Búsqueda de Ancestros Comunes Para Genomas de Diferentes Especies

Slides:



Advertisements
Presentaciones similares
IBD Clase 7.
Advertisements

BLAST.
ÁRBOLES EN C UNIVERSIDAD “ALONSO DE OJEDA” Facultad de Ingeniería
Introducción La educación superior se ha visto como un nivel para algunos privilegiados, haciendo diferencias según las culturas y las condiciones socioeconómicas.
Investigación de Operaciones II
Investigación Algorítmica
Investigación algorítmica
Tema 1. Introducción a la programación (Lenguaje java).
¿CÓMO MEJORAR LA EVALUACIÓN DE COMPETENCIAS? VI FORO DEL PERSONAL ACADÉMICO DE LA FI Dr. Rafael Rodríguez Nieto Miembro del Comité de Ingeniería Petrolera.
PROGRAMACION DE ESTRUCTURAS DE DATOS
Encuentra las 12 diferencias
Sistemas de nombres planos y jerárquicos.

Integrantes: Esteban Jiménez Guesseppe Lozada Mario Rodriguez Gustavo Tenorio Fabio.
Agrupamiento de relaciones no lineales entre expresiones de genes
Detección de Secuencias Reguladoras en el Genoma
Listas circulares.
El descubrimiento de elementos reguladores en los vertebrados a través de comparación de genomas Por Pilar Gonzalez Gomez Alberto Lietor Santos.
DPTO. MATEMÁTICAS - I.E.S. PABLO SERRANO
GRAFOS HUGO ARAYA CARRASCO.
PROGRAMACIÓN PARALELA EN ALGORITMOS SOBRE GRAFOS
Modelos de Texto Estructurado M
Temas importantes para el desarrollo de la segunda parte del TPE
Trabajo presentado por: LUIS FERNANDO OBANDO ING
Eduardo Brioso Moniz Álvaro Castilla Nieto Mario Colchero Pérez
Investigación algorítmica Grupo Plagiatest-T. Integrantes Grupo 4 Lizzett Seminario Huamaní César Ríos Gárate Carolina Balbín Ávalos.
UNIVERSIDAD MICHOACANA DE SAN NICOLÁS DE HIDALGO
Seminario de Análisis Documental  Presenta: Lilian Martínez Carrillo  Profesor: Georgina Araceli Torres México, D.F., 2011 Ley de Zipf y sus aplicaciones.
Agentes de resoluciones d problemas Parte I. Un agente puede adoptar una meta o un propósito para satisfacer.
Similaridad de cadenas genéticas Bienvenido Martínez Redondo Sergio García Esteban 2008/2009.
Diseño y análisis de algoritmos
Consulta Típica en OLAP
Diseño y análisis de algoritmos
B IOINFORMÁTICA : I NTERFAZ GRÁFICA PARA COMPARACIÓN DE GENOMAS VÍA WEB Oscar Castro García Tutores: Jordi Gonzàlez, Mario Huerta Julio 2009.
BIOINFORMÁTICA: INTERFAZ WEB PARA MOSTRAR LAS RELACIONES DE EXPRESIÓN ENTRE GRUPOS DE GENES Autor: Jose Luis Aylas Flores Direcció: Mario Huerta (IBB-UAB)
Aplicación de estructuras de datos
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)
Raquel Guardia Villalba
Los Sistemas de Información en la Empresa Introducción a los ERP 1.- El sistema de información de la empresa. Los ERP. Simplificando podemos identificar.
BIOINFORMÁTICA: INTERFAZ WEB PARA MOSTRAR QUE RELACIONES MANTIENEN LOS GENES AL EXPRESARSE. Alberto Medrano Nájera Tutores: Mario Huerta Jordi Gonzàlez.
BIOINFORMÁTICA: CONSULTAS CRUZADAS A BASES DE DATOS BIOMÉDICAS REMOTAS Antonio Rodríguez Cía Tutores: Mario Huerta, Juan José Villanueva Julio 2008.
SUBSECRETARÍA DE EDUCACIÓN SUPERIOR DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR TECNOLÓGICA INSTITUTO TECNOLÓGICO DE ALTAMIRA Altamira, Tam. Enero del 2013.
Estructura de Datos M.C. José Andrés Vázquez Flores FCC/BUAP
Escalabilidad en los Algoritmos de Aprendizaje de Redes Bayesianas ISL – Dpto de Informática – UCLM - Albacete.
Dikjstra – Shortest Path. Algoritmo Dijkstra Inicio: Asignar un nivel temporal igual a 0 en el nodo de inicio e infinito al resto de los nodos Iteración.
Matrices de sustitución
Introducción al Biclustering
Sesión 3: Teoría de Grafos
Minimum Spanning Tree (Árbol de Expansión Mínima)
DISEÑO DE UNA ESTRUCTURA DE INDEXACION DE DATOS TOPOLOGICAMENTE CONTENIDO.
Minimum Spanning Tree (Árbol de Expansión Mínima)
Arboles B (búsqueda externa)
Bases de datos secundarias. Briefings in Bioinformatics 3 (2002):
Francisco Gamboa Herrera Tanya Pérez Herrera 26 Noviembre 2010.
DIAGRAMA DE FLECHAS O RUTA CRITICA
LOS QUEHACERES DE JORGE
SOLUCION DE PROBLEMAS MEDIANTE BUSQUEDA
Teoría de Sistemas Operativos Domain Name System (DNS)
Victoria Alejandra Montoya Expositora
Jorge De Nova Segundo. Resolución inversa: Una consulta inversa a un servidor DNS consiste en preguntar por una dirección IP en lugar de preguntar por.
Resolución inversa Tema 3 SRI Vicente Sánchez Patón I.E.S Gregorio Prieto.
Resolución inversa Jesús Torres Cejudo. Resolución inversa La resolución DNS más común es la hecha para traducir un nombre para una dirección IP, pero.
Diseño de Redes - Capítulo 3
Luis Villalta Márquez.  El espacio de nombres de dominio tiene una estructura arborescente. Las hojas y los nodos del árbol se utilizan como etiquetas.
DOCENCIA CENTRADA EN EL APRENDIZAJE(DOCA) MÓDULO 6 “Nuevas Tecnologías de la Información y la Comunicación (NTICs) S ECRETARÍA DE E DUCACIÓN P ÚBLICA S.
Ivan Babitsch Soler Dirigido: Jordi Gonzàlez Sabaté Co-Dirigido: Mario Huerta.
Daniel Sánchez Santolaya Tutores: Mario Huerta(IBB) Jordi Gonzàlez(CVC)
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Información y Aleatoriedad de los Genes Iniciativa Científica MilenioSANTIAGO, 15 de Noviembre de 2006.
Fecha de descarga: 6/23/2016 Copyright © McGraw-Hill Education. Todos los derechos reservados. Desarrollo de estudios independientes de cultivos de un.
Transcripción de la presentación:

Búsqueda de Ancestros Comunes Para Genomas de Diferentes Especies POYECTO REALIZADO POR: Jonas Rodriguez Murillo BAJO LA DIRECCION DE: Jordi Gonzalez, Mario Huerta

Contenidos 2/26 Introducción Objetivos Diseño Resultados Conclusiones

Introducción Qué es un genoma? Secuenciación del ADN 3/26 TCAATATGGACGCCTGTAAAGGAGAGCATAGGCTATGTTTATGTTTCTAGGCGCGTCACGGTTAAAGCGAGCAAGCTATTGGGTTCGCTTACTTTGTTAGCGAGTTTAATATCTTTTGTGGTTGGTGCAGCATATGGTATTAC La longitud de un genoma se contabiliza por su número de bases.

Clasificación de Especies en Tres Grandes Dominios Introducción 4/26 Clasificación de Especies en Tres Grandes Dominios (Carl Woese). Archaeas Bacterias Eucariotas

Maximal Unique Matchings Introducción 5/26 Maximal Unique Matchings (MUMs) Secuencias de bases coincidentes en ambos genomas Mayor longitud posible No se repiten en ningún otro punto del genoma MUM Directo MUM Inverso

Objetivos 6/26 Introducción Objetivos Diseño Resultados Conclusiones

Objetivos 7/26 Buscar los ancestros comunes encontrando similitudes entre determinadas regiones Crear superMUMs, una nueva unidad de comparación Construir el Minimum Spanning Tree

Diseño Introducción Objetivos Diseño Cálculo de superMUMs 8/26 Introducción Objetivos Diseño Cálculo de superMUMs Cálculo del MS Tree Resultados Conclusiones

Diseño Cálculo de superMUMs 9/26 Que es un superMUM? Una superestructura formada por los MUMs mas cercanos entre si y por los espacios que los separan.

Diseño Cálculo de superMUMs 10/26 Porque son mejores para el cálculo de los ancestros? Aporta mas información que los MUMs, no solo las similitudes entre genomas sino las diferencias evolutivas entre ellas. Al concentrar los MUMs reduce el número de datos para manejar y por tanto el tiempo de cálculo Esta será la parte del pre-proceso del proyecto, solo se calcularan los superMUMs para cada pareja de genomas una vez.

Diseño 11/26 Algoritmo del cálculo de superMUMs

Ejemplos de formaciones Diseño 12/26 Ejemplos de formaciones de superMUMs

Optimizaciones para el Algoritmo Diseño 13/26 Optimizaciones para el Algoritmo de superMUMs Mejorar tiempo de cómputo Lista de Accesos (Posibles Absorbentes) Sistema de las dos listas enlazadas Lista de superMUMs finales Limite de búsqueda de MUMs para añadir a un superMUM

Diseño Cálculo del Minimum Spanning Tree 14/26 Diseñado para el uso en aplicaciones online!

Diseño 15/26 Como buscar regiones conservadas? Formula del grado de conservación

Diseño 16/26 Que superMUMs se deben eliminar? Al comparar las agrupaciones de los dos extremos, se elimina la que tenga una longitud menor Que conseguimos con esto? Al eliminar algunos superMUMs la región 2 se reduce aumentando así el grado de conservación. Este método no siempre funciona bien!!

Diseño De la matriz de similitud al grafo completo 17/26 Es el resultado de comparar todas las regiones entre si Representa las relaciones entre los genomas comparados, el valor es el grado de conservación (Similitud) obtenido en la comparación

Diseño 18/26 Construcción del Minimum Spanning Tree utilizando el algoritmo de Prim Buscar los nodos en grafo completo que tengan las mejores relaciones Unir todos los nodos utilizando solo los mejores arcos PRIM Las mejores relaciones obtenidas 1 2 Sim12 4 5 Sim45 Sim14 3 6 Sim36 Sim26

Resultados 19/26 Introducción Objetivos Diseño Resultados Conclusiones

Resultados Resultados del cálculo de superMUMs 20/26 Número de superMUMs Tiempo de cálculo Tiempo de cálculo antes y después de optimizar

Resultados Construcción del Minimum Spanning Tree 21/26 Uso el genoma con identificador 1 de las Archaeas Grados de conservación obtenidos mas altos: Los más cercanos a 1 en el árbol

Resultados 22/26 Obtenida la matriz de similitudes y aplicado el algoritmo de Prim: Los genomas que tenían un grado de conservación mas alto están cerca de la raíz (1).

Resultados 23/26 Representación de las comparaciones: Genomas 1 y 9

Conclusiones Introducción Objetivos Diseño Resultados Conclusiones 24/26 Introducción Objetivos Diseño Resultados Conclusiones

Conclusiones Objetivos cumplidos satisfactoriamente: 25/26 Objetivos cumplidos satisfactoriamente: Cálculo de superMUMs funcional y en tiempo de computo viable La búsqueda de regiones conservadas funciona correctamente La construcción del Minimum Spanning Tree con el algoritmo de Prim funciona bien Se ha respetado el sistema de carpetas del servidor para facilitar futuras implementaciones

Conclusiones Personalmente ha sido una experiencia muy interesante 26/26 Personalmente ha sido una experiencia muy interesante Un gran reto al resolver los problemas de los algoritmos Descubrimiento del mundo de la bioinformática y la genómica comparativa Participación en un proyecto puntero en investigación

Bibliography http://platypus.uab.es : Web server for the all-known-genomes comparison by web. Server supported by the Institute of Biotechnology and Biomedicine of the Autonomous University of Barcelona (IBB-UAB). Mario Huerta Suffix Tree Construction with slide nodes. technical report LSI-02-63-R Dep. Llenguatge i Sistemes Informàtics, Universitat Politècnica de Catalunya (2002). Mario Huerta and Xavier Messeguer Efficient space and time multicomparison of genomes.  Research Report LSI-02-64-R Dep. Llenguatge i Sistemes Informàtics, Universitat Politècnica de Catalunya.(2002). Domènec Farré, Romà Roset, Mario Huerta, José E. Adsuara, Llorenç Roselló, M. Mar Albà, Xavier Messeguer.Identification of patterns in biological sequences at the ALGGEN server. PROMO and MALGEN. Nucleic Acids Research 31(13): 3651-3653 (2003).

Búsqueda de Ancestros Comunes Para Genomas de Diferentes Especies POYECTO REALIZADO POR: Jonas Rodriguez Murillo BAJO LA DIRECCION DE: Jordi Gonzalez, Mario Huerta