© Copyright Ebiointel,SL 2006 Alineamiento múltiple Identificación de regiones conservadas Predicción de estructuras y funciones Diseño de experimentos.

Slides:



Advertisements
Presentaciones similares
CONSULTAS SOBRE UNA TABLA
Advertisements

Diseño y análisis de algoritmos
IBD Clase 7.
Objetivos del Taller Navegar por la interfase del programa. Identificar las capacidades de sus iconos. Demostrar sus posibilidades desde la visión educativa.
PSI-BLAST.

BLAST.
Al abrir el Access aparece una ventana para crear una base en blanco, con la ayuda de un asistente o abrir una existente. Al principio optamos por la primera.
Marcas de agua con FHT Fernando Pomares Reyes
David Escudero Mancebo Alfonso Pedriza Rebollo
Guía de autoaprendizaje
Técnico en programación de Software
Formato a un texto y a un párrafo
en general, mínimos energéticos
UNIVERSIDAD LATINA (UNILA) IV. IMPLANTACION DE ALGORITMOS.
3. INTRODUCCIÓN A LA PROGRAMACIÓN
Programa de Actualización en Tecnología Informática
Encuentra las 12 diferencias
El sistema de puntuación
El descubrimiento de elementos reguladores en los vertebrados a través de comparación de genomas Por Pilar Gonzalez Gomez Alberto Lietor Santos.
La PD no es adecuada para buscar en BD
MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN
SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES
Ingeniero Anyelo Quintero
Capítulo 4 BUSQUEDA INFORMADA.
Administración de Archivos
UNIDAD 2:Crear, abrir y cerrar una base de datos Hacer clic sobre la opción Nuevo de la pestaña Archivo. Se mostrarán las distintas opciones para nuevos.
Similaridad de cadenas genéticas Bienvenido Martínez Redondo Sergio García Esteban 2008/2009.
Una base de datos es un “almacén” que nos permite guardar grandes cantidades de información de forma organizada para que luego podamos encontrar y utilizar.
Práctica 1: Alineamientos Partimos de un archivo de datos que contiene 5 secuencias de mRNA asociado a la CFTR archivo de prácticas archivo de prácticas.
Búsqueda de Ancestros Comunes Para Genomas de Diferentes Especies
DEFINICIONES Sea (P) el siguiente problema de programación lineal:
complejidad de un problema.
Introducció a la Bioinformàtica
Matrices de Substitución PAM Y BLOSUM
1 Introducción a la Computación para Biólogos, Bioquímicos, Médicos, etc.
Simular: Representar una cosa, fingiendo o imitando lo que no es.
Comparar secuencias = Obtener información
The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto.
Alineamiento de dos secuencias
Previsión de Ventas. Métodos no paramétricos Previsión de Ventas. Tema 2. 1 Antonio Montañés Bernal Curso
PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.
Parte I. Estructuras de Datos.
Alfonso Varela Toro José Ramón Polo López MODELADO DE LA MAQUINARIA CELULAR A TRAVÉS DE LA COMPARACIÓN DE REDES BIOLÓGICAS.
ALINEAMIENTOS SIMPLE Y MÚLTIPLE Juan José Nieto Lunes, 11 de Julio de 2005.
Algoritmos para alineamientos locales: FastA
Matrices de sustitución
Parte I. Estructuras de Datos.
DISEÑO DE UNA ESTRUCTURA DE INDEXACION DE DATOS TOPOLOGICAMENTE CONTENIDO.
Alex Sánchez Introducción a la Bioinformática Herramientas de búsqueda en bases de datos SRS y Entrez.
Bases de datos secundarias. Briefings in Bioinformatics 3 (2002):
Alineamiento local: búsqueda de homologías
ALINEAMIENTO MULTIPLE: METODOS ALTERNATIVOS
MICROSOFT EXCEL ING. JOHANNA NAVARRO.
MANUAL DE USO BASES DE DATOS Por: EBSCO Information Services
Excel La Hoja De Cálculo.
Autor: Ing. Jessica Yuta COLEGIO DE INGENIEROS DEL PERU
Cognitens-WLS400M Ensamblaje Digital y Virtual. 2 Cognitens-WLS400M  Comprender que es un Ensamblaje  Entender las diferencias entre Ensamblaje Virtual.
Maracaibo, 26 de Mayo de 2006 Universidad del Zulia Facultad de Ingeniería División de Postgrado Maestría en Computación Aplicada Universidad del Zulia.
Introducción a la Bioinformática
Presente un cuestionario con los aspectos mas importantes sobre los
1 Curso avanzado de programación Sesión 1. 2 aleatorio() funciones aleatorias si... entonces...
MIA - Grupo 5 Unidad 2.
DIALIGN DIagonal ALIGNments Marcelo Piriz Daiana Mir.
© Copyright Ebiointel,SL 2006 Motores Sequence Retrieval System Motores de búsqueda.
Ivan Babitsch Soler Dirigido: Jordi Gonzàlez Sabaté Co-Dirigido: Mario Huerta.
Lic. María Isabel Fonseca PROTEÍNAS. Lic. María Isabel Fonseca PROTEÍNAS Niveles estructurales.
Información y Aleatoriedad de los Genes Iniciativa Científica MilenioSANTIAGO, 15 de Noviembre de 2006.
LE, EI, Profesor Ramón Castro Liceaga UNIVERSIDAD LATINA (UNILA) IV. IMPLANTACION DE ALGORITMOS.
GUÍA 1: PROCESADOR DE TEXTO Curso Básico de Sistemas Para Padres de Familia.
Transcripción de la presentación:

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Identificación de regiones conservadas Predicción de estructuras y funciones Diseño de experimentos para probar y modificar funciones de proteínas concretas Identificación de nuevos miembros de una familia de proteínas Comparación múltiple de secuencias IYDGGAV-EAL IIYDGG---EAL IIIFEGGILVEAL IVFD-GILVQAV VYEGGAVVQAL ConsydGGA/IV/LVeAl Alineamiento múltiple = Tabla 2D

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Comparación múltiple de secuencias FHIT_HUMAN MS-F RFGQHLIKP-SVVFL KTELSFALVNRKPVV PGHVLV... APH1_SCHPO MPKQ LYFSKFPVG-SQVFY RTKLSAAFVNLKPIL PGHVLV... HNT2_YEAST MILSKTKKPKSMNKP IYFSKFLVT-EQVFY KSKYTYALVNLKPIV PGHVLI... Y866_METJA MCIF CKIINGEIP-AKVVY EDEHVLAFLDINPRN KGHTLV... Un método de alineamiento múltiple verdadero, deber í a alinear todas las secuencias al mismo tiempo. Pero no existe un método computacional que pueda realizar esto en tiempo razonable

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Usando Prgramaci ó n din á mica en una matriz tridimensional Objetivo: encontrar el camino óptimo Cómo se resuelve un alineamiento múltiple de 3 secuencias?

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Complejidad del algoritmo de Programaci ó n Din á mica (PD) El número de comparaciones que el PS tiene debe realizar para llenar la matriz (sin usar heurísticas y excluyendo gaps) es el producto de las longitudes de las dos secuencias (N x M) La complejidad del algoritmo crece en forma exponencial con el número de secuencias Alinear dos secuencias de 300 nt implica realizar 300 x 300 = 90,000 comparaciones Alinear tres secuencias de 300 nt implica realizar 300 x 300 x 300 = 27,000,000 comparaciones!!

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Aproximaciones al algoritmo de Programaci ó n Din á mica Alinear todas las secuencias por pares Usar los scores para construir un árbol Alinear progresivamente (siguiendo el orden que sugiere el árbol) todas las secuencias para producir un Alineamiento Múltiple No es un verdadero Alineamiento Múltiple Las secuencias se alinean por pares

© Copyright Ebiointel,SL 2006 Alineamiento múltiple

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Clustal W Thompson J.D., Higgins D.G., Gibson T.J. (1994) "CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice."; Nucleic Acids Res. 22: Programa de alineamiento múltiple Alineamiento progresivo

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Clustal W Thompson J.D., Higgins D.G., Gibson T.J. (1994) "CLUSTAL W: Improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice."; Nucleic Acids Res. 22: Estrategia general Alineamiento rápido obtención de las mejores parejas análisis de clusters creación de un árbol guía Alineamiento múltiple se utiliza el árbol guía anterior optimización alineamiento de los pares más próximos introducción de gaps para mejorar el alineamiento alineamiento de las parejas optimización mediante inclusión de nuevos gaps

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Opciones Generales Clustal W YOUR SEARCH TITLE CPU MODE clustalw_mp - multiprocessor SGI systems. clustalw - genérico (CPU simple) ALIGNMENT Permite realizar alineamientos completos utilizando algoritmos restrictivos que generan un árbol guía o algoritmos más rápidos. OUTPUT Formato del resultado (ALN, GCG, PHYLIP, PIR and GDE) OUTORDER Orden de las secuencias COLOR Muestra el alineamiento en colores (solo en formatos ALN or GCG) AVFPM ILW REDSmall (small+ hydrophobic (incl.aromatic -Y)) DEBLUEAcidic RHKMAGENT A Basic STYHC NGQ GREENHydroxyl + Amine + Basic - Q OthersGray Línea consenso " * " = residuos idénticos o conservados en todas las secuencias " : " = sustituciones conservadas ". " = sustituciones semi-conservadas.

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Opciones FAST PAIRWISE ALIGNMENT Opciones MULTIPLE ALIGNMENT KTUP Tamaño de la palabra WINDOW Tamaño de la ventana SCORE Valoración a considerar al calcular el apareamiento TOPDIAG Número de top diagonal que se integraran al calcular el apareamiento PAIRGAP Penalización de la abertura de gaps MATRIX GAPOPEN Penalización por la abertura de un gap ENDGAP Penalización por el cierre de un gap GAPEXT Penalización por la extensión de un gap GAPDIST Penalización por la separación de gaps

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Clustal W (EBI)

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Formato secuencias para Clustal W Formato FASTA >FOSB_HUMAN P53539 homo sapiens (human). fosb protein MFQAFPGDYDSGSRCSSSPSAESQYLSSVDSFGSPPTAAASQECAGLGEMPGSFVPTVT A ITTSQDLQWLVQPTLISSMAQSQGQPLASQPPVVDPYDMPGTSYSTPGMSGYSSGGASG S GGPSTSGTTSGPGPARPARARPRRPREETLTPEEEEKRRVRRERNKLAAAKCRNRRRELT DRLQAETDQLEEEKAELESEIAELQKEKERLEFVLVAHKPGCKIPYEEGPGPGPLAEVRD LPGSAPAKEDGFSWLLPPPPPPPLPFQTSQDAPPNLTASLFTHSEVQVLGDPFPVVNPSY TSSFVLTCPEVSAFAGAQRTSGSDQPSDPLNSPSLLAL >FOSB_MOUSE P13346 mus musculus (mouse). fosb protein. MFQAFPGDYDSGSRCSSSPSAESQYLSSVDSFGSPPTAAASQECAGLGEMPGSFVPTVT A ITTSQDLQWLVQPTLISSMAQSQGQPLASQPPAVDPYDMPGTSYSTPGLSAYSTGGASGS GGPSTSTTTSGPVSARPARARPRRPREETLTPEEEEKRRVRRERNKLAAAKCRNRRRELT DRLQAETDQLEEEKAELESEIAELQKEKERLEFVLVAHKPGCKIPYEEGPGPGPLAEVRD LPGSTSAKEDGFGWLLPPPPPPPLPFQSSRDAPPNLTASLFTHSEVQVLGDPFPVVSPSY TSSFVLTCPEVSAFAGAQRTSGSEQPSDPLNSPSLLAL Eliminar espacios entre secuencias

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Resultados

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Resultados JalView

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Resultados Clustal W (.dnd)

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Árboles Phylodendron Phylogenetic tree printer

© Copyright Ebiointel,SL 2006 Alineamiento múltiple Práctica ClustalW - Primers Diseño primers Realizar una traducción reversa de los primers en la Sequence Manipulation Suite de la Univ de Alberta Mediante las tablas de uso de codones, disminuir la degeneración de los primers adaptándolos al uso del Microorganismo problematablas de uso de codones Comparación múltiple Abrir una sesión Clustal WClustal W Fija los parámetros e introduce las secuencias usando el archivo múltiple al que hemos añadido todas las secuencias a alinear. Ejecutar Clustal W Visualizar los resultados Identificar y almacenar les regiones conservadas (primers) Árboles Visualizar el archivo.dnd con Phylodendron (o TreeView local)Phylodendron Variar la topología del árbol enraizándolo a un outgroup arbitrario