Modelado por Homología: ¿Qué hacer con las secuencias de Proteínas?

Slides:



Advertisements
Presentaciones similares
Utilizando la herramienta de Construcción de la Caja de Búsqueda Tutorial.
Advertisements

Descubrimientos en Ciencias Planetariashttp://dps.aas.org/education/dpsdisc/ Mil Planetas Nuevos Antes del 2011 los científicos conocían la existencia.
INTRODUCCIÓN A LA BIOINFORMÁTICA
¿Evaluamos bien? Es evidente la necesidad de filtros que permitan una recuperación de información con calidad y alta relevancia. Existe la necesidad de.
Bioinformática: Conceptos Generales M.V. Gabriel B. Pinto y Med. Vet. MSci Gabriela Iglesias.
© 2009 Cisco Systems, Inc. All rights reserved.Cisco Public 1 Herramienta de Administración de Servicios de Acceso: Bill to ID y Numero de Contrato Septiembre.
© 2009 Cisco Systems, Inc. All rights reserved.Cisco Public 1 Septiembre 2009 Herramienta de Administración de Servicios de Acceso (SAMT) por: Numero de.
© 2009 Cisco Systems, Inc. All rights reserved.Cisco Public 1 Septiembre 2009 Herramienta de Administracion de Servicio de Acceso: Bill to ID.
PSI-BLAST.
The Universal Protein Resource: UniProtKB.
BLAST.
Uso de las Bases de Datos
HOMOLOGY MODELLING Modelado por homologia o comparativo
PRINCIPIOS DE MODELADO POR HOMOLOGÍA
Base de datos de estructuras 3D de proteínas: PDB
UNIDAD I MODELOS Y TOMA DE DECISIONES
Clase # 8: Análisis Conformacional (II)
Enrique Cardenas Parga
Bases de datos en Bioinformática
Encuentra las 12 diferencias
Modelado del negocio con UML y Visual Paradigm
International Nucleotide Sequence Database Collaboration
SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Tutorial Creación de un Cuadro De Búsqueda Usando la Herramienta Constructor de Cuadro de Búsquedas de EBSCO
TUTORIAL PDBSUM Proteína 3NVY
Detección de Secuencias Reguladoras en el Genoma
El descubrimiento de elementos reguladores en los vertebrados a través de comparación de genomas Por Pilar Gonzalez Gomez Alberto Lietor Santos.
Por Donde Empezar!!. Situaciones Caza ilegal: caza, pesca Adulteración de especies o fraude de alimentos Especies en peligro: el tráfico ilegal Casos.
CAPÍTULO 4. FUENTES DE DATOS EN
Bases de datos y bibliotecas medicas digitales
La PD no es adecuada para buscar en BD
Copyright © 2014 by The University of Kansas Métodos cualitativos para evaluar asuntos comunitarios.
Dirección de Educación y Capacitación en Salud Mendoza Guerrero J.A Uriega GonzálezPlata S. García Lorenzo. Módulo 2 Buscadores.
Modelado por homología
Profile HMMs Perfiles de Modelos ocultos de Markov
Eduardo Brioso Moniz Álvaro Castilla Nieto Mario Colchero Pérez
Curso de Diseño Web. Asegúrate que todo está listo  Probar el sitio en múltiples navegadores  IETester.
Toma de decisiones “PROCESO DELIBERADO QUE TERMINA EN UNA ELECCIÓN ENTRE UN CONJUNTO DE ALTERNATIVAS.” (Brown, W)
En PDB hay estructuras experimentales de proteínas.
COGs Cluster of Orthologous Groups. Genes Ortólogos Comparten una gran similitud en secuencias. Pueden provenir de un ancestro común.
Búsqueda de Ancestros Comunes Para Genomas de Diferentes Especies
Matrices de Substitución PAM Y BLOSUM
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)
Capítulo 8 Análisis de Usabilidad y Inspección
1 Introducción a la Computación para Biólogos, Bioquímicos, Médicos, etc.
The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto.
Predicción de Estructura 3D de Proteínas Reconocimiento de Plegamiento (threading) Florencio Pazos ALMA Bioinformatics, S. L.
INCORPORANDO LA INFORMACION CLIMATICA A LA TOMA DE DECISIONES EN LA PRODUCCION DE MAIZ DE LA REGION PAMPEANA Bert, F. E. *1,2, Podestá, G. P. 3, Satorre,
Alfonso Varela Toro José Ramón Polo López MODELADO DE LA MAQUINARIA CELULAR A TRAVÉS DE LA COMPARACIÓN DE REDES BIOLÓGICAS.
Algoritmos para alineamientos locales: FastA
Matrices de sustitución
Bioinformática Predicción estructural y funcional Máster Biomedicina
Clase # 7: Análisis Conformacional (I)
Alex Sánchez Introducción a la Bioinformática Herramientas de búsqueda en bases de datos SRS y Entrez.
Bioinformática Introducción. Bioinformática Definición intuitiva Conjunto de herramientas informáticas que sugieren soluciones a problemas biológicos.
Bases de datos secundarias. Briefings in Bioinformatics 3 (2002):
Alineamiento local: búsqueda de homologías
ALINEAMIENTO MULTIPLE: METODOS ALTERNATIVOS
Sistemas de Archivos Sistemas Operativos.  Se debe proporcionar un almacenamiento secundario que respalda a la memoria principal  El Sistema de archivos.
Análisis de estructuras. Problemas  No hay diferencias evidentes entre un modelo correcto y uno incorrecto  La utilización de una estructura desde el.
NOMBRE DEL ALUMNO: GRUPO:.  CONTESTA LO QUE SE INDICA DE UNA MANERA COMPLETA Y CLARA.
© Copyright Ebiointel,SL 2006 Motores Sequence Retrieval System Motores de búsqueda.
Ivan Babitsch Soler Dirigido: Jordi Gonzàlez Sabaté Co-Dirigido: Mario Huerta.
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
Taller de investigación 1
Lic. María Isabel Fonseca PROTEÍNAS. Lic. María Isabel Fonseca PROTEÍNAS Niveles estructurales.
Alineamiento de secuencia de proteinas con HMM Sandra Cano.
PROSITE: Guía rápida Dirección URL de PROSITE.
SYMFONY Información del Framework. Síntesis de Symfony  Es un framework diseñado para optimizar el desarrollo de aplicaciones web creado con PHP5. 
Predicción Estructural Modelling. ¿ Por que estudiar la estructura de las proteínas? Las proteínas juegan un papel funcional crucial en todos los procesos.
Transcripción de la presentación:

Modelado por Homología: ¿Qué hacer con las secuencias de Proteínas? Georgina Estrada Tapia ICF-UNAM ginaestapia@yahoo.com.mx Posgrado en Ciencias Biomédicas-UNAM Cuernavaca, Morelos. Abril 01 de 2011

Esquema: Introducción a la estructura de proteínas & bases de datos Prediction de estructura Ab-initio Threading Modelado por homología Ejercicio Evaluación del modelo

Secuencias & Bases de Datos de Estructuras RCSB- the Protein Data Bank- todas las estructuras depositadas UniProt- base de datos de secuencias de proteínas SwissProt Tremble NCBI- muchas bases de datos, incluye de secuencias y estructuras PDBsum- combina estructurales & de secuencias

UniProt- Base de datos de Secuencias de Proteínas UniProt es una colaboración entre: European Bioinformatics Institute (EBI), Swiss Institute of Bioinformatics (SIB) y el Protein Information Resource (PIR). En 2002, los tres institutos decidieron unir sus recursos y conocimientos y formaron el consorcio UniProt.

UniProt- Base de Datos de Secuencias de Proteínas

PDB: http://www.pdb.org

Hecho: Más Secuencias que Estructuras Hay discrepancia entre el número de secuencias conocidas y el de estructuras resueltas: 5,047,807   entradas en UniRef90 vs. 19988 90% de estructuras No redundantes http://www.rcsb.org/pdb/statistics/clusterStatistics.do http://www.ebi.uniprot.org/uniprot-srv/uniRefSearch.do Los métodos computacionales son necesarios para obtener más estructuras

Predicción de Estructura de Proteínas ¿Por qué predecir estructura si podemos determinarla experimentalmente? Los métodos experimentales son lentos y caros y no siempre es posible realizarlos Algunas estructuras no se pueden resolver Una estructura representativa de una familia puede ser suficiente para deducir estructuras de la familia completa de secuencias. A representative family structure can suffice to deduce structures of the entire family sequences

Esquema General Búsqueda de estructuras para una secuencia problema Elección de Patrón(es) [“Template”] Alineamiento de la secuencia con la estructura(s) Patrón Generación de un modelo para la proteína problema usando información de la estructura patrón. (Ej. MODELLER.- automodel) Evaluación del modelo Fiser A et al. Methods in Enzymology 374: 461-491(2004)

1: Template recognition and initial alignment 2: Alignment correction 1: Template recognition and initial alignment 3: Backbone generation 4: Loop modeling 8: Iteration 8: Iteration 5: Sidechain modeling Model! 8: Iteration 8: Iteration 7: Model validation 6: Model optimization Ej.-Minimización con Dinámica Molecural (MD)

El Modelado por Homología requiere del manejo de estructuras & secuencias Proteína (secuencia) problema- solamente la secuencia está disponible- se puede encontrar en UniProt Plantilla - después de su identificación, ambos tipos de datos estructurales y de secuencia, se pueden corroborar en- UniPort (o bases de datos de NCBI), RCSB y PDBsum

1. Búsqueda de Estructuras Búsqueda de la secuencia contra secuencias del PDB Búsqueda de perfiles Threading: función de ajuste secuencia-estructura HMM\profile: when many related sequences are found allows a more sensitive search Threading uses sequence–structure fitness functions, such as residue-level statistical potential functions, to evaluate a sequence–structure match. Threading methods generally do not rely on sequence similarity. Threading sometimes detects structural similarity between proteins without detectable sequence similarity.

1. Búsqueda de Estructuras Si BLAST falla (PDB) para encontrar estructuras patrón adecuadas, usar servidores para “fold recognition” (threading): FFAS03- http://ffas.ljcrf.edu/ffas-cgi/cgi/ffas.pl HHPRED- http://toolkit.tuebingen.mpg.de/hhpred HMAP (disponible a través de FUDGE pipeline)- http://wiki.c2b2.columbia.edu/honiglab_public/index.php/Software:PUDGE I-TASSER- http://zhang.bioinformatics.ku.edu/I-TASSER/ Estos servidores no solamente encuentran patrones opcionales , también sugieren el alineamiento por pares y en algunos casos hasta construyen modelo 3D.

2. Elección de Estructuras Más de un Patrón “The more the merrier” - multiple structures with the same fold: ניתן לראות כי למרות שברוב האזורים יש זהות בין המבנים, באזורי לופים בעיקר ניתן לאתר ואריאביליותץ והם יהיו גם האזורים הבעייתים במודל שלנו שנצטרך לייחס להם אמינות נמוכה יותר. Kinase domains

3. Alineamiento de la secuencia problema y la secuencia del Patrón Crear un alineamiento multiple de secuencias (MSA) y extraer el alineamiento por pares (pairwise). Usar información de estrcutura secundaria para optimizar el alineamiento por pares- evitar ‘gaps’ en esas regiones! Query Template

3. Alineamiento de la secuencia problema y la secuencia del Patrón Tips para el MSA ¿Dónde? (encontrar/buscar homólogos) Patrones o Plantillas Estructurales- búsqueda contra el PDB Homólogos secuenciales- búsqueda contra el SwissProt o Uniprot (¡recomendada!)- generalmente usando BLAST ¿Cuántos? Tantos como sea posible, siempre y cuando el MSA se vea bien…

Corrección del Alineamiento S G P L A E R C I V C R M P E V C R M P E -A-V F-D- Determinantes Estructurales  conservados Usar MSA Deleciones en tu secuencia  modificar gaps Estructura FDICRLPGSAEAV Model FNVCRMP---EAI Model FNVCR---MPEAI  Alineamiento Correcto

3. Alineamiento de la secuencia problema y el Patrón Tips para el MSA ¿Qué tan extensas? (longitud de homólogos) Fragmentos- homólogos cortos (menos del 50,60% de la longitud de la secuencia problema) = mal alineamiento Asegurarse que sus secuencias presentan el dominio(s) requeridos N/C terminales tienden a variar en longitud entre homólogos ¿Qué tan parecidas? (distancia de la secuencia problema) Muy parecidas- no informativo Muchas muy lejanas- mal alineamiento Asegurarse de tener un grupo balanceado!

3. Alineamiento de la secuencia problema y la secuencia del Patrón Tips para el MSA ¿De quienes? (a qué especies pertenecen las secuencias) No importa, todos los homólogos son bienvenidos Ortólogos/parálogos pueden ser útiles Secuencias de especies distantes/cercanas proveen diferentes tipos de información ¿Cuáles métodos de alineamiento? Los mejores son MUSCLE, T-Coffee and MAFFT. Todos disponibles en la página de EBI

3. Alineamiento de la secuencia problema y la secuencia del Patrón Alineamiento de Sec. problema-templado por “profile-to-profile”: 1. Construir un MSA para la secuencia, serviendo como perfil las propiedades de la familia estructural. 2. Alinear el perfil con perfiles de todas las proteínas del PDB, usando, por ej., FFAS03 o HHpred. 3. Comparar alineamientos por pares construídos por diferentes métodos – esperando tener una predicción consenso…

3. Alineamiento de la secuencia problema y la secuencia del Patrón Niveles diferentes de similitud entre el patrón & la proteína problema (varios abordajes computacionales):

4.Construcción del modelo Una vez que se tiene un buen alineamiento Usar MODELLER para la construcción del modelo! http://salilab.org/modeller

5. Evaluación del modelo La precisión del modelo depende de la identidad de la secuencia con la proteína patrón: Internal evaluation – self consistency checks External evaluation – relies on information that was not used in the model calculation

Estereoquímica -ProCheck 5. Evaluación Estereoquímica -ProCheck

Links Útiles 1. Estructuras PDB-Blast en NCBI- http://blast.ncbi.nlm.nih.gov/Blast.cgi Meta server- 3D judry http://bioinfo.pl/meta/ FFAS03- http://ffas.ljcrf.edu/ffas-cgi/cgi/ffas.pl HHPRED- http://toolkit.tuebingen.mpg.de/hhpred FUDGE- pipeline- http://wiki.c2b2.columbia.edu/honiglab_public/index.php/Software:PUDGE 2. Elección de estructura (s) patrón 3. Alineamiento de la secuencia problema con el o los templados MSA - MUSCLE, T-coffee and MAFFT en http://toolkit.tuebingen.mpg.de/sections/alignment Editor de alineamiento – Bioedit - http://www.mbio.ncsu.edu/BioEdit/bioedit.html 4. Construcción del modelo Nest - http://wiki.c2b2.columbia.edu/honiglab_public/index.php/Software:nest Modeller - http://salilab.org/modeller/modeller.html Automático: - SwissModel: http://swissmodel.expasy.org//SWISS-MODEL.html 5. Evaluación del modelo ConSurf http://consurf.tau.ac.il PROCHECK http://www.biochem.ucl.ac.uk/~roman/procheck/procheck.html WHATCHECK www.cmbi.kun.nl/swift/whatcheck/ ProSA https://prosa.services.came.sbg.ac.at/prosa.php ProQ http://www.sbc.su.se/~bjornw/ProQ/ProQ.cgi AT the Honig lab http://luna.bioc.columbia.edu/Model_Quality_Assessment/cgi-bin/Model_Quality_Assessment.cgi