The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto.

Slides:



Advertisements
Presentaciones similares
Ciclo de vida de desarrollo de software
Advertisements

Estrategias Reconocer fragmentos de secuencia asociados a características funcionales o estructurales concretas Agrupar la secuencia en una familia y heredar.
Diferenciación Celular
DATA MINING MINERIA DE DATOS Gersom Costas.
TECNICATURA UNIVERSITARIA EN INFORMATICA
BLAST.
Modelo Sistémico de la Educación a Distancia.
HOMOLOGY MODELLING Modelado por homologia o comparativo
PRINCIPIOS DE MODELADO POR HOMOLOGÍA
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
Clase # 8: Análisis Conformacional (II)
Versión 2004 Enrique Bañuelos Gómez
Bases de datos en Bioinformática
DIAGRAMA DE COMPONENTES INTEGRANTES Córdova Vásquez Giovanny Escobar Alvares Calixto Gomez Quinteros Adelaida Pinto Flores Yarmila.
Encuentra las 12 diferencias
David G. Lowe Distinctive Image Features from Scale-Invariant Keypoints Aradí Rosales Cruz Visión de alto nivel Enrique Sucar.
El descubrimiento de elementos reguladores en los vertebrados a través de comparación de genomas Por Pilar Gonzalez Gomez Alberto Lietor Santos.
Profesor José De La Cruz Departamento de Biología y Química
Tabla de Frecuencia según tipo de tipo de variables
Recuperaci ó n Basada en Contenido M. Andrea Rodríguez Tastets DIIC - Universidad de Concepción
Especificación de Consultas M
Diana Hermith Seminario de Investigación Grupo Destino Pontificia Universidad Javeriana, Cali 2008.
Similaridad de cadenas genéticas Bienvenido Martínez Redondo Sergio García Esteban 2008/2009.
En PDB hay estructuras experimentales de proteínas.
COGs Cluster of Orthologous Groups. Genes Ortólogos Comparten una gran similitud en secuencias. Pueden provenir de un ancestro común.
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
Métodos y Principios de la Sistemática D. S. Fernández del Viso UPR-Humacao BIOL 4435.
Clasificación y Evolución
Filogenia. Filogenia Filogenia y genealogía La filogenia reproduce la trayectoria evolutiva del taxón.
Estructura de Proteinas Antonio Flores Giancarlo Alvarez 12 de setiembre de 2008.
Trabajando con puertas y ventanas Como clasificar puertas y ventanas
Introducción a la Estadística Informática
Predicción de la estructura secundaria de ARN mFold
Universidad de Panamá Escuela de Biología Departamento de genética Genética de Poblaciones Integrantes: Castellanos, Rebeca Robinson, Anine Robles, Jazmin.
Matrices de Substitución PAM Y BLOSUM
Temario 1.Motivación 2.Conocimientos Básicos 3.Herramienta 4.Validación 5.Usabilidad 6.Accesibilidad 7.Conclusión.
Ingeniería en Sistemas de Información Diseño de Sistemas (3K1)
ENRUTAMIENTO Y PROTOCOLOS DE ENRUTAMIENTO Semestre 2 Capítulo 6
Predicción de Estructura 3D de Proteínas Reconocimiento de Plegamiento (threading) Florencio Pazos ALMA Bioinformatics, S. L.
Herramientas básicas.
PAM Margaret Dayhoff. Accepted Point Mutations accepted by natural selection.
Alfonso Varela Toro José Ramón Polo López MODELADO DE LA MAQUINARIA CELULAR A TRAVÉS DE LA COMPARACIÓN DE REDES BIOLÓGICAS.
Perspectiva genómica de las familias de proteínas Andrés Cuadros Suárez Cristina Donaire Ávila Trifón Giménez Vázquez Introducción a la Biología Computacional.
Evolución Microbiana y Sistemática
Matrices de sustitución
Homología y homoplasia
Aprendizaje No Supervisado y Redes de Kohonen
Nieves Ábalos Serrano Mª Teresa Jiménez Ramírez
INTRODUCCIÓN A LA INGENIERÍA DEL SOFTWARE
INTRODUCCIÓN A LA ESTADÍSTICA
Bases de datos secundarias. Briefings in Bioinformatics 3 (2002):
Koonin et al, Nucleic Acids Research, 2000, Vol. 28. Nº 1
ALINEAMIENTO MULTIPLE: METODOS ALTERNATIVOS
SISTEMATICA - EVOLUCION
ANTECEDENTES Y DEFINICIONES
SISTEMA DE INFORMACIÓN DE GEOGRÁFICA
Página Web
Victoria Alejandra Montoya Expositora
Introducción a los protocolos de enrutamiento dinámico
Taller: Inteligencia Computacional
Actividades en el Proceso de desarrollo de Software
Tecnologías Cliente / Servidor Capitulo II Richard Jiménez V. clienteserver.wordpress.com.
Heurística. Los procesos que se llevan a cabo en el cerebro pueden ser analizados, a un nivel de abstacción dado, como procesos computacionales de algún.
Lic. María Isabel Fonseca PROTEÍNAS. Lic. María Isabel Fonseca PROTEÍNAS Niveles estructurales.
AIM: How do comparative studies help trace evolution? Como ayuda la comparacion a establecer relaciones evolutivas?
PROSITE: Guía rápida Dirección URL de PROSITE.
Rafael Zamora Garrido Julio Ejemplos de objetivos de Minería de Datos Reducir las bajas de clientes actuales en un 5%. Aumentar las contrataciones.
Fecha de descarga: 6/23/2016 Copyright © McGraw-Hill Education. Todos los derechos reservados. Desarrollo de estudios independientes de cultivos de un.
DIFERENCIACIÓN CELULAR Y GENES HOMEÓTICOS
MUESTREO: DISEÑO Y PROCEDIMIENTOS
Transcripción de la presentación:

The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto

Introducción Mutaciones dieron lugar a familias de proteínas (DAYHOFF) Las relaciones usando Algoritmos de programación dinámica. Datos estructurales< Datos secuencia (Debido a cuestiones técnicas) Actualmente discrepancias mayores a 2 ordenes de magnitud entre recursos de secuencia y de estructura. PDB entradas NCBI entradas 1er cristal (1970) 1ra Clasificación estructural 1990s (SCOP, DALI y CATH)

2do DDBASE, 3DEE, DaliDD (3D) Reciente comparación entre SCOP, DALI y CATH (+80% de correspondencia) Debido a que gran proporción de la estructura del CORE (+50%) esta conservada, el alineamiento estructural es mucho mas exacto que el secuencial. SCOP y CATH contienen actual/ entre 950 – 1400 superfamilias de proteínas. Estas superfamilias contienen casi 1/3 de las secuencias no redundantes del Gen Bank.

Desarrollo Histórico: 1993 con menos de estructuras de proteínas Una década después +/ entradas del PDB, comprende dominios estructurales dominios extraídos del GenBank Dominio: Importante unidad evolutiva  Debido a que los métodos de modelamiento por homología son más exitosos cuando se trabaja con dominios.

CATH inicialmente como una base de datos de dominios. CATH divide en clusters: Phonetically: Basado en Similaridad estructural Filogenéticamente: Basado en Aparente relación evolutiva Ambigüedades automáticas son validadas manualmente y el mayor cuello de botella en la clasificación corresponde a la detección de dominios limítrofes y la verificación de sus homólogos relacionados.

Niveles CATH Clase: estructura secundaria. Arquitectura: orientación de estructura secundaria en 3D. Topología: orientación estructural (folds) Homología: agrupadas según la evidencia (estructural, secuencia, similaridad funcional).

Sequence identity >= 35%, overlap >= 60% of larger structure equivalent to smaller. SSAP score >= 80.0, sequence identity >= 20%, 60% of larger structure equivalent to smaller. SSAP score >= 70.0, 60% of larger structure equivalent to smaller, and domains which have related functions, which is informed by the literature and Pfam protein family database, (Bateman et al., 2004).

Estrategia Método pairwise Perfil comparativo de secuencias y estructuras es usado para detectar mayores distancias. Examinación automática y manual para determinar dominios. Recomparación de dominios. Estructuras no clasificadas son manualmente asignadas.

SSAP Sequential Structure Aligment Program Adaptación de programación dinámica a 3D. Comparación de ambiente estructural de residuos entre proteínas. 2 niveles: –Superior: acumulación sobre pares equivalentes –Inferior: comparación entre ambiente estructural de residuos

GRATH Compara estructuras secundarias entre proteínas. Representación vectorial y son asociados con los “nudos” en un gráfico. Ángulos de inclinación y rotación para detectar motivos estructurales.

CORA Alineamiento progresivo estructura consenso alineamiento contra cada una. Se hace un template 3D. Reconoce homólogos distantes (estructural) Librería CORA. Más rápido, sensible y selectivo que el SSAP.

Identificación de Dominios Algunas proteínas no se pueden clasificar. No definición cuantitativa de dominio. Cualitativa: unidad plegada compacta semindependiente. Protocolo DBS (PUU, DOMAK, DETECTIVE). Ambigüedades: Manualmente validadas. 17 % discordancia entre SCOP y CATH

DHS Datos de: secuencia, estructura y función. Información sobre relación de pares de bases, E value, identidad de secuencias. PDB, Swiss prot, PROSITE, Gen ProtEC

GENE 3D Resource

Estadística en Poblaciones Actualmente existen: –36  28 Bien definidas  8 Irregulares, Complejas, Poco estables. –6 estructuras características: α bundles 2 capas β sandwich Barriles β 2 capas de αβ sandwich 3 capas de αβ sandwich αβ barriles

Estadística en Poblaciones Algunos grupos de plegamientos son particularmente “Gregarios”. Sin embargo 15% de los Folds son distintos Estructuras que comparten el mismo FOLD pero que descienden de ancestro común: –Análogos