© 2006 Plataforma Bioinformàtica de la UAB Introducció a la Bioinformàtica Bioinformàtica: la recerca biomèdica in silico.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Estrategias Reconocer fragmentos de secuencia asociados a características funcionales o estructurales concretas Agrupar la secuencia en una familia y heredar.
Procesadores de Lenguaje
Unidad de competencia II Estadística descriptiva:
PSI-BLAST.
HOMOLOGY MODELLING Modelado por homologia o comparativo
PRINCIPIOS DE MODELADO POR HOMOLOGÍA
METODO DE ANALISIS DE FALLAS
MÉTODOS DE ANÁLISIS FINANCIEROS
Análisis Matemático III
Diseño de Experimentos
ANALISIS SINTACTICO DESCENDENTE
Bases de datos en Bioinformática
Encuentra las 12 diferencias
ESTADISTICA PARA RELACIONES LABORALES
TEMA 4 ESTRUCTURA TRIDIMENSIONAL DE LAS PROTEINAS
El descubrimiento de elementos reguladores en los vertebrados a través de comparación de genomas Por Pilar Gonzalez Gomez Alberto Lietor Santos.
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
FUNCIONES DE DENSIDAD DE PROBABILIDAD
Sesión 2: Métodos Probabilísticos Básicos
GEOMETRÍA ANALÍTICA ESPACIO RECTAS Y PLANOS
J. Trinidad Guillen Bonilla, H. Guillen Bonilla, A. Guillen Bonilla,
Profile HMMs Perfiles de Modelos ocultos de Markov
GEOMETRÍA ANALÍTICA ESPACIO RECTAS Y PLANOS
Proteínas Las cantidades relativas de los diversos aminoácidos de una proteína, varia según la naturaleza y función del material proteínico. En las proteínas.
Licda. Albertina Montenegro
NIVELES ESTRUCTURALES DE LAS PROTEINAS
Probabilidad y estadística
Descomposición Factorial Unidad 5
Programa escolar 2008 Los nuevos desafíos en la enseñanza de la
Bioinformática: Fundamentos y aplicaciones de actualidad Curso de verano 2005 Revisión de algunos modelos probabilísticos de evolución genética (Procesos.
Distribuciones derivadas del muestreo
Matrices de Substitución PAM Y BLOSUM
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
TECNOLOGÍA ELECTRÓNICA FIABILIDAD I
Estadística La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de objetos, personas, procesos,
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Inferencia Estadística
Simular: Representar una cosa, fingiendo o imitando lo que no es.
Práctica 1 Teoría de errores
The CATH Domain Structure Database Ana Gabriela Murguía Carlos Villa Soto.
Ditribución del valor extremo Distribucion del maximo de N scores de matching de secuencias random independientes Si la probabilidad de este.
Muestreo y Convergencia en calculos de Energia Libre de Interacciones Proteina-Ligando: El enlace de la tripenoxipiridina derivado a factor Xa y tripsina.
Perspectiva genómica de las familias de proteínas Andrés Cuadros Suárez Cristina Donaire Ávila Trifón Giménez Vázquez Introducción a la Biología Computacional.
© 2006 Plataforma Bioinformàtica de la UAB Introducció a la Bioinformàtica Bioinformàtica: la recerca biomèdica in silico.
Aminoácidos de las proteínas están enlazados por uniones peptidicas
Matrices de sustitución
Clase # 2: Campo de Fuerza
INTRODUCCIÓN A LA INGENIERÍA DEL SOFTWARE
Bases de datos secundarias. Briefings in Bioinformatics 3 (2002):
Hidden Markov Models Angélica Minaya Francesca Barletta Jeanette Velásquez Mónica Pajuelo Daniel Rueda.
ALINEAMIENTO MULTIPLE: METODOS ALTERNATIVOS
Cadenas De Markov.
Hidden Markov Models Angélica Minaya Francesca Barleta Jeanette velásquez Mónica Pajuelo Daniel Rueda.
Análisis de los Datos Cuantitativos
Tomando decisiones sobre las unidades de análisis
Congruencias y semejanzas de figuras planas
Método de mínimos cuadrados
Análisis de estructuras. Problemas  No hay diferencias evidentes entre un modelo correcto y uno incorrecto  La utilización de una estructura desde el.
Cap.3 Moléculas Biológicas
© Copyright Ebiointel,SL 2006 Motivos, estructura y función Prof. Inma Ponte Motivos, estructura y función Prof. Inma Ponte.
ESTADÍSTICA DESCRIPTIVA
¿QUÉ ES UNA MÁQUINA DE JUEGO PROGRAMADO? Una máquina de juego programado es aquella en que el resultado del juego se encuentra definido por el programador.
Análisis de tablas y gráficos IV medio
Fuentes consultadas Fuentes consultadas Medios de Transmisión Medios de Transmisión Actividades de aprendizaje Actividades de aprendizaje Propósito Introducción.
Lic. María Isabel Fonseca PROTEÍNAS. Lic. María Isabel Fonseca PROTEÍNAS Niveles estructurales.
Alineamiento de secuencia de proteinas con HMM Sandra Cano.
PROSITE: Guía rápida Dirección URL de PROSITE.
Medidas de tendencia central
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

© 2006 Plataforma Bioinformàtica de la UAB Introducció a la Bioinformàtica Bioinformàtica: la recerca biomèdica in silico

© 2006 Plataforma Bioinformàtica de la UAB Motivos, estructura y función Motivos, estructura y función

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: Objetivos Análisis de la secuencia de aa de una proteína alineamiento con proteínas homólogas búsqueda de zonas conservadas Predecir la presencia de estructuras secundarias Analizar la presencia de motivos

© 2006 Plataforma Bioinformàtica de la UAB Posibles estructuras secundarias Hélice alfa Hoja beta Giro beta Random coil Motivos y estructuras: estructura secundaria

© 2006 Plataforma Bioinformàtica de la UAB Métodos de predicción de estructura secunadaria basados en el analisis de la estructura primaria: CHOU-FASMAN DELEAGE&ROUX GARNIER-ROBSON Motivos y estructuras: m é todos de predicci ó n Perfiles de hidroafinidad (hidrofobicidad/hidrofilicidad) Perfiles de flexibilidad. (flexibilidad de la cadena peptídica) Perfiles de densidad de carga

© 2006 Plataforma Bioinformàtica de la UAB Método estadístico basado en estructuras cristalográficas ya resueltas Calcula un parámetro conformacional para cada residuo de la proteína Este parámetro refleja la preferencia de este residuo en hallarse en un tipo de estructura determinado Inicialmente se basaron en 15 proteínas, después en 24 y finalmente en 64 Cuatro grupos de proteínas: alfa, beta, alfa+beta, alfa/beta Limitaciones: no se puede usar con proteínas muy distintas a las 64 proteínas con la estructura conocida en que se basa este método CHOU-FASMAN Motivos y estructuras: métodos de predicción

© 2006 Plataforma Bioinformàtica de la UAB -Método estadístico basado en tres pasos: predicción de la clase de proteína (según comp. Aa) predicción de la estructura secundaria (frecuencia de cada residuo) nueva predicción optimizando parámetros Limitaciones:si la predicción de la clase de proteína es correcto, la predicción de estructura secundaria es más acertada que en los otros métodos. Si la proteína no queda bien clasificada, la predicción no es fiable. DELEAGE&ROUX Motivos y estructuras: métodos de predicción

© 2006 Plataforma Bioinformàtica de la UAB -Método estadístico basado en estructuras cristalográficas ya resueltas (25) -No sólo tiene encuenta la preferencia de un aa por una estructura, sino que además considera el entorno de este aa (ventana de 16 aa) -Fundamentalmente se basa en los ángulos f y y del enlace peptídico y en los puentes de hidrógeno de las estructuras secundarias. Limitaciones:la proteína problema no debe diferir substancialmente de las 25 proteínas de estructura conocida. GARNIER-ROBSON Motivos y estructuras: métodos de predicción

© 2006 Plataforma Bioinformàtica de la UAB -Karplus flexibility Perfiles de probabilidad de encontrase en la superfície de la proteína Perfiles de hidroafinidad (hidrofobicidad/hidrofilicidad) Perfiles de flexibilidad. (flexibilidad de la cadena peptídica) -Eisemberg moment -Kyte-Doolitte -Emini surface probability Perfiles de densidad de carga -Charge density Motivos y estructuras: métodos de predicción

© 2006 Plataforma Bioinformàtica de la UAB -Karplus flexibility Perfiles de probabilidad de encontrase en la superfície de la proteína Perfiles de hidroafinidad (hidrofobicidad/hidrofilicidad) Perfiles de flexibilidad. (flexibilidad de la cadena peptídica) -Eisemberg moment -Kyte-Doolitte -Emini surface probability Perfiles de densidad de carga -Charge density Motivos y estructuras: métodos de predicción

© 2006 Plataforma Bioinformàtica de la UAB Métodos de predicción de estructura secunadaria basados NO solo en el analisis de la estructura primaria: Motivos y estructuras: m é todos de predicci ó n Neural Networks Models GOR – METHOD (Garnier, Ousguthorpe and Robson) PSA – METHOD (Protein Sequence Analysis)

© 2006 Plataforma Bioinformàtica de la UAB Se basa en la consideración de que la estructura que adoptan los aa que flanquean un determinado aa central determinan la estructura que adapta este aa central. El método estudia los 8 aa N-terminales y los 8 aa C- terminal. Establece tres o cuatro (GOR III /GOR IV) matrices: una cuando el aa central es alfa, otra para beta, otro para random, y otra turn. Usa información teórica para la decisión final. GOR – METHOD (Garnier, Ousguthorpe and Robson) Motivos y estructuras: métodos de predicción

© 2006 Plataforma Bioinformàtica de la UAB Neural Networks Models Estos métodos contemplan tres niveles: El primer nivel: la preedición se realiza sobre alineamientos múltiples El segundo nivel: se consideran los elementos de estructura secundaria en las proteínas homologa El tercer nivel: promediar las predicciones obtenidas independientemente. Motivos y estructuras: métodos de predicción

© 2006 Plataforma Bioinformàtica de la UAB PSA – METHOD (Protein Sequence Analysis) Este método predice la estructura secundaria de proteínas sin homología de secuencia y sin homología de estructura. Se basa en 15 modelos matemáticos. Se han establecido tres o cuatro superclases. Los modelos matemáticos establecen las restricciones de cada tipo de estructura alfa, beta, etc.. en cada superclase. Motivos y estructuras: Interpro

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: métodos de predicción

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: Interpro

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: métodos de predicción

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: Interpro

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: Interpro

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: Interpro

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: Interpro

© 2006 Plataforma Bioinformàtica de la UAB Muchas proteínas tienen estructura «modular» Estimación: ~ 3 dominios / proteína Dominios (secuencias o estructuras conservadas) identificadas por alineamiento múltiple de secuencia Dominio/motivo/patron Patrones (expresión regular); usado en dominios muy conservado Perfiles (matrices de pesos): tablas de dos dimensiones por posición específicos para match-, gap-, y insertion, derivados del alineamiento de secuencia de la familia, usado para dominios menos conservado Hidden Markov Model (HMM); modelo probabilístico. Métodos para definir dominios Motivos y estructuras: busqueda de motivos

© 2006 Plataforma Bioinformàtica de la UAB Bancos de datos de motivos/familia PROSITEPatrones / Perfiles ProDomAlineado de motivos (PSI-BLAST) (Pfam B) PRINTSAlineado de motivos PfamHMM (Hidden Markov Models) SMARTHMM TIGRfamHMM DOMOAlineado de motivos BLOCKSAlineado de motivos (PSI-BLAST) CDD(CDART)PSI-BLAST(PSSM) de Pfam y SMART Motivos y estructuras: busqueda de motivos

© 2006 Plataforma Bioinformàtica de la UAB consiste en patrones y perfiles significativos biológicamente ayudar a determinar a que familia de proteínas pertenece la secuencia. Motivos y estructuras: busqueda de motivos

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: busqueda de motivos Generar Patrón Prosite G-H-E-x(2)-G-x(5)-[GA]-x(3)

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: busqueda de motivos Ejemplo Patrón Prosite <A-x-[ST](2)-x(3,5)-{V} < N-terminal x cualquier aa [ST] serina o treonina dos veces x(3,5) cualquier aa de 3 a 5 veces {V} cualquier aa excepto valina

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: busqueda de motivos Patrón Prosite

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: busqueda de motivos Patrón Prosite

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: busqueda de motivos Perfil Prosite

© 2006 Plataforma Bioinformàtica de la UAB Motivos y estructuras: busqueda de motivos Perfil Prosite

© 2006 Plataforma Bioinformàtica de la UAB InterPro Motivos y estructuras: Interpro InterPro integra: Pfam PROSITE ProDom SMART TIGRFAMs

© 2006 Plataforma Bioinformàtica de la UAB InterPro Motivos y estructuras: Interpro

© 2006 Plataforma Bioinformàtica de la UAB Ejercicio 1 Determinar la predicción de estructura secundaria de las siguientes proteínas. Utilizar diferentes métodos y decidir que tipo de estructura es el mayoritario. Que proteasa utilitarias para aislar el C-terminal (aprox 100 últimos aa) de la histona H10. Te serviría esta misma proteasa para los otros subtipos El C-terminal de esta proteína tiene putativos sitios de fosforilacions para la CK2 y para la PKC.

© 2006 Plataforma Bioinformàtica de la UAB Secuencias: H10, TENSTSAPAAKPKRAKASKKSTDHPKYSDMIVAAIQAEKNRAGSSRQSIQK YIKSHYKVGENADSQIKLSIKRLVTTGVLKQTKGVGASGSFRLAKSDEPKKS VAFKKTKKEIKKVATPKKASKPKKAASKAPTKKPKATPVKKAKKKLAATPKK AKKPKTVKAKPVKASKPKKAKPVKPKAKSSAKRAGKKK H12 SETAPAAPAAAPPAEKAPVKKKAAKKAGGTPRKASGPPVSELITKAVAASK ERSGVSLAALKKALAAAGYDVEKNNSRIKLGLKSLVSKGTLVQTKGTGASG SFKLNKKAASGEAKPKVKKAGGTKPKKPVGAAKKPKKAAGGATPKKSAKK TPKKAKKPAAATVTKKVAKSPKKAKVAKPKKAAKSAAKAVKPKAAKPKVVK PKKAAPKKK H13 SETAPLAPTIPAPAEKTPVKKKAKKAGATAGKRKASGPPVSELITKAVAASK ERSGVSLAALKKALAAAGYDVEKNNSRIKLGLKSLVSKGTLVQTKGTGASG SFKLNKKAASGEGKPKAKKAGAAKPRKPAGAAKKPKKVAGAATPKKSIKKT PKKVKKPATAAGTKKVAKSAKKVKTPQPKKAAKSPAKAKAPKPKAAKPKSG KPKVTKAKKAAPKKK

© 2006 Plataforma Bioinformàtica de la UAB Ejercicio 2 Para una proteína dada (ejemplo TDF humana): ¿Cómo saber si contiene dominios funcionales? ¿Qué otras proteínas contienen ese mismo dominio funcional?

© 2006 Plataforma Bioinformàtica de la UAB Ejercico 3: Has realizado un protocoloo de purificaciónn de la prothymosin alfa humana (Q15200). En lugar de obtener una sola proteína, obtienes tres, con las siguientes características: proteína 1 Mr: pI: 7 proteína 2 Mr: pI: 3.7 proteina 3 Mr: pI: 6 Cual de ellas es la correcta, Que estrategia puedes utilizar para comprobar que realmente esta es tu proteína.

© 2006 Plataforma Bioinformàtica de la UAB Ejercicio 4: El domino globular de la histona H5 (1Hst) se ha resuelto por cristalografía. Quieres estudiar la estabilidad de la primera hélice alfa. Que aproximación puedes seguir.

© 2006 Plataforma Bioinformàtica de la UAB Construir un PatrónEjercicio 5: Construir un Patrón