La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

PREDICCIÓN DE CARACTERÍSTICAS 1D

Presentaciones similares


Presentación del tema: "PREDICCIÓN DE CARACTERÍSTICAS 1D"— Transcripción de la presentación:

1 PREDICCIÓN DE CARACTERÍSTICAS 1D
Paolo Maietta ex-miembro del Grupo de Biología Computacional Estructural Centro Nacional de Investigaciónes Oncológicas (CNIO) Wikimedia Commons by LadyofHats

2 SUMARIO Estructura de proteínas Definición de características 1D
Predicción de características 1D Estructura Secundaria Desorden structural Accesibilidad al solvente Elementos transmembrana Otras características 1D

3 SUMARIO Estructura de proteínas Definición de características 1D
Predicción de características 1D Estructura Secundaria Desorden structural Accesibilidad al solvente Elementos transmembrana Otras características 1D

4 De los aminoácidos …. Cada aminoácido tiene unas características físico - químicas distintas; Estas influyen en el plegamiento de la proteína

5 De los aminoácidos …. Cada aminoácido tiene unas características físico - químicas distintas; Estas influyen en el plegamiento de la proteína Y además los aminoácidos están conectados entre si en una cadena …. >Estructura Primaria ASKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTT GKLPVPWPTLVTTFSYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTIFF KDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNV YIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHY LSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYK

6 … a la Estructura Pro Gly Diagramas de Ramachandran Matthews/Van Holde
Biochemistry, 2nd edition

7 α helices El esqueleto de la proteína adopta una conformación de hélice y en cada giro entran 3.6 residuos. Los enlaces de hidrógenos entre los grupos carboxilo del residuo n y el grupo amino del residuo n+4 estabilizan la estructura. Las hélices son flexibles y las cadenas laterales miran hacia fuera.

8 β strands p a Los β strands se juntan para generar β sheets gracias a la energía de estabilización de los enlaces de hidrógeno entre las diferentes láminas.

9 β sheets and turns ... Los β sheets pueden estar plegados o torcidos pero no son flexibles !! Los β sheets pueden contener láminas paralelas, anti-paralelas o una mezcla de ambas.

10 β sheets and turns ... Los β sheets pueden estar plegados o torcidos pero no son flexibles !! En un giro π (i → i+5) En un giro α (i → i+4) En un giro β (i → i+3) En un giro γ (i → i+2) En un giro δ (i → i+1) Los β sheets pueden contener láminas paralelas, anti-paralelas o una mezcla de ambas.

11 Y además …..

12 SUMARIO Estructura de proteínas Definición de características 1D
Predicción de características 1D Estructura Secundaria Desorden structural Accesibilidad al solvente Elementos transmembrana Otras características 1D

13 Definición características 1D
Todas aquellas que puedan ser representadas por un único valor asociado a casa aminoácido (B. Rost) Estos valores suelen tomar la forma de etiquetas de estado (ej: estructura secundaria: H → hélice, L → lámina, C → giro). También pueden ser relativos (ej: la accesibilidad al solvente puede representarse en porcentajes) En algunos métodos, las asignaciones van acompañadas de un valor de fiabilidad

14 Importancia características 1D
Porque estamos interesados en estas propiedades ?? Basicamente porque proporcionan información útil para caracterizar funcionalmente y estructuralmente una proteína: Peptidos señal y regiones transmembrana → localización celular, y también función Las modificaciones post-transcripcionales → procesos biológicos como la regulación Los métodos de predicción de estructura se nutren de estas técnicas Muchos métodos de predicción de estructura utilizan predicción de estructura secundaria y otras predicciones 1D. Esto es muy importante para Fold Recognition y es esencial para métodos ab-initio.

15 SUMARIO Estructura de proteínas Definición de características 1D
Predicción de características 1D Estructura Secundaria Desorden structural Accesibilidad al solvente Elementos transmembrana Otras características 1D

16 Estructura secundaria (DSSP)
1 ASKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTT TTGGGGSSEEEEEEEEEEEETTEEEEEEEEEEEETTTTEEEEEEEETT 51 GKLPVPWPTLVTTFSYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTIFF SS SS GGGGHHHHSSS GGG B GGGGGG HHHHTTTT EEEEEEEEE 101 KDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNV TTS EEEEEEEEEEETTEEEEEEEEEEE TTSTTTTT B S EEE 151 YIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHY EEEEEGGGTEEEEEEEEEEEETTS EEEEEEEEEEEESSSS SEE 201 LSTQSALSKDPNEKRDHMVLLEFVTAAGIT HGMDELYK EEEEEEEE TT SSEEEEEEEEEEES DSSP estudia la estructura secundaria en archivos de coordenadas atómicas basándose en patrones que tienen en cuenta: Geometría Puentes de Hidrógeno T = giro estabilizado por P de H H = α-helice, ~4 aa por vuelta G = helice 310, ~3 aa por vuelta I = helice phi, ~5 aa por vuelta B = conformacion β E = conformacion β formando lamina S = giro (sin P de H)‏ Kabsch and Sander (1983) Biopolymers 22,

17 Historia de los métodos
Primera generación Métodos estadísticos basados simplemente en la tendencia de cada aminoácido a formar cada uno de los elementos de estructura secundaria Chou y Fasman en 1974, propusieron el primero de estos métodos. Emplearon estadísticas extraídas de las 15 estructuras resueltas por cristalografía de rayos-X en aquella época. Estas probabilidades fueron calculadas para cada resíduo por separado. Más adelante este método mostró una exactitud del 57% sobre 62 proteínas. Garnier (1978). Estimó las probabilidades para interacciones de pares de resíduos significativas, obteniendo una mayor fiabilidad (~60%).

18 Historia de los métodos (2)
Chou-Fasman Glu, Met y Ala : fuerte tendencia a generar hélices. Val, Ile y Tyr: fuerte tendencia a generar láminas. Pro: fuerte tendencia a no formar hélices ni láminas Gly: alto grado de libertad, favorece la formación de giros Name P(a) P(b) P(turn) f(i) f(i+1) f(i+2) f(i+3)‏ Alanine Arginine Aspartic Acid Asparagine Cysteine Glutamic Acid Glutamine Glycine Histidine Isoleucine Leucine Lysine Methionine Phenylalanine Proline Serine Threonine Tryptophan Tyrosine Valine

19 Historia de los métodos (3)
Segunda generación La principal característica de estos métodos es la utilización de ventanas de resíduos adyacentes en secuencia, incluyendo así información de contexto a la predicción. Un gran número de algoritmos de predicción se usaron en esta generación de métodos: Redes Neuronales Artificiales Teoría de Grafos Métodos basados en reglas Estadística multivariable Esta innovación mejoró la predicción de estructura secundaria aumentando la fiabilidad

20 Historia de los métodos (4)
Limitaciones Fiabilidad (predicciones 3-estados ~ 70%)‏ Bajas fiabilidades de predicciones de cadenas-β La hélices y láminas predichas tienden a ser demasiado cortas. Debido a: El número de estructuras disponibles sigue siendo demasiado pequeño para extrapolar todo el espacio de secuencias. NO se tienen en cuenta los efectos provocados por resíduos situados a grandes distancias en secuencia (pero no en el espacio)‏

21 Historia de los métodos (5)
Tercera generación Iniciada por Levin en 1993 y Rost y Sander en 1994 La principal innovación de esta tercera generación es la inclusión de información evolutiva adicional en forma de alineamientos múltiples (Levin, 1993). Además, se resuelve el sesgo en las predicciones de cadenas-β balanceando el conjunto de entrenamiento (dado que las estructuras contienen más hélices que láminas; Rost y Sander, 1994)‏ Red neuronal PHD Información de secuencia de la familia de la proteína Perfil derivado del alineamiento múltiple para una ventana de resíduos adyacente. Rost et al. (1997) J. Mol. Biol. 270:

22 Historia (6) y Fiabilidad
Varios métodos han seguido estrategias similares a PHD, mejorando sus resultados a través del prefiltrado de los alineamientos de entrada y la extensión de los perfiles mediante PSIBLAST introducido por David Jones en la primera versión de PSIPRED (1999) con fiabilidades próximas al 77% o mediante HMMs usados por Kevin Karplus et al. en SAMT99sec (1999). Otros métodos siguen una estrategia diferentes, buscando el consenso de diferentes métodos, como es el caso de Jpred2 (Cuff y Barton, 2000). Métodos de Primera generación: Chou & Fasman, Lim, GORI Métodos de Segunda generación: Schneider, ALB, GORIII Métodos de Tercera generación: LPAG, COMBINE, S83, NSSP, PHD Y la fiabilidad ?

23 Fiabilidad Métodos basados en secuencias Accuracy Structure based
Statistics Chow-Fassman (1974)‏ 57% GOR1/GOR3 (1978/1987)‏ 63%/66% DSC (1996)‏ 70% Nearest neighbour methods PREDATOR (1996)‏ 75% NNSSP (1995)‏ 72% Neural Networks Methods 74% PHD (1993)‏ 75.7% PsiPRED (1999)‏ 73% JNET (1999)‏ Structure based Hidden Markov Models ~76% SAM-T99/SAM-T02 (1999/2002)‏

24 Problemas y Limitaciones
IMPORTANTE: la fiabilidad sigue dependiendo del número de homólogos !! Fiabilidad de PHD usando un conjunto de proteínas de prueba NO se tienen en cuenta los efectos provocados por resíduos situados a grandes distancias en secuencia (pero no en el espacio) Las proteínas con características inusuales deben tratarse con cuidado Las predicciones siguen cosiderando sólo tres estados Los malos alineamientos producen malas predicciones

25 SUMARIO Estructura de proteínas Definición de características 1D
Predicción de características 1D Predicción de características 1D Estructura Secundaria Desorden structural Accesibilidad al solvente Elementos transmembrana Otras características 1D

26 Desorden Estructural Algunas regiones de las secuencias no pueden clasificarse en ninguno de los tipos de estructura secundaria Estas regiones normalmente no son visibles en los cristales y están desordenadas. Las regiones desordenadas son rizos, caracterizados normalmente por elevados niveles de aminoácidos polares junto con bajos de aromáticos o regiones de baja complejidad. Algunas regiones desordenadas cortas, sin importancia funcional aparente, suelen hallarse en los extremos de las cadenas proteicas.

27 Desorden Estructural Las regiones más largas suelen estar conservadas en posición a lo largo de familias de proteínas. Estas regiones se relacionan con conexión entre dominios, sitios proteolíticos, así como con reconocimiento y unión tanto a ligandos como a otras proteínas. Suelen encontrarse en ciertas enzimas, como en aquellas involucradas en el crecimiento y división celular o en fosforilación proteica. Entre estas proteínas podemos encontrar factores y reguladores de transcripción y kinasas entre otras. Ejemplo de proteína desordenada el factor de crecimiento nervioso β (PDB: 1bet), que sólo es estable como dímero

28 Métodos

29 Evaluación de los métodos
The CASP10 experiment results

30 SUMARIO Estructura de proteínas Definición de características 1D
Predicción de características 1D Estructura Secundaria Desorden structural Accesibilidad al solvente Elementos transmembrana Otras características 1D

31 Accesibilidad al solvente
Al igual que con las predicciones de estructura secundaria, se puede estudiar la plausibilidad de las estructuras predichas por un método dado mediante el uso de la información de accesibilidad al solvente. Además esta infomación puede ser de utilidad en otros ámbitos, como la predicción de superficies de interacción entre proteínas o de sitios funcionales. Roßbach et al. BMC Structural Biology :7 La mayoría de los métodos reducen el problema a la predicción de dos estados Oculto: acc. Relativa < 16% Expuesto: acc. relativa >= 16%

32 Accesibilidad al solvente
Aunque la accesibilidad es una función de la hidrofobicidad, los métodos basados en perfiles de esta propiedad producen unas predicciones pobres. La predicción de accesibilidad mejora por el uso de ventanas en secuencia. Al igual que ocurre con la estructura secundaria, la accesibilidad al solvente es una propiedad sujeta a fuertes restricciones evolutivas, por lo que su predicción se beneficia del uso de alineamientos múltiples. PHDacc y PROFacc (B. Rost) emplean redes neuronales e infomación de alineamientos múltiples. Son los únicos métodos que predicen valores reales para accesibilidades relativas. JPred2 usa perfiles de PSIBLAST como entrada para sus redes neuronales y devuelve predicciones del tipo oculto/expuesto. Estos métodos tienen una porcentaje de acierto del 70-75%

33 SUMARIO Estructura de proteínas Definición de características 1D
Predicción de características 1D Estructura Secundaria Desorden structural Accesibilidad al solvente Elementos transmembrana Otras características 1D

34 TMS Ejemplos de elementos transmembrana (TMS) Se estima que un ~ 25/30% del proteoma contiene elementos transmembrana. Si se considera elementos como los péptidos señal, las predicciones indican que el ~ 12% de los genes codifican para los mismos.

35 Source: PDBTM http://pdbtm.enzim.hu/?_=/statistics/growth
Y ¿En el PDB? Source: PDBTM

36 ¿Cuál es el problema? La obtención de estructuras tridimensionales de proteínas transmembrana es un gran problema, ya que raramente producen cristales y su estudio por NMR es muy complicado. Las interacciones con el intorno hidrofóbico de la membrana son dificiles de modelar; por eso una predicción de estructuras transmembrana a nivel atómico sigue siendo dificil. Hernanz-Falcon P, Rodriguez-Frade JM, Serrano A, Juan D, del Sol A, Soriano SF, Roncal F, Gomez L, Valencia A, Martinez-A C, Mellado M. Nat Immunol Feb;5(2):

37 Predicción de topología TM
Las mismas restricciones que hacen que obtener cristales de las TMP sea complicado, nos permite pre-fijar unas reglas para predecir segmentos TM, hélices en la gran mayoría. Las regiones de conexión entre hélices del interior del citoplasma tienen una carga positiva mayor que las del exterior. Las hélices transmembrana tienden a tener una logitud de resíduos con una hidrofobidad total alta.

38 Problemas ... Region extracelular Region transmembrana
Region citoplasmatica

39 Algunos predictores de TMH
MEMSAT3 - Algoritmo de programación dinámica que hace predicciones basadas en tablas estadísticas compiladas de los datos de proteínas de membrana. TopPred2 - Promedia los valores de hidropatía con una ventana trapezoidal HMMTOP - Se definen 5 estados estructurales mediante HMMs para generar fragmentos de secuencia que maximizen la frecuencia de cada estado. PHDhtm - Combina redes neuronales, alineamientos múltiples y programación dinámica (proporciona un índice de fiabilidad). TOPCONS - Es un consenso de varios métodos creados por el grupo de Viklund y Elofsson, todos disponibles por separado (Phobius). TMHMM v Métodos estadísticos y HMMs que ayudan a mejorar la localización y orientación de hélices trans-membrana.

40 Fiabilidad Los métodos actuales dicen identificar correctamente > 90% de los segmentos trasmembrana y predecir correctamente la topología en > 80% de los casos. Sin embargo, el pequeño tamaño de los conjuntos de entrenamiento (hay poco menos que de 518 estructuras no redundantes conocidas) hacen estas estimaciones poco fiables (¿~70%?)‏ Se sabe que todos los métodos tienden a sobrepredecir proteínas globulares.

41 Hay predictores de TMB Hace algunos años han aparecido algunos métodos orientados a la predicción de barriles beta en membrana externa de bacterias Gram negativas. Se basan en HMM. PRED-TMBB PROF-TMB La escasez de estructuras distintas disponibles (sólo 90 no redundantes …) que además se usan para entrenar los métodos, hace que resulte muy difícil evaluar la calidad de dichos métodos (75-80% pero esta sobrevalorado !!).

42 Péptidos Señal Es una complicación anterior a la predicción de hélices transmembranas ... Cadenas peptídicas cortas (3-60 aa) que dirigen el tranporte post-transduccional de una proteína TIPOS: Señales N-terminal: matriz mitocondrial, retículo endoplasmático, peroxisoma Señales C-terminal: peroxisoma, RE Transporte al núcleo (NLS) -Pro-Pro-Lys-Lys-Lys-Arg-Lys-Val- Tranporte a RE H2N-Met-Met-Ser-Phe-Val-Ser-Leu- Leu-Leu-Val-Gly-Ile-Leu-Phe- Trp Ala-Thr-Glu-Ala-Glu-Gln- Leu-Thr-Lys-Cys-Glu-Val-Phe- Gln- Retención en RE -Lys-Asp-Glu-Leu-COOH Transporte a matriz mitocondrial H2N-Met-Leu-Ser-Leu-Arg-Gln-Ser- Ile-Arg-Phe-Phe-Lys-Pro-Ala- Thr Arg-Thr-Leu-Cys-Ser-Ser- Arg-Tyr-Leu-Leu- Transporte a peroxisoma (PTS1) -Ser-Lys-Leu-COOH Transporte a perosisoma (PTS2) H2N-----Arg-Leu-X5-His-Leu-

43 Recursos Disponibles 2006 2016 Fuente: Signal Peptide Resource
Archaea Bacteria Eukaryotes Viruses Sub-Total Exp. Verificadas 7 553 2114 74 2748 Predichas 99 4701 14190 804 19794 TOTAL 106 5254 16304 878 22542 2006 Archaea Bacteria Eukaryotes Viruses Sub-Total Exp. Verificadas 7 501 1984 20 2512 Predichas 99 6455 17348 1019 24921 TOTAL 106 6956 19332 1039 27433 2016 Fuente: Signal Peptide Resource Servidores de predicción: PSORT – predicción de péptidos señal y sitios de localización TargetP – predicción de localización subcelular SignalP – predicción de péptido señal

44 SUMARIO Estructura de proteínas Definición de características 1D
Predicción de características 1D Estructura Secundaria Desorden structural Accesibilidad al solvente Elementos transmembrana Otras características 1D

45 Otros predictores ... Enlace de interés
ChloroP – predicción de péptidos de cloroplasto NetOGlyc – predicción de sitios de O-glicosilación en proteínas de mamífero Big-PI – prediccíon de sitios de modificación por glycosil-phosphatidyl inositol(GPI) DGPI – predicciónde sitios de anclaje y rotura para proteínas modificadas por GPI NetPhos – predicción de sitios de fosforilación (Ser, Thr, Tyr) en eucariotas NetPicoRNA - prediction of cleavage sites for proteases in the picornavirus NMT – predicción de N-miristoilacion en N-terminales Sulfinator – predicción de sitios de sulfatación en tirosinas

46 Fin PREGUNTAS ?? Tengo que dar las gracias a:
Gonzalo Lopez por muchas figuras y información Michael Tress, por lo mismo y por la confianza; A todo el labo por la ayuda y las sugerencia …. Y por supuesto a vosotros por vuestra atención (espero … ) PREGUNTAS ??


Descargar ppt "PREDICCIÓN DE CARACTERÍSTICAS 1D"

Presentaciones similares


Anuncios Google