La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Pablo Porras Millán, scientific curator

Presentaciones similares


Presentación del tema: "Pablo Porras Millán, scientific curator"— Transcripción de la presentación:

1 Pablo Porras Millán, scientific curator pporras@ebi.ac.uk
Capturando el interactoma: creación y análisis de bases de datos de interacciones moleculares Pablo Porras Millán, scientific curator

2 Lazebnik, Biochemistry (Mosc). 2004, PMID: 15627398
¿Por qué estudiar el interactoma? Lazebnik, Biochemistry (Mosc). 2004, PMID:

3

4 Really Important Component Undoubtedly Most Important Component
Serendipitiously Recovered Component

5 Un modelo que se ajusta a la realidad
El modelo del biólogo Un modelo que se ajusta a la realidad

6 European Institute of Bioinformatics

7 Tipos de datos registrados en el EBI
Bibliografía Genomas Secuencias de proteínas Secuencias de nucleótidos Proteomas Expresión génica Estructura de proteínas Familias, motivos y dominios proteicos Sustancias químicas Interacciones proteína-proteína Sistemas Rutas biológicas

8 Un par de definiciones…
Interacciones proteína-proteína (IPPs): contactos físicos y selectivos que ocurren entre pares de proteínas en determinadas regiones moleculares y en un contexto biológico definido. Interactoma: Conjunto de interacciones proteína-proteína que tienen lugar en la célula / en un organismo / en un contexto biológico determinado… Red de interacciones proteína-proteína: Representación gráfica de un conjunto de IPPs en la que las proteínas se representan en forma de nodos y las interacciones en forma de aristas.

9 ¿Por qué estudiar interacciones proteína-proteína (IPPs)?
Nivel gen Nivel proteína ADN ARN 1 proteína = n funciones n redes 1 proteína = 1 función ¡MAL! Para predecir la función biológica de la proteína “culpable por asociación” Proteínas con funciones similares deberían agruparse Para mejorar la caracterización de complejos proteicos y vías biológicas Las redes de interacción funcionan como un mapa-borrador en el que ensamblar los elementos que forman las vías biológicas

10 Culpable por asociación
Kinasa ciclina-dependiente Regulación de la transcripción Proto-oncogén Factor de transcripción Mediador de la actividad de la ARN-polimerasa Regulación de la transcripción Histona metiltransferasa Papel en desarrollo temprano y hematopoyesis Ciclina Regulación de ciclina-kinasa, regulación transcripción y ciclo celular Modulador transcripcional Regulación de la transcripción dependiente de kinasas Algo que ver con transcripción y control del ciclo celular Modulador transcripcional activado por receptor Modulación de la transcripción, transducción de señales, activado por kinasas Papel en la inhibición de la curación de heridas Posible oncoproteína Implicado en la regulación de la transcripción Posible oncoproteína Activación de la transcripción

11 Tipos de interacciones proteína-proteína
Interacciones binarias – Dos participantes Colocalización – Proximidad de dos o más participantes Ints. n-arias (asociaciones) – Purificación de complejos Ints. funcionales / directas – Ej. Ints. enzimáticas

12 Interacciones binarias

13 Colocalización

14 Interacciones n-arias (asociaciones)
Schleiff et al., Nat Rev Mol Cell Biol PMID:

15 Interacciones funcionales / directas
Generalmente ensayos in vitro Los participantes suelen conocerse por adelantado (predeterminados) Ejs.- ensayos enzimáticos, SPR, cristalografía, métodos que usan proteínas purificadas… Imágenes tomadas de Wikipedia:

16 Purificación por afinidad en tándem + espectrometría de masas
Métodos de detección de PPIs Doble híbrido (Y2H) Alto rendimiento Purificación por afinidad en tándem + espectrometría de masas (TAP-MS) Ningún método puede reproducir una verdadera interacción binaria observada en condiciones fisiológicas – todas las interacciones detectadas experimentalmente son esencialmente artefactos Difracción de rayos X Bajo rendimiento There are multiple types of experimental methods used to detect protein-protein interactions. Two methods are important due to their use in high-throughput studies: these are the yeast two hybrid complementation assay (Y2H) and tandem-affinity purification followed by mass spectrometry (TAP-MS). Y2H is a fast, inexpensive and scalable method to detect binary interactions. TAP-MS will detect of multi-protein (n-ary) interactions. Other approaches that are less amenable to high-throughput setups are used in small-scale studies and provide more detailed structural and chemical information about the interaction. Credits for structure model: Cullin-complex model from Kleiger et al., Cell 139, , 2009.

17 Representando IPPs: dominios de interacción
We can specifically describe interacting domains down to the residue level. The domain can be represented as the specific range of the underlying amino acid sequence. Including required PTM These ranges are remapped whenever UniProtKB updates their protein sequences. Solapamiento de rangos en la secuencia:

18 El problema de los complejos
Representando IPPs: El problema de los complejos Algunos metodos experimentales generan datos de tipo complejo: Ej. Purificación por afinidad en tándem (TAP) Cuando se debe convertir esta información en datos binarios, hay 2 algoritmos disponibles: Computational tool to aid searches, Transforms n-ary interaction into binary, Both are somewhat wrong, spoke is said to generated 3 times less false positive (Bader et al.).

19 Bases de datos de interacciones: tipos
De Las Rivas & Fontanillo, PLoS Computational biology, PMID:

20 Bases de datos primarias: niveles de curación
Curación superficial BioGRID – curación activa, número limitado de organismos modelo HPRD – curación activa, centrada en humanos, predicción de interacciones MPIDB – curación activa, interacciones en microbios InnateDB – curación activa – interacciones relacionadas con inmunidad innata Curación a fondo IntAct – curación activa, amplia cobertura de especies, todo tipo de moléculas MINT – curación activa, amplia cobertura de especies, sólo IPPs DIP – curación activa, amplia cobertura de especies, sólo IPPs MPACT – actualmente sin curación, cobertura de especies limitada, sólo IPPs MatrixDB – curación activa, sólo moléculas de la matriz extracelular BIND – detuvo la curacción en 2006/7, amplia cobertura de especias, todo tipo de moléculas – la información está quedando desfasada I2D – curación activa – IPPs implicadas en cáncer CURACIÓN A FONDO CURACIÓN SUPERFICIAL

21 Bases de datos primarias: cobertura
De Las Rivas & Fontanillo, PLoS Computational biology, PMID: Cobertura de IPPs humanas en las principales bases de datos públicas

22 Un estándar para la representación de interacciones: el consorcio iMEX
Orchard et al., Nature Methods, PMID:

23 Cliente de consulta unificada: PSICQUIC
Interacciones PSI-MI Salida Consulta MIQL Entrada PSICQUIC PSICQUIC Registro Servicio A Servicio B Servicio C

24 IntAct: Esquema de almacenamiento de datos
Entrada Publicación Experimento 1 Interacción 1 Participante 1 Características Participante 2 Interacción 2 Experimento 2 Interacción 3 Interacción 4 [A] Nivel publicación (entrada) [B] Nivel experimento [C] Nivel interacción READY TO GO This is a schema of how interaction data is stored in IntAct. Each entry in the database corresponds to a publication [A], that is, a scientific article that is curated by the IntAct team. The information in the paper is analyzed and those experiments that contain molecular interactions are represented in the database (experiment level, [B]). Each experiment corresponds to one or more interactions identified in the same organism using the same techniques. The interactions in each experiment are then listed in the interaction level [C], adding information such as kinetic binding parameters, if they were given by the authors. Each participant is identified using cross-references to existing resources such as UniProt or CheBI, if possible, and represented in the participant level [D]. Finally, features of each participant such as binding sites, tags, mutations affecting the interaction or post-translational modifications can be depicted in detail in the feature level [E]. [D] Nivel participante [E] Nivel característica

25 IntAct: Uso de la ontología PSI-MI

26 IntAct: El trabajo del “curator” (curador)
PROPUESTAS DIRECTAS PAQUETES DE DATOS DE PROYECTOS DE DETECCIÓN DE INTERACCIONES A GRAN ESCALA DATOS DE INTERACCIONES MOLECULARES PUBLICADOS CURACIÓN

27 PAQUETES DE DATOS DE PROYECTOS DE DETECCIÓN DE INTERACCIONES A GRAN ESCALA
DATOS DE INTERACCIONES MOLECULARES PUBLICADOS CURACIÓN PROPUESTAS DIRECTAS FUNCIÓN Gene Ontology UniProtKB SECUENCIAS PROTEÍNA MOLÉCULAS PEQUEÑAS ChEBI REFERENCIAS CRUZADAS SECUENCIAS GENOMA Ensembl FAMILIAS Y DOMINIOS InterPro Otros ESTRUCTURA, ORGANISMO, TEJIDO, ETC…

28 Búsqueda web en IntAct www.ebi.ac.uk/intact copia y pega
Searching for interactions in IntAct is very simple: just paste the name or accession of your molecule(s) of interest in the search bar and press "Search". In this example, we use a list of proteins and we give their UniProtKB accessions.

29 Detalles de la interacción
Resultados de la búsqueda This view is based on the standard MITAB columns (minus confidence) Describes a binary interactions (!) a binary interaction collapses multiple experiment evidences into a single line (!) the order of interactor A and B is non deterministic (!) whenever the data originates from an n-ary interaction, it is expanded using the spoke model The next version is going to show an other XX columns including the method of expansion, so one can filter out Next slide shows all MITAB columns Enlace a UniProtKB o a Dasty Detalles de la interacción

30 IntAct: Representando interacciones

31 IntAct: el visualizador Dasty
READY TO GO! Dasty is an EBI web client that integrates protein annotated information coming from services such as IntAct, PDB, UniProt, InterPro or PRIDE. In the Dasty visualization multiple annotations referred to a given protein are summarized, allowing us to access information regarding the sequence features, protein structure or any other annotations that might have been added through the services linked by Dasty.

32 IntAct: Búsquedas con MIQL
Podemos hacer consultas complejas usando el Molecular Interaction Query Language (MIQL). Lista de campos usados para hacer consultas:

33 IntAct: Visualizando interacciones con networkView

34 Más información sobre IntAct: cursos “on-line” en el EBI

35 Desafíos en representación e integración de datos en las redes de IPPs
Blisson et al., 2011, Nature Biotechnology, PMID:

36 Mas información sobre el análisis del interactoma
Nuestro grupo ha escrito un tutorial dentro de un programa de la Human Protein Organization (HUPO) tratando la importancia del análisis de las redes de interacciones moleculares y que presenta un ejemplo de análisis guiado para el lector: Koh, Porras, Aranda, Hermjakob, & Orchard, 2012, Journal of Proteome Research, PMID: Una buena revisión general acerca de conceptos básicos en el estudio del interactoma: De Las Rivas & Fontanillo, 2010, PLoS Computational Biology, PMID: Otra revisión general, centrada en el estudio del interactoma en relación a enfermedades humanas: Vidal, Cusick, & Barabási, 2011, Cell, PMID: Una revisión reciente sobre biología de redes diferencial, el estudio de las diferencias entre situaciones biológicas distintas en contraste con el interactoma estático: Ideker & Krogan, 2012, Molecular Systems Biology, PMID: Asignar puntuaciones en función de la confianza a interacciones moleculares requiere usar estrategias paralelas y complementarias. En este artículo de evalúa la fiabilidad de distintos métodos de detección experimental con respecto a un set de interacciones de referencia: Braun et al., 2008, Nature Methods, PMID: Para terminar, un buen ejemplo de análisis usando datos que proceden de bases de datos primarias. Los autores construyen una red de alta calidad usando datos de interacciones binarias en las que hay información acerca de las superficies de interacción a resolución atómica, integran información relativa a mutaciones causantes de enfermedad y encuentran que existe una correlación entre la posición de dichas mutaciones en las superficies de interacción y su predisposición a causar enfermedad: X. Wang et al., 2012, Nature Biotechnology, PMID:

37 Equipo de desarrolladores
Agradecimientos Henning Hermjakob Jefe de grupo Sandra Orchard Margaret Duesbury Jyoti Khadake Equipo de curación Coordinadora Rafael Jiménez Marine Dumousseau  Noemí del Toro John Gómez Equipo de desarrolladores


Descargar ppt "Pablo Porras Millán, scientific curator"

Presentaciones similares


Anuncios Google