Pablo Porras Millán, scientific curator

Slides:



Advertisements
Presentaciones similares
LLUÍS CODINA UPF MÁSTER IDEC 2009 Ciencia 2.0. Web 2.0 Contenido creado por los usuarios Redes sociales Aplicaciones en línea Colaboración L. Codina.
Advertisements

Las bases moleculares de la herencia
INTRODUCCIÓN A LA BIOINFORMÁTICA
ESTRUCTURA Y REGULACIÓN GÉNICA
ESTRUCTURA Y REGULACIÓN GÉNICA Muchos factores, un objetivo.
Lenguaje Unificado de Modelado
OPERON LAC.
PURIFICACIÓNDE PROTEÍNAS Semestre 2011-I 16 Agosto 2010
PURIFICACIÓNDE PROTEÍNAS Semestre Febrero 2012
Maestría en Explotación de Datos y Descubrimiento del Conocimiento
INTERACCIONES MACROMOLECULA - LIGANDO
Base de datos de estructuras 3D de proteínas: PDB
Dr. Justo Zanier Mayo 2010 MEDICINA GENOMICA Dr. Justo Zanier Mayo 2010.
Artur Ezquerra González Genómica y Proteómica 12/06/2013
FUNDAMENTOS DE PROGRAMACIÓN
Guia Diseño Robert Echeverria
Maduración del Linfocito B
Administración de Procesos de Pruebas
ESTRUCTURA TERCIARIA: PROTEÍNAS GLOBULARES
Bases de datos en Bioinformática
DIAGRAMA DE COMPONENTES INTEGRANTES Córdova Vásquez Giovanny Escobar Alvares Calixto Gomez Quinteros Adelaida Pinto Flores Yarmila.
Intelligent Databases and Information Systems research group Department of Computer Science and Artificial Intelligence E.T.S Ingeniería Informática –
Licenciatura en Bioquímica José L. Oliver
International Nucleotide Sequence Database Collaboration
QUÍMICA ANALÍTICA I FUNDAMENTO DE QUÍMICA ANALÍTICA
BIOMOLÉCULAS INORGÁNCIAS
Posibles puntos de regulación de la expresión génica
Financian: Solicita:Colaboran: Asturias.  Presentación del estudio  Introducción a la calidad en la docencia  Análisis DAFO de la calidad en la educación.
Detección de Secuencias Reguladoras en el Genoma
Virus Hepatitis B y C: Virología aplicada Conceptos de genotipos, cuasiespecies, mutantes Epidemiología molecular en Argentina Jorge Quarleri Instituto.
BIOQUIMICA Y BIOLOGIA MOLECULAR DE PLANTAS
Profesor José De La Cruz Departamento de Biología y Química
COMUNICACIÓN CELULAR Unidad 8
PROSPECCIÓN DE GENES CANDIDATOS PARA CARACTERES ASOCIADOS AL RENDIMIENTO EN TRIGO PAN Ramírez IA 1, AC Pontaroli 2 Introducción 1 FCA-UNMdP; 2 EEA Balcarce.
Gung Ho! Gung Ho! Gestión de los Stakeholders
INGENIERIA METABOLICA
BIOINFORMÁTICA.
Diseño de la investigación
Fundamentos de programación
RESUMEN En este artículo se describe en forma breve una de las líneas de investigación que se están llevando a cabo en el Laboratorio de Tecnologías Emergentes.
Ácido desoxirribonucleico
Construcción de una variedad transgénica.
Gene Ontology: GO Prof. Dr. José L. Oliverhttp://bioinfo2.ugr.es/oliver.
NOVEDADES CIENTIFICAS
Ingeniería del Software
Métodos para secuenciar el ARN
DISEÑO DE LA INVESTIGACIÓN
Alfonso Varela Toro José Ramón Polo López MODELADO DE LA MAQUINARIA CELULAR A TRAVÉS DE LA COMPARACIÓN DE REDES BIOLÓGICAS.
Introducción al Biclustering
Tema 9: Regulación de la expresión génica en eucariotas
Alex Sánchez Introducción a la Bioinformática Herramientas de búsqueda en bases de datos SRS y Entrez.
TRANSCRIPTOMICA & PROTEOMICA
Bioinformática Introducción. Bioinformática Definición intuitiva Conjunto de herramientas informáticas que sugieren soluciones a problemas biológicos.
Nieves Ábalos Serrano Mª Teresa Jiménez Ramírez
BIOLOGIA COMPUTACIONAL
SGC PARA EL SUBSISTEMA DE EDUCACIÓN ESCOLAR Y EXTRAESCOLAR GUATEMALTECO José Manuel Abreu
Proyecto Genoma Humano
Diseño de Sistemas.
TIPOS DE PRUEBAS DEL SOFTWARE
REGULACIÓN DE LA EXPRESIÓN GÉNICA
OBJETIVOS - Generar el conocimiento necesario para comprender los mecnismos que subyacen en los procesos de desarrollo de las plantas y su interacción.
LA EXPRESIÓN GENÉTICA Esta obra está bajo una licencia Attribution-NonCommercial-ShareAlike 3.0 Unported de Creative Commons. Para ver una copia de esta.
Técnicas para el estudio de expresión de genes
[IGN + UPM] con financiación de la AECI Madrid, junio-julio de 2006 Carmen Muñoz-Cruzado García Universidad Politécnica de Madrid Curso IDEs El Nomenclátor.
Bases moleculares del cáncer
PROSITE: Guía rápida Dirección URL de PROSITE.
Verificación y Validación del Software
IDEA: Identificando el Problema /Oportunidad
Facultad de Ciencias Químicas
LA EXPRESIÓN GENÉTICA Esta obra está bajo una licencia Attribution-NonCommercial-ShareAlike 3.0 Unported de Creative Commons. Para ver una copia de esta.
Transcripción de la presentación:

Pablo Porras Millán, scientific curator pporras@ebi.ac.uk Capturando el interactoma: creación y análisis de bases de datos de interacciones moleculares Pablo Porras Millán, scientific curator pporras@ebi.ac.uk

Lazebnik, Biochemistry (Mosc). 2004, PMID: 15627398 ¿Por qué estudiar el interactoma? Lazebnik, Biochemistry (Mosc). 2004, PMID: 15627398

Really Important Component Undoubtedly Most Important Component Serendipitiously Recovered Component

Un modelo que se ajusta a la realidad El modelo del biólogo Un modelo que se ajusta a la realidad

European Institute of Bioinformatics

Tipos de datos registrados en el EBI Bibliografía Genomas Secuencias de proteínas Secuencias de nucleótidos Proteomas Expresión génica Estructura de proteínas Familias, motivos y dominios proteicos Sustancias químicas Interacciones proteína-proteína Sistemas Rutas biológicas

Un par de definiciones… Interacciones proteína-proteína (IPPs): contactos físicos y selectivos que ocurren entre pares de proteínas en determinadas regiones moleculares y en un contexto biológico definido. Interactoma: Conjunto de interacciones proteína-proteína que tienen lugar en la célula / en un organismo / en un contexto biológico determinado… Red de interacciones proteína-proteína: Representación gráfica de un conjunto de IPPs en la que las proteínas se representan en forma de nodos y las interacciones en forma de aristas.

¿Por qué estudiar interacciones proteína-proteína (IPPs)? Nivel gen Nivel proteína ADN ARN 1 proteína = n funciones n redes 1 proteína = 1 función ¡MAL! Para predecir la función biológica de la proteína “culpable por asociación” Proteínas con funciones similares deberían agruparse Para mejorar la caracterización de complejos proteicos y vías biológicas Las redes de interacción funcionan como un mapa-borrador en el que ensamblar los elementos que forman las vías biológicas

Culpable por asociación Kinasa ciclina-dependiente Regulación de la transcripción Proto-oncogén Factor de transcripción Mediador de la actividad de la ARN-polimerasa Regulación de la transcripción Histona metiltransferasa Papel en desarrollo temprano y hematopoyesis Ciclina Regulación de ciclina-kinasa, regulación transcripción y ciclo celular Modulador transcripcional Regulación de la transcripción dependiente de kinasas Algo que ver con transcripción y control del ciclo celular Modulador transcripcional activado por receptor Modulación de la transcripción, transducción de señales, activado por kinasas Papel en la inhibición de la curación de heridas Posible oncoproteína Implicado en la regulación de la transcripción Posible oncoproteína Activación de la transcripción

Tipos de interacciones proteína-proteína Interacciones binarias – Dos participantes Colocalización – Proximidad de dos o más participantes Ints. n-arias (asociaciones) – Purificación de complejos Ints. funcionales / directas – Ej. Ints. enzimáticas

Interacciones binarias

Colocalización

Interacciones n-arias (asociaciones) Schleiff et al., Nat Rev Mol Cell Biol. 2011. PMID: 211396380

Interacciones funcionales / directas Generalmente ensayos in vitro Los participantes suelen conocerse por adelantado (predeterminados) Ejs.- ensayos enzimáticos, SPR, cristalografía, métodos que usan proteínas purificadas… Imágenes tomadas de Wikipedia: http://en.wikipedia.org/wiki/X-ray_crystallography http://en.wikipedia.org/wiki/Surface_plasmon_resonance http://en.wikipedia.org/wiki/Protein_adsorption_in_the_food_industry

Purificación por afinidad en tándem + espectrometría de masas Métodos de detección de PPIs Doble híbrido (Y2H) Alto rendimiento Purificación por afinidad en tándem + espectrometría de masas (TAP-MS) Ningún método puede reproducir una verdadera interacción binaria observada en condiciones fisiológicas – todas las interacciones detectadas experimentalmente son esencialmente artefactos Difracción de rayos X Bajo rendimiento There are multiple types of experimental methods used to detect protein-protein interactions. Two methods are important due to their use in high-throughput studies: these are the yeast two hybrid complementation assay (Y2H) and tandem-affinity purification followed by mass spectrometry (TAP-MS). Y2H is a fast, inexpensive and scalable method to detect binary interactions. TAP-MS will detect of multi-protein (n-ary) interactions. Other approaches that are less amenable to high-throughput setups are used in small-scale studies and provide more detailed structural and chemical information about the interaction. Credits for structure model: Cullin-complex model from Kleiger et al., Cell 139, 957-968, 2009.

Representando IPPs: dominios de interacción We can specifically describe interacting domains down to the residue level. The domain can be represented as the specific range of the underlying amino acid sequence. Including required PTM These ranges are remapped whenever UniProtKB updates their protein sequences. Solapamiento de rangos en la secuencia:

El problema de los complejos Representando IPPs: El problema de los complejos Algunos metodos experimentales generan datos de tipo complejo: Ej. Purificación por afinidad en tándem (TAP) Cuando se debe convertir esta información en datos binarios, hay 2 algoritmos disponibles: Computational tool to aid searches, Transforms n-ary interaction into binary, Both are somewhat wrong, spoke is said to generated 3 times less false positive (Bader et al.).

Bases de datos de interacciones: tipos De Las Rivas & Fontanillo, PLoS Computational biology, PMID: 20589078.

Bases de datos primarias: niveles de curación Curación superficial BioGRID – curación activa, número limitado de organismos modelo HPRD – curación activa, centrada en humanos, predicción de interacciones MPIDB – curación activa, interacciones en microbios InnateDB – curación activa – interacciones relacionadas con inmunidad innata Curación a fondo IntAct – curación activa, amplia cobertura de especies, todo tipo de moléculas MINT – curación activa, amplia cobertura de especies, sólo IPPs DIP – curación activa, amplia cobertura de especies, sólo IPPs MPACT – actualmente sin curación, cobertura de especies limitada, sólo IPPs MatrixDB – curación activa, sólo moléculas de la matriz extracelular BIND – detuvo la curacción en 2006/7, amplia cobertura de especias, todo tipo de moléculas – la información está quedando desfasada I2D – curación activa – IPPs implicadas en cáncer CURACIÓN A FONDO CURACIÓN SUPERFICIAL

Bases de datos primarias: cobertura De Las Rivas & Fontanillo, PLoS Computational biology, PMID: 20589078. Cobertura de IPPs humanas en las principales bases de datos públicas

Un estándar para la representación de interacciones: el consorcio iMEX www.imexconsortium.org Orchard et al., Nature Methods, PMID: 22453911.

Cliente de consulta unificada: PSICQUIC www.ebi.ac.uk/Tools/webservices/psicquic/view/main.xhtml Interacciones PSI-MI Salida Consulta MIQL Entrada PSICQUIC PSICQUIC Registro Servicio A Servicio B Servicio C

IntAct: Esquema de almacenamiento de datos Entrada Publicación Experimento 1 Interacción 1 Participante 1 Características Participante 2 Interacción 2 Experimento 2 Interacción 3 Interacción 4 [A] Nivel publicación (entrada) [B] Nivel experimento [C] Nivel interacción … … … READY TO GO This is a schema of how interaction data is stored in IntAct. Each entry in the database corresponds to a publication [A], that is, a scientific article that is curated by the IntAct team. The information in the paper is analyzed and those experiments that contain molecular interactions are represented in the database (experiment level, [B]). Each experiment corresponds to one or more interactions identified in the same organism using the same techniques. The interactions in each experiment are then listed in the interaction level [C], adding information such as kinetic binding parameters, if they were given by the authors. Each participant is identified using cross-references to existing resources such as UniProt or CheBI, if possible, and represented in the participant level [D]. Finally, features of each participant such as binding sites, tags, mutations affecting the interaction or post-translational modifications can be depicted in detail in the feature level [E]. [D] Nivel participante [E] Nivel característica

IntAct: Uso de la ontología PSI-MI

IntAct: El trabajo del “curator” (curador) PROPUESTAS DIRECTAS PAQUETES DE DATOS DE PROYECTOS DE DETECCIÓN DE INTERACCIONES A GRAN ESCALA DATOS DE INTERACCIONES MOLECULARES PUBLICADOS CURACIÓN

PAQUETES DE DATOS DE PROYECTOS DE DETECCIÓN DE INTERACCIONES A GRAN ESCALA DATOS DE INTERACCIONES MOLECULARES PUBLICADOS CURACIÓN PROPUESTAS DIRECTAS FUNCIÓN Gene Ontology UniProtKB SECUENCIAS PROTEÍNA MOLÉCULAS PEQUEÑAS ChEBI REFERENCIAS CRUZADAS SECUENCIAS GENOMA Ensembl FAMILIAS Y DOMINIOS InterPro Otros ESTRUCTURA, ORGANISMO, TEJIDO, ETC…

Búsqueda web en IntAct www.ebi.ac.uk/intact copia y pega Searching for interactions in IntAct is very simple: just paste the name or accession of your molecule(s) of interest in the search bar and press "Search". In this example, we use a list of proteins and we give their UniProtKB accessions.

Detalles de la interacción Resultados de la búsqueda This view is based on the standard MITAB columns (minus confidence) Describes a binary interactions (!) a binary interaction collapses multiple experiment evidences into a single line (!) the order of interactor A and B is non deterministic (!) whenever the data originates from an n-ary interaction, it is expanded using the spoke model The next version is going to show an other XX columns including the method of expansion, so one can filter out Next slide shows all MITAB columns Enlace a UniProtKB o a Dasty Detalles de la interacción

IntAct: Representando interacciones

IntAct: el visualizador Dasty READY TO GO! Dasty is an EBI web client that integrates protein annotated information coming from services such as IntAct, PDB, UniProt, InterPro or PRIDE. In the Dasty visualization multiple annotations referred to a given protein are summarized, allowing us to access information regarding the sequence features, protein structure or any other annotations that might have been added through the services linked by Dasty.

IntAct: Búsquedas con MIQL Podemos hacer consultas complejas usando el Molecular Interaction Query Language (MIQL). Lista de campos usados para hacer consultas:

IntAct: Visualizando interacciones con networkView

Más información sobre IntAct: cursos “on-line” en el EBI www.ebi.ac.uk/training/online/course/intact-molecular-interactions-ebi

Desafíos en representación e integración de datos en las redes de IPPs Blisson et al., 2011, Nature Biotechnology, PMID: 21706016.

Mas información sobre el análisis del interactoma Nuestro grupo ha escrito un tutorial dentro de un programa de la Human Protein Organization (HUPO) tratando la importancia del análisis de las redes de interacciones moleculares y que presenta un ejemplo de análisis guiado para el lector: Koh, Porras, Aranda, Hermjakob, & Orchard, 2012, Journal of Proteome Research, PMID: 22385417. Una buena revisión general acerca de conceptos básicos en el estudio del interactoma: De Las Rivas & Fontanillo, 2010, PLoS Computational Biology, PMID: 20589078. Otra revisión general, centrada en el estudio del interactoma en relación a enfermedades humanas: Vidal, Cusick, & Barabási, 2011, Cell, PMID: 21414488. Una revisión reciente sobre biología de redes diferencial, el estudio de las diferencias entre situaciones biológicas distintas en contraste con el interactoma estático: Ideker & Krogan, 2012, Molecular Systems Biology, PMID: 22252388. Asignar puntuaciones en función de la confianza a interacciones moleculares requiere usar estrategias paralelas y complementarias. En este artículo de evalúa la fiabilidad de distintos métodos de detección experimental con respecto a un set de interacciones de referencia: Braun et al., 2008, Nature Methods, PMID: 19060903. Para terminar, un buen ejemplo de análisis usando datos que proceden de bases de datos primarias. Los autores construyen una red de alta calidad usando datos de interacciones binarias en las que hay información acerca de las superficies de interacción a resolución atómica, integran información relativa a mutaciones causantes de enfermedad y encuentran que existe una correlación entre la posición de dichas mutaciones en las superficies de interacción y su predisposición a causar enfermedad: X. Wang et al., 2012, Nature Biotechnology, PMID: 22252508.

Equipo de desarrolladores Agradecimientos Henning Hermjakob Jefe de grupo Sandra Orchard Margaret Duesbury Jyoti Khadake Equipo de curación Coordinadora Rafael Jiménez Marine Dumousseau  Noemí del Toro John Gómez Equipo de desarrolladores