Anotación Automática Dante Travisany
Temas Pipeline Tools Bases de Datos Conceptos Ejemplos Ensembl
Identificación del Problema Virus : 15 – 20 Bacteria Eucariontes: sobre los 10000
Pipeline Unix Símbolo: | Segmentación
Tools BLAST InterProScan AmiGO Pathway Tools Infernal Glimmer Critica GeneMark GeneWise BedTools Samtools GenomicTools KEGG-API
Base de Datos BLAST DB Protein -KEGG -PRIAM -SWISSPROT -UNIPROT -NR BLAST DB Nucleotide - NT - REFSEQ - RDP InterProScan - Databases -Pfam -SSF -Gene3D -TIGRfam
Nuevo Problema Gran cantidad de bases de datos. Errores en Anotación, doble anotación. Necesidad de Crear un vocabulario Controlado Gene Ontology, UniPROT, SwissPROT, InterProScan. Capacidad de realizar referencias cruzadas en las bases de datos.
Algunos Conceptos Importantes Gene Name Vocabulario Controlado IFAA
GeneName: Para cada Organismo existen gene names particulares, según la base de datos de Referencia. HUGO:
Gene Ontology Consortium Gene Ontology: Proyecto colaborativo entre variadas instituciones. Vocabulario: Estructurado Preciso Común Controlado Permite describir los roles de los genes y los productos génicos en cualquier organismo.
División Gene Ontology Proceso Biológico Función Molecular Componente Celular
COG - KOG
Idea Filtrar por bases de datos Generar una rutina automática capaz de iterar el proceso, para cada set de genes.
Tools & Databases
Resumen Hasta ahora, se han visto: NGS sequencing. Assembly. Gene Prediction. Annotation (Databases). Automatic Annotation
Caso Transcriptómica
Nannochloropsis salina transcriptomics
23 GenDB – Automatic Annotation System for Prokaryotic genomes Development for the University of Bielefeld since Modular system developed using an OOP and a relational database (O2DBI). Provide an Application program Interface (API).
24 GenDB Folker Meyer et all. GenDB an open source genome annotation system for prokaryote genomes. Nucleic Acids Research,2003
25 GenDB Pipeline 25
26 GenDB
Ensembl Inicio:1999 Objetivo: generar herramientas de anotación automática. Ensembl Pipeline. Website:
Galaxy Workflows, para NGS sequence, web based.