Predicción de genes.

Slides:



Advertisements
Presentaciones similares
La síntesis de proteínas
Advertisements

CURSO de Actualizaciones en Genética Molecular y sus aplicaciones
El dogma central de Crick o dogma central de la Biología
TRANSCRIPCIÓN EN EUCARIOTAS
TRANSCRIPCIÓN Y TRADUCCIÓN
INTRODUCCIÓN A LA BIOINFORMÁTICA
INFORMACIÓN GENÉTICA Y PROTEÍNAS
CURSO de Actualizaciones en Genética Molecular y sus aplicaciones
El flujo de la información genética
“Introducción a regulación génica ”
TRANSCRIPCIÓN EN EUCARIOTAS
Replicación 2ºBachillerato.
Colegio Hispano Americano
CODIGO GENETICO SINTESIS PROTEICA.
TRANSCRIPCIÓN EN EUCARIOTAS
Replicación, Transcripción y Traducción en Procariota
FUNCION DE LOS ACIDOS NUCLEICOS
Bases de datos en Bioinformática
El código genético y el mecanismo de expresión
GENÉTICA MOLECULAR Chema Ariza | Biología | C.C Virgen Inmaculada- Santa María de la Victoria.
Transcripción Expresión génica. Transcripción ADN versus ARN.
EXPRESIÓN DEL MENSAJE GENÉTICO
Posibles puntos de regulación de la expresión génica
4.- Transcripción Alonso Gracia Montes.
Síntesis de proteínas.
LA SINTESIS DE PROTEINAS A PARTIR DEL ADN
Esquema de la Replicación del DNA
Síntesis de proteínas Capacitación – Zona de Río Piedras 3 de noviembre de 2007.
Código genético y el mecanismo de expresión
DOGMA CENTRAL DE LA BIOLOGIA MOLECULAR
ENMyH Biología Molecular RNA
Expresión de la información genética
REPLICACION La capacidad de las células de mantener un elevado grado de orden dentro de un universo caótico, depende de la información genética que se.
Física y Química Biológica Licenciatura en Enfermería
TRANSCRIPCIÓN Y TRADUCCIÓN DE LA INFORMACIÓN
Expresión génica.
LA EXPRESIÓN GENÉTICA Esta obra está bajo una licencia Attribution-NonCommercial-ShareAlike 3.0 Unported de Creative Commons. Para ver una copia de esta.
ACIDOS NUCLEICOS. ACIDOS NUCLEICOS Ácidos nucléicos.
Modificaciones del "Dogma Central de la Biología Molecular" Temin Modificaciones del "Dogma Central de la Biología Molecular"
Jonathan Rivero Guzmán Biología Profundización PRE-USM
ESTRUCTURA Y SINTESIS DE RNA. La informaciòn genetica se encuentra en el DNA, pero el RNA hace las copias funcionales del DNA. La cadena de DNA sirve.
EXPRESIÓN GENÉTICA CURSO: BIOLOGIA Blgo. César Abel Sebastián Gonzáles
2.1.1 Expresión de genes mutantes y silvestres

Antes de la mitosis (el proceso por el cual no reproductoras o dividir las células somáticas) y la meiosis (proceso mediante el cual los precursores de.
Transcripción / Traducción
ADN E INGENIERÍA GENÉTICA. LÍPIDOS PROTEÍNAS.
Expresión del material genético
ÁCIDOS NUCLEICOS.
Convirtiendo lecturas de secuencia en un mapa de secuencia
Traducción de proteínas
EL ADN, EL PORTADOR DEL MENSAJE GENÉTICO
ADN, estructura, replicación y organización genómica.
El codigo genetico.
1. Inicio de la transcripción
DEL ADN A LAS PROTEÍNAS Material genético en procariotas y eucariotas
GENETICA MOLECULAR.
ADN, estructura, replicación y organización genómica.
CÓDIGO GENÉTICO Transcripción, Traducción y Síntesis Proteica
MECANISMOS DE REPLICACIÓN, TRANSCRIPCIÓN Y TRADUCCIÓN EN EUCARIOTAS
TEMA 4.7 mRNAs EUCARIÓTICOS.
MECANISMOS DE REPLICACIÓN, TRANSCRIPCIÓN Y TRADUCCIÓN EN EUCARIOTAS
Del ADN a la proteína: expresión génica
TRANSCRIPCIÓN.
Replicación del DNA Transcripción del DNA Traducción del mRNA
DEL ADN AL ARN MENSAJERO
 Material genético en procariotas y eucariotas  Dogma Central de la Biología Molecular  Transcripción  Código genético  Traducción  Regulación de.
¿Cómo se expresa el ADN?.
Biología 2º Bachillerato - Salesianos Atocha Luis Heras
Transcripción.
Transcripción de la presentación:

Predicción de genes

Contenido de la presentación ¿Es realmente necesario ? Introducción biológica Predicción “in silico” , principales problemas ¿De qué información disponemos? Medidas de fiabilidad Fiabilidad actual: GASP1 Introducción a la Bioinformática

¿Es realmente necesario ? Anotación del genoma humano.

Introducción a la Bioinformática Numero de genes en el chromosoma 22 initial annotation 545 Dunham et al., 1999 genscan+RT-PCR 590 Das et al., 2001 genscan+microarrays 730 Shoemaker et al., 2001 reviewed annotation 726 chr22 team, sanger, 2001 mouse shotgun data +20 (our data) geneid predictions 794 genscan predictions 1128 Introducción a la Bioinformática

Introducción a la Bioinformática Numero de genes del genoma humano Consortium 30.000-40.000 2001 Celera 27.000-38.000 2001 Consortium+Celera 50.000 Hogenesch et al. 2001 DBsearches 65.000-75.000 Wrigth et al., 2001 HumanGenomeSciences 90.000-120.000 Haseltine, 2001 Introducción a la Bioinformática

2. Introducción biológica Del DNA a las proteínas

Dogma central de la biología Transcripción. Las regiones promotoras contienen señales que son reconocidas por los factores de transcripción. Interacciones entre estos, activan la copia de una de las dos cadenas de DNA a RNA por una RNA polimerasa. Splicing. Los intrones, regiones no codificantes, son eliminados del tránscrito primario, produciendo una molécula mas corta de RNA, conocido como RNA mensajero (mRNA). Traducción. El ribosoma se une al codón inicial del mRNA, y recorre la secuencia sintetizando la cadena de aminoácidos especificada por codones consecutivos hasta que encuentra un codón de finalización. Introducción a la Bioinformática

Introducción a la Bioinformática

Predicción de genes “in silico” Deducir la secuencia de aminoácidos codificada en una cadena de DNA genómico, generando modelos computacionales para reproducir el mecanismo biológico que ocurre en la célula. Introducción a la Bioinformática

Predicción en genomas procariotas La predicción de genes en los genomas procariotas es mas simple debido principalmente a : Ausencia de intrones en los genes. Alta densidad de genes. Estas propiedades implican que la mayoría de pautas de lectura abiertas(ORFs), mas largas de un razonable “cutoff”, corresponden a genes. Introducción a la Bioinformática

Predicción en genomas eucariotas Los genes están separados por largas regiones intergénicas. Las regiones codificantes están divididas en un número “usualmente grande” de “pequeños” fragmentos codificantes conocidos como exones, separados por “largas” regiones no codificantes conocidas como intrones. Las señales que existen no están 100% conservadas y en muchos casos no tenemos suficiente conocimiento del proceso biológico. En algunos genomas eucariotas existe una gran densidad de elementos repetitivos, que pueden contener regiones codificantes. Introducción a la Bioinformática

Diferencias entre genes de organismos procariotas y eucariotas. Introducción a la Bioinformática

Introducción a la Bioinformática ATATATATATGGCGGCATTATATTGTTGGTAACTAAAATCACTCAGCTCTTACATGGTAAACCAGGATCCAAACTAGGGTCTGTGAAGTTCTAAATCTCATGTTTTCAACACTGTTCAAACAAAGATTTTCAGCTTCTGAGAAGAACAGAGGTGGACGAATGCAGGTACTTGATAGAATTTGAATCTGAATTACAGTGCTACTGATAGGTCTGTTAATCACGCACGTGCACATGCCACGCAAAAGTCAAACGCAGGGACCTAAACACGCCTGTGGTGTGTTCTCAGCTGAGCTCCAAGGCCCTGATGAGTTGTAAATGTTTACAGACTCCTCAGCTGGGTGGTCCTGGAGGCAGCTTATCACATGCCCTGAGGCCCGAGTGGGTTAGGGGAGAGAGCACAAAACGTGACAGCTTTGCCCTCACAGTCTCAGCTACCCTGGGAAAGAGTTTGGCAGGGGAATCATCATGCAGGCTCCATTTTTATACCACTGCACTGAAGTATAAGTACATTTTTTGTCACACTCTGCTAACTGCCTGCTCATAGATATTCAAATTTAGTAGATGTAGACAGACTCCTAACTTCTCATGGTTTAAAATGTTTAAACAACTATATTTATTTTGTACTTGCCTAATCTTTTCTAGTCCCCCTGGATTGGTATATGTTTCACCTGCTTAAATGAGACTGTTCTCTGGCTTAAGATTTATTTAGGTAGTGAGGGCTACTTTTGGTTGAAAGCTAGAACAGGTTTTGCACTTTAATGAACCTAAAGCAGATCTATGCTGTTTACATTCAGGTAAGGGGACTTCTCCTTTATTATTTATTTTAGATAGAATATTTGCCAACTGAAGATGTGTGGCCCCTTCCCACCCCAAAGAAGACAGTACCCATGGTTGAATTCCCAGATGGAAATGATTTATGACTAGGGATCCCATAGCCTTGGTTCCCCTTGTCTGCTGCTTATGAAGCAAGATAAACATGCTGCCTCCTCCTGGTGCAGCTCTTGAAATGTTTTGACTTCCTGTCACTGGAGAGGTGTTGACATGCTCAGGGGAATGTTGGTGGAACTCACTCTGCATTCCAATGTGTCATGAATTTAAGGATTATGGTTAGACCACGTCGAAGTCATCACACAGTAGTTACAGCTAATGTCTAGTACTGGTTGGCCCTGGAAACAAAGAAGAGCTTGGAAAAAAAGCAGTTTACAATGCAGAAGGTAGACGGAGCTGTGCTTATTGGATTGGTGGGAAATCAAATGCAGGAAACATGGTGTATTACTTGTTTATTTGGTGTAATGAAGACTACAGTGTCAGCCTCTACAACTACAGTGTGATCTGCTTCAGGGCAGGGTGTGTCTTCATCACTTTCACCTGGCCCTGGGGAGGCACTCAATAAATATTTGGAGGTGAATGAATTAATTAGAGTGGGAGATCTACCACGCTTGTGTCTGGTTCCTTACAGGGTAAAGACCCTGAGTTAAAGGCCAATGAAGTGACTAAATAAAGAAGATGGTAATCCAGCAAGCAGATTCTAATGCAGCCTTTTACAATAAATAACACCCCCATGCAGCTTTTATATAGAGATATAGACAGCTATAGATGAAT Introducción a la Bioinformática

3. ¿De qué información disponemos ? Modelizando la información biológica

Información utilizada para encontrar genes: Búsqueda de señales. La maquinaria celular reconoce secuencias mas o menos conservadas en el DNA genómico. Estadísticos codificantes. Las regiones codificantes tienen propiedades estadísticamente diferentes a las regiones no codificantes. Uso de homología. La similaridad con secuencias conocidas es un indicativo de que esa región pueda contener un gen homólogo. Introducción a la Bioinformática

(I) Búsqueda de señales Tipos de señales: Les señales conocidas son alineadas y se generan patrones con las regiones conservadas. Introducción a la Bioinformática

Generando un modelo para donors sites Introducción a la Bioinformática

(II) Estadísticos codificantes El DNA codificante tiene una composición de nucleótidos diferente al resto de DNA genómico, debido a que ha de codificar para proteínas (es menos aleatorio). Estadístico codificante: es una función que dada una secuencia de DNA, nos devuelve un número relacionado con la probabilidad de que esa secuencia corresponda a una región codificante. Introducción a la Bioinformática

Ejemplo de estadístico codificante: “codon usage” Introducción a la Bioinformática

Introducción a la Bioinformática (III) Uso de homología Algunos programas de predicción de genes permiten el uso de homologías con secuencias conocidas para mejorar las predicciones. Estas homologías las podemos encontrar en: Proteínas de otras especies. Fragmentos genómicos que sabemos que se transcriben (ESTs o cDNAs) Comparación de genomas completos. Introducción a la Bioinformática

Introducción a la Bioinformática Integrando la información geneid como ejemplo de programa de predicción de genes. Estructura jerárquica : señales - exones - genes Introducción a la Bioinformática

4. Medidas de fiabilidad

Fiabilidad de los programas de predicción de genes. Necesitamos un conjunto de genes conocidos para validar las predicciones. Conceptos básicos para medir la fiabilidad: Sensibilidad: proporción de genes reales que han sido predichos. Especificidad: proporción de predicciones que corresponden con la realidad. Introducción a la Bioinformática

Introducción a la Bioinformática Ejemplo de fiabilidad Introducción a la Bioinformática

5. Fiabilidad actual: GASP1 Introducción a la Bioinformática

GASP1: genome annotation assessment project El objetivo de este proyecto era estudiar la eficiencia de los programas de predicción de genes en una región de 2.9 Mb del genoma de Droshophila Melanogaster. Las predicciones fueron comparadas en base a los resultados de un profundo estudio experimental (2 años recopilando cDNAs) que no fueron revelados hasta el final de la evaluación. Introducción a la Bioinformática

Introducción a la Bioinformática Resultados del GASP1 Introducción a la Bioinformática

Introducción a la Bioinformática Resultados del GASP1 Introducción a la Bioinformática

Introducción a la Bioinformática Conclusiones del GASP1 Las predicciones cubren un 95% del proteoma. La predicción a nivel de nucleótido mejor que a nivel de exón. Muy baja proporción de genes correctamente predichos. Métodos optimizados para una especie funcionan mejor. Ningún programa es perfecto. Introducción a la Bioinformática