Encontrando sentido a las secuencias de ADN

Slides:



Advertisements
Presentaciones similares
Traducción de proteínas Mutaciones de Punto
Advertisements

TRANSCRIPCIÓN EN EUCARIOTAS
Detección de elementos funcionales en el genoma
TRANSCRIPCIÓN Y TRADUCCIÓN
GEN FRAGMENTO DE ADN LOCALIZADO EN UN LUGAR ESPECIFICO DEL CROMOSOMA SU INFORMACION CODIFICA LA SINTESIS DE UNA PROTEINA ESPECIFICA ??? CONCEPTO ANTIGUO.
CURSO de Actualizaciones en Genética Molecular y sus aplicaciones
OPERON LAC.
OPERON LAC.
Dra. Judith García de Rodas, Salón
9.1.- ¿QUÉ SON LOS GENES? Lo que determina un rasgo particular.
UN GEN, UN ENZIMA Garrod, en 1902 descubre la enfermedad hereditaria fenilcetonuria. Beadle y Tatum en (Nobel en 1958) comprueban en Neurospora.
Taboada, Fernando Gómez Germán
Colegio Hispano Americano
SEMINARIO 8 BIOLOGÍA CELULAR TRANSCRIPCIÓN Y PROCESAMIENTO DEL ARN
CODIGO GENETICO SINTESIS PROTEICA.
TRANSCRIPCIÓN EN EUCARIOTAS
9.1.- UN GEN, UN ENZIMA Garrod, en 1902 descubre la enfermedad hereditaria fenilcetonuria (Acumula Phe) Falta el enzima Phehidroxilasa No se produce Tyr.
Replicación, Transcripción y Traducción en Procariota
expresión diferencial del genoma
El código genético y el mecanismo de expresión
Metabolismo de Ácidos Nucleicos
Estructura y regulación génica
Transcripción Expresión génica. Transcripción ADN versus ARN.
EXPRESIÓN DEL MENSAJE GENÉTICO
Posibles puntos de regulación de la expresión génica
4.- Transcripción Alonso Gracia Montes.
- GEN - TRANSCRIPCION - TRADUCCION
Síntesis de proteínas.
LA SINTESIS DE PROTEINAS A PARTIR DEL ADN
Genética teoría Tema 6 Regulación Genética La transcripción
Código genético y el mecanismo de expresión
ENMyH Biología Molecular RNA
TRANSCRIPCIÓN Y TRADUCCIÓN DE LA INFORMACIÓN
Detección de Secuencias Reguladoras en el Genoma
TRANSCRIPCIÓN Y PROCESAMIENTO DEL ARN
Expresión génica.
12. Control de la expresión génica en eucariontes
ESTRUCTURA Y REGULACIÓN GÉNICA
Modificaciones del "Dogma Central de la Biología Molecular" Temin Modificaciones del "Dogma Central de la Biología Molecular"
Jonathan Rivero Guzmán Biología Profundización PRE-USM
ESTRUCTURA Y SINTESIS DE RNA. La informaciòn genetica se encuentra en el DNA, pero el RNA hace las copias funcionales del DNA. La cadena de DNA sirve.
Transcripción / Traducción
Expresión del material genético
EXPRESION GENICA EN PLANTAS
Convirtiendo lecturas de secuencia en un mapa de secuencia
Traducción de proteínas
Expresión de genes en E.coli
EL ADN, EL PORTADOR DEL MENSAJE GENÉTICO
Tema 8. Transcripción.
BIOLOGÍA MOLECULAR Función de las Secuencias reguladoras que participan en la Transcripción: Tema Edith Hermosillo Royval Nº
El codigo genetico.
Otras aplicaciones de HMM Búsqueda de familias (dominios)Búsqueda de familias (dominios) Alineamientos no globales (búsqueda de secuencias flanqueantes.
Vectores Plásmidos o Vectores Son moléculas pequeñas de ADN doble cadena y circular. Vectores de clonado, son pequeñas moléculas de ADN, con capacidad.
Síntesis de proteínas en eucariontes.
DEL ADN A LAS PROTEÍNAS Material genético en procariotas y eucariotas
ADN, estructura, replicación y organización genómica.
MECANISMOS DE REPLICACIÓN, TRANSCRIPCIÓN Y TRADUCCIÓN EN EUCARIOTAS
TEMA 4.7 mRNAs EUCARIÓTICOS.
MECANISMOS DE REPLICACIÓN, TRANSCRIPCIÓN Y TRADUCCIÓN EN EUCARIOTAS
Metabolismo de Ácidos Nucleicos
Del ADN a la proteína: expresión génica
TRANSCRIPCIÓN.
Estructura de Genes, Transcripción y Procesamiento del ARNhn
 Material genético en procariotas y eucariotas  Dogma Central de la Biología Molecular  Transcripción  Código genético  Traducción  Regulación de.
Bases Genética Molecular ucr. ac
El Dogma Central de la Biología Molecular describe un proceso de dos pasos, la transcripción y la traducción, por el cual la información contenida en los.
Metabolismo de Ácidos Nucleicos MSc. Bioq. María Bárbara De Biasio Facultad de Ciencias Veterinarias.
Tema 7 Expresión génica: transcripción.
El código genético es universal y degenerado
4.3 Estructura de los genes procariotas.
Transcripción de la presentación:

Encontrando sentido a las secuencias de ADN ¿Como podemos saber donde están localizados los genes conociendo únicamente la información de la secuencia?

Diferencias entre genes procariotas y eucariotas Organismo Tamaño del Genoma # de genes Unidad génica. (Tamaño promedio de un gen) Procariota:   Mycoplasma genitalium 0.58 473 1235 bp Haemophilus influenzae 1.8 1,709 1042 bp Eucariota: Saccharomyces cerevisiae 1.3 6,241 2,100 bp Neurospora crassa 42.9 10,000 - 13,000 3,000 - 4,000 bp Drosophila melanogaster 165 13,601 10,000 bp Caenorhabditis elegans 100 18,424 Homo sapiens 2,910 30,000 - 40,000

Estructura de los genes bacterianos I. Transcripto de 1 solo gen Promotor Sitio de inicio de la transcripción Terminador transcripcional ATG TAA Secuencia codificante hisG Transcripto (RNAm) Sitio de unión a ribosoma (RBS) Sitio inicio de la traduccion (ATG) Fin de la traducción La orientación del promotor determina el sentido de la transcripción (y por lo tanto cuál de las 2 hebras se transcribe)

Estructura de los genes bacterianos II. Operón Policistrónico Uno por operón Terminador transcripcional Promotor Sitio de inicio de la transcripción ATG TAA ATG TAA Secuencia codificante Secuencia codificante hisG hisH Transcripto (RNAm) Sitio de unión a ribosoma (RBS) Sitio inicio de la traduccion (ATG) + Fin de la traducción Uno por gen

Estructura de los genes eucariotas Exon 5’ no codificante Exon 5’ no codificante ATG STOP enhancer promotor DNA Inicio transcripción intrones Exones internos Transcripción, capping en 5’ y polyadenilación Pre-mRNA Splicing (remoción de los intrones) mRNA Traducción PROTEÍNA MAR = Matrix attachement regions BE = Boundary elements (evita que el enhancer actúe en otro gen) Señal Poly-A

características de los genes eucariotas: Muestran una distribución muy amplia de tamaños No hay grandes diferencias en el tamaño de los exones entre diferentes organismos En general los intrones son mas largos que los exones La distribución de los tamaños de los intrones varía desde el mismo largo que los exones (>200 pb) hasta 50-60 Kb en casos extremos No hay una correlación entre el tamaño del gen y el tamaño de los RNAms No hay buena una correlación entre tamaño del gen y el número de exones Las secuencias de los exones son conservadas pero los intrones varían

¿Cómo identificar genes? Localizar los marcos abiertos de lectura ORFs, Open Reading Frames Los ORFs comienzan con un codón Start (AUG = Met, casi siempre) Finaliza con uno de los tres codones stops (UAA, UAG, UGA). La interpretación del resultado es más sencilla en procariotas que en eucariotas La búsqueda por homología de los posibles ORF sólo predice un 50% de los genes

¿Cómo identificar genes? ¿Cómo detectar ORFs? ORF Finding Se analizan todos los marcos de lectura abiertos: total 6 (inicio en cada base de un codón y en los dos sentidos). Busca codones de iniciación (Met=AUG o codones alternativos GUG, CUG o UUG ) y terminación dentro de la secuencia (UAA, UAG, UGA). El programa permite: - Definir límite: secuencias de menos de 100 bases antes de un stop codon (33 amino acids) se excluyen. Promedio > 100 aa Seleccionar el codon de inicio -Seleccionar el “codon usage”

http://www.ncbi.nlm.nih.gov/gorf/gorf.html

Codigo genetico y uso de codones código genético no esta totalmente conservado http://www.kazusa.or.jp/codon/

Codigo genetico y uso de codones

Otros sitios que permiten determinar los ORFs ExPASy (Expert Protein Analysis System) Online Analysis Tools University of Guelph,  CANADA EMBOSS Transeq from EBI. DNA to Protein Translation http://www.expasy.ch/tools/dna.html http://molbiol-tools.ca/Translation.htm http://www.ebi.ac.uk/Tools/emboss/transeq/index.html http://bio.lundberg.gu.se/edu/translat.html

Reconocimiento de motivos Identificar sitios dentro de un gen es una actividad que entra dentro de lo conocido como “data mining” Reconocimiento de sitios de splicing sitios canónicos de splicing (par GT-AG) consenso en el sitio donante AG|GTRAGT (R=A o G) consenso en el sitio aceptor sitios de splicing no canónicos (GC-G, etc) Reconocimiento de promotores Predicción de sitios poly-A Predicción de sitios de terminacion de la transcricion

Reconocimiento de motivos Splicing (en genes eucariotas) Los sitios de unión son muy conservados. GT-AG = 99.24% GC-AG = 0.7% AT-AC = 0.05% La secuencia altamente conservada (99%) se encuentra inmediatamente dentro del intrón en los sitios de unión La secuencia de un intrón genérico se define como GT………….AG

Reconocimiento de motivos Reconocer un sitio de splicing 5’ Asumimos que : La secuencia de ADN comienza en un exón, contiene solo un sitio de splicing 5´ y termina en un intrón. Las secuencias de los exones, intrones y sitios de splicing deben tener diferentes propiedades estadísticas Exones: tienen una composición uniforme de bases , ATCG (25%) Intrones: ricos en A/T (40% de A, 40% de T), 10% de C y 10%G. Sitio de Splicing (SS) : es casi siempre una G (95%) y A (5%)

GENSCAN Métodos estadísticos y modelos probabilísticos para predicción de motivos en las secuencias. (modelos de Markov o HMM) Alineamientos basados en patrones conservados encontrados en el mismo orden en distintas secuencias. Predice estructuras genéticas completas, incluyendo exones intrones, promotores y señales de polyadenilación en secuencias genómicas. Permite búsquedas sobre genes incompletos y sobre cadenas simples o dobles.

http://genes.mit.edu/GENSCAN.html http://spliceport.cs.umd.edu/

Identificación de señales Promotores Características de los promotores de E. coli +1 -35 hexamero -10 hexamero espaciador intervalo TTGACA 15 a 19 bases TATAAT 5 a 9 bases RBS – Ribosome Binding Site (Shine-Dalgarno) conservadas aprox -15 upstream AUG. (en B. subtilis la RBS es AGGAGG)

Identificación de señales Terminadores de la transcripción Características de los terminadores rho-independentes Stem loop energia libre debajo de -7 kcal/mol Tallo de 5-10 pb con un mínimo de 60% GC At least 4 U residues Loop de 3-8 bases 5’ UUUU 3’ Secuencia en el ADNque marca la terminación de la transcripción para la RNA polimerasa, NO CONFUNDIR con los codones terminadores de la traducción

Identificación de señales Señales de Transcripcion : TATA box (~-30 TSS), CAAT box (~-75 TSS), GC box (~-90 TSS), Señal cap, Sitio de poli-adenilación. Enhancers En Eucariotas TSS= translation start site: señal de Kozak (upstream ATG), GCC[A/G]CCaugG[not U] == óptimo [A/G]NNaugG[not U] == fuerte ; con ‘A’ a -3 mas fuerte que con ‘G’ Cualquier otra combinacion = débil Señales de Splicing Señales de traduccion

http://molbiol-tools.ca/Promoters.htm

http://www. softberry. com/berry. phtml http://www.softberry.com/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindb

http://www-bimas.cit.nih.gov/molbio/proscan/

http://www.cbrc.jp/research/db/TFSEARCH.html Enhancer

Búsqueda de motivos de unión a DNA http://meme.sdsc.edu/meme/ A generic approach to identify Transcription Factor-specific operator motifs; Inferences for LacI-family mediated regulation in Lactobacillus plantarum WCFS1. Francke C, Kerkhoven R, Wels M, Siezen RJ. BMC Genomics. 2008 Mar 27;9:145.

http://www.ualberta.ca/~stothard/javascript/index.html

Genes RNA Funcionales genes RNA transcriptos pero no tranducidos – no hay preferencia de codones. Cómo se predicen genes de rRNA, tRNA y small RNA? Buscar región Promotora (no es tan especifico) Estructura secundaria RNA es importante. Puede ser predicta usando RNA structure Prediction tools (MFOLD tool). http://mfold.bioinfo.rpi.edu/cgi-bin/rna-form1.cgi

Identificar Small RNAs Funciones regulatorias Basados en 10 sRNA conocidos en E. coli se predicen 24 sRNAs, 14 de los cuales han sido verificados experimentalmente. 3 estudios posteriores identifican ~ 20 mas sRNA genes en E. coli.

Esquema predictivo Localizar regiones “vacias” genoma E. coli “Empty” regions ORF A Localizar regiones “vacias” genoma E. coli ORF C ORF B buscar promoteres reconocidos s70 RNA polimerasa -35 -10 Promoter +1 Identificar rho-independent terminators TTTT Rescatar secuencias donde la distancia entre promotor y terminador sea 50 a 400 bases. -35 -10 Promoter +1 Terminator 50-400 bases Buscar consenso en otras bacterias

Argaman et. Al – Current Biology 2001.