La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Encontrando sentido a las secuencias de ADN

Presentaciones similares


Presentación del tema: "Encontrando sentido a las secuencias de ADN"— Transcripción de la presentación:

1 Encontrando sentido a las secuencias de ADN
¿Como podemos saber donde están localizados los genes conociendo únicamente la información de la secuencia?

2 Diferencias entre genes procariotas y eucariotas
Organismo Tamaño del Genoma # de genes Unidad génica. (Tamaño promedio de un gen) Procariota: Mycoplasma genitalium 0.58 473 1235 bp Haemophilus influenzae 1.8 1,709 1042 bp Eucariota: Saccharomyces cerevisiae 1.3 6,241 2,100 bp Neurospora crassa 42.9 10, ,000 3, ,000 bp Drosophila melanogaster 165 13,601 10,000 bp Caenorhabditis elegans 100 18,424 Homo sapiens 2,910 30, ,000

3 Estructura de los genes bacterianos
I. Transcripto de 1 solo gen Promotor Sitio de inicio de la transcripción Terminador transcripcional ATG TAA Secuencia codificante hisG Transcripto (RNAm) Sitio de unión a ribosoma (RBS) Sitio inicio de la traduccion (ATG) Fin de la traducción La orientación del promotor determina el sentido de la transcripción (y por lo tanto cuál de las 2 hebras se transcribe)

4 Estructura de los genes bacterianos
II. Operón Policistrónico Uno por operón Terminador transcripcional Promotor Sitio de inicio de la transcripción ATG TAA ATG TAA Secuencia codificante Secuencia codificante hisG hisH Transcripto (RNAm) Sitio de unión a ribosoma (RBS) Sitio inicio de la traduccion (ATG) + Fin de la traducción Uno por gen

5 Estructura de los genes eucariotas
Exon 5’ no codificante Exon 5’ no codificante ATG STOP enhancer promotor DNA Inicio transcripción intrones Exones internos Transcripción, capping en 5’ y polyadenilación Pre-mRNA Splicing (remoción de los intrones) mRNA Traducción PROTEÍNA MAR = Matrix attachement regions BE = Boundary elements (evita que el enhancer actúe en otro gen) Señal Poly-A

6 características de los genes eucariotas:
Muestran una distribución muy amplia de tamaños No hay grandes diferencias en el tamaño de los exones entre diferentes organismos En general los intrones son mas largos que los exones La distribución de los tamaños de los intrones varía desde el mismo largo que los exones (>200 pb) hasta Kb en casos extremos No hay una correlación entre el tamaño del gen y el tamaño de los RNAms No hay buena una correlación entre tamaño del gen y el número de exones Las secuencias de los exones son conservadas pero los intrones varían

7 ¿Cómo identificar genes?
Localizar los marcos abiertos de lectura ORFs, Open Reading Frames Los ORFs comienzan con un codón Start (AUG = Met, casi siempre) Finaliza con uno de los tres codones stops (UAA, UAG, UGA). La interpretación del resultado es más sencilla en procariotas que en eucariotas La búsqueda por homología de los posibles ORF sólo predice un 50% de los genes

8 ¿Cómo identificar genes?
¿Cómo detectar ORFs? ORF Finding Se analizan todos los marcos de lectura abiertos: total 6 (inicio en cada base de un codón y en los dos sentidos). Busca codones de iniciación (Met=AUG o codones alternativos GUG, CUG o UUG ) y terminación dentro de la secuencia (UAA, UAG, UGA). El programa permite: - Definir límite: secuencias de menos de 100 bases antes de un stop codon (33 amino acids) se excluyen. Promedio > 100 aa Seleccionar el codon de inicio -Seleccionar el “codon usage”

9

10

11 Codigo genetico y uso de codones
código genético no esta totalmente conservado

12 Codigo genetico y uso de codones

13 Otros sitios que permiten determinar los ORFs
ExPASy (Expert Protein Analysis System) Online Analysis Tools University of Guelph,  CANADA EMBOSS Transeq from EBI. DNA to Protein Translation

14 Reconocimiento de motivos
Identificar sitios dentro de un gen es una actividad que entra dentro de lo conocido como “data mining” Reconocimiento de sitios de splicing sitios canónicos de splicing (par GT-AG) consenso en el sitio donante AG|GTRAGT (R=A o G) consenso en el sitio aceptor sitios de splicing no canónicos (GC-G, etc) Reconocimiento de promotores Predicción de sitios poly-A Predicción de sitios de terminacion de la transcricion

15 Reconocimiento de motivos
Splicing (en genes eucariotas) Los sitios de unión son muy conservados. GT-AG = 99.24% GC-AG = 0.7% AT-AC = 0.05% La secuencia altamente conservada (99%) se encuentra inmediatamente dentro del intrón en los sitios de unión La secuencia de un intrón genérico se define como GT………….AG

16 Reconocimiento de motivos
Reconocer un sitio de splicing 5’ Asumimos que : La secuencia de ADN comienza en un exón, contiene solo un sitio de splicing 5´ y termina en un intrón. Las secuencias de los exones, intrones y sitios de splicing deben tener diferentes propiedades estadísticas Exones: tienen una composición uniforme de bases , ATCG (25%) Intrones: ricos en A/T (40% de A, 40% de T), 10% de C y 10%G. Sitio de Splicing (SS) : es casi siempre una G (95%) y A (5%)

17 GENSCAN Métodos estadísticos y modelos probabilísticos para predicción de motivos en las secuencias. (modelos de Markov o HMM) Alineamientos basados en patrones conservados encontrados en el mismo orden en distintas secuencias. Predice estructuras genéticas completas, incluyendo exones intrones, promotores y señales de polyadenilación en secuencias genómicas. Permite búsquedas sobre genes incompletos y sobre cadenas simples o dobles.

18

19

20 Identificación de señales
Promotores Características de los promotores de E. coli +1 -35 hexamero -10 hexamero espaciador intervalo TTGACA 15 a 19 bases TATAAT 5 a 9 bases RBS – Ribosome Binding Site (Shine-Dalgarno) conservadas aprox -15 upstream AUG. (en B. subtilis la RBS es AGGAGG)

21 Identificación de señales
Terminadores de la transcripción Características de los terminadores rho-independentes Stem loop energia libre debajo de -7 kcal/mol Tallo de pb con un mínimo de 60% GC At least 4 U residues Loop de 3-8 bases 5’ UUUU 3’ Secuencia en el ADNque marca la terminación de la transcripción para la RNA polimerasa, NO CONFUNDIR con los codones terminadores de la traducción

22 Identificación de señales
Señales de Transcripcion : TATA box (~-30 TSS), CAAT box (~-75 TSS), GC box (~-90 TSS), Señal cap, Sitio de poli-adenilación. Enhancers En Eucariotas TSS= translation start site: señal de Kozak (upstream ATG), GCC[A/G]CCaugG[not U] == óptimo [A/G]NNaugG[not U] == fuerte ; con ‘A’ a -3 mas fuerte que con ‘G’ Cualquier otra combinacion = débil Señales de Splicing Señales de traduccion

23

24 http://www. softberry. com/berry. phtml

25

26 Enhancer

27 Búsqueda de motivos de unión a DNA
A generic approach to identify Transcription Factor-specific operator motifs; Inferences for LacI-family mediated regulation in Lactobacillus plantarum WCFS1. Francke C, Kerkhoven R, Wels M, Siezen RJ. BMC Genomics Mar 27;9:145.

28

29 Genes RNA Funcionales genes RNA transcriptos pero no tranducidos – no hay preferencia de codones. Cómo se predicen genes de rRNA, tRNA y small RNA? Buscar región Promotora (no es tan especifico) Estructura secundaria RNA es importante. Puede ser predicta usando RNA structure Prediction tools (MFOLD tool).

30

31 Identificar Small RNAs
Funciones regulatorias Basados en 10 sRNA conocidos en E. coli se predicen 24 sRNAs, 14 de los cuales han sido verificados experimentalmente. 3 estudios posteriores identifican ~ 20 mas sRNA genes en E. coli.

32 Esquema predictivo Localizar regiones “vacias” genoma E. coli
“Empty” regions ORF A Localizar regiones “vacias” genoma E. coli ORF C ORF B buscar promoteres reconocidos s70 RNA polimerasa -35 -10 Promoter +1 Identificar rho-independent terminators TTTT Rescatar secuencias donde la distancia entre promotor y terminador sea 50 a 400 bases. -35 -10 Promoter +1 Terminator bases Buscar consenso en otras bacterias

33 Argaman et. Al – Current Biology 2001.

34


Descargar ppt "Encontrando sentido a las secuencias de ADN"

Presentaciones similares


Anuncios Google