BLOQUE I: SECUENCIACIÓN GENÓMICA TEMA 1. Secuenciación de genomas completos
El origen de los Proyectos Genoma 1986: DOE propone secuenciar genoma humano para evaluación sistemática efecto radiaciones 1987: se une NIH 1988: nace HUGO para coordinar los esfuerzos 1990: inicio PGH, planificado a 15 años Elaboración de mapas genéticos y físicos de alta resolución Secuenciación del genoma humano completo
1. CARTOGRAFÍA GENÓMICA 1.1. CARTOGRAFÍA GENÉTICA DE LIGAMIENTO Cálculo de la frecuencia a la que se co-heredan formas alternativas (alelos) de dos loci genéticos que están ligados formando parte de un mismo cromosoma Análisis de STRs por PCR PGH 1994: resolución 0,7-1 cM
1.2. CARTOGRAFÍA FÍSICA E INTEGRACIÓN DE MAPAS Cartografía genómica 1.2. CARTOGRAFÍA FÍSICA E INTEGRACIÓN DE MAPAS Contig: conjunto de fragmentos de un genoma que se han clonado por separado, pero que son contiguos y que están parcialmente solapados Mapeo por restricción
Cartografía genómica STS (sequenced tagged sites): marcadores universales PGH 1997: resolución 100 Kb (~ 0,1 cM)
2. SECUENCIACIÓN Y ENSAMBLAJE 2.1. TÉCNICAS DE SECUENCIACIÓN 2.1.1. MÉTODO DE LOS ddNTPs FLUORESCENTES
Secuenciación 2.1.2. PIROSECUENCIACIÓN
Unión de cada fragmento Secuenciación Secuenciación masiva en paralelo Unión de cada fragmento a una bolita Adición de componentes de PCR en gota de aceite Se cargan en reactores (picolitros) Pirosecuenciación y Detección por cámara CCD
Secuenciación 2.1.3. OTRAS PLATAFORMAS DE SECUENCIACIÓN SOLID
Secuenciación 2.1.3. OTRAS PLATAFORMAS DE SECUENCIACIÓN Illumina
Secuenciación 2.1.5. SECUENCIACIÓN CON NANOPOROS Molécula embebida en una matriz forma un canal de 1-1.5 nm por donde pasa DNA/RNA de simple cadena Sistema de detección acoplado que permita detectar los diferentes nucleótidos
Secuenciación por síntesis 2.1.6. NUEVAS TÉCNICAS DE SECUENCIACIÓN DE MOLÉCULAS INDIVIDUALES Secuenciación por síntesis FRET: Fluorencence resonance energy transfer Secuenciación nanomecánica Nano-knife edge probes Nanoporos por bloques
Secuenciación Genoteca DNA genómico Rotura aleatoria HydroShear Sonicador Rotura aleatoria Selección fragmentos Genoteca Purificación clones Secuenciación Ensamblaje
2.2. ESTRATEGIAS DE SECUENCIACIÓN 2.2.1. ESTRATEGIA CLÁSICA Técnica de shotgun, basada en mapas físicos previos El DNA fragmentado se utiliza para fabricar genotecas en YACs (100-2000 Kb) Elaboración de mapas de baja resolución con YACs solapantes Fragmentación de los YACs y subclonación en cósmidos (~ 40 Kb) Elaboración de mapas de alta resolución con cósmidos Selección de cósmidos con solapamientos mínimos Fragmentación de cósmidos seleccionados y subclonación en plásmidos (~ 1,5 Kb) Secuenciación completa de los plásmidos Ensamblaje computacional
Secuenciación Shotgun clásico YACs Cósmidos Plásmidos
2.2.2 ESTRATEGIA GLOBAL Secuenciación Whole genome shotgun (WGS), sin mapas físicos previos
Secuenciación del genoma de Haemophilus influenzae (Fleischmann et al., 1995) Secuenciación de 19.687 clones (~1.500 pb) en los dos sentidos, El ensamblado sólo necesitó 30 horas, generándose 140 contigs y una redundancia de ~ 6. 2. Se completó la secuencia de los clones cuyas secuencias aparecían en contigs diferentes: quedaban 42 contigs. 3. Genoteca en el fago l (para evitar problemas de clonación). Rastreo con sondas de los extremos de los contigs no unidos. Secuenciación de los clones positivos: quedan 19 contigs. 4. Diseño de cebadores específicos de las secuencias de los contigs no unidos. Amplificación por PCR con cada par de cebadores: cromosoma circular.
Secuenciación Contigs no ensamblados con clones de la genoteca en pUC18 1. Diseño de oligonucleótidos correspondientes a los extremos 2. Hibridación genoteca en el fago l. Buscar clones con los dos extremos de contigs diferentes PCR
“Shotgun” global aplicado a genomas complejos Secuenciación “Shotgun” global aplicado a genomas complejos (Venter et al., 1996) DNA genómico clonado en BACs (insertos ~ 150 Kb): 300.000 clones cubren el genoma 10 veces 2. Secuenciar ~ 500 b de cada extremo de los clones STCs (conectores) 600.000 secuencias (10% genoma) cada STC puede conectar 30 BACs 3. Seleccionar un BAC semilla Secuenciar identificar los STCs que contiene. 4. Secuenciar los BACs más informativos que contienen los STCs detectados. PASEO CROMOSÓMICO CON BACs
Secuenciación Venter et al., 2001
2.3. ENSAMBLAJE COMPUTACIONAL PHRED/PHRAP/CONSED (Ewing et al., 1998; Green, 1994; Gordon et al., 1998) Staden Package (Staden, 1996) Celera assembler (Myers et al., 2000) CAP3 (Huang and Madan, 1999) ARACHNE (Batzoglou et al., 2002) PCAP (Huang et al., 2003) … Lectura de los resultados de la secuenciación Ensamblaje: reconocen secuencias de homología y las alinean Edición manual de secuencias Asistencia para la finalización de la secuencia completa
Ensamblaje Staden Package
Ensamblaje
Ensamblaje
Ensamblaje
Ensamblaje
Ensamblaje
Ensamblaje
Ensamblaje
Ensamblaje >SO4b_01_G11b_G11_042 NEW-SOPE.0.187 gatccgggactctagagcgacctgcaggcatgcaagcttggcgtaatcatggtcatagct gtttcctgtgtgaattgttatccgctcacaattccacacaacatacgagccggaagcata aagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctca ctgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgc gcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctg cgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggtta tccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggcc aggaaccgtaaaaaggccgcgttgctggcgtttttccataggcnccgcccccctgacgag catcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagatac caggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttacc ggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgt aggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaacccccc gttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaaga cacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgta ggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagta tttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttga tccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacg cgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcag tggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacc tagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaact tggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctattt cgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggctta ccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagattta tcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatcc gcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaat agtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggt atggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttg tgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgca gtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgta agatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcgg cgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaact ttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccg ctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatctttt actttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaaggga ataagggcgacacggaaatgtnaatactcatactcttcctttttcaatattattgaagca tttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaac aaataggggtaccgagctcgaattcactggccgtcgttttacaacgtcgtgactgggaaa accctggcgttacccaacttaatcgccttgcagctggcgta