Adrián Báez 16/06/2014
ADN Genes Proteínas Genoma Genómica Biomedicina
Secuenciación Ensamblado
Fragmentos Lecturas Archivo FASTQ Secuenciación genómica
Finalización del Proyecto Genoma Humano ( ) millones de dólares Lanzamiento del secuenciador Illumina HiSeqX Ten 1000 dólares/genoma “Cuarenta de estas máquinas podrían secuenciar en un año más genomas que todos los que han sido secuenciados hasta la fecha.” Secuenciación genómica
÷ 400 x20 Lecturas MB ~ GB HDD Ensamblado Estructuras de datos intermedias GB ~ TB RAM Secuencia original MB ~ GB HDD LecturasEnsamblado (RAM) Resultado E. coli 82.4 MB1.64 GB3.8 MB T. cruzi 1 GB13.75 GB38.6 MB Ensamblado genómico
Instituto Universitario de Enfermedades Tropicales y Salud Pública de Canarias Sistema actual: Ensamblado y análisis vía web
Futuros trabajos: Soluciones Big Data Instituto Universitario de Enfermedades Tropicales y Salud Pública de Canarias
Transferencia de datos Biotorrents Implementando Big Data Seguridad y privacidad de datos Algoritmos de cifrado avanzado Soluciones propias fuera de la nube Consentimiento de compartición de datos del genoma Almacenamiento de datos Carencia de una solución integral, económica y segura
Proyectos de secuenciación/ensamblado Google Scholar: papers que mencionan secuenciación o ensamblado genómico Human Genome Project Cancer Genome ProjectPine Genome Project Dog Genome Project Pediatric Cancer Genome Project Bovine Genome Project Mammoth Genome Project Pear Genome Project Fugu Genome Project