Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Sequence and annotation of genomes and metagenomes with Galaxy Overview of sequencing technologies Dr. rer. nat. Diego Mauricio Riaño Pachón Brazilian Bioethanol Science and Technology Laboratory (CTBE) Brazilian Center for Research in energy and Materials (CNPEM)
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 CTBE is part of Ministry of Science and Technology with other three National Labs Brazilian Centre of Research in Energy and Materials (CNPEM)
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 NGS Facility CTBE/CNPEM 3 HiSeq2500 MiSeqcBot Image server batteries Compute power Miseq HiSeq
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Genómica 4
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Sequencing technologies 5
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Next Generation Sequencing: Technologies and applications 6 Single Molecule Real Time Sequencing (SMRT)
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 PacBio: Single Molecule Real Time Sequencing (SMRT) 7 Play Video
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Next Generation Sequencing: Technologies and applications 8 Nanopore sequencing
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Oxford Nanopore 9 Play Video
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Next Generation Sequencing: Technologies and applications 10 Sequencing by Synthesis
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Sequencing by synthesis 11 Play Video
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Overview 12 Library preparation (more on this later) Bentley et al Nature 456, | doi: /nature07517 Original DNA fragments bp Ligation of Y adapters: Polarity Why this size range?
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Overview 13 Bentley et al Nature 456, | doi: /nature07517 Attach fragments to surface and amplify Attach Bridge PCR
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Overview 14 Bentley et al Nature 456, | doi: /nature07517 Mate pair sequencing Long fragments, e.g., 10Kbp Circularize Fragment Ligate Y adapters
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina 15 More details on Illumina´s SBS
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre The size of the fragment is very important, as long fragments could give rise to polyclonal clusters, and so, degraded signal Also you have to keep an eye on the number of clusters formed in the initial steps, if it is too large you will most likely loose most of the information, in those cases is better to start over and not waste sequencing reagents.
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre
Universidad de los Andes, Bogotá, Colombia, Septiembre Sequencing by synthesis Metzkler, Nature Reviews Genetics 11, | doi: /nrg2626 At each cycle, take four pictures (here they are shown combined) (A, C, G and T)
Universidad de los Andes, Bogotá, Colombia, Septiembre Combined image Cluster imaging: False color At each cycle, take four pictures (A, C, G and T) Combined image
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Paired end sequencing 30 C. Cosentino Slideshare: Sequence first read Regenerate clusters Remove/Cleave first fragment Sequence second read
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Multiplexing
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Multiplexing Dual indexing is also possible: More samples in the same lane
Universidad de los Andes, Bogotá, Colombia, Septiembre Some library preparation strategies using Illumina
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Library preparation NeXtera 34
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Library preparation TruSeq RNASeq 35
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Library preparation TruSeq Strand-specific RNASeq 36
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Library preparation Synthetic long reads 37 Genomic DNA is fragmented to approximately 10 Kb. Adapters are ligated to the fragments.
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Library preparation Synthetic long reads 38 Fragments are clonally amplified across 384 wells. ~300 molecules/well Fragments are sheared and labeled with unique indexes. Fragments from all 384 wells are then pooled, purified, and size selected.
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Library preparation Synthetic long reads 39 Fragments are sequenced. Read length distribution Sugarcane genome
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina: Library preparation Synthetic long reads 40 Genome assembly: The problem with the short reads Repeat copy 1Repeat copy 2 Collapsed repeat consensus Contig orientation? Contig order? Source:
Universidad de los Andes, Bogotá, Colombia, Septiembre Data deluge and dropping costs
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Costo de Secuencia 42
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Costo de Secuencia 43 one-company-became-the-force-behind-medicines-genetic-revolution/
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Illumina dominates the NGS market 44 Do you own, or support one of the following NGS platforms?
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 The data deluge: Costs 45 Stein, Genome Biology, 11:207 “in the not too distant future it will cost less to sequence a base of DNA than to store it on a hard disk” Data HiSeq 2500 (v3) Cost one flowcell: US$ Yield: 500 Gbp Cost per bp: US$4x10 -6 Cost to store 1 TB: US$900 Cost to store 1bp (FastQ format ~5bytes): US$4.5x10 -4
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Genomics in Colombia Today 46 Details: Marco Cristancho, BIOS.co
Universidad de los Andes, Bogotá, Colombia, Septiembre Applications
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Genome sequencing Panda Octopus 1000 human genomes 1001 Arabidopsis genomes 10K Vertebrate genomes Genomic Encyclopedia of Bacteria and Archaea Community Genomics: Metagenomics 48
Universidad de los Andes, Bogotá, Colombia, Septiembre 2015 Other applications ChIP-Seq FAIRE-Seq mRNASeq ncRNASeq 49