Métodos estadísticos en Bioinformática Programa de doctorado Estadística, Análisis de Datos y Bioestadística
PRESENTACIÓN
Objetivos generales Discutir métodos y modelos de análisis Presentar la necesidad de los modelos y métodos estadísticos para tratar problemas que plantea la biologia molecular del siglo XXI Introducir las herramientas y los modelos estadísticos y bioinformáticos para el análisis de secuencias biológicas. Discutir métodos y modelos de análisis Análisis de secuencias biologicas Análisis de datos de microarrays 12/11/2018
Información sobre las clases Aulas Biblioteca del departamento de Estadística Aula de Informática Profesor; Alex Sánchez Profesores invitados ... Página Web del curso: http://www.ub.edu/stat/docencia/EADB/EstadBioinformatica_Web/ 12/11/2018
Referencias Ewens & Grant. Statistical Methods in Bioinformatics. Springer Draghici, S. Data Analysis tools for DNA microarrays. Chapman & Hall Speed. T., Statistical methods for DNA microarrays. CRC Press Durbin et al. Biological sequence analysis. www…. 12/11/2018
Metodología de las clases Clases de exposición a cargo del profesor, invitados o alumnos Clases prácticas R Bioconductor Programas para el análisis de datos de microarrays Bioconductor, Cluster/Treeview, SAM, … Programas para la construccion y análisi de HMM: HMMER Seminarios 12/11/2018
Ejercicios y evaluación Problemas y/o ejercicios computacionales Trabajos (uno de HMM y uno de ADM ) Presentación de un artículo sobre un tema del curso 12/11/2018
CONTENIDO DEL CURSO Preliminares Análisis de datos de microarrays Modelos ocultos de Markov
Contenido-1. Preliminares Introducción. Problemas estadísticos en bioinformática Biología Molecular Biomoléculas. El dogma central de la Biologia Molecular Introducción a la bioinformática Estadística Probabilidad, Inferencia estadística Cadenas de Markov 12/11/2018
2. Análisis de secuencias Análisis de secuencias. Alineamientos. Modelos estadísticos de alineamiento. Modelos de Markov. y aplicaciones: Islas CpG, Predicción de genes Problemas y algoritmos básicos Viterbi, Forward, Backward, Baum-Welch, E-M MMO lineales: a pares y de perfil Aplicación al estudio de las proteínas: HMMER MMO generalizados y MMO a pares Aplicación a la predicción de genes. 12/11/2018
3-Análisis de datos de Microarrays Introducción a los microarrays Análisis exploratorio de datos Preprocesado y Normalización Análisis de expresión diferencial de genes y Contraste de hipótesis múltiples. Métodos de Agrupación y de clasificación. Clasificación de muestras de tumores. Diseño experimental. Diseño de experimentos con microarrays. 12/11/2018
PROBLEMAS ESTADÍSTICOS EN BIOINFORMÁTICA
La biologia en el siglo XXI Al final del siglo XX se dan cambios tecnológicos que revolucionan la biologia Secuenciación automática de genomas Estudios másivos de expresión génica Inmensas cantidades de datos biológicos que almacenar, organizar y analizar Bioinformática (Bio)Estadística 12/11/2018
Ejemplo 1: Del DNA a los genes El genoma humano Un libro de 3000.000.000. letras En un idioma desconocido Sin puntos, comas, titulos… Pero … QUE … DICE? 12/11/2018
Ejemplo 1: Algunas soluciones Conocemos algunas señales (puntos, comas), algunas palabras etc Problema: análisis de señales con ruido Podemos Elaborar modelos probabilísticos Estimar los parámetros del modelo Usar los modelos para predecir (frases?) Validar el modelo, estudiar el error… 12/11/2018
Ejemplo 2: Estudios de expresión Los microarrays permiten “medir” como se expresan, simultaneamente, miles de genes Resultado: miles de puntos de colores, probablemente con errores de todo tipo Problema: separar el “grano de la paja” 12/11/2018
La estadística y los microarrays 12/11/2018
Conclusión La biología del siglo XXI utiliza modelos cuantitativos y sofisticadas técnicas de análisis de datos El-La estadístico-a / matemático-a / informatico-a es quien conoce las técnicas El-la biologo-a / medico-a / bioquimico-a es quien plantea los problemas Grandes posibilidades para la colaboracion interdisciplinaria 12/11/2018