CLADOS Granada 17 Diciembre 2009. Evolución del proyecto Resultados Presupuesto.

Slides:



Advertisements
Presentaciones similares
UNA VISIÓN GLOBAL DEL HAPMAP PROJECT
Advertisements

SEMINARIO BIOLOGIA DE LA CONSERVACIÓN
Química Biológica Patológica Bioq. Mariana L. Ferramola
Leyes de Mendel.
DATA MINING MINERIA DE DATOS Gersom Costas.
METODOS LEVANTAMIENTO II
GRAFICOS . *TIPOS . * DETERMINACION DE ESCALA..
Estadística Unidad III
Estimación de los Errores de Muestreo Encuestas de Salud Reproductiva   RHS Usando SPSS 19.
Genética del huesped y curso evolutivo de la enfermedad por meningococo: Revisión sistemática y meta-análisis Host genetics and outcome in meningococcal.
Artur Ezquerra González Genómica y Proteómica 12/06/2013
GENETICA 2014 PARTE II: HERENCIA Teórica 3.
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
Métodos de muestreo.
Introducción a la lectura crítica de un ensayo clínico
GENETICA MENDELIANA.
BASES MOLECULAR Y BIOQUÍMICA DE LAS ENFERMEDADES GENÉTICAS
Optimización matemática Algoritmos Genéticos – Parte 2 Por: Antonio H
RECONOCIMIETO DE PATRONES
Algoritmos Bayesianos Karina Figueroa. Preliminares Aprendizaje ◦ cuál es la mejor hipótesis (más probable) dados los dato? Red Bayesiana (RB) ◦ Red de.
REDES BAYESIANAS Y DECISIÓN ESTADÍSTICA
Flujo génico en poblaciones estructuradas
INTELIGENCIA ARTIFICIAL.
GENETICA MENDELIANA.
describe el estudio de la herencia al igual que ocurre en los seres humanos.
Jornada Selección Genómica, Zaragoza 2009
3. Funciones discriminantes para la f.d.p normal.
Nuria Medina Medina Rosana Montes Soldado María del Mar Abad Grau
Descripción de Contenidos con Wavelets Jaime Gaviria.
Monohibridismo Prof. Héctor Cisternas R. Prof. Héctor Cisternas R.
TÉCNICAS MOLECULARES UTILIZADAS EN EL DIAGNÓSTICO GENÉTICO I
Estadística Administrativa II
Evaluación de riesgos y análisis de decisiones Gestión Ambiental Tema 11.
EN DIFERENTES AREAS COMO POR EJEMPLO: INVESTIGACIÓN: la clonación de secuencias de ADN en vectores, como pueden ser los plásmidos.
Universidad de Panamá Escuela de Biología Departamento de genética Genética de Poblaciones Integrantes: Castellanos, Rebeca Robinson, Anine Robles, Jazmin.
Datos: Estadística.
ESTADÍSTICAS DESCRIPTIVA
Estadística La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de objetos, personas, procesos,
3. Análisis de Correspondencias Simples
Herramientas básicas.
Adelgazamiento de Imágenes RGB
Integración de Redes Bayesianas con Programas Lógicos para Música Eduardo Morales L.Enrique Sucar Roberto Morales.
Una introducción a la computación evolutiva
Codominancia. Series alélicas
Ligamiento y mapas genéticos
Capítulo 1. Conceptos básicos de la Estadística
Normalidad Preparado por: Dr. Juan José García García.
Introducción al análisis de expresiones
UCLA – DAC M. Sc. Jorge E. Hernández H.
Genetica mendeliana.
Leyes de Mendel.
Evaluación de riesgos y análisis de decisiones
GENETICA HUMANA.
1 Introducción al tratamiento de datos © José Luís Contreras.
La estructura poblacional está determinada por sus parámetros
Sesión 6: Redes Bayesianas - Inferencia
Taller: Inteligencia Computacional
Aplicaciones Estadísticas a las Finanzas Clase 1
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Control Estadístico de Procesos
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
MUESTREO : Generalidades
describe el estudio de la herencia al igual que ocurre en los seres humanos. describe el estudio de la herencia al igual que ocurre en los seres humanos.seres.
NORMA INTERNACIONAL DE AUDITORÍA 530
Unidad 4 Análisis de los Datos.
GRAFICA DE MEDIDAS INDIVIDUALES Y RANGOS MOVILES
Genetica humana.
Departamento de Anatomía, Embriología y Genética. El programa informático PQGen está diseñado para ser el complemento.
GENETICA HUMANA.
Fecha de descarga: 6/23/2016 Copyright © McGraw-Hill Education. Todos los derechos reservados. Desarrollo de estudios independientes de cultivos de un.
Transcripción de la presentación:

CLADOS Granada 17 Diciembre 2009

Evolución del proyecto Resultados Presupuesto

Anomalías en marcadores (SNPs)‏ Anomalías estructurales (SNP y CNV)‏ CLADOS. Detección de anomalías estructurales mediante modelos gráficos probabilísticos: factores genéticos de susceptibilidad a enfermedades

Objetivos Objetivo: red bayesiana para diagnóstico de susceptibilidad a la EM No es para el diagnóstico de la enfermedad (datos de expresión genética, mRNA)‏

Usan genotipos en vez de haplotipos Las variables son los genotipos simples  Valores: AA, aa, A/a Los consideran independientes (ausencia de epístasis)‏  Ej. Medidas ponderadas de riesgo (Lancet 2009)‏ Modelan las dependencias: AA-BB, AA-B/b, etc.  Ej. Redes bayesianas (Nature Genetics 2005)‏ Factores genéticos de susceptibilidad a enfermedades: algunas soluciones

Objetivos Objetivo: red bayesiana para diagnóstico de susceptibilidad a la EM  Representación de los factores genéticos de riesgo  Selección de variables: Selección a gran escala: TDT-2G Selección fina: TDT P, reconstrucción filogenética 3. Agrupación de valores 4. Aprendizaje automático de la estructura de la red bayesiana

1. Representación de los factores genéticos de riesgo Representar genes, no nucleótidos:  SNPs (A/a, B/b, etc.) -> haplotipos (tag SNPs) (AB, Ab, aB, ab)‏  Problemas Los marcadores no suelen contener al gen Los marcadores cambian entre muestras (Affymetrix, Illumina)‏ No genes, sino haplotipos en desequilibrio de ligamiento: Asociación entre nucleótidos de posiciones cercanas debido a la baja recombinación gengen

SNPs asociados y DL 2 pequeños bloques de baja recombinación 2. Selección de variables

Selección burda  TDT-2G: alta sensibilidad

2. Selección de variables  Una variable de L SNPs tiene 2 L valores (haplotipos) distintos  Los loci asociados pueden ser muy largos (L muy grande)‏ Selección a fina escala  TDT P : alta sensibilidad y especificidad Acotar la zona de asociación intentando aumentar la especificidad al locus de susceptibilidad a la enfermedad (reducir efecto de DL)‏

Ejemplo TDT P

Problemas:  muchas discontinuidades, incluso usando ventanas deslizantes  El resultado depende del tamaño de la ventana 2. Selección de variables

Diferentes anchos de ventanas

2. Selección de variables Mucha incertidumbre  Haplotipos largos a veces capturan mejor la asociación  El marcador con asociación más fuerte cambia con el ancho del haplotipo (ventana)‏

3. Reducción de los valores Mucha incertidumbre  Haplotipos largos a veces capturan mejor la asociación  El marcador con asociación más fuerte cambia con el ancho del haplotipo (ventana)‏  El comportamiento depende de la muestra (subpoblación) 2. Selección de variables

SNPs asociados Negro: Asociados en IMSGC (tríos)‏ Rojo: Asociados en WTCCC (caso/control)‏ Verde: Asociados en ambos Muy pocos en común Buscar comunes en el mismo bloque de baja recombinación

2. Selección de variables Mucha incertidumbre si queremos determinar el locus de susceptibilidad  Haplotipos largos a veces capturan mejor la asociación  El marcador con asociación más fuerte cambia con el ancho del haplotipo (ventana)‏  El comportamiento depende de la muestra (subpoblación) No es importante para modelar los factores de riesgo

3. Agrupación de valores Simplificación parcial  Por la baja frecuencia de las mutaciones y de recombinaciones, sólo una minoría de haplotipos existen en la población Aun así, el número de haplotipos distintos es considerable y pueden aparecer nuevos valores

Necesidad de conocer la relación entre los haplotipos para poder agruparlos  Árboles filogenéticos TreeDT (Sevon et al., IEEE Trans. Comp Biol. & Bioinformatics 2007)‏ Caso/control Test estadístico basado en árboles (otros: Seltman et al AJHG)‏ No modelan la recombinación, sólo mutaciones  Grafos ancestrales de recombinación: Modelan la recombinación (Lam et al AJHG)‏ 3. Agrupación de valores

Longitud arcos no proporcional θ=0; T

Longitud arcos proporcional θ=0; T

Longitud arcos no proporcional θ=0; U

Longitud arcos no proporcional θ=0,0032; T

Longitud arcos proporcional θ=0,0032; T

Longitud arcos no proporcional θ=0,0032; U

Longitud arcos proporcional θ=0.0032; U

θ=0; T θ=0,003; U θ=0; U θ=0,003; T

Medidas de distancia intra-árbol  Según haplotipo de referencia Distancia al más ancestral (más frecuente) (L)‏ Distancia completa (LxL)‏  Según modelo Mutaciones Recombinaciones Ambas 3. Agrupación de valores

Estudios relacionados TreeDT (Sevon et al., IEEE Trans. Comp Biol. & Bioinformatics 2007)‏  Caso/control  Test estadístico basado en árboles (otros: Seltman et al. 2001, Lam et al. 2000)‏

Del cladograma a la agrupación  Hacerlas binarias (usar valores centrales): De 2 L a 2 (haplotipo riesgo sí/no)‏ Selección de los valores representativos:  Usar el haplotipo más frecuente de T/U (más ancestral): hT, hU o sólo hT y umbral  Otras posibilidades???  Calcular la distancia filogenética a hT, hU  Los marcadores no coinciden Usar muestra caso/control (permitir subpoblaciones)‏ 3. Agrupación de valores

Muestra de tríos (1000 tríos): usada para obtener los haplotipos de susceptibilidad Muestra caso/control (3000 inds. en total): 1/3 para obtener haplotipo fundador y umbral Resto para aprender/probar el modelo Redes bayesianas  Clasificador simple: ausencia de epístasis  TAN  Redes más genéricas: K2? 4. Aprendizaje automático? de la estructura de la red