Bayesian Inference of Phylogeny

Slides:



Advertisements
Presentaciones similares
DSITRIBUCION T DE STUDENT.
Advertisements

Continuación de modelos de decisión
Tema 4. Juegos simultáneos con información incompleta.
BLAST.
Modelos de Variable Dependiente Binaria -Logit y Probit-
Fallas y reparaciones: el papel de las cadenas de Markov
} LISSET BÁRCENAS MONTERROZA
Dpto. Señales, Sistemas y Radiocomunicaciones
Capítulo 5 Método de MonteCarlo
Ejercicios con listas.
Tests de permutaciones y tests de aleatorización
Junta de Trabajo- TACIB A 15 de Mayo del ¡Muchas felicidades a todos!
Using Localised “Gossip” to Structure Distributed Learning Bruce Edmonds Centre for Policy Modelling Manchester Metropolitan University.
Departament d’Estadística Divisió de Ciències Experimentals i Matemàtiques Hepatitis B: un ejemplo de Montecarlo basado en Cadenas de Markov Programa de.
Distribuciones muestrales Procedimientos de muestreo
Inferencia Estadística Departament d’Estadística
MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN
REDES BAYESIANAS Y DECISIÓN ESTADÍSTICA
Sesión 2: Métodos Probabilísticos Básicos
Flujo génico en poblaciones estructuradas
Sesión 4: Métodos Probabilísticos Básicos “... tenemos razones para creer que hay en la constutución de las cosas leyes de acuerdo a las cuales suceden.
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
1.2- MÉTODO DE DESCOMPOSICIÓN DE ADOMIAN (ADM)
Sesión 2: Teoría de Probabilidad “Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para.
Unidad V: Estimación de
Estadística Administrativa I
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
Modelo de regresión simple: Y =  1 +  2 X + u 1 Hemos visto que los coeficientes de regresión b 1 y b 2 son variables aleatorias. Estos, respectivamente,
Sesión 6: Campos de Markov
4.1 Continuidad en un punto 4.2 Tipos de discontinuidades 4.3 Continuidad en intervalos.
MÉTODO MONTE CARLO Primer método de simulación empleado.
Matrices de Substitución PAM Y BLOSUM
The Normal Distribution To calculate the probability of a Normal distribution between a and b:
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
1 M. en C. Gal Vargas Neri. 2 Planeación del curso TEMACAP.TITULODÍASSEMFEC FIN TEMA 00MOTIVACION Y PLANEACION1111/01 TEMA I1-2ESTADISTICA Y MEDICION2115/01.
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
Departament d’Estadística Divisió de Ciències Experimentals i Matemàtiques Montecarlo basado en cadenas de Markov Programa de doctorado Estadística, Análisis.
Act. Carlos Vladimir Rodríguez Caballero HSBC MÉXICO Facultad de Ciencias Riesgo de CréditoUNAM AME p.1/16.
Capítulo 7 Estimación de Parámetros Estadística Computacional
Ditribución del valor extremo Distribucion del maximo de N scores de matching de secuencias random independientes Si la probabilidad de este.
ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA
Inferencia Bayesiana de Filogenias Moleculares Tania Hernández.
Sesión 7: Redes Bayesianas – Inferencia
Solución de problemas que involucran campos aleatorios de conductividad hidráulica.
A  Percentil al 68.3%,  :  P(x) dx =  
Unidad V: Estimación de
Matrices de sustitución
Inferencia Multivariante Cap 10 y 11
Estimación de modelos ARMA
Artificial Intelligence Machine learning Fall 2008 professor: Luigi Ceccaroni.
Recuperació de la informació Bioinformatics. Sequence and genome analysis David W. Mount Flexible Pattern Matching in Strings (2002) Gonzalo Navarro and.
Simulación/2002 Héctor Allende
Discriminant Analysis. Two classification problems Discrimination Cluster.
P Y E 2012 Clase 11Gonzalo Perera1 Repaso de clase anterior Fórmula del bloqueo de Erlang. LFGN y el problema de la Robustez.
Arboles B (búsqueda externa)
Alineamiento local: búsqueda de homologías
ALINEAMIENTO MULTIPLE: METODOS ALTERNATIVOS
Física Experimental IV Curso 2010 Experimento 12 Página-1 Departamento de Física Fac. Ciencias Exactas - UNLP Distribución de Poisson En cualquier serie.
1.5 Análisis Bayesiano - Tomador de Decisiones con Información Imperfecta. La estadística Bayesiana construye un modelo a partir de información adicional.
Sesión 6: Redes Bayesianas - Inferencia
Curso de Estadística a Distancia El Profesor se va por las ramas… Los alumnos parecen ausentes…
INFERENCIA ESTADÍSTICA
Departamento de Informática Universidad Técnica Federico Santa María EconometríaEconometría Capitulo II.
METODOS DE REMUESTREO: JACKKNIFE Y BOOTSTRAP
1 Nancy Lacourly FONDEF D99I ¿SABÍAN QUE LAS COCINERAS SON EXCELENTESMUESTRISTAS?
RAFAEL MARÍA ROMÁN BRAVO OCTUBRE, 2015 Importancia de la Estadística en la Investigación.
Robótica Móvil CC5316 Clase 15: Localización Semestre Primavera 2012 Profesor: Pablo Guerrero.
CÁLCULO INTEGRAL. Nombre de la asignatura: Cálculo Integral Carrera: Todas las Carreras Clave de la asignatura: ACF-0902 (Créditos) SATCA1:
Regresión logística Tema 6c. En la regresión lineal la variable dependiente es continua En regresión logística se utiliza cuando la variable dependiente.
Transcripción de la presentación:

Bayesian Inference of Phylogeny T. Bayes, Phil. Trans. Roy. Soc., 330 (1763). p(Ti|S) probability of the tree Ti given the sequence data S p(S|Ti) probability or likelihood of the data S given tree Ti p(Ti) prior probability of Ti “The denominator sums the probabilities over all possible trees”

ESTIMACION BAYESIANA Inferencias están basadas en la probabilidad de distribución posterior de un parámetro. La unión de las probabilidades de todos los parámetros son calculados. Las probabilidades están basadas en algún modelo (esperado a priori), luego de aprender algo de los datos.

ESTIMACION BAYESIANA

DADOS

ESTIMACION BAYESIANA ¿Cuál es la probabilidad de tomar un dado trucado? Respuesta :1/10. Esta número representa la probabilidad a priori de tomar un dado sesgado.

ESTIMACION BAYESIANA Supongamos ahora que otra persona toma un par de dados de la caja y los tira. Resultando: ¿Podemos creer que este resultado esta sesgado? Dos aproximaciones: Maximum Likelihood e Inferencia Bayesiana.

OBSERVACION NORMALES SESGADOS PROBABILIDADES OBSERVACION NORMALES SESGADOS

PR NORM SESG PROBABILIDADES

ESTIMACION BAYESIANA

INFERENCIA BAYESIANA Pr [Sesgados

ESTIMACION BAYESIANA

11 44

posterior a priori

Likelihood Probabilidad a priori Probabilidad a posteriori Σ de todas las probabilidades a posteriori Integración de todas las posibles combinaciones de largo de ramas y modelos de sustitución nucleotídica.

INFERIR UNA FILOGENIA

POSIBLES FILOGENIAS

Arboles equiprobables Proporcional a observaciones: supuestos ej. alineamiento Combinación: probabilidades a priori y Likelihood

ALINEAMIENTO

Estimación de las probabilidades a posteriori : ¿Cómo aproximarse? Calcular esta probabilidad implica: involucrar todos los árboles posibles….para cada árbol se debe integrar sobre todas las combinaciones de largo de rama y modelos de sustitución nucleotídica. (IMPOSIBLE ANALÍTICAMENTE!!!) Por necesidad la solución debe ser aproximada Método de Montecarlo

Monte Carlo y cadenas Markovianas (MCMC) MCMC trabaja del siguiente modo: a) Comienza una cadena markoviana con un árbol ya sea 1) elegido al azar o 2) elegido por el investigador. b) Un nuevo árbol es propuesto….el proceso de cambio del arbol 1 al 2 debe satisfacer las siguientes condiciones: 1) El mecanismo debe ser estocástico; 2) cada arbol posible debe ser obtenido por aplicaciones repetidas del mismo mecanismo y 3) la cadena debe ser aperiodica.

MARKOV CHAIN MONTE CARLO (MCMC)

At each step in the chain a new tree is proposed by altering the topology, or by changing branch lengths or the parameters of the model of sequence evolution. The Metropolis-Hastings algorithm is then used to accept or reject the new tree.

METROPOLIS-COUPLED MARKOV CHAIN MONTE CARLO (MCMCMC o MC3) Involucra correr algunas cadenas independientemente. La primera cadena que se cuenta (cold chain) el resto se denomina cadenas accesorias (heated chain). Saltos son intentados al azar entre dos cadenas distintas. Se necesita correr varios análisis independientes para confirmar convergencias.

Resultado de esta búsqueda se obtiene un tercer término para la estimación de las probabilidades a posteriori (Proposal Ratio o Término de Hasting)

INFERENCIA FILOGENÉTICA BAYESIANA Prior probability DNA Data Likelihood Evolutionary model Phylogenetic tree Posterior prob. Proposal Starting tree inferencia A sequence of Samples MCMC Approximate the distribution

MrBayes: Bayesian Inference of Phylogeny MrBayes is a program for Bayesian inference of phylogeny using Markov chain Monte Carlo methods. Avaialble for Mac, PC, and Unix.

Métodos filogenéticos más usados Algorithm Statistical Supported Search Strategy Bayesian Methods Stochastic search Maximum Likelihood Optimization method Divide & Conquer Maximum Parsimony Greedy search GA, SA MCMC Exact search Fitch-Margolish DCM, HGT, Quartet Algorithmic method Stepwise addition Global arrangement Star decomposition Exhaustive Branch & Bound Neighbor-join UPGMA Distance matrix Data set Character data

Mapping characters onto phylogenies

Mapping Uncertainty parsimony ML Bayesian

Phylogenetic and Mapping Uncertainty