MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN

Slides:



Advertisements
Presentaciones similares
Branch-and-bound Search
Advertisements

METODOLOGIA DE LA INVESTIGACION.
Programación entera En muchos problemas reales las variables sólo pueden tomar valores enteros Ejemplos: decisiones sobre inversiones, compras, arranques,
Programación entera En muchos problemas reales las variables sólo pueden tomar valores enteros Ejemplos: decisiones sobre inversiones, compras, arranques,
Diseño y análisis de algoritmos
Algoritmos Voraces.
PSI-BLAST.
Programación Lineal Entera Antonio H. Escobar Z Universidad Tecnológica de Pereira – Colombia Posgrado en Ingeniería – Maestría/Doctorado.
Investigación de Operaciones II
Investigación de Operaciones II
en general, mínimos energéticos
COMPONENTIZACIÓN DE ALGORITMOS GENETICOS Y SU IMPLEMENTACIÓN EN UNA PLATAFORMA ABIERTA PARA APRENDIZAJE COMPUTACIONAL.
KRIGING.
Inteligencia Artificial Búsqueda informada y exploración
Sistema de tres ecuaciones con tres incógnitas
Modelos de Programación Entera - Heurísticas
Programación Lineal Entera Antonio H. Escobar Z Universidad Tecnológica de Pereira – Colombia Posgrado en Ingeniería – Maestría/Doctorado.
Algoritmo Simplex Dual Como sabemos, el método simplex es un algoritmo iterativo que iniciando en una solución básica factible pero no óptima, genera soluciones.
EXPANSIÓN DE SISTEMAS ELÉCTRICOS DE Universidad Tecnológica de Pereira
Clase 2, Parte 2: Métodos Tradicionales de Optimización y Búesqueda
Temas importantes para el desarrollo de la segunda parte del TPE
Trabajo presentado por: LUIS FERNANDO OBANDO ING
Capítulo 4 BUSQUEDA INFORMADA.
EL PODER DE SOLVER.
EMPLEAR COMO DISEÑO UNA FRACCION FACTORIAL
ANÁLISIS DE CONGLOMERADOS
Optimización, Búsqueda Heurística
SISTEMAS DE ECUACIONES
Objetivo: Facilitar la búsqueda de los elementos del conjunto ordenado
Diseño y análisis de algoritmos
Programación Lineal Entera Antonio H. Escobar Z Universidad Tecnológica de Pereira – Colombia Posgrado en Ingeniería – Maestría/Doctorado.
Diplomado en Logística de Negocios
Métodos de Búsqueda Informada. Búsqueda de la mejor Ruta En esta sección no sólo nos interesa encontrar una posible ruta, sino obtener aquella ruta que.
Tema 10.3: Asignación de Espacio No Contiguo. Tema 10.3: 2 Silberschatz, Galvin and Gagne ©2005 Fundamentos de los Computadores (ITT, Sist. Electr.),
Métodos y Principios de la Sistemática D. S. Fernández del Viso UPR-Humacao BIOL 4435.
Diseño y análisis de algoritmos
Asignación de Espacio No Contiguo
Filogenia. Filogenia Filogenia y genealogía La filogenia reproduce la trayectoria evolutiva del taxón.
SISTEMA DE ECUACIONES LINEALES.
Diseño y análisis de algoritmos
Para construir un árbol filogenético se necesitan tres ingredientes básicos:
Análisis de Agrupamientos y Componentes Principales
APLICACIONES DE LA LINGÜÍSTICA COMPUTACIONAL (I)
ROB DE SALLE JOE FELSENSTEIN LINNEO Métodos “numéricos” son usados frecuentemente por que la mayoría de los datos (caracteres) incluyen evidencia que.
Métodos de reconstrucción filogenética
o caracteres derivados compartidos por un grupo de organismos
Parte II. Algorítmica. 5. Backtracking. 1. Análisis de algoritmos.
1 Introducción a la Computación para Biólogos, Bioquímicos, Médicos, etc.
Prof. Orlando Durán Escuela de Ingeniería Mecánica PUCV Clase 05 AUTOMATIZACION DE LA MANUFACTURA.
Parte I. Estructuras de Datos.
SIG. LAURA VELAZQUEZ MORELOS. Hace referencia a un refrán que implica resolver un problema difícil, dividiéndolo en partes más simples tantas veces como.
Clase # 7: Análisis Conformacional (I)
Parte I. Estructuras de Datos.
Redes de Area Local, LAN Una red de área local es una red de datos de alta velocidad que cubre un área geográfica relativamente pequeña. Típicamente conecta.
Sabemos reconocerlas, y calcularlas como soluciones de sistemas de ecuaciones, o de desigualdades Buscamos métodos de cálculo generales y eficientes Problemas.
1 Condiciones de extremo Proceso para derivar las condiciones De problema más simple a más complejo Progresión de problemas: Problema sin restricciones.
1.2 Análisis por Matriz de Ganancias
UNIDAD 4 Clase 6.3 Tema: Sistema de Ecuaciones Lineales
Investigación Algorítmica
Optimización Combinatoria y Grafos Búsqueda Tabú
El Poder de la Sonrisa.
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto.
Heurística. Los procesos que se llevan a cabo en el cerebro pueden ser analizados, a un nivel de abstacción dado, como procesos computacionales de algún.
Resolución de problemas
DISEÑO FRACCION UN MEDIO
AYUDANTÍA DE SIMULACIÓN
Método de cofactores para cálculo de determinantes
BUSINESS T&G Think & Grow Uniclass Gestión Documental Solución Web para Mejorar la Captura y Gestión.
Programación I Prof. Carolina Cols. Algoritmo es una lista bien definida, ordenada y finita de operaciones que permite hallar la solución a un problema.
Propiedad Intelectual Cpech PPTCAC008MT21-A16V1 Álgebra I Propiedad Intelectual Cpech ACOMPAÑAMIENTO ANUAL BLOQUE 21.
Transcripción de la presentación:

MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN WAGNER LINNEO

Optimización de Caracteres 1 1 A B C D E paralelismo 2 orígenes independientes 0 => 1 (DELTRAN) = * 1 => 0 = origen y reversión (ACCTRAN) * 0 => 1

Búsqueda de arboles óptimos: Soluciones exactas Soluciones exactas solo pueden ser usadas para un pequeño número de taxa. Búsqueda exhaustiva examina todos los arboles posibles. Típicamente usados para grupos problemas menores a 10 OTUs.

Búsqueda exhaustiva B C Arbol de partida, 3 taxa 1 A Añada un cuarto taxón (D) en cada una de los tres combinaciones posibles -> tres árboles E B D D C B C E B C D 2a 2b 2c E A A E A E Añada un quinto taxon (E) en cada una de las cinco posibles posiciones en cada uno de los tres arboles -> 15 arboles……….

Hay tres posibles arboles no enraizados para cuatro taxa (A, B, C, D) Inferencia Filogenética: Búsqueda del “arbol verdadero o único” Computacionalmente intensivo ( “hard problem”)

Número de árboles incrementa de manera exponencial con el numero de taxa F (2N - 5)!! = # arboles no enraizados para N taxa

Búsqueda de arboles óptimos: Soluciones exactas Branch and bound ahorra tiempo descartando familias de arboles durante la construcción del arbol. Elimina aquellos combinaciones que involucran un mayor numero de pasos. Típicamente usado en problemas que involucran menos de 18 taxa.

Búsqueda de arboles óptimos: Soluciones exactas: Branch and Bound

Búsqueda de arboles óptimos: Búsqueda heurística Métodos heurísticos son usados para buscar en el espacio de arboles aquél más parsimonioso seleccionando un árbol inicial e intercambiando ramas buscando las mejores combinaciones. Problema: “No garantiza encontrar el más parsimonioso” (“se hace lo que se puede").

Búsqueda de arboles óptimos: Búsqueda heurística Stepwise addition Asis – El orden en la matriz de datos. Closest –Comienza con el árbol más corto de 3-taxa añadiendo otros taxa en un orden que produce el menor incremento en el largo del árbol. Simple – El primer taxón en la matriz es tomado como referencia (taxa son añadidos considerando un orden decreciente de similaridad a la referencia). Random - taxa son añadidos en una secuencia al azar, muchas secuencias distintas son usadas. Se recomienda usar Random cuando son muchas OTUs (10-100).

Búsqueda heurística Branch Swapping (intercambiando ramas): Nearest neighbor interchange (NNI) Subtree pruning and regrafting (SPR) (corte e injerto) Tree bisection and reconnection (TBR)

Búsqueda heurística Nearest neighbor interchange (NNI) A B C D E F G

Búsqueda heurística Subtree pruning and regrafting (SPR) A B C D E F G (corte e injerto) PAUP permite 2 cortes NONA hasta 10 cortes

Búsqueda heurística Tree bisection and reconnection (TBR) PAUP permite 2 cortes NONA hasta 10 cortes

Búsqueda heurística Branch Swapping Nearest neighbor interchange (NNI) Subtree pruning and regrafting (SPR) Tree bisection and reconnection (TBR) Por la naturaleza de búsqueda heurística no podemos saber cual método es mejor..es decir cual método encontrará el árbol más parsimonioso ( o los arboles MP). Consejo, TBR ( el más intensivo) usada junto con Random addition debería funcionar mejor.

El Espacio de arboles puede ser “habitado” por minimos locales e islas de arboles SECUENCIA DE RÉPLICAS DE RANDOM ADDITION EQUIVOCA CORRECTA EQUIVOCA Branch Largo del árbol Swapping Branch Swapping Branch Swapping MÍNIMO LOCAL MÍNIMO GLOBAL MÍNIMO LOCAL

BUSCANDO CON RESTRICCIONES TOPOLOGICAS (topological constraints) “Topological constraints” son hipótesis filogenéticas definidas por el usuario. Pueden ser usadas para encontrar arboles óptimos cuando: 1. Se incluye un clado específico o un set de relaciones específicas. 2. Se excluye un clado especifico o un set de relaciones específicas. (reverse constraint)

Buscando usando “topological constraints” E F G CONSTRAINT TREE ((A,B,C,D)(E,F,G)) EFG ABCD A B C E D F G A B C D E F G EFG ABCD Compatible con reverse constraint tree Incompatible con constraint tree Compatible con constraint tree Incompatible con reverse constraint tree

Buscando usando “topological constraints” “backbone constraints” “Backbone constraints” especifica relaciones entre un subgrupo de taxa BACKBONE CONSTRAINT A B D E ((A,B)(D,E)) Relaciones de taxon C no son especificadas A B D E A D B E Posiciones posibles de taxon C Incompatible con backbone constraint Compatible con backbone constraint Compatible con reverse constraint Incompatible con reverse constraint

Datos faltantes (“missing data”) “Missing data” son ignorados en la construcción de un árbol pero pueden llevar, si son incluidos a encontrar arboles igualmente parsimoniosos, en ausencia de homoplasía. 1 ? ? Muchos datos faltantes en la matriz pueden llevar a multiples arboles igualmente parsimoniosos. (Problema más serio cuando se analizan datos morfológicos que datos moleculares) A B C D E * Origen único 0 => 1 En cualquiera de las tres ramas * *

Arboles Optimos La mayoría de los métodos nos llevan a encontrar múltiples árboles igualmente parsimoniosos . Podemos seleccionar entre ellos usando criterios adicionales…. Es una práctica común utilizar árboles de consenso.

Métodos de Consenso Arbol de Consenso: resumen del acuerdo entre los arboles encontrados. Los Métodos de Consenso puedens ser usados en: a) Múltiples arboles de un análisis. b) Múltiples análisis SUPERTREES (debate!!)

Método de Consenso Estricto A B C D E F G A B C E D F G A B C D E F G

Método de Consenso de Mayoría B C D E F G A B C E F G A B C E F D G D A B C E D F G 100 66 66 66 66

Método de Consenso reducido (Reduced consensus) A B C D E F G A G B C D E F A B C D E F G A B C D E F Consenso Estricto NO Resuelve STRICT REDUCED CONSENSUS TREE Programa RadCon Taxon G es excluído

Método de Consenso Use Consenso Estricto para identificar aquellas relaciones que se sostiene en forma inambigua para una interpretación por parsimonia de los datos. Use Métodos del Consenso Reducido donde arboles de consenso tiene poca resolución. Use Método de mayoría cuando haga bootstraps.