Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto.

Slides:



Advertisements
Presentaciones similares
Búsqueda en árboles de juego
Advertisements

Ejemplo 2: Reparto de 3 objetos indivisibles.
Diseño y análisis de algoritmos
Planificación de Monoprocesadores
BENEMERITA UNIVERSIDAD AUTONOMA DE PUEBLA
Grupo 4 Matías Melgar Pablo Carbonell
Bivariadas y Multivariadas
MATEMÁTICAS DISCRETAS.
KRIGING.
Tema 3 Revisión de diversos métodos robustos aplicados en algunos problemas fotogramétricos.
UNIVERSIDAD LATINA (UNILA) IV. IMPLANTACION DE ALGORITMOS.
Búsqueda Informada Heurísticas.
Algoritmos Aleatorizados
Inteligencia Artificial Búsqueda informada y exploración
Solución de problemas por búsqueda inteligente
COLAS, IMPLEMENTACIÓN A PARTIR DE LISTAS Y PARA PILAS
Algoritmos Genéticos (AG) Integrantes: Rubén Levineri Miguel Rozas Juan Yañez Faltan autores y bibliografía.
Modelos de Programación Entera - Heurísticas
MÉTODOS DE BÚSQUEDA DE ARBOLES Y OPTIMIZACIÓN
Programación Lineal Entera Antonio H. Escobar Z Universidad Tecnológica de Pereira – Colombia Posgrado en Ingeniería – Maestría/Doctorado.
GRAFOS HUGO ARAYA CARRASCO.
REDES BAYESIANAS Y DECISIÓN ESTADÍSTICA
Temas importantes para el desarrollo de la segunda parte del TPE
Estructuras de Datos MC Beatriz Beltrán Martínez.
Definiciones: conjuntos, grafos, y árboles
Optimización Combinatoria usando Algoritmos Evolucionistas Problemas de Optimización. Idea: Encontrar una solución "factible" y "óptima" de acuerdo a algún.
Capítulo 4 BUSQUEDA INFORMADA.
ANÁLISIS DE CONGLOMERADOS
Solución de problemas por Búsqueda
Optimización, Búsqueda Heurística
Problemas de Decisión y Optimización
Estructura de Datos y Algoritmos

Diseño y análisis de algoritmos
Programación Lineal Entera Antonio H. Escobar Z Universidad Tecnológica de Pereira – Colombia Posgrado en Ingeniería – Maestría/Doctorado.
Diseño y análisis de algoritmos
Tablas de Hash.
DESARROLLO MODELO RESOLUCION MODELO ¿VALIDA? MODELO MODIFICADO IMPLEMENTACION DEFINICION DEL PROBLEMA t.
Parte I. Estructuras de Datos.
Diseño y análisis de algoritmos
(Organización y Manejo de Archivos)
Parte II. Algorítmica. 3. Algoritmos voraces.
Surge cuando se necesita un modelo costo-efectividad que permita transportar ciertos bienes desde un lugar de origen a un destino que necesita aquellos.
Análisis de Agrupamientos y Componentes Principales
METODOS DE BUSQUEDA INFORMADOS CAPITULO 5
Teoría – Alejandro Gonzalez
Backtracking 1. Método general. 2. Análisis de tiempos de ejecución.
Cómo encontramos yacimientos?  L os Geofísicos encuentran yacimientos por medio de ondas que emiten desde la superficie y dependiendo de cuánto tarde.
Parte II. Algorítmica. 5. Backtracking. 1. Análisis de algoritmos.
Una introducción a la computación evolutiva
Capítulo 1. Conceptos básicos de la Estadística
Tema 12. Backtracking. 1. Método general.
Parte I. Estructuras de Datos.
Tema 10: Algoritmos voraces
Incorporando Búsqueda Local a un Algoritmo ACO para el Problema de Scheduling de Tardanza Ponderada Lasso M., de San Pedro M Laboratorio de Tecnologías.
Introducción a la Robótica mecanismos avanzados Coordinación de Ciencias Computacionales, INAOE Dra Angélica Muñoz Dr Eduardo Morales
Optimización Combinatoria y Grafos Búsqueda Tabú
Instituto Tecnológico De Villahermosa Alumno: Lázaro García Hernández.
Heap Fibonacci heap de Fibonacci es una estructura de datos similar a un heap binomial pero con mejor coste amortizado. se utiliza para mejorar el tiempo.
UNIDAD 2 Grafos Árboles abarcadores mínimos Caminos más cortos.
Tomando decisiones sobre las unidades de análisis
Toribio Sarmiento Miguel Sesarego Cruz Rosmery. BUSQUEDA DE LA SOLUCION EN UN ESPACIO ESTADO BUSQUEDA SISTEMATICA O CIEGA EN PROFUNDIDAD EN AMPLITUD NO.
ANALISIS DE REDES Problema de Transporte Método de la esquina Noroeste
Heurística. Los procesos que se llevan a cabo en el cerebro pueden ser analizados, a un nivel de abstacción dado, como procesos computacionales de algún.
Árboles Equilibrados Estructuras de Datos MC Beatriz Beltrán Martínez Primavera 2015.

M.C. Meliza Contreras González
Marco de Trabajo para Indexación, Clasificación y Recopilación Automática de Documentos Digitales Javier Caicedo Espinoza Gonzalo Parra Chico.
10 Etapas de administración de proyectos con el método Lewis
Planificación de CPU Conceptos Básicos Criterios de Planificación Algoritmos de Planificación Planificación con Múltiples Procesadores Planificación Real-Time.
Transcripción de la presentación:

Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto Miguel Lillo, Universidad Nacional de Tucumán, Tucumán

Biogeografía histórica Distribución geográfica en un contexto filogenético Brundin, 1972

Biogeografía histórica Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía. Optimación de caracteres, bien sea usando parsimonia de Fitch o similares a Sankoff, o mapeo estocástico usando likelihood.

Biogeografía histórica Áreas predefinidas: Definidas arbitrariamente, nunca se contrastan Ignoran la naturaleza espacial de los datos No permiten escalas detalladas Solo son viables con pocos “caracteres” (áreas) Susceptibles a problemas que no son propios de la biogeografía (v.g. especies ampliamente distribuídas) Nylander et al. 2008

Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica

Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones

Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones Distribución de un nodo es la suma de sus descendientes

Distribuciones

Puntos georeferenciados

1. Para cada terminal t 2.Para todas las celdas (i,j) 3.D t (i,j) ← 0, 4.Para cada registro r en t 5.D t (i,j) ← 1 para la celda (x,y) asignada al registro r 6.Para cada V k de (x,y), D t (v1,v2) ← 1 7.Fin-para 2 8. Fin-para 1 ∎ Relleno de “imagen digital”

Distribuciones Rellenado de la distribución

Distribuciones Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas. Un poco más de 70 terminales, eso es más de 140 nodos: 360x120x140 celdas. Más de 6' de celdas, en su mayor parte vacías!

Quad-árboles Construir Q (i1, i2, j1, j2, anc) 1. Si (D|i1, i2, j1, j2| = 0) retornar NULO 2.Q -> ancestro ← anc 3.Asignar coordenadas del cuadrante a Q 4.Si ((i1 = i2) y (j1=j2)) Q -> esCelda? ← verdadero retornar Q 5.x ← i1 + ((i2 – i1) / 2), y ← j1 + ((j2 – j1) / 2) Q -> esCelda? ← falso 6.Q -> NW ← Construir Q (i1, x, j1, y, Q) Q -> NE ← Construir Q (x, i2, j1, y, Q) Q -> SW ← Construir Q (i1, x, y, j2, Q) Q -> NW ← Construir Q (x, i2, y, j2, Q) 7. Retornar Q ∎

Quad-árboles

Criterio de optimalidad

Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos vicariantes. El criterio optimo es entonces: (i) minimizar nodos no vicariantes (ii) minimizar eliminación de nodos Criterio de optimalidad

Sea un nodo-j un nodo en donde todos sus descendientes menos uno tienen una eliminación de distribucion (Page, 1994; Arias et al. 2008). Cualquier otro node es vicariante o no vicariante.

Sea C n el costo de la reconstrucción del nodo n, y desc (n) es la lista de descendientes de n. C n = ( ∑ i = desc(n) C i ) + Y n + X n Criterio de optimalidad

C n = ( ∑ i = desc(n) C i ) + Y n + X n Donde Y n Y n = costo de una eliminación, si la distribución de n es eliminada, De lo contrario, Y n = 0

C n = ( ∑ i = desc(n) C i ) + Y n + X n y X n X n = 0, si n es un nodo-j, X n = 0, si n es un nodo vicariante, X n = costo de un nodo no vicariante, si n es no vicariante. Criterio de optimalidad

Esta operación permite conocer el costo del árbol para una reconstrucción dada. El peso de la búsqueda esta en la optimación del árbol: cada reconstrucción propuesta, requiere una optimación. Optimación

Optimar (nodo n) 1.Si (n es eliminado) C n ← costo_eliminación Sino C n ← 0 2.Si n es terminal, retornar C n 3.Para cada i que sea desc(n) C n ← C n + Optimar (i) 5.Si n es no vicariante C n ← C n + Costo_no_vic 6.Retornar C n ∎ Optimación ingenua

Requiere visitar todos los nodos del árbol. Su estructura revela la posibilidad de una optimación más adecuada: el costo de de un nodo depende solo de sus nodos descendientes, por lo tanto, si se parte de una reconstrucción, es posible únicamente optimar los nodos ancestrales al nodo modificado.

Optimar (nodo n) 1. Minetras n dif NULL 2.Si (n es eliminado) C n ← costo_eliminación Sino C n ← 0 2.Si n es terminal, n ← anc (n), volver a 1 3.Para cada i que sea desc(n) C n ← C n + C i 4.Si n es no vicariante C n ← C n + Costo_no_vic 5.n ← anc (n) 6.Fin-Mientras ∎ Optimación incremental

Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol. En promedio el número de visitas es el número de nodos entre el terminal más alejado de la raíz y la raíz.

Búsquedas heurísticas Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisimas posibilidades. Búsquedas heurísticas no garantizan encontrar el óptimo, pero permiten atacar problemas mucho mayores.

“Subida de colina” simple 1.Min ← C t 2.Para cada nodo n en el árbol t 3.Eliminar n Optimizar t 4.Si (C t < Min) volver a 1. 5.Restaurar n Optimizar t 6.Fin para-2. ∎

“Subida de colina” simple Rápida, independiente del punto de partida. En el peor caso revisa todos los nodos, 2n optimiaciones. Es poco efectiva en árboles grandes, las primeras eliminaciones pueden ser poco óptimas.

Heurística de Page 1. Prev ← C t 2.Min ← C t Pos ← NULL 3.Para cada nodo n en el árbol t 4.Eliminar n, Optimizar t 5.Si (C t < Min) Min ← C t Pos ← n 6.Restaurar n, Optimizar t 7.Fin para-3. 8.Si (Min < Prev) Eliminar n, Optimizar t volver a 2. ∎

Más exhaustiva que la subida simple. En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones. Si no hay empates, siempre realiza la misma secuencia. Heurística de Page

Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto estará disponible de manera gratuita en internet. Este es el primer programa de biogeografía que utiliza filogenias y datos geográficos simultáneamente Implementación

Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas. En cambio, hay muchas posibilidades para mejorar las heurísticas: búsquedas limitando los nodos a optimar, muestreos basados en cristalización simulada, o fusión de soluciones. Perspectivas

Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314). P. Hovenkamp ha mostrado un gran interés y retroalimentación al proyecto. C.A. Szumik, P.A. Goloboff, D. Casagranda, S. Catalono y M. Mirande han proporcionado ideas, discusión y apoyo. Agradecimientos