Modelos Gráficos Probabilistas

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

Decisiones de Cartera Villar. Capítulo Nº 12.
TEORIA DE DECISIONES Introducción.
INTRODUCCION Análisis de decisiones: Es una herramienta cuyo objetivo es ayudar en el estudio de la toma de decisiones en escenarios bajo incertidumbre.
Investigación de Operaciones
Sesión 3: Teoría de Grafos
TEORÍA DE LA DECISIÓN BAJO INCERTIDUMBRE
GeNie GeNie: entorno de desarrollo para la
PROGRAMACION DE ESTRUCTURAS DE DATOS
Sesión 12: Procesos de Decisión de Markov
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Aprendizajes Esperados
REDES BAYESIANAS Y DECISIÓN ESTADÍSTICA
Tema 2: LA ELECCIÓN RACIONAL DEL COSUMIDOR
Decisiones bajo Incertidumbre Teoría de Juegos
16 de mayo de 2011Hebe Alicia Cadaval1 UN TRATAMIENTO AXIOMÁTICO DE LA UTILIDAD Artículo de R. D. LUCE Y H. RAIFFA Versión de Hebe Alicia Cadaval.
Sesión 13: Lógica y Probabilidad. Incertidumbre - LD y LP, L.E. Sucar2 Contenido Lógica probabilista Redes bayesianas con nodos lógico Modelos relacionales.
EL PODER DE SOLVER.
LA DECISIÓN EMPRESARIAL
Seminario sobre evaluación económica de proyectos de transporte Madrid, 15 y 16 de noviembre LA PREDICCIÓN DE LA DEMANDA EN EVALUACIÓN DE PROYECTOS.
ADMINISTRACION DE NEGOCIOS IV
Teoría de la decisión.
ADMINISTRACION DE NEGOCIOS I
Sesión 2: Teoría de Probabilidad “Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para.

Eduardo Morales / L. Enrique Sucar
Sesión 6: Campos de Markov
Sesión 12: Procesos de Decisión de Markov. Incertidumbre - MDP, L.E. Sucar2 Procesos de Decisión de Markov Procesos de Decisión Secuenciales Procesos.
DISTRIBUCION DE PROBABILIDADES
Sesión 6: Redes Bayesianas - Representación
Manejo de Incertidumbre Sesión 13 Eduardo Morales / L. Enrique Sucar Sesión 13 Eduardo Morales / L. Enrique Sucar.
Organización y Administración II Problemas Universo Indeterminado
Sesión 5: Modelos Ocultos de Markov
TEORIA DE LOS COSTOS 1.1 Antecedentes/Comentarios
Arboles de Decisión y Teoría de Utilidad
Sistemas Inteligentes Distribuidos Sistemas Inteligentes Distribuidos Sesión 13 L. Enrique Sucar / Marco López Sesión 13 L. Enrique Sucar / Marco López.
Razonamiento con Incertidumbre
Sistemas Inteligentes Distribuidos Sistemas Inteligentes Distribuidos Sesión 8 Eduardo Morales / L. Enrique Sucar Sesión 8 Eduardo Morales / L. Enrique.
21/9/99RICARDO ESTEBAN LIZASO1 UN TRATAMIENTO AXIOMATICO DE LA UTILIDAD ARTICULO DE R.D.LUCE Y H. RAIFFA VERSION DE RICARDO ESTEBAN LIZASO RICARDO ESTEBAN.
Valuación de los riesgos Una vez tenemos los riesgos identificado y medidos, ¿qué hacemos? Debe de tener métodos para valuar los riesgos.
Matemáticas Discretas
Simular: Representar una cosa, fingiendo o imitando lo que no es.
Sesión 2: Teoría de Probabilidad
Sesión 7: Redes Bayesianas – Inferencia
Integración de Redes Bayesianas con Programas Lógicos para Música Eduardo Morales L.Enrique Sucar Roberto Morales.
Cambios realizados en Elvira
Sesión 12: Procesos de Decisión de Markov
Diagrama de árbol Sesión 4.
Sesión 3: Teoría de Grafos
1 Problemas de decisión Tipo particular de problemas de optimización Sistemas que evolucionan con el tiempo Se toman decisiones en momentos sucesivos de.
Sesión 12: Procesos de Decisión de Markov
Los Árboles de decisión y el riesgo
Ejemplos de problemas de decisión
L. E. Sucar / Alberto Reyes
Modelos Gráficos Probabilistas: Principios y Aplicaciones L. Enrique Sucar INAOE.
Sesión 2: Teoría de Probabilidad “Considero que la probabilidad representa el estado de la mente con respecto a una afirmación, evento u otra cosa para.
INSTITUTO TECNOLOGICO DE VILLHERMOSA
Sesión 7: Redes Bayesianas – Inferencia: 2da Parte Modelos Gráficos Probabilistas L. Enrique Sucar INAOE [Neapolitan 90]
Diagrama de influencia
Toma de decisiones en la empresa
Sesión 6: Redes Bayesianas - Inferencia
VALOR ACTUAL NETO VAN. VALOR ACTUAL NETO VAN Valor Actual Neto ( VAN) El VAN se define como el método mediante el cual se compara el valor actual.
RIESGO, RENDIMIENTO Y VALOR

TEMA: DECISIONES BAJO RIESGO –TEORIA DE JUEGOS Ing. Larry D. Concha B.
Inducción y Recursión Matemáticas Discretas L. Enrique Sucar INAOE.
Métodos Cuantitativos ANALISIS DE DECISIONES Semana 09.
Hernández Camacho Víctor Jesus Islas Sánchez Karla Vanessa
El Principio de Razonamiento Insuficiente o Criterio de Laplace
Instituto superior tecnológico “ISMAC” Nombre: patricio coral Nivel: 3er nivel vespertino- Materia:
Transcripción de la presentación:

Modelos Gráficos Probabilistas L. Enrique Sucar INAOE Sesión 12: Redes de Decisión “un agente racional ideal es aquel que, para cada posible secuencia de percepciones, realiza la acción que maximiza su medida de rendimiento esperada, basado en la evidencia y su conocimiento.” [Russell 95]

© L.E. Sucar: MGP - redes decisión Redes de Decisión Teoría de Decisiones Utilidad Axiomas de utilidad Utilidad del dinero Modelos para soporte de decisiones Árboles de decisión Redes de decisión Redes de decisión dinámicas © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Teoría de Decisiones Marco teórico para tomar decisiones en forma racional Agente Racional – toma sus decisiones de forma que maximize la utilidad de sus acciones en función de sus objetivos y su conocimiento acerca del mundo © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Utilidad La utilidad expresa que tan deseable es el resultado de cada posible acción Ya que normalmente se tiene incertidumbre, se estima la utilidad esperada: U(a) = Sr U(r) P(r|a,e) Donde: a = posibles acciones r = posibles resultados e = evidencia disponible © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Lotería A cada posible resultado (escenario) se la asocia una probabilidad de ocurrencia, al conjunto de estos se le denomina una lotería Cada estado de la lotería tiene una utilidad, de forma que se pueden ordenar de acuerdo a la preferencia del agente: Prefiere A a B – A > B Indiferente – A ~ B © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Axiomas de Utilidad Orden – dados dos estados, se prefiere uno u otro, o se es indiferente Transitividad – si A > B y B > C, entonces A > C Continuidad – Si A>B>C, existe algún valor de probabilidad, p, de forma que es indiferente entre obtener B o la lotería A, p y C, 1-p © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Axiomas de Utilidad Substitución – si el agente es indiferente entre dos loterías A y B, entonces es indiferente entre dos loterías más complejas que son iguales excepto en que A es substituida por B en una de ellas Monotonicidad – si hay dos loterías con los mismos resultados, A y B, y el agente prefiere A, entonces debe preferir la lotería en que A tiene mayor probabilidad Descomposición – loterías compuestas se pueden reducir a loterías más simples usando las leyes de probabilidad © L.E. Sucar: MGP - redes decisión

Principio de Utilidad Se prefiere la acción (decisión) que de la mayor utilidad esperada: U(A) > U(B)  A > B (A es mejor que B) Si la utilidad es la misma se es indiferente: U(A) = U(B)  A ~ B (indiferencia) Normalmente se mide la utilidad en términos monetarios, aunque la relación de utilidad y $ no es lineal! © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Utilidad del Dinero Ejemplo: “En un concurso ya tienes $1,000,000. Tienes la oportunidad de quedarte con esto o lanzar una moneda – si cae águila ganas $3,000,000, si no pierdes lo que tenías” ¿Qué escogerías? Valor monetario esperado: Quedarse – VME = $1,000,000 Apostar – VME = 0.5x0 + 0.5x$3,000,000 = $1,500,000 © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Utilidad del Dinero Se ha encontrado empíricamente para la mayor parte de las personas hay existe una relación logarítmica entre VME y la utilidad. U $ © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Utilidad del Dinero Sin embargo, para diferentes personas (empresas) puede haber diferentes relaciones entre U y VME dependiendo de la situación y el contexto Busca el Riesgo Neutro U Evita el Riesgo $ © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Árboles de Decisión Un árbol de decisión es una representación gráfica de las alternativas disponibles para el agente y los aspectos que son inciertos Un árbol de decisión tiene dos tipos de nodos: Nodos de decisión (cuadrados) Nodos aleatorios (círculos) © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Árboles de Decisión El árbol de decisión se puede ver como una “guía” para el tomador de decisiones: Al encontrar un nodo de decisión debe seleccionar una de las alternativas Al encontrar un nodo aleatorio no tiene control, la trayectoria esta determinada por las probabilidades Cada alternativa en un nodo aleatorio tiene asociada una probabilidad Los nodos terminales (hojas) del árbol tienen un costo o utilidad (normalmente en unidades monetarias) © L.E. Sucar: MGP - redes decisión

Ejemplo de Árbol de Decisión Ganar (0.1) 100 pronósticos - 15 Perder (0.9) Decisión Ganar (0.2) melate 50 Perder (0.8) -10 © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Evaluación A partir de los nodos terminales (de las hojas hacia la raíz): Para los nodos aleatorios, se calcula la utilidad (costo) esperado en función de los costos de cada alternativa y sus probabilidades asociadas Para los nodos de decisión, se selecciona la alternativa de mayor utilidad (menor costo) esperado © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Ejemplo de Evaluación Ganar (0.1) 100 -3.5 pronósticos - 15 Perder (0.9) Decisión Ganar (0.2) 50 melate 2 Perder (0.8) -10 © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Redes de Decisión Alternativa a los árboles de decisión que es más expresiva y a la vez permite construir modelos más compactos basados en modelos gráficos Se pueden ver como una extensión a las redes bayesianas, incorporando nodos de decisión y nodos de utilidad © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Tipos de Nodos Nodos Aleatorios – (óvalos) Nodos de Decisión – (rectángulos) Nodos de Utilidad – (rombos) © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Ejemplo A Decisión B C Utilidad D © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Nodos Aleatorios Representan variables aleatorias como en redes bayesianas Pueden ser observadas o estimadas Costo © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Nodo de Decisión Representan los puntos de decisión del agente Tiene un conjunto de valores que corresponden a las opciones en ese punto Los arcos hacia nodos de decisión son de información, indican precedencia en el tiempo Pueden tener arcos (influenciar) a los nodos aleatorios o a los nodos de utilidad Puede haber varios nodos de decisión en una red de decisión Ubicación © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Nodo de Utilidad Representan la función de utilidad del agente Tienen como padres los nodos aleatorios y de decisión que afectan directamente la utilidad La utilidad se puede definir como: Una matriz con un valor por cada combinación de los padres Una función matemática En los modelos básicos hay un nodo de utilidad, pero puede haber más. Generalmente se asume que la utilidad es la suma (pesada) de los nodos de utilidad Utilidad © L.E. Sucar: MGP - redes decisión

Ejemplo – modelo para decidir la ubicación de un Aeropuerto accidentes Utilidad tráfico ruido demanda costo Constr. © L.E. Sucar: MGP - redes decisión

Evaluación (un nodo de decisión) Asignar valores a todos los nodos aleatorios conocidos (evidencia) Para cada posible decisión: Asignar dicho valor al nodo de decisión Propagar las probabilidades Calcular la utilidad Seleccionar la alternativa de mayor utilidad © L.E. Sucar: MGP - redes decisión

Evaluación (más de un nodo de decisión) Si hay varios nodos de decisión se van evaluando uno por uno en “orden” Para ello se requiere hacer un ordenamiento mediante una transformación de la red El algoritmo de evaluación se basa en una serie de transformaciones del grafo – remover nodos e invertir arcos, tal que no modifican la política óptima © L.E. Sucar: MGP - redes decisión

Red de decisión regular Una red de decisión es regular si: Es un grafo acíclico dirigido El nodo de utilidad no tiene sucesores Hay una trayectoria dirigida que contiene a todos los nodos de decisión La tercera condición implica un ordenamiento total de todas las decisiones © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Transformaciones Eliminar nodos aleatorios o de decisión que sean nodos hoja (barren nodes)- no afectan las decisiones Eliminar nodos aleatorios que son padres del nodo de utilidad y no tienen otros hijos – se recalcula el nodo de utilidad en base a los padres del nodo eliminado Eliminar nodos de decisión que sean padres del nodo de utilidad y que sus padres también sean padres del nodo de utilidad – tomar la decisión de mayor utilidad y guardarla en el nodo de utilidad © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Transformaciones Inversión de arcos: se puede invertir el arco del nodo aleatorio i  j si no hay otra trayectoria entre i – j se invierte el arco j  i y cada nodo hereda los padres del otro © L.E. Sucar: MGP - redes decisión

Ejemplo de transformación © L.E. Sucar: MGP - redes decisión

Ejemplo de transformación © L.E. Sucar: MGP - redes decisión

Ejemplo de transformación © L.E. Sucar: MGP - redes decisión

Ejemplo de transformación © L.E. Sucar: MGP - redes decisión

Ejemplo de transformación © L.E. Sucar: MGP - redes decisión

Ejemplo de transformación © L.E. Sucar: MGP - redes decisión

Ejemplo de transformación © L.E. Sucar: MGP - redes decisión

Ejemplo de transformación © L.E. Sucar: MGP - redes decisión

Ejemplo de transformación © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Método alternativo Otra forma de resolver una red de decisión es transformarla a una red bayesiana: Los nodos de decisión se convierten a nodos aleatorios con una distribución uniforme Los nodos de utilidad se convierten a nodos aleatorios binarios, para los que su probabilidad es proporcional a la utilidad Entonces el problema se reduce a propagar en la red bayesiana para todas las combinaciones de los nodos de decisión, de forma que se maximice la probabilidad del nodo(s) de utilidad © L.E. Sucar: MGP - redes decisión

Ejemplo en Hugin: ¿Llevar paraguas? Nodos aleatorios: predicción del clima clima Nodos de decisión: escuchar el pronóstico llevar paraguas Nodo de ultilidad: considera el compromiso entre el costo de llevar el paraguas vs. el costo de mojarse © L.E. Sucar: MGP - redes decisión

Redes de decisión dinámicas Este concepto se puede extender a la toma de decisiones en el tiempo – redes de decisión dinámicas Incorporan nodos de decisión y de utilidad a las redes bayesianas dinámicas Normalmente se tienen una serie de decisiones en el tiempo y una cierta utilidad en el futuro © L.E. Sucar: MGP - redes decisión

Redes de Decisión Dinámicas Ut Ut+1 Ut+2 Dt-1 Dt Dt+1 Dt+2 St St+1 St+2 St+3 E E E E © L.E. Sucar: MGP - redes decisión

Procesos de Decisión de Markov Los procesos de decisión en el tiempo, conocidos también como procesos de decisión secuenciales, se modelan y resuelven como modelos de decisión de Markov (MDP) – que veremos en la siguiente sesión © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Referencias [Russell & Norvig] – Cap. 16 Hiller & Lieberman, Introduction to Operations Research, Holden-Day – Cap. 15 Warner, A tutorial introduction to decision theory, en Readings on Uncertain Reasoning, Morgan-Kaufmann Shachter, Evaluating influence diagrams, en Readings on Uncertain Reasoning, Morgan-Kaufmann © L.E. Sucar: MGP - redes decisión

© L.E. Sucar: MGP - redes decisión Actividades Continuar desarrollando el proyecto final Presentación último día de clases: 5 de julio © L.E. Sucar: MGP - redes decisión