Incertidumbre Qué puede hacer un agente cuando las cosas no son tan claras como el cristal.

Slides:



Advertisements
Presentaciones similares
Modelos de Toma de Decisión
Advertisements

PROGRAMACIÓN LINEAL La Programación Lineal (PL) es un procedimiento matemático para determinar la asignación óptima de recursos. Introducción a la Programación.
Redes Bayesianas Capítulo 14. Contenido Sintaxis (forma de la red) Semántica Como todo lenguaje...
TEMA 3. ESTADÍSTICA BIDIMENSIONAL. INDICE 1.- Relación estadística: correlación 2.- Diagramas de dispersión o nube de puntos 3.- Tablas de frecuencia.
Marco Antonio Carrillo Zevallos. Los principios y axiomas lógicos. La lógica como ciencia pretende darnos a conocer leyes universales del pensamiento.
* Parte del punto 3 está basado en las presentaciones del Curso de Enfoques Metodológicos de Fernando Cartes M.
Enfoque de los comunicadores:
Solución de problemas y toma de decisiones administrativas
LÍMITES Y CONTINUIDAD IVºELECTIVO
Modelando las Preferencias
Microeconomía Clase 6.
La Semilla Estratégica: El paradigma lógico-analítico
PSICOESTADÍSTICAS INFERENCIALES
Normatividad relativa a la calidad
CALCULO DE LÍMITES Elaborado por: Ing. Juan Adolfo Álvarez Martínez Noviembre,
ESTRUCTURAS CONDICIONALES
Qué es la Econometría No hay acuerdo en la definición ya que:
INTRODUCCION A LA TEORIA DE DECISIONES JUAN ANTONIO DEL VALLE F.
Centro de Estudios de Justicia de las Américas
FUNCIONES, PROCESAMIENTO ELEMENTAL DE DATOS
ANÁLISIS DE RIESGO SIMULACIÓN DE SISTEMAS 2009
FUNCIONES MATEMÁTICAS
INFORMÁTICA II (ALGORITMOS)
ANALISIS DEL RIESGO DEL PROYECTO
Principales criterios empleados bajo Riesgo
TEMA 6 : DISTRIBUCIONES ESTADÍSTICAS.
Sistema de Bases de Datos
Descripción e interpretación de la estadística
Tema 5: Probabilidad Lecturas recomendadas:
Introducción a la Simulación
ESTADISTICA GENERAL.
Actividades 2do grado Bimestre 1.
Métodos de muestreo.
INDICE Ejemplo 1: Temperaturas registradas entre las 5hs y 22:30hs
Programación en scratch
SISTEMAS DINAMICOS John Alexander Lozano
INTERVALO DE CONFIANZA
ALGORITMOS Un procedimiento o método para resolver un problema que cumpla con unos requisitos se dice que es un algoritmo. Se puede dar por tanto la siguiente.
Datos y Azar I medio Verónica Toro y Daniela Riquelme
Las principales funciones de las hipótesis son:
ACUERDO 592 POR EL QUE SE ESTABLECE LA ARTICULACION DE LA EDUCACION BASICA ARTICULO PRIMERO.- La Articulación de la Educación Básica, que comprende los.
GESTIÓN EMPRESARIAL.
Diagrama de flujo.
Aplicaciones Estadísticas a las Finanzas
TEOREMA DE PITAGORAS Zaira EDITH REZA FLORES Katia Elí Pedroza Aranda
y pensamiento algebraico
Programación Lógica.
ESTADÍSTICA BÁSICA.
Teoría Relacional Modelo Relacional Líder en Ciencia y Tecnología.
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
Diagramas PERT.
LAS VARIABLES EN LA INVESTIGACIÓN
FORMULACIÓN DE PROYECTOS
Metodología de la Programación
HIPOTESIS.
Enfoque de los comunicadores:
Dr. Carlomagno Araya Alpízar
FUNDAMENTOS DE LA TEORÍA DE LA PROBABILIDAD
Clase Nº 1 Concepto de Probabilidad
AXIOMAS DE ARROW JAIMES GUTIERREZ LINDA KAREN PALOMA ADRIANA FUENTES VILCHIS.
Presentan:. Presentan: Estadística Historia y Conceptos Básicos.
ENSEÑANZA Y APRENDIZAJE EN LA RED.
Evaluación de Proyectos con riesgo
Eduardo Cruz Pérez.
ETAPAS DE LA PLANEACION!
Diagrama de componentes
Clase Reglas de Decisión Alternativas Teoría de la Decisión Lic.Santiago Tagle CRITERIO DE WALD Bajo la alternativa a i, el peor resultado posible que.
Equipo 1: ¿Migrar o no migrar?
PROBABILIDAD Y TÉCNICAS DE CONTEO
Clase Nº 1 Concepto de Probabilidad
Transcripción de la presentación:

Incertidumbre Qué puede hacer un agente cuando las cosas no son tan claras como el cristal.

Como Actuar Ante la Incertidumbre Pereza. Ignorancia Teórica. Ignorancia Practica . Una de las limitaciones de la lógica de primer orden y, por lo tanto, del método del agente lógico, es que los agentes casi nunca tienen acceso a toda la verdad acerca de su ambiente. El empleo de la lógica de primer orden tiene sus limitantes v     Pereza: el listar el conjunto completo de antecedentes o consecuentes necesarios para garantizar una regla sin excepciones implica demasiado trabajo, y también seria muy difícil emplear las enormes resultantes. v     Ignorancia Teórica: las ciencias no cuentan aun con una teoría completa sobre todas las cosas. Ignorancia Practica: Aun conociendo todas las reglas, cuando no es posible realizar todas las pruebas que sea necesario hacer, albergaríamos ciertas dudas.

Los Axiomas de Probabilidad Todas las probabilidades están comprendidas entre 0 y 1. La probabilidad de las proposiciones necesariamente verdaderas es de 1, y de las necesariamente falsas es de 0. La probabilidad de una disyunción se expresa de la siguiente manera: P(A V B) = P(A) + P(B) – P(A  B). Nuestra herramienta principal para manejar los grados de creencia será la teoría de probabilidad. La probabilidad es una forma de resumir la incertidumbre originada en nuestra pereza e ignorancia.

Origen de las Probabilidades Frecuentista. Objetivista. Subjetivista. Este debate sobre el origen tiene varios puntos de vista: v     Frecuentista: este punto de vista dice que los números solo pueden originarse en experimentos v     Objetivista: las probabilidades son aspectos reales del universo. v     Subjetivista: considera a las probabilidades como una manera de caracterizar las creencias de un agente, y no les concede ninguna significación externa.

Sistemas de Razonamiento Probabilistico Cómo construir sistemas de razonameinto basados es modelos de redes.

Representación del Conocimiento en un Dominio Incierto Los nodos de la red están formados por un conjunto de variables aleatorias . Cada par de nodos se conecta entre sí mediante un conjunto de enlaces o flechas . Por cada nodo hay una tabla de probabilidad condicional . La grafica no tiene ciclos dirigidos . Para representar la dependencia que existe entre determinadas variables se utiliza una estructura de datos conocida como red de creencia. Esta red es una grafica en la que se cumple lo siguiente

Ejemplo robo temblor alarma Maria llama Juan llama

Ejemplos de Casos para las redes de Creencia Para tomar decisiones con base en las probabilidades de la red y en los recursos del agente. Para saber que tantas más variables de evidencia hay que observar para poder conseguir información útil. Para explicar al usuario los resultados obtenidos mediante inferencia probabilística.

Toma de decisiones sencillas Cómo debe tomar decisiones un agente para obtener lo que desea.

Bases de la Teoría de la Utilidad El agente debe elegir aquellas acciones que permitan obtener el máximo de la utilidad esperada. El principio de la Maxima Utilidad Esperada define enteramente la IA. El principio de la Máxima Utilidad Esperada (MUE) afirma que el agente debe elegir aquellas acciones que permitan obtener el máximo de la utilidad esperada del agente. En cierto sentido, podrá considerarse que el principio de la MUE define enteramente la IA. Todo lo que tiene que hacer el agente inteligente es calcular las diversas cantidades implicadas, maximizar sus acciones y eso es todo. Lo cual no quiere decir que basta con la definición para resolver los problemas de IA.

Axiomas de la teoríia de la Utilidad Posibilidad de Ordenación. Transitividad. Continuidad. Posibilidad de sustitución. Monotonicidad. Posibilidad de descomposición. Las seis siguientes restricciones son conocidas como axiomas de la teoría de la utilidad:   v     Posibilidad de Ordenación: dados 2 estados, el agente debe preferir uno de ambos o valorar ambos como igualmente preferibles. v     Transitividad: dados 3 estados, si el agente prefiere A en vez de B, y prefiere B en vez de C entonces preferiría a A en vez de C. v     Continuidad: si en grado de preferencia un estado B esta entre A y C, existe una probabilidad P de que el agente racional le sea indiferente obtener con toda seguridad B y obtener la lotería que produce A. v     Posibilidad de sustitución: Al agente le es indiferente la obtención de 2 loterías A y B al agente también le será indiferente la obtención de 2 loterías más complejas que sean lo mismo excepto que una de ellas B este remplazado por A. v     Monotonicidad: si hay 2 loterías cuyos resultados son los mismos A y B. Si el agente prefiere A sobre B también debe preferir la lotería que ofrece mayor probabilidad para A. Posibilidad de descomposición: las loterías compuestas pueden reducirse a loterías más simples mediante la aplicación de las leyes de la probabilidad

Estructura de Preferencia y la Utilidad de Atributos Múltiples Preferencias sin incertidumbre. Preferencias bajo condiciones de incertidumbre. Preferencias sin incertidumbre: El caso en el que no existe incertidumbre en cuanto al resultado de las acciones, y que lo único que ocupa la atención son las diversas preferencias entre uno u oro resultado concreto. En un caso así, a la regularidad básica que caracteriza a la estructura de preferencias se le denomina independencia de las preferencias.   Preferencias bajo condiciones de incertidumbre: Si en el dominio existe incertidumbre, no bastara con determinar el valor de las funciones, sino que será necesario también considerar la estructura de las preferencias entre las loterías y comprender las propiedades resultantes en las funciones de utilidad. Como las matemáticas respectivas pueden resultar bastante complejas, representaremos algunos de los resultados más importantes para dar una idea de lo que puede realizarse.

Redes de Decisión Los tres nodos empleados son Nodos Aleatorios (óvalos) Nodos de Decisión (rectángulos) Nodos de Utilidad (rombos) Se le conoce también como diagrama de influencia. En las redes de decisión se combinan las redes de creencia con tipos adicionales de nodos para acciones y utilidades.   Una red de decisión esta representada la información sobre el estado actual del agente sus posibles acciones, el estado que resultara de las acciones que emprenda el agente así como la utilidad de dicho estado. Los tres nodos empleados son: v     Nodos Aleatorios (óvalos): representan variables aleatorias, exactamente como en el caso de redes de creencia. A cada nodo le corresponde una tabla de probabilidad condicional. v     Nodos de Decisión (rectángulos): representan puntos para los cuales puede decidirse que acción emprender. v     Nodos de Utilidad (rombos): representan la función de utilidad del agente. Los padres del nodo de utilidad son aquellas variables que describen el estado resultado que afecta directamente la utilidad. La tabla asociada es una fabulación directa de la utilidad.

Toma de Decisiones Complejas Se examinan metodos para saber que hacer hoy, sabiendo que existe la posibilidad de actuar mañana

Ambientes para la Toma de decisiones Ambientes Accesibles Ambientes Inaccesbibles Las decisiones complejas se deben tomar en el caso de los problemas de decisión secuencial, en donde la utilidad del agente depende de una secuencia de decisiones. Este tipo de problemas, que implican utilidades, incertidumbre y percepción, constituye una generalización de los problemas de búsqueda y planificación ambientes accesibles. En estos, las percepciones del agente en cada paso le permitirán identificar cual es el estado en que se encuentra.   El total de correlaciones entre estados y acciones se conoce como política. Con base en esta, puede calcularse la utilidad esperada de las posibles historias ambientales producidas por dicha política. El problema, por tanto, no reside en calcular la secuencia de acciones optima, sino en calcular la política optima: es decir, aquella que produce la mayor utilidad esperada. ambientes inaccesibles, la percepción no aporta suficiente información para determinar el estado o las probabilidades de la transición correspondiente. En la literatura de la investigación de operaciones a este tipo de problemas se le conoce como problemas de decisión de Markov parcialmente observables o PDMPO. La forma adecuada de resolver los PDMPO consiste en calcular una distribución de probabilidades que abarque todos los estados posibles, tomando en cuenta todas las percepciones anteriores, y basar las decisiones en esta distribución.

Algoritmos para Calcular una Política Optima Interación de Valores Interación de Política Interación de Valores   Un algoritmo que sirve para calcular una política optima conocida como interacción de valores. La idea fundamental consiste en calcular la utilidad de cada uno de los estados y con base en estas utilidades, seleccionar una acción optima para cada uno de ellos. Lo difícil en el calculo es que no sabemos a que nos conducirá una acción determinada. Interación de Política El algoritmo de interación de política funciona escogiendo una política y luego calculando la utilidad de cada estado con base en dicha política. Luego actualiza la política correspondiente a cada estado utilizando las utilidades de los estados sucesores, lo que se repite hasta que es estabilizada la política. El paso en el cual los valores de la utilidad son definidos a partir de una determinada política es conocida como determinación de valor. La idea básica en que se apoya la interación de política, comparada con la interación de valores, es que la determinación de valores debe ser más sencilla que la interación de valores, puesto que la acción correspondiente a cada estado es definida por la política.

Redes de decisión Dinámica Para convertir redes de creencia dinámica en redes de decisión dinámicas basta con añadir nodos de utilidad y nodos de decisión correspondientes a las acciones. El algoritmo de evaluación de las RDD básicamente es el mismo que el de las redes de decisión comunes. Para el peor de los casos la RDD calcula la utilidad esperada de las secuencias de decisión fijando los nodos de decisión y aplicando inferencia probabilística para calcular el estado final.

Gracias….