La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Incertidumbre Qué puede hacer un agente cuando las cosas no son tan claras como el cristal.

Presentaciones similares


Presentación del tema: "Incertidumbre Qué puede hacer un agente cuando las cosas no son tan claras como el cristal."— Transcripción de la presentación:

1 Incertidumbre Qué puede hacer un agente cuando las cosas no son tan claras como el cristal.

2 Como Actuar Ante la Incertidumbre
Pereza. Ignorancia Teórica. Ignorancia Practica . Una de las limitaciones de la lógica de primer orden y, por lo tanto, del método del agente lógico, es que los agentes casi nunca tienen acceso a toda la verdad acerca de su ambiente. El empleo de la lógica de primer orden tiene sus limitantes v     Pereza: el listar el conjunto completo de antecedentes o consecuentes necesarios para garantizar una regla sin excepciones implica demasiado trabajo, y también seria muy difícil emplear las enormes resultantes. v     Ignorancia Teórica: las ciencias no cuentan aun con una teoría completa sobre todas las cosas. Ignorancia Practica: Aun conociendo todas las reglas, cuando no es posible realizar todas las pruebas que sea necesario hacer, albergaríamos ciertas dudas.

3 Los Axiomas de Probabilidad
Todas las probabilidades están comprendidas entre 0 y 1. La probabilidad de las proposiciones necesariamente verdaderas es de 1, y de las necesariamente falsas es de 0. La probabilidad de una disyunción se expresa de la siguiente manera: P(A V B) = P(A) + P(B) – P(A  B). Nuestra herramienta principal para manejar los grados de creencia será la teoría de probabilidad. La probabilidad es una forma de resumir la incertidumbre originada en nuestra pereza e ignorancia.

4 Origen de las Probabilidades
Frecuentista. Objetivista. Subjetivista. Este debate sobre el origen tiene varios puntos de vista: v     Frecuentista: este punto de vista dice que los números solo pueden originarse en experimentos v     Objetivista: las probabilidades son aspectos reales del universo. v     Subjetivista: considera a las probabilidades como una manera de caracterizar las creencias de un agente, y no les concede ninguna significación externa.

5 Sistemas de Razonamiento Probabilistico
Cómo construir sistemas de razonameinto basados es modelos de redes.

6 Representación del Conocimiento en un Dominio Incierto
Los nodos de la red están formados por un conjunto de variables aleatorias . Cada par de nodos se conecta entre sí mediante un conjunto de enlaces o flechas . Por cada nodo hay una tabla de probabilidad condicional . La grafica no tiene ciclos dirigidos . Para representar la dependencia que existe entre determinadas variables se utiliza una estructura de datos conocida como red de creencia. Esta red es una grafica en la que se cumple lo siguiente

7 Ejemplo robo temblor alarma Maria llama Juan llama

8 Ejemplos de Casos para las redes de Creencia
Para tomar decisiones con base en las probabilidades de la red y en los recursos del agente. Para saber que tantas más variables de evidencia hay que observar para poder conseguir información útil. Para explicar al usuario los resultados obtenidos mediante inferencia probabilística.

9 Toma de decisiones sencillas
Cómo debe tomar decisiones un agente para obtener lo que desea.

10 Bases de la Teoría de la Utilidad
El agente debe elegir aquellas acciones que permitan obtener el máximo de la utilidad esperada. El principio de la Maxima Utilidad Esperada define enteramente la IA. El principio de la Máxima Utilidad Esperada (MUE) afirma que el agente debe elegir aquellas acciones que permitan obtener el máximo de la utilidad esperada del agente. En cierto sentido, podrá considerarse que el principio de la MUE define enteramente la IA. Todo lo que tiene que hacer el agente inteligente es calcular las diversas cantidades implicadas, maximizar sus acciones y eso es todo. Lo cual no quiere decir que basta con la definición para resolver los problemas de IA.

11 Axiomas de la teoríia de la Utilidad
Posibilidad de Ordenación. Transitividad. Continuidad. Posibilidad de sustitución. Monotonicidad. Posibilidad de descomposición. Las seis siguientes restricciones son conocidas como axiomas de la teoría de la utilidad: v     Posibilidad de Ordenación: dados 2 estados, el agente debe preferir uno de ambos o valorar ambos como igualmente preferibles. v     Transitividad: dados 3 estados, si el agente prefiere A en vez de B, y prefiere B en vez de C entonces preferiría a A en vez de C. v     Continuidad: si en grado de preferencia un estado B esta entre A y C, existe una probabilidad P de que el agente racional le sea indiferente obtener con toda seguridad B y obtener la lotería que produce A. v     Posibilidad de sustitución: Al agente le es indiferente la obtención de 2 loterías A y B al agente también le será indiferente la obtención de 2 loterías más complejas que sean lo mismo excepto que una de ellas B este remplazado por A. v     Monotonicidad: si hay 2 loterías cuyos resultados son los mismos A y B. Si el agente prefiere A sobre B también debe preferir la lotería que ofrece mayor probabilidad para A. Posibilidad de descomposición: las loterías compuestas pueden reducirse a loterías más simples mediante la aplicación de las leyes de la probabilidad

12 Estructura de Preferencia y la Utilidad de Atributos Múltiples
Preferencias sin incertidumbre. Preferencias bajo condiciones de incertidumbre. Preferencias sin incertidumbre: El caso en el que no existe incertidumbre en cuanto al resultado de las acciones, y que lo único que ocupa la atención son las diversas preferencias entre uno u oro resultado concreto. En un caso así, a la regularidad básica que caracteriza a la estructura de preferencias se le denomina independencia de las preferencias. Preferencias bajo condiciones de incertidumbre: Si en el dominio existe incertidumbre, no bastara con determinar el valor de las funciones, sino que será necesario también considerar la estructura de las preferencias entre las loterías y comprender las propiedades resultantes en las funciones de utilidad. Como las matemáticas respectivas pueden resultar bastante complejas, representaremos algunos de los resultados más importantes para dar una idea de lo que puede realizarse.

13 Redes de Decisión Los tres nodos empleados son
Nodos Aleatorios (óvalos) Nodos de Decisión (rectángulos) Nodos de Utilidad (rombos) Se le conoce también como diagrama de influencia. En las redes de decisión se combinan las redes de creencia con tipos adicionales de nodos para acciones y utilidades. Una red de decisión esta representada la información sobre el estado actual del agente sus posibles acciones, el estado que resultara de las acciones que emprenda el agente así como la utilidad de dicho estado. Los tres nodos empleados son: v     Nodos Aleatorios (óvalos): representan variables aleatorias, exactamente como en el caso de redes de creencia. A cada nodo le corresponde una tabla de probabilidad condicional. v     Nodos de Decisión (rectángulos): representan puntos para los cuales puede decidirse que acción emprender. v     Nodos de Utilidad (rombos): representan la función de utilidad del agente. Los padres del nodo de utilidad son aquellas variables que describen el estado resultado que afecta directamente la utilidad. La tabla asociada es una fabulación directa de la utilidad.

14 Toma de Decisiones Complejas
Se examinan metodos para saber que hacer hoy, sabiendo que existe la posibilidad de actuar mañana

15 Ambientes para la Toma de decisiones
Ambientes Accesibles Ambientes Inaccesbibles Las decisiones complejas se deben tomar en el caso de los problemas de decisión secuencial, en donde la utilidad del agente depende de una secuencia de decisiones. Este tipo de problemas, que implican utilidades, incertidumbre y percepción, constituye una generalización de los problemas de búsqueda y planificación ambientes accesibles. En estos, las percepciones del agente en cada paso le permitirán identificar cual es el estado en que se encuentra. El total de correlaciones entre estados y acciones se conoce como política. Con base en esta, puede calcularse la utilidad esperada de las posibles historias ambientales producidas por dicha política. El problema, por tanto, no reside en calcular la secuencia de acciones optima, sino en calcular la política optima: es decir, aquella que produce la mayor utilidad esperada. ambientes inaccesibles, la percepción no aporta suficiente información para determinar el estado o las probabilidades de la transición correspondiente. En la literatura de la investigación de operaciones a este tipo de problemas se le conoce como problemas de decisión de Markov parcialmente observables o PDMPO. La forma adecuada de resolver los PDMPO consiste en calcular una distribución de probabilidades que abarque todos los estados posibles, tomando en cuenta todas las percepciones anteriores, y basar las decisiones en esta distribución.

16 Algoritmos para Calcular una Política Optima
Interación de Valores Interación de Política Interación de Valores Un algoritmo que sirve para calcular una política optima conocida como interacción de valores. La idea fundamental consiste en calcular la utilidad de cada uno de los estados y con base en estas utilidades, seleccionar una acción optima para cada uno de ellos. Lo difícil en el calculo es que no sabemos a que nos conducirá una acción determinada. Interación de Política El algoritmo de interación de política funciona escogiendo una política y luego calculando la utilidad de cada estado con base en dicha política. Luego actualiza la política correspondiente a cada estado utilizando las utilidades de los estados sucesores, lo que se repite hasta que es estabilizada la política. El paso en el cual los valores de la utilidad son definidos a partir de una determinada política es conocida como determinación de valor. La idea básica en que se apoya la interación de política, comparada con la interación de valores, es que la determinación de valores debe ser más sencilla que la interación de valores, puesto que la acción correspondiente a cada estado es definida por la política.

17 Redes de decisión Dinámica
Para convertir redes de creencia dinámica en redes de decisión dinámicas basta con añadir nodos de utilidad y nodos de decisión correspondientes a las acciones. El algoritmo de evaluación de las RDD básicamente es el mismo que el de las redes de decisión comunes. Para el peor de los casos la RDD calcula la utilidad esperada de las secuencias de decisión fijando los nodos de decisión y aplicando inferencia probabilística para calcular el estado final.

18 Gracias….


Descargar ppt "Incertidumbre Qué puede hacer un agente cuando las cosas no son tan claras como el cristal."

Presentaciones similares


Anuncios Google