INGENIERIA INFORMATICA Y BUSQUEDAS CON ADVERSARIOS

Slides:



Advertisements
Presentaciones similares
Ing. Victor Jaime Polo Romero
Advertisements

Búsqueda en árboles de juego
5. Estructuras no lineales estáticas y dinámicas
ESTRUCTURA DE DATOS Unidad 04 TDA no lineales - Árboles.
CUBO SERPIENTE Universidad de San Martín de Porres
Ejemplo 2: Reparto de 3 objetos indivisibles.
Inteligencia Artificial
Diseño y análisis de algoritmos
Inteligenica Artificial I Alejandro Permingeat Inteligencia Artificial de Russell y Norving 1° edición 1996 Parte II Capítulo V.
REDES SEMANTICAS Y BUSQUEDAS
IBD Clase 7.
ESTRUCTURA DE DATOS Unidad 04 Árboles BINARIOS DE BUSQUEDA.
EXCEL.
Tema 3: Juegos bipersonales
BENEMERITA UNIVERSIDAD AUTONOMA DE PUEBLA
Conceptos Hoja de cálculo. Concepto.
PARTE II: ALGORÍTMICA Tema 7. Ramificación y poda.
Inteligencia Artificial
Curso Inteligencia Artificial (30223) Problemas resueltos
Sesión sobre presentación de solicitudes de evaluación de la actividad investigadora a la CNEAI (16-XII-2013) Sesión sobre presentación de solicitudes.
Un nuevo algoritmo incremental IADEM-0
Preguntas tipo test (Tema I)
Inteligencia Artificial Búsqueda entre adversarios
BUSQUEDA EN JUEGOS DE ADVERSARIO Sección 1-4
Solución de problemas por búsqueda inteligente
Árboles balanceados AVL
Equipo # 1 Norma Pimentel Wendy Hernandez Julisa Javier Mario Tristán.
Inteligencia Artificial Resolver problemas mediante búsqueda
Almacenamiento y Recuperacion de Información TAD_ABB Ana Lilia Laureano Cruces Universidad Autónoma Metroplotiana.
Teoría de lenguajes y compiladores
Tema Nº4.
Inteligencia Artificial Resolver problemas mediante búsqueda
Inteligencia Artificial Gonzalo Villarreal Farah
Excel y 15 de julio de 2014.
Decisiones bajo Incertidumbre Teoría de Juegos
Trabajo presentado por: LUIS FERNANDO OBANDO ING
Optimización Combinatoria usando Algoritmos Evolucionistas Problemas de Optimización. Idea: Encontrar una solución "factible" y "óptima" de acuerdo a algún.
Capítulo 4 BUSQUEDA INFORMADA.
PILAS, COLAS, RECURSIVIDAD.
ADMINISTRACION DE NEGOCIOS IV
Solución de problemas por Búsqueda
Optimización, Búsqueda Heurística
TEMA 4 JUEGOS SECUENCIALES CON INFORMACIÓN PERFECTA. Manual: cap. 6
Agentes de resoluciones d problemas Parte I. Un agente puede adoptar una meta o un propósito para satisfacer.
Diseño y análisis de algoritmos
Parte I. Estructuras de Datos.
Diseño y análisis de algoritmos
Cap. 2 – Movimiento en Una Dimension
UNIVERSIDAD AUTONOMA SAN FRANCISCO
Algoritmo Poda Alpha-Beta
RIESGO Y ESTRATEGIA. HASTA AHORA HEMOS EVALUADO VARIABLES QUE PUEDEN SER CONSIDERADAS COMO CIERTAS (SALVO EN EL CASO DE INFORMACION ASIMETRICA) SIN EMBARGO.
Parte II. Algorítmica. 5. Backtracking. 1. Análisis de algoritmos.
Diseño y análisis de algoritmos
Análisis y Diseño de Algoritmos
Estructura de Datos M.C. José Andrés Vázquez Flores FCC/BUAP
. Juegos.
Inteligencia Artificial Búsqueda entre adversarios Primavera 2008 profesor: Luigi Ceccaroni.
INTRODUCCIÓN A JUEGOS (BÚSQUEDA CON ADVERSARIOS)
Toribio Sarmiento Miguel Sesarego Cruz Rosmery. Desde la aparición de las civilizaciones, los juegos han ocupado la atención de las facultades intelectuales.
BUSQUEDA EN UN ESPACIO DE ESTADOS.
ARBOLES GENERALIZADOS
Inteligencia Artificial
TEMA: DECISIONES BAJO RIESGO –TEORIA DE JUEGOS Ing. Larry D. Concha B.
 Consiste en la elección del mejor movimiento para cada jugador, es decir la máquina para quien programaremos el sistema tratará de maximizar las oportunidades.
Búsqueda de ascensión de colinas (BLv)
Ejercicio 1 Eliminación iterativa de estrategias estrictamente dominadas Resuelva, mediante la eliminación iterativa de estrategias estrictamente dominadas,
Equipo # 1 Norma Pimentel Wendy Hernandez Julisa Javier Mario Tristán.
Implementación de algoritmo para juegos. Algoritmo Minimax  El algoritmo de minimax en simples palabras consiste en la elección del mejor movimiento.
Poda alfa-beta Problema de la búsqueda minimax: el número de estados que tiene que examinar es exponencial con el número de movimientos. El exponente no.
Transcripción de la presentación:

INGENIERIA INFORMATICA Y BUSQUEDAS CON ADVERSARIOS SISTEMAS INTELIGENCIA ARTIFICIAL BUSQUEDAS CON ADVERSARIOS Sesión 5

Árboles y búsqueda con adversario Los entornos competitivos, en los cuales los objetivos del agente están en conflicto, dan ocasión a problemas de búsqueda entre adversarios, a menudo conocido como juegos.

Ing. Victor Jaime Polo Romero La manera natural de responder un juego es mediante un árbol de juegos que es un tipo especial de árbol semántico en los que los nodos representan configuraciones de tableros Ing. Victor Jaime Polo Romero

Ing. Victor Jaime Polo Romero y las ramas indican como una configuración puede transformarse en otra mediante un solo movimiento. Ing. Victor Jaime Polo Romero

Ing. Victor Jaime Polo Romero Por supuesto existe un giro especial en el hecho de que las decisiones son tomadas por dos adversarios que toman una decisión a la vez. Ing. Victor Jaime Polo Romero

Un juego se define formalmente como una clase de problemas de búsquedas con los componentes siguientes:

Ing. Victor Jaime Polo Romero El estado inicial: Que incluye la posición del tablero e identifica al jugador que mueve. Ing. Victor Jaime Polo Romero

Ing. Victor Jaime Polo Romero Una función sucesor: Que devuelve una lista de pares (movimiento, estado), indicando un movimiento legal y el estado que resulta. Ing. Victor Jaime Polo Romero

Ing. Victor Jaime Polo Romero Un test Terminal: Que determina cuando se termina el juego. A los estados donde el juego se ha terminado se les llama estados terminales. Ing. Victor Jaime Polo Romero

Una función de utilidad: También llamada función objetivo o función de rentabilidad, que da un valor numérico a los estados terminales. En el ajedrez, el resultado es un triunfo, pérdida o empate, con valores +1, -1 o 0. Ing. Victor Jaime Polo Romero

Un árbol (parcial) de búsqueda para el juego de tres en raya.

PROCEDIMIENTO MINIMAX En una búsqueda normal, la solución óptima sería una secuencia de movimientos que conducen a un estado objetivo.

Ing. Victor Jaime Polo Romero En un juego, por otra parte, MIN tiene algo que decir sobre ello. MAX por lo tanto debe encontrar una estrategia contingente, que especifica el movimiento de MAX en el estado inicial, después de los movimientos de MAX en los estados que resultan de cada respuesta posible de MIN, después los movimientos de MAX en los estados que resultan de cada respuesta posible de MIN de los anteriores movimientos, etc. Ing. Victor Jaime Polo Romero

3 MAX A a1 a3 a2 MIN 3 B 2 C 2 D b3 b1 b2 c1 d1 d2 c2 d3 c3 3 12 8 2 4 6 14 5 2 El mejor movimiento de MAX en la raíz es a1, porque conduce al sucesor con el valor minimax mas alto, y la mejor respuesta de MIN es b1, por que conduce al sucesor con el valor minimax mas bajo.

Poda alfa-beta Problema de la búsqueda minimax: el número de estados que tiene que examinar es exponencial con el número de movimientos. El exponente no se puede eliminar, pero se puede dividir en la mitad. Es posible calcular la decisión minimax correcta sin mirar todos los nodos en el árbol. La poda alfa-beta permite eliminar partes grandes del árbol, sin influir en la decisión final.

[-, +] (a) A [-, 3] C D B 3 (a) La primera hoja debajo de B tiene el valor 3. De ahí B, que es un nodo MIN, tiene un valor de cómo máximo 3.

[-, +] (b) A [-, 3] C D B 3 12 (b) La segunda hoja debajo de B tiene el valor 12; MIN evitara este movimiento, entonces el valor de B es todavía como máximo 3.

[3, +] (c) A [3, 3] C D B 3 12 8 (c) La tercera hoja debajo de B tiene el valor 8; hemos visto a todos los sucesores de B, entonces el valor de B es exactamente 3. Ahora, podemos deducir que el valor de la raíz es al menos 3., por que MAX tiene una opción digna de 3 en la raíz.

[3, +] (d) A [3, 3] [- , 2] C D B 3 12 8 2 (d) La primera hoja debajo de C tiene el valor 2. De ahí, C que es un nodo MIN, tiene un valor de cómo máximo 2. Pero sabemos que B vale 3, entonces MAX nunca elegiría C. Por lo tanto, no hay ninguna razón en mirar a los otros sucesores de C. Este es un ejemplo de la poda Alfa-Beta.

[3, 14] (e) A [- , 2] [- , 14] [3, 3] C D B 3 12 8 2 14 (e) La primera hoja debajo de D tiene el valor 14,entonces D vale como máximo 14. Este todavía es mas alto que la mejor alternativa de MAX (es decir, 3), entonces tenemos que seguir explorando a los sucesores de D. Note también que ahora tenemos límites sobre todos los sucesores de la raíz, entonces el valor de la raíz es como máximo 14.

[3, 3] (f) A [2,2] [3, 3] [- , 2] C D B 3 12 8 2 14 5 2 (f) El segundo sucesor de D vale 5, así que otra vez tenemos que seguir explorando. El tercer sucesor vale 2, así que ahora D vale exactamente 2. La decisión de MAX en la raíz es moverse a B, dando un valor de 3.

Poda alfa-beta Los dos parámetros alfa y beta describen los límites sobre los valores que aparecen a lo largo del camino: = el valor de la mejor opción (el más alto) que se ha encontrado hasta el momento en cualquier punto del camino, para MAX = el valor de la mejor opción (el más bajo) que se ha encontrado hasta el momento en cualquier punto del camino, para MIN La búsqueda alfa-beta actualiza el valor de  y  según se va recorriendo el árbol y termina la recursión cuando encuentra un nodo peor que el actual valor  o  correspondiente.

{ } MAX Si Vi >  modificar  Si Vi   poda  Retornar  Vi MIN { } Si Vi <  modificar  Si Vi   poda  Retornar  Vi Las cotas  y  se transmiten de padres a hijos de 1 en 1 y en el orden de visita de los nodos.  es la cota inferior de un nodo max.  es la cota superior de un nodo min.