Algoritmo Poda Alpha-Beta

Slides:



Advertisements
Presentaciones similares
INGENIERIA INFORMATICA Y BUSQUEDAS CON ADVERSARIOS
Advertisements

Búsqueda en árboles de juego
Inteligenica Artificial I Alejandro Permingeat Inteligencia Artificial de Russell y Norving 1° edición 1996 Parte II Capítulo V.
Conclusiones capítulo 5 Cátedra. El diseño de automóviles culmina en las carreras de Fórmula 1 El diseño de programas de la IA culmina en los juegos Dedicarse.
Inteligencia Artificial
Inteligencia Artificial Búsqueda entre adversarios
BUSQUEDA EN JUEGOS DE ADVERSARIO Sección 1-4
Equipo # 1 Norma Pimentel Wendy Hernandez Julisa Javier Mario Tristán.
Capítulo 4 BUSQUEDA INFORMADA.
Diseño y análisis de algoritmos
Algoritmo Poda Alpha-Beta
Parte II. Algorítmica. 5. Backtracking. 1. Análisis de algoritmos.
. Juegos.
Inteligencia Artificial Búsqueda entre adversarios Primavera 2008 profesor: Luigi Ceccaroni.
INTRODUCCIÓN A JUEGOS (BÚSQUEDA CON ADVERSARIOS)
Toribio Sarmiento Miguel Sesarego Cruz Rosmery. Desde la aparición de las civilizaciones, los juegos han ocupado la atención de las facultades intelectuales.
 Consiste en la elección del mejor movimiento para cada jugador, es decir la máquina para quien programaremos el sistema tratará de maximizar las oportunidades.
Análisis de los algoritmos Unidad 7. Análisis La resolución práctica de un problema – algoritmo o método de resolución – y por otra un programa o codificación.
Javier Benavides Pañeda
CAUSALIDAD Y VALIDEZ EN LOS ESTUDIOS EPIDEMIOLÓGICOS.
Búsqueda con Adversarios Capítulo 6 Sección 1 – 4.
Tipos de errores Error de escala Error sistemático Error aleatorio Error total.
Cuando el número de posibles resultados de un experimento es finito, su espacio muestral es finito y su cardinal es un número natural. Si el experimento.
8-Puzle consiste en un tablero cuadrado (3x3) en el que hay situados 8 bloques cuadrados numerados (con lo cual se deja un hueco del tamaño de un bloque).
BÚSQUEDA DE SOLUCIONES Soluciones no Informadas (cont.) Dra. Myriam Hernández A.
Inteligencia artificial tema: “Chinook”
Teoría de Juegos Introducción Dixit & Skeath, 1,2.
Chinook: el juego de damas invencible
DISEÑO EN CUADRADO LATINO Y GRECOLATINO
MANEJO DE TEXTO Y OBJETOS AVANZADOS ENCABEZADOS Y PIES DE PÁGINA
VALOR DE LA INFORMACION
Articulación entre ciclos: Cálculo Mental y Juegos
Trabajo de Investigación
Árboles de Decisión Son modelos gráficos empleados para representar las decisiones secuenciales, así como la incertidumbre asociada a la ocurrencia de.
DEEP BLUE Deep Blue la primera SUPERCOMPUTADORA que venció
En INCERTIDUMBRE No se conocen las probabilidades de ocurrencia de los estados naturales, por lo tanto, hay que recurrir a criterios empíricos para tomar.
Etapas de una investigación
Guía de Ejercicios 3: D&AA Universidad Viña del Mar 30/9/2002
TAD’s ARBOLES GENERALIZADOS
ESTADÍSTICA INFERENCIAL Elaborado por: Mg. YOANDRY RIVERO PADRON TERCER SEMESTRE Docente: Mg. Dorenis Mota.
Trabajo de Investigación del software Deep Blue
PENSAMIENTO MATEMÁTICO,10 ESTRATEGIAS PARA ESTIMULAR SU DESARROLLO
Modelo de 3 capas. Qué es la arquitectura de una aplicación? La arquitectura se refiere a la forma en la que es diseñada tanto física como lógicamente.
ESPERANZA MATEMÁTICA Una forma de mejorar nuestras decisiones.
LINEAS DE ESPERA.
Toribio Sarmiento Miguel Sesarego Cruz Rosmery
Equipo # 1 Norma Pimentel Wendy Hernandez Julisa Javier Mario Tristán.
ÁRBOLES El árbol es una estructura de datos muy importante en informática y en ciencias de la computación. Los árboles son estructuras no lineales,
Excel.
Análisis de redes. 3.4 Problema de flujo máximo.
Búsqueda por profundidad iterativa
GIOVANNY ANDRES ARENAS UNIVERSIDAD DE IBAGUE-COREDUCACIÓN
Árboles clase 6 Apoyo de Práctica. Resumen ●Árboles ○Concepto ○Características ○Dinámica ○Recorridos o barridos. ●Ejercicio Sugerido.
Estrategias Mixtas En teoría de juegos una estrategia mixta, a veces también llamada estrategia mezclada (del nombre en inglés mixed strategy), es una.
ÁRBOLES ESTRUCTURA DE DATOS II ING. CARLOS ALBERTO PULLAS.
Agentes que planifican. 1. Introduccion En la actualidad todas la mayoría de actividades en un empresa o compañía, como en el hogar o el medio ambiente.
 La minería de datos o exploración de datos (es la etapa de análisis de "Knowledge Discovery in Databases" o KDD) es un campo de la estadística y las.
Inteligencia Artificial
AXIOMAS DE ARROW JAIMES GUTIERREZ LINDA KAREN PALOMA ADRIANA FUENTES VILCHIS.
Excel. Microsoft Office Excel, mejor conocido sólo como Microsoft Excel, es una aplicación para manejar hojas de cálculos. Este programa fue y sigue siendo.
Equipo 4 ÁRBOL DE DESICIÓN. UN ÁRBOL DE DECISIÓN:  Es una forma grafica y analítica para representar eventos o sucesos que puedan surgir a partir de.
Estructura de los sistemas Operativos 1. Componentes de un sistema operativo  Administración de procesos  Administración de memoria  Subsistema de Entrada/Salida.
Algoritmos de caminos más cortos
CONCEPTOS BASICOS DE MEDICION Sesión 7. UNIDADES, VARIABLES, VALORES Y CONSTRUCTOS.
TÉCNICAS DE BÚSQUEDA Y SUS APLICACIONES. Introducción  ¿Qué son las técnicas de búsqueda y cuáles son sus elementos?  Tipos de solucionadores - Búsqueda.
Clase Reglas de Decisión Alternativas Teoría de la Decisión Lic.Santiago Tagle CRITERIO DE WALD Bajo la alternativa a i, el peor resultado posible que.
Implementación de algoritmo para juegos. Algoritmo Minimax  El algoritmo de minimax en simples palabras consiste en la elección del mejor movimiento.
Poda alfa-beta Problema de la búsqueda minimax: el número de estados que tiene que examinar es exponencial con el número de movimientos. El exponente no.
Espacio de estados: un problema se divide en un conjunto de pasos de resolución desde el inicio hasta el objetivo. Los estados y su relación de accesibilidad.
HISTORIA GEOGRAFÍA Y ECONOMÍA La economía de mercado.
Transcripción de la presentación:

Algoritmo Poda Alpha-Beta Inteligencia Artificial Algoritmo Poda Alpha-Beta

Información Imperfecta. JUEGO DE INSPECCION - Es determinístico. GUERRA MARINA – No vemos el tablero del adversario. No hay dados o naipes. Es determinístico.

Decisiones Imperfectas. - Suponer que el espacio de problema es demasiado grande como para llegar a los nodos terminales - interrumpir la búsqueda en algún nivel y aplicar evaluaciones heurísticas a las hojas polinomios lineales ponderados - forma habitual de adaptarse a evaluaciones heurísticas - pesos o ponderaciones ¿por aprendizaje? - reglas sobre cuándo interrumpir la búsqueda profundidad fija profundización iterativa hasta cuando el tiempo permitido queda satisfecho expandir con búsqueda secundaria nodos no quietos - teoría de la EXTENSIÓN SINGULAR irresoluble problema del horizonte (peón coronado)

Árbol de Juego con turnos para los dos adversarios - Aplicación de la heurística alfa-beta.

Poda alfa-beta. Omitir la expansión de nodos que por sus valores no pueden ser los mejores (peores)- - valor del nodo MAX (alfa) menor que el más alto hasta este momento - omitir nodo - valor del nodo MIN (beta) mayor que el nodo más bajo hasta el momento - omitir nodo - en mejor caso, alfa-beta permite búsqueda dos veces más profunda - ordenamiento de los operadores, resultante del conocimiento o experiencia

Poda alfa-beta. UNICAMENTE IMPORTA EL ORDEN Y NO LOS VALORES EXACTOS. LA PODA NO AFECTA AL RESULTADO FINAL.

Poda alfa-beta Alfa-beta es una mejora del algoritmo minimax que evita revisar porciones dominadas del árbol, que no pueden proveer información útil sobre la jugada siguiente. Alfa-beta es un algoritmo BPP, rama y cota, que avanza por el árbol en un orden ya fijado (p.ej., de izquierda a derecha) y va usando la información de la valuación de los nodos hoja para podar ramas dominadas que no sirven para cambiar el valor minimax del nodo inicio (la jugada inminente). .

Poda alfa-beta. ESTRUCTURAS DE DATOS. Dos variables deben recordarse a lo largo de la búsqueda. Alfa, que es el límite inferior encontrado hasta ese momento, y beta, que es el límite superior. En los niveles maximizantes donde MAX debe optar, solo beta se usa para podar la búsqueda y en los niveles minimizantes donde MIN debe optar, solo alfa se usa para podar. Alfa-beta es el algoritmo más usado para buscar en árboles de juegos determinísticos. .

Origen del nombre alfa Alfa es el nombre del mejor valor m, para MAX, encontrado hasta ahora en su ruta de búsqueda en un nivel de MIN *Si n es peor que alfa, MAX lo evitará  podar esa rama punteada *m y n son nodos de MIN

Algoritmo de Búsqueda Alfa-Beta. Corresponde a la combinación de tres aportes: ejecutar MINIMAX + mantener recordados alfa y beta + podar

Algoritmo de Búsqueda Alfa-Beta.

Comportamiento de los nuevos Algoritmos de Búsqueda en Juegos. Aproximadamente, alfa-beta ha de buscar solamente b3/4 de los b movimientos posibles desde una dada posición de juego. Alternativamente, esto significa que la profundidad de búsqueda se puede incrementar por un factor = log b / log B ~= 4/3 por encima de una búsqueda exhaustiva minimax . B es aquí el factor de ramificación efectivo. Si los sucesores se ordenan a la perfección (definido como que al usar alfa-beta la búsqueda es mínima), alfa-beta examina 2bd/2 - 1 posiciones de juego. Así tenemos B = b ............en búsquedas exhaustivas, B ~= b3/4 .....en alfa-beta ordenando al azar; y B = b1/2 .......en alfa-beta ordenando perfectamente.

Clasificación de Juegos con adversario y turnos. Tipos de Juegos Determinísticos, información perfecta: Arriba, Izq D  Determinísticos, información imperfecta Arriba, Der Aleatorios, información perfecta: Abajo, Izq Aleatorios, A  información imperfecta: Abajo, Der Info Perf Info Imp Juego de Inspección Guerra marina Scrabble sin pozo Ta-te-ti Otelo=Reversi Ajedrez--Go Truco mental (sin naipes) Back gamón Chaquete Monopolio Dominó Truco Bridge Póquer Scrabble con pozo

Juegos con una componente aleatoria (moneda, dados, etc.). Nodos aleatorios (además de los nodos min/max) El árbol se incrementa desmesuradamente porque debajo de la fila MAX aparece una nueva fila con las posibilidades aportadas por los dados, debajo de la cual aparece una fila MIN y de nuevo la fila de posibles combinaciones de dados. Es una tarea de búsqueda muy compleja, p. ej.: un nodo para cada posibilidad (por ejemplo, puntos del dado) con su probabilidad asociada. calcular el valor esperado (idem MAX e idem MIN) para cada posibilidad (p.ej., de un dado) - con su probabilidad asociada - y reemplazar el valor Minimax del algoritmo. Diferencias absolutas en la función de evaluación pueden afectar cual movimiento elegir. Posibles podas si los valores están acotados.

Conclusiones Mejoras pretendidas en la forma de encarar los juegos: usar distribuciones de probabilidad sobre valores posibles en lugar de valores crudos para incrementar la discriminación del significado de diferencias en valores no fijarse tanto si es legal una expansión de nodos, sino si muestra utilidad. combinar dos proyectos: el de la búsqueda de victoria y el de satisfacer una meta “secundaria”, p.ej., capturar la reina en ajedrez. Equivale a tener una estrategia. ¿Extensión del sistema Gala por parte de los bots jugadores? – 1) mejores los juegos heurísticamente adaptados a un ambiente concreto. 2) competencia de la máquina consigo misma a la manera del TD-gammon.

Conclusiones. El diseño de programas de la IA se concreta en los juegos Durante el diseño de un juego surgen temas muy importantes-Samuel (1959) mide en el juego de damas la DIFERENCIA entre el resultado del cálculo de EVAL directamente de una posición y el resultado PREDICHO de una exploración hacia niveles más profundos. Esa DIFERENCIA implica la posibilidad de un aprendizaje por refuerzo de EVAL, mejorandolo y abriendo campos a la curiosidad con cada nuevo aprendizaje.

Conclusiones. Cada nueva táctica creada proporciona información sobre buen o mal éxito de las reglas tácticas de búsqueda, cada acción del oponente provee información sobre buen o mal éxito de las inferencias probabilísticas.

BIBLIOGRAFIA http://www.angelfire/oh4/ohcop/ClaseCap7nu.ppt http://www.angelfire/oh4/ohcop/ayuda55.html