La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Teoría de Juegos Sesión #3 Juegos Simultáneos de Estrategias Mixtas

Presentaciones similares


Presentación del tema: "Teoría de Juegos Sesión #3 Juegos Simultáneos de Estrategias Mixtas"— Transcripción de la presentación:

1 Teoría de Juegos Sesión #3 Juegos Simultáneos de Estrategias Mixtas
Dixit & Skeath, 5 Mas-Colell, 8

2 Repaso Juegos Simultáneos
Criterios para resolver juegos simultáneos de información imperfecta (conozco los pay-offs míos y de mi oponente, pero no soy capaz de observar su decisión) Eliminación sucesiva de estrategias estrictamente dominadas Eliminación de estrategias que nunca son una mejor respuesta Eliminación sucesiva de estrategias débilmente dominadas lleva a resultados distintos según el orden de eliminación, cuando existe más de una estrategia débilmente dominada – No es un criterio de solución válido Equilibrio de Nash en juegos simultáneos Concepto de mejor respuesta en términos discretos y contínuos (curvas de reacción) – Equilibrio de Cournot (Q), y Bertrand (P) – Funciones contínuas de mejor respuesta no siempre son lineales

3 Estrategias Minimax en Juegos de suma-cero, en donde no existe dominancia
OFFENSE Run Pass DEFENSE 2 Short Pass Medium Pass Blitz 6 5 5.6 4.5 13 10.5 1 Long Pass 10 3 -2 min = 2 min = 5.6 min = 1 min = -2 max = 10 max = 5.6 max = 13

4 Estrategias Minimax Búsqueda de Equilibrios de Nash vía Estrategias Minimax Jugadores pesimistas sobre la posibilidad de conseguir un buen resultado Al ser el juego uno de suma-cero, el otro está tratando de implementar su mejor estrategia que – al mismo tiempo – es la peor para mí – No utilizar minimax para encontrar equilibros en juegos que no son suma cero Existe equilibrio de Nash si el payoff más grande de su columna es también el más pequeño de su fila

5 Sin Equilibrios de Nash en Estrategias Puras
SELES DL CC HINGIS 50 80 90 20 min = 50 min = 20 max = 90 max = 80 Quiero mantener al otro en incertidumbre (guessing) – Eso es precisamente lo que se logra escogiendo estrategias en forma random siguiendo una distribución conocida!

6 ¿Qué es una estrategia mixta?
Establece que la estrategia a seguir por un jugador va a ser escogida entre sus estrategias puras siguiendo una distribución específica de probabilidades Reglas que le indican a un jugador cómo usar sus estrategias puras cierto porcentaje de las veces que se repite el juego Todo juego simultáneo no necesariamente tiene un equilibrio en estrategia pura, pero siempre tiene un equilibrio en estrategia mixta: “Si él(la) la tira a pegar con X probabilidad, mi mejor respuesta es tirarla a pegar con probabilidad Y” Estrategia pura es un sub-caso de estrategia mixta, en donde alguna(s) estrategia(s) tienen probabilidad cero de ocurrir, por eso el equilibrio de Nash en estrategia mixta es un concepto más general que el equilibrio de Nash en estrategia pura

7 Equilibrio(s) de Nash en Estrategias Mixtas: La perspectiva de Seles (Filas)
DL CC HINGIS 50 80 90 20 min = 50 min = 20 min = ? p + 90(1 - ) -Mix + 20(1 -

8 Equilibrio(s) de Nash en Estrategias Mixtas: La perspectiva de Seles (Filas)
Seles’s Success (%) 90 0.7 1 80 50 62 20 Against Hingis playing DL and CC p -Mix Seles’s p -Mix

9 ¿Qué sucede si Seles juega DL 70% de las veces?
Su payoff esperado es 62%, independientemente de lo que haga Hingis En ese punto, Hingis no puede explotar la jugada de Seles para sacar ventaja (y poner en esa misma desventaja a Seles, porque el juego es suma-cero)

10 Equilibrio(s) de Nash en Estrategias Mixtas: La perspectiva de Hingis (columnas)
SELES DL CC HINGIS 50 q -Mix 80 + 80(1 - ) 90 20 max = 90 max = 80 max = ? + 20(1 -

11 Equilibrio(s) de Nash en Estrategias Mixtas: La perspectiva de Hingis (columnas)
Seles’s Success (%) Hingis’s q -Mix 0.6 1 90 50 62 80 20 When Seles plays DL and CC

12 ¿Por qué p=70%, q=60% es un equilibrio de Nash?
Si cada jugador escoge un p o q distinto a ese, el otro jugador tiene una estrategia pura que da mayor valor esperado, por tanto ese valor distinto a p o q no puede ser un equilibrio Esas probbilidades (p y q) dejan a cada jugador indiferente ante lo que el otro pueda hacer, bajo esas probabilidades, no hay nada que el otro pueda hacer para cambiar mi payoff, porque mi payoff esperado es independiente de su estrategia El equilibrio eleva el valor de maximin y disminuye el de minimax, ambos jugadores están mejor (en promedio) que con sus estrategias puras En estrategia pura el minimax era diferente del maximin, por eso no existía equilibrio, estas probabilidades hacen el minimax igual al maximin, y por tanto constituyen un equilibrio de Nash

13 Curvas de Mejores Respuestas y Equilibrio
0.7 p q 1 0.6 EQ. NASH ESTRATEGIA MIXTA ES UNICO NO HAY EQUILIBRIOS DE ESTRATEGIA PURA

14 Incluye estrategias puras en donde p=0, ó p=1
Equilibrio de Nash en estrategias mixtas para Juegos que no son suma-cero: The Chicken Game JAMES Swerve Straight DEAN q -Mix - (1 - ) = - 1, (1 - ) - 2(1 - ) = 3 - 2, - - 2 p 1 - , - 1 0, 1, -1 -1, 1 -2, -2 Incluye estrategias puras en donde p=0, ó p=1

15 Diagramas de pay-off para encontrar el equilibrio de Nash en estrategias mixtas
Dean’s Payoff Upper envelope James’ p -Mix When Dean plays Straight and Swerve 1 -1 -2 q When James plays -0.5 0.5

16 Curvas de Acción y Reacción de Dean y James:
Existen tres puntos en común 0.5 p q 1 DEAN JAMES El equilibrio de Nash de estrategia mixta encontrado no es único Existen dos equilibrios de estrategia pura (que son equilibrios de estrategia mixta en donde p=0, q=1; y p=1, q=0) y uno de estrategia mixta (p=q=0.5)

17 Algunas observaciones sobre el equilibrio de Nash de estrategias mixtas encontrado
A pesar de que el equilibrio ha sido hallado a través del método de “mantener al oponente indiferente”, esa no es la principal razón que motiva la acción de los jugadores – Cada jugador está tratando de obtener el máximo posible para sí dado que desconoce la decisión de su oponente, y el equilibrio de Nash de estrategia mixta es una consecuencial accidental de esa búsqueda El equilibrio de Nash de estrategia mixta da valores esperados a cada jugador de –0.5 – Existe una combinación de estratagias puras que da más a cada uno (Swerve-Swerve) : (0,0) – pero esa combinación no es un equilibrio de Nash Nótese que en el equilibrio de Nash de esraegias mixas aún existe un 25% de probabilidad de ocurrencia del escenario “desastre”

18 Algunas observaciones sobre el equilibrio de Nash de estrategias mixtas encontrado
50% de probabilidad de “swerve” se puede lograr lanzando una moneda OJO: Coordinación randomizada (aleatoria), si el juego es repetido, lanzamos la moneda, si cae cara yo me aparto (Swerve) y tu sigues derecho (Straight), si cae sello viceversa – Si se repite varias veces es de esperarse que cada uno sea considerado como cobrade (chicken) 50% de las veces Ese acuerdo produciría un valor esperado de 0 (50% * % * - 1), mayor al del equilibrio de Nash de estrategia mixta Coordinación aleatoria de valores esperados al menos tan buenos como Swerve-Swerve Cuando James escoge p=0.5, está haciendo a Dean indiferente entre Swerve y Right, pero para James sería mejor que Dean jugara Swerve (0.5 > - 1.5) – Encontrar la “p” que hace indiferente a mi oponente no me hace a mí indiferente, porque el juego NO es suma-cero

19 Equilibrio de Nash en estrategias mixtas para Juegos que no son suma-cero: The Battle of two Cultures SCIENCE FACULTY Lab Theater HUMANITIES FACULTY q -Mix 2 , 1 - 2(1- ) p 2(1 - 2, 1 0, 1,

20 Diagramas de pay-off para encontrar el equilibrio de Nash en estrategias mixtas
Humanities’ Payoff Science’s p -Mix 1 2 / 3 Humanities choose Theater and Lab q-Mix Sciences

21 Curvas de Acción y Reacción de Scientist y Humanists:
Existen tres puntos en común 1 q p 2 / 3 1/3

22 Algunas observaciones
Cuando ambos grupos hacen su jugada de acuerdo con las probabilidades encontradas, esa combinación de probabilidades constituye un equilibrio de Nash Al igual que en el juego anterior, los payoffs esperados de esa combinación de estrategias dan un payoff esperado (0.66; 0.66) que es menor al payoff que alcanzarían lanzando una moneda y coordinando para hacer el teatro cuando salga cara, y el laboratorio cuando salga sello (payoff esperado 0.50)! – Pero ese resultado en este juego es poco probable dado que se juega UNA SOLA VEZ –

23 Equivalencia entre los métodos de “prevenir explotación” (Seles-Hingis) y “mantener al oponente indiferente” ROW Left Right COLUMN q -Mix Up p pa + (1 - ) c , pA C Down a, A c, d, D pb d pB b, B qc qC qa b qA

24 Este método es más fácil de lo que parece, y es una alternativa fácil cuando se tiene un juego 2x2
DEAN Swerve Straight Swerve 0, -1, 1 JAMES Straight 1, -1 -2, -2

25 “Odds” es el juego (punto) Seles - Hingis
DL CC HINGIS 50 80 90 20 = -40 = -60 = -30 = -70

26 Cambios contra-intuitivos en equilibrios mixtos cuando cambia la estructura de payoff
SELES DL CC HINGIS q -Mix p 30 90 + 90(1 - ) 80 20 + 20(1 - + 80(1 - En la estructura de pagos arriba se ha supuesto que Hingis ha mejorado su capacidad de respuesta a golpes “down the line” (DL), disminuyendo la probabilidad de que Seles gane un punto cuando Hingis cubre esa posición de 50% a 30% P=7/12 ; Q=0.50 ; Payoff esperado (55, -55)

27 Algunos resultados contra-intuitivos
A primera vista se podría decir que Hingis debería inclinarse ahora más por cubrir DL – porque ha mejorado su capacidad de respuesta y disminuido la probabilidad de Seles de ganar el punto si golpea hacia ese lado y Hingis cubre ese lado – pero q bajó de 60% en el escenario anterior a 50% Seles SABE que Hingis ha mejorado su respuesta DL, y también debe revisar sus probabilidades, golpeando DL 58% de las veces en lugar de 70% Dado que es más probable (en relación al caso anterior) que Seles golpee CC (antes era 30%, ahora es 47%), Hingis debe también corregir sus probabilidades para reflejar esa información Las probabilidades resultan contra-intuitivas, pero los payoffs esperados no: Hingis ha aumentado su probabilidad de ganar el punto de 38% a 45%, y Seles ha bajado su probabilidad de ganar el punto de 62% a 55% Jugar aleatoriamente significa jugar aleatoriamente, es decir, tener un sistema de decisión que genera respuesta en función de p y q óptimos

28 Utilizando estrategias mixtas en la práctica
Jugar aleatoriamente significa jugar aleatoriamente, es decir, tener un sistema de decisión que genera respuesta en función de p y q óptimos Las estrategias mixtas pueden producir resultados pobres para los jugadores en un porcentaje importante de las ocasiones en que se repite el juego – Por esta razón es necesario reconocer y dejar claro que aunque la estrategia óptima es la mixta, es necesario estar preparado para enfrentar escenarios de bajos pay-offs o aún desastrosos (straight-straight en “Chicken”, tiene 25% de probabilidades de ocurrir) Nótese que una vez que mi oponente decida jugar su estrategia de equilibrio mixto, es igual la respuesta que yo dé, el payoff esperado para mis jugadas siempre será el mismo – Así que no tengo necesidad de jugar mi estrategia mixta, podría jugar una estrategia pura – El detalle de ésta forma de razonar es que si juego estrategias puras y NO mi propia estrategia mixta de equilibrio, mi oponente se podría dar cuenta y jugar también la estrategia pura que es mejor respuesta a mi estrategia pura, en lugar de su estrategia mixta óptima, por lo que no estaríamos en equilibrio El equilibrio ocurre cuando AMBOS juegan su estrategia mixta

29 Estrategias mixtas cuando un jugador tiene más de dos estrategias puras
SELES DL CC HINGIS q -Mix Lob 50 90 70 80 20 + 20(1 - ) + 80(1 - 60 p 1 + 20 2 + 60(1 - - + 90 + 70(1 -

30 Diagrama de pay-off para Hingis escogiendo “q”
Seles’s Success (%) Hingis’s q -Mix 0.5 1 90 50 70 When Seles plays DL, Lob, and CC 0.667 0.6 80 20 60

31 Si q=0.5, los payoffs para seles de jugar DL, LOB, o cualquier combinación de las dos (65%), son mayores que los payoff de jugar CC (55%) Elimino CC SELES DL CC HINGIS q -Mix p 50 70 1 + 70(1 - ) 80 60 + 60(1 - + 80(1 - Lob

32 Diagrama de pay-off para Hingis (mini-max) (Si q =0.5)
Seles’s Success (%) p -Mix 0.25 1 80 50 65 70 60 Against Hingis playing DL and CC

33 Si q=0.66, los payoffs para seles de jugar CC, LOB, o cualquier combinación de las dos (66%), son mayores que los payoff de jugar DL (60%) Elimino DL SELES DL CC HINGIS q -Mix p 90 70 1 + 70(1 - ) 20 60 + 60(1 - + 20(1 - Lob Al eliminar DL, CC se vuelve estrictamente dominante para Hingis, de manera que noi hay una combinación de Seles que haga a Hingis indiferente

34 Diagrama de pay-off para Hingis (mini-max) (Si q =0.6666)
Seles’s Success (%) p -Mix 1 90 20 70 60 Against Hingis playing DL and CC

35 Si q=0.666, no existe un valor de p que haga a Hingis indiferente
Sólo existe un equilibrio de Nash de estrategia mixta, q=0.50, p1=0.25, p2=0 Cuando q=0.6666, no existe un valor de p que pueda hacer indiferente a Hingis, p1=0, pero entonces al Seles NO jugar DL CC se vuelve estrictamente dominante para Hingis, por lo que no existe un segundo punto de equilibrio de estrategia mixta Tampoco lo existe en estrategia pura, porque observando el juego simultáneo completo, CC no es dominante para Hingis Para que se dé el equilibrio de Nash de estrategia mixta tiene que haber un par de estrategias que hagan a los oponentes indiferentes!

36 Caso de Excepción: Cuando los payoffs son tales que las estrategias de un jugador convergen para cierto q HINGIS DL CC q -Mix DL 50 80 50 q + 80(1 - q ) CC 90 20 90 q + 20(1 - q ) SELES Lob 70 50 70 q + 50(1 - q ) 50 p + 90 p 80 p + 20 p p -Mix 1 2 1 2 + 70(1 - p - p ) + 50(1 - p - p ) 1 2 1 2

37 Diagramas payoff Seles
Seles’s Success (%) Hingis’s q -Mix 0.6 1 90 50 62 80 20 When Seles plays DL, Lob, and CC 70

38 P-mix no se puede determinar con exactitud, pero si sé dentro de qué rangos de valores debe estar p2 = p1- 0.4 p 1 A D = (0.7, 0.3) B C = (0.4, 0) 2

39 EJERCICIO 5.1 ROW Left Right COLUMN 4 -1 1 2 Up Down (a)

40 EJERCICIO 5.1 ROW Left Right COLUMN 3 2 1 4 Up Down (b)

41 EJERCICIO 5.1 (c) COLUMN Left Right Up 4, -1, 2 ROW Down 1, 1 2, -1

42 EJERCICIO 5.4 ROW Left Right COLUMN 1, 16 4, 6 2, 20 3, 40 Up Down

43 EJERCICIO 5.6 (a) COLUMN A B C D 1 1, 1 2, 2 3, 4 9, 3 ROW 2 2, 5 3, 3
7, 1

44 EJERCICIO 5.7 COLUMN Left Right Up A ROW Down B C

45 EJERCICIO: KREPPS (1990) P1 LL L P2 100, 2 U D M R -100, 1 0, 0
-100, -100 100, -49 1, 0


Descargar ppt "Teoría de Juegos Sesión #3 Juegos Simultáneos de Estrategias Mixtas"

Presentaciones similares


Anuncios Google