La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1 2 1212 0000 2121 N (2, 1) 2 (1,2) S S N 0000 Ejemplo 2: Reparto de 3 objetos indivisibles.

Presentaciones similares


Presentación del tema: "1 2 1212 0000 2121 N (2, 1) 2 (1,2) S S N 0000 Ejemplo 2: Reparto de 3 objetos indivisibles."— Transcripción de la presentación:

1 N (2, 1) 2 (1,2) S S N 0000 Ejemplo 2: Reparto de 3 objetos indivisibles.

2 La estrategia de un jugador es un plan completo de acción que especifica qué hacer ante todas y cada una de las situaciones en que pueda ser llamado a decidir. Una estrategia es un plan completo contingente a la información de que se dispone en cada momento. El jugador 2, aún teniendo dos acciones, dispone de cuatro posibles estrategias (puras): si 1 ofrece (2,1), acepta (S) y si 1 ofrece (1,2), acepta (S). si 1 ofrece (2,1), acepta (S) y si 1 ofrece (1,2), rechaza (N). si 1 ofrece (2,1), rechaza (N) y si 1 ofrece (1,2), acepta (S). si 1 ofrece (2,1), rechaza (N) y si 1 ofrece (1,2), rechaza (N).

3 si 1 ofrece (2,1), acepta (S) y si 1 ofrece (1,2), acepta (S). si 1 ofrece (2,1), acepta (S) y si 1 ofrece (1,2), rechaza (N). si 1 ofrece (2,1), rechaza (N) y si 1 ofrece (1,2), acepta (S). si 1 ofrece (2,1), rechaza (N) y si 1 ofrece (1,2), rechaza (N). Por simplificar la notación en lo que sigue denotaremos estas cuatro estrategias de la forma siguiente: {(S,S), (S,N), (N,S), (N,N)}, donde el primer elemento en cada par es que se planea votar si el jugador 1 ofrece (2,1) y el segundo si ofrece (1,2). Reparto de 4 objetos indivisibles? forma general de una estrategias? número de estrategias?

4 Una forma intuitiva de pensar en una estrategia es imaginarla como un conjunto de instrucciones completas que se le dejan a un delegado para que juegue en tu ausencia y en tu nombre, pero sin ninguna libertad estratégica, es decir, haciendo exactamente lo que dictan las instrucciones. Formalmente una estrategia en un juego con información perfecta no es más que una función que especifica una acción, y sólo una, para todos y cada uno de los nodos de decisión de un jugador.

5 N (2, 1) 2 (1,2) S S N 0000 El jugador 1 sólo mueve en un nodo de decisión (el origen del juego), por lo que en este caso estrategias y acciones coinciden. Es decir, sus estrategias son acciones no contingentes al ser el primero en mover y no volver a hacerlo en todo el juego.

6 Analicemos a continuación el ejemplo 2 sobre el reparto de 3 objetos indivisibles. Para calcular los EN de este juego es útil representar matricialmente los pares de estrategias de los jugadores y sus pagos asociados. Es fácil comprobar con esta matriz que existen tres EN: {(2,1), (S,S)}, {(2,1), (S,N)} y {(1,2), (N,S)}, con pagos (2,1) los dos primeros y (1,2) el último. (S,S)(S,N)(N,S)(N,N) Ofrecer (2,1) (2,1) (0,0) Ofrecer (1,2) (1,2)(0,0)(1,2)(0,0)

7 El equilibrio, {(1,2), (N,S)}, recoge también una amenaza del jugador 2 al jugador 1 que ofrece primero. En concreto, el jugador 2 planea rechazar el reparto (2,1) y aceptar solo el reparto (1,2) Si el jugador 1 cree esta amenaza su mejor respuesta es ofrecer (1,2) De esta forma el jugador 2 consigue el mejor resultado posible del juego para él: 2 objetos. Sin embargo, nuevamente, esta amenaza no es creíble, pues el jugador 2 siempre puede incumplir su amenaza sin ningún coste.

8 En concreto, la parte de la estrategia en que se planea rechazar el reparto (2,1) por parte del jugador 1 no es creíble, pues en ese caso el jugador 2 obtendría un pago de 0 cuando aceptando obtendría un pago de 1. Luego, este EN no es razonable por el mismo motivo que el anterior: incorpora amenazas no creíbles. O, dicho con otras palabras, el jugador que mueve primero anticipa conducta irracional (por ejemplo, planear una acción dominada) del jugador que mueve segundo.

9 N (2, 1) 2 (1,2) S S N 0000 Senda de equilibrio Equilibrio ((1,2), ((N,S) Amenaza

10 Observemos ahora el EN {(2,1), (S,N)} de este juego. ¡En este equilibrio el jugador 2 planea aceptar el reparto en el caso de que el jugador 1 ofrezca (2,1) y planea rechazar el reparto (1,2), que le proporciona pagos mayores! Nuevamente planea una acción dominada en el nodo de decisión en que se encontrara tras observar (1,2) por parte del jugador 1. El problema del concepto de EN en los juegos secuenciales es que no restringe las acciones planeadas fuera de la senda del juego definida por las estrategias de equilibrio

11 N (2, 1) 2 (1,2) S S N 0000 Senda de equilibrio Fuera de la senda de equilibrio Equilibrio ((2,1), ((S,N)

12 El equilibrio, {(2,1), (S,S)}, En concreto, el jugador 2 planea aceptar tanto el reparto (2,1) como el reparto (1,2) Dado el comportamiento del jugador 1 la mejor respuesta del jugador 1 es ofrecer (2,1) De esta forma el jugador 1 consigue el mejor resultado posible del juego para él: 2 objetos.

13 N (2, 1) 2 (1,2) S S N 0000 Senda de equilibrio Fuera de la senda de equilibrio Equilibrio ((2,1), ((S,S)

14 5.5 El principio de racionalidad secuencial y las amenazas creíbles. El concepto de EN por sí sólo no es muy útil para predecir la conducta en los juegos secuenciales. El problema no es sólo la multiplicidad sino, sobre todo, que muchos EN no son razonables pues representan, por ejemplo, amenazas no creíbles basadas en planear acciones dominadas. En estos EN no razonables algún jugador planea dichas acciones dominadas y el otro jugador lo cree, es decir, este último anticipa o prevee conducta futura irracional de su oponente.

15 En los ejemplos vistos anteriormente existe un EN que presenta este problema. En el ejemplo del niño, éste debe anticipar que la única conducta racional (maximizadora de pagos) del padre en caso de que se porte mal es no castigarle (NC). Dado esto, lo mejor que puede hacer el niño es portarse mal (M). Es decir, obtenemos el EN (M, NC) En el reparto de los 3 objetos, el jugador 1 debe anticipar que el único plan racional del jugador 2 es aceptar cualquier reparto de los objetos. Dada esta estrategia del jugador 2, obtenemos el EN: {(2,1), (S,S)}.

16 En estos EN, libres de amenazas no creíbles, se cumple lo que llamaremos el principio de racionalidad secuencial: los jugadores anticipan o preveen en todo punto del juego conducta racional futura (maximizadora de pagos) de sus oponentes. Los equilibrios Nash que adicionalmente satisfacen el principio de racionalidad secuencial los denominaremos equilibrios Nash perfectos (EP, en adelante). Cualquier predicción que tengamos para un juego secuencial entre jugadores inteligentes deberá cumplir como mínimo la condición de constituir un EP del juego

17 Un EN de un juego secuencial es un equilibrio perfecto en subjuegos si induce equilibrios Nash en todos los subjuegos del juego. Es decir, las acciones que se planean jugar según las estrategias de ese EN constituyen un EN en todos y cada uno de los subjuegos. Obsérvese que de esta forma se descarta que los jugadores puedan planear acciones dominadas en algún subjuego fuera de la senda de equilibrio, de manera que se implementa el principio de racionalidad secuencial

18 En los juegos secuenciales finitos con información perfecta (aquellos con horizonte finito y un número de acciones finito) existe un método para calcular (computar) los EP: el algoritmo denominado inducción hacia atrás. La idea es resolver el juego desde el final. Se empieza resolviendo las elecciones óptimas en los últimos nodos de decisión, es decir, aquellos previos a los nodos terminales, se eliminan el resto de ramas de estos nodos y entonces se sube en el árbol a los penúltimos nodos de decisión donde se repite la operación, y así sucesivamente hasta alcanzar el nodo inicial.

19 N (2, 1) 2 (1,2) S S N 0000 Ejemplo : Reparto de 3 objetos indivisibles.

20 (2, 1) 2 (1,2) S S Ejemplo : Reparto de 3 objetos indivisibles.

21 (2, 1) 2 (1,2) S S Ejemplo : Reparto de 3 objetos indivisibles. EP: ((2,1), (S,S))

22 (2, 1) S Ejemplo : Reparto de 3 objetos indivisibles. Senda de equilibrio

23 Luego, el EP que obtenemos por construcción es {(2,1), (S,S) } que, como ya sabíamos es el único EP del juego. Es evidente que con este método garantizamos la racionalidad secuencial pues vamos escogiendo las acciones maximizadoras de pagos en todos los subjuegos. Si en este proceso de inducción hacia atrás, todos los jugadores tienen siempre en cada nodo una única acción maximizadora de pagos (como sucede en el ejemplo) es evidente que obtendremos el único EP del juego. Luego, si esta condición se cumple (es decir, no hay empates de pagos para un mismo jugador), el EP es único en todo juego finito con información perfecta, lo cual contrasta con la multiplicidad de EN.

24


Descargar ppt "1 2 1212 0000 2121 N (2, 1) 2 (1,2) S S N 0000 Ejemplo 2: Reparto de 3 objetos indivisibles."

Presentaciones similares


Anuncios Google