Teoría de Juegos Sesión #6 Juegos Evolutivos Dixit & Skeath, 10
Juegos Evolutivos Dentro de todas las variaciones de juegos que hemos visto, se ha mantenido constante la racionalidad de los jugadores Ahora vamos a levantar el supuesto de que los jugadores actúan en forma racional (entendiendo racional como sistema de valores que ayuda a clasificar los resultados de acuerdo con un sistema de valores y preferencias que son completas y transitivas), manteniendo sin embargo un sistema de payoffs que sin ser racional: Reconoce que existen estrategias que producen mejores resultados (payoffs) que otras Los jugadores, a través de la experiencia, adquieren el hábito de utilizar con mayor frecuencia estrategias exitosas y utilizan con cada vez menos frecuencia aquellas que no lo son
Desde la genética hasta las ciencias sociales Juegos Evolutivos: Desde la genética hasta las ciencias sociales Genética Parte importante de los patrones de conducta de las especias viene determinada en forma genética Estos patrones de conducta difieren entre representantes de la misma especie: Bajo ciertas condiciones, los miembros de una especie que poseen cierto patrón de conducta que los hace prevalecer sobre otros Nuevos patrones aparecen periódicamente (mutaciones) y compiten con los ya prevalecientes Cuando una especie ha desarrollado un patrón de conducta que predomina y no ha podido ser superado por ninguna mutación se dice que sigue una estrategia de conducta (patrón) evolucionario estable Ciencies Sociales A veces los jugadores no escogen sus estrategias en forma racional, sino que están predeterminados (quizás no genéticamente pero si por experiencia: Hay cooperadores y “cheaters” eternos) La decisión de ser un cooperador o un cheater está vinculada al payoff promedio que se haya tenido utilizando esa estrategia frente a diferentes jugadores seleccionados aleatoriamente La población se comporta en forma mixta pero ya no porque un jugador utiliza una estrategia mixta, sino porque quienes cooperan y quienes no aún están repartidos de acuerdo a cierta mexcla en la sociedad (polymorpfismo) Estos patrones producen equilibrios estables (mixtos)
El dilema del prisionero Juegos Evolutivos: El dilema del prisionero ROW Confess Not COLUMN 10 yr, 10 yr 25 yr, 1 yr 1 yr, 25 yr 3 yr, 3 yr Supongamos que los jugadores son escogidos aleatoriamente dentro de una población que tiene un X % de cooperadores naturales y (1-X%) de cheaters El cheater posee un payoff esperado mayor que el cooperador Si X está entre 0 y 1, los payoffs del cheater siempre son mayores (bajo ese sistema de payoff), lo que llevará a la población de cooperadores a disminuir Dados los payoffs, no hay manera de que la población de cooperadores “invada” el terreno de los cheaters – Esa población será evolutivo estable Por regla general, si una especie o grupo dentro de una especie tiene una estrategia dominante, esa será la estrategia evolutiva estable (ESS)
El dilema del prisionero jugado dos veces Juegos Evolutivos: El dilema del prisionero jugado dos veces ROW A T COLUMN 20, 20 N 35, 11 50, 2 6, 6 2, 50 11, 35 A: Siempre confiesa, T: Dando y dando, N: Nunca confiesa T Domina débilmente a N (si el otro coopera los payoffs son iguales) En cualquier población que haya tenido suficiente experiencia dentro de este juego T va a terminar eliminando a N – N no es un ESS (Evolutionary Stable Strategy) Existe una X (proporción de la población A) dentro de la cual pueden coexistir A y T como estrategies (especies, recuérdese que aquí cada grupo tiene una “tendencia”) – Equilibrios Polimórficos Por debajo de esa proporción A siempre prevalecería y tendería a eliminar en términos evolutivos a T (y por encima, viceversa) – Equilibrios Monomórficos
El dilema del prisionero jugado dos veces Juegos Evolutivos: El dilema del prisionero jugado dos veces Unfitness (years in jail) Proportion x of T Types in Population of T type A type 1 35 20 11 6
El dilema del prisionero jugado múltiples veces Juegos Evolutivos: El dilema del prisionero jugado múltiples veces ROW A T COLUMN 10 n , + 15, - 9 3 - 9, + 15 Si una especie A se encuentra n veces con otra A: Payoff: 10n,10n Si una especie T se encuentra n veces con otra T: Payoff: 3n,3n Si una T se encuentra con una A, la primera vez coopera y es engañada (obtiene 25), pero de allí en adelante no coopera y obtiene 10 (n-1 veces) =25 + 10*(n-1) = 10n+15 Si una A se encuentra con una T, la primera vez no coopera y se aprovecha de T (obtiene 1), pero de allí en adelante no coopera y obtiene 10 (n-1 veces) =1 + 10*(n-1) = 10n-9 Dentro de este juego, el X de equilibrio es una función de n, X=15/(7n+6) (X es la proporción de T en la población)
Comparación Equilibrios Evolutivos versus Equilibrios Obtenidos en Modelos Racionales Observando el juego en su versión más simple (A versus T, repetido dos veces), podemos notar que existen dos equilibrios de Nash puros (A,A) y (T,T), y uno de estrategia mixta: A:25%, T:75% Los dos primeros corresponden a los equilibrios evolutivos que hemos definido como monomórficos, y el mixto corresponde al equilibrio polimórfico, en donde co-existen dos grupos dentro de una misma especie con estrategias distintas Por definición, un ESS debe ser un equilibrio de Nash entendido en su forma racional El enfoque evolutivo, sin embargo, viene a proveer soporte al concepto de equilibrio de Nash (no al revés) de que aún cuando los individuos no sean 100% de las veces maximizadores conscientes de la estructura del juego y payoffs, la repetición los va a llevar a aprender a utilizar con mayor frecuencia ciertas estrategias sobre otras, convergiendo en este proceso a un conjunto de estrategias estables – El equilibrio de Nash
Juegos Evolutivos: The Chicken Game A Wimp Macho B -1, 1 -2, -2 0, 1, 1, -1
Juegos Evolutivos: The chicken game Macho - 1 2 1/2 Wimp Fitness Fitness Proportion x of Machos in Population
Juegos Evolutivos: The chicken game Obsérvese que la efectividad de un grupo dentro de la especie es mayor en la medida en que ese grupo ocupa una proporción menor de la población Si hay muchos machos, un wimp lo hará relativamente mejor que los machos, y viceversa El único punto en el que ambos están en equilibrio es allí en donde existe una proporción similar de ambos grupos, cualquier desviación de ese punto va a llevar a un incremento en la proporción del que se encuentre en desventaja numérica hasta que el equilibrio se reestablezca Por las reglas y la estructura de este juego el equilibrio es convergente, en el dilema del prisionero estudiado anteriormente era divergente – El equilibrio como concepto es más sólido aquí que el caso anterior, porque allá cualquier desviación mínima a favor de uno u otro grupo va a terminar de producir un equilibrio evolutivo en donde sólo hay un grupo
Juegos Evolutivos: The meeting game A T M B 0, 2, 2 1, 1
Juegos Evolutivos: The meeting game 2 M type T type 1 2/3 Proportion x of T Types in Population M type T type 2 1 2/3 Fitness
Juegos Evolutivos: The meeting game Visto en su forma racional el juego posee tres equilibrios de Nash: (T,T), (M,M), y p=q=2/3 En este equilibrio mixto las probabilidades de que ambos jugadores vayan a sitios distintos sigue siendo alta: 2/3 x 1/3 x 2 = 4/9 En la versión evolutiva del juego, si se define x como la proporción de individuos T en la población, T=2/3 es el punto en donde ambas especies (T y M) pueden coexistir Si hubiese menos T que 2/3, M se convertiría en especie superior, y de allí a que la población este compuesta por 100% de M no hay mucho trecho – Cualquier desviación de 2/3 va a llevar a todo el que quiere encontrarse con alguien – sin ponerse de acuerdo previamente – a dirigirse TODAS las veces a un solo lugar, y los demás, sabiéndolo, se van a dirigir también a ese lugar
Juegos Evolutivos – Interacciones entre especies: La batalla de las dos culturas SCIENCE FACULTY Hard-liner Compromiser HUMANITIES FACULTY 2, 1 0, 1, 2 A diferencia de los ejemplos que hemos visto hasta ahora, como los jugadores no vienen de la misma especie, la proporción de hardliners y compromisers dentro de los científicos (x) no tiene por qué ser igual a la proporción de hardliners dentro de los humanistas (y)
. Juegos Evolutivos – Interacciones entre especies: La batalla de las dos culturas Proportion y of Hard-Liners Among Humanists 2/3 A 1 C D B x of Hard-Liners Among Scientists NASH/ESS .
Juegos Evolutivos – Interacciones entre especies: La batalla de las dos culturas Nótese que la efectividad de un grupo dentro de la especie depende de la proporción dentro de la otra especie (si y es menor a 2/3, los hardliners serán más efectivos en promedio que los compromisers dentro de la especie científicos) El ESS equilibrio polimórfico, en donde dentro de cada especie sobreviven grupos hardliners y compromisers es muy frágil, cualquier desviación de ambos lados en dirección contraria (suben los hardliners en un grupo y bajan los compromisers en otro, o viceversa) va a conducir hasta un equilibrio de Nash de estrategia pura La dotación inicial de hardliners y compromisers de cada grupo (en términos proporcionales) influye sobre el equilibrio de Nash más probable, si “x” es baja y “y” es alta es muy probable que el equilibrio obtenido llegue a ser 1,2 Fuera del punto de equilibrio multimórfico, la gran mayoría de las fuerzas conducen hacia uno de los dos vértices que representan equilibrios monomórficos (Nash de estrategias puras)
Juegos Evolutivos: Hawk-Dove Análisis de Estrategias Racionalizables (Dominancia) A Hawk Dove B V , 0, V , 2 V-C , V-C Si V es mayor que C, estamos frente al Dilema del Prisionero Existe una solución, un solo equilibrio: (H,H) Si V es menor que C, estamos frente a un Chicken Game: Sin solución, tres equilibrios de Nash: (H,D), (D,H), y p=q=V/C
Juegos Evolutivos: Hawk-Dove Estabilidad Evolucionaria si V mayor que C A Hawk Dove B V , 0, V , 2 V-C , V-C Si se define d como la proporción de Doves en la población, entonces para cualquier valor de “d” entre 0-1 Hawks predomina sobre Doves, y en consecuencia el equilibrio final va a ser uno en donde sólo existen Hawks (H,H) Este es el mismo equilibrio del Dilema del Prisionero cuando la selección natural elimina a los Cooperadores
Juegos Evolutivos: Hawk-Dove Estabilidad Evolucionaria si V menor que C A Hawk Dove B V , 0, V , 2 V-C , V-C Existe un valor “d” óptimo en el que pueden coexistir ambos grupos Más aún, un grupo es más efectivo que otro en la medida en que pertenece a una proporción menor, el equilibrio resultante es convergente Este es el mismo equilibrio de Chicken Game, en donde un Macho lo hace mejor si hay más Wimps que machos y viceversa Dentro de este caso, el resultado mixto implica que: a) La población está compuesta de una mezcla de individuos que utilizan estrategias puras, o b) La población está compuesta por individuos que mezclan sus estrategias
Piedra (Rock), Papel (paper), o Tijera (scissors) Juegos Evolutivos: Piedra (Rock), Papel (paper), o Tijera (scissors) PLAYER 1 R P PLAYER 2 S -1 q -Mix - + 2 + (1 - ) - (1 -
Piedra (Rock), Papel (paper), o Tijera (scissors) Juegos Evolutivos: Piedra (Rock), Papel (paper), o Tijera (scissors) q 2 1/2 1 + = 1
Ejercicio 10.2 PLAYER 1 Cooperate Defect PLAYER 2 1, 4 2, 2 3, 3 4, 1