Juegos repetidos: la colusión.

Juegos repetidos: la colusión.
Tema 7. Juegos repetidos: la colusión. 7.1 Juegos repetidos y cooperación tácita. 7.2 Juegos repetidos: modelo formal. 7.3 Algunos equilibrios Nash con horizonte infinito y equilibrios perfectos. Aplicaciones: Juegos repetidos con horizonte finito. Duopolio e incentivos a la colusión. Bibliografía básica: Olcina y Calabuig: Cap. 8. Bibliografía complementaria: Gibbons: cap. 2 (2.3) Dixit y Nalebuff: cap. 4

7.1 Juegos repetidos y cooperación
Juegos repetidos, juegos en los que se juega el mismo juego repetidamente y con los mismos oponentes a lo largo del tiempo. Muchas interacciones estratégicas tienen lugar de forma repetida con las mismas personas. Estas situaciones en las que en las que nos relacionamos con los mismos jugadores una y otra vez tienen una importancia económica y social indudable. En el ámbito económico, podemos encontrar ejemplos en los oligopolios de Cournot o Bertrand repetidos, en las negociaciones salariales periódicas entre empresas y sindicatos, etc...

En el juego del dilema del prisionero, la predicción del resultado fuese que los presos decidían óptimamente confesar cuando el juego se jugaba una única vez. La situación más habitual en la que se supone que, tras salir de la cárcel, los prisioneros volverán a encontrarse en el futuro, y si alguno de ellos ha confesado podría recibir la represalia del otro por la delación. Por tanto, ante el posible castigo futuro el prisionero decida no confesar en un marco de interacción repetido. Este ejemplo demuestra que es posible sostener resultados en los que se produce cooperación cuando un juego, que tiene como acción dominante una acción no cooperativa, se repite en el tiempo.

Un ejemplo de este tipo se situación se observa en el duopolio de Cournot repetido, en el que las empresas no tienen incentivos a cumplir un acuerdo implícito de colusión en el corto plazo, y sin embargo, al competir repetidamente a lo largo del tiempo, se observa que sólo en raras ocasiones las empresas intentan “aprovecharse” del rival incumpliendo el acuerdo tácito. Tampoco en aquellos negocios en los que es importante volver a contar con los mismos clientes, se observa que las empresas se “aprovechen” de éstos fijando precios abusivos.

Esta es una primera e importante implicación de los juegos repetidos: se pueden obtener resultados que no era posible alcanzar en situaciones en los que se interactúa una única vez. ¿A qué se debe que la conducta en una situación repetida (o de largo plazo) sea tan diferente de la que se produce en una situación aislada en el tiempo (o a corto plazo) o con oponentes distintos? La repetición del juego y la observabilidad de la conducta pasada de nuestros oponentes, permite la utilización de jugadas estratégicas como amenazas, promesas, creación de una reputación, etc… Jugadas estratégicas que permiten sostener un comportamiento que no s pueden obtener si jugásemos una sola vez.

Nos interesa entender por qué se coopera en la situación repetida, cuando la no cooperación es acción dominante en una situación estratégica jugada aisladamente. La idea básica que puede explicar esta conducta es que cada parte es disuadida de explotar la ventaja de corto plazo, por la “amenaza” de castigo que reduce su pago a largo plazo. Este es, en esencia, el mecanismo que sostiene la cooperación a largo plazo.

Conviene resaltar, por tanto, que la cooperación no se produce debido a un comportamiento altruista de los jugadores, recordemos que suponemos que son egoístas y que solo se preocupan de su propio pago, sino del temor a que un castigo por parte del oponente pueda reducir sus pagos futuros.

Nos centraremos en la repetición de juegos con estructura del dilema del prisionero, en los que se produce un conflicto entre el resultado eficiente, que se obtiene cuando ambos jugadores eligen Cooperar (6,6), y el resultado ineficiente que se origina cuando ambos jugadores eligen su acción dominante, No Cooperar (2,2).

Es importante subrayar que en el juego repetido los jugadores observan lo que ha ocurrido en el pasado, es decir, observan las acciones que han elegido todos los jugadores en los periodos anteriores. Supongamos que el dilema del prisionero anterior se repite indefinidamente a lo largo del tiempo. Llamaremos C a cooperar y NC a no cooperar. Una estrategia de largo plazo, del jugador 1 por ejemplo, consiste, en elegir C siempre que el otro jugador elija C y, si en algún período, el rival elige NC, “castigarlo” eligiendo NC para siempre. ¿Qué puede hacer el otro jugador?

Si el jugador 2 elige C en todos los períodos, el resultado sería (C,C) en todos los periodos, con unos pagos de 6 para ambos jugadores. Si el jugador 2 elige NC en algún período, entonces obtendría un pago de 8 en ese período, y dada la estrategia del jugador 1, un pago de 2 en el resto de los períodos. Si el jugador 2 es suficientemente paciente, es decir, la valoración que otorga a los pagos futuros no es muy bajo en comparación con lo que valora los pagos presentes, la corriente de pagos (8,2,2,2...) es inferior a la corriente de pagos (6,6,6,6.....). Por consiguiente, para el jugador 2 elegir C en cada periodo será una mejor respuesta a la estrategia de “castigo” del jugador 1.

Naturalmente, la elección por su parte de la misma estrategia de “castigo” también es una mejor respuesta a la estrategia del jugador 1. Luego, tenemos un equilibrio Nash del juego repetido en el que se consigue el resultado de cooperación, (C,C), en todos los periodos No obstante, conviene resaltar que en los juegos repetidos existen además otros equilibrios entre los cuales también se obtiene un equilibrio en el que no se produce cooperación, es decir, un resultado el que los jugadores eligen en cada periodo su acción dominante: no cooperar

7.2 Juegos repetidos: el modelo formal.
Supondremos que el juego que se repite a lo largo del tiempo (juego constituyente o de etapa) es un juego bipersonal simultáneo Llamaremos juego repetido G(T) a la repetición T periodos del juego G (juego de etapa), en el que los jugadores observan las acciones elegidas tras jugar cada período t. T es el horizonte temporal y como veremos, puede ser finito o indefinido. Obsérvese que un juego repetido es un juego secuencial con “casi” información perfecta,

En el juego G(T) los jugadores intentan maximizar su flujo o corriente de pagos. Ahora bien, ¿cómo evaluar una corriente de pagos? un método muy extendido consiste en calcular el valor presente (o descontado) de dicha corriente. Por ejemplo, supongamos que en cada período cada jugador elige simultáneamente una acción de su conjunto de estrategias El par de acciones que han elegido en el período 1 lo denotamos por a1, mientras que el par de acciones que ambos eligieron en segundo período lo llamamos a2, y así sucesivamente hasta el periodo T. Es decir, los jugadores juegan la secuencia de pares de acciones {a1, a2, .....aT} que determinan unos resultados y unos pagos para los jugadores en cada periodo.

Supondremos que para los jugadores la utilidad que reciban de un determinado pago será menor cuando más alejado esté en el tiempo. Esta idea la representaremos suponiendo que los agentes descuentan el futuro con un factor de descuento  Así mismo, por sencillez, supondremos que ambos jugadores tienen el mismo factor de descuento, donde   (0,1).

Las preferencias temporales de los jugadores.
A nuestros jugadores les importa no sólo cuanto obtienen sino también cuando se obtiene. Luego, necesitamos representar dichas preferencias intertemporales, de forma que podamos comparar pagos obtenidos en diferentes periodos. Recogeremos las preferencias temporales de un individuo i mediante su factor de descuento  Este factor es el valor para el individuo de un euro obtenido mañana, en euros de hoy (valor presente o descontado). El factor de descuento mide la paciencia relativa del jugador y pertenecerá al intervalo (0,1).

Su valor no tiene porque coincidir entre individuos pues obviamente presentamos distintos gustos sobre el intercambio entre renta presente y futura (es decir, unos individuos son más pacientes y otros más impacientes). ¿Qué cantidad de euros hoy sería equivalente a obtener un euro dentro de un periodo? Será una cantidad , que hemos llamado factor de descuento, que invertida al tipo de interés r nos reporte un euro dentro de un periodo.

La utilidad que le reporta al jugador i un pago en el que consiga xi euros obtenido en el periodo t, es decir, ui(xi,t) será igual a xiit-1.

Por ejemplo, la utilidad de recibir un pago de 100, hoy, es decir, en t = 1, será justamente 100.
Si este mismo pago se consigue en el período siguiente, t = 2, la utilidad será 100, o si se recibiera en t = 3, la utilidad sería 1002, y así sucesivamente. Obviamente, cuanto mayor sea , más valorará los pagos futuros respecto a los pagos presentes, es decir, más paciente será el jugador. Por ejemplo, si  = 0.9, 1 millón recibido el año que viene, es equivalente a euros hoy. Por el contrario, si un jugador es muy impaciente, por ejemplo,  = 0.4, el mismo acuerdo de conseguir 1 millón el año que viene, vale en euros hoy , es decir, se valora muchísimo más el presente.

A modo de ejemplo, supongamos que los jugadores han elegido la siguiente sucesión o secuencia de acciones durante cuatro periodos, donde el primer elemento es la acción del jugador 1 y el segundo la del jugador 2: En t = 1, se ha jugado a1 = (C,C) , con lo que los jugadores tienen unos pagos de (6,6). En t = 2, han jugado a2 = (C,NC), con unos pagos de (-2,8). En t = 3, eligieron a3 = (NC,NC), lo que produce unos pagos de (2,2). En t = 4, han elegido a4 = (NC, C), consiguiendo unos pagos de (8,-2). La corriente de pagos del jugador 1 será (6,-2,2,8), mientras que la suma presente descontada de esta corriente sería U1 = 6 + (-2) + 22 + 38, si =0.5, U1 =6,5 El flujo de pagos para el jugador 2 sería (6,8,2,-2) y el valor de la suma descontada de pagos de este flujo sería U2 = 6 + 8 + 22 + 3(-2), si =0.5, U2 =10,25

Definamos la noción de estrategia en un juego repetido,
pero para ello se necesita previamente introducir el concepto de historia en esta clase de juegos. Llamaremos historia del juego en el período t a la secuencia de pares de acciones observadas por los jugadores antes de jugar en el periodo t. Ahora ya estamos en disposición de definir el concepto de estrategia: Definición: Una estrategia para el jugador i en el juego repetido G(T) especifica la acción a jugar en el periodo t, en función de las historias posibles hasta t.

La noción de estrategia en un juego repetido es compleja.
Supongamos, por ejemplo, que se repite dos veces el dilema del prisionero En este caso, una estrategia del juego repetido dos períodos nos indica en cada periodo que acción elegir en función de la historia previa. Como en el primer periodo no ha habido ningún movimiento previo de ningún jugador, el conjunto de historias posibles es vacío. Por tanto, el primer elemento de una estrategia en el primer periodo consiste simplemente en la elección de una acción, C o NC.

Sin embargo, en el segundo periodo, el conjunto de posibles historias contiene cuatro elementos,
H2={(NC,NC), (NC,C), (C,NC), (C,C)}, ya que en el primer periodo el resultado puede haber sido (NC,NC) o bien (C,C), y así hasta cuatro. Por tanto en este segundo período existen 16 combinaciones posibles (24), que son las funciones que van desde el conjunto de posibles historias que podían producirse en el primer periodo, al conjunto de acciones del jugador i. A modo de ejemplo, un elemento de una estrategia en el segundo periodo podría ser: si el resultado en el primer periodo ha sido (NC,NC) entonces elegir NC, en cualquier otro caso elegir C.

El número de estrategias para cada jugador que juegue el dilema del prisionero durante dos periodos asciende a 32 (2 acciones en el primer periodo x 16 combinaciones en el segundo). De esta tabla podemos destacar diversas estrategias de interés: se puede observar que hay estrategias incondicionales, por ejemplo, la estrategia 1 implica cooperar siempre independientemente de la historia previa, del mismo modo que la estrategia 32 supone no cooperar nunca tras toda historia posible. Algunas estrategias, como la estrategia 7, tienen una importancia especial para sostener la cooperación.

Esta estrategia (7) dicta que el jugador 1 comience cooperando en el primer periodo e incorpora un castigo al oponente, puesto que si el jugador 2 ha elegido una acción distinta de cooperar en el primer periodo, el jugador 1 elegirá no cooperar. Esta estrategia recibe el nombre de estrategia del disparador o gatillo (trigger strategy). Debido a su importancia para garantizar la cooperación, a continuación vamos ofrecer la definición formal y general de esta estrategia:

Estrategia del disparador (o del gatillo) (D) :
Esta estrategia para el jugador i simplemente estipula que en el primer periodo comience cooperando, y que continúe cooperando mientras también lo haga su rival. Pero si alguna vez éste no coopera, no volver a cooperar nunca más. Elegir C en el primer periodo, C si aj = C para un periodo  = 1, 2, ..t-1 NC en otro caso. Esta estrategia condiciona lo que se va a jugar en cada periodo en función de lo que se ha jugado en el pasado. En concreto, si el oponente alguna vez ha jugado NC, a partir de entonces jugará para siempre la acción NC.

Juegos repetidos: la colusión.

Presentaciones similares

Presentación del tema: "Juegos repetidos: la colusión."— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

Juegos repetidos: la colusión.

Presentaciones similares

Presentación del tema: "Juegos repetidos: la colusión."— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback