JUEGOS REPETIDOS.

Slides:



Advertisements
Presentaciones similares
Problemas Teóricos Resueltos Sobre Límites de Funciones
Advertisements

(información perfecta)
Introducción a la teoría de juegos Rafael Salas abril de 2010
Teoría de juegos: Tema 1 Rafael Salas febrero de 2013
Tema 3. Juegos simultáneos : el equilibrio de Nash.
JUEGOS SIMULTÁNEOS CON INFORMACIÓN INCOMPLETA.
Juegos repetidos: la colusión.
El dilema de los prisioneros
Nos centraremos en la repetición de juegos con estructura del dilema del prisionero, en los que se produce un conflicto entre el resultado eficiente, que.
Acción débilmente dominante
CONTRIBUIR O NO AL JARDÍN.
Tema 7: Probabilidad 1. Introducción. 2. Variables aleatorias.
PARTE I: JUEGOS SIMULTANEOS.
Tema.10. Conceptos básicos de muestreo y probabilidad aplicados a modelos en Psicología. Principales conceptos. Teoremas básicos. Variables aleatorias.
Estrategia Taller No. 14 Instructor: Guido Capra S MBA, MEE
Sesión 3 Estructuras Repetitivas
DEFINICIONES       Experiencia Aleatoria: es aquella cuyo resultado depende del azar: ( lanzto de un dado, una moneda, extraer una bola, una carta, etc.)
TEORIA DE JUEGOS Trata del comportamiento estratégico, del comportamiento en interacción. Esto es fundamental en la gerencia política. En teoría de juegos.
Límite finito en el infinito Límite infinito en el infinito
Teoría de los Juegos: definiciones
Tema 3. Teoría de Juegos Introducción
? Dioptra y a continuación otra dioptra n’’ B h F’ A’ A F h’ s2 B’ s1
Juego repetido Las estrategias de los jugadores son dinámicas y cambiantes. El juego de etapa que se juega en cada interacción es estático e inmutable.
UNIVERSIDAD COMPLUTENSE DE MADRID D epartamento de Fundamentos del Análisis Económico I Teoría de juegos: Tema 2 Rafael Salas febrero de 2005.
Jesús Muñoz San Miguel Matemáticas II:
Juego de Equilibrio con Bloques Jugador A Jugador B.
Sesión 12: Procesos de Decisión de Markov
La Teoría de Juegos *Ivonne Santibáñez *Cynthia Flores
TEORIA DE JUEGOS TEORIA DE JUEGOS
PROGRESIONES.
Dirección General Oscar Moreno
Profesor: Jorge Li Ning
Leydy Johanna Hernández
Helen Markelova Programa de CGIAR sobre Acción Colectiva y Derechos de Propiedad (CAPRi) Instituto Internacional de Investigación sobre Políticas Alimentarias.
Rafael Gómez Costumero.. EL DILEMA DEL PRISIONERO es uno de los problemas que más claramente ejemplifican la teoría de juegos. TEORÍA DE JUEGOS : Es.
Temas en Microeconomia Lectura #3 del curso corto para estudiantes de La Universidad Autónoma de Chapingo, 3-8 de junio, Richard Woodward Basado.
TOMA DE DECISIONES.
M.S.C. Ivette Hernández Dávila
Sesión 12: Procesos de Decisión de Markov. Incertidumbre - MDP, L.E. Sucar2 Procesos de Decisión de Markov Procesos de Decisión Secuenciales Procesos.
SUCESIONES Prof. Lucas Picos M..
UNIVERSIDAD COMPLUTENSE DE MADRID D epartamento de Fundamentos del Análisis Económico I Teoría de juegos: Juegos dinámicos (información perfecta) Rafael.
TEMA 7 JUEGOS SECUENCIALES CON INFORMACIÓN INCOMPLETA O ASIMÉTRICA. manual. Cap. 9 Por diferencia a un juego simultáneo, ahora el jugador con información.
Escuela Superior de Formación de Maestros “Ángel Mendoza Justiniano”
BRENDA YAKELINE SALAZAR FAUSTINO
Teoría de Juegos: Introducción
Tema 4. Oligopolio Concepto.
Teoría de juegos: Juegos repetidos Rafael Salas mayo de 2006
Elección social. Elecciones Municipales: __/__/__ Municipio: _________ Número de concejalías: 21.
1 Problemas de decisión Tipo particular de problemas de optimización Sistemas que evolucionan con el tiempo Se toman decisiones en momentos sucesivos de.
Probabilidad y Estadística Segunda parte: Teoría de la Decisión
Sesión 12: Procesos de Decisión de Markov
Game Feel The Big Game Theory Octubre 28, 2010.
Tema 14 DISTRIBUCIÓN Angel Prieto Benito
DILEMA DE LOS PRISIONEROS REPETIDO CON HORIZONTE FINITO E INFORMACIÓN INCOMPLETA. Considere el siguiente Dilema de los Prisioneros (donde C es cooperar.
COMPETENCIA MONOPOLÍCA Y OLIGOPOLIO Parte II
Equipo “Un equipo es un grupo de personas trabajando juntas hacia una meta común”
ADMINISTRACIÓN Y MARKETING
About me… Vengo de Argentina Al igual que Uds. me apasiona la seguridad y la tecnología a la cual me dedico desde hace mas de 10 años. Si…..tengo certificaciones….CEH,
Copyrite 2008 INTEGRACIÓN INTEGRACIÓN Busca mantener relaciones de sinergia y cooperación. Resolviendo conflictos, promoviendo una sana relación entre.
Tema 13: Oligopolio Entre monopolio y competencia perfecta Oligopolio.
1 Unidad 2: La derivada Reglas de derivación.. 2 ¿Cómo se obtiene la derivada de ¡Reflexión! Técnicas de derivación ó sin tener que usar la definición.
¿QUÉ ES UNA MÁQUINA DE JUEGO PROGRAMADO? Una máquina de juego programado es aquella en que el resultado del juego se encuentra definido por el programador.
Un hombre de negocios acababa de apagar las luces de la tienda cuando un hombre apareció y demandó dinero. El dueño abrió una caja registradora. El contenido.
Ejercicios ¿Cuáles son los equilibrios de Nash del siguiente juego en forma estratégica? Mencione sólo los equilibrios en estrategias puras
METODOS NUMERICOS TEORIA DE ERRORES. Cuando se mide una cantidad, ya directa, ya indirectamente, la medida que se obtiene no es necesariamente el valor.
Ejercicio 1 Eliminación iterativa de estrategias estrictamente dominadas Resuelva, mediante la eliminación iterativa de estrategias estrictamente dominadas,
 Según Ariely, la elección de una persona por un bien no solo depende de su racionalidad instrumental, sino también de las limitaciones para procesar.
Jugar Salir del juego SUMAS RESTAS Vuelve al inicio.
Etapas de un proyecto.
Transcripción de la presentación:

JUEGOS REPETIDOS

Dilema del prisionero Dilema del prisionero iterado Tras cada interacción entre los prisioneros, y una vez reveladas sus decisiones, vuelven a interactuar y los pagos que obtienen son la suma de los pagos Jug1\Jug2 Confesar No confesar 0,0 7,-2 -2,7 5,5

Definición Un juego repetido se define por un juego de etapa G en forma estratégica, que se juega de forma repetida en tiempo discreto: G = {Si, πi, i = 1,. . ., N} con Si es el conjunto de estrategias del jugador i y πi (s1, s2, ..., Sn) su función de pagos. Definición Si el número de repeticiones, T, es finito, el juego es un juego repetido finitamente y si el juego no tiene un fin fijo es un juego infinitamente repetido. En juegos finitamente repetidos los pagos son la suma de los pagos en cada etapa. En juegos infinitamente repetidos los pagos se descuentan con un factor δ: 0 <δ <1, Interpretación del factor δ Cada vez que se juega el juego de etapa, hay una probabilidad p de que la interacción actual sea la última (la probabilidad de que estos jugadores jueguen el juego de etapa de nuevo es δ = 1-p). Los beneficios se calculan como el pago esperado. El pago de la etapa t + 1 se valora como una fracción δ en la etapa t. La fracción δ asociada es un factor de descuento y se valoran los beneficios como el valor actual.

El dilema del prisionero modificado en T etapas. En el dilema del prisionero modificado los prisioneros tienen también la opción de confesar parcialmente con la matriz de pagos Player 1 \ Player 2 c p n c 0, 0 3, -1 7, -2 p -1, 3 3, 3 6, 0 n -2, 7 0, 6 5, 5 Este proceso se repite T veces y los pagos son la suma de los pagos de cada etapa El juego de etapa tiene dos equilibrios • (C,C) con pagos (0, 0). • (P, P) con pagos (3, 3).

Equilibrios básicos Ambos jugadores juegan C en cualquier caso. Ambos jugadores juegan P en cualquier caso. Otros equilibrios. El comportamiento de los jugadores en cada etapa depende del comportamiento observado en etapas anteriores En dos etapas tenemos un EPS si ambos jugadores juegan con la estrategia En la primera etapa jugar N. Si en la primera etapa se ha jugado (N,N) jugar P. En caso contrario jugar C. En T etapas tenemos un EPS si ambos jugadores juegan con la estrategia: Si en las etapas anteriores todos los jugadores han jugado N jugar N, salvo en la ultima etapa que jugamos P.

Proposición En un juego repetido cuyo juego de etapa G = {Si, πi, i = 1,. . ., N} tiene exactamente un equilibrio de Nash, (s1*, s2*, ..., Sn*), hay un único EPS. En este equilibrio, el jugador i si juega si* en cada una de las etapas, independientemente de lo que podría haber sido interpretado por él mismo o cualquiera de los otros, en cualquier etapa anterior El dilema del prisionero en T etapas. El juego de etapa tiene un único equilibrio $(C,C)$. Los jugadores pueden jugar en todo momento como si les quedara una única etapa. El juego completo tiene un único equilibrio: los dos jugadores confiesan siempre y en cualquier contingencia Nota Si hay más de un equilibrio de Nash, siempre existe la posibilidad de mantener un buen comportamiento en las primeras etapas de interacción repetida. El buen comportamiento en las interacciones tempranas puede ser recompensado por el juego de mejores equilibrios de Nash en subjuegos futuros, mientras que cualquier desviación de esta conducta puede ser castigado por el juego de los malos equilibrios de Nash en subjuegos futuros.

El dilema del prisionero iterado infinitamente. Tras cada interacción entre los prisioneros, y una vez reveladas sus decisiones, vuelven a interactuar sin fin definido Factor de descuento asociado a un interés 𝛿= 1 1+𝑖 Probabilidad p de que el juego termine 𝛿=1−𝑝

Estrategia del disparador severo (grim trigger strategy) Jugar N en la primera etapa. Si en las etapas anteriores los jugadores han jugado siempre N entonces jugar N. En caso contrario jugar $C$ de ahora en adelante. Si ambos jugadores juegan con la estrategia del disparador severo tenemos un EPS:

Estrategia del disparador con perdón (forgiving trigger strategy) En las estrategias del tipo disparador hay un perfil de estrategias cooperativo tras el cual, si algunos de los jugadores se desvía, el jugador juega un perfil de estrategias de castigo. Jugar $N$ en la primera etapa. Si en todas las etapas anteriores ambos jugadores han jugado siempre N entonces jugar N. Si algún jugador ha jugado C entonces jugar C en las T etapas siguientes y jugar N en la etapa T+1 con la estrategia en mente Si ambos jugadores juegan con esta estrategia tenemos un EPS cuyos pagos son mayores que en el disparador severo

Un ciclo de comportamiento (behavior cycle) es una sucesión de acciones que se repite. Jugar (N,N) T1 etapas Jugar (C,C) T2 etapas Jugar (N,C) T3 etapas Jugar (C,N) T4 etapas Tras las T=T1+T2+T3+T4 etapas repetir el ciclo Un ciclo de comportamiento es individualmente racional si cada jugador obtiene pagos estrictamente positivos dentro del ciclo Teorema popular (Folk theorem) Comportamiento en equilibrio. Cualquier ciclo de comportamiento individualmente racional es factible como EPS (siempre que el factor de descuento δ es cercano a 1). Estrategia Equilibrio. Una estrategia que constituye un equilibrio es el disparador severo: comenzar con el ciclo de la conducta deseada y continuar con él. Si cualquier jugador se desvía entonces jugar (c, c) siempre después