Teoría de juegos: Equilibrio de Nash Rafael Salas marzo de 2006

Teoría de juegos: Equilibrio de Nash Rafael Salas marzo de 2006
UNIVERSIDAD COMPLUTENSE DE MADRID Departamento de Fundamentos del Análisis Económico I Teoría de juegos: Equilibrio de Nash Rafael Salas marzo de 2006

Ui(si*,s-i*)  Ui(si,s-i*), si Si, i=1,...,n
Equilibrio de Nash (si*,s-i*) es un EN en estrategias puras si y sólo si Ui(si*,s-i*)  Ui(si,s-i*), si Si, i=1,...,n

Equilibrio de Nash: mejor respuesta
Nótese que cumple las siguientes propiedades: (1) si* es mejor respuesta de i a la estrategia s-i. Esto es, Ui(si*,s-i)  Ui(si,s-i), si Si, dado s-i Implica que es racionalizable: son las mejores respuestas a cualquier estrategia, conjetura o creencia, que cualquier individuo puede formarse sobre el comportamiento de los otros. No existen incentivos a desviarse unilateralmente (self-enforcing)

Equilibrio de Nash: compatibilidad
(2) las mejor respuestas (si*,s-i*) son compatibles entre sí, que lo hace ser una situación de equilibrio sostenible. Implica que, en equilibrio, los individuos aciertan sobre las conjeturas o creencias que se forman sobre las estrategias de los otros.

Equilibrio de Nash: concepto amplio
(3) Es un concepto más amplio que los cuatro conceptos de equilibrio anteriores: EEED, EEDD, EEIEED y EEIEDD. Todo equilibrio anterior, si existe, es EN. Pero no al revés (por ejemplo, la batalla de los sexos)...

Ejemplo 4: dilema de los presos
JUG 2 CA CO 2 4 CA 2 JUG 1 1 CO 4 1 .

Otros ejemplo : dilema de los presos
Oligopolios Pesca Aranceles Carrera armamentista Ejemplo: dilema de los presos altruista Otros ejemplos: autobús .

Ejemplo : carrera armamentista
JUG 2 D R 1,5 2 D 1,5 JUG 1 1 R 2 1 .

Ejemplo 1: batalla de los sexos
JUG 2 O B 1 O 4 JUG 1 -1 4 B -1 1 .

Otros ejemplos : batalla de los sexos
Departamentos en una empresa y uso de equipo informático Carrera armamentística modificada .

Ejemplo : carrera armamentista modificada
JUG 2 D R 3 2 D 3 JUG 1 1 R 2 1 .

Ejemplo 5bis: ciervo-liebre
JUG 2 C L 2 1 C 2 JUG 1 1/2 L 1 1/2 .

Ejemplo 5: Halcón-paloma
JUG 2 H P 2-k , 2-k 4 , 0 H JUG 1 0 , 4 2 , 2 P .

Ejemplo 3: Preferencias idénticas
JUG 2 IZQ DCHA 1 , 1 -1 , -1 IZQ JUG 1 -1 , -1 1 , 1 DCHA .

Ejemplo 3 bis: Preferencias idénticas
JUG 2 APPLE IBM 2 , 2 0 , 0 APPLE JUG 1 0 , 0 1 , 1 IBM .

Equilibrio de Nash (4) EL EN puede ser múltiple.
Con la eliminación de estrategias estrictamente dominadas nunca eliminamos un EN del juego (los EN asignan una probabilidad cero a usar estrategia estrictamente dominadas). Por lo tanto, si existe un EEED ó un EEIEED (que son único), el EN es único también. Con la eliminación de estrategias débilmente dominadas podemos eliminar algún EN del juego (en ese caso, los EN eliminados asignan una probabilidad positiva a usar estrategia estrictamente dominadas). Pero si existe un EEDD ó un EEIEDD (que puede ser múltiple), éstos son EN necesariamente. Luego algún EN (de los que perduran a la eliminación) asigna probabilidad cero a estrategias débilmente dominadas.

Ejemplo 16: algún EN desaparece con EEIEDD
JUG 2 I M D 1 -2 U 10 5 4 JUG 1 1 -1 D 10 5 1 .

Práctica . Demostrad formalmente:
(1) Todos los EN sobreviven a la eliminación de estrategias estrictamente dominadas (2) No ocurre lo mismo con la eliminación de estrategias débilmente dominadas (3) Todo equilibrio por eliminación de estrategias débilmente dominadas es un equilibrio de Nash (EEIEDD implica EN) .

Función mejor respuesta
si* es mejor respuesta de i a la estrategia s-i. Esto es, Ui(si*,s-i)  Ui(si,s-i), si Si, dado s-i Definimos la función (corres.) mejor respuesta MRi(s-i) como: MRi(s-i)={si* Si : Ui(si*,s-i)  Ui(si,s-i), si Si}

Equilibrio Nash (si*,s-i*) es un EN si y sólo si: si*= MRi(s-i*) i

Ilustraciones Modelo de oligopolio de Cournot
Modelo de oligopolio de Bertrand Competencia electoral Subastas

Modelo de duopolio de Cournot
Dos empresas que producen producto homogéneo, compiten en cantidades. La demanda agregada es P=a-X, donde X=X1+X2 y los costes Ci=c Xi, a y c>0. El conjunto de estrategias es Xi  [0,a]. Los pagos Bi(Xi,X-i) = PXi - Ci = {a- (Xi+X-i) }Xi - c Xi son: Bi(Xi,X-i)/ Xi = (a-c) - 2Xi - X-i 2Bi(Xi,X-i)/ Xi2 = - 2 < 0

Modelo de duopolio Cournot
¿Cuál es la solución?... Mejores respuestas de 1 y 2: B1(X1,X2)/ X1 = 0  (a-c) - 2X1- X2 = 0 B2(X1,X2)/ X2 = 0  (a-c) - 2X2- X1 = 0 El EN es la solución del sistema anterior: X1*= X2* = (a-c)/3

Representación: Dibujamos las funciones de mejor respuesta (funciones de reacción) X2 (a-c) R1 (a-c)/2 EN X2* R2 X1* (a-c)/2 (a-c) X1 SOLUCIÓN: X1*= X2* = (a-c)/3 No es eficiente, puesto que (desde el punto de vista de las empresas) la solución del monopolio lo es: X=(a-c)/2 .

Práctica (1) Un duopolio, fijador de cantidades y maximizador de beneficios, que suministra productos homogéneos. La demanda del mercado es: p(x)=max {0, a-x} Calcular el EN en el caso Ci=cix i , i=1,2 y donde a>c1>c2>0 (b) ¿Qué empresa produce más en equilibrio? (c) Calcular el efecto de un una elevación del coste de 2 .

Práctica (1’) Un duopolio, fijador de cantidades y maximizador de beneficios, que suministra productos homogéneos. La demanda del mercado es: p(x)=max {0, 1-x} (a) calcular el EN en el caso Ci=1/2xi , i=1,2 (b) calcular el EN en el caso Ci=1/2xi -3/4 xi2, i=1,2 .

Práctica (1’’) Un oligopolio de n empresas, fijador de cantidades y maximizador de beneficios, que suministra productos homogéneos. La demanda del mercado es: p(x)=max {0, a-x} (a) calcular el EN en el caso Ci=cxi , i=1,...,n .

Modelo de oligopolio de Cournot
Mejores respuestas de i: Bi(Xi,X-i)/ Xi = 0  (a-c) - 2Xi- X-i = 0 Dado que hay simetría, X1 = X2 =...= Xn. El EN es: X1*= X2* =...= Xn* = (a-c)/n+1

Práctica: modelo de Bertrand
(2) Un duopolio, fijador de precios y maximizador de beneficios, que suministra productos homogéneos. La empresa que fije el precio más bajo se lleva todo el mercado. Si fijan el mismo precio, las empresas se reparte al 50% el mercado. La demanda del mercado es: x(p)=max {0, 15-p} donde p= min{p1, p2} y el coste es Ci=2xi , i=1,2 (a) calcular el EN en el caso p es un real entre 0 y 15. (b) calcular el EN en el caso p es un entero entre 0 y 15. .

Bertrand precios enteros
2 2 3 4 5 6 7 8 9 10 11 12 2 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 0 , 0 3 0 , 0 6 , 6 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 12 , 0 4 0 , 0 0, 12 11, 11 22, 0 22, 0 22, 0 22, 0 22, 0 22, 0 22, 0 22, 0 1 5 0 , 0 0, 12 0, 22 15, 15 30, 0 30, 0 30, 0 30, 0 30, 0 30, 0 30, 0 6 0 , 0 0, 12 0, 22 0, 30 18, 18 36, 0 36, 0 36, 0 36, 0 36, 0 36, 0 7 0 , 0 0, 12 0, 22 0, 30 0, 36 20, 20 40, 0 40, 0 40, 0 40, 0 40, 0 8 0 , 0 0, 12 0, 22 0, 30 0, 36 0, 40 21, 21 42, 0 42, 0 42, 0 42, 0 9 0 , 0 0, 12 0, 22 0, 30 0, 36 0, 40 0, 42 21, 21 40, 0 40, 0 40, 0 10 0 , 0 0, 12 0, 22 0, 30 0, 36 0, 40 0, 42 0, 40 20, 20 36, 0 36, 0 11 0 , 0 0, 12 0, 22 0, 30 0, 36 0, 40 0, 42 0, 40 0, 36 18, 18 30, 0 12 0 , 0 0, 12 0, 22 0, 30 0, 36 0, 40 0, 42 0, 40 0, 36 0, 30 15, 15 13 0 , 0 0, 12 0, 22 0, 30 0, 36 0, 40 0, 42 0, 40 0, 36 0, 30 0, 22 .

Equilibrio de Nash: existencia
Teorema de Nash (1950) en estrategias mixtas En todo juego en forma normal o estratégica G ={1,...,n; S1,...,Sn;U1,...,Un} con un número de jugadores finitos y de estrategias finito en Si , i, existe al menos un equilibrio de Nash en estrategias mixtas. Demostración : se basa en el teorema del punto fijo sobre correspondencias de buen comportamiento, Kakutani (1941). Será enunciado más tarde, cuando generalicemos el teorema anterior.

Estrategias mixtas Definimos una estrategia mixta del jugador i como un vector de probabilidades pi definidas sobre todas las estrategias puras disponibles si  Si. pi* es la mejor respuesta en estrategias mixtas a la estrategia mixta p-i, si y sólo si, alcanza la mayor utilidad esperada. Esto es, pi*Ui(pi*,p-i)  piUi(pi,p-i), pi sobre si Si, i=1,...,n; dado p-i sobre s-i

Equilibrio de Nash en estrategias mixtas
(pi*,p-i*) es un EN en estrategias mixtas si y sólo si pi*Ui(pi*,p-i*)  piUi(pi,p-i*), pi definida sobre si Si, i=1,...,n pi* es una mejor respuesta en estrategias mixtas del jugador i y existe compatibilidad. Ejemplos: juego de las monedas y batalla de los sexos

El juego de las monedas JUG 2 1 , -1 -1 , 1 JUG 1 -1 , 1 1 , -1 . CA
CR 1 , -1 -1 , 1 CA JUG 1 -1 , 1 1 , -1 CR .

El juego de las monedas JUG 2 1 , -1 -1 , 1 JUG 1 -1 , 1 1 , -1 .
SOLUCION: subrayamos las mejores respuestas NO HAY EQUILIBRIO DE NASH en estrategias puras DEBE EXISTIR AL MENOS UNO en estrategias mixtas JUG 2 CA CR 1 , -1 -1 , 1 CA JUG 1 -1 , 1 1 , -1 CR .

El juego de las monedas Definimos la estrategia mixta del jugador 1 como (p,1-p) sobre (CR,CA) y la estrategia mixta del jugador 2 como (q,1-q) sobre (CR,CA), p y q . Veamos la utilidad esperada del jugador 2 de adoptar CA ó CR, dada la estrategia mixta del jugador 1 como (p,1-p) sobre (CR,CA): UECA2 = p(1)+(1-p)(-1)=2p-1 UECR2 = p(-1)+(1-p)(1)=1-2p Veamos la utilidad esperada del jugador 1 de adoptar CA ó CR, dada la estrategia mixta del jugador 1 como (q,1-q) sobre (CR,CA): UECA1 = q(-1)+(1-q)(1)=1-2q UECR1 = q(1)+(1-q)(-1)=2q-1 Las dibujamos, para determinar las mejores respuestas en estrategias mixtas...

El juego de las monedas Maximizamos la utilidad esperada en estrategias mixtas de los dos jugadores EN VERDE RAYADA: las UE máximas (mejores respuestas) para cada estrategia mixta del contrario p UE2 1/2 1 -1 UECR2 UECA2 q UE1 1/2 1 -1 UECA1 UECR1 .

þ ý ü þ ý ü El juego de las monedas q=1 p < 1/2 q[0,1 p = 1/2
Las correspondencias de mejores respuestas en estrategias mixtas: R2 (p)= R1 (p)= þ ý ü q=1 q=0 q[0,1 p < 1/2 p = 1/2 p > 1/2 þ ý ü p=0 p=1 p[0,1 q < 1/2 q = 1/2 q > 1/2

El juego de las monedas q p .
Dibujamos las correspondencias de mejores respuestas en estrategias mixtas EN ROJO: las del JUG 1. EN AZUL: las del JUG 2 LA SOLUCIÓN: (p*, q*)=(1/2, 1/2) Los jugadores randomizan sus estrategias al 50% y obtienen un pago de (0, 0) CR, CR CA,CR 1 q 1/2 1/2 1 CA,CA p CR, CA .

La batalla de los sexos JUG 2 4 , 1 0 , 0 JUG 1 -1 , -1 1 , 4 . B O B

La batalla de los sexos q p .
Dibujamos las correspondencias de mejores respuestas en estrategias mixtas EN ROJO: las del JUG 1. EN AZUL: las del JUG 2 SOLUCI0NES: Las dos estrategias puras más una mixta (p*, q*)=(1/6, 5/6). Los jugadores randomizan sus estrategias al 16,7% y 83,3% obtienen un pago de (0.66, 0.66) que no es eficiente O,O B,O 1 5/6 q 1/6 1 B,B p O,B .

Equilibrio de Nash: punto fijo de correspondencias de mejor respuesta
Definimos la correspondencia de mejor respuesta del jugador i Ri: s si* s S De esta forma: si* = Ri (s) s =(si,s-i) S, tal que: Ui(si*,s-i) = max Ui(si,s-i), si Si Para todo i=1,...,n; la correspondencia de mejor respuesta será: R: s s* s S donde s*=(s1*,...,sn*)

Equilibrio de Nash: punto fijo de correspondencias de mejor respuesta
Definimos el equilibrio de Nash s*=(s1*,...,sn*) como R: s* s* o lo que es lo mismo: s* = R (s*) Esto es lo que se conoce como un punto fijo de la correspondencia de mejor respuesta R(s)

Ilustración: caso de una variable
En el caso de que s sea una variable. Un punto fijo sería: R(s) R(s*) 45º s* s .

Teorema de Kakutani (1941): existencia de puntos fijos de correspondencias
Establece las condiciones suficientes que garantizan la existencia de un punto fijo de correspondencias Si el conjunto S es compacto (acotado y cerrado) y convexo y R(s) es una correspondencia hemi-contínua superior y convexa para todo s, existe siempre un punto fijo (y por tanto un EN)

Ilustración: caso de una variable
Caso de S compacto y convexo y una correspondencia R(s) hemi-contínua superior, pero no convexa para todo s: No se garantiza la existencia de un punto fijo. R(s) 45º s .

Teorema de Nash: generalización
Teorema de Nash (1951) en estrategias contínuas En todo juego en forma normal o estratégica G ={1,...,n; S1,...,Sn;U1,...,Un} donde el conjunto de estrategias es compacto y convexo y donde las funciones de pagos es contínua en S y cuasi-cóncava en si, existe al menos un equilibrio de Nash. Demostración : aplicación del teorema del punto fijo sobre correspondencias de Kakutani (1941). Si la función de pago es contínua, R(s) es hemi-contínua superior y si la función de pagos es cuasi-cóncava en si, R(s) es convexo para todo s. Generalización : el teorema en estrategias mixtas es un caso particular, donde el conjunto de estrategias es compacto y convexo y la función de pagos lineal en si (por lo tanto, cuasi-cóncava)

Teorema de Nash: generalización
Demostración : aplicación del teorema del punto fijo sobre correspondencias de Kakutani (1941). Si la función de pago es contínua, R(s) es hemi-contínua superior y si es cuasi-cóncava en si , R(s) es convexo para todo s.

Cuasi-concavidad de función de pagos
DEF: F pagos Ui (si,s-i) cuasi-cónvava en si si y sólo si, dados cualquier s1 y s2, tales que Ui (s1,s-i) = Ui (s2,s-i) y [0,1], entonces: Ui (s1+(1-) s2,s-i)  Ui (s1,s-i) = Ui (s2,s-i) PROPOSICIÓN: Si la función de pago es cuasi-cóncava en si , R(s) es convexo para todo s. PRUEBA: Si R(s) es no convexa: dadas s1 y s2  Ri(s) dos mejores respuestas de s, entonces s1+(1-) s2  Ri(s), [0,1] Por lo que, Ui (s1+(1-) s2,s-i) < Ui (s1,s-i) = Ui (s2,s-i) Esto contradice la cuasi-concavidad de la función de pagos en si

Práctica (3) Dos empresas fijadoras del precio producen dos bienes sustitutos cercanos, con demandas: x1(P1,P2)= a-P1 +bP2 x2(P1,P2)= a-P2 +bP1 (a) calcular el EN en el caso Ci=cxi , i=1,2 y b>0 .

Modelo de duopolio de Bertrand con producto diferenciado
Dos empresas que producen producto diferenciado, compiten en precios. Los costes Ci=c Xi, a y c>0. El conjunto de estrategias es Pi  [0,), no acotado Los pagos Bi(Pi,Pj) = PiXi - cXi = Pi(a-Pi+bPj) - Pi(a-Pi+bPj) son: Bi(Pi,Pj)/ Pi = a+bPj-2Pi+c 2Bi(Pi,Pj)/ Pi2 = - 2 < 0

Modelo de duopolio de Bertrand con producto diferenciado
Mejores respuestas de 1 y 2: B1(P1,P2)/ P1 = 0  P1= (a+c+bP2)/2 B2(P1,P2)/ P2 = 0  P2= (a+c+bP1)/2 El EN es la solución del sistema anterior: P1*= P2* = (a+c)/(2-b) existe solución sólo si 0<b<2 solución

Práctica (4) Dos empresas fijadoras del precio producen dos bienes sustitutos cercanos, con demandas: X1(P1,P2)= max {0, P22 -5P1P2} X2(P1,P2)=max {0, 30+20P12-0,5P1P2} (a) calcular el EN en el caso Ci=10xi , i=1,2 (b) ¿se dan las condiciones suficientes que garantizan la existencia del EN? .

Práctica (5) Dos empresas fijadoras del precio producen dos bienes sustitutos cercanos, con demandas: X1(P1,P2)= 10P2/P1 X2(P1,P2)= 20P1/P2 (a) calcular el EN en el caso Ci=50xi , i=1,2 (b) ¿se dan las condiciones suficientes que garantizan la existencia del EN? .

Práctica (6) 10 pescadores faenan en una zona pesquera. Cada uno dispone de una flota gi. El número total de barcos es G=g1+...+g10..El coste por barco es constante igual a c=10. La producción pesquera viene dada por la función vi=100-2G (por barco). (a) calcular el EN del juego y observar si se llega a una producción eficiente. .

Teoría de juegos: Equilibrio de Nash Rafael Salas marzo de 2006

Presentaciones similares

Presentación del tema: "Teoría de juegos: Equilibrio de Nash Rafael Salas marzo de 2006"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

Teoría de juegos: Equilibrio de Nash Rafael Salas marzo de 2006

Presentaciones similares

Presentación del tema: "Teoría de juegos: Equilibrio de Nash Rafael Salas marzo de 2006"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback