Von Neumann, Nash, Mentes Brillantes y la Teoría de Juegos

Slides:



Advertisements
Presentaciones similares
UN MUNDO LLENO DE PROBLEMAS
Advertisements

Nuestro trabajo: Tomar decisiones Resolver problemas.
(información perfecta)
Introducción a la teoría de juegos Rafael Salas abril de 2010
Tema 3. Juegos simultáneos : el equilibrio de Nash.
El dilema de los prisioneros
Razonamiento estratégico
Nos centraremos en la repetición de juegos con estructura del dilema del prisionero, en los que se produce un conflicto entre el resultado eficiente, que.
Acción débilmente dominante
CONTRIBUIR O NO AL JARDÍN.
Tema 5. Juegos secuenciales con información perfecta.
PARTE I: JUEGOS SIMULTANEOS.
Tema 4. Juegos simultáneos con información incompleta.
Ejemplo 2: Reparto de 3 objetos indivisibles.
LAS PIEZAS.
¿ EXISTE DIOS ? Trabajo Hecho por: Germán Alonso.
TEORIA DE JUEGOS Trata del comportamiento estratégico, del comportamiento en interacción. Esto es fundamental en la gerencia política. En teoría de juegos.
Actividades de conteo en Nivel Inicial
NEGOCIACIÓN ESTRATÉGICA
Investigación de Operaciones
MICROECONOMIA HAL VARIAN
JAC Elegir sin suficiente información. La información es la base para tomar cualquier decisión. Si eliges unos estudios guiándote por los estereotipos,
El ajedrez.
UNIVERSIDAD COMPLUTENSE DE MADRID D epartamento de Fundamentos del Análisis Económico I Teoría de juegos: Tema 2 Rafael Salas febrero de 2005.
Supongamos que nos plantean el siguiente problema:
Teoria de grafos.-clase 4
Decisiones bajo Incertidumbre Teoría de Juegos
ANALISIS DE DATOS CON EXCEL
3.5. Competencia en precios con restricciones de capacidad - Solución de Edgeworth Matilde Machado.
Dirección General Oscar Moreno
ADMINISTRACION DE NEGOCIOS IV
Teoría de la decisión.
Leydy Johanna Hernández
Estas combinaciones implican, a menudo, la coronación de un Peón o un mate en la última fila. A veces los dos incidentes aparecen en la misma combinación,
Una empresa encarga una tarea a un equipo formado por dos trabajadores. Estos deberán decidir simultáneamente si realizan esfuerzo alto (e = 2) o esfuerzo.
Rafael Gómez Costumero.. EL DILEMA DEL PRISIONERO es uno de los problemas que más claramente ejemplifican la teoría de juegos. TEORÍA DE JUEGOS : Es.
TEMA 4 JUEGOS SECUENCIALES CON INFORMACIÓN PERFECTA. Manual: cap. 6
Diseño y análisis de algoritmos
TEXTO EXPOSITIVO.
Descomposición Factorial Unidad 5
Control Estadístico de Procesos Introducción a la Probabilidad.
UNIVERSIDAD AUTONOMA SAN FRANCISCO
BRENDA YAKELINE SALAZAR FAUSTINO
LAS REUNIONES 15 No exijamos de más al Presiente de Debates!
3.1. Características del comportamiento estratégico
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Tema 4. Oligopolio Concepto.
Introducción a la Teoría de Juegos
Teoría de juegos: Juegos repetidos Rafael Salas mayo de 2006
“Juegos consecutivos”.  Hasta ahora nos hemos limitado a analizar los juegos en los que los movimientos eran simultáneos. Pero muchos juegos de interés.
NÚMEROS REALES.
Variables estadísticas bidimensionales
JOHN STUART MILL.
DOCENCIA EN LA CLÍNICA MÉDICA: nuevas herramientas para un aprendizaje significativo Curso Perfeccionamiento Escuela de Medicina Universidad Valparaíso.
AJEDREZ Carlos A. Alsina.
El 65% de los encuestados, no tienen pareja frente a un 35 % que si. Esto significa que los jóvenes de hoy en día no son partidarios de mantener una relación.
Teoría de Juego: Juegos estáticos con información completa
La necesidad de sistematizar las experiencias de su trabajo es un aspecto frecuentemente mencionado por muchas personas que trabajan en el campo de desarrollo.
DILEMA DE LOS PRISIONEROS REPETIDO CON HORIZONTE FINITO E INFORMACIÓN INCOMPLETA. Considere el siguiente Dilema de los Prisioneros (donde C es cooperar.
Universidad de San Pedro Sula
Monterrey, Nuevo León a 26 de noviembre de  En este escrito reflexivo hablaré sobre los siete saberes necesarios para la educación del futuro,
Modelos de ComunicaciónDefiniciónDesventajasReflexión Aguja HipodérmicaEsquemas simples de estímulo-respuesta.Solamente acepta una vía y no existe retroalimentación.
Variables estadísticas bidimensionales
REGLAMENTO Y BASES DE LA CANASTA El campeonato se desarrollará según la cantidad de personas inscriptas: por grupo o por eliminación. Se premiará el.
1 2  La Teoría de la Probabilidad constituye la base o fundamento de la Estadística, ya que las ingerencias que hagamos sobre la población o poblaciones.
TEMA: DECISIONES BAJO RIESGO –TEORIA DE JUEGOS Ing. Larry D. Concha B.
EL AJEDREZ Potenciar las capacidades de cálculo, de análisis y de síntesis; se mejora la percepción, la discriminación, la creatividad, la imaginación,
Un hombre de negocios acababa de apagar las luces de la tienda cuando un hombre apareció y demandó dinero. El dueño abrió una caja registradora. El contenido.
 EL LEGUAJE JURÍDICO Y SU RELACIÓN CON LA ARGUMENTACIÓN:  Un discurso constituye una argumentación cuando se plantea como objetivo: justificar, motivar,
Las 5 Preguntas más Efectivas para Usar cuando se Cierra acuerdo con una nueva Consultora.
Transcripción de la presentación:

Von Neumann, Nash, Mentes Brillantes y la Teoría de Juegos Guillermo Durán Departamento de Computación Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires

Imaginemos el siguiente juego (macabro, por cierto): Dos personas, que llamaremos A y B, son colocadas en habitaciones separadas con un botón próximo a cada una. Saben que ambos serán matados a menos que uno apriete su respectivo botón en la próxima hora. La primer persona que apriete el botón salvará a la otra, pero se condenará a su propia muerte. Asumiremos que A y B se aman mutuamente. ¿Qué estrategia tendrá cada uno?

Claramente, ambos deben hacer una evaluación de quien debe salvarse y obrar en consecuencia. Representemos las estrategias posibles en una matriz: A B Salvar a A Salvar a B (1,1) (2,1) (1,2) (2,2)

El caso sencillo es cuando los dos llegan a la misma conclusión: A debe salvarse y B sacrificarse, o viceversa. Serían los casos (1,1) y (2,2) de la matriz. En el primero A espera que B toque el botón, y ambos están de acuerdo. En el segundo, B espera que A toque el botón, y listo.

Los casos de conflicto son los otros dos, y en cierta medida son similares entre sí. El de (2,1) lo podríamos llamar el de “amor profundo”. Ambos quieren salvar al otro. En este caso se desataría una carrera por llegar primero al botón para cumplir con el deseo. El de (1,2) lo podríamos llamar el de “amor, pero no tanto”. Ambos esperan el sacrificio del otro. En este caso, van a esperar hasta el último segundo para apretar el botón (una especie de carrera para llegar último al botón).

El dilema nuclear: un “juego” un poco más real En Agosto de 1949 la Unión Soviética explotó su primer bomba atómica en Siberia, demostrando que ya poseía la tecnología necesaria. Mucho antes de lo que los americanos (y sus aliados) habían esperado ya había dos poderes atómicos. El mundo estaba ante una situación similar a la que mostramos en el juego anterior.

Estados Unidos y la Unión Soviética tenían dos opciones: apretar el “botón nuclear” y hacer desaparecer a su enemigo de la faz de la tierra o mantener su poderío nuclear como una amenaza latente. USA URSS Apretar No Apretar (1,1) (2,1) (1,2) (2,2)

El caso (1,1) de la matriz ahora no es posible, por motivos obvios. Los casos simétricos (1,2) y (2,1) permitían terminar definitivamente con el enemigo, pero pagando el costo mundial del uso de la bomba. El caso (2,2) aparecía como una suerte de “equilibrio” donde los dos mantenían la amenaza latente (y de hecho fue lo que pasó en la práctica).

Para 1950, importantes sectores de USA y sus aliados europeos creían que Estados Unidos debía contemplar seriamente la idea de un ataque nuclear sobre la entonces URSS. Lo llamaban “la guerra preventiva”. Contra lo que uno podría suponer, “la guerra preventiva” estaba defendida por algunos de los principales intelectuales americanos, entre ellos dos de los más famosos matemáticos del momento: Bertrand Russell y John von Neumann.

John von Neumann (1903-1957) fue el creador de la teoría de juegos. Desde la década del ’20 estuvo trabajando en la estructura matemática del poker y otros juegos, pero enseguida vio que sus teoremas podían ser aplicados a economía, política, relaciones internacionales, etc. JVN demostró matemáticamente que siempre hay un curso racional de acción para juegos de dos jugadores, con intereses completamente opuestos (uno gana y el otro pierde). Esta prueba es conocida como el Teorema Minimax.

La clase de juegos cubiertos por este Teorema incluye un montón de juegos recreativos, desde el ta-te-ti hasta el ajedrez. JVN probó que siempre hay una forma optimal de jugar a dichos juegos. La primer referencia bibliográfica que aparece sobre estos temas es un artículo de von Neumann de 1928, ampliado años después en el libro “Theory of Games and Economic Behavior”, de von Neumann y Morgenstern, publicado en 1944.

¿Qué es la Teoría de Juegos? Es la teoría matemática que modela situaciones de conflicto. Una situación de conflicto (un juego) es una situación en la cual individuos (jugadores) interactúan y obtienen resultados que dependen de tal interacción. Cada jugador tiene control parcial de la situación. Cada jugador tiene ciertas preferencias sobre los resultados posibles y se asume que estas preferencias son descriptas por una función numérica (función de utilidad). Cada jugador trata de llevar a cabo las estrategias que resulten más favorables a sus intereses, o sea, trata de maximizar su función de utilidad.

Tradicionalmente la TdJ clásica se ha dividido en dos ramas: Teoría Cooperativa y No Cooperativa. La TdJ No Cooperativa asume que no hay lugar para comunicación, correlación o acuerdos entre los jugadores, de no ser los explícitamente estipulados por las reglas del juego. Es de interés el describir recomendaciones para los jugadores tales que ninguno tenga incentivos para unilateralmente desviarse (si los demás siguen las recomendaciones, y yo me muevo, pierdo). Esta idea corresponde al concepto de Equilibrio de Nash. Es el concepto más importante en Teoría No Cooperativa y su estudio formal (John Nash, 1950) marcó un hito en el tema, que le terminó dando a Nash el premio Nobel de Economía en 1994 por su “análisis pionero del equilibrio en la teoría de los juegos no cooperativos”.

El Dilema del Prisionero Es el problema “madre” en Teoría de Juegos y tiene “infinitas” formulaciones diferentes. Veamos una de ellas: son detenidos dos hombres acusados de cometer un crimen y son encarcelados en celdas diferentes. El juez tiene ciertos indicios sobre la culpabilidad de ambos, pero decide hacer un interrogatorio planteándoles el siguiente dilema:

Si ambos se declaran inocentes, serán condenados a 3 años de prisión cada uno. Si ambos acusan al otro, serán condenados a 10 años de prisión cada uno. Si uno se declara inocente y es acusado por su compañero, será condenado a 20 años de prisión, mientras al otro le corresponde sólo 1. Llamaremos C a la estrategia “cooperativa” (declararse inocente) y D a la estrategia “defraudativa” (acusar al otro).

La matriz de pagos queda entonces de la siguiente manera: (3,3) (1,20) (20,1) (10,10) C D C D Una interpretación más interesante de situaciones que presentan las características del Dilema del Prisionero se presenta cuando dos empresas compiten en la venta de un mismo producto y tienen que fijar el precio del mismo. Pueden definir una estrategia de competición con la otra empresa y fijar un precio bajo (estrategia D), o elegir una estrategia de cooperación y fijar un precio alto (estrategia C). Es inmediato verificar que el único equilibrio de Nash de este juego es (D,D) .

Sin embargo, a simple vista resulta muy atractivo el resultado que surge de usar las estrategias (C,C) y naturalmente uno se preguntará si en alguna otra versión del modelo esta estrategia goza de una estabilidad apropiada. Un camino que da respuesta satisfactoria a este hecho surge de considerar un modelo donde el juego en cuestión se repite.

Ejemplos de estrategias en juegos repetidos: Estrategia Gatillo: D C Estrategia C-tft: D C Observación: estas estrategias asumen que los juegos son infinitos. La asunción de finitud modifica en parte las estrategias (excepto que el juego se repita una cantidad finita de veces, pero el número final sea desconocido).

¿Freno o no freno? En la vida cotidiana nos topamos con este tipo de decisiones todos los días. Supongamos que llegamos a una esquina en simultáneo con otro auto. Para darle un sentido económico al ejemplo, supongamos tambien que Lavagna abrió el corralito en forma muy restringida y que cada sucursal va a devolverle la plata al primero que llegue, y que justamente quien maneja el otro auto que llegó a la esquina conmigo tiene su plazo fijo en la misma sucursal que yo (y que además somos los dos que estamos por llegar primero).

La matriz de pagos podría ser la siguiente: ¿Cuáles son los equilibrios de Nash de este juego? (5,5) (10,0) (0,10) (-2,-2)

La Teoría de Movidas (TOM) (Theory of Moves, Steven Brams, 1994) Asume juegos estrictamente ordinales. Supongamos que tenemos dos actores (el jugador fila F y el jugador columna C) cada uno con dos posibles decisiones. Cada jugador ranquea los 4 estados del juego de 1 a 4 (1 es el peor estado, 4 es el mejor). Por ejemplo: C1 C2 (2,4) (1,1) (4,2) (3,3) F1 F2

Estos resultados son sólo ordinales, indican sólo un ordenamiento de los resultados de mejor a peor. No da ninguna graduación sobre cuanto la prefiere un jugador a un resultado sobre los otros. Sólo indica las preferencias de los jugadores. Primera diferencia entre la TOM y la TJC es que para la TJC importan las utilidades mientras que para la TOM no son relevantes.

Otra diferencia es que en la TJC los movimientos son en simultáneo, o al menos se realizan sin conocer el movimiento del otro jugador. En la TOM vamos a suponer que se mueve en forma alternada partiendo de un estado inicial y llegando a un estado final. Aparecen nuevos conceptos de equilibrios y estrategias que me llevan a mover o detenerme en un estado determinado. Veamos aplicaciones de la TOM a ejemplos que nos van a resultar cotidianos y cercanos.

La renuncia de Chacho Alvarez a la vicepresidencia Corría octubre del 2000 y se empezaba a resquebrajar la Alianza que había ganado las elecciones unos pocos meses antes. El vicepresidente de la Nación (y líder de uno de los partidos de la Alianza) había denunciado coimas en el Senado en la aprobación de la ley de reforma laboral. El presidente de la Nación (y uno de los líderes del otro partido de la Alianza) se debatía entre investigar a fondo las denuncias apoyando a su vicepresidente (y fortaleciendo la Alianza) o no hacer nada, dejando pedalear en el aire a Chacho. Chacho Alvarez se debatía entre renunciar o no renunciar.

¿Cómo repesentamos este juego en términos de la TOM? 1) La realidad (desde mi óptica) ¿Cuál es el estado inicial? ¿Cuál es el estado final? (3,1) (4,2) (2,3) (1,4) I NI R NR

2) De la Rua estadista (obviamente ficticio !) ¿Cuál es el estado inicial? ¿Cuál es el estado final? (3,1) (4,3) (2,2) (1,4) I NI R NR

El asalto Supongamos que soy asaltado por una persona armada. Definamos mi objetivo y el del ladrón en términos de prioridades: Los míos: 1)No salir herido. 2)Que no me roben. 3)Atraer la atención de la gente. El del ladrón (inteligente): 1)Robarme todo lo que tenga. 2)No llamar la atención. 3)Evitar el uso de la fuerza (si lo llegan a agarrar la pena es mucho peor)

¿Cómo repesentamos este juego en términos de la TOM? ¿Cuál es el estado inicial? ¿Cuál es el estado final? (2,2) (1,3) (4,1) (3,4) V NV R NR

Juegos Cooperativos Supongamos que tenemos 100 presos y se les plantea el siguiente problema. Se los coloca en una fila, cada uno con un gorro negro o blanco. El último de la fila ve todos los gorros, excepto el suyo. El anteúltimo de la fila ve todos los gorros, excepto el suyo y el del último. Y asi siguiendo... Cada preso para ser liberado debe acertar el color de su gorro, empieza a arriesgar el último, luego el anteúltimo, etc. Todos escuchan lo que dicen todos.Lo único que tienen permitido es arriesgar el color de su gorro, absolutamente ninguna cosa más.

¿Cuál será la estrategia conjunta para salvar a la mayor cantidad de presos? Una estrategia para salvar al menos al 50 %: Consiste en que cada preso de orden par dice el color del gorro del que tiene adelante. Así, garantizamos salvar a todos los de orden impar, ya que la estrategia es conocida por todos de antemano. Una estrategia para salvar seguro a todos menos al último de la fila (el primero que arriesga): El preso de orden 100 dice “blanco” si la cantidad de blancos que tiene adelante es impar, y “negro” en caso contrario. De ahí en adelante todos pueden deducir que gorro tienen contando la paridad de blancos y negros de los que tienen adelante.