Estrategias Mixtas En teoría de juegos una estrategia mixta, a veces también llamada estrategia mezclada (del nombre en inglés mixed strategy), es una.

Slides:



Advertisements
Presentaciones similares
Tema 4. Juegos simultáneos con información incompleta.
Advertisements

3.1. Características del comportamiento estratégico
Ejercicios ¿Cuáles son los equilibrios de Nash del siguiente juego en forma estratégica? Mencione sólo los equilibrios en estrategias puras
Ejercicio 1 Eliminación iterativa de estrategias estrictamente dominadas Resuelva, mediante la eliminación iterativa de estrategias estrictamente dominadas,
Estrategias Mixtas En teoría de juegos una estrategia mixta, a veces también llamada estrategia mezclada (del nombre en inglés mixed strategy), es una.
Sistemas de Ecuaciones Lineales
TEMA 5: PROBABILIDAD. Índice Experimentos aleatorios. Sucesos. Tipos de sucesos. Sucesos elementales Suceso seguro Suceso imposible Álgebra de sucesos.
Ejemplos de  2 y prueba de contingencia Queremos saber: 1.- Si la diferencia entre los parentales en cuanto al color de la flor se debe a un solo gen.
MATEMÁTICAS II Tema 3 Determinantes. Determinantes. Determinantes de orden dos y de orden tres. Propiedades de los determinantes. Cálculo del valor de.
Las distribuciones de probabilidad son idealizaciones de los polígonos de frecuencias. En el caso de una variable estadística continua consideramos el.
Límites y continuidad. Alguna vez ha estado Ud. en una playa de estacionamiento en el que puede “aproximarse” al automóvil de enfrente, pero no quiere.
Teoría de Juegos Introducción Dixit & Skeath, 1,2.
Funciones.
Apuntes Matemáticas 2º ESO
VALOR DE LA INFORMACION
PROPIEDADES DE LAS DESIGUALDADES
Conceptos de: variable, base, exponente, coeficiente, terminos.
3.1. Características del comportamiento estratégico
Apuntes 2º Bachillerato C.S.
DETERMINANTES U.D. 2 * 2º Angel Prieto Benito
GRÁFICAS Y FUNCIONES María José Peña Mártil MATEMÁTICAS
INECUACIONES Y SISTEMA DE INECUACIONES II
Árboles de Decisión Son modelos gráficos empleados para representar las decisiones secuenciales, así como la incertidumbre asociada a la ocurrencia de.
En INCERTIDUMBRE No se conocen las probabilidades de ocurrencia de los estados naturales, por lo tanto, hay que recurrir a criterios empíricos para tomar.
INVESTIGACIÓN DE OPERACIONES
Teoría de Juegos Sesión #5 Consolidación, Extensión y Discusión
Unidad 5. Capítulo II. Modelos de sistemas en forma matricial.
¿Cuándo usar esta distribución?
Matemáticas 2º Bachillerato CS
Tarea Apalancamiento Financiero y Operativo. Punto de Equilibrio
3.7. Colusión Tácita: juegos repetidos
Explicación de los ejercicios de la evaluación Nº2
Modelos de probabilidad Distribuciones continuas
Unidad 4. Capítulo IV. El Wronskiano de funciones.
PROGRAMACION DINAMICA
ESPERANZA MATEMÁTICA Una forma de mejorar nuestras decisiones.
Funciones Prof. M. Alonso
Teoría de Juegos Sesión #5 El Dilema del Prisionero Dixit & Skeath, 8.
Desigualdades e Inecuaciones
Teoría de la decisión Curso Métodos Cuantitativos Por Lic. Gabriel Leandro, MBA
TEMA Nº 1 Conjuntos numéricos. Aprendizajes esperados: Utilizar y clasificar los distintos conjuntos numéricos en sus diversas formas de expresión, tanto.
Kriging Consideremos información de determinada propiedad en el yacimiento y puntos en los cuales se tiene la estimación dea partir de los puntos.
4.4. La ciudad circular – El Modelo de Salop
Curso Métodos Cuantitativos Por Lic. Gabriel Leandro, MBA.
Juan José Bravo B., M.Sc. Solución de Modelos de Programación Lineal El Metodo Simplex Juan José Bravo B, M.Sc. ©
Taller de Matemáticas Financieras
Apuntes de Matemáticas 3º ESO
3.7. Colusión Tácita: juegos repetidos
3.1. Características del comportamiento estratégico
Operador de Suma La Letra Griega ∑ (sigma) se usa para indicar una suma, de manera qué:
Matemáticas Aplicadas CS I
3.1. Características del comportamiento estratégico
3.1. Características del comportamiento estratégico
AXIOMAS DE ARROW JAIMES GUTIERREZ LINDA KAREN PALOMA ADRIANA FUENTES VILCHIS.
Técnicas de conteo: Permutaciones y variaciones
Matrices Conceptos básicos. Matrices Buscando formas para describir situaciones en matemáticas y economía, llegamos al estudio de arreglos rectangulares.
Teoría de la decisión Curso Métodos Cuantitativos Por Lic. Gabriel Leandro, MBA
MATEMATICAS APLICADAS A LAS CCSS-II DEPARTAMENTO DE MATEMÁTICAS
3.7. Colusión Tácita: juegos repetidos
Optimización Luis Carlos Corral A.. Introducción En esta sección estudiamos la aplicación práctica de extremos de funciones (absolutos y relativos) mediante.
MATRICES. ¿QUÉ ES UNA MATRIZ? Una matriz es un espacio bidimensional que se genera en la memoria del computador. Las matrices deben tener un nombre que.
MÉTODO SIMPLEX. Ejemplo de Simplex: Vamos a resolver el siguiente problema: MaximizarZ = f(x 1,x 2 ) = 3x 1 + 2x 2 Sujeto a:2x 1 + x 2 ≤ 18 2x 1 + 3x.
CONTROLES Y ESTRUCTURAS BÁSICAS DE PROGRAMACIÓN  1. Algoritmos: conjunto de instrucciones programadas para resolver una tarea específica.  2. Datos:
Clase Reglas de Decisión Alternativas Teoría de la Decisión Lic.Santiago Tagle CRITERIO DE WALD Bajo la alternativa a i, el peor resultado posible que.
CAPITULO I Límite de Funciones de una Variable 1.Límites de funciones reales de una variable. Límites mediante la gráfica. Límites por aproximaciones.
Problema nº 3: Circunferencias
XXV Olimpiada Thales. PROBLEMAS DE IDIOMAS Solución Menú El profesor de Matemáticas le propuso a Arquimedín la siguiente cuestión: “En la clase de al.
Instrumentos de medición Pie de metro – medición en pulgadas
Resumen Posición, velocidad y aceleración son tres maneras diferentes de describir el movimiento aunque están relacionadas. El cambio con el tiempo es.
VARIANZA Y Y COVARIANZA DE VARIABLES ALEATORIAS Estadística II MI. MARTHA PAMELA RAMÍREZ VELA ITESM CAMPUS SALTILLO 1.
Transcripción de la presentación:

Estrategias Mixtas En teoría de juegos una estrategia mixta, a veces también llamada estrategia mezclada (del nombre en inglés mixed strategy), es una generalización de las estrategias puras, usada para describir la selección aleatoria de entre varias posibles estrategias puras, lo que determina siempre una distribución de probabilidad sobre el vector de estrategias de cada jugador.teoría de juegosestrategias purasdistribución de probabilidad Una estrategia totalmente mixta es aquella en la que el jugador asigna una probabilidad estrictamente positiva a cada estrategia pura. Las estrategias totalmente mixtas son importantes para el refinamiento del equilibrio.refinamiento del equilibrio

Ejemplo 1 – Estrategias Mixtas

Solución Ej. 1 En estrategias mixtas hay que hallar la función de pagos de cada jugador: (q) (1- q) (p) (1- p) Sacando factor común con la variable de decisión del jugador n o. 1, tenemos:

Solución Ej. 1 (cont. …) Lo representado entre corchetes va a obtenerlo el jugador nº 1 independientemente de cuál sea su elección – pues no depende de p –. El otro sumando es el que nos va a interesar para conocer cuál será su decisión óptima en función de lo que haga el otro. Fácilmente se puede apreciar que si q=2/7, el valor del paréntesis es cero, por lo que el jugador nº 1 será indiferente ante cualquier valor de p, pues eso no influirá en el pago que va a recibir. En otras palabras, si el jugador nº 2 opta por la estrategia X con probabilidad 2/7 y por la estrategia Y con probabilidad 5/7, el jugador nº 1 obtendrá el mismo pago utilizando la estrategia A o la estrategia B, o cualquier combinación lineal de ambas.

Solución Ej. 1 (cont. …) Por otro lado, si q tiene un valor inferior a 2/7, el valor del paréntesis será positivo, por lo que si el jugador nº 1 pretende maximizar su pago habrá de dar a p el valor más alto posible, es decir, tratándose como ocurre en este caso de una probabilidad, p debe valer 1. Finalmente, si q tiene un valor superior a 2/7, el valor del paréntesis será negativo, por lo que si el jugador nº 1 pretende maximizar su pago habrá de dar a p el valor más bajo posible, es decir, tratándose como ocurre en este caso de una probabilidad, p debe valer 0.

Solución Ej. 1 (cont. …) Podríamos representar, por tanto, esta función de reacción del jugador nº 1 que nos indica cuál es el p óptimo (p*), en función del valor de q.

Solución Ej. 1 Análogamente, la función de pagos del jugador nº 2 será: Sacando factor común la variable de decisión del jugador nº 2, tenemos: (q) (1- q) (p) (1- p)

Solución Ej. 1 Del mismo modo que ocurría con el jugador nº 1, lo representado entre corchetes va a obtenerlo el jugador nº 2 independientemente de cuál sea su elección – pues no depende de q –. El otro sumando es el que nos va a interesar para conocer cuál será su decisión óptima en función de lo que haga el otro jugador. Fácilmente se puede apreciar que, sea cual sea el valor de p, el valor del paréntesis es positivo – dado que p es una probabilidad y por tanto su valor está comprendido entre cero y uno –, por lo que el jugador nº 2, si pretende maximizar su pago, habrá de dar a q el valor más alto posible, es decir, tratándose como en este caso de una probabilidad, q debe valer 1.

Solución Ej. 1 (cont. …) Podríamos representar, por tanto, esta función de reacción del jugador nº 2 que nos indica cuál es el q óptimo (q*), en función del valor de p.

Solución Ej. 1 (cont. …) Si representamos en un mismo gráfico las funciones de reacción de cada individuo, que nos indican cuál es la respuesta óptima de cada uno de ellos ante lo que haga el otro, obtendremos, allí donde coincidan, los Equilibrios de Nash. En este caso, el único Equilibrio de Nash en estrategias mixtas es aquel en el que el jugador nº 1 utiliza la estrategia B con probabilidad 1 y el jugador nº 2 emplea la estrategia X con probabilidad 1; es el Equilibrio de Nash que ya habíamos calculado en estrategias puras, y no hay ninguno más.

Ejemplo 2 – Estrategias Mixtas

Solución Ej. 2 Puede ocurrir, no obstante, que exista algún otro Equilibrio de Nash en estrategias mixtas. Sacando factor común la variable de decisión del jugador nº 1, tenemos: (q) (1- q) (p) (1- p)

Solución Ej. 2 (cont. …) Como se puede apreciar, si q = 1/3, el valor del paréntesis es cero, por lo que el jugador nº 1 será indiferente ante cualquier valor de p, pues eso no influirá en el pago que va a recibir. Dicho de otro modo, si el jugador nº 2 opta por la estrategia X con probabilidad 1/3 y por la estrategia Y con probabilidad 2/3, el jugador nº 1 obtendrá el mismo pago utilizando la estrategia A o la estrategia B, o cualquier combinación lineal de ambas. Por otro lado, si q tiene un valor inferior a 1/3, el valor del paréntesis será positivo, por lo que si el jugador nº 1 pretende maximizar su pago habrá de dar a p el valor más alto posible, es decir, tratándose de una probabilidad, p debe valer 1. Finalmente, si q tiene un valor superior a 1/3, el valor del paréntesis será negativo, por lo que si el jugador nº 1 pretende maximizar su pago habrá de dar a p el valor más bajo posible, es decir, tratándose de una probabilidad, p deberá valer 0.

Solución Ej. 2 (cont. …) Podríamos representar, por tanto, esta función de reacción del jugador nº 1 que nos indica cuál es el p óptimo (p*), en función del valor de q.

Solución Ej. 2 Análogamente, la función de pagos del jugador nº 2 será: Sacando factor común la variable de decisión del jugador nº 2, tenemos: (q) (1- q) (p) (1- p)

Solución Ej. 2 Del mismo modo que ocurría con el jugador nº 1, lo representado entre corchetes va a obtenerlo el jugador nº 2 independientemente de cuál sea su elección – pues no depende de q –. El otro sumando es el que, por tanto, nos va a interesar para conocer cuál será su decisión óptima en función de lo que haga el otro jugador. Fácilmente se puede apreciar que si p es 2/3, el valor del paréntesis será cero, por lo que el jugador nº 2 estará indiferente por el valor de q, dado que siempre obtendrá el mismo pago sea cual sea éste. Si p es menor de 2/3 el valor del paréntesis será positivo, por lo que lo óptimo para el jugador nº 2 será otorgar a q el valor 1 (es decir, utilizar la estrategia X), mientras que si p es mayor de 2/3, dado que el valor del paréntesis será negativo, debería utilizar la estrategia Y (o lo que es lo mismo, dar a q el valor cero).

Solución Ej. 2 (cont. …) Podríamos representar, por tanto, esta función de reacción del jugador nº 2 que nos indica cuál es el q óptimo (q*), en función del valor de p.

Solución Ej. 2 (cont. …) Si representamos en un mismo gráfico las funciones de reacción de cada uno de los dos individuos, que nos indican cuál es la respuesta óptima de cada uno de ellos ante cualquier estrategia que pueda seguir el otro, obtendremos, allí donde coincidan, los Equilibrios de Nash. En este caso, aparecen tres Equilibrios de Nash en estrategias mixtas, que son los dos que ya conocíamos en estrategias puras y uno adicional. Éste es aquel en el que el jugador nº 1 utiliza la estrategia A con probabilidad 2/3 y la estrategia B, con probabilidad 1/3, y el jugador nº 2 emplea la estrategia X con probabilidad 1/3 y la estrategia Y con probabilidad 2/3:

Solución Ej. 2 (cont. …) El E.N. que figura en la parte superior izquierda del gráfico es en el que p vale cero y el valor de q es 1; es decir, (B, X). El de la parte inferior derecha se produce para los valores de uno y cero p y de q, respectivamente, por lo que se trata del E.N. ( A, Y).

LR T2,10,2 B1,23,0 Jugador N o. 1 Jugador N o. 2

Estrategias Mixtas u(T/q) = 2q + 0(1-q) = 2q u(B/q) = 1q + 3(1-q) = q+3-3q = -2q+3 2q >-2q+3, 4q>3, q>3/4 Si la probabilidad de que J2 elija L es >3/4 entonces, el J1 eligirá T Si la probabilidad de que J2 elija L es <3/4 entonces, el J1 eligirá B u(L/p) = 1p + 2(1-p) = p+2 – 2p = -p + 2 u(R/p) = 2p + 0(1-p) = 2p P+2>2p, 2>3p, 3p<2, p<2/3 Si la probabilidad de que J1 elija T es <2/3 entonces, el J2 eligirá L Si la probabilidad de que J1 elija B es >2/3 entonces, el J2 eligirá R ENEM = 2/3T+1/3B, 3/4L+1/4R

Nadal vs. Federer Cálculo del EN 1.- Sea q la probabilidad con la que Federer juega I (izquierda), veamos quéprefiere Nadal: u NADAL (I/q) = 0.5q + 0.9(1−q) = 0.9 − 0.4q u NADAL (D/q) = 0.7q + 0.5(1−q) = q Para que Nadal esté indeciso, debemos tener: 0.9 − 0.4q > q q = 2/3

Nadal vs. Federer Cálculo del EN Sea p la probabilidad con la que Nadal juega I, veamos qué prefiere Federer: u FEDERER (I/p) = 0.5p + 0.3(1−p) = q u FEDERER (D/p) = 0.1p + 0.5(1−p) = 0.5 − 0.4p Para que Federer esté indeciso, debemos tener: p > 0.5 − 0.4p p = 1/3 Escribiremos así el equilibrio: E.N.E.M:

Nadal vs. Federer La Función “mejor respuesta” La función mejor respuesta de Nadal nos debe decir cuál es su mejor estrategia para cada posible estrategia mixta de Federer: De igual manera calculamos la MR para Federer:

Nadal vs. Federer La Función “mejor respuesta”

Juego del Gallina En la película ‘Rebelde sin causa’, James Dean participa en el ‘juego del gallina’ con otro adolescente: Cada uno conduce a toda velocidad un coche hacia un acantilado; el primero que salta de su coche es un ‘gallina’. Suponga que los dos prefieren ser el último en saltar, pero también saltar primero a no saltar, para así evitar despeñarse. En tal caso, podemos representar el juego en forma estratégica como (nota: Que los dos salten ‘los últimos’ se interpreta como que ninguno salta; que los dos salten ‘los primeros’ significa que los dos saltan al mismo tiempo):

Halle los equilibrios de Nash en estrategias mixtas La utilidad esperada del jugador 1 (fila) es:

Halle los equilibrios de Nash en estrategias mixtas La utilidad esperada del jugador 2 (columna) es:

La Función “mejor respuesta” de ambos

Ejercicios Estrategias Mixtas 1 Jugador N o. 1 Jugador N o. 2

Ejercicios Estrategias Mixtas 2 Jugador N o. 1 Jugador N o. 2

Solución Ej. 1 En estrategias mixtas hay que hallar la función de pagos de cada jugador, y desarrollar el ejercicio de la manera siguiente: Jugador N o. 1 Jugador N o. 2