La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Toma de decisiones gerenciales clase 3

Presentaciones similares


Presentación del tema: "Toma de decisiones gerenciales clase 3"— Transcripción de la presentación:

1 Toma de decisiones gerenciales clase 3
Prof.Luis A.Medina

2 ¿Contenido General? Segunda Unidad
Toma de Decisiones bajo incertidumbre Teoría de los juegos Conceptos Juegos en forma normal Juegos de suma constante Juegos de suma no constante Criterio minimax Programación por metas Una meta u objetivos Múltiples metas Metas con ponderaciones y prioridades

3 Teoría de juegos De Wikipedia, la enciclopedia libre La teoría de juegos es un área de la matemática aplicada que utiliza modelos para estudiar interacciones en estructuras formalizadas de incentivos (los llamados juegos) y llevar a cabo procesos de decisión. Sus investigadores estudian las estrategias óptimas así como el comportamiento previsto y observado de individuos en juegos. Tipos de interacción aparentemente distintos pueden, en realidad, presentar estructuras de incentivos similares y, por lo tanto, representar conjuntamente un mismo juego. Desarrollada en sus comienzos como una herramienta para entender el comportamiento de la economía, la teoría de juegos se usa actualmente en muchos campos, desde la biología a la filosofía. Experimentó un crecimiento sustancial y se formalizó por primera vez a partir de los trabajos de John von Neumann y Oskar Morgenstern, antes y durante la Guerra Fría, debido sobre todo a su aplicación a la estrategia militar —en particular a causa del concepto de destrucción mutua garantizada. Desde los setenta, la teoría de juegos se ha aplicado a la conducta animal, incluyendo el desarrollo de las especies por la selección natural. A raíz de juegos como el dilema del prisionero, en los que el egoísmo generalizado perjudica a los jugadores, la teoría de juegos se ha usado en ciencia política, ética y filosofía. Finalmente, ha atraído también la atención de los investigadores en informática, usándose en inteligencia artificial y cibernética.

4 Aunque tiene algunos puntos en común con la teoría de la decisión, la teoría de juegos estudia decisiones realizadas en entornos donde interaccionan. En otras palabras, estudia la elección de la conducta óptima cuando los costes y los beneficios de cada opción no están fijados de antemano, sino que dependen de las elecciones de otros individuos. Un ejemplo muy conocido de la aplicación de la teoría de juegos a la vida real es el dilema del prisionero, popularizado por el matemático Albert W. Tucker, el cual tiene muchas implicaciones para comprender la naturaleza de la cooperación humana. La teoría psicológica de juegos, que se arraiga en la escuela psicoanalítica del análisis transaccional, es enteramente distinta. Los analistas de juegos utilizan asiduamente otras áreas de la matemática, en particular las probabilidades, las estadísticas y la programación lineal, en conjunto con la teoría de juegos. Además de su interés académico, la teoría de juegos ha recibido la atención de la cultura popular. La vida del matemático teórico laureado con un premio Nobel John Forbes Nash, desarrollador del Equilibrio de Nash, fue el tema de la biografía de Sylvia Nasar Una mente brillante (1998), y de la película del mismo nombre (2001). Varios programas de televisión han explorado situaciones de teoría de juegos, como el concurso de la televisión de Cataluña (TV3) Sis a traició (seis a traición), el programa de la televisión estadounidense Friend or foe? (¿Amigo o enemigo?) y, hasta cierto punto, el concurso Supervivientes.1

5 Hay dos clases de juegos que plantean una problemática muy diferente y requieren una forma de análisis distinta. Si los jugadores pueden comunicarse entre  ellos y negociar los resultados se tratará de juegos con transferencia de utilidad (también llamados juegos cooperativos), en los que la problemática se concentra en el análisis de las posibles coaliciones y su estabilidad. En los juegos sin transferencia de utilidad, (también llamados juegos no cooperativos) los jugadores no pueden llegar a acuerdos previos; es el caso de los juegos conocidos como "la guerra de los sexos", el "dilema del prisionero" o el modelo "halcón-paloma". Los modelos de juegos sin transferencia de utilidad suelen ser bipersonales, es decir, con sólo dos jugadores. Pueden ser simétricos o asimétricos según que los resultados sean idénticos desde el punto de vista de cada jugador. Pueden ser de suma cero, cuando el aumento en las ganancias de un jugador implica una disminución por igual cuantía en las del otro, o de suma no nula en caso contrario, es decir, cuando la suma de las ganancias de los jugadores puede aumentar o disminuir en función de sus decisiones.

6 Cada jugador puede tener opción sólo a dos estrategias, en los juegos biestratégicos, o a muchas. Las estrategias pueden ser puras o mixtas; éstas consisten en asignar a cada estrategia pura una probabilidad dada. En el caso de los juegos con repetición, los que se juegan varias veces seguidas por los mismos jugadores, las estrategias pueden ser también simples o reactivas, si la decisión depende del comportamiento que haya manifestado el contrincante en jugadas anteriores

7 Un juego en forma normal
El jugador 2 elige izquierda El jugador 2 elige derecha El jugador 1 elige arriba 4, 3 -1, -1 El jugador 1 elige abajo 0, 0 3, 4 Forma normal de un juego La forma normal (o forma estratégica) de un juego es una Matriz que muestra los jugadores, las estrategias, y las recompensas (ver el ejemplo a la derecha). Hay dos tipos de jugadores; uno elige la fila y otro la columna. Cada jugador tiene dos estrategias, que están especificadas por el número de filas y el número de columnas. Las recompensas se especifican en el interior. El primer número es la recompensa recibida por el jugador de las filas (el Jugador 1 en nuestro ejemplo); el segundo es la recompensa del jugador de las columnas (el Jugador 2 en nuestro ejemplo). Si el jugador 1 elige arriba y el jugador 2 elige izquierda entonces sus recompensas son 4 y 3, respectivamente. Cuando un juego se presenta en forma normal, se presupone que todos los jugadores actúan simultáneamente o, al menos, sin saber la elección que toma el otro. Si los jugadores tienen alguna información acerca de las elecciones de otros jugadores el juego se presenta habitualmente en la forma extensiva. También existe una forma normal reducida. Ésta combina estrategias asociadas con el mismo pago.

8 Un juego de suma cero En los juegos de suma cero el beneficio total para todos los jugadores del juego, en cada combinación de estrategias, siempre suma cero (en otras palabras, un jugador se beneficia solamente a expensas de otros). El go, el ajedrez, el póker y el juego del oso son ejemplos de juegos de suma cero, porque se gana exactamente la cantidad que pierde el oponente. Como curiosidad, el fútbol dejó hace unos años de ser de suma cero, pues las victorias reportaban 2 puntos y el empate 1 (considérese que ambos equipos parten inicialmente con 1 punto), mientras que en la actualidad las victorias reportan 3 puntos y el empate 1. La mayoría de los ejemplos reales en negocios y política, al igual que el dilema del prisionero, son juegos de suma no cero, porque algunos desenlaces tienen resultados netos mayores o menores que cero. Es decir, la ganancia de un jugador no necesariamente se corresponde con la pérdida de otro. Por ejemplo, un contrato de negocios involucra idealmente un desenlace de suma positiva, donde cada oponente termina en una posición mejor que la que tendría si no se hubiera dado la negociación. Se puede analizar más fácilmente un juego de suma cero, y cualquier juego se puede transformar en un juego de suma cero añadiendo un jugador "ficticio" adicional ("el tablero" o "la banca"), cuyas pérdidas compensen las ganancias netas de los jugadores. La matriz de pagos de un juego es una forma conveniente de representación. Por ejemplo, un juego de suma cero de dos jugadores con la matriz que se muestra a la derecha.

9 Las estrategias del otro jugador
La estrategia Maximín Consideremos un juego de suma cero en el que lo que yo gano lo pierde el otro jugador. Cada jugador dispone de tres estrategias posibles a las que designaremos como A, B, y C (supongamos que son tres tarjetas con dichas letras impresas). Los premios o pagos consisten en la distribución de diez monedas que se repartirán según las estrategias elegidas por ambos jugadores y se muestran en la siguiente tabla llamada matriz de pagos. Mis ganancias, los pagos que puedo recibir, se muestran en verde, a la izquierda de cada casilla. Los pagos al otro jugador se muestran en rosa, a la derecha de cada casilla. Para cualquier combinación de estrategias, los pagos de ambos jugadores suman diez.  MATRIZ DE PAGOS Las estrategias del otro jugador A B C Mi estrategia 9 | 1 1 | 9 2 | 8 6 | 4 5 | 5 4 | 6 7 | 3 8 | 2 3 | 7

10 La estrategia del otro jugador
Por ejemplo. Si yo juego la tarjeta C y el otro jugador elige su tarjeta B entonces yo recibiré ocho monedas y el otro jugador recibirá dos. Éste es por tanto un juego de suma cero. Se llama juego de suma cero aquél en el que lo que gana un jugador es exactamente igual a lo que pierde o deja de ganar el otro.  Para descubrir qué estrategia me conviene más vamos a analizar la matriz que indica mis pagos, la de fondo verde. Ignoro cuál es la estrategia (la tarjeta) que va a ser elegida por el otro jugador. Una forma de analizar el juego para tomar mi decisión consiste en mirar cuál es el mínimo resultado que puedo obtener con cada una de mis cartas. En la siguiente tabla se ha añadido una columna indicando mis resultados mínimos. MATRIZ DE MIS PAGOS La estrategia del otro jugador A B C mínimos Mi estrategia 9 1 2 6 5 4 7 8 3

11 MATRIZ DE PAGOS AL OTRO JUGADOR La estrategia del otro jugador
En efecto,  Si yo elijo la tarjeta A, puedo obtener 9, 1 o 2, luego como mínimo obtendré un resultado de 1. Si elijo la tarjeta B, puedo obtener 6, 5 o 4, luego como mínimo obtendré 4. Si elijo la tarjeta C, puedo obtener 7, 8 o 3, luego como mínimo obtendré 3. De todos esos posibles resultados mínimos, el que prefiero es 4 ya que es el máximo de los mínimos. MATRIZ DE PAGOS AL OTRO JUGADOR La estrategia del otro jugador A B C Mi estrategia 1 9 8 4 5 6 3 2 7 mínimos

12 El Dilema del Prisionero
El Dilema del Prisionero (Prisoner's dilemma) es un modelo de conflictos muy frecuentes en la sociedad que ha sido profundamente estudiado por la Teoría de Juegos. Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos.  El alguacil sospecha que han participado en el robo del banco, delito cuya pena es diez años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito menor, tenencia ilícita de armas, cuyo castigo es de dos años de cárcel.  Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco. Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos. La estrategia "lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero. Llamaremos "traición" a la estrategia alternativa.

13 Matriz de Pagos (años de cárcel) Preso Y lealtad traición Preso X
Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel a los que es condenado el preso X o Y respectivamente según las estrategias que hayan elegido cada uno de ellos. Matriz de Pagos (años de cárcel) Preso Y lealtad traición Preso X 2 \ 2 10 \ 1 1 \ 10 5 \ 5  En vez de expresar los pagos en años de cárcel, podríamos indicar simplemente el orden de preferencia de cada preso de los correspondientes resultados, con lo que el modelo pasa a tener aplicación más general. Matriz de Pagos (orden de preferencias) Preso Y lealtad traición Preso X 2 \ 2 4 \ 1 1 \ 4 3 \ 3*

14 El duopolio en la Teoría de Juegos
En el oligopolio, los resultados que obtiene cada empresa dependen no sólo de su decisión sino de las decisiones de las competidoras. El problema para el empresario, por tanto, implica una elección estratégica que puede ser analizada con las técnicas de la Teoría de Juegos. Supongamos que dos empresas, Hipermercados Xauen y Almacenes Yuste, constituyen un duopolio local en el sector de los grandes almacenes. Cuando llega la época de las tradicionales rebajas de enero, ambas empresas acostumbran a realizar inversiones en publicidad tan altas que suelen implicar la pérdida de todo el beneficio. Este año se han puesto de acuerdo y han decidido no hacer publicidad por lo que cada una, si cumple el acuerdo, puede obtener unos beneficios en la temporada de 50 millones. Sin embargo una de ellas puede preparar en secreto su campaña publicitaria y lanzarla en el último momento con lo que conseguiría atraer a todos los consumidores. Sus beneficios en ese caso serían de 75 millones mientras que la empresa competidora perdería 25 millones.

15 Los posibles resultados se pueden ordenar en una Matriz de Pagos como la mostrada en el cuadro de la derecha. Cada almacén tiene que elegir entre dos estrategias: respetar el acuerdo —Cooperar— o hacer publicidad —Traicionar—. Los beneficios o pérdidas mostrados a la izquierda de cada casilla son los que obtiene Xauen cuando elige la estrategia mostrada a la izquierda y Yuste la mostrada arriba. Los resultados a la derecha en las casillas son los correspondientes para Yuste. Yuste Cooperar Traicionar Xauen 50,50 -25,75 75,-25 0,0

16 Veamos cuál debe ser la decisión a adoptar por esos almacenes
Veamos cuál debe ser la decisión a adoptar por esos almacenes. El director de la división de estrategia de Xauen pensará: "Si Yuste no hace publicidad, a nosotros lo que más nos conviene es traicionar el acuerdo, pero si ellos son los primeros en traicionar, a nosotros también nos convendrá hacerlo. Sea cual sea la estrategia adoptada por nuestros competidores, lo que más nos conviene es traicionarles". El director de la división de estrategia de Yuste hará un razonamiento similar. Como consecuencia de ello ambos se traicionarán entre sí y obtendrán resultados peores que si hubieran mantenido el acuerdo. La casilla de la matriz de pagos marcada con un asterisco es la única solución estable: es un punto de equilibrio de Nash. Contrariamente a las argumentaciones de Adam Smith, en las situaciones caracterizadas por el Dilema de los Presos si los agentes actúan buscando de forma racional su propio interés, una "mano invisible" les conducirá a un resultado socialmente indeseable.

17 Supongamos ahora otra situación ligeramente diferente
Supongamos ahora otra situación ligeramente diferente. Si ambas empresas se enredan en una guerra de precios, haciendo cada vez mayores rebajas, ambas sufrirán importantes pérdidas, 25 millones cada una. Han llegado al acuerdo de no hacer rebajas con lo que cada una podrá ganar 50 millones. Si una de ellas, incumpliendo el acuerdo, hace en solitario una pequeña rebaja, podrá obtener un beneficio de 75 millones mientras que la otra perdería muchos clientes quedándose sin beneficios ni pérdidas Yuste Cooperar traicionar Xauen 50, 50 0,75 Traicionar 75,0 -25,-25

18 El razonamiento de los estrategas será ahora diferente: "Si nuestros competidores cooperan, lo que más nos interesa es traicionarles, pero si ellos nos traicionan será preferible que nos mostremos cooperativos en vez de enredarnos en una guerra de precios. Hagan lo que hagan ellos, nos interesará hacer lo contrario". En el juego "Gallina" el orden en que actúen los jugadores es muy importante. El primero en intervenir decidirá Traicionar, forzando al otro a Cooperar y obteniendo así el mejor resultado. La solución de equilibrio puede ser cualquiera de las dos marcadas con un asterisco en la matriz de pagos, dependiendo de cuál haya sido el primer jugador en decidirse. Ambas soluciones son puntos de equilibrio de Nash. En casi todos los modelos, sea cual sea la forma de la matriz, el protocolo o reglas del juego influirá mucho en la solución. Además del orden de intervención de los jugadores, habrá que tener en cuenta si el juego se realiza una sola vez o si se repite cierto número de veces, la información de que disponen en cada momento, el número de jugadores que intervienen y la posibilidad de formar coaliciones, etc.  

19 Curvas de Reacción En la teoría de juegos, las curvas de reacción muestran, en un gráfico cartesiano, las combinaciones de decisiones (puede ser en las abscisas) y pagos (puede ser en las ordenadas). Un ejemplo sencillo de curvas de reacción puede verse en las curvas de oferta y demanda. Supóngase que demanda y oferta son construídas por tanteo, según propuestas de precios a cobrar y pagar realizadas por un ofertante y un demandante en relación a una cantidad determinada a negociarse en el mercado. Las combinaciones (X*, pd) ofrecidas y las combinaciones (X*, pd) propuestas por el demandante determinarán que exista una diferencia de precios (pd - ps) mayor, menor o igual a cero. Si la diferencia es mayor que cero, el demandante debe decidir si le conviene proponer un nivel de negocios diferente combinado con un precio a pagar inferior. El ofertante debe, asimismo, decidir si propondrá un nivel de negocios diferente combinado con un precio a pagar superior. El procedimiento es similar cuando la diferencia es menor que cero: el ofertante quizás proponga un precio menor y el demandante quizás proponga un precio mayor. En el caso descrito por los mercados que siguen la ley de la oferta y la ley de la demanda, se demuestra que existe una combinación solución (X, p) que presenta convergencia y estabilidad. En este modelo de mercado, se realiza un secuencia de movimientos, tomando como "señal" a la diferencia de precios. Los turnos son dobles, es decir que los dos jugadores actúan simultáneamente. Otro modelo notable de tipo secuencial es el Duopolio de Cournot.

20 Árboles de resultados sucesivos Un diagrama de árbol de resultados sucesivos se utiliza en juegos que implican secuencias de movimientos (un movimiento es un binomio decisión-acción). En este árbol, se define un punto de partida (por ejemplo, la posición inicial del jugador A). A partir del inicio, se extienden ramas que representan los diferentes movimientos que puede realizar el jugador que inicia la competencia. Los diferentes movimientos o ramas definirán igual número de resultados o pagos, que pueden servir como punto de partida para nuevas decisiones del jugador siguiente (por ejemplo, el jugador B). El proceso se repite hasta completar el número de movimientos que A y B pueden realizar. Un juego con un movimiento para A y uno para B posee dos generaciones de ramas. Un juego con dos movimientos para A y dos movimientos para B posee cuatro generaciones de ramas. En general, un juego con movimientos para A y n movimientos para B (el valor absoluto de m-n no puede ser mayor que 1) tiene m+n generaciones de ramas. Las puntas de las ramas de última generación contienen la descripción de los posibles resultados del juego. En el caso particular de que tanto A como B pueda tomar sólo dos decisiones en cada estadio del juego, el número de puntas del árbol será 2m+n.


Descargar ppt "Toma de decisiones gerenciales clase 3"

Presentaciones similares


Anuncios Google