La teoría de juegos.
La teoría de juegos es una rama de la economía que estudia las decisiones en las que
para que un individuo tenga éxito tiene que tener en cuenta las decisiones tomadas
por el resto de los agentes que intervienen en la situación. La teoría de juegos como
estudio matemático no se ha utilizado exclusivamente en la economía, sino en la
gestión, estrategia, psicología o incluso en biología.
En teoría de juegos no tenemos que preguntarnos qué vamos a hacer, tenemos que
preguntarnos qué vamos a hacer teniendo en cuenta lo que pensamos que harán los
demás, ellos actuarán pensando según crean que van a ser nuestras actuaciones. La
teoría de juegos ha sido utilizada en muchas decisiones empresariales, económicas,
políticas o incluso para ganar jugando al póker. La teoría de juegos es nuestro
Concepto de esta semana
Para representar gráficamente en teoría de juegos se suelen utilizar matrices (también
conocidas como forma normal) y árboles de decisión como herramientas para
comprender mejor los razonamientos que llevan a un punto u otro. Además los juegos
se pueden resolver usando las matemáticas, aunque suelen ser bastante sofisticadas
como para entrar en profundidad.
Historia
Aunque hubo trabajos anteriores la teoría de juegos empieza con un estudio de
Antoine Augustin Cournot sobre un duopolio en el que se llega a una versión educida
del equilibrio de Nash ya que se alcanza poco a poco el nivel de precios y producción
adecuado. Más tarde se podría decir que el fundador de la teoría de juegos
formalmente hablando fue el matemático John von Neuman, el mismo del proyecto
Manhattan.
Desde entonces algunos economistas han sido galardonados con el Nobel de
Economía por sus trabajos sobre el tema. Destaca Nash, conocido por la película “Una
mente maravillosa” y porque es en el equilibrio de Nash dónde se basan muchas
conclusiones que se han tomado sobre teoría de juegos aplicada a la vida real.
Equilibrio de Nash
El equilibrio de Nash se alcanza en una situación en la que ninguno de los jugadores
(o agentes) de un juego en el que hay dos o más jugadores, todos conocen los
equilibrios de los demás, quieren cambiar unilateralmente su decisión porque
cambiarla supondría empeorar su condición. Cuando todos los jugadores han tomado
una decisión y no pueden cambiarla sin empeorar su bienestar, se considera que se
ha alcanzado un equilibrio de Nash.
El equilibrio de Nash puede no ser Pareto eficiente (es decir, puede haber una
situación en la que todos los jugadores incrementen su bienestar sin perjudicar a los
demás). No obstante, en ocasiones el equilibrio de Nash es la única alternativa dadas
las reglas del juego a pesar de que exista un óptimo de Pareto.
El equilibrio de Nash se ha utilizado para regular situaciones de competencia entre
empresas y diseñar subastas de adjudicaciones públicas. Una legislación que tenga
en cuenta el equilibrio de Nash puede evitar oligopolios, por eso en la legislación
antimonopolio se suele buscar formas de evitar que se pacten precios entre las partes
Implicadas.
Ejercicio:
Considere un caso simplificado en el cual existen dos participantes: usuarios de buses
(pasajeros) y conductores de buses (clásico chofer de micro). Considerando el sistema de los
paraderos diferidos, vemos que cada participante tiene dos posibilidades: Usuarios: Esperar el
bus en el paradero más cercano o Esperarlo en el paradero correspondiente. Conductores:
Parar en todos los paraderos o Parar sólo en los paraderos que le corresponden. La siguiente
matriz de pagos resume las utilidades para cada uno ante las distintas combinaciones de
estrategias.
Parar en cualquier lugar Parar en diferidos
Esperar cualquier lugar 10 ; 5 5;5
Esperar en diferidos 5;5 30 ; 20
Analizar si existen Equilibrios de Nash.
Respuesta:
Los equilibrios de Nash corresponden a los pagos de 15,10 y de 20,30. Esto debido a
que si estamos en cualquiera de esas situaciones (ej: los choferes parando en
cualquier lugar y los pasajeros esperando en cualquier lugar), las utilidades serán tal
que ninguno de los dos agentes tendrá incentivos para cambiar su comportamiento.
Por lo tanto, existen dos equilibrios de Nash.
Estrategia dominante
En teoría de juegos, las estrategias son las diferentes alternativas o decisiones que
cada jugador puede elegir. Para un jugador, una estrategia domina estrictamente a
otra si, hagan lo que hagan los demás jugadores, el jugador en cuestión recibe mayor
utilidad con la primera que con la segunda decisión. Un jugador racional nunca jugará
una estrategia estrictamente dominada porque ésta nunca será óptima.
Muchos juegos sencillos se pueden resolver mediante estrategias dominantes. Ocurre
lo contrario con los juegos donde una estrategia puede ser mejor o peor que otra para
un jugador, en función de cómo jueguen los demás jugadores.
En la terminología cuando un jugador trata de elegir la mejor estrategia entre múltiples
opciones, puede comparar dos estrategias A y B para ver cuál es mejor. Dependiendo
del juego considerado, pueden producirse los siguientes resultados:
A domina a B, donde pueden distinguirse 2 posibilidades:
1. A domina estrictamente a B si la elección de A siempre da un resultado
estrictamente mejor que elegir B, independientemente de lo que el otro
jugador(es) haga(n).
2. A domina débilmente a B si por lo menos existe un conjunto de acciones de los
oponentes para los que A es estrictamente mejor que B y para el resto A y B
dan la misma utilidad (es decir, el jugador está indiferente entre A y B). En
suma, la elección A es mejor en algunos casos e igual de buena que B en el
resto, dependiendo exactamente cómo elijan jugar el o los oponentes.
A está dominada por B, donde análogamente hay 2 posibilidades:
1. A está estrictamente dominada por B si la elección de A siempre da un
resultado peor que la elección de B, no importa lo que el otro jugador(es)
haga(n).
2. A está débilmente dominada por B cuando hay por lo menos un conjunto de
elección de los oponentes para el que A da un resultado peor que B, mientras
que en el resto son indiferentes
En el ejemplo con la siguiente matriz de pagos, la estrategia F1 está estrictamente
dominada por la F2, pues 15 es menor que 18 y 0 es menor que 3:
C1 C2
F1 15,15 0,18
F2 18,0 3,3
Ejercicio:
Para el jugador nº 2 no existe ninguna estrategia estrictamente dominada, pero sí para
el jugador nº 1: el pago que recibiría optando por la alternativa C siempre es mayor
que el que obtendría eligiendo la estrategia A, (2 > 1, 1 > 0, 3 > 2) sea cual sea la
elección del jugador nº 2. Eliminamos por tanto la estrategia A.
Ahora, vemos que la estrategia X siempre le daría menor pago al jugador nº 2 que la
estrategia Z, puesto que 3 > 0 y 2 > 1, por lo que eliminamos la estrategia X.
Ahora, ambos jugadores cuentan con dos posibles estrategias, y la estrategia C está
dominada por la estrategia B para el jugador nº 1:
Finalmente, el jugador nº 1 sólo tiene la estrategia B, mientras que el jugador nº 2
puede optar por Y ó Z. Lógicamente, elegirá Y pues su pago (4) es mayor que el
correspondiente a Z (3).
Programación Dinámica.
Es una técnica que permite la resolución de problemas que tratan de alcanzar
determinados fines, a través de una serie de etapas o fases compuestas de diversos
estados, de estos es necesario hacer una elección, de tal manera que se alcance la
máxima efectividad global. Fue utilizado originalmente en los años 1940 por RICHARD
BELLMAN para describir el proceso de resolver problemas donde se necesita encontrar las
mejores decisiones unas a otras.
Ejercicios.
1.- Un Ingeniero Forestal, requiere saber: i) Cuál es el costo mínimo, y ii) Cuál es la
ruta con ese costo mínimo, para ir desde su oficina hasta el lugar donde está la
cosecha. En su camino debe pasar por 3 sectores o ciudades antes de llegar a su
destino, y lugares posibles en esos sectores o ciudades. Las posibles rutas, y el costo
asociado por Kms. de distancia y otros en $, se ven en el siguiente esquema
Solución:
Para ir de 1 a 13 hay 48 rutas posibles. Una posibilidad para encontrar la
solución es calcular el valor asociado a cada una y ver cual es la que proporciona el
menor costo. ¿Y si fuesen miles de rutas?. Por se descarta esa alternativa y se usa el
método de la programación Dinámica, donde se resuelve desde el final hacia el inicio,
y hay etapas y estados.
Etapas: Son 4. La etapa 1 es decidir ir del estado inicial 1 al estado 2,3,4 o 5 que son
los puntos posibles en el sector siguiente. La etapa 2 es decidir ir a 6, 7 u 8. La etapa 3
es decidir ir a 9, 10, 11 o 12. La etapa 4 es decidir a 13.
Estado: Lugar donde se encuentra. La etapa 1 tiene 1 estado: el 1. La etapa 2 tiene 4
estados: 2, 3, 4, 5. La etapa 3 tiene 3 estados: 6,7,8. La etapa 4 tiene 4 estados: 9, 10,
11, 12.
Cálculos n=4 S \ X4 13 F4* X4*
9 12 12 13
10 16 16 13
11 15 15 13
12 14 14 13
n=3 S \ X3 9 10 11 12 F3* X3*
6 3+12=15 2+16=18 1+15=16 3+14=17 15 9
7 4+12=16 1+16=17 4+15=19 6+14=20 16 9
8 2+12=14 3+16=19 6+15=21 5+14=19 14 9
n=2 S \ X2 6 7 8 F2* X2*
2 9+15=24 4+16=20 6+14=20 20 7-8
3 5+15=20 7+16=23 4+14=18 18 8
4 9+15=24 10+16=26 8+14=22 22 8
5 9+15=24 10+16=26 11+14=25 24 6
n=1 S \ X1 2 3 4 5 F1* X1*
1 7+20=27 6+18=24 5+22=27 6+24=30 24 3
Respuesta: El óptimo es: 24
La solución óptima es: X1 = 3 ; X2 = 8 ; X3= 9 ; X4= 13.
La ruta óptima es: 1 3 8 9 13
Respuesta al problema planteado:
El Ingeniero Forestal tiene un costo mínimo de $24 para ir desde su oficina al lugar de
cosecha, y ese mínimo lo puede lograr yendo desde su oficina al lugar 3 luego al lugar
8 luego al lugar 9 y de ahí al lugar 13, que es donde está la cosecha.
2.-Un Técnico Forestal, debe revisar 3 faenas: Poda, Raleo y Cosecha, y dispone de 4
días. Según la dedicación en días que le de a cada faena, éstas tendrán una
probabilidad de fracasar, y con ello fracasar la faena total, por lo que puede ser
despedido. Por ello, dicho Técnico desea minimizar la probabilidad de ser despedido
minimizando la probabilidad de que las 3 tareas fracasen al mismo tiempo.
Dedicación \ Faenas Poda Raleo Cosecha
0 día 0.50 0.60 0.40
1 día 0.42 0.51 0.35
2 días 0.36 0.41 0.21
3 días 0.25 0.36 0.18
Un día no asignado a una faena no tiene valor asociado. A lo más se puede asignar 3
días a una misma faena.
Solución:
Etapas: Son 3. La etapa 1 es el proceso de asignación de días a Poda. La etapa 2 es
el proceso de asignación de días a Raleo. La etapa 3 es el proceso de asignación de
días a Cosecha.
Estados: Son los días disponibles para ser asignados, y van de 0 a 4, dependiendo de
las etapas. La etapa 1 tiene 1 estado factible y es: tener 4 días disponibles para ser
asignados.
Las variables de decisión son 3: X1, X2, X3 y representan: Cuántos días asignar a la
faena poda, Cuántos días asignar a la faena de raleo, Cuántos días asignar a la faena
de cosecha; respectivamente.
La Función Objetivo y las restricciones forman en el modelo para este problema y es:
P: Min( p(X1)*p(X2)*p(X3) ) ; s.a: X1+X2+X3 4 ; Xi 0,1,2,3; i=1,2,3
La probabilidad de ser despedido en este momento es: 0.5*0.6*0.4 =0.12, que es de
un 12%, y con los 4 días disponibles desea minimizar esa probabilidad.
n=3 S \ X3 0 1 2 3 F3* X3*
0 0.4*1=0.40 - - - 0.40 0
1 0.4*1=0.40 0.35*1=0.35 - - 0.35 1
2 0.4*1=0.40 0.35*1=0.35 0.21 - 0.21 2
Los cálculos.
3 0.4*1=0.40 0.35*1=0.35 0.21 0.18 0.18 3
4 0.4*1=0.40 0.35*1=0.35 0.21 0.18 0.18 3 n=2
S\X2 0 1 2 3 F2* X2*
1 0.6*0.35=0.210 0.51*0.40=0.2040 - - 0.2040 1
2 0.6*0.21=0.126 0.51*0.35=0.1785 0.41*0.40=0.1640 - 0.1260 0
3 0.6*0.18=0.108 0.51*0.21=0.1071 0.41*0.35=0.1435 0.36*0.40=0.144 0.1071 1
4 0.6*0.18=0.108 0.51*0.18=0.0918 0.41*0.21=0.0861 0.36*0.35=0.126 0.0861 2
0
n=1
S\X1 0 1 2 3 F1* X1*
4 0.5*0.0861 0.42*0.1071 0.36*0.1260 0.25*0.2040 0.04305 0
= 0,04305 = 0,044982 = 0,04536 = 0,051
Respuesta: óptimo = 0.04305 ( un 4,3% ).
La solución óptima es: X1 = 0 ; X2 = 2 ; X3= 2
La ruta óptima es: 4 4 2 2
Respuesta al problema planteado: La probabilidad mínima de ser despedido es
0.04305 , es decir de un 4,3%, y la asignación óptima de días es: 0 días a la Poda, 2
días al Raleo, 2 Días a la Cosecha.