Introducción
La teoría de juegos especula sobre los comportamientos que pueden esperarse de cada uno teniendo en cuenta los cursos de
acción posibles para ambos. El enfoque es similar al que puede aplicarse en un juego de interacción donde los resultados
dependen de la elección de comportamientos por parte de ambos. Ej: ajedrez, la decisión de jugador1 sobre qué pieza
mover depende de la respuesta esperada de jugador2. Además, jugador1 tiene en cuenta la respuesta de jugador2 antes de
hacer su elección y viceversa en cada movimiento.
Las interacciones pueden esquematizarse de varias maneras:
Forma extensa. la interacción se describe mediante un árbol de decisiones que muestra los posibles rumbos para cada
parte así como los posibles resultados según la rama que se siga.
Forma estratégica/normal. se usan cuadros de doble entrada, las columnas muestran cursos de acción para cada
jugador, llamados estrategias. La intersección de las estrategias de cada jugador se muestra con celdas, allí se
exhiben los resultados para cada parte de esa confluencia de estrategias.
Ecuaciones: se tipifican las variables intervinientes para ponerlas en fórmulas que liguen los comportamientos.
Gráficos: las trayectorias o áreas resultantes muestran qué sucederá en la interacción. Usualmente son
representaciones de lo descrito en ecuaciones
Números grandes y pequeños
La teoría de juegos es una herramienta útil para resolver los casos llamados de números pequeños (es decir, donde la
teoría económica estándar no brinda una respuesta clara a los fenómenos que se analizan).
Mercado perfectamente competitivo: mercado de grandes números. Hay muchos oferentes y demandantes, tantos que
uno solo no influye en los resultados del mercado:
Si uno de los demandantes quisiera más o menos bienes, no afectaría a la demanda del mercado; el precio no
cambiaría y los demás demandantes u oferentes no tienen por qué prever nada respecto a la conducta del 1º.
Si uno de los oferentes cobrara más caro perdería clientes y estos irían a otros oferentes, y si cobrara más barato
quebraría. Además, su sola salida de la actividad no incidirá en la oferta de mercado y nada cambiará.
Lo anterior es un ejemplo de lo que es ser tomador de precios.
Cada transacción o negativa a realizar una transacción implica un número pequeño de protagonistas: un potencial
vendedor en particular y un potencial comprador en particular pero no son los únicos. El éxito de cada vendedor no
depende de un comprador en particular y la satisfacción de un comprador no depende de un vendedor en particular.
Hay alternativas y lo que pase en el total del mercado no depende de 1 caso aislado. Las únicas guías de acción son:
Consumidor el precio del bien y su función de bienestar
Oferente su ingreso marginal (aquí, igual al precio del bien) y su función de costos.
Mercado monopólico: Hay 1 oferente pero los demandantes son tantos y tan pequeños que uno solo no puede influir
en el mercado. Cuando el oferente actúa no tiene que pensar en algún demandante particular y el efecto de su
respuesta, tampoco en cómo se comportarán otros oferentes (no hay). Las guías de acción son:
Consumidor el precio del bien y su función de bienestar.
Oferente su ingreso marginal y su función de costos.
Mercado oligopólico: hay pocos vendedores y muchos compradores.
Ej: hay 2 empresas vendedoras (mercado duopólico) y los consumidores son tomadores de precios. Ambas empresas
son aproximadamente del mismo tamaño, por lo que la producción de ambas es relevante en el total del mercado.
Entonces, lo que haga una afectará a la otra y a los consumidores. Si una baja el precio del bien atraerá muchos
consumidores y la demanda de la otra disminuirá. Y si aumenta el precio, la demanda de la otra aumentará. A su vez,
la otra empresa actuará en consecuencia y eso afectará a la 1º, lo que podría llevarla a una nueva decisión.
El análisis de oferta y demanda no está claro que haya una conducta posible para cada una ni cuál será el resultado
final. Ej: A la empresa1 le conviene bajar el precio mientras empresa2 mantenga el suyo. Sin embargo se esperaría que
empresa2 también lo baje ya que así estará peor que cuando ambas tenían los precios más altos pero mejor que
1
cuando sólo empresa1 lo había bajado. Con esto, empresa1 estará peor que cuando ella sola había bajado el precio y
que cuando ninguna lo había hecho.
Las dificultades aumentan si se contempla la posibilidad de no tomar acciones independientemente, sino con los otros
agentes económicos. Hay que ver si se puede formar una pacto, y, una vez formado, analizar si sus integrantes
cumplirán o no y por qué. Así habrá, para cada agente, una gama de conductas posibles que los instrumentos de la
teoría económica estándar no están en condiciones de analizar. Es lo que ocurre con los llamados números pequeños.
La teoría económica estándar trabaja con grupos grandes.
En un grupo grande las particularidades e influencias individuales se diluyen, resaltando variables de influencia más
generalizada (como el precio). Esto permite tipificar a los agentes y trabajar con un empresario tipo o un consumidor tipo.
Así, las explicaciones y predicciones pueden hacerse con gran acierto cuando se analizan grupos grandes de agentes
económicos pero no en casos individuales. Para los números pequeños de agentes económicos resalta la teoría de juegos.
Soluciones a los juegos
Existen 2 jugadores, A y B, ambos tienen 3 cursos de acción posibles para su
relación con el otro agente, llamados A y B. La grilla de resultados muestra
cuánto obtiene cada uno del objeto X, según qué tipos de conductas eligen
dado lo que eligió el otro. La 1º cifra es el resultado de A, la 2º la de B.
¿Cómo se desarrollará la interacción? ¿Qué hará cada uno?
Responderlo es resolver el juego, para hacerlo se necesitan de algunos supuestos básicos sobre las reglas de la relación,
restricciones y objetivos de cada uno. Lo más fácil es plantear que cada uno prefiere la cifra más grande, el análisis de la
interacción consistirá en descubrir la estrategia más beneficiosa para cada jugador dada la estrategia que se espera elegirá
el otro (esto considerando que cada jugador sabe que el otro hará su estrategia con el mismo criterio y que ambos saben
que el otro sabe eso). Bajo estos supuestos se usan técnicas para llegar a una solución del juego, que pueden agruparse en
técnicas de dominio y técnicas de equilibrio.
Consiste en analizar qué estrategia no será elegida ya que los resultados de otra estrategia serán mejor, dadas las
estrategias alternativas del otro jugador. De encontrarlo se dice que la “estrategia descartada” es “dominada” por la otra:
Ej1: Teniendo en cuenta A1 y A2. Si B eligiera B1, a A le conviene A2. Y si B eligiera
B2, A1 es más conveniente. Ninguna de estas estrategias de A domina a la otra.
Teniendo en cuenta A2 y A3. Si B eligiera B1, a A le conviene A2. Y si B elige B2, A3
es más conveniente. Ninguna de estas estrategias de A domina a la otra.
Teniendo en cuenta A1 y A3. Si B eligiera B1, a A le conviene A1. Y si B eligiera B2, a A también le conviene A1. A1 domina a
A3. En consecuencia, A no seguirá la estrategia A3 nunca, porque hay otra estrategia que siempre es mejor.
A3 es una estrategia dominada y nunca sería elegida, entonces ambos tienen 2 alternativas: A tiene A1 y A2; B tiene B1 y
B2. Desde el punto de vista de B hay un dominio: B2 domina a B1. Si A elige A1, a B le conviene B2; y si A elige A2, para B es lo
mismo B1 y B2. Entonces, como B2 es mejor que B1 en un caso e igual en el otro puede pensarse que B no elegirá B1.
Finalmente, si B descartara B1 ahora si habría dominio entre A1 y A2
En resumen, A estudia sus estrategias y descarta A3; B sabe esto por lo que descarta B1. A sabe que B sabe que descartó
A3 y que por eso descartó B1. Entonces A descarta A2. Finalmente, sólo queda la solución es la casilla: A1 y B2.
El ejemplo es una aplicación del “dominio recursivo, iterado, o sucesivo”. Es decir, cuando el dominio de una estrategia
sobre otra se define a partir de un dominio establecido anteriormente entre otras estrategias. En el ejemplo, el dominio de
A1 sobre A1 se definió recién a partir del dominio de B2 sobre B1. Sin embargo estos últimos se definieron a partir del
dominio de A1 sobre A3. Este último, que no depende de dominios anteriores para surgir, es un dominio simple.
2
El dominio no siempre es de una estrategia sobre otra sola, puede ser sobre más de 1:
Ej2: A3 domina a A1 y A2. Por lo que se las descarta.
El dominio también puede surgir a partir de una combinación de estrategias:
Para B, B2 nunca da el mejor resultado. Por lo tanto B1 y B3 dominan a B2.
Solución: A descarta A1 y A2 y B descarta B2. Con A1 y A2 descartadas, B3 domina a
B2 y es descartada. Solución: A3-B3.
Sin embargo no siempre un juego tendrá solución.
Ej3: Para A no hay dominio entre A1 y A2 pero A1 domina a A3 por lo que se
descarta. Para B, no hay dominio entre B1 y B2. Luego del dominio simple de A1
sobre A3 sigue sin haber dominio entre B1 y B2. Entonces habrá solución al caso
entre A1 y A2. La técnica del dominio no permite avanzar más.
En un juego habrá equilibrio cuando las estrategias elegidas por cada jugador es tal que a ninguno le conviene cambiar su
estrategia, dada la que eligió el otro. Ese equilibrio es la solución. (El caso es también llamado “equilibrio de Nash”)
Ej3: se diría que el resultado del juego irá rotando. Si A eligiera A1 y B eligiera B1, A tendrá incentivos para elegir A2. De ser
así, a B le conviene B2. Pero si B elige B2, a A le convendrá A1. Aunque ahora a B le conviene volver a B1. Por lo menos, podrá
saberse que el resultado rotará entre A1-B1, A2-B1, A2-B2, y A1-B2.
La técnica del equilibrio no consiste sólo en analizar los incentivos para cambiar de estrategia. Un elemento importante es
la de mejor solución evidente.
Ej4: No hay dominio entre ninguna de las estrategias de A y B. Sin embargo, hay 2
equilibrios: A1-B2 y A2-B1. Suponiendo que ambos conocen los resultados de las
conjunciones de estrategias se puede decir que es evidente la superioridad de A 2-B1
sobre A1-B2. Por lo que se puede concluir que la solución será A2-B1.
También hay juegos donde no es evidente cómo actuará cada jugador:
Ej5: A y B prefieren tener un acuerdo antes que un conflicto (se prefieren A1-B1 y A2-
B2) aunque cada parte tiene ideas diferentes sobre cuál sería el acuerdo preferido. La
solución dependerá de las características puntuales de la negociación en particular.
Lo único que puede decirse es cuáles casillas no se elegirán (A1-B2 y A2-B1).
Sigue el tipo de resultados posibles para los jugadores. Específicamente, qué pasa con el total que reciben entre ambos. Ello
permite distinguir entre:
Juegos de suma cero (o suma constante): la combinación de las estrategias no cambia el total correspondiente a cada
jugador en conjunto, sino cómo se reparte el total entre ellos.
Ej6: el resultado total es siempre 100, varía en cuánto de esos 100
recibe cada jugador. Aplicando técnica de dominio, A1 domina a A2 y B3
domina B1 y B2. Para A quedarían A1 y A3 y para B está B3. La solución
sería A3-B3. Hay equilibrio, cualquier cambio empeora su situación.
Sin embargo, hay otra forma de analizarlo; criterio del maximín. Es decir, elegir la estrategia que dé el máximo de los
resultados mínimos.
Ej6: si A elige A1, B elegiría B3; de elegir A2 lo peor sería que B elija B3; y si elige A3, para B lo mejor es B3. De los 3 mínimos
resultados el máximo es A3 (45). Ahora, si B elige B1, A elegiría A1; de elegir B2 lo peor sería que A elija A1; y si elige B3,
para A lo mejor es A3. De los 3 mínimos resultados el máximo es B3 (55). Así, el equilibrio ocurre en A3-B3.
3
La suma 0 implica
Juegos de suma no cero (o suma variable): se pondrá atención en un juego de suma no 0 en particular: que la única forma
de ganar algo es que
el otro pierda algo.
Ej7: de aplicar maximín se tendría que para A el máximo de sus mínimos es NC
Al analizar una
(30). Y para B el máximo de sus mínimos es NC (30). estrategia, el
jugador debe pensar
Ahora, al comparar las 4 casillas, C-C luce mucho mejor ya que ambos ganarían
que al otro le
más que con NC-NC (además, el total conjunto es superior). Este resultado no se alcanza si se encara un juego de suma no convendrá la que
cero como si fuera de suma cero. En otros términos, si se cree que sólo se gana perjudicando al otro. más daño le cause.
Supóngase que la interacción dad es un contrato comercial. Las alternativas son cumplir (C) o no cumplir (NC). En
principio que lo mejor es cumplir, pero ambos están tentados a no hacerlo ya que estafar brinda más beneficios (110-70
para A, 120-80 para B). Y se supone que a eso lo sabe el otro jugador. Por lo tanto, hay una estrategia dominante para
ambos (NC). Si el otro cumple, uno gana más. Si el otro intenta estafar, lo peor es ser un incauto que cumple y se saca un
resultado menos malo estafando al mismo tiempo.
Cada uno sabe que el otro se hace el mismo planteo y por lo tanto, pese al atractivo de C-C, les conviene elegir NC. Si se
piensa con maximín la solución es que la estrategia dominante es NC y que NC-NC es un equilibrio de Nash.
También puede ocurrir C-NC (sola interacción/juego a un solo periodo). En este caso puede haber 2 posibilidades:
1. En un juego de 1 vez no hay motivos para pensar en que el otro coopere con uno.
2. En juegos de más 1 período, si los agentes piensan en el futuro, la cooperación tiene alguna posibilidad.
Para que ambos cooperen debe haber la idea de amenaza creíble: una de las partes seguirá una conducta que sea un
castigo para la otra si ésta no adopta cierta estrategia. En este caso se puede pensar que si uno gana al estafar el otro no lo
hace, por lo que si ambos cumplen la situación será mejor que si ambos estafan. ¿Cómo evitar que las partes elijan NC y
se logre C-C? Está la amenaza de que si una de las partes elige NC, la otra puede elegir NC en el siguiente período y
haciendo que termine en NC-NC. La amenaza de elegir NC si el otro estafa es creíble mientras haya siguiente periodo.
Con esto en mente pueden especificarse las relaciones numéricas que definen el juego como un dilema del prisionero. Se
deben cumplir las siguientes desigualdades para cada jugador:
T >R > C > I
La tentación de estafar (T) debe ser mayor que la recompensa por el cumplimiento mutuo (R), que a su vez debe ser mayor
que el castigo por la estafa mutua (C) y éste superior al pago por ser un incauto (I) y cumplir cuando el otro no.
[(T + I)/2] < R
El promedio entre la tentación y el pago por incauto debe ser menor que la recompensa por cooperar. Esta condición
implica que no se puede dar que a ambos les convenga estafar una vez y ser estafado la siguiente.
Ahora bien, la introducción de una secuencia temporal no resuelve por sí misma la situación. Supóngase que la cantidad
de interacciones será un número conocido. En la última interacción, , la amenaza no es creíble. Si uno estafa no hay forma
de castigarlo ya que no hay período siguiente. Por lo tanto, el incentivo para la cooperación se debilita.
Si se pensara en términos de inducción hacia atrás la estafa mutua puede ocurrir desde un 1º momento: en el último
período puede esperarse la estafa, por lo que un jugador racional prevé esto y estafa en el período previo. Si esto se lleva
hasta las últimas consecuencias se esperaría la estafa mutua desde el 1º período. Pareciera entonces que la mejor
condición para que esto no pase es que el dilema del prisionero sea infinito, Así la estafa tendría menos chances de suceder.
Otra posibilidad es la dar algún incentivo adicional a favor de las estrategias de cooperación con el otro.
El estado
Otro mecanismo (pese a tener aspectos negativos) se relaciona con el marco institucional formal. Es tener un árbitro, en el
dilema del prisionero, que vigile estrategias y castigue a quien elija NC haciendo que C-C sea más probable. Entonces, las
4
interacciones privadas se desarrollarían dentro del marco de reglas formales e informales pero con un vigilante. Aquí, C
corresponde al respeto de las reglas y NC a su violación.
En el fondo, introducir al Estado puede considerarse como un cambio en la matriz de pagos, con el castigo probable como
parte de la evaluación previa a la elección, pero el dilema del prisionero sigue siendo útil para demostrar las alternativas
de conducta y las consecuencias de las normas sancionatorias.
Con este papel del Estado puede abordarse el dilema del prisionero cuando hay más de un jugador. En un juego con 2
jugadores los agentes pueden ir conociéndose y generando reputaciones y pautas de conducta. Pero también puede no
implicar estabilidad de los jugadores. Ej: una compraventa puede presentarse como un dilema del prisionero y puede ocurrir
que el vendedor sea siempre el mismo pero el cliente no. O el cliente pueda ir al mismo vendedor pero tan pocas veces que
ninguno forme una idea sobre el otro.
A efectos prácticos la interacción se parece a una de corto plazo. De tomar sólo esas circunstancias el aumento del número
de agentes parece actuar en contra de las conductas de respeto. Ej: si comprador tiene muchos vendedores para elegir puede
estar motivado a no cumplir porque igual puede buscar otro. Con los vendedores igual.
¿Cuándo aparecen las ventajas del número asociadas con la cantidad de competidores?
Cuando vendedores y compradores tienen información sobre los demás, las buenas conductas valen la pena. Si hay muchos
oferentes para los consumidores, los oferentes atenderán las necesidades de los clientes si el acierto es recompensado y la
falla es castigada. La recompensa seria si un cliente satisfecho vuelve y si la buena reputación atrae a otros nuevos; el
castigo seria si un cliente insatisfecho no vuelve y si potenciales clientes no lo buscan debido a su mala reputación. Incluso
el propio mercado puede generar los mecanismos para ganar confianza o para difundir la información adecuada para la
toma de decisiones.
Pareciera que el Estado no es imprescindible para que el dilema del prisionero se desarrolle en la variante de cooperación
entre los jugadores, pero no es así. La presencia del Estado puede verificar que los acuerdos se cumplan, agregando un
marco legal coactivo que cubra el bache de confianza o conocimiento derivado de la poca frecuencia de interacciones en
particular, y puede potenciar los mecanismos que el propio mercado genere. Incluso los grandes mercados parecen
aumentar los incentivos para no cooperar o no cumplir en una interacción al estilo de un dilema del prisionero, por lo que
parece más necesaria la presencia del Estado.
Pero también hay problemas con el Estado: no existe como tal. Conceptualmente puede verse como una persona jurídica,
pero su funcionamiento implica la conducta de personas humanas, gente con su propia función de bienestar y con objetivos
propios. Depende de la organización del sistema político y de la estructura del sector público cómo eso objetivos se alinean
(o no) con el papel teórico del Estado. Por lo tanto, es posible que por sus intereses propios el árbitro abandone su papel y
juegue a favor de uno de los agentes. Así, si este incumple las reglas el árbitro lo deja, pero si el otro lo hace es castigado.
Una salida usual es moverse a una economía en negro, pese a implicar el riesgo de ser castigado por el Estado y de no poder
acudir a él cuando la otra parte falle en su compromiso.
Un ejemplo al que se puede aplicar la teoría de juegos es el del horizonte temporal del gobernante. Puede pensarse que éste
tiene la alternativa de cumplir o no pero los incentivos para hacerlo existen mientras existan más interacciones futuras a
las que el ciudadano responda apoyándolo o no en una próxima elección. Sin embargo, cuando el período de gobierno
termina y no hay posibilidades de reelección está el problema del último período. El ciudadano no tendría cómo premiar
al gobernante y él tampoco tiene cómo castigarlo. La 1º solución es permitir reelecciones, sin embargo el margen de
acción, la tentación de poder y los problemas de control ciudadano sobre los gobernantes hacen recomendable poner un
límite a la ocupación del poder ejecutivo por una sola persona. Teóricamente, el riesgo del último período del ejecutivo
debería ser reducido con el control parlamentario por personas que no están en situación de horizonte temporal breve.
La teoría de juegos y Adam Smith
Una mirada superficial a algunos casos de la teoría de juegos puede llevar a malas interpretaciones sobre su utilidad o
función. Un ejemplo es el dilema del prisionero, podría decirse que este muestra que si los protagonistas se dejan llevar por
5
su egoísmo el resultado social y el individual serán menores que si cooperaran entre sí. Por lo tanto, dice la conclusión
apresurada, la teoría de juegos demuestra que el egoísmo lleva “por una mano invisible” al bien común está equivocado.
Sin embargo, la teoría de juegos complementa el planteo de Adam Smith.
Smith sostuvo que, bajo ciertas condiciones institucionales, el egoísmo tiene resultados sociales positivos. No que el libre
egoísmo conduce al bienestar social. Sí que, en condiciones de mercados abiertos (competencia, bajos costos de entrada al
mercado, cumplimiento de contratos...), la búsqueda del bienestar individual conduce al bienestar social pues la única
forma de beneficiarse es ofreciendo lo que beneficia a otros. También advirtió que cuando aquellas condiciones no se dan el
resultado es otro.
Por supuesto que el dilema del prisionero muestra un resultado conjunto no deseable para sus protagonistas lo que no
quiere decir socialmente indeseable. En el duopolio ser individualistas puede implicar entrar en una guerra de precios que
beneficie al consumidor (resultado conjunto indeseable para los empresarios). En cambio, “cooperar” significa ponerse de
acuerdo para explotar al consumidor (resultado conjunto deseable para los empresarios).
Entre los fundamentos del análisis de juegos están los mismos que en la corriente principal de la economía (egoísmo y qué
resultados generales tiene seguirlo) según los marcos institucionales. Esto implica el estudio de qué cambios institucionales
hacen que la acción egoísta individual conduzca a resultados socialmente deseables. Esto es, el planteo original de Smith.