Teoría de Juegos Estáticos
Teoría de Juegos Estáticos
Índice
1. Introducción 2
3. Teorı́a de la decisión 3
3.1. Conocimiento común, inconsciencia . . . . . . . . . . . . . . . . . 4
4. Soluciones de un juego 5
4.1. Dominancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
4.2. Estrategias racionalizables . . . . . . . . . . . . . . . . . . . . . . 9
4.3. Equilibrio de Nash - Cournot . . . . . . . . . . . . . . . . . . . . 10
4.4. Seguridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
6. Aspectos normativos 22
1
1. Introducción
La teorı́a de juegos es el estudio de las interacciones estratégicas entre
agentes racionales (individuos, firmas, etc.) con diferentes objetivos. La
principal caracterı́stica es que reconoce que las decisiones de un agente
pueden afectar de forma directa los objetivos de los demás agentes. Ésta
se puede dividir en dos grandes ramas. La teorı́a de juegos estratégicos
(o juegos no cooperativos) y la teorı́a de juegos coalicionales (o juegos
cooperativos). La principal diferencia de los últimos comparados frente a
los primeros es que en los juegos coalicionales se supone que los jugadores
pueden hacer coaliciones o arreglos que se sostienen mediante algún meca-
nismo que no se especifica explı́citamente. En esta parte nos concentramos
en la teorı́a de juegos estratégicos.
2
1\2 A C
A -10,-10 0,-12
C -12,0 -1,-1
M\H B S
B 3,2 1,1
S 0,0 2,3
M\H D I
D 1,1 0,0
I 0,0 1,1
Ejemplo 4 (Juego de revelación) Los dos jugadores son un ser superior (SB)
y una persona (P ).2 Las estrategias para SB son SSB = {RE, N RE},SP =
{CE, N CE} donde RE y N RE significan respectivamente que SB revela su
existencia y que no revela su existencia y CE, N CE significan respectivamente
que P cree o no cree en su existencia.
SB\P CE NCE
RE 3,4 1,1
NRE 4,2 2,3
N N
Notación 1 Sea S = Π Si y para cualquier jugador i sea S−i = Π Sj . Dada
i=0 j6=i
una estrategia conjunta s = (s1 , ..., sN ) ∈ S y cualquier jugador i también deno-
tamos la estrategia conjunta s como s = (si , s−i ) donde si ∈ Si es la estrategia
del jugador i y s−i es la estrategia conjunta de todos los jugadores con excepción
del jugador i.
3. Teorı́a de la decisión
Todo juego plantea un problema de decisión.
Un problema de decisión consiste en la especificación de:
2 Basado en S. Brams [2007]. Superior Beings: If they exist, how should we know?
3
1. Un conjunto de acciones.
2. Un conjunto de estados de la naturaleza (conjeturas, expectativas o
creencias sobre los estados de la naturaleza).
3. Un conjunto de consecuencias sobre las cuales el agente tienen prefe-
rencias.
4. Unas preferencias del agente sobre el conjunto de consecuencias.
5. Hipótesis de comportamiento.
4
el segundo sabe que hay por lo menos un sombrero rojo. Sin embargo, antes del
anuncio, el tercero no sabe que el segundo sabe que el primero sabe que hay
por lo menos un sombrero rojo entre los tres. Ahora, una vez hecho el anuncio,
saber que hay por lo menos un sombrero rojo entre los tres se convierte en
conocimiento común: todos saben que los demás saben y todos saben que los
demás saben que los otros saben, etc. En particular, el tercero sabe que el segundo
sabe que el primero sabe que hay por lo menos un sombrero rojo entre los tres.
Por lo tanto, dado que el primero y el segundo afirmaron no saber de qué color
era el sombrero, el tercero puede deducir que su sombrero es rojo. Para ver
esto suponga que una vez hecho el anuncio, los dos primeros responden no sé.
Ahora el tercero puede argumentar ası́. Si mi sombrero no fuera rojo, como
el segundo jugador sabe que el primero respondió no sé, entonces es porque el
segundo sabe que el primero está viendo un sobrero rojo. Si el mı́o no es rojo,
entonce el segundo jugador deberı́a deducir que el sombrero rojo que está viendo
el primer jugador es el del jugador dos, luego el jugador dos debió responder
que su sombrero era rojo. Como no lo hizo, eso quiere decir que mi sombrero
es rojo. Obsérvese que la clave de este argumento es que después de hecho el
anuncio, el jugador tres sabe que el jugador dos sabe que el jugador uno sabe
que hay por lo menos un sombrero rojo entre los tres.
Existen muchas formas de relajar el supuesto de conocimiento común.
Puede ser en el sentido de que el juego no es conocimiento común (un
jugador desconoce que existe un tercero, desconoce todas las estrategias
de sus oponentes, etc.) o puede tener una inteligencia limitada (sabe algo
sobre su oponente pero no sabe que su oponente sabe que él sabe), etc.
Las consecuencias formales de este tipo de limitaciones serán discutidas
más adelante. En la literatura se conoce como games with unawareness.
4. Soluciones de un juego
Una solución de un juego es una descripción sistemática del resultado que
podrı́amos esperar de la interacción de los jugadores en el juego.
Tres conceptos sirven para unificar las ideas principlaes relacionadas con
la solución de un juego. Estos son el concepto de dominancia, estabilidad y
seguridad. El primero está relacionado con la identificación de estrategias
que un agente racional no jugarı́a. La segunda representa un concepto de
equilibrio y busca identificar estrategias en las cuales no existen incentivos
a desviarse y la tercera, identifica estrategias que garantizan cierta utilidad
para los jugadores en el peor de los casos.
Supongamos que todos los jugadores son racionales. Es decir buscan maxi-
mizar su pago neto (más adelante consideraremos otras formas de raciona-
lidad como por ejemplo que un jugador no juega una estrategia dominada).
Utilizaremos el concepto de inteligencia para hablar de el conocimiento
que tienen los jugadores del juego, de las conjeturas de los demás, etc.
5
Los jugadores escogen su estrategia de forma independiente de los demás.
Además supongamos todos los jugadores conocen todos los elementos del
juego G y que saben que los demás jugadores saben que los demás son
racionales e inteligentes. Más precisamente, en el juego la racionalidad de
los jugadores y la inteligencia de los mismos es conocimiento común.
A lo largo de las notas vamos a estudiar diferentes niveles de inteligencia
de los jugadores. Es decir, qué tipo de racionalidad e inteligencia se supone
sobre los demás y si es conocimiento común o no.
La pregunta más fundamental de la teorı́a de juegos es, ¿Cuál es nuestra
mejor predicción de la interación de los agentes en el juego? Es decir, da-
das las hipótesis mencionadas anteriormente, qué estrategias consideramos
razonables para cada jugador. Esto es lo que denominamos una solución
de un juego.
Todo concepto de solución de un juego está basado en un supuesto sobre
la racionalidad, el nivel de inteligencia de los agentes y las restricciones
sobre las estrategias.
4.1. Dominancia
Definición 2 (Dominancia) Una estrategia sbi ∈ Si domina débilmente una
estrategia si ∈ Si , o si es una estrategia débilmente dominada por sbi , si para
todo s−i ∈ S−i :
si , s−i ) ≥ πi (si , s−i )
πi (b
con desigualdad estricta por lo menos para un s−i . Cuando en la definición ante-
rior podemos sustituir la desigualdad débil por una estricta para todo s−i ∈ S−i
decimos que sbi ∈ Si domina (estricatmente) la estrategia si , o equivalentemente
que si es una estrategia dominada (estrictamente) por sbi .
Nota técnica 1 Mientras no se diga lo contrario, el término domina o domi-
nada se utiliza en un sentido estricto.
Ejemplo 6 En el siguiente juego, para el agente 1, Y domina a Z.
1\2 A B C
X 2,7 2,0 2,2
Y 7,0 1,1 3,2
Z 4,1 0,4 1,3
6
Ejemplo 7 (Dilema de los prisioneros) En el dilema de los prisioneros ca-
da uno de los agentes tiene una estrategia dominante.
Para estudiar un poco esta idea de condiciones mı́nimas que debe satisfa-
cer un concepto de solución introduciremos el concepto de estrategias no
dominadas iterativamente.
El concepto de estrategias dominadas sugiere una forma de identificar
un conjunto de estrategias de las cuales se podrı́a afirmar que cualquier
resultado de un juego deberı́a de estar.
7
Definición 6 (Juegos solucionables en estrategias no dominadas iterativamente)
Si S ∞ consiste de un sólo elemento, decimos que el juego es solucionable en es-
trategias no dominadas estrictamente de forma iterativamente.
1\2 A B C
X 2,7 2,0 2,2
Y 7,0 1,1 3,2
Z 4,1 0,4 1,3
El proceso de eliminación arroja: S10 = {x, y, z}, S11 = {x, y}, S12 = {x, y},
S13= {y}, S14 = {y}, S20 = {A, B, C}, S21 = {A, B, C}, S22 = {A, C}, S23 =
{A, C} y S24 = {C}.
8
Ejercicio 2 Demostrar que W ∞ ⊆ S ∞ . Dar un ejemplo que muestre que en
general la contenencia es estricta. Sea EW y ES el conjunto de equilibrios en
estrategias dominantes débilmente y estrı́ctamente respectivamente. Demostrar
que:
ES ⊆ EW ⊆ W ∞ ⊆ S ∞
para todo si . Una estrategia si nunca es una mejor respuesta si no existe s−i
tal que si sea mejor respuesta cuando las estrategias de los demás son s−i .
9
de imaginarse, en la misma lı́nea que la definición de eliminación de estra-
tegias dominadas estrictamente, una definición de eliminación iterativa de
estrategias que nunca son mejor respuesta.
Definición 8 (Estrategias racionalizables) Las estrategias que sobreviven
el proceso de eliminación iterativo de estrategias que nunca son mejor respuesta,
lo denominamos el conjunto de estrategias racionalizables R∞ .
Se puede demostrar que el proceso de eliminación es independiente del
orden.
Ejercicio 3 Mostrar que una estrategia estrı́ctamente dominada nunca es una
mejor respuesta y demostrar que R∞ ⊆ S ∞ .
Ejercicio 4 Demostrar o dar un contraejemplo de la afirmación S ∞ ⊆ R∞ .
Obsérvese que una estrategia dominada débilmente si puede ser en prin-
cipio una mejor respuesta. Este es el caso con las estrategias que son
dominadas débilmente pero no estrı́ctamente. Esta observación muestra
que el concepto de eliminación iterativa de estrategias débilmente domi-
nadas no tiene bases racionales tan sólidas cuanto el concepto basado en
eliminación estricta. Sin embargo, como veremos más adelante, este tipo
de eliminación puede eventualmente eliminar equilibrios de Nash lo que
cuál resulta atractivo en presencia de múltiples equilibrios.
10
Un equilibrio de Nash de este ejemplo es:
1
xi =
N +1
El problema es que el valor individual y social de esta solución es muy bajo:
1 n 1
(1+n)2 y (1+n)2 ∼ n respectivamente.
Ahora, si maximizamos el valor social suponiendo que cada agente usa la
misma proporción x de la banda entonces:
!
P P
xi 1 − xj = nx (1 − nx)
i j
1
y obtenemos la solución socilamente eficiente x = 2n que implica un benefi-
1
cio social igual a 4 , el cual es muy superior al beneficio social en la solución
descentralizada.
11
cada individuo actúa de forma individual, conocen las caracterı́sticas del proble-
ma mencionadas y suponen que los demás actúan de la misma forma, requiere
un poco más de esfuerzo. Es fácil de ver que todos los carros tomaran la ruta A
- 1 pues si todos hacen esto el tiempo de desplazamiento hasta 1 es 40 minutos.
Estando en 1, lo óptimo es hacer 1 - 2 - B, pues el tiempo de esta última parte
serı́a 40 minutos y la alternativa serı́a 45. En conclusión el nuevo equilibriuo
implica un tiempo de desplazamiento de 80 minutos. El resultado es sorpren-
dente dado que el número de carros que viaja de A hacia B es exactamente el
mismo, y que las mismas rutas que estaban a disposición anteriormente siguen
estándolo una vez construida la variante que comunica 1 y 2. En conclusión, el
comportamiento individualista en el segundo caso tiene como consecuencia un
resultado ineficiente para la sociedad.
Proposición 1 Todo equilibrio de Nash sobrevive el proceso de eliminación de
estrategias dominadas estrictamente.
Prueba. Suponga que tenemos una estrategia conjunta que es Nash pero no
está en S ∞ . Eso quiere decir que para algún i, la estrategia que le corresponde
en Nash no está en Si∞ , luego fue eliminada en alguna iteración k. Sea k el
menor k para el cual existe un i tal que estrategia que le corresponde a i en
el equilibrio de Nash es eliminada en la iteración k. Entonces esto implica que
existe una estrategia en Sik−1 que domina estrictamente en S−i k−1
la estrategia
de Nash que le corresponde a i. Sin embargo, todas las estrategias de los demás
k−1
jugadores pertenecen a S−i (por la definición de k, además k 6= 0) luego esto
implicarı́a que la estrategia que le corresponde a i en el equilibrio de Nash no
serı́a una mejor respuesta.
Proposición 2 Si un juego tiene un equilibrio en estrategias no dominadas ite-
rativamente (es resoluble en estrategias no dominadas iterativamente) entonces
esa estrategia conjunta es un equilibrio de Nash y además es el único equilibrio
de Nash.
Prueba. Para ver esto supongamos que no es Nash. Entonces algún agente no
está optimizando dadas las estrategias de los demás. Escojamos una estrategia
que sı́ sea mejor respuesta en S−i . Como esta estrategia no sobrevivió el pro-
ceso de eliminación, ya que sólo una lo hizo, entonces tuvo que ser eliminada
en algun momento. Como fue eliminada quiere decir que fue dominada estric-
tamente en algún momento en Sik−1 . Ahora, Sik−1 ⊇ S ∞ luego en particular,
existirı́a una estrategia que domina estrictamente a la mejor respuesta cuando
los demás juegan lo que les corresponde en el equilibrio en estrategias no domi-
nadas iterativamente. Una contradicción. La unicidad se sigue de que el proceso
de eliminación de estrategias dominadas no elimina ningún equilibrio de Nash.
12
1\2 A B C
A 1,1 1,0 1,0
B 0,1 2,-2 -2,2
C 0,1 -2,2 2,-2
El concepto de equilibrio de Nash es estrictamente más débil que el concep-
to de equilibrio en estrategias dominates (ejemplo: Batalla de los sexos).
Ejemplo 14 Nash no sobrevive eliminacion débil de estrategias dominadas de-
bilmente. Considere el siguiente ejemplo
1\2 A B
A 1,1 0,-3
B -3,0 0,0
El equilibrio de Nash no siempre existe como lo demuestra el siguiente
ejemplo.
Ejemplo 15 (Cara y Sello) Considere el siguiente juego.
1\2 C S
C 1,-1 -1,1
S -1,1 1,-1
En este caso no existe un equilibrio de Nash - Cournot en estrategias puras.
El equilibrio de Nash - Cournot es un concepto más débil en términos
estratégicos que el equilibrio en estrategias dominantes pero más fuerte en
términos de la inteligencia que se supone tienen los jugadores. En éste es
necesario que los agentes tengan una expectativa correcta sobre lo que los
demás van a jugar y viceversa.
Es también una condición muy natural y por lo tanto, una condición mı́ni-
ma que debe satsifacer cualquier concepto de equilibrio.
4.4. Seguridad
Ejemplo 16 La idea de este ejemplo es resaltar el concepto de seguridad en un
juego
1\2 A B
X 2,1 2,-20
Y 3,0 -10,1
Z -100,2 3,3
El único equilibrio de Nash de este juego es un poco peligroso para el jugador
1. Obsérvese que si el jugador 2 comete un error y no juega Nash entonces 1
se ve muy perjudicado. Alternativamente él podrı́a jugar una estrategia que le
garantizara el mejor pago posible en el peor de los casos. Esto serı́a jugar X.
Esto es lo que se conoce como la estrategia maxmin del jugador 1.
13
Formalmente el valor maxmin o valor de seguridad de un jugador, en estra-
tegias puras, se define como la utilidad para el jugador i cuando el jugador i
resuelve:
Obsérvese que este valor supone que todos los adversarios de i actuan con-
certadamente para minimizar el pago de i.
14
Definición 10 (Estrategias mixtas) Para el jugador i, una estratgeia mixta
σi sobre el espacio de estrategias puras es un distribución de probabilidad sobre
Si . Denotamos esto por σi ∈ Σi donde Σi es el conjunto de distribuciones de
probabilidad sobre Si y σi (si ) es la probabilidad que la estrategia σi le asigna a
N
la acción si ∈ Si . Una estrategia mixta conjunta es un vector de σ ∈ Σ = Π Σi ,
i=1
σ = (σ1 , ..., σN ) donde σi ∈ Σi . Adicionalmente, suponemos que los jugadores
escogen las estrategias mixtas de forma estadı́sticamente independiente.
Definición
n 11 (Extensión Emixta de un juego en forma normal) Sea G =
(N , Si )i=1,...,N , {πi }i=1,...,N un juego en forma normal. La extensión mixta
del juego es el juego en forma estratégica:
Obsérvese que hemos utilizado el hecho de que los jugadores escogen las
estrategias de forma independiente.
5.1. Dominancia
Definición 12 (Dominancia de estrategias puras por mixtas) Decimos que
para el agente i ∈ N una estrategia si ∈ Si es dominada (estrictamente) por
bi ∈ Σi si para todo σ−i ∈ Σ−i :
una estrategia σ
πi (b
σi , σ−i ) > πi (si , σ−i )
La definición anterior es una definición más débil que la definición que di-
mos anteriormente. Es decir, si una estrategia es dominada (débilmente)
por una estrategia pura, entonces es dominada (débilmente) por una estra-
tegia mixta. El converso claramente no es cierto como muestra el siguiente
ejemplo.
15
Ejemplo 17 Considere el siguiente juego en forma estratégica (los pagos del
jugador dos son irrelevantes para el ejemplo).
1\2 A B
X 1,* 1,*
Y 3,* 0,*
Z 0,* 3,*
16
Definición 13 (Niveles de inteligencia) Supongamos que cada jugador es
racional en el sentido de jugar mejores respuestas. Decimos que las creencias
de un jugador son de grado 1 si este cree que los demás jugadores son raciona-
les. Son de grado 2 si el cree que los demás creen que los demás jugadores son
racionales (i.e., si el cree que los demás tienen creencias de grado 1), etc.
1. Sea Σ0i = Σi .
2. Σq+1
i = {σi ∈ Σqi : ∃σ−i ∈ Σq−i tal que ∀e
σi ∈ Σqi , πi (σi , σ−i ) ≥ πi (e
σi , σ−i )}.
Esto es, Σq+1
i son las estrategias que pueden ser racionalizadas como mejor
respuesta a alguna creencia de orden q (i.e., σ−i ∈ Σq−i ) que el agente i
tenga sobre los demás jugadores.
∞
Ri = ∩ Σqi se llama el conjunto de estrategias racionalizables del jugador i.
q=1
Un estrategia conjunta σ se llama racionalizable si la estrategia que le corres-
N
ponde a cada jugador es racionalizable: σ ∈ R = Π Ri
i=1
17
óptima a ninguna estrategia conjunta que los demás jugadadores jueguen.
Luego el conjunto de estrategias mixtas no dominadas iterativamente con-
tiene al conjunto de estrategias racionalizables.
En el caso de juegos bilaterales, estos dos conjuntos coinciden (Perace,
1984) pero, en general, la contenencia es estricta. Si permitieramos que
los agentes se formaran expectativas correlacionadas sobre las estrategias
de los demás ambos conceptos coincidirı́an (esto explica por qué en juegos
bilaterales no es necesario hacer esta extensión).
Ahora, parece intutivo que una estrategia racionalizable le asigne proba-
bilidad positiva solo a aquellas estrategias que se juegan con probabilidad
positiva en algun equilibrio de Nash. Sin embargo esto no es cierto como
lo demuestra un ejemplo de Bernheim (véase Vega - Redondo, tabla 2.10).
Luego el concepto de estrategia racionalizable, ası́ como el concepto de
estrategias no dominadas iterativamente, no es propiamente un concepto
de equilibrio en el sentido de que no existan incentivos a desviaciones
unilaterales.
π i (b b−i ) ≥ π i (σi , σ
σi , σ b−i )
Ejercicio 8 Dar algunos ejemplos para demostrar que ninguna de las hipótesis
de este teorema puede ser eliminada.
18
Nota técnica 3 El concepto de equilibrio Nash se remonta a Cournot [1838].
La formalización y primera demostración se debe a Nash [1950] en la que utiliza
el teorema del punto fijo de Kakutani. En Nash [1951] muestra como sustituir
el teorema de Kakutani por el de Brower.
1. σ
b es un equilibrio de Nash.
1\2 E G
E 100,100 0,0
G 0,0 1000,1000
positiva.
19
Ejemplo 20 (Batallla de los sexos) En este ejemplo hay, adicionalmente,
un equilibrio en estrategias mixtas: σ = ( 34 , 14 , 14 , 34 )
1\2 F C
N 0,2 0,2
E -1,-1 1,1
Teorema 4 (Debreu 1952, Fan 1952 y Glicksberg 1952) Bajo las condi-
ciones del teorema anterior, si el espacio de estratgeias es convexo y las funcio-
nes de utilidad son cuasi-cóncavas en la estrategia de cada jugador entonces el
juego tiene un equilibrio Nash en estrategias puras.
20
Ejemplo 22 (No existencia del equilibrio de Nash) Supongamos que dos
jugadores pueden venderle un producto a tres posibles compradores. Los com-
pradores A y C tienen acceso a sólo un vendedor. B tiene acceso a los dos
vendedores. Los tres compradores tienen una restricción presupuestal de una
unidad. Los vendedores escogen el precio de venta de su producto pero no pue-
den discriminar entre los compradores. Ellos escogen de forma simultánea un
precio pi ∈ [0, 1]. Supongamos que en caso de que los precios sean idénticos el
comprador B compra del vendedor 1.
Este juego no tiene un equilibrio, aún en estrategias mixtas. Suponga que
existe un equilibrio en estrategias puras tal que p1 > 21 . El jugador 2 va escoger
un precio ligeramente inferior p1 > p2 > 12 . En este caso el jugador 1 va querer
disminuir su precio y ası́ sucesivamente. Luego no existe un equilibrio con p1 >
1 1
2 . Si p1 ≤ 2 , la única mejor respuesta del jugador 1 es p2 = 1. Pero en este caso
1 tiene un incentivo a aumentar su precio. La no existencia de un equilibrio en
estrategias mixtas se deja como ejercicio para el lector.
Ejercicio 13 (Seven Puzzles You Think You Must Not Have Heard Correctly
with solutions: Peter Winkler). The names of 100 prisoners are placed in 100
wooden boxes, one name to a box, and the boxes are lined up on a table in a
room. One by one, the prisoners are led into the room; each may look in at
most 50 boxes, but must leave the room exactly as he found it and is permitted
no further communication with the others. The prisoners have a chance to plot
their strategy in advance, and they are going to need it, because unless every
single prisoner finds his own name all will subsequently be executed. Find a
strategy for them which has probability of success exceeding 30 %.
5.4. Seguridad
Ejemplo 23 Considere el siguiente juego:
A
B
a 2,1
0,0
b 0,0
1,2
21
6. Aspectos normativos
Definición 16 En un juego en forma normal, una estrategia conjunta τ domina
débilmente a σ en el sentido de Pareto si, para todo i :
πi (τ ) ≥ πi (σ)
Prueba. Considere una estrategia para cada jugador que sea ofertar la mitad
de su valoración.
22
7. Otros conceptos de solución
7.1. Equilibrio perfecto
Esta sección está basada en Mas-Colell et.al [1995].
La eliminación de estrategias dominadas débilmente es dificil de justificar
sobre la base del comportamiento puramente racional: una estrategia do-
minada débilmente puede ser un mejor respuesta a alguna estrategia de
otro jugador. Luego, sólo si estamos seguros de que el otro jugador no va
utilizar esa estrategia se justifica eliminarla.
El concepto de equilibrio de Nash tampoco elimina estrategias domina-
das débilmente: Puede existir un equilibrio de Nash tal que un jugador
está utilizando un estrategia dominada débilmente. Para mayor ilustra-
ción consideremos el siguiente juego.
1\2 A B
a 1,1 0,-3
b -3,0 0,0
Vamos a ver que si suponemos cierta cuatela por parte de los jugadores, en
la medida que estos reconozcan que con cierta probabilidad sus adversarios
pueden no jugar Nash, entonces es posible racionalizar la eliminación de
estrategias dominadas débilmente.
El objetivo es definir un concepto de equilibrio que sea robusto a cierto
tipo de perturbaciones del juego que reflejan la posibilidad de que los
jugadores puedan cometer errores.
La definición que captura esta idea es la siguiente. La proposición que le
sigue caracteriza y hace más operacional este nuevo concepto de equilibrio.
23
2. lı́mk→∞ σik = σi
Obsérvese que la definición solo requiere que exista una sucesión de juegos
perturbados.
Intuitivamente la definición captura la idea de que los agentes pueden
cometer errores (trembling hand ) y por lo tanto evaluan juegos ligeramente
perturbados donde los agentes le asignan probabilidad positiva a todas la
estrategias puras.
Proposición 5 Sea G = (N, (Si )i=1,...,N , (πi )i=1,..,N ) un juego en forma nor-
mal. Una estrategia conjunta de σ 1 , ..., σ n es un equilibrio perfecto (en forma
normal) del juego G si y solamente si para cada jugador i existe σki k=1,.....
sucesión de estrategias mixtas de soporte completo tal que:
1. σki → σ i
2. Para todo i y k, σ i es la mejor respuesta ante σk−i .
1\2 X Y
Aa 0,1 0,1
Ab 0,1 0,1
Ba -1,2 1,0
Bb -1,2 2,3
1\2 X Y
Aa 0,2 0,2
Ab 0,2 0,2
Ba -1,0 3,0
Bb -1,-1 -1,-1
24
Ejercicio 16 Mostrar que en un juego con únicamente dos jugadores todo equi-
librio de Nash en el no se juegan estrategias débilmente dominadas con proba-
bilidad positiva es un equilibrio perfecto en forma normal (véase Kreps, página
439).
1\2 X Y
A 2,2 2,2
BC 4,1 1,0
BD 0,0 0,1
Este juego tiene un equilibrio perfecto en formal normal pero no extensiva (véase
capı́tulo sobre juegos dinámicos).
Selten [1975] demostró que todo juego finito tiene un equilibrio perfec-
to en forma normal. En particular, todo juego finito tiene un equilibrio
de Nash en el que ninguna estrategia débilmente dominada se juega con
probabilidad positiva.
πi ((σi )i∈C , σ σ ), ∀i ∈ C
bN \C ) > πi (b
Ejemplo 26 Este juego tiene un único equlibrio fuerte pero dos equilibrios de
Nash.
1\2 A B
A 1,1 0,0
B 0,0 4,4
1\2 A B 1\2 A B
X 0,0,10∗ -5,-5,0 X -2,-2,0 -5,-5,0
Y -5,-5,0 1,1,4 Y -5,-5,0 -1,-1,5∗
3 M 3 N
25
En este juego existen dos equilibrios de Nash - Cournot y uno de ellos domi-
na al otro. Ninguno de los dos equilibrios de Nash - Cournot son un equilibrio
fuerte pero el equilibrio dominado tiene algunas caracterı́sticas que motivan el
próximo concepto de equilibrio que introduciremos. Para ver que el primer equili-
brio (X, A, M ) no es un equilibrio fuerte obsérvese que 1 y 2 tienen un incentivo
a desviarce. El segundo equilibrio claramente no es un equilibrio fuerte. Ahora,
considere los incentivos a desviarse del segundo equilibrio (dominado) al prime-
ro. Si los jugadores 1 y 2 creen que el jugador 3 va jugar M , la misma idea
del equilibrio fuerte nos suigiere que 1 y 2 no deberián de tener incentivos para
desviarse juntos de sus estrategias X y A respectivamente. Sin embargo, este no
es el caso, ellos tendrı́an el incentivo a desviarse juntos y jugar Y , B respec-
tivamente. Pero si el jugador 3 internaliza ese argumento entonces preferirı́a
jugar N y volvemos al equilibrio ineficiente.
26
desviaciones bilaterales admisibles. Sin embargo, los jugadors 1 y 2 si tie-
ne un incentivo a desviarse y esta desviación sı́ es admisible pues es un
equilibrio de Nash - Cournot del subjuego que definen ellos dos.
De todas formas este es un concepto muy fuerte de equilibrio y deja de
existir en muchas circunstancias.
Un resultado interesante de Moreno y Wooders (1996) afirma que si en el
conjunto de estrategias no dominadas iterativamente existe una que domi-
na débilmente a todas las demás, entonces esta estrategia es un equilibrio
inmune a coaliciones.
1\2 A B
X 5,1 0,0
Y 4,4 1,5
27
En un mecanismo privado las posibles desviaciones son condicionales a la
recomendación privada que el jugadaor recibe.
EP [π i (γ)] ≥ EP [π i (e
γi , γ−i )] ,
28
Definición 24 (Mecanismo de coordinación estocástico en forma reducida)
Un mecanismo de coordinación estocástico (en forma reducida) para un juego
en forma normal es una distribución de probabilidad p : Σ1 × ... × ΣN → [0, 1].
Por simplicidad vamos a considerar únicamente el caso en el que la distribución
es de soporte finito.
29
mixtas. Esa distribución conjunta es el equilibrio correlacionado en forma redu-
cida. En este caso le asigna probabilidad 31 a ((1, 0), (1, 0)), ((0, 1), (1, 0)), ((0, 1), (0, 1))
y probabilidad cero a ((1, 0), (0, 1)).
H\M B S
B 3,2 0,0
S 0,0 2,3
mechanism that might allow them to obtain the higher payoff of 2 available in
30
the middle box. As explained, if such a mechanism exists, its details need not be
given explicitly. That is, its performance may be compactly summarized through
a (stochastic) pattern of incentive-compatible recommendations as formalized by
Definition 2.7.
Consider therefore the probability density p : 1 × 2 × 3 → [0, 1], which
distributes all positive probability equally over the following two (pure) strategy
profiles: (X, A, N ) and (Y, B, N ). That is,
Este juego tiene dos equilibrios de Nash en estrategias puras: (Y, A, M ) y
(X, B, Q) . Ambos equilibrios tiene un pago neto de 1 para cada jugador. Existen
sin embargo estrategias conjuntas que domina a ambos equilibrios: (X, A, N ) ,
(Y, B, N ) . Consideremos ahora el siguiente mecanismo de coordinación estocásti-
co (en forma reducida): p (X, A, N ) = p (Y, B, N ) = 12 . Entonces p soporta un
equilibrio correlacionado con pago esperado 2 para cada jugador.
Ahora supongamos que 3 se le da la opción de pagar por conocer la recomen-
dación puntual que el mecanismo le hace a los otros dos jugadores. En este caso
3 responderı́a de la siguiente forma: Si los otros dos juegan (X, A) el juega M
y si juegan (Y, B) el juega Q. Luego si los otros dos jugadores son informados
de que 1 ha comprado esta opción ciertamente no jugaran las estrategias reco-
mendadas y no habrá coordinación impidiendo que los jugadores obtuvieran un
pago de 2. Luego la opción de obtener más información para 3 no tiene ningun
valor.
Definición 26 Un juego bilateral de suma cero es un juego G = h{1, 2} , {Si }i=1,2 , {πi }i=1,2 i
tal que para todo s ∈ S, π1 (s) + π2 (s) = 0.
Teorema 5 (von Neumann, 1928) Sea G una juego bilateral de suma cero.
Entonces:
5 Algunos autores consideran una generalización de juegos de suma cero que denominan
juegos estrictamente competitivos. Estos son juegos en los que los dos jugadore tiene preferen-
cias opuestas por las alternativas (en estrategias puras). Estos juegos comparten muchas de
la propiedades de los juegos de suma cero pero en general, la caracterı́stica de ser competitivo
no se extiende a estrategias mixtas.
31
1. máx mı́n π1 (σ1 , σ2 ) = mı́n máx π1 (σ1 , σ2 ) . El primer valor lo denomi-
σ1 ∈Σ1 σ2 ∈Σ2 σ2 ∈Σ2 σ1 ∈Σ1
namos el valor maxmin del jugador 1 y lo denotamos por v1 , el segundo
lo denominamos el valor minmax del jugador 1 y lo denotamos por v2 .
Luego el teorema afirma que en un juego de suma cero estos dos valores
son iguales y denotamos el valor común por v1∗ denominado el valor del
juego para el jugador 1.
2. Para todo equilibrio de Nash - Cournot (σ1∗ , σ2∗ ) tenemos v1∗ = π1 (σ1∗ , σ2∗ )
y viceversa, si σ1∗ , σ2∗ son estrategias maxmin para cada jugador enton-
ces (σ1∗ , σ2∗ ) es un equilibrio de Nash - Cournot. En particular, todos los
equilibrios de Nash - Cournot generan la misma utilidad.
v1 ≤ máx π1 (σ1 , σ2 ) ⇒ v1 ≤ v2
σ1 ∈Σ1
32
Ahora, v1 = máx mı́n π1 (σ1 , σ2 ) ≥ mı́n π1 (σ1∗ , σ2 ) = π1 (σ1∗ , σ2∗ ) (porque
σ1 ∈Σ1 σ2 ∈Σ2 σ2 ∈Σ2
σ2∗ es una mejor respuesta para el segundo jugador dado que el primero juega
σ1∗ ) luego v1 ≥ π1 (σ1∗ , σ2∗ ) .
Por otro lado, como σ1∗ es una mejor respuesta para el primer jugador dado
que el primero juega σ2∗ ,
El teorema anterior implica que el valor del juego para cada jugador es el
mismo para cada jugador independientemente de qué equilibrio de Nash
jueguen. En efecto, no es necesario que los jugadores jueguen un equilibrio
de Nash para que que se realice ese valor. Basta con que cada jugador
utilize como estrategia alguna que sea perteneciente a una estrategia con-
junta que sea un equilibrio y que él espere que los demás hagan lo mismo
y viceversa. Esta propiedad se conoce como intercambiabilidad del equili-
brio en juegos bilaterales de suma cero. Formalmente la intercambiabilidad
implica que el conjunto de estrategias conjuntas que son equilibrios tie-
ne la estructura de un producto cartesiano entre conjuntos de estrategias
mixtas.
El teorema de von Neumann puede verse como un caso particular del
teorema de dualidad en la teorı́a de optimización (véase Myerson, pági-
na 125). En efecto, existe una equivalencia entre juegos de suma cero y
problemas de programación lineal.
33
9. Juegos generalizados y juegos con un conti-
nuo de jugadores
Esta parte es avanzada en comparación con el resto de las notas y supo-
ne conocimientos básicos de teorı́a de la medida. El modelo está basado
en Riascos, A. y Torres Martinez, J.P (2012): On the existence of pure
strategy equilibria in large generalized games with atomic players.
En esta sección consideramos dos generalizaciones importantes de la teorı́a
de juegos estratégicos en forma normal. De una parte permitimos que
el espacio de acciones de cada jugador dependa de las acciones de los
demás (juego generalizado) y de otra parte permitimos que además de
un número finito de jugadores (llamados atómicos) exista un continuo de
jugadores (jugadores no-atómicos). Sin embargo, las acciones del continuo
de jugadores solo tiene influencia sobre los pagos de los demás (atómicos
y no-atómicos) a través de un mensaje que agrega las acciones de los
jugadores no-atómicos.
34
R
mediante el mensaje dado por la función m(f ) = h(t, f (t))dλ para incorporar
T1
a sus estrategias.
Ahora, nos vamos a concentrar en los perfiles de acciones para los cuales
los mensajes están bien definidos, decimos que f es un perfil de estrategias de
los jugadores en T1 si tanto f ∈ F(T1 ) como h(·, f (·)) es una función medible
desde T1 hasta Rl .7 Sobre el comportamiento de los jugadores atómicos no son
necesarias restricciones de medibilidad. Por está razón, el conjunto de estrategias
de los jugadores en T2 es idéntico al espacio de perfiles de acciones F(T2 ).
El conjunto de mensajes asociados con el perfil de estrategias de jugadores
no-atómicos está dado por
Z
M= h(t, f (t))dλ : f ∈ F(T1 ) ∧ h(·, f (·)) es medible ⊂ Rl , (1)
T1
T
que es no vacı́o dado que t∈T1 Kt es un conjunto no-vacı́o y h es una función
continua. También, dado que los conjuntos Kb y T1 son compactos, para cualquier
perfil de acciones f : T1 → K, la función h(·, f (·)) : T1 → Rl es acotada. Por
b
lo que, si esta es medible entonces también es integrable. Por estas razones, en
la definición del conjunto de mensajes M solo se requerı́a que h(·, f (·)) fuera
medible.
En nuestro juego, los mensajes acerca de los perfiles de estrategias de los
jugadores en T1 junto con los perfiles de estrategias de los jugadores en T2 pue-
den restringir el conjunto de estrategias admisibles disponibles para un jugador
t ∈ T . Esto es, dado un vector (m, a) ∈ M × F(T2 ) las estrategias dispo-
nibles para un jugador t ∈ T1 están dadas por un conjunto Γt (m, a) ⊂ Kt ,
donde Γt : M × F(T2 ) Kt es una correspondencia continua con valores
no vacı́os y compactos. De forma análoga, dado (m, a−t ) ∈ M × F−t (T2 ), el
conjunto de estrategias para el jugador t ∈ T2 es Γt (m, a−t ) ⊂ Kt , donde
Γt : M × F−t (T2 ) Kt es un correspondencia continua con valores no-vacı́os,
compactos y convexos. Nos referimos a las correspondencias (Γt ; t ∈ T ) como
correspondencias de estrategias admisibles.
Dado un conjunto A ⊂ Rk , definimos U(A) como una colección de funciones
continuas u : A → R. Supongamos que U(A) esta dotada con la topologı́a de
la norma del supremo. Suponemos que cada jugador t ∈ T1 tiene una función
objetivo ut ∈ U(K b × M × F(T2 )) y que cada jugador t ∈ T2 tiene una función
objetivo ut ∈ U(M ×F(T2 )) que se supone son cuasi-concavas en las estrategias.
Finalmente, suponemos que la correspondencia U : T1 → U(K b × M × F(T2 ))
8
definida por U (t) = ut es medible.
7 En Schmeidler (1973) and Rath (1992), los jugadores son no-atómicos y toman en cuenta
solamente el promedio de las acciones escogidas por los otros jugadores. Entonces, siguiendo
nuestra notación, l = n y h(t, x) = x. Por lo tanto, ellos definen los perfiles de estrategias
como funciones medibles desde el conjunto de jugadores hasta el conjunto de acciones.
8 Supongamos que hay un número finito de tipos en el conjunto de agentes no-atómicos,
T1 . Esto es, hay una partición finita de T1 en conjuntos Lebesgue-Medibles {I1 , . . . , Ir } tal
que, dos jugadores t y t0 pertenecientes al mismo elemento de la partición son idénticos. En
este caso, la restricción acerca de la medibilidad de U se satisface de forma trivial.
35
Definición. Un equilibrio de estrategias puras de Nash de un juego generalizado
G(T, (Kt , Γt , ut )t∈T , h) esta dado por los perfiles de estrategias (f ∗ , (a∗t ; t ∈ T2 ))
tales que, para cualquier jugador no-atómico t ∈ T1 ,
b → Rl es continua.
5. La función h : T1 × K
6. La correspondencia U : T1 → U (K b ×M × F (T2 )), que asocia con cualquier
t ∈ T1 la función objetivo ut , es medible.
36