Equilibrio de Nash en Teoría de Juegos
Equilibrio de Nash en Teoría de Juegos
Bien, considere la intersección o, mejor dicho, el equilibrio de Nash en estrategias mixtas (1,1), esto indica
que 𝑥 = 1 y que 𝑦 = 1. Que 𝑥 = 1 significa que 𝐸𝑎 elige, con toda probabilidad, B. Lo mismo ocurre con 𝐸𝑜
quien elige con toda probabilidad B, dado que 𝑦 = 1. Así, el equilibrio en estrategias mixtas (1,1)
corresponde con el equilibrio en estrategias puras 𝜎 1∗ = (𝐵, 𝐵). De la misma forma, el equilibrio (0,0)
significa que ambos jugadores eligen la opción opuesta a B, la cual es S, por lo que este equilibrio
2 1 2
Por último, el equilibrio (3 , 3) indica que 𝐸𝑎 deberá elegir B con probabilidad 3 en tanto que 𝐸𝑜 deberá
1 2
elegir también B con probabilidad . Si 𝐸𝑎 elige B con probabilidad , significa que elige S con probabilidad
3 3
1 1 2
. De esta misma forma, si 𝐸𝑜 elige B con probabilidad , significa que elige S con probabilidad . Lo que
3 3 3
denota un equilibrio de Nash de acuerdo con un evento programado con niveles de probabilidad.
DEFINICIÓN 7: Dada 𝑋 ∈ 𝑀 (con 𝑀 = × 𝑋𝑗 ), se dice que 𝑋̂𝑗 es una MEJOR RESPUESTA MIXTA del
𝑗∈𝑁
jugador 𝑗 al perfil 𝑋, si
Dado un juego rectangular, para cada jugador 𝑗, y para cada 𝑋 ∈ 𝑀, se denotará al CONJUNTO
47
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
Ahora considere el Dilema del prisionero original, de la Tabla 8. Recuerde que en este juego el equilibrio
de Nash se encuentra en el perfil 𝜎 ∗ = (𝐶, 𝐶), por lo que se espera que un equilibrio en estrategias mixtas
sea (1,1).
Primero, se calcularán las funciones de pago esperado 𝜓1 [(𝑥, 1 − 𝑥), (𝑦, 1 − 𝑦)] y 𝜓2 [(𝑥, 1 − 𝑥), (𝑦, 1 − 𝑦)].
𝐽2
C NC 3(1 x)y
y 1 y
Y=(x y) 2xy
-
-
= - -
y)
X)
𝐽1
NC (−3,0) (−1, −1)
(1 X)
Ya(x y) y)
-
,
=
-
exy -
x)1 -
(1 -
x)(1 -
y)
𝜓1 [(𝑥, 1 − 𝑥), (𝑦, 1 − 𝑦)] = (−2)𝑥𝑦 + (0)𝑥(1 − 𝑦) + (−3)(1 − 𝑥)𝑦 + (−1)(1 − 𝑥)(1 − 𝑦)
𝜓2 [(𝑥, 1 − 𝑥), (𝑦, 1 − 𝑦)] = (−2)𝑥𝑦 + (−3)𝑥(1 − 𝑦) + (0)(1 − 𝑥)𝑦 + (−1)(1 − 𝑥)(1 − 𝑦)
48
- 3x
3x
-
- 2x = 1
3
-
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
0 > −1
03 -
1
¿Bajo qué circunstancias ocurre que 0 es mayor que un número negativo?, bajo cualquier circunstancia. Si
se replantea la pregunta: ¿bajo qué condiciones del valor 𝑦, 0 > −1?, pues bajo cualquier condición de 𝑦.
Una vez más, ¿cuáles son los valores de 𝑦 que hacen que 0 sea mayor que −1?, todos los posibles valores
que pueda tomar 𝑦, es decir, los valores del intervalo [1,0] pues es una medida de probabilidad que no
tiene restricciones.
Ahora, se hará lo mismo para el jugador 2. Se tiene que 𝐽2 elige con toda probabilidad C sobre NC (𝑦 = 1), si
0 > −1
𝐿2 (𝑥) = {𝑦y= 1
1 𝑠𝑖=
x𝑥 [0,1]
t∈(0 1] ,
49
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
(1 1) , que representa
el confesar
confesar
Cabe preguntarse si pasará lo mismo con la versión premios de Dilema del prisionero, el que se muestra
en la Tabla 9.
Tarea moral
-
- +
𝜓1 (𝑥, 𝑦) = 𝑥𝑦
xy + 3𝑥(1 − 𝑦) + 2(1 − 𝑥)(1 − 𝑦)
+
z)1 x)(1 y)
xy + 3(1 −x)y
-
3(1 𝑥)𝑦 +
-
+
Para 𝐽1 , se evalúa 𝜓1 en 𝑥 = 1 y 𝑥 = 0.
50
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
𝜓1 (1, 𝑦) = 𝑦 + 3(1 − 𝑦)
= 𝑦 + 3 − 3𝑦
= 3 − 2𝑦
𝜓1 (0, 𝑦) = 2(1 − 𝑦)
= 2 − 2𝑦
3 − 2𝑦 > 2 − 2𝑦
32 -
3>2
Y esto ocurre para cualquier valor de 𝑦. Así, el conjunto de mejor respuesta es:
𝐿1 (𝑦) = {𝑥 = 1 𝑠𝑖 𝑦 ∈ [0,1]
𝜓2 (𝑥, 1) = 𝑥 + 3(1 − 𝑥)
= 𝑥 + 3 − 3𝑥
= 3 − 2𝑥
𝜓2 (𝑥, 0) = 2(1 − 𝑥)
= 2 − 2𝑥
3 − 2𝑥 > 2 − 2𝑥
51
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
3>2
𝐿2 (𝑥) = {𝑦 = 1 𝑠𝑖 𝑥 ∈ [0,1]
La Figura 8 muestra una gráfica similar a la de la Figura 7, y en esta se determina que el equilibrio de Nash
∗ ∗
es el mismo que el caso anterior, 𝜎𝑒𝑚 = (1,1), el cual corresponde con 𝜎𝑒𝑝 = (C, C).
Considere ahora el ejemplo 3, el Juego del “volado” (moneda al aire). Recuerde que en este no se encontró
equilibrio de Nash en estrategias puras. Se calcularán sus equilibrios en estrategias mixtas. En la tabla 10
EN =
<03 para
X
a (−1,1) (1, −1) estrategias puras
𝐽1
s (1, −1) (−1,1)
1X
52
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
x(x−y)
𝜓2 (𝑥, 𝑦) = 𝑥𝑦 − 𝑥(1 (1 − 𝑥)𝑦 +(1
𝑦) − (1 (1 x)7 y) − 𝑦)
− 𝑥)(1
xy xy
- - + - -
- -
Se evalúan 𝜓1 y 𝜓2 en 𝑥 = 1, 𝑥 = 0, y 𝑦 = 1, 𝑦 = 0.
(1 −y)
𝜓1 (1, 𝑦) = −𝑦y + (1 zy+ 11
𝑦) = −2𝑦
- +
+
-
- =
𝜓1 (0, 𝑦) = 𝑦y − (1-y)
(1 − 𝑦) = 2𝑦1 − 1
cy
- =
𝜓2 (𝑥, 1) = 𝑥X − 11
(1-X) = 2𝑥1− 1
− 𝑥) 2x
-
=
-
𝜓2 (𝑥, 0) = −𝑥 -
(1X)− 𝑥) =2x
x +(1 −2𝑥
+
1+1 -
=
- +
sol
Entonces, 𝐽1 elige con toda probabilidad “a” sobre “s”, 𝑥 = 1, si:
Aguila
−2𝑦 + 11>>2𝑦 − 1
-
2y
+
2y- 1
−4𝑦 > −2
y < E
1
𝑦<
2
1
𝑥X = 11 =
𝑠𝑖 Si𝑦 <
y<2
1
(0 , 1) 𝑠𝑖 siy𝑦 = Xz
=
sol
Y 𝐽2 elige con toda probabilidad “a” sobre “s”, 𝑦 = 1, si:
Aguila
𝜓2 (𝑥, 1) > 𝜓2 (𝑥, 0)
2𝑥 − 13
2x- 1 > −2𝑥
2x +
11 - +
4𝑥
x > 2
E
1
𝑥>
2
53
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
1 si xx
1
𝑦y = 1
=
𝑠𝑖 𝑥>
2
(0 1) Si 1 E
x =
𝐿2 (𝑥) = 𝑦 y∈t(0,1) 𝑠𝑖
,
𝑥=
2
0
si x
1
{ 𝑦y = 0 𝑠𝑖 𝑥<
=
En la Figura 9 se muestran los conjuntos, o correspondencias de mejor respuesta para el juego de moneda
al aire. En este gráfico se muestra la existencia, en estrategias mixtas, de un solo equilibrio de Nash, el cual
1 1
es el perfil 𝜎 ∗ = ( , ). La interpretación de este resultado radica en el hecho de que una persona, jugando
2 2
un número determinado este juego, la mejor estrategia que puede ocupar es elegir la mitad de “águila” y la
mitad de “sol”, esta es su estrategia de equilibrio, la misma que mostrará su contrincante. Esta estrategia
↑
I
E
-
1)
- x t (0,
Ahora se calcularán los equilibrios en estrategias mixtas del siguiente juego hipotético. La matriz de pagos
En esta matriz se determinan dos equilibrios de Nash en ep, 𝐸𝑁𝑒𝑝 = {(𝑈, 𝐿), (𝐷, 𝑅)}. Ahora se calcularán
54
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
,
Ay
2x(1 y)− 𝑦)
𝜓2 (𝑥, 𝑦) = −2𝑥(1 z(1
x)y(1 −
(1 + 𝑥)𝑦 + y)
x)(1 2(1 − 𝑥)(1 − 𝑦)
- -
+
+ -
-
-
Se evalúan 𝜓1 y 𝜓2 en 𝑥 = 1, 𝑥 = 0, y 𝑦 = 1, 𝑦 = 0.
- y −11(1y)− 𝑦) =
𝜓1 (1, 𝑦) = −𝑦 1 −1
- -
-
=
𝜓1 (0, 𝑦) = −𝑦 (1 y) 1+1
y + (1 − 𝑦) =zy−2𝑦 = +
+
- - -
𝜓2 (𝑥, 1) = 1(1−
-X)
𝑥 =
1 -
𝜓2 (𝑥, 0) = −2𝑥
2x + 2(1x)− 𝑥) =
2(1
-
4x−4𝑥
+
+2 +2 -
=
-
−113 2y + 11
> −2𝑦
-
+
y<< 1
−2𝑦 −2 No es posible
porser una probabilidad :
𝑦>1
𝑥x = 11 Si𝑠𝑖 >𝑦1> 1
y
=
𝐿1 (𝑦) = {𝑥 ∈ (0,1) 𝑠𝑖 𝑦 = 1
2) Si y 1
=
*𝑥=0
t 10 𝑠𝑖 𝑦 < 1
*
,
x = 0
Si y C1
N
Ahora, 𝐽2 elige con toda probabilidad “L” sobre “R”, 𝑦 =mu
1, si:
55
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
4x +
2
1 − 𝑥 > −4𝑥 + 2
3x > 1
3𝑥 > 1
x 5
1
𝑥>
3
1
j Six 𝑥>43
1
𝑦y = 1 𝑠𝑖 >
=
3
(0 2) ;= Si X
=
1Y3
𝐿2 (𝑥) = 𝑦y ∈ (0,1) 𝑠𝑖
,
𝑥=
3
Si 1
x>Y3
y 0
{ 𝑦=0 𝑠𝑖 𝑥<
;
=
En la Figura 10 se muestran los conjuntos de mejor respuesta del juego hipotético 2. En este gráfico se
indica una cantidad infinita de equilibrios, dentro de un segmento continuo. En este caso se afirma que
1
jugador 1 tendrá una estrategia de equilibrio, de manera continua eligiendo 𝑥 > . Es decir, para todo el
3
1
intervalo semicerrado de valores de 𝑥, ( , 1], son estrategias de equilibrio, en tanto que para 2, la
3
s
Aca hay una
region .
Is
56
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
Otro ejemplo más es el que se muestra en la matriz de pagos de la Tabla 28. De igual forma, se calcularán
A partir de esto se determina que 𝐸𝑁𝑒𝑝 = {(𝐷, 𝑅)}. Ahora se calcularán los equilibrios en estrategias mixtas.
Se evalúan 𝜓1 y 𝜓2 en 𝑥 = 1, 𝑥 = 0, y 𝑦 = 1, 𝑦 = 0.
𝜓1 (1, 𝑦) = 3𝑦
𝜓1 (0, 𝑦) = 3(1 − 𝑦) = 3 − 3𝑦
𝜓2 (𝑥, 1) = 0
𝜓2 (𝑥, 0) = 𝑥 + (1 − 𝑥) = 1
3𝑦 > 3 − 3𝑦
6𝑦 > 3
1
𝑦>
2
57
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
1
𝑥=1 𝑠𝑖 𝑦>
2
1
𝐿1 (𝑦) = 𝑥 ∈ (0,1) 𝑠𝑖 𝑦=
2
1
{ 𝑥=0 𝑠𝑖 𝑦<
2
0>1
Como esto no sucede, entonces, 𝐽2 debe elegir “R” sobre “L” con toda probabilidad, 𝑦 = 0; así es coherente
la afirmación:
1>0
Y como 1 > 0 para cualquier caso de 𝑥, entonces la correspondencia de mejor respuesta es:
𝐿2 (𝑥) = {𝑦 = 0 𝑠𝑖 𝑥 ∈ [0,1]
La gráfica de correspondencias de mejor respuesta para el juego hipotético 3 se muestra en la Figura 11,
58
Septiembre 28 , 2023
El siguiente ejemplo es un juego de suma cero. Se pide a dos personas que elijan simultáneamente un
número entre el conjunto de enteros del 1 al 𝑘. Si los números coinciden, el jugador 2 le paga $1 al jugador
1, en cualquier otro caso, el pago es cero para ambos. ¿Cuál es el equilibrio de Nash?
• N =
<J1 J23
,
• D1 D2 =
=
<1 ,
2, 3
,
. .
., k}
• D D1XD2 <(1 1)
= =
, ,
. .
.,
(1 k) ,
, .
. .
.,
(k 2),
, . . . .
, (k , K)3
• Funciones de pago:
𝜑1 : 𝐷 → ℝ 𝜑2 : 𝐷 → ℝ
(1 , 1) ↦ 1 (1 , 1) ↦ ->
1
(1 , 2) ↦0 (1 , 2) ↦ 0
… … … … … …
11 , k) ↦O 11 , k) ↦ 0
(2 , 1) 0 0
↦ (2 , 1) ↦
12, 2 1 1
↦ 12, 2 ↦ -
… … … … … …
(k , k) ↦I (k , k) ↦
-
1
La matriz de pagos de este juego será una matriz cuadrada de tamaño 𝑘, en cada celda se encuentra un
vector de dos entradas, pago para jugador 1 y para el jugador 2, de manera respectiva. En todas las
entradas de la diagonal se encontrará repetidamente el vector (1, −1). Fuera de la diagonal, cualquier
entrada será el vector (0,0). Por ejemplo, para el caso en que 𝑘 = 2, la Tabla 29 muestra los pagos.
Como se observa, no hay Equilibrio de Nash en estrategias puras. Es fácil mostrar que este juego tiene
1 1
como equilibrio, en estrategias mixtas, al perfil 𝜎 ∗ = (2 , 2). La gráfica de correspondencias de mejor
59
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
respuesta se muestra en la Figura 12, la cual es semejante a la que se muestra en la Figura 9, una cruz
gamada; en este caso, una contra-gamada. Es importante resaltar en este punto lo siguiente: se infiere que
en un juego de suma cero, para el que no haya equilibrios en estrategias puras, la forma de los conjuntos
de mejor respuesta es una cruz gamada o contra-gamada6; y, por tanto, hay solo un equilibrio en
estrategias mixtas, sin correspondencia en estrategias puras, es decir, equilibrios en los que no hay
Para el caso de los juegos de suma cero, los que cumplen las condiciones de acuerdo con el Apéndice 1, los
equilibrios se encuentran dentro de la llamada ZONA O REGIÓN DE INDIFERENCIA DE LOS JUGADORES PARA ELEGIR
UNA U OTRA ESTRATEGIA. Así, en el juego representado en la matriz de pagos de la Tabla 29, para encontrar
6 Esto ocurre siempre que las diferencias absolutas de los pagos entre una u otra estrategia del jugador 1, sumadas de
acuerdo con las dos estrategias del jugador 2, sea distinto de cero. En caso de ser cero se obtienen formas degeneradas de
los conjuntos de mejor respuesta, las cuales no son cruces gamadas. En el Apéndice 1 se encuentra un análisis de los juegos
de suma cero y sus formas gráficas de los conjuntos de mejor respuesta (intenté generar una conclusión general, es decir
propuse una matriz de pagos de 2x2 y utilicé a, b, c y d, tal que dieran suma cero en cada entrada; sin embargo, no llegué a
mucho, ver apunte).
60
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
región en la que a ambos jugadores les da lo mismo utilizar una estrategia que otra, esto es, la parte de los
conjuntos en que 𝑥 ∈ (0,1) y 𝑦 ∈ (0,1). Es decir, se calculan los pagos esperados de cada uno, se evalúan
indiferente utilizar una estrategia que otra, cuando los pagos se igualan. De aquí que a esta región se le
llame la ZONA DE INDIFERENCIA DE LOS JUGADORES. Cabe mencionar que esta zona no necesariamente se
encuentra en el interior del Cuadrado Unitario. Se pueden establecer las condiciones para conocer si esta
zona se encuentra en el interior o en la frontera. Por ejemplo, en los juegos de suma cero, la Zona de
Indiferencia se encuentra en el interior del Cuadrado Unitario. Esto, al parecer, dependerá únicamente de
la combinación de pagos.
Regresando al juego de la Tabla 29, se calculan los pagos esperados para cada jugador.
𝜓1 (𝑥, 𝑦) = 𝑥𝑦 + (1 − 𝑥)(1 − 𝑦)
Se evalúan 𝜓1 y 𝜓2 en 𝑥 = 1, 𝑥 = 0, y 𝑦 = 1, 𝑦 = 0.
𝜓1 (1, 𝑦) = 𝑦
𝜓1 (0, 𝑦) = 1 − 𝑦
𝜓2 (𝑥, 1) = −𝑥
𝜓2 (𝑥, 0) = −(1 − 𝑥) = 𝑥 − 1
indiferencia de elegir una u otra estrategia en ambos jugadores. Entonces, para 𝐽1 se establecerá la
𝜓1 (1, 𝑦) = 𝜓1 (0, 𝑦)
61
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
𝑦 =1−𝑦
2𝑦 = 1
1
𝑦=
2
𝜓2 (𝑥, 1) = 𝜓2 (𝑥, 0)
−𝑥 = 𝑥 − 1
−2𝑥 = −1
1
𝑥=
2
X =
2
1 1
Así, el equilibrio es 𝜎 ∗ = (2 , 2), tal como se había indicado más arriba.
1 =
62
Apuntes para un curso básico de Teoría de Juegos
Facultad de Ciencias, UNAM. Julio 2022
Mtro. Juan Carlos Guapilla Salamanca
𝜓1 ((1,0,0), 𝑦) = 𝑦y1
1
𝜓1 ((0,1,0), 𝑦) = 𝑦y2
2
𝜓1 ((0,0,1), 𝑦) = 𝑦y3
3
Se asumirá que la intercepción se encuentra dentro de la zona de indiferencia para elegir cualquiera de
-
sus 3 decisiones para cada jugador. En este caso, para 𝐽1 , se considera que le da lo mismo elegir 1, 2 o 3, es
decir, 𝑥1 , 𝑥2 , 𝑥3 ∈ (0,1), si los tres pagos calculados inmediatamente arriba, son iguales. Esto es:
1
𝑦1 + 𝑦2 + 𝑦3 = 1, por lo tanto: 𝑦1 = 𝑦2 = 𝑦3 = 3.
De esta misma forma se calcula que, para 𝐽2 , le dará lo mismo elegir 1, 2 o 3, es decir, 𝑦1 , 𝑦2 , 𝑦3 ∈ (0,1), si
1
sus tres pagos son iguales, y considerando la definición de 𝑋1 , por lo que 𝑥1 = 𝑥2 = 𝑥3 = 3. Así, el
1 1 1 1 1 1
equilibrio para este juego es 𝜎 ∗ = ((3 , 3 , 3) , (3 , 3 , 3)), con 𝑘 = 3.
De manera inferencial, se debe obtener que para cualquier número entero 𝑘, el equilibrio del Juego, 𝐽1
1 1 1 1 1 1
adivina a 𝐽2 , deberá ser 𝜎 ∗ = ((𝑘 , 𝑘 , … , 𝑘) , (𝑘 , 𝑘 , … , 𝑘)).
63