Teorema de Perron-Frobenius
Apuntes para Modelos Matemáticos I, Rafael Ortega
1 Enunciado y ejemplos
Suponemos que la matriz A ∈ Rd tiene todos sus coefi-
cientes positivos,
(?) aij > 0 para cada i, j = 1, . . . , d.
Entonces A tiene un valor propio λ1 que es positivo y domi-
nante. Además, el vector propio asociado w ∈ Rd se puede
escoger con todas las coordenadas positivas,
w1
w2
Aw = λ1 w, w = ··· ,
wd
λ1 > 0, wi > 0 para cada i = 1, . . . , d.
Ejemplos
7 7 7
1. A = 7 7 7
7 7 7
1
En este caso λ1 = 21 y podemos elegir w = 1 .
1
1
Comprobamos que λ1 es dominante ya que solo hay otro
valor
propio,
λ2= 0,
que es doble. Los vectores v1 =
1 −2
1 y v2 = 1 son linealmente independientes y
−2 1
cumplen Avi = 0.
v2
v1
7 0 0
2. A = 0 7 0
7 7 7
En este caso λ1 = 7 es positivo pero al ser triple no es
dominante. No hay vectores propios asociados con todas las
coordenadas positivas, el espacio propio asociado es x+y =
0. Es un caso en el que el teorema no es aplicable porque
la condición (?) no se cumple.
Una mejora del teorema
El teorema sigue siendo válido cuando (?) se cambia por
la condición más débil:
(??) todos los coeficientes de A son no negativos y existe
algún entero ν ≥ 1 para el que la potencia Aν tiene todos
los coeficientes positivos.
2
Ejemplos (continuación)
0 1
3. A =
1 1
2
En este
caso se cumple (??) con ν = 2, pues A√ =
1 1
. Los valores propios de A son λ1 = 1+2 5 y
1 2 √
λ2 = 1−2 5 . Como predice el Teorema, λ1 es positivo y
1
dominante. El vector propio w = tiene coorde-
λ1
nadas positivas.
Antes de empezar la demostración del teorema vamos a
estudiar algunas ideas preliminares sobre el orden vectorial,
las aplicaciones lineales y la desigualdad triangular.
2 Preliminares
2.1 El orden vectorial
Definimos
x1
Rd+ = {x ∈ Rd : x = · · · , xi ≥ 0, i = 1, . . . , d}.
xd
Para d = 1 este conjunto es la semi-recta positiva, para
d = 2 es el primer cuadrante del plano, para d = 3 es el
primer octante del espacio,...
Dados x, y ∈ Rd , la notación x ≥ y significa x − y ∈ Rd+
o, de manera equivalente,
xi ≥ yi para cada i = 1, . . . , d.
3
La notación x y se emplea para la condición más fuerte
xi > yi , i = 1, . . . , d.
Los vectores y en la zona verde cumplen x y, mientras
que los de la zona azul cumplen x y. Los vectores en las
zonas sin colorear no se comparan con x. ¿Qué propiedades
cumplen los vectores situados en los bordes de las zonas
coloreadas?
Ejercicio. Prueba que si x y entonces existe un número
> 0 de manera que x ≥ (1 + )y.
Al igual que en el caso de los números, las desigualdades
no estrictas van bien con el paso al lı́mite. Dados xn , x, α ∈
Rd ,
{xn }n≥0 → x, xn ≥ α ⇒ x ≥ α.
Esto es equivalente a decir que Rd+ es cerrado en Rd .
La hipótesis (?) se puede interpretar como una propiedad
de monotonı́a fuerte de la aplicación lineal descrita por A,
x, y ∈ Rd , x ≥ y, x 6= y ⇒ Ax Ay.
4
Ejercicio. Prueba que esta propiedad es equivalente a (?).
2.2 La matriz traspuesta y los hiperplanos invariantes
Dada una matriz A ∈ Rd×d , los vectores propios nos per-
miten describir las rectas invariantes de la aplicación li-
neal asociada. Si Av = λv, entonces A(V ) ⊆ V , donde
V = {cv : c ∈ R} es la recta vectorial que engendra v.
V
v
Por dualidad, los vectores propios reales de la matriz
traspuesta A∗ nos permiten determinar los hiperplanos in-
variantes. Si A∗ v = λv, entonces el hiperplano ortogonal a
v es invariante por A.
Lema 1. Dada A ∈ Rd×d , suponemos que v ∈ Rd \ {0}
5
cumple A∗ v = λv para algún λ ∈ R. Entonces
V = {x ∈ Rd : x ⊥ v}
cumple A(V ) ⊆ V .
Demostración. Usaremos una importante propiedad de
la matriz traspuesta:
hAx, yi = hx, A∗ yi, ∀x, y ∈ Rd .
Dado x ∈ V , sabemos que hx, vi = 0. Vamos a probar que
también Ax es perpendicular a v,
hAx, vi = hx, A∗ vi = hx, λvi = 0.
2.3 Valores propios simples
Consideramos una aplicación lineal L : Rd → Rd . Dada
una base B de Rd , designamos por MB a la matriz que
representa a L en esa base.
Lema 2. Suponemos que hay una descomposición
Rd = V ⊕ W
donde W = Ker(L − λ1 I) es una recta engendrada por un
vector propio w ∈ Rd \ {0} y V es un hiperplano invariante
por L, L(V ) ⊆ V . Entonces λ1 es un valor propio simple
(en sentido algebraico).
Demostración. Construimos una base B = {w, v2 , . . . , vd }
de Rd donde {v2 , . . . , vd } es una base del sub-espacio V . De
vi ∈ V se sigue que Lvi ∈ V , por ser V invariante. Entonces
d
X
Lvi = αji vj ,
j=2
6
W
con αij ∈ Rd . La matriz MB será
λ1 0 · · · 0
0 α22 . . . α2d
MB = ··· ··· ··· ··· .
0 αd2 · · · αdd
α22 . . . α2d
La sub-matriz M̂ = · · · · · · · · · representa al ope-
αd2 · · · αdd
rador restringido a V , LV : V → V , en la base B̂ =
{v2 , . . . , vd }. Designamos por p(λ) al polinomio caracterı́stico
de L y por p̂(λ) al de LV . Entonces, desarrollando por la
primera columna de MB ,
p(λ) = det(MB −λI) = (λ1 −λ) det(M̂ −λI) = (λ1 −λ)p̂(λ).
Como λ1 no es un valor propio de LV , p̂(λ1 ) 6= 0. Por tanto
λ1 es una raı́z simple de p(λ).
7
2.4 Observaciones sobre la desigualdad triangular en C
Dados α, β ∈ C, sabemos que se cumple la desigualdad
triangular
|α + β| ≤ |α| + |β|.
Suponemos α 6= 0 y nos preguntamos bajo qué condiciones
se da la igualdad. Daremos por cierto lo que sugieren los
dibujos; es decir,
|α + β| = |α| + |β| ⇐⇒ ∃µ ∈ R, µ ≥ 0 : β = µα.
Esta observación se puede extender a cualquier conjunto
finito de números complejos.
Lema 3. Dados α1 , α2 , . . . , αr ∈ C con α1 6= 0, son equiva-
lentes:
(i) |α1 | + |α2 | + . . . + |αr | = |α1 + α2 + . . . + αr |
(ii) Para cada i = 2, . . . , r existe µi ∈ R, µi ≥ 0 tal que
αi = µi α1 .
1
2
3
Demostración. (ii) ⇒ (i) Se deja como ejercicio.
8
(i) ⇒ (ii) Sabemos que esta implicación es válida para r =
2. Haremos inducción sobre r ≥ 2. Suponemos que (i) ⇒
(ii) es cierta para cualesquiera r − 1 números y partimos
de (i) para r números. Es decir,
|α1 | + |α2 | + . . . + |αr | = |α1 + α2 + . . . + αr | = |α1 + β|,
donde hemos definido β = α2 + . . . αr . La desigualdad
triangular y esta identidad implican,
|α1 + β| ≤ |α1 | + |β| = |α1 | + |α2 + . . . + αr | ≤
|α1 | + |α2 | + . . . + |αr | = |α1 + β|.
Por tanto se cumple |α1 + β| = |α1 | + |β|. De aquı́ se
sigue la existencia de un número µ ≥ 0 tal que β = µα1 .
Reescribimos (i) teniendo en cuenta que 1 + µ es positivo,
|α1 | + |α2 | + . . . + |αr | = |α1 + β| = |α1 + µα1 | = (1 + µ)|α1 |.
Como µ es no negativo deducimos que
|α2 | + . . . + |αr | = µ|α1 | = |µα1 | = |β|.
Es decir, se cumple
|α2 | + . . . + |αr | = |α2 + . . . + αr |
y nos encontramos con (i) para r − 1 números.
No es restrictivo suponer que α2 6= 0. En otro caso defini-
mos µ2 = 0 y nos fijamos en α3 .
Por la hipótesis de inducción existen γ3 , . . . , γr ≥ 0 tales
que αj = γj α2 , j ≥ 3. De las identidades anteriores,
µα1 = β = α2 + α3 + . . . + αr = (1 + γ3 + . . . + γr )α2 .
9
El número 1 + γ3 + . . . + γr es positivo y podemos encontrar
los coeficientes µi ,
µ µγj
µ2 = , µj = , j ≥ 3.
1 + γ3 + . . . + γr 1 + γ3 + . . . + γr
3 Demostración del Teorema
Primero suponemos que se cumple (?). Al final de la prueba
discutiremos los cambios que hay que introducir cuando
solo se supone (??).
Comenzamos definiendo la noción de valor propio de
módulo máximo:
λ1 ∈ σ(A), |λ1 | = r(A).
Algunas matrices tienen varios valores propios
con esta
−1 0 0
propiedad. Por ejemplo, para la matriz 0 0 −1
0 1 0
todos los valores propios tienen módulo máximo.
1
i
10
El primer paso en la demostración será probar que cuando
se cumple (?) hay un único valor propio con módulo máximo.
Será consecuencia de la propiedad:
(♣) Si λ1 es un valor propio de módulo máximo, entonces
λ1 > 0 y existe w ∈ Rd , w 0 tal que Aw = λ1 w.
1
r A
Para probar (♣) elegimos λ1 ∈ σ(A) de módulo máximo y
un vector propio asociado v ∈ Cd \ {0},
Av = λ1 v.
En coordenadas,
d
X
aij vj = λ1 vi , i = 1, . . . , d.
j=1
Después de tomar módulos y usar la desigualdad triangular,
d
X d
X
|λ1 ||vi | = | aij vj | ≤ aij |vj |.
j=1 j=1
Aquı́ hemos usado que los coeficientes de A no son nega-
tivos.
11
Distinguimos dos casos:
(i) todas las desigualdades son estrictas,
d
X
|λ1 ||vi | < aij |vj |, i = 1, . . . , d
j=1
(ii) en alguna coordenada se da la igualdad,
d
X
|λ1 ||vi | = aij |vj |, para algún i ∈ {1, . . . , d}.
j=1
Veamos en primer lugar que el caso (i) es imposible. Defi-
nimos el vector
|v1 |
V = · · · ∈ Rd+ .
|vd |
Si se cumple (i), AV |λ1 |V . Entonces, por un ejercicio
anterior, sabemos que existe > 0 tal que AV ≥ (|λ1 |+)V .
La matriz B = |λ11|+ A tiene radio espectral
1 |λ1 |
r(B) = r(A) = < 1.
|λ1 | + |λ1 | +
Aquı́ hemos usado que λ1 tiene módulo máximo. Deduci-
mos que B n → 0 si n → ∞. Por otra parte sabemos que
BV ≥ V y, como B preserva el orden, deducimos la cadena
de desigualdades
. . . B n+1 V ≥ B n V ≥ . . . ≥ B 2 V ≥ BV ≥ V.
En particular B n V ≥ V para cada n ≥ 1. Tomando lı́mites
en esta desigualdad y usando la continuidad del producto
12
de matrices, 0 · V = 0 ≥ V . Entonces V = 0, lo que es una
contradicción con su definición y v 6= 0.
Ahora sabemos que la alternativa válida ha de ser (ii)
y podemos usar la observación anterior sobre la desigual-
dad triangular. Para simplificar la notación supondremos
que la igualdad se da para la primera coordenada (i = 1).
Entonces sabemos que se cumple
d
X
|λ1 ||v1 | = a1j |vj |.
j=1
Como alguna coordenada vj es no nula y se cumple (?),
d
X
|λ1 ||v1 | = a1j |vj | > 0.
j=1
Ahora podemos decir que λ1 6= 0 y v1 6= 0. Usamos el Lema
3 con α1 = a11 v1 6= 0, αj = a1j vj , j ≥ 2. Puesto que se
cumple la condición (i) del Lema, existirán nḿeros µj ≥ 0,
j = 2, . . . , d tales que
a1j vj = µj a11 v1 .
Hemos obtenido la identidad v = cw con c = v1 y
1
µ2 a11
V = a12 ∈ Rd+ \ {0}.
···
µd a11
a1d
Como A tiene la propiedad de monotonı́a fuerte, Aw 0.
Además, de w ∈ Ker(A − λ1 I) se deduce que
λ1 w = Aw 0.
13
Como w1 = 1 deducimos de la primera coordenada de esta
igualdad que λ1 > 0. Finalmente, de w = λ11 Aw llegamos a
w 0. Hemos probado que se cumple (♣).
Supongamos ahora que el espectro de la matriz está for-
mado por valores propios distintos λ1 , λ2 , . . . , λr con r ≤ d
y λ1 de módulo máximo. Entonces |λi | < λ1 para cada
i = 2, . . . , r. Esta propiedad se sigue de (♣) pero todavı́a
no hemos probado que λ1 sea dominante, falta comprobar
que este valor propio es simple en sentido algebraico.
3
1
2
4
Para ello empezaremos probando que es simple en sentido
geométrico; es decir,
dim Ker(A − λ1 I) = 1.
Como w es fuertemente positivo, para cualquier v ∈ Rd \{0}
podemos encontrar δ ∈ R de manera que w − δv ≥ 0 y
alguna coordenada de este vector sea nula (wi − δvi ≥ 0
para cada i, wj − δvj = 0 para algún j).
14
v w v
w
Vamos a probar que si Av = λ1 v entonces, en realidad,
w − δv = 0. Esto implica que w y v son linealmente depen-
dientes.
Por reducción al absurdo, si w − δv ≥ 0 con w − δv 6= 0,
como A cumple una propiedad de monotonı́a fuerte,
A(w − δv) 0.
Llegamos a la desigualdad λ1 (w−δv) = A(w−δv) 0, que
no es compatible con el hecho de que alguna coordenada de
w − δv sea nula.
Una vez que hemos probado que el espacio propio tiene
dimensión 1, nos fijamos en la matriz traspuesta A? . Esta
matriz también cumple la hipótesis (?) y, como consecuen-
cia, la propiedad (♣) es válida para la traspuesta. Las ma-
trices A y A? tienen los mismos valores propios, ası́ que λ1
es el valor propio de módulo máximo para las dos. Encon-
tramos un vector w? ∈ Rd , w? 0 tal que A? w? = λ1 w? .
Por el Lema 1 sabemos que el hiperplano
V = {x ∈ Rd : x ⊥ w? }
es invariante para A; es decir, A(V ) ⊆ V .
15
w
w*
Vamos a probar que los sub-espacios V y W = Ker(A −
λ1 I) = {cw : c ∈ R} cumplen
V ∩ W = {0}.
En otro caso w estarı́a contenido en V , lo que es absurdo ya
que w y w? no pueden ser perpendiculares. Al tener ambos
vectores todas sus coordenadas positivas, hw, w? i > 0.
Hacemos la suma directa V ⊕ W , cuya dimensión es
dimW +dimV = 1+d−1 = d. Deducimos que Rd = V ⊕W
y aplicamos el Lema 2, ası́ completamos la prueba porque
λ1 es simple también en el sentido algebraico.
4 Modificaciones para la hipótesis (??)
En el caso (ii) de la prueba de (♣) observamos que
Av = λ1 v ⇒ Aν v = λν1 v.
Los valores propios de la matriz Aν son λν1 , λν2 , . . . , λνr , de
manera que λν1 tiene módulo máximo como valor propio de
Aν . Por otra parte, Aν cumple (?) y los argumentos para
A se adaptan a esta potencia.
16
El mismo truco se usa para la prueba de
dim Ker(A − λ1 I) = 1.
17