Tema 8
Tema 8
Tema 8. Diagonalización
A lo largo del curso ha quedado clara la importancia central que poseen las matrices en
el ámbito del Álgebra lineal. Es claro que muy a menudo tendremos que manejar
matrices de mayor o menor complejidad. A este nivel puede surgir la inquietud de si
existe alguna forma de simplificar el contenido de una matriz (cuadrada en particular)
para realizar las manipulaciones necesarias de manera más fácil. Evidentemente que
dicha simplificación requeriría que la matriz resultado de la misma fuera equivalente a
todos los efectos prácticos a la matriz original.
Transformar una matriz a una forma diagonal, proceso conocido como diagonalización,
tiene numerosas aplicaciones prácticas en variados campos de las ciencias exactas
(Química y Física) y la Ingeniería, que no vamos a describir aquí pero que están
íntimamente relacionadas con las aplicaciones prácticas de los valores y vectores
propios. De hecho, como veremos a medida que avanzamos en el tema, la
diagonalización de matrices se logra conociendo previamente los valores y vectores
propios de la matriz. Si tenemos en cuenta que para cada matriz existe definida
implícitamente una transformación (operador) lineal de tipo matricial y, más importante,
que cualquier transformación lineal puede representarse matricialmente, tiene sentido
afirmar que además de diagonalizar matrices, podremos también diagonalizar
operadores lineales.
Otra vez aquí queda clara la equivalencia que existe entre una transformación
(operador) lineal y su representación matricial. En efecto, para saber si un operador es
diagonalizable o no, deben evaluarse sus matrices asociadas.
Si recordamos que todas las matrices asociadas a un mismo operador son semejantes, la
definición de matriz diagonalizable implica directamente que todas las matrices
asociadas a un operador lineal serán diagonalizables si por lo menos alguna de ellas
resulta ser diagonal.
Así que ahora hemos adelantado bastante en nuestra pretensión de saber si existe una
matriz diagonal asociada a un operador lineal en alguna base del espacio de trabajo.
Sabemos que para obtener dicha matriz basta con partir de cualquier matriz asociada al
operador lineal (por simplicidad, usualmente se construye la matriz asociada en la base
canónica) y luego aplicar la fórmula que expresa la semejanza entre matrices en la cual
las matrices auxiliares incógnitas, P y P-1, no son otra cosa que las matrices cambio de
base entre las bases involucradas.
Hipótesis:
Tesis:
Así que el teorema dice que un operador lineal será diagonalizable si y sólo sí es posible
construir una base del espacio de trabajo formada por vectores propios del operador. En
caso que esto sea posible, la matriz asociada en la base de vectores propios será
diagonal.
Desde el punto de vista práctico, este teorema implica lo que ya se adelantó: para
determinar si un operador o matriz es diagonalizable se deberán calcular los vectores
propios, lo que a su vez implica calcular primero los valores propios. Por lo cual, la
diagonalización está íntimamente relacionada con el cálculo de valores y vectores
propios. Demostraremos ahora el teorema.
Demostración:
1 0 . . 0
0 2 . . 0
Sea B((T))B = . . . . . . Por definición de matriz asociada tenemos que:
. . . . .
0 0 . . n
1 0 0
0 2 0
coordBT(v1) = . , coord BT(v2) = . , ……… , coord BT(vn) = .
. . .
0 0 n
A partir de las coordenadas anteriores podemos escribir los vectores respectivos como:
B V vi ≠ v i = 1:n b)
b
1 0 . . 0
0 2 . . 0
B((T))B =
. . . . .
. . . . .
0 0 . . n
1 0 . . 0
0 2 . . 0
B((T))B =
. . . . . es única a menos del orden de los elementos de su
. . . . .
0 0 . . n
diagonal principal.
que para poder determinar la matriz diagonal, no será necesario aplicar la ecuación, que
vimos más arriba, que relaciona matrices semejantes entre sí (B = P-1AP).
Lo que no establece este teorema son los casos en los que efectivamente puede
construirse una base de vectores propios del espacio vectorial correspondiente. Desde el
punto de vista práctico (ahorro de trabajo), sería bueno que antes de obtener los vectores
propios del operador, sepamos si el mismo es diagonalizable o no. Afortunadamente,
esta interrogante tiene respuesta y la veremos un poco más adelante.
Veamos ahora un ejemplo para aplicar los conceptos adquiridos.
De acuerdo a la teoría que vimos, el primer paso para resolver el ejercicio es calcular los
valores propios del operador. Notar que no conocemos la expresión del operador pero
tenemos información equivalente en la forma de la matriz asociada al operador en la
base canónica del espacio. Por lo tanto, podemos obtener los valores propios de E((T))E
que serán los mismos que los de T.
3 0 0
det(E((T))E – I) = det 0 4 0 = (3 – )(4 – )(2 – ) = 0
1 2 2
Para cada valor propio obtenido, hallamos los vectores propios asociados.
1 0 0
= 2 E((T))E – I = 0 2 0
1 2 0
1 0 0 0
0 2 0 0
1 2 0 0
A simple vista (el lector puede verificarlo aplicando escalerización por ejemplo) es claro
que se trata de un sistema efectivamente compatible indeterminado. De la primera fila
de la matriz concluimos que x = 0 y de la segunda que y = 0, resultados que verifican la
tercera ecuación (tercera fila de la matriz) del sistema.
S2 = {(x,y,z) R3 / x = y = 0}
0 0 0
= 3 E((T))E – I = 0 1 0
1 2 1
0 0 0 0
0 1 0 0
1 2 1 0
S3 = {(x,y,z) R3 / x = -z, y = 0}
1 0 0
= 4 E((T))E – I = 0 0 0
1 2 2
1 0 0 0
0 0 0 0
1 2 2 0
S4 = {(x,y,z) R3 / y = -z, x = 0}
Ahora bien, el teorema del operador diagonalizable indica que si encontramos una base
de vectores propios del espacio vectorial de trabajo el operador será diagonalizable, es
decir, la matriz asociada al operador en esa base de vectores propios será diagonal. La
pregunta que surge ahora es cómo obtener, si existe, la base de vectores propios que
necesitamos.
Analicemos la situación. Para el caso que nos ocupa, V = R3, necesitamos 3 vectores
propios L.I. para formar una base del espacio. Los subespacios propios previamente
determinados para el operador tienen dimensión 1 (son rectas en el espacio) por lo que,
como también nos indican las bases respectivas, dos vectores cualesquiera de un mismo
subespacio propio serán necesariamente L.D. Esto reduce mucho las posibilidades que
existen para intentar formar una base de vectores propios. En realidad, la única
alternativa que resta es seleccionar un y sólo un vector de cada uno de los subespacios
encontrados. Si el conjunto resultante es efectivamente L.I., entonces tendremos la base
que estamos buscando.
Por comodidad, y dado que ya las hemos definido, consideraremos la unión de las bases
de cada subespacio propio para formar el conjunto B = {(0,0,1), (1,0,-1), (0,1,-1)}.
=0
=0
––=0
Es evidente que la única solución posible es la trivial lo que significa que B es L.I. y por
lo tanto B R3. Luego T es diagonalizable.
b
0 1 0
E((I))B = 0 0 1
1 1 1
I(1,0,0) = (1,0,0)
I(0,1,0) = (0,1,0)
I(0,0,1) = (0,0,1)
coord B(1,0.0)
1 = 1
1 = 0
1 -
coordBT(1,0,0) = (1,1,0)
coord B(0,1.0)
2 = 0
2 = 1
2 -
coordBT(0,1,0) = (1,0,1)
coord B(0,0.1)
3 = 0
3 = 0
3 -
coordBT(0,0,1) = (1,0,0)
1 1 1
B((I))E = 1 0 0
0 1 0
1 1 1 3 0 0 0 1 0 2 0 0
B((T))B = 1 0 0 0 4 0 0 0 1 = 0 3 0
0 1 0 1 2 2 1 1 1 0 0 4
Una observación importante que puede hacerse a este nivel es que la matriz cambio de
base de la base de vectores propios a la base canónica (E((I))B) se construye
simplemente “colgando” los vectores de la base de vectores propios como columnas en
la matriz (respetando como siempre el orden de los vectores de la base).
Por ende, siempre en este tipo de ejercicios, una vez que obtenemos los valores y
vectores propios, y es posible construir una base del espacio formada por vectores
propios, tendremos automáticamente la matriz diagonal asociada en la base de vectores
propios (B((T))B) y también la matriz cambio de base en la base de vectores propios
(E((I))B).
En el ejercicio que se acaba de resolver se logró construir una base del espacio formada
por vectores propios tomando un vector de cada uno de los subespacios propios
existentes. Vimos que como resultado se obtenía un conjunto L.I. Surge la pregunta de
si este resultado fue casual para el caso de estudio o en realidad es un resultado general.
Vamos a ver a continuación un par de teoremas que nos aseguran la validez de este
resultado y que al mismo tiempo implicarán que podremos saber si un operador es
diagonalizable sin calcular siquiera sus vectores propios.
Teorema
Hipótesis:
Sea V E.V. sobre K, T:V V un operador lineal, 1, 2, ….., n valores propios
distintos de T y v1, v2, …., vn vectores propios de T asociados a cada valor propio,
respectivamente.
Tesis:
Como recién se adelantó, este teorema asegura que vectores propios de distintos
subespacios propios serán siempre L.I. O, equivalentemente, la intersección entre
subespacios propios de un operador es el vector . El lector atento deducirá rápidamente
que un espacio vectorial será suma directa de los subespacios propios de un operador
diagonalizable definido en ese espacio. Por qué?
Demostración:
1) h = 1
Sea 1 valor propio de T y v1 vector propio de T asociado al valor propio 1. Por
definición v1 ≠ {v1} es L.I.
2) h = h + 1
Sean 1, 2, ….., h, h+1 valores propios distintos y A = {v1, v2, …..., vh, vh+1} con vi ≠
v y vi Si i = 1:h+1
h 1v1 – h+1 2 v2 - …… - h+1 hvh – h+1 h+1 vh+1 + 11v1 + 22v2 + …… +
hhvh + h+1h+1vh+1 = v
Por hipótesis de inducción se sabe que {v1, v2, …..., vh} es L.I.
i = 0 i = 1:h
h+1 vh+1 = v
A partir de este teorema, se deriva una proposición que en la práctica es aún más
importante en cuanto a la determinación del carácter de diagonalizabilidad de un
operador lineal.
Demostración:
Sean 1, 2, ….., n valores propios distintos de T y v1, v2, …..., vn vectores propios
asociados a cada valor propio, respectivamente.
Por el teorema recién demostrado sabemos que {v1, v2, …..., vn} es L.I.
Tenemos que card{v1, v2, …..., vn} = n = dimV {v1, v2, …..., vn} V
b
Llegamos a que existe una base de vectores propios. Luego T es diagonalizable.
Así que, como ya adelantáramos más arriba, en algunos casos es posible saber si un
operador (o matriz) es diagonalizable incluso antes de calcular los vectores propios para
intentar formar una base del espacio. En efecto, en el caso que los valores propios del
operador sean todos distintos el mismo resultará ser diagonalizable.
2 5 0
Ejemplo 2: Dada A = 0 7 0
0 5 2
Determinar si A es diagonalizable
2 5 0
det(A – I) = det 0 7 0 = (2 – )(7 – )(2 – ) = 0
0 5 2
1,2 = 2, 3 = 7
En este caso los valores propios de la matriz no son todos distintos entre sí dado que
tenemos una raíz (2) con multiplicidad doble en la ecuación característica. Si se
cumpliera el recíproco de la última proposición vista, la matriz no debería ser
diagonalizable. Para determinarlo fehacientemente debemos calcular los vectores
propios de A e intentar obtener una base del espacio de trabajo (R3) formada por
vectores propios.
=2
0 5 0 0
0 5 0 0
0 5 0 0
S2 = {(x,y,z) R3 / y = 0}
Como dim(S2) = 2 entonces una base de S2 poseerá dos vectores, por ejemplo:
B2 = {(1,0,0), (0,0,1)}
=7
5 5 0 0
0 0 0 0
0 5 5 0
S7 = {(x,y,z) R3 / x= z = -y}
Como dim(S7) = 1 entonces una base de S7 poseerá un solo vector, por ejemplo:
B7 = {(1,-1,1)}
La pregunta ahora es si podemos formar una base del espacio de referencia con las
bases de los subespacios propios hallados. Qué ocurre si, como hicimos en el ejemplo
anterior, unimos los vectores de las bases de los subespacios propios? Es inmediato ver
que dicha unión resultará en un conjunto de tres vectores por lo que si esos vectores son
L.I. el conjunto resultará ser base del espacio R3 y por ende será una base de vectores
propios.
Aplicando la definición:
= 0
- = 0
+=0
Es evidente que la única solución posible es la trivial lo que significa que B es L.I. y por
lo tanto B R3. Luego T es diagonalizable y la matriz diagonal asociada a T en la
b
2 0 0
base B es: B((T))B = 0 2 0
0 0 7
Notar que en este ejemplo, fue posible seleccionar dos vectores del mismo subespacio
propio (de hecho los vectores de una de sus bases) que no fueran L.D. entre sí. Sigue
cumpliéndose que vectores de distintos subespacios propios son L.I. por lo que al
plantear la unión para formar el conjunto B la independencia lineal se preservó.
En la clase pasada habíamos visto un ejemplo en donde algunos de los valores propios
obtenidos no formaban parte del cuerpo escalar de referencia. Evidentemente que en
esos casos será imposible obtener una base de vectores propios del espacio considerado.
Pero a la luz de los ejemplos vistos en esta clase, puede surgir la duda de si un operador
(o matriz) será siempre diagonalizable conforme sus valores propios pertenezcan al
cuerpo escalar de trabajo. Para aclarar este punto, veamos otro ejemplo.
Ejemplo 3:
2 4 1
Dada A = 0 7 0
0 5 2
Determinar si A es diagonalizable
2 4 1
det(A – I) = det 0 7 0 = (2 – )(7 – )(2 – ) = 0
0 5 2
1,2 = 2, 3 = 7
La matriz posee exactamente los mismos valores propios de la matriz del ejemplo
anterior en donde habíamos visto que era necesario calcular los vectores propios para
saber si la matriz era diagonalizable o no.
=2
0 4 1 0
0 5 0 0
0 5 0 0
S2 = {(x,y,z) R3 / y = z = 0}
Como dim(S2) = 1 entonces una base de S2 poseerá un solo vector, por ejemplo:
B2 = {(1,0,0)}
=7
5 4 1 0
0 0 0 0
0 5 5 0
S7 = {(x,y,z) R3 / x= z = -y}
B7 = {(1,-1,1)}
Vemos que tenemos una diferencia fundamental en los resultados de esta matriz con los
de la matriz anterior y es que el subespacio asociado al valor propio 2 que en el caso
anterior tenía dimensión dos, ahora tiene dimensión uno. Entonces no va a ser posible
formar una base de vectores propios del espacio R3 puesto que solamente se podrán
obtener simultáneamente dos vectores L.I., lo cual ya sabemos que no alcanza para
generar todo el espacio R3. En conclusión, la matriz A no es diagonalizable.
Notar que cuando decimos que una matriz no es diagonalizable, esto no impide que con
sus valores propios pueda construirse una matriz diagonal. Pero el punto es que esa
matriz diagonal no guardará relación alguna con la matriz original, específicamente, no
será una matriz semejante a la matriz original y por lo tanto su construcción no tendrá
ningún sentido.
De los dos últimos ejemplos puede también deducirse que no es suficiente que dos
matrices tengan los mismos valores propios (mismo polinomio característico) para que
las mismas sean semejantes. De lo contrario, la matriz del ejemplo 3 también debería
haber sido diagonalizable dado que sería semejante a una matriz (la del ejemplo 2) que a
su vez es semejante a una matriz diagonal. Así que de la misma forma que sabíamos que
dos matrices con igual traza, rango y determinante no eran necesariamente semejantes,
tampoco se cumplirá la propiedad cuando la igualdad se verifica a nivel de los valores
propios, algo que ya habíamos observado la clase anterior.
Para terminar con este tema veremos una definición fundamental que resume de forma
adecuada los distintos aspectos y elementos que hemos visto para determinar si un
operador o una matriz son diagonalizables.
1 ≤ mg() ≤ ma() ≤ n
Esto nos indica que tanto la multiplicidad algebraica como la multiplicidad geométrica
adoptarán valores mayores a cero y menores o iguales a la dimensión del espacio
vectorial involucrado y que siempre la multiplicidad algebraica será mayor o igual que
la geométrica.
Este resultado es concordante con la proposición que vimos en páginas anteriores y que
decía que si todos los valores propios de un operador eran distintos entonces el operador
era diagonalizable. En efecto, si todos los valores propios son distintos entonces las
respectivas multiplicidades algebraicas serán necesariamente iguales a uno y como uno
es también el valor mínimo para la multiplicidad geométrica, la cual no puede ser nunca
mayor que la algebraica, ambas magnitudes coincidirán. En otras palabras, la
multiplicidad algebraica y geométrica de un valor propio podrán ser distintas solamente
si la primera es mayor a uno.
Repasemos los tres ejemplos vistos a lo largo del documento, ahora considerando las
multiplicidades de los valores propios.
En el primer ejemplo el operador poseía tres valores propios distintos lo que equivalía a
una multiplicidad algebraica igual a uno al tiempo que los subespacios propios
asociados a cada uno de los valores propios tenían dimensión igual a uno, es decir que
la multiplicidad geométrica de cada valor propio también era uno. Ambas magnitudes
eran entonces iguales para todos los valores propios y por lo tanto el operador resultó
ser diagonalizable. En tanto, en el segundo ejemplo existía un valor propio con
multiplicidad algebraica igual a dos (era raíz doble de la ecuación característica) pero
para el cual la multiplicidad geométrica también valía dos y por lo tanto la matriz
resultó ser también diagonalizable. En contraposición, en el tercer ejemplo también
existía un valor propio con multiplicidad algebraica dos al tiempo que la dimensión del
subespacio propio asociado (i.e. la multiplicidad geométrica) era uno; de ahí que se
cumpliera la desigualdad entre ambas magnitudes y por lo tanto la matriz no resultó ser
diagonalizable.
4 1 i
Dada A =
1 i 5
3 0 i 1 1
Respuesta: AD = , P =
0 6 1 1 i