Devoir 19 (DS7) : racines carrées de matrices réelles
un corrigé
1 Généralités et exemples
1. (a) On sait que si B est une base de E et f, g ∈ L(E), MB (f ◦ g) = MB (f )MB (g). Avec f = g,
on obtient que
f est un carré ssi MB (f ) est un carré
(b) Soit x ∈ ker(P (f )), c’est à dire que P (f )(x) = 0. g commute avec f et donc avec tout
polynôme en f et donc
P (f )(g(x)) = P (f ) ◦ g(x) = g ◦ P (f )(x) = g(0) = 0
et ainsi g(x) ∈ ker(P (f )).
si g 2 = f , ker(P (f )) est stable par g
(c) Si A = B 2 alors det(A) = det(B)2 ≥ 0 (on est dans R où un carré est positif)
Le déterminant d’un carré est positif
−1 0
Posons A = . On a det(A) = 2 ≥ 0. Si, par l’absurde, B 2 = A alors les sous-
0 −2
espaces propres pour A, c’est à dire Vect((1, 0)) et Vect((0, 1)) sont stables par B et B est
donc diagonale : B = diag(a, b). On a alors a2 = −1 et b2 = −2, ce qui est impossible pour
a, b ∈ R.
La réciproque est fausse
0 −1
(d) Posons M = . On a M 2 = −I2 et −I2 est un carré .
1 0
−I3 n’est pas un carré puisque son déterminant vaut −1 < 0 (et avec la question (c)).
(e) Supposons (analyse) que λIn soit un carré. Son déterminant est donc positif et ainsi λn ≥ 0.
Si n est impair, ceci impose λ ≥ 0. √ Il faut donc que λ ≥ 0 ou que λ < 0 et n pair.
Réciproquement, si λ ≥ 0, λIn = ( λIn )2 est un carré et si n = 2p est pair
et λ < 0, λIn
√ 0 1
est le carré de la matrice bloc-diagonale avec p bloc égaux à −λ .
−1 0
λIn est un carré ⇐⇒ λ ≥ 0 ou (λ < 0 et n pair)
(f) On remarque que
2
0 In M 0
=
M 0 0 M
ce qui fait de cette matrice un carré.
(g) On suppose que f est nilpotent d’indice p. X p annule f et X p−1 ne l’annule pas. Ainsi
µf = X p . Or, par théorème de Cayley-Hamilton, µf χf . Comme χf est de degré n, on a a
donc p ≤ n.
l’indice de nilpotence en dimension n est plus petit que n
On a f p−1 6= 0 et f p = 0 ce qui donne g 2p−2 6= 0 et g 2p = 0
1
L’indice de nilpotence de g est 2p − 1 ou 2p
On en déduit que 2p − 1 ≤ n .
0 1 0 ... 0
.. . . .. .. .
.
. . . ..
Posons A = ... .. .. en sorte que An−1 6= 0 et An = 0. Un endomorphisme
. . 0
..
..
. . 1
0 ... ... ... 0
f représenté par A est nilpotent d’indice n. Si c’était le carré d’un endomorphisme g, on
aurait donc 2n − 1 ≤ n ce qui contredit n ≥ 2. A n’est donc pas un carré.
2. (a) Les sous-espace propres sont toujours en somme directe. Dans le cas de diagonalisabilité,
la somme est égale à tout l’espace. Ainsi
k
M
E= ker(f − λi Id)
i=1
(b) Dans une base adaptée à cette decomposition, f est représenté par diag(λ1 Iα1 , . . . , λk Iαk ) =
A.
Supposons que f est un carré et notons g un endomorphisme tel que g 2 = f . g et f
commutent et les sous-espaces propres pour f sont stables par g. Dans la base choisie, la
matrice de g est du type diag(M1 , . . . , Mk ). Un calcul par blocs donne alors Mi2 = λi Iαi .
La question 1(e) montre alors que λi ≥ 0 ou (λi < 0 et αi pair).
Réciproquement, si ces relations ont lieu alors 1(e) donne Mi telle que Mi2 = λi Iαi et on
remonte le raisonnement pour obtenir que f est un carré.
f est un carré ⇐⇒ ∀j, λj ≥ 0 ou (λj < 0 et αj est pair)
3. (a) Si λ 6= µ, f possède trois valeurs propres distinctes et est donc diagonalisable à sous-espaces
propres de dimension 1.
Si λ = µ, χf = (X − λ)2 (X − 4) est scindé et f sera diagonalisable si les sous-espaces
propres associés à λ et 4 sont respectivement de dimension 2 et 1. La valeur propre 4 qui
est simple ne pose pas de problème. f − λId est de rang 1 seulement si a = 0 (sinon, les
colonnes 2 et 3 de MB (f − λId) sont indépendantes). Ainsi
f est diagonalisable si et seulement si λ 6= µ ou (λ = µ et a = 0)
Avec 2(b), le seul problème pour que f soit un carré concerne les valeurs propres strictement
négatives qui doivent être de multiplicité paire. Dans le cas diagonalisable,
f est un carré sauf si λ 6= µ et si l’une des deux valeurs est < 0
(b) On se place dans le cas où f n’est pas diagonalisable.
Les deux sous-espaces propres sont alors de dimension 1. En particulier, il existe ε3 tel que
E4 (f ) = Vect(ε3 ).
e1 est propre pour λ et en posant ε2 = e2 /a, on a f (ε2 ) = λε2 + e1 .
ε3 ∈ ker(f − 4Id) et e1 , e2 /a ∈ ker((f − λId)2 ). Ces deux espaces sont en somme directe
(lemme des noyaux) et donc (e1 , e2 /a, ε3 ) = B 0 est une base de E (famille libre de bon
cardinal). Par construction,
λ 1 0
MB0 (f ) = 0 λ 0
0 0 4
2
Supposons que f soit un carré et notons g tel que g 2 = f . Eλ (f ) et E4 (f ) sont stables par
g et il existe donc x, y, z, t, u tels que
x y 0
MB0 (g) = 0 z 0
0 t u
g 2 = f donne alors x2 = z 2 = λ, u2 = 4, y(x + z) = 1 et t(y + u) = 0. x2 = λ impose λ ≥ 0.
Il faut même que λ > 0 sinon x = z = 0 et y(x + z) = 0 6= √ 1.
Réciproquement, en choisissant t = 0, u = 2, x = z = λ et y = 2√1 λ , on obtient un
endomorphisme g convenable.
Si λ = µ et a 6= 0, f est un carré quand λ > 0
2 Le cas quasi-nilpotent de valeur propre strictement positive
4. (a) Si u est nilpotent d’indice 1 alors u = 0 et f = Id = Id2 est un carré.
Si u est nilpotent d’indice 2 alors u2 = 0 (et u 6= 0). On a alors (développer le carré avec le
binôme, ce qui est possible car Id et u commutent)
u 2
Id + = Id + u = f
2
et f est donc encore un carré. Ainsi, le résultat est vrai si p ≤ 2 .
(b) En posant ai = 0 si i ≥ p + 1, on a
2p−2
X k
X
g2 = ck uk avec ck = ai ak−i
k=0 i=0
Pp−1
En notant P = k=0 ak X k , on a g 2 = P (g) ◦ P (g) = P 2 (g) et on utilise ci-dessus l’expres-
sion de P 2 .
Comme uk = 0 pour k ≥ p − 1, on a donc
p−1
X k
X
2 k
g = ck u avec ck = ai ak−i
k=0 i=0
où tous les indices des aj sont entre 0 et p − 1.
Comme c0 = a20 et c1 = 2a0 a1 , les relations de l’énoncé entraı̂nent g 2 = Id + u.
Pour le sens direct, il nous suffit de montrer que (Id, u, . . . , up−1 ) est une famille libre (une
identification des coordonnées sera alors licite). Cette indépendance a bien lieu car µu = X p
et aucun polynôme non nul de degré ≤ p − 1 n’annule u. Ainsi
g 2 = Id + u ⇐⇒ (a20 = 1, 2a0 a1 = 1 et pour 2 ≤ k ≤ p − 1, kj=0 aj ak−j = 0)
P
Si on choisit a0 = 1, les autres relations permettent, par récurrence, de définir a1 , a2 , . . . , ap−1
et on trouve ainsi un g tel que f = g 2 .
f est un carré
5. On suppose f − λId nilpotent avec λ > 0. Posons u = λ1 f − Id. C’est aussi un endomorphisme
√
nilpotent. Ainsi, λ1 f = u + Id est un carré, et s’écrit g 2 . On a alors f = ( λg)2 .
f est un carré
3
3 Le cas sans valeur propre réelle
6. On a g 2 − f = (P 2 − X)(f ) et cet endomorphisme est nul si et seulement si c’est un multiple du
polynôme minimal de f . Ainsi
g 2 = f ⇐⇒ (X 2 + bX + c)β |P 2 − X
√ √
7. (a) On remarque que X 2 + bX + c = (X + c)2 − (2 c − b)X. Comme 4c > b2 ≥ 0, c > 0 et
√
2 c > b. On peut donc poser
1 √
P1 = p √ X+ c
2 c−b
On a alors P12 − X = √1 (X 2 + bX + c) et donc (X 2 + bX + c)|(P12 − X).
2 c−b
On a le résultat pour k = 1
(b) Avec les notations de l’énoncé, et en notant A = X 2 + bX + c, on a
2
2 1 k
Pk+1 − X = Pk − A R − X
2
1
= (Pk2 − X) − Pk Ak R + A2k R
4
k 1 2k
= A (Q − Pk R) + A R
4
Comme 2k ≥ k + 1, A2k R est divisible par Ak+1 . Pk+1 convient donc si et seulement si
A|(Q − Pk R).
R convient si et seulement si X 2 + bX + c|Q − Pk R.
La suite découle d’une recherche au brouillon. On veut que Pk R ∈ AK[X] + Q et on veut
donc trouver un élément dans Pk K[X] et dans AK[X] + Q. On veut donc des polynômes
U, V tels que Pk U = Q + AV ou encore Pk U − AV = Q. C’est une relation de Bézout
que l’on pourra obtenir si Pk ∧ A|Q. On va donc justifier cette divisibilité et remonter le
raisonnement.
On a X = Pk2 − Ak Q et donc P ∧ A|X. Ainsi,
- ou bien Pk ∧ A = 1
- ou bien Pk ∧ A = X et alors avec X = −Ak Q + Pk2 , on trouve X 2 |X et ceci est
impossible.
Comme Pk ∧ A = 1, il existe U, V tels que Pk U − AV = Q et Q − Pk U est multiple de A :
on peut choisir U = R.
Si le résultat est vrai au rang k, il l’est au rang k + 1
4 Le cas nilpotent
8. (a) L’image par f de Im(f k−1 ) est exactement Im(f k ). f induit donc une application linéaire
u de Im(f k−1 ) dans Im(f k ).
Le théorème du rang appliqué à u donne
dim(Im(f k−1 )) = dim(Im(f k )) + dim(ker(u))
4
Or, si u(x) = 0 alors x ∈ Im(f k−1 ) et u(x) = 0 ce qui donne f (x) = 0 et x ∈ Im(f k−1 ) ∩
ker(f ). La réciproque est similaire et donc
dim(Im(f k−1 ) ∩ ker(f )) = dim(ker(u)) = dim(Im(f k−1 )) − dim(Im(f k ))
Il reste à appliquer le théorème du rang à f k−1 et à f k pour conclure que
δk = dim(Im(f k−1 ) ∩ ker(f ))
La suite (Im(f k−1 )) étant décroissante (si y = f k (x) alors y = f k−1 (f (x))), il en est de
même quand on intersectre avec ker(f ). La suite des dimensions est donc décroissante.
(δk ) est décroissante
(b) Notons δk (h) = dim(ker(hk )) − dim(ker(hk−1 )). On a ainsi
δk (f ) = δ2k (g) + δ2k−1 (g)
Si cet entier est impair, on a δ2k (g) 6= δ2k−1 (g) et donc (avec la question 8(a) appliquée à
g) δ2k (g) < δ2k−1 (g). On en déduit que
δk (f ) < 2δ2k−1 (g) ≤ δ2k−2 (g) + δ2k−4 (g) = δk−1 (f )
Si f est un carré alors (δk impair entraı̂ne δk < δk−1 )
9. Soit fj l’endomorphisme canoniquement associé à Aj . En notant (e1 , . . . , ej ) la base canonique
de Rj , on a donc
∀p ∈ [[1, j − 1]], fj (ep ) = ep+1 et fj (ej ) = 0
On en déduit par une récurrence aisée que
(
ep+k si p ≤ j − k
∀k ∈ N, ∀p ∈ [[1, j]], fjk (ep ) =
0 sinon
En particulier, ∀k ∈ [[0, j − 1]], Im(fjk ) = Vect(ek+1 , . . . , ej ) ce qui montre que fj est nilpotent
d’indice j et donne le rang de fjk pour k ≤ j − 1 (pour k ≥ j, ce rang est nul par nilpotence).
(
j−k si k ≤ j − 1
Aj est nilpotente d’indice j et rg(Akj ) =
0 sinon
10. On suppose j ≥ 4 pair et on peut donc l’écrire j = 2p avec p ≥ 2. Avec les mêmes notations que
ci-dessus, on a
fj2 (e1 ) = e3 , fj2 (e3 ) = e5 , . . . , fj2 (e2p−3 ) = e2p−1 , fj2 (e2p−1 ) = 0
fj2 (e2 ) = e4 , fj2 (e4 ) = e6 , . . . , fj2 (e2p−2 ) = e2p , fj2 (e2p ) = 0
Dans la base (e1 , e3 , . . . , e2p−1 , e2 , e4 , . . . , e2p ), fj2 est donc représenté par diag(Aj/2 , Aj/2 ) et donc
si j ≥ 4 est pair, A2j est semblable à diag(Aj/2 , Aj/2 )
On suppose maintenant j ≥ 3 et on peut donc l’écrire j = 2p + 1 avec p ≥ 1. On a cette fois
fj2 (e1 ) = e3 , fj2 (e3 ) = e5 , . . . , fj2 (e2p−1 ) = e2p+1 , fj2 (e2p+1 ) = 0
fj2 (e2 ) = e4 , fj2 (e4 ) = e6 , . . . , fj2 (e2p−2 ) = e2p , fj2 (e2p ) = 0
et comme avant
5
si j ≥ 3 est impair, A2j est semblable à diag(Adj/2e , Abj/2c )
11. (a) Si n = 1 alors f = 0 est représenté par A1 = 0.
Si n = 1 (et donc p = 1), le résultat est vrai avec α1 = 1
Pp−1
(b) On suppose que j=0 αj f j (a) = 0 et, par l’absurde, que les αj sont non tous nuls. On peut
ainsi considérer le plus petit j tel que αj = 0. En composant la relation par f p−1−j , on
trouve alors αj f p−1 (a) = 0 ce qui contredit αj 6= 0 et f p−1 (a) 6= 0.
F = (a, f (a), . . . , f p−1 (a)) est libre
Si p = n, F est alors (indépendance linéaire et bon cardinal) une base de E dans laquelle f
est représenté par An . Ceci donne le résultat voulu avec αn = 1 et αj = 0 si j ∈ [[1, n − 1]].
le résultat est vrai si p = n
(c) F peut être complété en une base B = (a, f (a), . . . , f p−1 (a), ep+1 , . . . , en ) de E. Une forme
linéaire pouvant être définie par son action sur une base, il en existe une ϕ telle que
ϕ(f p−1 (a)) = 1 et les autres vecteurs de la base sont envoyés sur 0.
Si x ∈ G alors pour tout k ∈ [[0, p − 1]], ϕ(f k (x)) = 0. On a ainsi ϕ(f k (f (x))) = 0 pour
k ∈ [[0, p − 2]] et comme f p (x) = 0, ceci reste vrai si k = p − 1. On a donc f (x) ∈ G et
G est stable par f .
Soit x ∈ E que l’on décompose sur la base B : x = x1 a + · · · + xp f p−1 (a) + xp+1 ep+1 + · · · +
xn en . On a alors
∀k ∈ [[0, p − 1]], ϕ ◦ f k (x) = xp−k + xp+1 ϕ ◦ f k (ep+1 ) + · · · + xn ϕ ◦ f k (en )
x ∈ G se traduit alors parun système linéaire de p équations vérifié par (x1 , . . . , xn ) et dont
la matrice s’écrit Ip M . Cette matrice est de rang p et son noyau est donc de dimension
n − p.
dim(G) = n − p
Soit x ∈ F ∩ G. Avec les notations précédentes, xp+1 = · · · = xn et le système traduisant
x ∈ G s’écrit x1 = · · · = xp = 0. Ainsi x = 0 et F ⊕ G. Par dimension, on conclut que
F ⊕G=E
f induit sur F et G des endomorphismes fF et fG qui sont nilpotents d’indice ≤ p. fF est
même d’indice p car f p−1 (a) 6= 0. Il existe donc (hypothèse de récurrence applicable car
1 ≤ dim(F ) ≤ n − 1) une base de G dans laquelle fF est représenté par une matrice bloc
diagonale de Ap , . . . , A1 avec au moins un bloc Ap (en fait, en utilisant la base précédente,
on a fF représenté par un bloc Ap ). On trouve de même une base de G dans laquelle fG
est représenté par une matrice bloc diagonale de Aj avec j ≤ p. En concaténant ces bases,
on obtient le résultat pour f .
(d) Une matrice est de rang k si et seulement on peut par opérations élémentaires sur les lignes
et colonnes de cette matrice obtenir une matrice dont tous les coefficients sont nuls sauf k
termes diagonaux valant 1.
Supposons M = diag(M1 , . . . , Mp ) avec Mi carrée de taille ni . Des opérations élémentaires
sur les ni lignes et colonnes correspondant à Mi ne changent rien aux autre blocs. On peut
ainsi transformer M par opérations élémentaires en un matrice dont tous les coefficients
sont nuls sauf rg(M1 ) + · · · + rg(Mp ) coefficients diagonaux qui valent 1. Ces opérations
conservant le rang, on a
rg(diag(M1 , . . . , Mp )) = rg(M1 ) + · · · + rg(Mp )
6
On a donc ici
p
X p
X p
X p
X p
X
rg(f ) = αi rg(Ai ) = αi (i − 1) = iαi − αi = n − αi
i=1 i=1 i=1 i=1 i=1
Par théorème du rang, on conclut que
dim(ker(f )) = α1 + · · · + αp
De façon similaire
p
X p
X
rg(f k ) = αi rg(Aki ) = αi (i − k)
i=1 i=k+1
Par théorème du rang, on conclut que
p
X p
X p
X
dim(ker(f k )) − dim(ker(f k−1 )) = αi (i − k + 1) − αi (i − k) = αi
i=k i=k+1 i=k
On a donc
αp = δp , αp−1 = δp−1 − δp , . . . , α1 = δ1 − δ2
ce qui donne l’unicité des αi .
12. La question 8(b) donne le sens direct.
Supposons réciproquement la propriété vérifiée pour les noyaux. Il existe une base où f est
représenté par une matrice bloc-diagonale M avec αi blocs égaux à Ai : M = diag(Ai1 , . . . , Air )
avec p = i1 ≥ i2 ≥ · · · ≥ ir et r = α1 + · · · + α1 (nombre de blocs).
Supposons αp ≥ 2. M = diag(Ap , Ap , Ai3 , . . . ). Avec la question 10, il existe Q ∈ GL2p (R) telle
que Q−1 A22p Q = diag(Ap , Ap , . . . ). En posant Q̃ = diag(Q, In−2p ), Q est inversible d’inverse
diag(Q−1 , In−2p ) et
M = Q̃−1 diag(A22p , Ai3 , . . . )Q̃
Supposons αp = 1. Avec les expressions obtenues pour les αk et l’hypothèse faite, on a αp−1 =
δp−1 −δp > 0. On va donc comme ci-dessus pouvoir “réunir deux blocs” (toujours avec la question
10). On trouve une matrice inversible Q̃ telle que
M = Q̃−1 diag(A22p−1 , Ai3 , . . . )Q̃
Si les deux blocs suivants ont même taille, on peut les fusionner en A22i3 . Sinon ils ont une
taille qui différe de une unité avec l’hypothèse faite et on peut les fusionner en A22i3 −1 . On peut
poursuivre le processus et obtenir une matrice inversible P telle que
M = P −1 diag(A2j1 , . . . , A2jq )P
En considérant l’endomorphisme g associé à P −1 diag(Aj1 , . . . , Ajq )P dans la base canonique, on
a f = g2.
f est un carré si et seulement pour tout k ∈ [[2, p]], (δk impair entraı̂ne δk < δk−1 )
5 Le cas quasi-nilpotent de valeur propre strictement négative
13. On suppose f = g 2 avec f − λIdE nilpotente. Notons Nk = ker((f − λId)k ).
Comme f et g commutent, Nk est stable par g. Il l’est aussi par f .
Notons fk et gk les restrictions à Nk de f et g. Comme f − λId est nilpotente, fk − λId l’est
aussi et on a
det(fk ) = λdim(Nk )
Par ailleurs, fk = gk2 et donc det(fk ) = det(gk )2 ≥ 0. Comme λ < 0, on en déduit que Nk est de
dimension paire.
7
Si f est un carré alors ∀k, dim(ker((f − λId)k )) est pair
14. On suppose réciproquement que tous les Nk sont de dimension paire (en gardant les notations
précédentes). La question 11(d) montre alors que dans la décomposition de Jordan de f − λId,
tous les αi sont pairs. Dans une base adaptée, f sera donc représentée par une matrice par blocs
où les blocs sont du type diag(Ai + λIi , Ai + λIi ). La question 1(f) montre que tous ces blocs
sont des carrés. On en déduit que f est aussi un carré (sa matrice dans une bonne base est un
carré).
Si ∀k, dim(ker((f − λId)k )) est pair, f est un carré
6 Cas général
15. Le théorème de décomposition des noyaux (on a des polynômes premiers entre eux deux à deux
puisque ce sont des puissances d’irréductibles et distincts) indique que
k k+`
ker((f 2 + bi f + ci Id)βi )
M M
E = ker(µf (f )) = ker((f − λi Id)βi ) ⊕
i=1 i=k+1
Chacun de ces noyaux (non réduit à {0} par minimalité de µf ) est stable par f et f induit sur
ces noyaux des endomorphismes f1 , . . . , fk+` .
Si f est un carré, disons f = g 2 , chaque noyau est stable par g et g induit sur le i-ième noyau
un endomorphisme gi tel que fi = gi2 . Tous les fi sont donc des carrés.
Réciproquement, si chaque fi est un carré, disons fi = gi2 alors l’endomorphisme g dont la
restriction au i-ème noyau est i vérifie g 2 = f (g est parfaitement défini puisque les noyaux sont
supplémentaires).
Pour i ∈ [[1, k]], (X − λi )βi annule fi et le polynôme minimal de fi est donc du type (X − λi )α
avec α ≤ βi . On a en fait α = βi car sinon en changeant βi par α dans µf on obtient encore un
annulateur de f et de degré strictement inférieur à celui de µf .
De même, pour i ∈ [[k + 1, k`]], µfi = (X 2 + bi X + ci )βi .
On peut ainsi appliquer les résultats des parties précédentes pour affirmer que les fi avec i ≥ k+1
sont des carrés ainsi que les fi pour i ≤ k tels que λi > 0.
Dans le cas i ≤ k et λi < 0, fi sera un carré si les dimensions des ker((fi − λi Id)k ) = ker((f −
λi Id)k ) sont paires.
Enfin, si un des λi est nul, f n’est pas inversible et le fi correspondant est un carré si et seulement
si la condition de la question 12 est vérifiée.
Finalement, f est un carré ssi
(
∀λ ∈ Sp(f ) ∩ R∗− , ∀k ∈ N, dim(ker((f − λi Id)k )) est pair
∀k, (δk impair) ⇒ (δk < δk−1 ) où δk = dim(ker(f k )) − dim(ker(f k−1 ))