0% ont trouvé ce document utile (0 vote)

63 vues167 pages

Introduction au calcul matriciel

Le document traite du calcul matriciel dans le cadre d'une licence de mathématiques. Il couvre divers sujets tels que la dualité linéaire, les espaces euclidiens, la réduction des endomorphismes, et les systèmes linéaires, avec des sections détaillées sur les propriétés et applications des matrices. Chaque chapitre est structuré avec des sous-sections qui approfondissent des concepts mathématiques clés et leur utilisation.

Transféré par

souheil.rejeb.2018

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

63 vues167 pages

Introduction au calcul matriciel

Transféré par

souheil.rejeb.2018

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Calcul matriciel

Fabien Priziac

Licence 3 de Mathématiques, année universitaire 2020-2021

2
Table des matières

1 Dualité linéaire 7
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Formes linéaires sur un espace vectoriel et espace dual . . . . . . . . . . . . . . 7
1.3 Base duale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4 Aspects matriciels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5 Annulateur d’un sous-espace vectoriel et correspondance duale . . . . . . . . . . 15
1.6 Application transposée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.7 Bidual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2 Espaces euclidiens 23
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2 Produit scalaire sur un espace vectoriel réel . . . . . . . . . . . . . . . . . . . . 23
2.3 Orthogonalité dans les espaces euclidiens . . . . . . . . . . . . . . . . . . . . . . 27
2.4 Orthogonalité et dualité dans les espaces euclidiens . . . . . . . . . . . . . . . . 30
2.5 Bases orthogonales et bases orthonormales . . . . . . . . . . . . . . . . . . . . . 31
2.6 Représentation matricielle du produit scalaire . . . . . . . . . . . . . . . . . . . 35
2.7 Endomorphisme adjoint . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.8 Endomorphismes orthogonaux et matrices orthogonales . . . . . . . . . . . . . . 41
2.9 Décomposition QR d’une matrice inversible . . . . . . . . . . . . . . . . . . . . 45

3 Réduction des endomorphismes 49

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2 Valeurs propres et espaces propres . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3 Polynôme caractéristique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.4 Diagonalisabilité et diagonalisation . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.5 Polynômes d’endomorphismes, polynômes annulateurs et diagonalisabilité . . . 54
3.6 Polynôme minimal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.7 Triangularisabilité et triangularisation . . . . . . . . . . . . . . . . . . . . . . . 56
3.8 Réduction de Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.8.1 Etape 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.8.2 Etape 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.8.3 Description matricielle de la méthode de réduction à la forme de Jordan 65

3
4 TABLE DES MATIÈRES

4 Exponentielle de matrices 77
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2 Norme de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.3 Définition et propriétés de base . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.4 Calcul via la réduction de Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.5 Résolution des systèmes différentiels linéaires . . . . . . . . . . . . . . . . . . . 86

5 Orthogonalité et réduction 91
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.2 Diagonalisabilité des endomorphismes auto-adjoints . . . . . . . . . . . . . . . . 91
5.3 Matrices symétriques positives . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.4 Décomposition polaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.5 Réduction des endomorphismes et matrices orthogonaux . . . . . . . . . . . . . 105

6 Normes subordonnées et rayon spectral 111

6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6.2 Normes matricielles subordonnées . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6.3 Rayon spectral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.4 Conditionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

7 Matrices stochastiques et théorème de Perron 127

7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
7.2 Matrices stochastiques et vecteurs stochastiques . . . . . . . . . . . . . . . . . . 130
7.3 Matrices positives, strictement positives, primitives, irréductibles . . . . . . . . 132
7.4 Les théorèmes de Perron-Frobenius . . . . . . . . . . . . . . . . . . . . . . . . . 133
7.5 Le cas des matrices primitives stochastiques . . . . . . . . . . . . . . . . . . . . 136

8 Résolution de systèmes linéaires 143

8.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
8.2 Méthode du pivot de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
8.3 La décomposition LU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
8.4 La décomposition P LU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
8.5 La décomposition de Cholesky . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
Index des notations

Ci-dessous, K désigne un corps commutatif quelconque. E et F désignent deux espaces vec-

toriels sur K. f désigne une application linéaire de E dans F et g désigne un endomorphisme
de E. v, v1 , . . . , vk désignent des vecteurs de E. B, B 1 désignent deux bases de E. A désigne une
matrice à coefficients dans K. C désigne une base de F . n et p désignent des entiers naturels
non nuls. i et j désignent deux nombres de l’ensemble t1, . . . , nu. M désigne une matrice carrée
de taille n. P désigne un polynôme de KrXs. S désigne un sous-ensemble quelconque de E. R
désigne un anneau commutatif et x1 , . . . , xk des éléments de R.

• LpE, F q : espace vectoriel sur K des applications linéaires de E dans F .

• Ker f : noyau de f (il s’agit d’un sous-espace vectoriel de E).

• Im f : image de f (il s’agit d’un sous-espace vectoriel de F ).

• dimpEq : dimension de E sur K si E est de dimension finie.

• Vecttv1 , . . . , vk u : sous-espace vectoriel de E engendré par v1 , . . . , vk .

• MatB pvq : vecteur colonne (matrice colonne) des coordonnées du vecteur v dans la base
B.

• tA : transposée de la matrice A.

• IdE : application identité de E.

• MatB,C pf q : matrice représentative de f dans les bases B de E et C de F .

• PBÑB1 : matrice de passage de la base B à la base B 1 (il s’agit de la matrice MatB1 ,B pIdE q).

• Mn pKq : espace vectoriel des matrices carrées à n lignes et n colonnes et à coefficients

dans K.

• Ei j : matrice de Mn pKq avec un coefficient 1 sur la ligne i et la colonne j, et des coefficients

nuls partout ailleurs.

• Kn rXs : espace vectoriel sur K des polynômes en une indéterminée à coefficients dans K
et de degré au plus n.

5
6 TABLE DES MATIÈRES

• TrpM q : trace de la matrice M i.e. la somme des coefficients diagonaux de M .

• In : matrice identité de taille n.

• 0n,p : matrice à n lignes et p colonnes avec uniquement des coefficients nuls.

• VectpSq : sous-espace vectoriel de E engendré par les vecteurs de E contenus dans S.

• LpEq : espace vectoriel sur K des endomorphismes de E (LpEq “ LpE, Eq).

• rgpAq : rang de la matrice A.

• rg pf q : rang de l’application linéaire f .

• detpM q : déterminant de la matrice M .

• det pgq : déterminant de l’endomorphisme g.

• Mn,p pKq : espace vectoriel des matrices à n lignes et p colonnes et à coefficients dans K.

• Ker A : noyau de la matrice A.

• degpP q : degré du polynôme P .

• px1 , . . . , xk q : idéal de A engendré par les éléments x1 , . . . , xk .

Chapitre 1

Dualité linéaire

1.1 Introduction
La dualité linéaire est la théorie des formes linéaires sur un espace vectoriel, c’est-à-dire,
pour K un corps commutatif quelconque, la théorie des applications linéaires E Ñ K où E
est un espace vectoriel sur K. On peut également voir la dualité linéaire comme la théorie des
équations linéaires sur un espace vectoriel. En particulier, cette théorie nous donne une cor-
respondance explicite entre les sous-espaces vectoriels d’un espace vectoriel E et les systèmes
d’équations linéaires sur E. La dualité linéaire nous fournit également une interprétation vec-
torielle de l’opération de transposition sur les matrices.

Tout au long de ce chapitre, K désigne un corps commutatif quelconque.

1.2 Formes linéaires sur un espace vectoriel et espace dual

Soit E un espace vectoriel sur K.

Définition 1.2.1. On appelle forme linéaire sur E toute application linéaire de E dans K.
L’ensemble des formes linéaires sur E est appelé espace dual de E et noté E ˚ .

R3 Ñ R
Exemple 1.2.2 (exemple “fil rouge”). L’application ϕ : est une
px, y, zq ÞÑ 2x ` 3y ´ 5z
forme linéaire sur R3 .
Remarque 1.2.3. ‚ E ˚ “ LpE, Kq est un espace vectoriel sur K.

‚ Si E est de dimension finie n P Nzt0u ¨ B “ te1 , . . . , en u est une base de E, alors, pour
et si ˛
x1
˚ .. ‹
tout vecteur v de E de coordonnées ˝ . ‚ dans la base B et toute forme linéaire ϕ de
xn

7
8 CHAPITRE 1. DUALITÉ LINÉAIRE

E ˚ , on a

ϕpvq “ ϕpx1 e1 ` ¨ ¨ ¨ ` xn en q
“ x1 lo
ϕpe
omo1oqn ` ¨ ¨ ¨ ` xn lo
ϕpe
omonoqn
PK PK
¨ ˛
x1
“ pϕpe1 q ¨ ¨ ¨ ϕpen qq ˝ ... ‚
˚ ‹

Exemple 1.2.4 (suite de l’exemple “fil rouge”). Pour tout vecteur px, y, zq de R3 , on a
¨ ˛
x
ϕpx, y, zq “ p2 3 ´ 5q y ‚
˝
z

Définition 1.2.5. Soit ϕ P E ˚ une forme linéaire sur E non identiquement nulle. On appelle
hyperplan de E déterminé par ϕ le sous-espace vectoriel Ker ϕ de E.

Exemple 1.2.6 (suite de l’exemple “fil rouge”). L’hyperplan

( de R3 déterminé par ϕ est le sous-
espace vectoriel px, y, zq P R3 | 2x ` 3y ´ 5y “ 0 de R3 .
L’appellation “hyperplan” est justifiée par le fait que, si E est de dimension finie n P Nzt0u,
l’hyperplan déterminée par une forme linéaire sur E non identiquement nulle est effectivement
un sous-espace vectoriel de E de dimension n ´ 1. Nous allons montrer ce fait ci-dessous, ainsi
que sa réciproque :

Proposition 1.2.7. Supposons que E est de dimension finie n P Nzt0u.

Les hyperplans de E déterminés par les formes linéaires non nulles de E ˚ sont exactement
les hyperplans linéaires de E i.e. (“id est” : c’est-à-dire) les sous-espaces vectoriels de E de
dimension n ´ 1.

Démonstration. Soit ϕ P E ˚ zt0u. L’image Im ϕ de ϕ étant un sous-espace vectoriel de K, la

dimension de Im ϕ (sur K) est inférieure ou égale à 1 (la dimension de K sur K est 1). Comme
ϕ est non identiquement nulle, la dimension de Im ϕ ne peut être 0. La dimension de Im ϕ est
donc 1 et, par le théorème du rang,

dimpKer ϕq “ dimpEq ´ dimpIm ϕq “ n ´ 1,

i.e. l’hyperplan de E déterminé par ϕ est de dimension n ´ 1.

Réciproquement, soit H un sous-espace vectoriel de E de dimension n´1. Soit v0 un vecteur
de E n’appartenant pas à H. Alors les sous-espaces vectoriels H et Vecttv0 u de E sont en somme
directe et, par un argument de dimension, E “ H ‘ Vecttv0 u. Ainsi, tout vecteur v de E se
décompose de façon unique en une somme v “ uv ` λv v0 avec uv P H et λv P K. Si ϕ désigne
E Ñ K
alors la forme linéaire , on a H “ Ker ϕ, i.e. H est l’hyperplan de E déterminé par
v ÞÑ λv
la forme linéaire ϕ.
1.3. BASE DUALE 9

Remarque 1.2.8. Reprenons les notations de la remarque 1.2.3. Si ϕ P E ˚ , l’hyperplan de E

déterminé par ϕ est le sous-espace vectoriel de E caractérisé par l’équation linéaire

ϕpe
omo1oqn x1 ` ¨ ¨ ¨ ` lo
lo ϕpe
omonoqn xn “ 0
PK PK
¨ ˛
x1
˚ .. ‹
en les coordonnées ˝ . ‚ dans la base B.
xn
Réciproquement, à tout sous-espace vectoriel H de E caractérisé par une équation linéaire

a1 x1 ` ¨ ¨ ¨ ` an xn “ 0

avec pa1 , . . . , an q P Kn ztp0, . . . , 0qu, on peut associer la forme linéaire

E Ñ K
ϕ: ,
x1 e1 ` ¨ ¨ ¨ ` xn en ÞÑ a1 x1 ` ¨ ¨ ¨ ` an xn

et alors H “ Ker ϕ.
On obtient ainsi une “correspondance” entre l’espace dual E ˚ de E et les équations linéaires
en les coordonnées dans la base B. A noter que l’espace des solutions d’un système d’équations
linéaires peut être vu comme une intersection d’hyperplans.

1.3 Base duale

Soit E un espace vectoriel sur K de dimension finie n P Nzt0u.
En utilisant le fait que dim pLpE, Kqq “ dimpEq ˆ dimpKq “ dimpEq, on peut montrer
directement que dimpE ˚ q “ dimpEq. On peut également le montrer en associant à toute base
de E une base de E ˚ :
Théorème et Définition 1.3.1. Soit B “ te1 , . . . , en u une base de E.
Pour i P t1, . . . , nu, on note e˚i la forme linéaire sur E définie par
#
˚ 1 si i “ j,
pour tout j P t1, . . . , nu, ei pej q “ δi j “
0 si i ‰ j.

La famille te˚1 , . . . , e˚n u de E ˚ est une base de E ˚ , appelée base duale de B. On la note B ˚ .
Démonstration. Soit i P t1, . . ¨
. , nu.˛Commençons par remarquer que, par définition, si v est un
x1
˚ .. ‹
vecteur de E de coordonnées ˝ . ‚ dans la base B,
xn

e˚i pvq “ e˚ px1 e1 ` ¨ ¨ ¨ ` xn en q “ x1 e˚i pe1 q ` . . . ` xn e˚i pen q “ xi ,

autrement dit e˚i associe à tout vecteur v de E sa ième coordonnée dans la base B.
10 CHAPITRE 1. DUALITÉ LINÉAIRE

A présent, montrons que la famille te˚1 , . . . , e˚n u de E ˚ est libre : soient λ1 , . . . , λn P K tels
que λ1 e˚1 ` . . . ` λn e˚n soit la forme linéaire nulle, i.e., pour tout vecteur v de E, λ1 e˚1 pvq ` . . . `
λn e˚n pvq “ 0. En particulier, pour tout j P t1, . . . , nu, 0 “ λ1 e˚1 pej q ` . . . ` λn e˚n pej q “ λj et la
famille te˚1 , . . . , e˚n u de E ˚ est donc libre.
˚ ˚ ˚ ˚
Montrons ensuite que ¨ la ˛famille te1 , . . . , en u engendre E . Soit donc ϕ P E , et soit v un
x1
˚ .. ‹
vecteur de coordonnées ˝ . ‚ dans la base B. On a alors
xn

˚ ˚
ϕpvq “ ϕpx1 e1 ` ¨ ¨ ¨ ` xn en q “ lo
ϕpe
omo1oqn x1 ` ¨ ¨ ¨ ` lo
ϕpe
omonoqn xn “ ϕpe1 qe1 pvq ` ¨ ¨ ¨ ` ϕpen qen pvq.
PK PK

Ainsi, ϕ “ ϕpe1 qe˚1 ` ¨ ¨ ¨ ` ϕpen qe˚n P Vectte˚1 , . . . , e˚n u et la famille te˚1 , . . . , e˚n u est donc généra-
trice de E ˚ .

Remarque 1.3.2. ‚ On aurait pu se contenter de montrer le caractère libre ou le carac-

tère générateur de la famille te˚1 , . . . , e˚n u puis d’utiliser le fait, établi précédemment, que
dim pE ˚ q “ dim pEq “ n pour montrer que la famille te˚1 , . . . , e˚n u est une base de E ˚ .
On a cependant fait le choix de la démonstration “complète” ci-dessus pour son intérêt
didactique.

‚ E et E ˚ étant deux espaces vectoriels de même dimension finie, ils sont isomorphes.
Cependant, en général, ils ne le sont pas de façon “canonique” : un isomorphisme entre
ces deux espaces vectoriels dépend, en général, d’un choix de bases pour E et E ˚ .
Exemple 1.3.3. Si B “ te1 , . . . , en u est la base canonique de Kn , pour tout i P t1, . . . , nu, e˚i est
la forme linéaire
Kn Ñ K
e˚i :
px1 , . . . , xn q ÞÑ xi

Exemple 1.3.4. On considère la base B “ te1 , e2 , e3 u de R3 formé par les vecteurs e1 :“ p1, 1, 1q,
e2 :“ p1, 0, ´1q et e3 :“ p0, 1, 1q. Déterminons la base duale B ˚ de B : précisément, nous allons
déterminer les expressions des formes linéaires e˚1 , e˚2 et e˚3 sur R3 .
On cherche a, b, c P R tels que, pour tout px1 , x2 , x3 q P R3 , e˚1 px1 , x2 , x3 q “ ax1 ` bx2 ` cx3 .
Or
$ $ $
˚
&e1 pe1 q “ 1
’ &a ` b ` c “ 1
’ &a “ 1
’
˚
e1 pe2 q “ 0 ô a ´ c “ 0 ô b “ ´1
’
% ˚ ’ ’
e1 pe3 q “ 0 b`c“0 c“1
% %

Ainsi, e˚1 est l’application

R3 Ñ R
e˚1 :
px1 , x2 , x3 q ÞÑ x1 ´ x2 ` x3
1.3. BASE DUALE 11

On cherche à présent a, b, c P R tels que, pour tout px1 , x2 , x3 q P R3 , e˚2 px1 , x2 , x3 q “

ax1 ` bx2 ` cx3 . Or
$ $ $
˚
&e2 pe1 q “ 0
’ &a ` b ` c “ 0
’ &a “ 0
’
˚
e2 pe2 q “ 1 ô a ´c“1 ô b“1
’
% ˚ ’ ’
e2 pe3 q “ 0 b`c“0 c “ ´1
% %

Ainsi, e˚2 est l’application

R3 Ñ R
e˚2 :
px1 , x2 , x3 q ÞÑ x2 ´ x3
Enfin, on cherche a, b, c P R tels que, pour tout px1 , x2 , x3 q P R3 , e˚3 px1 , x2 , x3 q “ ax1 ` bx2 `
cx3 . Or $ $ $
e ˚ pe q “ 0 a b c 0
& 3
’ 1 ’
& ` ` “ &a “ ´1
’
˚
e3 pe2 q “ 0 ô a ´c“0 ô b“2
’
% ˚ ’ ’
e3 pe3 q “ 1 b`c“1 c “ ´1
% %

Ainsi, e˚3 est l’application

R3 Ñ R
e˚3 :
px1 , x2 , x3 q ÞÑ ´x1 ` 2x2 ´ x3
Remarque 1.3.5. Attention : parler de “dual d’un vecteur” n’a pas de sens. Si B1 et B2 sont deux
bases de E et v est un vecteur de E appartenant à chacune de ces deux bases, les vecteurs “v ˚ ”
dans B1˚ et “v ˚ ” dans B2˚ sont a priori différents (on devrait écrire v ˚B1 , respectivement v ˚B2 ).
Reprenons les vecteurs e1 “ p1, 1, 1q et e2 “ p1, 0, ´1q de R3 de l’exemple précédent mais
posons cette fois v3 :“ p1, 0, 0q. La famille B 1 :“ te1 , e2 , v3 u est également une base de R3 .
Déterminons les formes linéaires de la base duale B 1 ˚ de B 1 : on cherche a, b, c P R tels que, pour
tout px1 , x2 , x3 q P R3 , e˚1 px1 , x2 , x3 q “ ax1 ` bx2 ` cx3 . Or
$ $ $
e ˚ pe q “ 1 a b c 1
& 1
’ 1 ’
& ` ` “ &a “ 0
’
˚
e1 pe2 q “ 0 ô a ´c“0 ô b“1
’
% ˚ ’ ’
e1 pv3 q “ 0 a “0 c“0
% %

Ainsi, e˚1 est l’application

R3 Ñ R
e˚1 :
px1 , x2 , x3 q ÞÑ x2
On cherche ensuite a, b, c P R tels que, pour tout px1 , x2 , x3 q P R3 , e˚2 px1 , x2 , x3 q “ ax1 ` bx2 `
cx3 . Or $ $ $
˚
&e2 pe1 q “ 0
’ &a ` b ` c “ 0
’ &a “ 0
’
˚
e2 pe2 q “ 1 ô a ´c“1 ô b“1
’
% ˚ ’ ’
e2 pv3 q “ 0 a “0 c “ ´1
% %

Ainsi, e˚2 est l’application

R3 Ñ R
e˚2 :
px1 , x2 , x3 q ÞÑ x2 ´ x3
12 CHAPITRE 1. DUALITÉ LINÉAIRE

Enfin, on cherche a, b, c P R tels que, pour tout px1 , x2 , x3 q P R3 , v3˚ px1 , x2 , x3 q “ ax1 `bx2 `cx3 .
Or $ $ $
˚
&v3 pe1 q “ 0
’ &a ` b ` c “ 0
’ &a “ 1
’
˚
v3 pe2 q “ 0 ô a ´ c “ 0 ô b “ ´2
’
% ˚ ’ ’
v3 pv3 q “ 1 a “1 c“1
% %

Ainsi, v3˚ est l’application

R3 Ñ R
v3˚ :
px1 , x2 , x3 q ÞÑ x1 ´ 2x2 ` x3
˚ ˚
On remarque ainsi que e2 B “ e˚2 B mais que e1 B ‰ e˚1 B . A noter également que, même si v3 est le
1 1

˚ 1 R3 Ñ R
troisième vecteur de la base canonique de R3 , v3 B n’est pas l’application .
px1 , x2 , x3 q ÞÑ x3
Dans la suite, B “ te1 , . . . , en u désignera une base de E.
ÿn
Proposition 1.3.6. 1. Pour toute forme linéaire ϕ P E ˚ , ϕ “ ϕpei qe˚i , autrement dit ϕ
¨ ˛ i“1
ϕpe1 q
a pour coordonnées ˝ ... ‚ dans la base duale B ˚ de B.
˚ ‹

ϕpen q
¨ ˚ ˛
n e1 pvq
ÿ
˚ ˚ .. ‹
2. Pour tout vecteur v P E, v “ ej pvqej , autrement dit v a pour coordonnées ˝ . ‚
j“1 e˚n pvq
dans la base B.

Démonstration. 1. Soit ϕ P E ˚ . Comme B ˚ est une base de E ˚ , il existe λ1 , . . . , λn P K

ÿn n
ÿ
(uniques) tels que ϕ “ λi e˚i . Si j P t1, . . . , nu, on a alors ϕpej q “ λi e˚i pej q “ λj , et
i“1 i“1
n
ÿ
donc ϕ “ ϕpei qe˚i .
i“1

2. Soit v P E. Comme B est une base de E, il existe µ1 , . . . , µn P K (uniques) tels que

n
ÿ n
ÿ n
ÿ
v“ µj ej . Si i P t1, . . . , nu, on a alors e˚i pvq “ µj e˚i pej q “ µi , et donc v “ e˚j pvqej .
j“1 j“1 j“1

Remarque 1.3.7. Cela peut constituer un moyen “efficace” de déterminer les coordonnées d’une
forme linéaire dans une base duale donnée, resp. (“respectivement”) d’un vecteur dans une base
donnée.
R3 Ñ R
Exemple 1.3.8. ‚ Reprenons la forme linéaire ϕ : de
px1 , x2 , x3 q ÞÑ 2x1 ` 3x2 ´ 5x3
l’exemple fil rouge et déterminons ses coordonnées dans la base duale B ˚ de l’exemple
1.4. ASPECTS MATRICIELS 13

1.3.4. On a ϕpe1 q “ 0, ϕpe2 q “ 7, ϕpe3 q “ ´2 et donc ϕ “ 7e˚2 ´ 2e˚3 . Remarquons que

l’on n’a pas besoin de l’expression des formes linéaires de la base duale pour déterminer
les coordonnées de ϕ dans celle-ci (les expressions obtenues dans l’exemple 1.3.4 nous
permettent cependant de vérifier que la décomposition précédente est bien correcte).

‚ Si l’on considère le vecteur v “ p3, ´4, 1q de R3 , on obtient ses coordonnées dans la base
B de l’exemple 1.3.4 en calculant e˚1 pvq “ 8, e˚2 pvq “ ´5 et e˚3 pvq “ ´12. On a donc
v “ 8e1 ´ 5e2 ´ 12e3 .
La proposition 1.3.6 nous permet également de montrer de l’opération qui à toute base de
E associe sa base duale est injective. Nous montrerons sa surjectivité dans la section suivante.

Corollaire 1.3.9. Soit B 1 “ tf1 , . . . , fn u une base de E. Si B ˚ “ B 1 ˚ , alors B “ B 1 .

Démonstration. Soit i P t1, . . . , nu. D’après la proposition 1.3.6,

n
ÿ n
ÿ
ei “ fj˚ pei qfj “ e˚j pei qfj “ fi .
j“1 j“1

Ainsi B “ B 1 .

Remarque 1.3.10. Comme, sur l’espace vectoriel de dimension finie E ˚ , on a accès à des bases,
on peut utiliser les outils matriciels pour étudier les formes linéaires de E ˚ .

1.4 Aspects matriciels

Comme dans la section précédente, on considère un espace vectoriel E de dimension finie
n P Nzt0u et une base B “ te1 , . . . , en u de E.
Commençons par une première remarque : si ϕ est une forme linéaire de E ˚ et v est un
vecteur de E, alors, d’après la remarque 1.2.3,

ϕpvq “ t MatB˚ pϕqMatB pvq.

A présent, nous allons nous intéresser au changement de base pour les bases duales : préci-
sément, soit B 1 “ tf1 , . . . , fn u une autre base de E, on peut calculer la matrice de passage de
la base duale B ˚ à la base duale B 1 ˚ à partir de la matrice de passage de la base B à la base B 1 .

Proposition 1.4.1. On a
PB˚ ÑB1 ˚ “ tPBÑB1 ´1 “ tPB1 ÑB
(rappel : la transposition et l’inversion des matrices inversibles commutent).

Démonstration. Pour simplifier les écritures, on note P “ ppi j q1ďi,jďn :“ PBÑB1 et Q “

pqi j q1ďi,jďn :“ PB˚ ÑB1 ˚ . Ainsi, pour i, j P t1, . . . , nu, fi˚ “ nk“1 qk i e˚k (il s’agit de la dé-
ř

composition de fi˚ dans la base B ˚ ) et fj “ nl“1 pl j el (il s’agit de la décomposition de fj dans

ř
la base B). Nous allons montrer que In “ t QP (et donc Q “ tP ´1 ).
14 CHAPITRE 1. DUALITÉ LINÉAIRE

Soient i, j P t1, . . . , nu. Le coefficient situé sur la ligne i et la colonne j de la matrice identité
In est δi,j et, par définition de la base duale B 1 ˚ “ tf1˚ , . . . , fn˚ u, on a
˜ ¸˜ ¸
n
ÿ n
ÿ
δi,j “ fi˚ pfj q “ qk i e˚k pl j el
k“1 l“1
n ÿ
ÿ n
“ qk i pl j e˚k pel q
k“1 l“1
ÿn ÿ n
“ qk i pl j δk,l
k“1 l“1
ÿn
“ qk i p k j
k“1
n
ÿ
Or qk i pk j est justement le coefficient situé sur la ligne i et la colonne j de la matrice produit
k“1
t QP . Ainsi, on a bien In “ t QP i.e. Q “ tP ´1 i.e. PB˚ ÑB1 ˚ “ tPBÑB1 ´1 .

A l’aide de cette propriété, on peut également montrer la surjectivité, et donc la bijectivité

(voir corollaire 1.3.9 ci-dessus), de l’opération qui associe à toute base B de E sa base duale B ˚
de E ˚ :
Corollaire et Définition 1.4.2. Pour toute base C de E ˚ , il existe une et une seule base B
de E telle que C “ B ˚ . On appelle B la base antéduale de C.
Démonstration. Soit C une base de E ˚ . Fixons maintenant B0 une base quelconque de E et
considérons la matrice Q :“ tPB0˚ ÑC ´1 . Comme il s’agit d’une matrice inversible de taille n, Q
peut être considérée comme la matrice de passage PB0 ÑB de la base B0 de E à une base B (les
coordonnées des vecteurs de B dans la base B0 sont données par les colonnes de Q) et on a
alors, d’après la proposition précédente,
PB0˚ ÑB˚ “ tPB0 ÑB ´1 “ tQ´1 “ PB0˚ ÑC ,
de sorte que les coordonnées des vecteurs de la base C dans la base B0˚ sont les mêmes que les
coordonnées des vecteurs de la base B ˚ dans la base B0˚ et donc C “ B ˚ .

R3 Ñ R
Exemple 1.4.3. On considère les formes linéaires ϕ1 : , ϕ2 :
px1 , x2 , x3 q Ñ x1 ` x2 ` x3
R3 Ñ R R3 Ñ R
et ϕ3 : sur R3 . La famille C “ tϕ1 , ϕ2 , ϕ3 u
px1 , x2 , x3 q Ñ ´x1 ` x3 px1 , x2 , x3 q Ñ x2 ` x3
` ˘˚
est une base de R3 . Pour le voir, on écrit les coordonnées de ϕ1 , ϕ2 et ϕ3 dans la base duale
B0˚ “ te˚1 , e˚2 , e˚3 u de la base canonique B0 “ te1 , e2 , e3 u de R3 : on a ϕ1 “ e˚1 ` e˚2 ` e˚3 ,
ϕ2 “ ´e˚1 ` e˚3 et ϕ3 “ e˚2 ` e˚3 , et la matrice
¨ ˛
1 ´1 0
P :“ ˝1 0 1‚
1 1 1
1.5. ANNULATEUR D’UN SOUS-ESPACE VECTORIEL ET CORRESPONDANCE DUALE15

dont les colonnes sont les coordonnées de ϕ1 , ϕ2 et ϕ3 dans la base B ˚ , est inversible.
On cherche maintenant à déterminer la base antéduale B “ tv1 , v2 , v3 u de la base C. On
procède comme dans la démonstration précédente : la matrice P ci-dessus est la matrice de
passage de B0˚ à C et la matrice de passage de la base B0 à la base B est alors la matrice tP ´1 .
On obtient ¨ ˛
1 0 ´1
t ´1
P “ ˝´1 ´1 2 ‚
1 1 ´1
et on a donc v1 “ e1 ´ e2 ` e3 “ p1, ´1, 1q, v2 “ ´e2 ` e3 “ p0, ´1, 1q et v3 “ ´e1 ` 2e2 ´ e3 “
p´1, 2, ´1q.

1.5 Annulateur d’un sous-espace vectoriel et correspondance duale

Soit E un espace vectoriel de dimension finie n P Nzt0u.
Dans cette section, on va définir des outils de la dualité qui vont nous donner une corres-
pondance explicite entre les sous-espaces vectoriels de E et les systèmes d’équations linéaires
qui les caractérisent.

Soit F un sous-espace vectoriel de E et soit W un sous-espace vectoriel de E ˚ .

Définition 1.5.1. ‚ L’ensemble, noté F 0 , des formes linéaires de E ˚ qui s’annulent sur F
est appelé annulateur de F .

‚ L’ensemble, noté W 0 , des vecteurs de E qui sont annulés par toutes les formes linéaires
de W est appelé annulateur de W .

L’ensemble F 0 “ tϕ P E ˚ | pour tout v P F , ϕpvq “ 0u est un sous-espace vectoriel de E ˚ :

la forme linéaire identiquement nulle sur E appartient à F 0 et, si ϕ, ψ P E ˚ et λ, µ P K, pour
tout v P E, pλϕ ` µψqpvq “ λϕpvq ` µψpvq “ 0.
De façon analogue, W 0 “ tv P E | pour tout ϕ P W , ϕpvq “ 0u est un sous-espace vectoriel
de E : le vecteur nul de E appartient à W 0 et, si v, w P E et λ, µ P K, pour tout ϕ P E ˚ ,
ϕpλv ` µwq “ λϕpvq ` µϕpwq “ 0.

Proposition 1.5.2. 1. Si tv1 , . . . , vp u est une base de F , alors F 0 “ tϕ P E ˚ | ϕpv1 q “

0, . . . , ϕpvp q “ 0u.

2. Si tϕ1 , . . . , ϕq u est une base de W , alors W 0 “ tv P E | ϕ1 pvq “ 0, . . . , ϕq pvq “ 0u.

Démonstration. 1. Soit ϕ P F 0 , alors, comme v1 , . . . , vp P F , ϕpv1 q “ 0, . . . , ϕpvp q “ 0. Réci-

proquement, soit maintenant ϕ une forme linéaire sur E annulant les vecteurs v1 , . . . , vp
et soit v P F . Comme tv1 , . . . , vp u est une base de F , il existe λ1 , . . . , λp P K (uniques)
tels que v “ λ1 v1 ` ¨ ¨ ¨ ` λp vp et alors

ϕpvq “ λ1 ϕpv1 q ` ¨ ¨ ¨ ` λp ϕpvp q “ 0,

et ϕ appartient donc à F 0 .
16 CHAPITRE 1. DUALITÉ LINÉAIRE

2. Soit v P W 0 , alors, comme ϕ1 , . . . , ϕq P W , ϕ1 pvq “ 0, . . . , ϕq pvq “ 0. Réciproquement,

soit maintenant v un vecteur de E annulé par les formes linéaires ϕ1 , . . . , ϕq et soit ϕ P
W . Comme tϕ1 , . . . , ϕq u est une base de W , il existe µ1 , . . . , µq P K (uniques) tels que
ϕ “ µ1 ϕ1 ` ¨ ¨ ¨ ` µq ϕq et alors

ϕpvq “ µ1 ϕ1 pvq ` ¨ ¨ ¨ ` µq ϕq pvq “ 0,

et v appartient donc à W 0 .

Remarquons que, si tϕ1 , . . . , ϕq u est une base de W , W 0 “ qi“1 Ker ϕi et que, si B “

Ş
te1 , . . . , en u est une base de E, W 0 est le sous-espace vectoriel de E caractérisé par le système
linéaire $
&ϕ1 pe1 qx1 ` ¨ ¨ ¨ ` ϕ1 pen qxn “ 0
’
’
..
’ .
’
%ϕ pe qx ` ¨ ¨ ¨ ` ϕ pe qx “ 0
q 1 1 q n n
¨ ˛
x1
˚ .. ‹
en les coordonnées ˝ . ‚ dans la base B.
xn
La proposition suivante affirme notamment que si W “ F 0 , alors F peut être décrit par le
système linéaire ci-dessus, autrement dit que les vecteurs de F sont exactement les solutions de
ce système.

Proposition 1.5.3. On a
` ˘ ` ˘
1. dimpEq “ dimpF q ` dim F 0 et dim pE ˚ q “ dimpW q ` dim W 0 ,
` ˘0 ` ˘0
2. F 0 “ F et W 0 “ W .
` ˘
Démonstration. 1. Montrons tout d’abord que dimpEq “ dimpF q`dim F 0 . Soit tv1 , . . . , vp u
une base de F que l’on complète en une base B “ ( tv1 , . . . , vp , vp`1 , . . . , vn u de E. Considé-(
rons la base duale B “ v1 , . . . , vp , vp`1 , . . . , vn et montrons que la famille vp`1 , . . . , vn˚
˚ ˚ ˚ ˚ ˚ ˚

est une base de F 0 :

‚ Soit i P tp ` 1, . . . , nu, alors vi˚ P F 0 car, pour tout j P t1, . . . , pu, vi˚ pvj q “ 0 (i ‰ j)
et les vecteurs v1 , . . . , vp engendrent F .
(
˚ , . . . , v ˚ de E ˚ est libre comme sous-famille de la base B ˚ .
‚ La famille vp`1 n
‚ De plus, elle engendre F 0 : en effet, soit ϕ P F 0 , alors, d’après la proposition 1.3.6
i),

ϕ “ ϕpv1 qv1˚ ` ¨ ¨ ¨ ` ϕpvp qvp˚ ` ϕpvp`1 qvp`1

˚
` ¨ ¨ ¨ ` ϕpvn qvn˚
˚
(
“ ϕpvp`1 qvp`1 ` ¨ ¨ ¨ ` ϕpvn qvn˚ P Vect vp`1
˚
, . . . , vn˚

(ϕpv1 q “ ¨ ¨ ¨ “ ϕpvp q “ 0 car v1 , . . . , vp P F et ϕ P F 0 ).

1.5. ANNULATEUR D’UN SOUS-ESPACE VECTORIEL ET CORRESPONDANCE DUALE17
` ˘
En particulier, dim F 0 “ n ´ p “ dimpEq ´ dimpF q.

` ˘ ` ˘
L’égalité dim E 0 “ dimpW q ` dim W 0 se démontre de façon tout à fait similaire, à
l’aide de la notion de base antéduale (corollaire et définition 1.4.2) : soit tϕ1 , . . . , ϕq u
une base de W que l’on complète en une base C “ tϕ1 , . . . , ϕq , ϕq`1 , . . . , ϕn u de E ˚ et
notons B “ tv1 , . . . , vq , vq`1 , . . . , vn u la base antéduale de C. On montre que la famille
tvq`1 , . . . , vn u est une base de W 0 :

‚ Soit j P tq`1, . . . , nu, alors vj P W 0 car, pour tout i P t1, . . . , qu, ϕi pvj q “ vi˚ pvj q “ 0
(i ‰ j) et les vecteurs ϕ1 , . . . , ϕq engendrent W .
‚ La famille tvq`1 , . . . , vn u de E est libre comme sous-famille de la base B.
‚ De plus, elle engendre W 0 : en effet, soit v P W 0 , alors, d’après la proposition 1.3.6
ii),

v “ v1˚ pvqv1 ` ¨ ¨ ¨ ` vq˚ pvqvq ` vq`1

˚
pvqvq`1 ` ¨ ¨ ¨ ` vn˚ pvqvn
“ ϕ1 pvqv1 ` ¨ ¨ ¨ ` ϕq pvqvq ` ϕq`1 pvqvq`1 ` ¨ ¨ ¨ ` ϕn pvqvn
“ ϕq`1 pvqvq`1 ` ¨ ¨ ¨ ` ϕn pvqvn P Vect tvq`1 , . . . , vn u

(ϕ1 pvq “ ¨ ¨ ¨ “ ϕq pvq “ 0 car ϕ1 , . . . , ϕq P W et v P W 0 ).

` ˘
En particulier, dim W 0 “ n ´ q “ dim pE ˚ q ´ dimpW q “ dimpEq ´ dimpW q.
` ˘0
2. Des deux égalités démontrées précédemment, on déduit la double inclusion F 0 “ F :
` ˘0
on a F Ă F 0 (car si v P F et ϕ P F 0 alors ϕpvq “ 0) et
´` ˘ ¯
0
F0 “ dimpEq ´ dim F 0 “ dimpEq ´ pdimpEq ´ dimpF qq “ dimpF q.
` ˘
dim

` ˘0 ` ˘0
De même, W 0 “ W car W Ă W 0 (si ϕ P W et v P W 0 alors ϕpvq “ 0) et
´` ˘0 ¯
W0 “ dimpEq ´ dim W 0 “ dimpEq ´ pdimpEq ´ dimpW qq “ dimpW q.
` ˘
dim

Cette proposition et sa démonstration nous donnent en particulier une méthode pour, à

partir d’une base de F , obtenir un système d’équations linéaires “linéairement indépendantes”
(i.e. d’équations correspondant à des formes linéaires linéairement indépendantes) décrivant F :
Exemple 1.5.4. Soit F le sous-espace vectoriel de R3 engendré par le vecteur v1 “ p1, 1, 1q.
On note v2 le vecteur p1, 0, ´1q et v3 le vecteur p0, 1, 1q, puis on complète la famille libre
tv1 u de R3 en la base B “ tv1 , v2 , v3 u (voir également exemple 1.3.4). On considère ensuite
la base duale B ˚ “ tv1˚ , v2˚ , v3˚ u et, d’après ce que l’on a vu dans la démonstration précédente,
R3 Ñ R
F 0 “ Vect tv2˚ , v3˚ u. L’expression de v2˚ sur R3 est v2˚ : et l’expression
px1 , x2 , x3 q ÞÑ x2 ´ x3
18 CHAPITRE 1. DUALITÉ LINÉAIRE

R3 Ñ R
de v3˚ sur R3 est v3˚ : . Ainsi
px1 , x2 , x3 q ÞÑ ´x1 ` 2x2 ´ x3
` ˘0
F “ F0 px1 , x2 , x3 q P R3 | v2˚ px1 , x2 , x3 q “ 0, v3˚ px1 , x2 , x3 q “ 0
(
“
px1 , x2 , x3 q P R3 | x2 ´ x3 “ 0, ´x1 ` 2x2 ´ x3 “ 0 .
(
“

Une méthode analogue permet d’obtenir, à partir d’une description de F comme ensemble
des solutions d’un système d’équations linéaires linéairement indépendantes, une base de F :
Exemple 1.5.5. Notons B0 “ te1 , e2 , e3 u la base canonique de R3 et considérons les formes
˚
linéaires ϕ1 “ e˚1 ` e˚2 ` e˚3 et ϕ2 “ ´e˚1 ` e˚3 sur R3 . On note W :“ Vecttϕ1 , ϕ2 u Ă R3 et(on
cherche à déterminer une base de W 0 “ px1 , x2 , x3 q P R3 | x1 ` x2 ` x3 “ 0, ´x1 ` x3 “ 0 .
Tout d’abord, remarquons que les formes linéaires ϕ1 et ϕ2 sont linéairement indépendantes :
on peut par exemple constituer la matrice dont les colonnes sont les coordonnées de ϕ1 et ϕ2
dans la base B0˚ et montrer qu’elle est bien de rang 2. On note ` 3ensuite
˘˚ ϕ3 :“ e˚2 ` e˚3 et on
complète la famille libre tϕ1 , ϕ2 u en la base C :“ tϕ1 , ϕ2 u de R . D’après l’exemple 1.4.3,
la base préduale de C est la base B “ tp1, ´1, 1q, p0, ´1, 1q, p´1, 2, ´1qu de R3 et, d’après la
démonstration de la proposition 1.5.3, W 0 “ Vecttp´1, 2, ´1qu.
Remarque 1.5.6. On a t0E u0 “ E ˚ , E 0 “ t0E ˚ u, t0E ˚ u0 “ E et pE ˚ q0 “ t0E u.

1.6 Application transposée

La dualité linéaire va également nous permettre de donner une interprétation vectorielle à
l’opération de transposition sur les matrices.
Soient E et F deux espaces vectoriels sur K.

Définition 1.6.1. Soit f P LpE, F q. On appelle transposée de f l’application linéaire

t F ˚ Ñ E˚
f:
ϕ ÞÑ ϕ ˝ f

Remarque 1.6.2. ‚ Si ϕ P F ˚ “ LpF, Kq, on a bien ϕ ˝ f P E ˚ “ LpE, Kq.

‚ L’application tf est bien linéaire : si ϕ, ψ P F ˚ et λ, µ P K,

t
f pλϕ ` µψq “ pλϕ ` µψq ˝ f
“ λϕ ˝ f ` µψ ˝ f
“ λ tf pϕq ` µ tf pψq

Les propriétés de base de la transposée d’une application linéaire sont réunies dans la pro-
position suivante :

Proposition 1.6.3. 1. t pIdE q “ IdE ˚ .

2. Si f, g P LpE, F q et λ, µ P K, t pλf ` µgq “ λ tf ` µ tg.

1.6. APPLICATION TRANSPOSÉE 19

3. Si G est un espace vectoriel sur K, f P LpE, F q et g P LpF, Gq, t pg ˝ f q “ tf ˝ tg.

4. Si f est une` application
˘´1 t ` ´1 linéaire
˘ bijective de E dans F , alors tf : F ˚ Ñ E ˚ est également
t
bijective et f “ f .
Démonstration. 1. Pour tout ϕ P E ˚ , on a
t
pIdE q pϕq “ ϕ ˝ IdE “ ϕ “ IdE˚ pϕq.

2. Pour tout ϕ P F ˚ , on a
t
pλf ` µgq pϕq “ ϕ ˝ pf ` gq “ ϕ ˝ f ` ϕ ˝ g “ tf pϕq ` tgpϕq “ tf ` tg pϕq.
` ˘

3. Pour tout ϕ P G˚ , on a
t
pg ˝ f q pϕq “ ϕ ˝ pg ˝ f q “ pϕ ˝ gq ˝ f “ tgpϕq ˝ f “ tf tgpϕq “ tf ˝ tg pϕq.
` ˘ ` ˘

` ˘ ` ˘ ` ˘ ` ˘
4. On a tf ˝ t f ´1 “ t f ´1 ˝ f “ t pIdE q “ IdE ˚ et t f ´1 ˝ tf “ t f ˝ f ´1 “ t pIdF q “ IdF ˚ .

On en vient à la justification matricielle de l’appellation “transposée” et, “réciproquement”,

à une interprétation vectorielle, via la dualité, de la transposition matricielle :
Proposition 1.6.4. On suppose que les espaces vectoriels E et F sont tous deux de dimension
finie. Soient alors B “ te1 , . . . , en u une base de E et C “ tv1 , . . . , vm u une base de F , et soit
f P LpE, F q. On a
MatC ˚ ,B˚ tf “ t MatB,C pf q,
` ˘

autrement dit la matrice de la transposée tf de f dans les bases duales C ˚ et B ˚ est la transposée
de la matrice de f dans les bases B et C, ou encore, symétriquement, la transposée de la matrice
de f dans les bases B et C est la matrice de la transposée tf de f dans les bases duales C ˚ et B ˚ .
Démonstration. Soit j P t1, . . . , mu et notons A “ pak l q1ďkďm,1ďlďn :“ MatB,C pf q. Alors
n
ÿ
t
` ˘
f vj˚ “ lo
vj˚omo
˝ ofn “ vj˚ ˝ f pei qe˚i par la proposition 1.3.6, 1.
i“1
PE ˚
n
ÿ
“ vj˚ pf pei qq e˚i
i“1
˜ ¸
ÿn m
ÿ
“ vj˚ ak i vk e˚i
i“1 k“1
ÿn ÿm
“ ak i vj˚ pvk qe˚i
i“1 k“1
ÿn
“ aj i e˚i
i“1
` ˘
Ainsi la matrice MatC ˚ ,B˚ tf est exactement la transposée de la matrice A “ MatB,C pf q.
20 CHAPITRE 1. DUALITÉ LINÉAIRE

Remarque 1.6.5. Ce résultat est également à mettre en lien avec la propriété 1.4.1 concernant la
matrice de passage d’une base duale à une autre : si B et B 1 sont deux bases d’un espace vectoriel
de dimension finie E, la matrice de passage PBÑB1 est la matrice MatB1 ,B pIdE q de l’identité
de E dans les bases B 1 et B, et la transposée de cette matrice est, d’après les propositions
précédentes, la matrice MatB˚ ,B1 ˚ pIdE ˚ q, i.e. la matrice de passage PB1 ˚ ÑB˚ . Autrement dit,
tP ´1
“ tPBÑB1 ´1 “ tPB1 ÑB .
BÑB1 “ PB1 ˚ ÑB˚ et donc, de façon équivalente, PB˚ ÑB1 ˚ “ PB1 ˚ ÑB˚

Ce point de vue “vectoriel” sur la transposition matricielle permet également, à partir de la

proposition 1.6.3 et de la correspondance entre produit de matrices et composition ` ˘d’applications
´1 ` ˘
linéaires, de montrer sans calcul les propriétés matricielles “ t pABq “ tB tA” et “ tA “ t A´1 ”.

1.7 Bidual
Soit E un espace vectoriel sur K. Son dual E ˚ est également un espace vectoriel sur K : on
peut donc aussi considérer son dual que l’on note E ˚˚ . On a alors, par définition,

E ˚˚ “ pE ˚ q˚ “ L pE ˚ , Kq “ pLpE, Kqq˚ “ L pLpE, Kq, Kq .

Définition 1.7.1. On appelle E ˚˚ le bidual de E.

On a vu qu’un espace vectoriel de dimension finie est isomorphe à son dual et donc, comme
le dual est isomorphe à son propre dual, à son bidual. Néanmoins, comme on l’a dit plus haut, on
ne dispose pas, en général, d’isomorphisme “canonique” entre un espace vectoriel de dimension
finie et son dual. Une propriété remarquable du bidual est que, en dimension finie, tout espace
vectoriel est canoniquement isomorphe à son bidual :

Proposition 1.7.2. On suppose que E est de dimension finie. Alors E est canoniquement
isomorphe à son bidual E ˚˚ , i.e. on peut construire un isomorphisme linéaire de E sur E ˚˚
sans faire appel à des choix de bases.

E˚ Ñ K
Démonstration. Pour v P E, définissons tout d’abord l’application Φv : (l’ap-
ϕ ÞÑ ϕpvq
plication d’“évaluation” des formes linéaires sur E en le vecteur v). Pour tout v P E, l’application
Φv est linéaire : si ϕ, ψ P E ˚ et λ, µ P K,

Φv pλϕ ` µψq “ pλϕ ` µψq pvq “ λϕpvq ` µψpvq “ λΦv pϕq ` µΦv pψq.

Ainsi, pour tout v P E, Φv P L pE ˚ , Kq “ E ˚˚ .

On considère alors l’application

E Ñ E ˚˚
Φ:
v Ñ Φv
1.7. BIDUAL 21

Φ est une application linéaire : si v, w P E et λ, µ P K alors, pour tout ϕ P E ˚ ,

Φ pλv ` µwq pϕq “ Φλv`µw pϕq

“ ϕ pλv ` µwq
“ λϕpvq ` µϕpwq
“ λΦv pϕq ` µΦw pϕq
“ λΦpvqpϕq ` µΦpwqpϕq
“ pλΦpvq ` µΦpwqq pϕq

i.e. Φ pλv ` µwq “ λΦpvq ` µΦpwq.

On montre enfin que l’application linéaire Φ : E Ñ E ˚˚ est bijective : comme dim pE ˚˚ q “
dim pE ˚ q “ dimpEq, on peut se contenter de montrer que Φ est injective. Soit donc v P E tel
que Φpvq “ Φv “ 0, i.e., pour tout ϕ P E ˚ , ϕpvq “ 0. En particulier, si l’on considère une
base B “ te1 , . . . , en u de E et sa base duale B ˚ “ te˚1 , . . . , e˚n u, on a, pour tout j P t1, . . . , nu,
ÿn
˚
ej pvq “ 0 et donc v “ e˚j pvqej “ 0 : Φ est donc bien injective.
j“1
Ainsi, l’application Φ est bien un isomorphisme linéaire de E sur E ˚˚ (et sa définition ne
dépend pas d’un choix de bases).
22 CHAPITRE 1. DUALITÉ LINÉAIRE
Chapitre 2

Espaces euclidiens

2.1 Introduction
On introduit sur les R-espaces vectoriels de dimension finie une structure supplémentaire : le
produit scalaire, notion qui généralise le produit scalaire classique sur R2 ou R3 . Cette structure
supplémentaire nous donne accès aux notions géométriques d’orthogonalité et de distance.

2.2 Produit scalaire sur un espace vectoriel réel

Soit E un espace vectoriel sur R.

EÊ Ñ R
Définition 2.2.1. Considérons une application x¨, ÿ : . On dit que x¨, ÿ
pv, wq ÞÑ xv, wy
est un produit scalaire sur E si x¨, ÿ est

1. bilinéaire, i.e. pour tous v1 , v2 , w1 , w2 P E et tous λ, µ P R, xλv1 ` µv2 , wy “ λxv1 , wy `

µxv2 , wy et xv, λw1 ` µw2 y “ λxv, w1 y ` µxv, w2 y,

2. symétrique, i.e. pour tous v, w P E, xv, wy “ xw, vy,

3. définie positive, i.e. pour tout v P E, xv, vy ě 0 et xv, vy “ 0 si et seulement si v “ 0E .

Exemple 2.2.2. 1. Soit n P Nzt0u, pour tous v “ px1 , . . . , xn q et w “ py1 , . . . , yn q dans Rn ,

on définit
xv, wycan :“ x1 y1 ` ¨ ¨ ¨ ` xn yn .
Rn ˆ Rn Ñ R
L’application x¨, ¨ycan : est alors un produit scalaire sur Rn ,
pv, wq ÞÑ xv, wycan
appelé produit scalaire canonique sur Rn . Montrons le caractère défini positif de l’appli-
ÿn n
ÿ
2
n
cation x¨, ¨ycan : si v “ px1 , . . . , xn q P R , xv, vycan “ xi ě 0 et xv, vycan “ x2i “ 0 ssi
i i
(“si et seulement si”) pour tout i P t1, . . . , nu, xi “ 0 ssi v “ p0, . . . , 0q.

23
24 CHAPITRE 2. ESPACES EUCLIDIENS

2. Supposons que E est un espace vectoriel de dimension finie n P Nzt0u et soit B “

¨ 1 , .˛. . , en¨u une
te ˛ base de E. Pour tous vecteurs v et w de E, de coordonnées respectives
x1 y1
˚ .. ‹ ˚ .. ‹
˝ . ‚ et ˝ . ‚ dans la base B, on définit
xn yn

xv, wyB :“ x1 y1 ` ¨ ¨ ¨ ` xn yn “ t MatB pvqMatB pwq.

EˆE Ñ R
L’application x¨, ¨yB : est alors un produit scalaire sur E, appelé
pv, wq ÞÑ xv, wyB
produit scalaire associé à la base B.

3. Soit n P Nzt0u. Pour toutes matrices A “ pai j q1ďi,jďn et B “ pbi j q1ďi,jďn dans Mn pRq,
on définit ÿ
ai j bi j “ Tr tA B .
` ˘
xA, By :“
1ďi,jďn

Mn pRq ˆ Mn pRq Ñ R
L’application x¨, ¨y : est alors un produit scalaire sur
pA, Bq ÞÑ xA, By
Mn pRq : il s’agit du produit scalaire associé à la base canonique tEi j u1ďi,jďn de Mn pRq.

4. Soit n P Nzt0u. Pour tous polynômes P et Q de Rn rXs, on définit

ż1
xP, Qy :“ P ptqQptqdt.
0

Rn rXs ˆ Rn rXs Ñ R
L’application x¨, ÿ : est alors un produit scalaire sur Rn rXs.
pP, Qq ÞÑ xP, Qy
La bilinéarité de l’application x¨, ÿ provient de la linéarité de l’intégrale. Montrons que
ż1
x¨, ÿ est bien définie positive. Soit P P Rn rXs, on a xP, P y “ pP ptqq2 dt ě 0 (l’inté-
0 ż1
grale sur un segment d’une fonction positive est positive). Si xP, P y “ pP ptqq2 dt “ 0,
0
comme la fonction R Ñ R ; t ÞÑ P ptq2 est continue et positive, on a, pour tout t P r0, 1s,
pP ptqq2 “ 0 (l’intégrale d’une fonction continue et positive sur un segment est nulle si
et seulement si la fonction est identiquement nulle sur ce segment) et donc, pour tout
t P r0, 1s, P ptq “ 0, donc (un polynôme ayant une infinité de racines étant nécessairement
nul) le polynôme P est nul.
Remarque 2.2.3. Si x¨, ÿ est un produit scalaire sur E et si F est un sous-espace vectoriel de E,
la restriction
F ˆF Ñ R
x¨, ÿ|F ˆF :
pv, wq ÞÑ xv, wy
est un produit scalaire sur F .
Définition 2.2.4. Si E est un espace vectoriel de dimension finie muni d’un produit scalaire
x¨, ÿ, le couple pE, x¨, ÿq est appelé espace euclidien.
2.2. PRODUIT SCALAIRE SUR UN ESPACE VECTORIEL RÉEL 25

Remarque 2.2.5. D’après la remarque

` ˘ pE, x , yq est un espace euclidien et si F est un
2.2.3, si
sous-espace vectoriel de E, alors F, x , y|F ˆF est également un espace euclidien. On le notera
simplement pF, x , yq.
Supposons donc dans la suite de cette section que E est un espace vectoriel de dimension
a d’un produit scalaire x¨, ¨y. Pour tout vecteur v de E, xv, vy ě 0 et on définit alors
finie muni
}v} :“ xv, vy. Une première propriété importante des espaces euclidiens est l’inégalité de
Cauchy-Schwarz ci-dessous. Cette inégalité permet en particulier de montrer que l’application
qui à tout vecteur v de E associe }v} P r0, `8r est une norme.

Lemme 2.2.6 (Inégalité de Cauchy-Schwarz). Pour tous vecteurs v et w de E, on a l’inégalité

|xv, wy| ď }v}}w},

et |xv, wy| “ }v}}w} si et seulement si les vecteurs v et w sont liés.

Démonstration. Soient v, w P E.

Si w est le vecteur nul 0E de E, on a

xv, wy “ xv, 0E y “ xv, 0 ¨ 0E y “ 0 ¨ xv, 0E y “ 0

a a
et }w} “ xw, wy “ x0E , 0E y “ 0. L’inégalité ci-dessus est donc vérifiée : il s’agit d’une
égalité et on a w “ 0E “ 0 ¨ v.

On suppose maintenant que w ‰ 0E . Soit alors λ P R, on a }v ` λw}2 ě 0. Or

}v ` λw}2 “ xv ` λw, v ` λwy

“ xv, vy ` λxv, wy ` λxw, vy ` λ2 xw, wy
“ }v}2 ` 2λxv, wy ` λ2 }w}2 .

Ainsi, pour tout λ P R, }w}2 λ2 `2xv, wyλ`}v}2 ě 0, en d’autres termes, la fonction polynomiale
du second degré (remarquons que }w}2 ‰ 0 car xw, wy ‰ 0 car w ‰ 0E )

R Ñ R
λ ÞÑ }w}2 λ2 ` 2xv, wyλ ` }v}2

est positive sur tout R, ce qui est équivalent au fait que le discriminant associé 4xv, wy2 ´
4}w}2 }v}2 soit négatif ou nul. Ainsi, on a xv, wy2 ď }v}2 }w}2 i.e. |xv, wy| ď }v}}w}.

De plus, si |xv, wy| “ }v}}w} ô xv, wy2 “ }v}2 }w}2 , le discriminant associé à la fonction
polynomiale du second degré ci-dessus est nul et donc le polynôme associé possède une racine
(double) λ0 P R. On a ainsi

xv ` λ0 w, v ` λ0 wy “ }v ` λ0 w}2 “ }w}2 λ20 ` 2xv, wyλ0 ` }v}2 “ 0

et donc v ` λ0 w “ 0E , en particulier les vecteurs v et w sont liés.

26 CHAPITRE 2. ESPACES EUCLIDIENS

Réciproquement, supposons qu’il existe pµ1 , µ2 q P R2 ztp0, 0qu tel que µ1 v ` µ2 w “ 0. Si

µ2 “ 0, nécessairement v “ 0E et, comme ci-dessus, |xv, wy| “ 0 “ }v}}w}. Si µ2 ‰ 0, on a
w “ µµ21 v et alors

µ1 2
B F
2
xv, wy “ v, v
µ2
ˆ ˙2
µ1
“ xv, vy2
µ2
B F
µ1 µ1
“ xv, vy v, v
µ2 µ2
“ }v}2 }w}2 .

E Ñ r0, `8r
Corollaire et Définition 2.2.7. L’application } ¨ } : est une norme, i.e.
v ÞÑ }v}
1. pour tous v P E et λ P R, }λv} “ |λ|}v},
2. pour tout v P E, }v} “ 0 si et seulement si v “ 0E ,
3. pour tous v, w P E, }v ` w} ď }v} ` }w}.
En conséquence, le couple pE, } ¨ }q est un espace vectoriel normé. La norme } ¨ } est appelée
norme euclidienne associée au produit scalaire x¨, ¨y.
Démonstration. 1. Soient v P E et λ P R, alors
a ? a
}λv} “ xλv, λvy “ λ2 xv, vy “ |λ|}v}.
a
2. Soit v P E, alors }v} “ xv, vy “ 0 ssi xv, vy “ 0 ssi v “ 0E .
3. Soient v, w P E. Alors

}v ` w}2 “ xv ` w, v ` wy
“ xv, vy ` xv, wy ` xw, vy ` xw, wy
“ }v}2 ` 2xv, wy ` }w}2
ď }v}2 ` 2|xv, wy| ` }w}2
ď }v}2 ` 2}v}2 }w}2 ` }w}2 (par l’inégalité de Cauchy-Schwarz)
“ p}v} ` }w}q2

et donc }v ` w} ď }v} ` }w}.

Remarque 2.2.8. D’après les premières égalités ci-dessus, on a, pour tous v, w P E,

1`
}v ` w}2 ´ }v}2 ´ }w}2 .
˘
xv, wy “
2
2.3. ORTHOGONALITÉ DANS LES ESPACES EUCLIDIENS 27

2.3 Orthogonalité dans les espaces euclidiens

Soit pE, x¨, ¨yq un espace euclidien.
La structure supplémentaire qu’apporte le produit scalaire x¨, ¨y sur l’espace vectoriel de
dimension finie E nous permet d’introduire une notion d’orthogonalité :

Définition 2.3.1. Soient v et w deux vecteurs de E. On dit que v et w sont orthogonaux si

xv, wy “ 0. Dans ce cas, on dira également que v est orthogonal à w et que w est orthogonal à
v.
Soit maintenant A un sous-ensemble non vide de E. On note AK l’ensemble des vecteurs de
E orthogonaux à tous les vecteurs contenus dans A, i.e.

AK :“ tv P E | pour tout w P A, xv, wy “ 0u.

On appelle AK l’orthogonal de A (par rapport à x¨, ¨y).

Remarque 2.3.2. Une famille finie tv1 , . . . , vp u de vecteurs non nuls de E deux à deux ortho-
gonaux (i.e., pour tous i, j P t1, . . . , pu, si i ‰ j alors xvi , vj y “ 0) est libre. En effet, soient
λ1 , . . . , λp P R tels que λ1 v1 ` ¨ ¨ ¨ ` λp vp “ 0E , alors, pour i P t1, . . . , pu,
C p
G p
ÿ ÿ
0 “ vi , λj vj “ λj xvi , vj y “ λi xvi , vi y
j“1 j“1

et donc, comme xvi , vi y ‰ 0 (car vi ‰ 0E ), λi “ 0.

Une famille finie de vecteurs non nuls de E deux à deux orthogonaux sera appelée famille
orthogonale. Etant libre, une famille orthogonale possède au plus dimpEq éléments.
Exemple 2.3.3. Dans R3 muni du produit scalaire canonique, les vecteurs p1, ´1, 2q et p1, 3, 1q (
sont orthogonaux, et tp´2, 5, 3quK “ px, y, zq P R3 | xpx, y, zq, p´2, 5, 3qycan “ ´2x ` 5y ` 3z “ 0 .
Dans l’exemple ci-dessus, on peut remarquer que tp´2, 5, 3quK est un sous-espace vectoriel
de R3 . L’orthogonal d’un sous-ensemble est en fait toujours un sous-espace vectoriel :

Lemme 2.3.4. Soit A un sous-ensemble de E. Alors AK est un sous-espace vectoriel de E

(même si A ne l’est pas).

Démonstration. 0E P AK car, pour tout w P A, x0E , wy “ 0, et, si v1 , v2 P AK et λ, µ P R, on a,

pour tout w P A,
xλv1 ` µv2 , wy “ λxv1 , wy ` µxv2 , wy “ 0.
Ainsi, AK est bien un sous-espace vectoriel de E.

Remarque 2.3.5. • Si A est un sous-ensemble de E, on a AK “ pVectpAqqK .

• On a t0E uK “ E (car, pour tout v P E, xv, 0E y “ 0) et E K “ t0E u (en effet, si v P E K ,

xv, vy “ 0, car v P E K et v P E, et donc v “ 0E ).
Remarquons ensuite que le théorème de Pythagore peut être étendu à tout cadre euclidien
général :
28 CHAPITRE 2. ESPACES EUCLIDIENS

Lemme 2.3.6 (Théorème de Pythagore). Soient v et w deux vecteurs de E. Alors v et w sont

orthogonaux si et seulement si }v ` w}2 “ }v}2 ` }w}2 .
Démonstration. Dans la section précédente, on a vu que }v ` w}2 “ }v}2 ` 2xv, wy ` }w}2 et
donc }v ` w}2 “ }v}2 ` }w}2 ssi xv, wy “ 0 ssi v et w sont orthogonaux.

Revenons maintenant à l’orthogonal d’un sous-ensemble de E. Si F est un sous-espace

vectoriel de E, on va pouvoir décomposer E en la` somme
˘ directe de F et de son orthogonal F K .
On montrera l’égalité dimpEq “ dimpF q ` dim F K dans la section suivante, qui exhibera un
lien important entre orthogonalité et dualité pour un espace euclidien.
Proposition 2.3.7. Soit F un sous-espace vectoriel de E. On a :
` ˘
1. dimpEq “ dimpF q ` dim F K ,

2. E “ F ‘ F K ,
` ˘K
3. F K “ F .
Démonstration. 1. Il s’agit du corollaire 2.4.4 de la section suivante.

2. On a F X F K “ t0E u car, si v P F X F K , xv, vy “ 0 (car v P F K et v P F ) et donc

` K ˘v “ 0E .
K
Ainsi, F et F sont en somme directe et, comme dimpEq “ dimpF q ` dim F par 1.,
E “ F ‘ F K.
` ˘K
3. On a F Ă F K car, si v P F , pour tout w P F K , xv, wy “ xw, vy “ 0. De plus,
´` ˘K ¯ ` ˘
dim F K “ dimpEq ´ dim F K “ dimpEq ´ pdimpEq ´ dimpF qq “ dimpF q.
` ˘K
En conséquence, F “ F K .

Soit F un sous-espace vectoriel de E. Comme E se décompose en la somme directe de F et

son orthogonal F K , on peut considérer la projection de E sur F parallèlement à F K :
Définition 2.3.8. On appelle projection orthogonale sur F la projection de E sur F parallèle-
ment à F K . Il s’agit de l’application linéaire surjective qui à tout vecteur v “ w ` u de E avec
w P F et u P F K associe sa composante w dans F . On note pF cette application.
Remarque 2.3.9. Si te1 , . . . , ep u est une base de F et tep`1 , . . . , en u est une base de F K alors
B :“ te1 , . . . , ep , ep`1 , . . . , en u est une base de E dans laquelle la matrice représentative de pF
est ¨ ˛
1
˚ .. ‹
˚ . ‹
˚ ‹ ˆ ˙
˚ 1 ‹ Ip 0p,n´p
MatB ppF q “ ˚ ˚
‹ “ 0n´p,p 0n´p,n´p
‹
˚ 0 ‹
˚ . . ‹
˝ . ‚
0
2.3. ORTHOGONALITÉ DANS LES ESPACES EUCLIDIENS 29

La projection orthogonale permet notamment de calculer explicitement la distance eucli-

dienne d’un vecteur de E à un sous-espace vectoriel de E. On donne tout d’abord la définition
de cette notion de distance euclidienne :

Définition 2.3.10. Si v et w sont deux vecteurs de E, on définit la distance euclidienne de v à w

comme étant le réel positif ou nul dpv, wq :“ }w ´ v}.
Si v est un vecteur de E et A un sous-ensemble non vide de E, on définit également
la distance euclidienne de v à A comme étant le réel positif ou nul dpv, Aq :“ inf dpv, wq “
wPA
inf }w ´ v}.
wPA

Remarque 2.3.11. • La distance euclidienne d’un vecteur de E à un autre est bien une
distance, dans le sens où

1. pour tous v, w P E, dpv, wq ě 0,

2. pour tous v, w P E, dpv, wq “ dpw, vq (en effet }w ´ v} “ }v ´ w}),
3. pour tous v, w P E, dpv, wq “ 0 ssi v “ w (en effet, }w ´ v} “ 0 ssi w ´ v “ 0E ),
4. pour tous v, w, u P E, dpv, uq ď dpv, wq`dpw, uq (en effet, }u´v} “ }u´w `w ´v} ď
}u ´ w} ` }w ´ v}).

Plus généralement, toute norme sur un espace vectoriel induit, de cette façon, une distance.

• Pour v un vecteur de E et A un sous-ensemble non vide de E, la borne inférieure de

l’ensemble tdpv, wq | w P Au existe bien et est positive ou nulle : ce sous-ensemble de R
est non vide et minorée par 0.

Proposition 2.3.12. Soit v P E. On a

dpv, F q “ }v ´ pF pvq} .

Démonstration. Soit w P F . On a

}v ´ w}2 “ }v ´ pF pvq ` pF pvq ´ w}2 “ }v ´ pF pvq}2 ` }pF pvq ´ w}2

par le théorème de Pythagore (lemme 2.3.6) car v ´ pF pvq P F K (par définition de la projection
orthogonale : il existe un unique vecteur u P F K tel que v “ pF pvq ` u) et pF pvq ´ w P F (car
F est un sous-espace vectoriel de E).
Ainsi, pour tout w P F , }v ´ w}2 ě }v ´ pF pvq}2 donc }v ´ w} ě }v ´ pF pvq} donc inf t}v ´ w} | w P F u ě
}v ´ pF pvq}. De plus, comme pF pvq P F , inf t}v ´ w} | w P F u ď }v ´ pF pvq}. Au total, }v ´ pF pvq} “
inf t}v ´ w} | w P F u “ dpv, F q.

On définit également la symétrie orthogonale par rapport à F :

Définition 2.3.13. On appelle symétrie orthogonale par rapport à F la symétrie par rapport à
F parallèlement à F K . Il s’agit de l’involution linéaire de E qui à tout vecteur v “ w ` u de E
avec w P F et u P F K associe le vecteur w ´ u. On note sF cette application.
30 CHAPITRE 2. ESPACES EUCLIDIENS

Remarque 2.3.14. • “Involution linéaire de E” signifie que sF est une application linéaire de
E dans E telle que sF ˝ sF “ IdE . Autrement dit, sF est un automorphisme linéaire de
E d’inverse lui-même.

• Comme pour toute symétrie vectorielle, on a sF “ 2pF ´ IdE (si v “ w ` u P E avec

w P F et u P F K , on a p2pF ´ IdE q pvq “ 2w ´ pw ` uq “ w ´ u “ sF pvq).

• Si te1 , . . . , ep u est une base de F et tep`1 , . . . , en u est une base de F K alors B :“ te1 , . . . , ep , ep`1 , . . . , en u
est une base de E dans laquelle la matrice représentative de sF est
¨ ˛
1
˚ .. ‹
˚ . ‹
˚ ‹ ˆ ˙
˚ 1 ‹ Ip 0p,n´p
MatB psF q “ ˚˚
‹ “ 0n´p,p ´In´p
‹
˚ ´1 ‹
˚ .. ‹
˝ . ‚
´1

2.4 Orthogonalité et dualité dans les espaces euclidiens

Effectuons un petit retour sur la dualité linéaire. Soit E un espace vectoriel de dimension
finie sur R. On a vu au chapitre précédent que, même si E et son dual E ˚ sont isomorphes, il
n’existe en général pas d’isomorphisme canonique (i.e. ne dépendant pas d’un choix de bases)
entre E et E ˚ . Mais si E est maintenant muni d’un produit scalaire x¨, ¨y, celui-ci permet de
construire un tel isomorphisme canonique entre E et E ˚ :

Théorème 2.4.1. Soit pE, x¨, ¨yq un espace euclidien. Pour tout v P E, on définit l’application
linéaire Λv : E Ñ R ; w ÞÑ xv, wy. On définit ensuite l’application

E Ñ E˚
Λ:
v ÞÑ Λv

L’application Λ est un isomorphisme linéaire.

Démonstration. Remarquons tout d’abord que, si v P E, Λv est bien une application linéaire de
E dans R (en d’autres termes Λv P E ˚ ) car le produit scalaire x¨, ¨y est bilinéaire.
Montrons ensuite que l’application Λ est bien linéaire. Soient donc v1 , v2 P E et λ, µ P R,
alors, pour tout w P E,

Λ pλv1 ` µv2 q pwq “ Λλv1 `µv2 pwq

“ xλv1 ` µv2 , wy
“ λxv1 , wy ` µxv2 , wy
“ λ Λv1 pwq ` µ Λv2 pwq
“ pλΛv1 ` µΛv2 q pwq

i.e. Λ pλv1 ` µv2 q “ λΛpv1 q ` µΛpv2 q.

2.5. BASES ORTHOGONALES ET BASES ORTHONORMALES 31

Montrons enfin que Λ est injective : comme dimpEq “ dim pE ˚ q, on obtiendra alors (par le
théorème du rang) que Λ est bijective. Soit donc v P E tel que Λv est l’application identiquement
nulle. En particulier, Λv pvq “ xv, vy “ 0 donc v “ 0E . L’application Λ est donc bien injective,
et Λ est donc un isomorphisme.

Remarque 2.4.2. La surjectivité de Λ nous dit que pour toute forme linéaire ϕ P E ˚ , il existe
v P E tel que, pour tout w P E, ϕpwq “ xv, wy. De plus, comme Λ est bijective, v “ Λ´1 pϕq.
Intéressant en soi, ce résultat nous permet également de mettre une évidence une corres-
pondance entre les notions d’orthogonal et d’annulateur d’un sous-espace vectoriel d’un espace
euclidien :

` ˘ 2.4.3. Soient pE, x¨, ¨yq un espace euclidien et F un sous-espace vectoriel de E. On

Corollaire
a Λ F K “ F 0.
` ˘
Démonstration. Montrons l’égalité équivalente Λ´1 F 0 “ F K . On a

Λ´1 F 0 “ v P E | Λpvq P F 0
` ˘ (

“ tv P E | pour tout w P F , xv, wy “ 0u

“ FK

Soient pE, x¨, ¨yq un espace euclidien et F un sous-espace vectoriel de E. Le corollaire pré-
K 0
cédent affirme en` particulier
K
˘ ` 0 ˘Λ induit, par restriction, un isomorphisme linéaire F Ñ F ,
que
et donc que dim F “ dim F . On obtient ainsi le résultat qui nous permet de terminer la
preuve de la proposition 2.3.7 :
` ˘
Corollaire 2.4.4. On a dimpEq “ dimpF q ` dim F K .
Démonstration. On a, en utilisant proposition 1.5.3 1.,

dim F K “ dim F 0 “ dimpEq ´ dimpF q.

` ˘ ` ˘

2.5 Bases orthogonales et bases orthonormales

Soit pE, x¨, ¨yq un espace euclidien de dimension n P Nzt0u et soit¨ tv˛ 1, . . . ¨
, vn u˛une base de
x1 y1
˚ .. ‹ ˚ .. ‹
E. Si v et w sont deux vecteurs de E de coordonnées respectives ˝ . ‚ et ˝ . ‚ dans cette
xn yn
base, alors C G
ÿn n
ÿ ÿ
xv, wy “ xi vi , yj v j “ xi yj xvi , vj y.
i“1 j“1 1ďi,jďn

On aimerait une base de E dans laquelle cette expression du produit scalaire x¨, ¨y sur E soit
la plus simple possible. Cela nous mène à la notion de base orthogonale et de base orthonormale :
32 CHAPITRE 2. ESPACES EUCLIDIENS

Définition 2.5.1. Soit B “ te1 , . . . , en u une base de E.

1. On dit que B est une base orthogonale de E si pour tous i, j P t1, . . . , nu tels que i ‰ j,
on a xei , ej y “ 0.

2. On dit que B est une base orthonormale de E si B est une base orthogonale de E et si tous
les vecteurs de B sont de norme euclidienne 1. Autrement dit, B est une base orthonormale
de E si et seulement si pour tous i, j P t1, . . . , nu, xei , ej y “ δi j (pour tout v P E, }v} “ 1
ssi xv, vy “ 1).

Exemple 2.5.2. • La base canonique de Rn est une base orthonormale pour le produit sca-
laire canonique sur Rn (exemple 2.2.2 1.).

• Par définition, une base B de E est une base orthonormale pour le produit scalaire associé
x¨, ÿB (exemple 2.2.2 2.).
Remarque 2.5.3. 1. Si B “ te1 , . . . , en u est une baseörthonormale
˛ ¨ ˛ pour x¨, ÿ et si v et w sont
x1 y1
˚ .. ‹ ˚ .. ‹
deux vecteurs de E de coordonnées respectives ˝ . ‚ et ˝ . ‚ dans B, alors
xn yn

ÿ n
ÿ
xv, wy “ xi yj xei , ej y “ x i yi .
1ďi,jďn i“1

En particulier, pour tout i P t1, . . . , nu, xv, ei y “ xi et donc

n
ÿ
v“ xv, ei yei .
i“1

2. Si la famille t1 , . . . , n u est une base orthogonale de E, alors la famille te1 , . . . , en u avec,
pour tout i P t1, . . . , nu, ei :“ }ii } , est une base orthonormale de E. En effet, pour tout
› ›
i P t1, . . . , nu, }ei } “ › }ii } › “ }1i } }i } “ 1.
› ›

3. Plus généralement, on appellera famille orthonormale toute famille orthogonale tv1 , . . . , vp u

de E (remarque 2.3.2) telle que, pour tout i P t1, . . . , pu, }vi } “ 1.
Ainsi, avec les notations ci-dessus, si tv1 , . . . , vn u est une base orthonormale de E, on a
l’expression simple
ÿn
xv, wy “ x i yi .
i“1

du produit scalaire de v et w, qui rappelle l’expression du produit scalaire canonique sur Rn .

Et un résultat fondamental de la théorie des espaces euclidiens est qu’il est toujours pos-
sible de construire, de façon algorithmique, une base orthonormale pour n’importe quel espace
euclidien :
2.5. BASES ORTHOGONALES ET BASES ORTHONORMALES 33

Théorème 2.5.4 (Procédé d’orthonormalisation de Gram-Schmidt). Soit tv1 , . . . , vp u une fa-

mille libre de E. On peut construire, de façon algorithmique, une famille orthonormale te1 , . . . , ep u
de E telle que, pour tout k P t1, . . . , pu, Vect te1 , . . . , ek u “ Vect tv1 , . . . , vk u (en particulier,
te1 , . . . , ep u est donc une base orthonormale de Vect tv1 , . . . , vp u).
Démonstration. On construit, de façon récursive, une base orthogonale t1 , . . . , p u pour Vect tv1 , . . . , vp u.
On en déduit immédiatement une base orthonormale en “normalisant” les vecteurs obtenus (i.e.
en les multipliant chacun par l’inverse de leur norme comme dans la remarque 2.5.3 2.).
Le procédé récursif est le suivant : pour 1 ď k ď p´1, on suppose que l’on a déjà construit des
vecteurs 1 , . . . , k P E orthogonaux deux à deux tels que Vect t1 , . . . , k u “ Vect tv1 , . . . , vk u.
On recherche alors un vecteur k`1 de E de la forme

k`1 “ vk`1 ` λ1 1 ` ¨ ¨ ¨ ` λk k P Vect t1 , . . . , k , vk`1 u “ Vect tv1 , . . . , vk , vk`1 u

tel que, pour tout i P t1, . . . , ku, xk`1 , i y “ 0.

Or, pour i P t1, . . . , ku,

xk`1 , i y “ 0 ô xvk`1 ` λ1 1 ` ¨ ¨ ¨ ` λk k , i y “ 0
ô xvk`1 , i y ` λi xi , i y “ 0
xvk`1 , i y
ô λi “ ´
}i }2
,i y
Ainsi, par construction, la famille t1 , . . . , k`1 u avec k`1 “ vk`1 ´ ki“1 k`1
ř xv
}i }2
i est orthogo-
nale et engendre bien Vect tv1 , . . . , vk , vk`1 u car Vect tv1 , . . . , vk , vk`1 u “ Vect t1 , . . . , k , vk`1 u “
,i y
Vect t1 , . . . , k , k`1 u (car k`1 “ vk`1 ´ ki“1 k`1
ř xv
}i }2
i P Vect t1 , . . . , k , vk`1 u et vk`1 “
řk xvk`1 ,i y
k`1 ` i“1 }i }2 i P Vect t1 , . . . , k , k`1 u).

Remarque 2.5.5. Au terme de l’étape k ` 1 du procédé ci-dessus, on peut remplacer k`1 par
n’importe quel vecteur non nul 1k`1 de la droite vectorielle engendrée par k`1 : la famille
t1 , . . . , k , 1k`1 u ainsi obtenue reste orthogonale et engendre toujours Vect tv1 , . . . , vk`1 u. Cela
peut être utile pour simplifier les calculs (notamment pour éviter de manipuler des fractions).
Exemple 2.5.6. On détermine une base orthonormée pour le sous-espace vectoriel F de R4
engendré par les vecteurs v1 “ p1, 1, 0, 0q, v2 “ p1, 0, ´1, 1q et v3 “ p0, 1, 1, 1q. La famille
tv1 , v2 , v3 u est libre (c’est donc une base de F “ Vecttv1 , v2 , v3 u) et on applique le procédé
d’orthonormalisation de Gram-Schmidt pour déterminer une base orthonormale de F .
On pose

1 :“ v1 “ p1, 1, 0, 0q
ˆ ˙
xv2 , 1 y 1 1 1 1
2 :“ v2 ´ 2
1 “ v2 ´ 1 “ , ´ , ´1, 1 “ p1, ´1, ´2, 2q
}1 } 2 2 2 2
1
2 :“ p1, ´1, ´2, 2q (pour simplifier les calculs)
ˆ ˙
xv3 , 1 y xv3 , 12 y 1 1 1 1 2 2 4 6 2
3 :“ v3 ´ 1 ´ “ v 3 ´ 1 ` “ ´ , , , “ p´1, 1, 2, 3q
}1 }2 }12 }2 2 2 10 2 5 5 5 5 5
1
3 :“ p´1, 1, 2, 3q
34 CHAPITRE 2. ESPACES EUCLIDIENS

et la famille t1 , 12 , 13 u est alors une base orthogonale de F . La famille
" *
1 1 1
? p1, 1, 0, 0q, ? p1, ´1, ´2, 2q, ? p´1, 1, 2, 3q
2 10 15

ensuite obtenue par normalisation est une base orthonormale de F .

Corollaire 2.5.7. Il existe une base orthonormale pour l’espace euclidien pE, x¨, ¨yq

Démonstration. Soit tv1 , . . . , vn u une base de E. En particulier, la famille tv1 , . . . , vn u est libre
et, d’après le théorème 2.5.4, on peut construire une base orthonormale pour Vecttv1 , . . . , vn u “
E.

Remarque 2.5.8. Soit B “ te1 , . . . , en u une base orthonormale pour x¨, ÿ. Alors x¨, ÿ “ ¨
x¨, ÿ˛
B
x1
(exemple 2.2.2 2.). En effet, pour tous vecteurs v et w de E, de coordonnées respectives ˝ ... ‚
˚ ‹

xn
¨ ˛
y1 n
˚ .. ‹ ÿ
et ˝ . ‚ dans la base B, on a xv, wy “ xi yi “ xv, wyB .
yn i“1

Le choix d’une base orthonormale pour l’espace euclidien pE, x¨, ¨yq permet d’identifier E
avec l’espace euclidien pRn , x¨, ¨ycan q muni du produit scalaire canonique. Précisément :

Corollaire 2.5.9. Il existe un isomorphisme (non canonique) ψ : E Ñ Rn tel que, pour tous
vecteurs v et w de E, xψpvq, ψpwqycan “ xv, wy.

Démonstration. Soit B “ te1 , . . . , en u une base orthonormale pour x¨, ¨y et notons B 1 “ te11 , . . . , e1n u
la base canonique de Rn . Notons ensuite ψB l’application linéaire de E dans Rn qui, pour tout
i P t1, . . . , nu,¨associe 1
˛ ei à ei . Autrement dit, ψB est l’application qui à tout vecteur v de E de
x1
˚ .. ‹
coordonnées ˝ . ‚ dans la base B associe le vecteur px1 , . . . , xn q de Rn . Il s’agit d’un isomor-
xn
¨ ˛ ¨ ˛
x1 y1
˚ .. ‹ ˚ .. ‹
phisme linéaire et, si v et w sont deux vecteurs de E de coordonnées respectives ˝ . ‚ et ˝ . ‚
xn yn
dans B, on a

n
ÿ
xψB pvq, ψB pwqycan “ xpx1 , . . . , xn q, py1 , . . . , yn qycan “ xi yi “ xv, wy
i“1

(car B est une base orthonormale pour x¨, ¨y).

2.6. REPRÉSENTATION MATRICIELLE DU PRODUIT SCALAIRE 35

2.6 Représentation matricielle du produit scalaire

Afin d’aider aux calculs, on cherche à représenter le produit scalaire de façon matricielle.
Soit pE, x¨, ¨, yq un espace euclidien. Le point de départ pour définir une telle représentation
est le suivant. Supposons que E soit de dimension n P Nzt0u et soit B “ te1 , . . . , en u une base
(quelconque) de E. On a vu au début ¨ ˛ de la¨ ˛ précédente que, si v et w sont deux vecteurs
section
x1 y1
de E de coordonnées respectives ˝ ... ‚ et ˝ ... ‚ dans la base B, alors
˚ ‹ ˚ ‹

xn yn
ÿ
xv, wy “ xi yj xei , ej y.
1ďi,jďn

˛¨ ¨ ˛
x1 y1
˚ .. ‹ ˚ .. ‹
Ecrivons X :“ ˝ . ‚ “ MatB pvq, Y :“ ˝ . ‚ “ MatB pwq et A la matrice pxei , ej yq1ďi,jďn .
xn yn
On a alors
ÿ
xv, wy “ xi yj xei , ej y
1ďi,jďn
ÿ
“ xi xei , ej yyj
1ďi,jďn
˜ ¸
n
ÿ n
ÿ
“ xi xei , ej yyj
i“1 j“1
ÿn
“ xi pAY qi (où pAY qi désigne la ième coordonnée du vecteur colonne AY )
i“1
t
“ XAY

Cette écriture motive la définition suivante :

Définition 2.6.1. On appelle matrice représentative du produit scalaire x¨, ¨y dans la base B la
matrice
¨ ˛
xe1 , e1 y ¨ ¨ ¨ xe1 , en y
˚ .. .. ‹
Matps
B px¨, ¨yq :“ pxei , ej yq1ďi,jďn “˝ . . ‚
xen , e1 y ¨ ¨ ¨ xen , en y

Exemple 2.6.2. • Si Bcan désigne la base canonique de Rn , on a Matps

Bcan px¨, ¨ycan q “ In .

• On a Matps
B px¨, ¨yB q “ In .
36 CHAPITRE 2. ESPACES EUCLIDIENS

• Considérons sur l’espace vectoriel R2 rXs de dimension 3 le produit scalaire x¨, ¨y défini
dans l’exemple 2.2.2 4.. On note B la base t1, X, X 2 u de R2 rXs et on calcule alors
ż1
x1, 1y “ 1 dt “ rts10 “ 1
0
ż1 1
t2
„
1
x1, Xy “ xX, 1y “ t dt “ “
0 2 0 2
ż1 „ 3 1
t 1
1, X 2 “ X 2 , 1 “ t2 dt “
@ D @ D
“
0 3 0 3
ż1 „ 3 1
t 1
xX, Xy “ t2 dt “ “
0 3 0 3
ż1 „ 4 1
t 1
X, X 2 “ X 2 , X t3 dt “
@ D @ D
“ “
0 4 0 4
ż1 „ 5 1
t 1
X 2, X 2 t4 dt “
@ D
“ “
0 5 0 5

Ainsi, ¨ ˛
1 1
1 2 3
Matps
˚ 1 1 1
‹
B px¨, ¨yq “ ˝
˚ ‹
2 3 4 ‚
1 1 1
3 4 5
Remarque 2.6.3. • Attention aux confusions avec la matrice représentative d’une application
linéaire !

• Avec les notations du début de cette section, on a

xv, wy “ t MatB pvqMatps

B px¨, ¨yq MatB pwq,

qui est aussi égal à t MatB pwqMatps

B px¨, ¨yq MatB pvq “ xw, vy car x¨, ¨y est symétrique.

• Comme le produit scalaire est symétrique, on a, pour tous i, j P t1, . . . , nu, xei , ej y “
xej , ei y et la matrice Matps t ps ps
B px¨, ÿq est donc symétrique i.e. MatB px¨, ÿq “ MatB px¨, ÿq.
Le fait que le produit scalaire x¨, ÿ soit “défini” s’exprime dans le fait que MatpsB px¨, ÿq est
inversible. En effet, si on note A :“ Matps B px¨, ÿq et si X est un vecteur colonne de taille
n quelconque tel que AX est le vecteur colonne nul de taille n, alors t XAX “ 0 et donc
xv, vy “ 0 où v désigne le vecteur de coordonnées X dans la base B. Par suite, v “ 0E et
X est donc le vecteur colonne nul. Comme le noyau de la matrice carrée A est réduit au
vecteur colonne nul, A est inversible.

• La base B est orthonormale par rapport au produit scalaire x¨, ¨y si et seulement si

Matps
B px¨, ¨yq “ In .
Ainsi, le corollaire 2.5.7 affirme qu’il existe toujours une base dans laquelle la matrice
représentative du produit scalaire x¨, ¨y est la matrice identité.
2.7. ENDOMORPHISME ADJOINT 37

On peut à présent se demander comment sont reliées les matrices représentatives de x¨, ¨y dans
deux bases (quelconques) différentes, autrement dit s’intéresser à la question du changement de
base pour la matrice représentative d’un produit scalaire.
Soit donc B 1 une autre base de E et considérons la matrice de passage PBÑB1 de la base B
à la base B 1 . On a l’égalité suivante :

Proposition 2.6.4. On a

Matps t ps
B1 px¨, ¨yq “ PBÑB MatB px¨, ¨yq PBÑB
1 1

Démonstration. Soient v, w P E. Comme au début de la section, notons X :“ MatB pvq, Y :“

MatB pwq et A :“ Matps 1 1 1
B px¨, ¨yq. Notons ensuite X :“ MatB1 pvq, Y :“ MatB1 pwq et A :“
ps
MatB1 px¨, ¨yq.
On a X 1 “ PB1 ÑB X “ PBÑB1 ´1 X ô X “ PBÑB1 X 1 et Y 1 “ PB1 ÑB Y “ PBÑB1 ´1 Y ô Y “
PBÑB1 Y 1 . Ainsi,
t
xv, wy “ XAY
t
` ˘ ` ˘
“ PBÑB1 X 1 A PBÑB1 Y 1
“ t X 1 t PBÑB1 A PBÑB1 Y 1 .
` ˘

Remarquons maintenant que, si M “ pmi j q1ďi,jďn est une matrice carrée de taille n quel-
conque et si, pour i P t1, . . . , nu, Xi désigne le vecteur colonne avec coordonnées 1 à la ligne i
et 0 sur les autres lignes, on a, pour tous i, j P t1, . . . , nu, t Xi M Xj “ mi j . ´ ¯
Soient alors i, j P t1, . . . , nu et notons B 1 “ te11 , . . . , e1n u. On a MatB1 pe1i q “ Xi et MatB1 e1j “
Xj et, par l’égalité ci-dessus,
@ 1 1 D t `t ˘
ei , ej “ Xi PBÑB1 A PBÑB1 Xj .

Autrement dit, le coefficient à la ligne i et la colonne j de la matrice A1 est égal au coefficient

à la ligne i et la colonne j de la matrice t PBÑB1 A PBÑB1 . Par conséquent, A1 “ t PBÑB1 A PBÑB1 .

Remarque 2.6.5. Attention à ne surtout pas confondre ce changement de base pour les produits
scalaires avec le changement de base pour les applications linéaires.

2.7 Endomorphisme adjoint

Soit pE, x¨, ¨yq un espace euclidien et soit f un endomorphisme de E.
Proposition et Définition 2.7.1. Il existe une et une seule application f ˚ : E Ñ E tel que,
pour tous vecteurs v et w de E,

xf pvq, wy “ xv, f ˚ pwqy .

De plus, f ˚ est une application linéaire (et donc un endomorphisme de E). On appelle f ˚
l’endomorphisme adjoint de f .
38 CHAPITRE 2. ESPACES EUCLIDIENS

Démonstration. On montre l’existence de f ˚ en utilisant l’isomorphisme canonique entre E et

E ˚ du théorème 2.4.1. Soit w P E, on considère l’application

E Ñ R
ϕw :
v ÞÑ xf pvq, wy

Cette application est linéaire car f l’est et ϕw est donc un élément du dual E ˚ de E. D’après
le théorème 2.4.1, il existe donc un unique vecteur f ˚ pwq de E tel que ϕw “ Λ pf ˚ pwqq i.e. tel
que, pour tout v P E,

xf pvq, wy “ ϕw pvq “ Λ pf ˚ pwqq pvq “ xf ˚ pwq, vy “ xv, f ˚ pwqy .

On note alors f ˚ l’application qui à tout vecteur w de E associe f ˚ pwq. L’unicité évoquée ci-
dessus montre l’unicité de l’application f ˚ : E Ñ E telle que, pour tous v, w P E, xf pvq, wy “
xv, f ˚ pwqy.
Montrons à présent sa linéarité : soient w1 , w2 P E et λ, µ P R alors, pour tout v P E,

xv, f ˚ pλw1 ` µw2 qy “ xf pvq, λw1 ` µw2 y

“ λ xf pvq, w1 y ` µ xf pvq, w2 y
“ λ xv, f ˚ pw1 qy ` µ xv, f ˚ pw2 qy
“ xv, λf ˚ pw1 q ` µf ˚ pw2 qy

Ainsi, Λ pf ˚ pλw1 ` µw2 qq “ Λ pλf ˚ pw1 q ` µf ˚ pw2 qq. Par injectivité de l’application Λ, on ob-
tient alors l’égalité f ˚ pλw1 ` µw2 q “ λf ˚ pw1 q ` µf ˚ pw2 q et f ˚ est donc bien linéaire.

Avant d’étudier le pendant matriciel de cette opération d’“adjonction” des endomorphismes

de E, on en montre quelques propriétés de base :

Proposition 2.7.2. 1. pIdE q˚ “ IdE .

2. Si g P LpEq et λ, µ P R, pλf ` µgq˚ “ λf ˚ ` µg ˚ et pg ˝ f q˚ “ f ˚ ˝ g ˚ .

` ˘˚
3. Si f est une application bijective, son adjoint f ˚ l’est également et pf ˚ q´1 “ f ´1 .

4. pf ˚ q˚ “ f .

Démonstration. 1. Pour tous v, w P E, on a xIdE pvq, wy “ xv, wy “ xv, IdE pwqy donc
˚
pIdE q “ IdE (par unicité de l’adjoint).

2. Pour tous v, w P E, on a

xpλf ` µgq pvq, wy “ λ xf pvq, wy ` µ xgpvq, wy

“ λ xv, f ˚ pwqy ` µ xv, g ˚ pwqy
“ xv, pλf ˚ ` µg ˚ q pwqy

donc pλf ` µgq˚ “ λf ˚ ` µg ˚ .

2.7. ENDOMORPHISME ADJOINT 39

Pour tous v, w P E, on a

xg ˝ f pvq, wy “ xg pf pvqq , wy
“ xf pvq, g ˚ pwqy
“ xv, f ˚ pg ˚ pwqqy
“ xv, f ˚ ˝ g ˚ pwqy

donc pg ˝ f q˚ “ f ˚ ˝ g ˚ .
` ˘˚ ` ˘˚ ` ˘˚ ` ˘˚
3. On a f ˚ ˝ f ´1 “ f ´1 ˝ f “ pIdE q˚ “ IdE et f ´1 ˝ f ˚ “ f ˝ f ´1 “ pIdE q˚ “
IdE .

4. Pour tous v, w P E, on a

xf ˚ pvq, wy “ xw, f ˚ pvqy

“ xf pwq, vy
“ xv, f pwqy

donc pf ˚ q˚ “ f .

Remarque 2.7.3. On dit que l’endomorphisme f est auto-adjoint si f ˚ “ f . IdE est un exemple
d’endomorphisme auto-adjoint de E.
Donnons également deux égalités intéressantes reliant noyaux et images de f et de son
adjoint via l’opération “orthogonal d’un sous-ensemble” :

Proposition 2.7.4. On a Ker f ˚ “ pIm f qK et Im f ˚ “ pKer f qK

Démonstration. Soit w P E. Supposons que w P Ker f ˚ . Alors, pour tout v P E,

xf pvq, wy “ xv, f ˚ pwqy “ xv, 0y “ 0

donc w P pIm f qK . Réciproquement, si w P pIm f qK alors, pour tout v P E,

xv, f ˚ pwqy “ xf pvq, wy “ 0,

en particulier xf ˚ pwq, f ˚ pwqy “ 0 donc f ˚ pwq “ 0E i.e. w P Ker f ˚ .

Pour montrer la seconde égalité, on utilise l’égalité précédente ainsi que la proposition 2.3.7
3) et la proposition 2.7.2 3) :
´ ¯K
Im f ˚ “ pIm f ˚ qK
˘K
“ Ker pf ˚ q˚
`

“ pKer f qK
40 CHAPITRE 2. ESPACES EUCLIDIENS

Intéressons-nous à présent à la représentation matricielle des endomorphismes adjoints, plus

précisément à leur représentation dans une base orthonormale de pE, x¨, ¨yq :

Proposition 2.7.5. Soit B “ te1 , . . . , en u une base orthonormale de E. Alors

MatB pf ˚ q “ t MatB pf q.

Démonstration. Pour tous v, w P E, on a, puisque la base B est orthonormale et d’après la

définition de l’adjoint,

xf pvq, wy “ xv, f ˚ pwqy ô t pMatB pf qMatB pvqq MatB pwq “ t MatB pvq pMatB pf ˚ q MatB pwqq

i.e.
t
MatB pvq t MatB pf q MatB pwq “ t MatB pvq MatB pf ˚ q MatB pwq
En prenant pour v et w les vecteurs de la base B, on obtient, pour tous i, j P t1, . . . , nu l’égalité
t
Xi t MatB pf qXj “ t Xi MatB pf ˚ q Xj

(voir la démonstration de la proposition 2.6.4) et on a donc bien t MatB pf q “ MatB pf ˚ q.

Deux conséquences directes de la représentation matricielle dans une base orthonormale de

l’“adjonction” par la transposition sont les suivantes :

Corollaire 2.7.6. Le rang de l’adjoint f ˚ de f est égal au rang de f et le déterminant de f ˚

est égal au déterminant de f .

Démonstration. Soit B une base orthonormale de E alors

rg pf ˚ q “ rg pMatB pf ˚ qq “ rg t MatB pf q “ rg pMatB pf qq “ rg pf q

` ˘

et
det pf ˚ q “ det pMatB pf ˚ qq “ det t MatB pf q “ det pMatB pf qq “ det pf q .
` ˘

La proposition 2.7.5 nous donne également une nouvelle interprétation vectorielle de la

transposition matricielle : si A est une matrice carrée de Mn pRq, représentant un endomorphisme
f de Rn dans la base canonique, alors t A est la matrice représentative de l’endomorphisme f ˚
adjoint de f par rapport au produit scalaire canonique (pour lequel la base canonique est une
base orthonormale).
Cette remarque nous invite à rechercher un lien entre les interprétations “duale” (proposition
1.6.4) et “euclidienne” de la transposition matricielle. Un tel lien est induit par la relation
suivante :

Proposition 2.7.7. On a
f ˚ “ Λ´1 ˝ tf ˝ Λ.
2.8. ENDOMORPHISMES ORTHOGONAUX ET MATRICES ORTHOGONALES 41

Démonstration. Pour tous vecteurs v et w de E, on a

xf pvq, wy “ pΛpwq ˝ f q pvq “ tf pΛpwqq pvq “ tf ˝ Λpwq pvq
` ˘

et
xv, f ˚ pwqy “ pΛ pf ˚ pwqqq pvq “ pΛ ˝ f ˚ pwqq pvq,
d’où l’égalité tf ˝ Λ “ Λ ˝ f ˚ et le résultat (Λ est un isomorphisme).

Corollaire 2.7.8. Soit B une base orthonormale de E. Alors

MatB pf ˚ q “ MatB˚ tf .
` ˘

Démonstration. D’après la propriété précédente, on a

MatB pf ˚ q “ MatB,B˚ pΛq´1 MatB˚ tf MatB,B˚ pΛq .
` ˘

¨ ˛
x1
˚ .. ‹
Or, si i P t1, . . . , nu et si v est un vecteur de E de coordonnées ˝ . ‚ dans B, on a
xn
C G
ÿn ÿn
Λpei qpvq “ ei , xj ej “ xj xei , ej y “ xi “ e˚i pvq
j“1 j“1

donc Λpei q “ e˚i et la matrice représentative de Λ dans les bases B et B ˚ est la matrice identité
In . Ainsi, on a bien
MatB pf ˚ q “ MatB˚ tf .
` ˘

˚
`t ˘2.7.9. La proposition 2.7.7 nous donne une raison “intrinsèque” de l’égalité MatB pf q “
Remarque
MatB˚ f que l’on pouvait déjà obtenir à partir de la proposition 2.7.5.

2.8 Endomorphismes orthogonaux et matrices orthogonales

Soit pE, x¨, ¨yq un espace euclidien de dimension n P Nzt0u et soit f un endomorphisme de
E.
Définition 2.8.1. On dit que f est un endomorphisme orthogonal de E si f ˚ ˝ f “ IdE .
Exemple 2.8.2. L’identité IdE de E est un endomorphisme orthogonal.
Remarque 2.8.3. Si f est orthogonal alors f est bijectif et f ´1 “ f ˚ . En effet, l’égalité f ˚ ˝ f “
IdE implique l’injectivité de f (si v P E vérifie f pvq “ 0E alors v “ f ˚ pf pvqq “ 0E ) et donc
sa bijectivité car f est une application linéaire de E dans E. L’égalité f ˚ ˝ f “ IdE est alors
équivalente à f ˚ “ f ´1 . En particulier, on a également l’égalité f ˝ f ˚ “ IdE .
Remarquons que, réciproquement, l’égalité f ˝ f ˚ “ pf ˚ q˚ ˝ f ˚ “ IdE implique f ˚ ˝ pf ˚ q˚ “
f ˚ ˝ f “ IdE .
On déduit également de ces considérations que f est orthogonal ssi son adjoint f ˚ est
orthogonal.
42 CHAPITRE 2. ESPACES EUCLIDIENS

L’orthogonalité d’un endomorphisme se caractérise géométriquement :

Proposition 2.8.4. f est un endomorphisme orthogonal si et seulement si f conserve le produit

scalaire x¨, ÿ si et seulement si f conserve la norme euclidienne }¨} associée à x¨, ÿ si et seulement
si f conserve la distance euclidienne d associée à x¨, ÿ.

Démonstration. On montre que les assertions

1. f est orthogonal,

2. pour tous v, w P E, xf pvq, f pwqy “ xv, wy,

3. pour tout v P E, }f pvq} “ }v},

4. pour tous v, w P E, d pf pvq, f pwqq “ dpv, wq,

sont équivalentes.
Montrons tout d’abord 1 ñ 2 : supposons que f est orthogonal, alors, pour tous v, w P E,

xf pvq, f pwqy “ xv, f ˚ ˝ f pwqy “ xv, wy.

Montrons ensuite 2 ñ 3 : si f préserve le produit scalaire x¨, ¨y, alors, pour tout v P E,
a a
}f pvq} “ xf pvq, f pvqy “ xv, vy “ }v}.

Montrons également 3 ñ 4 : si f préserve la norme euclidienne associé à x¨, ¨y, alors, pour
tous v, w P E,

d pf pvq, f pwqq “ }f pwq ´ f pvq} “ }f pw ´ vq} “ }w ´ v} “ dpv, wq.

Montrons enfin 4 ñ 1 : Commençons par remarquer que 4 ñ 3 ñ ` 2 car f est linéaire et,˘
pour tout u P E, dpu, 0q “ }u} et, pour tous v, w P E, xv, wy “ 21 }v ` w}2 ´ }v}2 ´ }w}2
(remarque 2.2.8). Si f préserve la distance euclidienne, f préserve donc également le produit
scalaire et, pour tous v, w P E, on a alors

xf ˚ ˝ f pvq, wy “ xf pvq, f pwqy “ xv, wy

et donc xf ˚ ˝ f pvq ´ v, wy “ 0. En particulier, pour tout v P E, xf ˚ ˝ f pvq ´ v, f ˚ ˝ f pvq ´ vy “

0 donc f ˚ ˝ f pvq ´ v “ 0E i.e. f ˚ ˝ f pvq “ v. Ainsi f ˚ ˝ f “ IdE et f est orthogonal.

Remarque 2.8.5. Un endomorphisme orthogonal est également appelé isométrie.

Une autre caractérisation d’un endomorphisme orthogonal est qu’il transforme toute base
orthonormale en une base orthonormale :

Proposition 2.8.6. L’endomorphisme f est orthogonal si et seulement si f associe à toute

base orthonormale de E une base orthonormale de E.
2.8. ENDOMORPHISMES ORTHOGONAUX ET MATRICES ORTHOGONALES 43

Démonstration. Supposons que f est orthogonal et soit te1 , . . . , en u une base orthonormale de
E. Comme f est orthogonal, on a, par la proposition précédente, xf pei q, f pej qy “ xei , ej y “ δi j ,
donc la famille de n vecteurs tf pe1 q, . . . , f pen qu est orthonormale : il s’agit donc d’une base
orthonormale de E.
Réciproquement, soit B “ te1 , . . . , en u une base orthonormale de E et supposons que la
famille
¨ ˛ tf¨ pe1 q,˛. . . , f pen qu est orthonormale. Soient alors v, w P E, de coordonnées respectives
x1 y1
˚ .. ‹ ˚ .. ‹
˝ . ‚ et ˝ . ‚ dans la base B. On a
xn yn
C ˜ ¸ ˜ ¸G
n
ÿ n
ÿ ÿ n
ÿ
xf pvq, f pwqy “ f xi e i ,f yj ej “ xi yj xf pei q, f pej qy “ xi yi “ xv, wy.
i“1 j“1 1ďi,jďn i“1

Par la proposition précédente, f est donc orthogonal.

Remarque 2.8.7. Remarquons que, d’après la démonstration ci-dessus, il suffit qu’il existe une
base orthonormale te1 , . . . , en u de E telle que la famille tf pe1 q, . . . , f pen qu soit orthonormale
pour que l’endomorphisme f soit orthogonal.
Passons maintenant à la caractérisation matricielle de l’orthogonalité. Soit B une base
orthonormale de E.

Proposition 2.8.8. Soit A :“ MatB pf q la matrice représentative de f dans la base B. L’endo-

morphisme f de E est orthogonal si et seulement si t AA “ In .

Démonstration. D’après la proposition 2.7.5, la matrice représentative de l’adjoint f ˚ de f dans

B est t A et donc f ˚ ˝ f “ IdE ssi t AA “ In

Ce résultat motive la définition suivante :

Définition 2.8.9. On dit qu’une matrice A de Mn pRq est orthogonale si t AA “ In .

Remarque 2.8.10. L’endomorphisme f de E est donc orthogonal si et seulement si la matrice

MatB pf q est orthogonale. « Réciproquement », une matrice A de Mn pRq est orthogonale ssi
l’endomorphisme de Rn représenté par f dans la base canonique est orthogonal
Exemple 2.8.11.

1. La matrice ¨ ˛
2 ´1 2
1
A :“ ˝ 2 2 ´1‚
3
´1 2 2
est orthogonale.

2. Une symétrie orthogonale est un endomorphisme orthogonal (remarque 2.3.14). Une pro-
jection orthogonale sur un sous-espace vectoriel strict n’est pas un endomorphisme ortho-
gonal (remarque 2.3.9).
44 CHAPITRE 2. ESPACES EUCLIDIENS

Un point de vue supplémentaire donné par l’égalité “ t AA “ In ” est le suivant : une matrice
A P Mn pRq est orthogonale si et seulement si les vecteurs colonnes la composant forment une
base orthonormale de Rn muni du produit scalaire canonique. Dans ce cas, la matrice A est la
matrice de passage de la base canonique de Rn à la base orthonormale formée par ses vecteurs
colonnes. On peut généraliser cela de la façon suivante :

Proposition 2.8.12. Soit B 1 une base de E. Alors B 1 est orthonormale si et seulement si la

matrice de passage de B à B 1 est orthogonale.

Démonstration. La matrice de passage P :“ PBÑB1 de B “ te1 , . . . , en u à B 1 “ te11 , . . . , e1n u est

formée, dans l’ordre, des vecteurs coordonnées des vecteurs e1i , i “ 1, . . . , n, dans la base B. On
a alors, comme B est orthonormale,
¨ 1 1 ˛
xe1 , e1 y ¨ ¨ ¨ xe11 , e1n y
t
P P “ ˝ ... .. ‹
˚
. ‚
xe1n , e11 y ¨ ¨ ¨ xe1n , e1n y

Ainsi, la matrice de passage P “ PBÑB1 est orthogonale ssi la famille de vecteurs te11 , . . . , e1n u
est orthonormale.

Remarque 2.8.13. En particulier, toute matrice de passage d’une base orthonormale à une autre
est orthogonale.
Remarquons ensuite que l’égalité “ t AA “ In ” permet le calcul du déterminant d’une matrice
orthogonale et donc d’un endormorphisme orthogonal :

Proposition et Définition 2.8.14. Soit A une matrice orthogonale de Mn pRq. Alors detpAq “
1 ou detpAq “ ´1. Ainsi, si f est orthogonal, det pf q “ 1 ou det pf q “ ´1.
Si detpAq “ 1, resp. det pf q “ 1, on dit que A, resp. f , est une matrice orthogonale directe,
resp. endomorphisme orthogonal direct. Si detpAq “ ´1, resp. det pf q “ ´1, on dit que A, resp.
f , est une matrice orthogonale indirecte, resp. endomorphisme orthogonal indirect.

Démonstration. On a tAA “ In donc 1 “ det tAA “ det tA detpAq “ pdetpAqq2 d’où

` ˘ ` ˘

detpAq “ 1 ou detpAq “ ´1
Ainsi, si f est orthogonal, comme sa matrice représentative dans une base orthonormale est
orthogonale (proposition 2.8.8), on a det pf q “ 1 ou det pf q “ ´1.

Exemple 2.8.15. 1. La matrice orthogonale A de l’exemple 2.8.11 1. est directe.

2. Une symétrie orthogonale par rapport à un sous-espace vectoriel F de E est directe ou

indirecte suivant la parité de la “codimension” de F : le déterminant d’une telle symétrie
orthogonale est p´1qn´p si p est la dimension de F (remarque 2.3.14).
Terminons cette section en remarquant que l’ensemble des endomorphismes orthogonaux de
E muni de la composition forme un groupe. On a déjà vu plus haut que l’identité IdE de E est
orthogonale et que, si f est un endomorphisme orthogonal, il en est de même pour son adjoint.
Enfin, la composition d’endomorphismes orthogonaux est également orthogonale :
2.9. DÉCOMPOSITION QR D’UNE MATRICE INVERSIBLE 45

Proposition 2.8.16. Soit g un endomorphisme de E et supposons que f et g sont orthogonaux.

Alors la composition f ˝ g (ainsi que la composition g ˝ f ) est orthogonale.

Démonstration. On a pf ˝ gq˚ ˝ pf ˝ gq “ g ˚ ˝ f ˚ ˝ f ˝ g “ g ˚ ˝ IdE ˝ g “ g ˚ ˝ g “ IdE .

Corollaire et Définition 2.8.17. L’ensemble, noté O pE, x¨, ÿq ou simplement OpEq lorsque
le contexte est clair, des endomorphismes orthogonaux de l’espace euclidien pE, x¨, ÿq est un
sous-groupe du groupe pGLpEq, ˝q des automorphismes linéaires de E muni de la composition
(appelé groupe linéaire de E). On a appelle pOpEq, ˝q le groupe orthogonal de pE, x¨, ÿq.

De manière équivalente, l’ensemble On pRq des matrices orthogonales de Mn pRq est un sous-
groupe du groupe pGLn pRq, ¨q des matrices réelles inversibles de taille n muni du produit ma-
triciel. On pRq est appelé groupe orthogonal de Mn pRq.
Remarque 2.8.18. Le sous-ensemble de OpEq des endomorphismes orthogonaux directs est un
sous-groupe de pOpEq, ˝q appelé groupe spécial orthogonal de E et noté SOpEq.
Le sous-ensemble de On pRq des matrices orthogonales directes est un sous-groupe de pOn pRq, ¨q
appelé groupe spécial orthogonal de Mn pRq et noté SOn pRq.

2.9 Décomposition QR d’une matrice inversible

Soit à nouveau pE, x¨, ¨yq un espace euclidien.
Pour terminer ce chapitre, revenons au procédé d’orthonormalisation de Gram-Schmidt
(théorème 2.5.4). Ce procédé permet notamment de construire, à partir d’une base tv1 , . . . , vn u
quelconque de E, une base orthonormale te1 , . . . , en u de E.

Nous allons étudier le pendant matriciel de ce procédé. Précisément, soit n P Nzt0u et

considérons une matrice A de Mn pRq de rang maximal (i.e. rgpAq “ n) i.e. A P GLn pRq.
Notons v1 , . . . , vn les vecteurs colonnes qui, dans l’ordre, forment la matrice A. La famille
B 1 :“ tv1 , . . . , vn u, considérée comme famille de vecteurs de Rn , est une base de Rn : si B0
désigne la base canonique de Rn , A est alors la matrice de passage PB0 ÑB . Notons ensuite
B 1 “ te1 , . . . , en u la base orthonormale de Rn (par rapport au produit scalaire canonique)
obtenue à partir du procédé d’orthonormalisation de Gram-Schmidt. On note P :“ PBÑB1 la
matrice de passage de la base tv1 , . . . , vn u à la base te1 , . . . , en u de E.
Dans le procédé de Gram-Schmidt, pour k P t1, . . . , nu, le vecteur ek est défini comme
une combinaison linéaire des vecteurs tv1 , . . . , vk u. En particulier, la matrice de passage P est
triangulaire supérieure. De par cette construction, on sait même que les coefficients diagonaux
de P sont (strictement) positifs.
Enfin, si Q désigne la matrice de passage de B0 à B 1 (i.e. Q est la matrice formée, dans
l’ordre, par les vecteurs colonnes e1 , . . . , en ), on a Q “ AP (PB0 ÑB1 “ PB0 ÑB PBÑB1 ). On réécrit
cette égalité sous la forme A “ QR avec R :“ P ´1 “ PB1 ÑB . Remarquons enfin que, comme
les vecteurs colonnes de la matrice Q forment une base orthonormale de Rn (par rapport au
produit scalaire canonique), Q est orthogonale.
Au total, nous avons (partiellement) montré le résultat suivant :
46 CHAPITRE 2. ESPACES EUCLIDIENS

Théorème 2.9.1 (Décomposition QR d’une matrice inversible). Soit n P Nzt0u et soit A P

GLn pRq. Il existe une unique matrice orthogonale Q P On pRq et une unique matrice R P GLn pRq
triangulaire supérieure à coefficients diagonaux strictement positifs telles que A “ QR. On
appelle cette écriture la décomposition QR de A.

Démonstration. Il nous reste à montrer l’unicité de la décomposition. Soient donc Q1 , Q2 P

On pRq et R1 , R2 deux matrices triangulaires supérieures de GLn pRq à coefficients diagonaux
strictement positifs telles que A “ Q1 R1 “ Q2 R2 .
On a alors R1 R2´1 “ Q´1 ´1 ´1
1 Q2 et R1 R2 “ Q1 Q2 est alors une matrice orthogonale (pOn pRq, ¨q
est un groupe) et triangulaire supérieure à coefficients strictement positifs (l’inverse d’une ma-
trice triangulaire supérieure à coefficients strictement positifs est une matrice triangulaire su-
périeure à coefficients strictement positifs). Il s’agit donc de la matrice In d’après le lemme qui
suit cette preuve.
Ainsi, R1 R2´1 “ Q´11 Q2 “ In et donc Q1 “ Q2 et R1 “ R2 .

Lemme 2.9.2. Soit A P GLn pRq une matrice orthogonale et triangulaire supérieure à coeffi-
cients strictement positifs. Alors A “ In .

Démonstration. Notons v1 , . . . , vn les vecteurs colonnes qui, dans l’ordre, forment la matrice
A “ pai j q1ďi,jďn . Le fait que A soit orthogonale signifie que, pour tout i, j P t1, . . . , nu, xvi , vj y “
δi j . En particulier, xv1 , v1 y “ 1. Mais, comme A est triangulaire supérieure, xv1 , v1 y “ a21 1 et,
comme a1 1 est strictement positif, on a nécessairement a1 1 “ 1. Pour tout j P t2, . . . , nu, on a
alors xv1 , vj y “ a1 j “ 0 (autrement dit, la première ligne n’a que des coefficients nuls sauf le
coefficient a1 1 qui est égal à 1).
Soit k P t1, n ´ 1u et supposons que l’on a déjà montré que, pour tout i P t1, . . . , ku et tout
j P t1, . . . , nu, ai j “ δi j (autrement dit que pour les k premières lignes, tous les coefficients
d’une ligne i donnée sont nuls sauf le coefficient ai i qui est égal à 1). On considère alors le
vecteur colonne vk`1 dont, par hypothèse de récurrence, la seule coordonnée non nulle est
ak`1 k`1 ą 0. Comme xvk`1 , vk`1 y “ ak`1 k`1 2 “ 1, on a ak`1 k`1 “ 1 et, par suite, pour tout
j P tk ` 2, . . . , nu, xvk`1 , vj y “ ak`1 j “ 0 : la ligne k ` 1 n’a donc que des coefficients nuls sauf
le coefficient ak`1 k`1 qui est égal à 1.

Exemple 2.9.3. Considérons la matrice

¨ ˛
1 1 0
A :“ ˝1 2 0‚
0 0 1

de M3 pRq. On note v1 :“ p1, 1, 0q, v2 :“ p1, 2, 0q, v3 :“ p0, 0, 1q P R3 et on applique le procédé

2.9. DÉCOMPOSITION QR D’UNE MATRICE INVERSIBLE 47

d’orthonormalisation de Gram-Schmidt à la base tv1 , v2 , v3 u de R3 . On pose

1 :“ v1 “ p1, 1, 0q
ˆ ˙
xv2 , 1 y 3 1 1 1
2 :“ v2 ´ 1 “ v2 ´ 1 “ ´ , , 0 “ p´1, 1, 0q
}1 }2 2 2 2 2
1
2 :“ p´1, 1, 0q
xv3 , 1 y xv3 , 12 y 1
3 :“ v3 ´ 1 ´ “ v3 “ p0, 0, 1q
}1 }2 }12 }2 2
1 1
e1 :“ 1 “ ? p1, 1, 0q
}1 } 2
1 1 1
e2 :“ “ ? p´1, 1, 0q
}12 } 2 2
1
e3 :“ 3 “ p0, 0, 1q
}3 }

Comme
?
v1 “ 1 “ 2e1
3 3 1 3 1
v2 “ 1 ` 2 “ 1 ` 12 “ ? e1 ` ? e2
2 2 2 2 2
v3 “ 3 “ e3

la matrice de passage de la base te1 , e2 , e3 u à la base tv1 , v2 , v3 u est

¨? ˛
2 ?32 0
R :“ ˝ 0 ?12 0‚
˚ ‹
0 0 1

Si on note Q la matrice ¨ ˛
?1 ´ ?12 0
˚ ?12 ?1 0‚
‹
˝ 2 2
0 0 1
formée par les coordonnées (dans la base canonique de R3 ) des vecteurs e1 , e2 , e3 , l’égalité
¨ 1 ˛ ¨? ˛
? ´ ?1 0 2 ?3 0
˚ 2 2 2
A “ QR “ ˝ ?12 ?1 0 0 ?1 0‚
‹˚ ‹
2 2
‚ ˝
0 0 1 0 0 1

est la décomposition QR de A.
48 CHAPITRE 2. ESPACES EUCLIDIENS
Chapitre 3

Rappels et compléments sur la

réduction des endomorphismes

3.1 Introduction
On donne dans ce chapitre des rappels sur la théorie de réduction des endomorphismes,
c’est-à-dire l’étude des bases dans lesquelles un endomorphisme donné possède la représentation
matricielle la plus “simple” possible (la plus “réduite” possible).
On étudiera notamment les critères nécessaires et suffisants classiques de diagonalisabilité,
directs (via la recherche des espaces propres) ou via les polynômes d’endomorphismes. On
étudiera également la triangularisabilité et la réduction la plus aboutie des endomorphismes
triangularisables, à savoir la réduction de Jordan pour laquelle nous donnerons une méthode
systématique de réduction.
La première partie de ce chapitre étant constituée de rappels, les assertions seront la plupart
du temps données sans preuve (on renvoie au cours de l’année passée pour les démonstrations).
Nous les illustrerons cependant, ainsi que les méthodes, par des exemples. La preuve de l’exis-
tence de la réduction de Jordan pour les endomorphismes triangularisables sera elle donnée,
notamment afin de dégager une méthode systématique de réduction.
Tout au long de ce chapitre, K désigne un corps commutatif quelconque et E désigne un
espace vectoriel sur K de dimension finie.

3.2 Valeurs propres et espaces propres

Soit f un endomorphisme de E.
Définition 3.2.1. Soit λ P K. On dit que λ est une valeur propre de f s’il existe un vecteur
non nul v de E tel que f pvq “ λv ô pf ´ λIdE q pvq “ 0E , autrement dit si l’endomorphisme
f ´ λIdE n’est pas injectif.
Si λ P K est une valeur propre de f , on note Eλ :“ Ker pf ´ λIdE q : il s’agit d’un sous-
espace vectoriel de E que l’on appelle sous-espace propre de f associé à la valeur propre λ et
tout vecteur non nul de Eλ est appelé vecteur propre de f associé à la valeur propre λ. On dira

49
50 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

qu’un vecteur v de E est un vecteur propre de f s’il existe une valeur propre λ P K de f telle
que v est un vecteur propre de f associé à λ.
Exemple 3.2.2. 2 est une valeur propre de l’endomorphisme

R2 Ñ R2
f:
px, yq ÞÑ px ` 2y, ´x ` 4yq

car, par exemple, f p2, 1q “ p4, 2q “ 2p2, 1q, et on a

E2 “ Ker pf ´ 2 IdR2 q “ px, yq P R2 | x “ 2y .

(

Soit n P Nzt0u et soit A une matrice carrée de Mn pKq. On peut, de façon analogue, définir une
notion de valeur propre, d’espace propre et de vecteur propre pour A : un scalaire λ P K est une
valeur propre de A s’il existe un vecteur colonne non nul X de Mn,1 pKq tel que AX “ λX, autre-
ment dit si le sous-espace vectoriel Eλ :“ Ker pA ´ λIn q de Mn,1 pKq n’est pas réduit au vecteur
colonne nul, et, dans ce cas, Eλ est appelé sous-espace propre de A associé à la valeur propre λ
et tout vecteur colonne non nul de Eλ est appelé vecteur propre de A associé à la valeur propre λ.
Remarque 3.2.3. Supposons que dimpEq “ n et soit B une base de E. Soient λ P K et v P E. Si
A “ MatB pf q, alors λ est une valeur propre de f ssi λ est une valeur propre de A et, dans ce
cas, v est un vecteur propre de f associé à λ ssi MatB pvq est un vecteur propre de A associé à
λ.

Définition 3.2.4. L’ensemble des valeurs propres de f , resp. A, dans K est appelé spectre de f ,
resp. spectre de A, et noté Sppf q, resp. SppAq.

3.3 Polynôme caractéristique

Soient f P LpEq et λ P K.

Proposition 3.3.1. λ est une valeur propre de f ssi det pf ´ λIdE q “ 0.

On note χf le polynôme
det pf ´ XIdE q P KrXs,
appelé polynôme caractéristique de f . Ainsi, λ P Sppf q ssi λ est une racine (dans K) de χpf q.
Exemple 3.3.2. Reprenons l’endomorphisme f de l’exemple 3.2.2. La matrice représentative de
f dans la base canonique de R2 est ˆ ˙
1 2
´1 4
et donc
ˆˆ ˙ ˙ ˆ ˙
1 2 1´X 2
χf “ det pf ´ XIdE q “ det ´ XI2 “ det “ p3 ´ Xqp2 ´ Xq
´1 4 ´1 4´X

d’où Sppf q “ t2; 3u.

3.4. DIAGONALISABILITÉ ET DIAGONALISATION 51

Soit A P Mn pKq, on définit de façon analogue χA :“ det pA ´ XIn q P KrXs et le spectre de

A est alors l’ensemble des racines de χA dans K.
Remarque 3.3.3. Attention au corps de base : si l’on considère par exemple la matrice
ˆ ˙
0 1
A :“ ,
´1 0
on a ˆ ˙
´X 1
χA “ det “ X 2 ` 1.
´1 ´X
Ainsi, si A est considérée comme une matrice de Mn pCq, on a SppAq “ SpC pAq “ t´i; iu, et si
A est considérée comme une matrice de Mn pRq, on a SppAq “ SpR pAq “ H.
Corollaire 3.3.4. Si n “ dimpEq, le polynôme χf P KrXs est de degré n et f possède donc au
plus n valeurs propres distinctes.
De la même façon A possède au plus n valeurs propres distinctes.
Remarque 3.3.5. D’après le théorème de d’Alembert-Gauss, tout polynôme de CrXs est scindé.
Ainsi, tout endomorphisme sur C admet au moins une valeur propre.

3.4 Diagonalisabilité et diagonalisation

Soit f P LpEq. On note n :“ dimpEq.
La forme “la plus simple” pour une matrice carrée est la forme diagonale. Nous allons rappe-
ler dans cette section des conditions suffisantes, voire nécessaires et suffisantes, sous lesquelles
f possède une matrice représentative diagonale (diagonalisabilité) et, dans ce cas, chercher à
déterminer une base de E dans laquelle la matrice représentative de f est diagonale (diagona-
lisation).
On commence par donner la définition précise de la diagonalisabilité de f :
Définition 3.4.1. On dit que l’endomorphisme f est diagonalisable s’il existe une base B de E
et des scalaires λ1 , . . . , λn P K tels que
¨ ˛
λ1 0
MatB pf q “ ˝
˚ .. ‹
. ‚
0 λn

Remarquons que f est donc diagonalisable ssi il existe une base de E formée de vecteurs
propres de f . Mais on peut énoncer une caractérisation plus précise et pratique. Pour cela,
commençons par énoncer le fait suivant :
Proposition 3.4.2. Soient λ1 , . . . , λk , k P Nzt0u, des valeurs propres deux à deux distinctes
de f . Alors les sous-espaces propres Eλ1 , . . . , Eλk correspondants sont en somme directe.
En conséquence, si λ1 , . . . , λp , p P N, désignent les valeurs propres deux à deux distinctes de
f :
52 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

p
ÿ
Théorème 3.4.3. f est diagonalisable ssi Eλ1 ‘ ¨ ¨ ¨ ‘ Eλn “ E ssi dim pEλi q “ dimpEq.
i“1

Exemple 3.4.4. Reprenons l’endomorphisme f des ( exemples 3.2.2 et 3.3.2. On avait déterminé
2
que Sppf q “ t2; 3u et E2 “ px, yq P R | x “ 2y “ Vecttp2, 1qu. Enfin,

E3 “ Ker pf ´ 3 IdR2 q “ px, yq P R2 | x “ y “ Vecttp1, 1qu.

(

` ˘
Ainsi, dim pE1 q ` dim pE2 q “ 2 “ dim R2 et f est donc diagonalisable. De plus, la famille
B :“ tp2, 1q, p1, 1qu est une base de E formée de vecteurs propres de f et on a
ˆ ˙
2 0
MatB pf q “
0 3

(on dit qu’on a diagonalisé f ).

Remarque 3.4.5. Diagonaliser un endomorphisme diagonalisable f de E, c’est déterminer une
base B de E dans laquelle la matrice représentative de f est diagonale et exprimer MatB pf q.
On peut également exprimer la condition sur les dimensions du théorème 3.4.3 à l’aide du
polynôme caractéristique et plus particulièrement à l’aide des multiplicités des valeurs propres
en tant que racines du polynôme caractéristique :

Définition 3.4.6. Soit λ P K une valeur propre de f . On note mλ la multiplicité de λ en tant

que racine du polynôme χf P KrXs.

On peut tout de suite remarquer que, si λ1 , . . . , λp désignent les valeurs propres de f , alors
la somme mλ1 ` ¨ ¨ ¨ ` mλp est inférieure ou égale à deg pχf q “ n “ dimpEq, et qu’il y a égalité
ssi χf est scindé sur K. De plus :

Proposition 3.4.7. Si λ P Sppf q, alors

1 ď dim pEλ q ď mλ .

Ainsi :

Théorème 3.4.8. f est diagonalisable ssi χf est scindé et, pour tout λ P Sppf q, dim pEλ q “ mλ .

Exemple 3.4.9. Si f admet n “ dimpEq valeurs propres deux à deux distinctes, alors f est
diagonalisable.
La diagonalisation d’un endomorphisme correspond à un changement de base vers une base
dans laquelle la matrice représentative de l’endomorphisme considéré est diagonale. L’analogue
matriciel du changement de base est l’opération de “conjugaison” par une matrice inversible.
Soit A une matrice de Mn pKq.

Définition 3.4.10. On dit que A est diagonalisable s’il existe une matrice inversible P P
GLn pKq et une matrice diagonale D de Mn pKq telles que

P ´1 AP “ D.
3.4. DIAGONALISABILITÉ ET DIAGONALISATION 53

Remarque 3.4.11. Si B P Mn pKq, on dit que A est semblable à B s’il existe une matrice inversible
P P GLn pKq telle que P ´1 AP “ B (la relation de similitude sur Mn pKq est une relation
d’équivalence).
Ainsi, A est diagonalisable ssi A est semblable à une matrice diagonale.
Les résultats de diagonalisabilité d’un endomorphisme énoncés ci-dessus ont leurs analogues
matriciels, à savoir :

Théorème 3.4.12. Soient λ1 , . . . , λp , p P N, les valeurs propres deux à deux distinctes de A

et, pour i P t1, . . . , pu, notons mλi la multiplicité de λi en tant que racine de χA . Alors A est
ÿ p
diagonalisable ssi dim pEλi q “ n ssi (χA est scindé et, pour tout i P t1, . . . , pu, dim pEλi q “
i“1
mλi ).

Remarque 3.4.13. • Diagonaliser une matrice diagonalisable A de Mn pKq, c’est déterminer

une matrice inversible P P GLn pKq telle que la matrice P ´1 AP soit diagonale et exprimer
P ´1 AP .

• Diagonaliser une matrice diagonalisable permet entre autres de calculer ses puissances,
comme présenté dans l’exemple ci-dessous.
Exemple 3.4.14. On considère la matrice
ˆ ˙
1 ´1
A :“
2 4

de M2 pRq. Son polynôme caractéristique χA “ pX ´ 2qpX ´ 3q est scindé à racines simples donc
A est diagonalisable. "ˆ ˙* "ˆ ˙*
1 1
Une base de E2 est , une base de E3 est et on pose
´1 ´2
ˆ ˙
1 1
P :“ .
´1 ´2

On a alors ˆ ˙
2 0
“ P ´1 AP
0 3
ˆ ˙
2 0
donc A “ P P ´1 et, par associativité du produit matriciel, pour k P Nzt0u, Ak “
0 3
ˆ k ˙
2 0
P P ´1 .
0 3k
ˆ ˙
´1 2 1
Or P “ donc
´1 ´1
ˆ ˙
k 2k`1 ´ 3k 2k ` 3k
A “ .
´2k`1 ` 2 ¨ 3k ´2k ´ 2 ¨ 3k
54 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

3.5 Polynômes d’endomorphismes, polynômes annulateurs et dia-

gonalisabilité
On va dans cette section présenter des conditions nécessaires et suffisantes de diagonalisa-
bilité, exprimées à l’aide de la notion de polynôme d’endomorphisme :
Définition 3.5.1. Soient P “ aN X N ` aN ´1 X N ´1 ` ¨ ¨ ¨ ` a1 X ` a0 P KrXs et f P LpEq. On
note
P pf q :“ aN f N ` aN ´1 f N ´1 ` ¨ ¨ ¨ ` a1 f ` a0 IdE P LpEq
(où, pour k P t1, . . . , N u, f k désigne la composée k ème de l’endomorphisme f avec lui-même).
Un endomorphisme de E de cette forme est appelé polynôme d’endomorphisme.
On peut définir de façon analogue la notion de polynôme de matrice : si l’on reprend les
notations de la définition ci-dessus et si A est une matrice de Mn pKq, on définit

P pAq :“ aN AN ` aN ´1 AN ´1 ` ¨ ¨ ¨ ` a1 A ` a0 In P Mn pKq,

où, pour k P t1, . . . , N u, Ak désigne la puissance k ème de A.

Tous les énoncés et notions présentés ci-après sur les polynômes d’endomorphismes ont leur
analogues immédiats pour les polynômes de matrices.
Exemple 3.5.2. Considérons la matrice
ˆ ˙
1 0
A :“
´1 0

de M2 pRq et le polynôme P :“ XpX ´ 1q de RrXs. On a

ˆ ˙ˆ ˙ ˆ ˙
1 0 0 0 0 0
P pAq “ ApA ´ I2 q “ “ .
´1 0 ´1 ´1 0 0

Soient f P LpEq et P P KrXs.

Définition 3.5.3. On dit que P est un polynôme annulateur de f si P pf q est l’endomorphisme
identiquement nul de E.
Exemple 3.5.4. Si l’on reprend les notations de l’exemple précédent 3.5.2, P est un polynôme
annulateur de A.
Un premier pas entre les polynômes annulateurs et la réduction des endomorphismes est
donné par le résultat suivant :
Lemme 3.5.5. Soit λ P Sp pf q. Si P est un polynôme annulateur de f , alors λ est une racine
de P .
Exemple 3.5.6. • Reprenons la matrice A de l’exemple 3.5.2. Comme P “ XpX ´ 1q est un
polynôme annulateur de A, SppAq Ă t0; 1u.

• Si l’endomorphisme f vérifie f 3 “ f i.e. le polynôme X 3 ´ X “ XpX ´ 1qpX ` 1q annule

f , alors Sp pf q Ă t0; ´1; 1u.
3.6. POLYNÔME MINIMAL 55

On en vient à un premier critère, nécessaire et suffisant, de diagonalisabilité d’un endomor-

phisme mettant en jeu la notion de polynôme annulateur :
Théorème 3.5.7. L’endomorphisme f est diagonalisable si et seulement s’il existe un polynôme
annulateur de f qui soit scindé à racines simples.
Exemple 3.5.8. Si f vérifie alors f 3 “ f alors f est diagonalisable car le polynôme X 3 ´ X “
XpX ´ 1qpX ` 1q, annulateur de f , est scindé à racines simples.
Remarque 3.5.9. Il est à noter que ce critère permet, si l’on trouve un tel polynôme annulateur
de f scindé à racines simples, de montrer que f est diagonalisable sans avoir à calculer les
dimensions des espaces propres de f .

3.6 Polynôme minimal

Soit f P LpEq. Remarquons que l’ensemble If des polynômes de KrXs qui annulent f est un
idéal de l’anneau KrXs : le polynôme nul annule f et, si P et Q sont deux polynômes annulant f
et si R est un polynôme de KrXs, pP ´ Qqpf q “ P pf q ´ Qpf q “ 0 et pRP qpf q “ Rpf qP pf q “ 0.
L’anneau KrXs étant principal, l’idéal If peut être engendré par un seul élément de If , que
l’on peut de plus supposer unitaire. En fait, il y a un seul générateur de ce type :
Proposition et Définition 3.6.1. Il existe un unique polynôme unitaire µf tel que If “ pµf q.
On appelle µf le polynôme minimal de f.
Remarque 3.6.2. • Par définition, les polynômes annulateurs de f sont les multiples de µf .
En particulier, si l’on connaît µf , on connaît alors tous les polynômes annulateurs de f .
• µf est le polynôme annulateur de f unitaire de plus petit degré.
Le polynôme minimal de f divise le polynôme caractéristique de f en vertu du théorème de
Cayley-Hamilton :
Théorème 3.6.3 (Théorème de Cayley-Hamilton). Le polynôme caractéristique de f est un
polynôme annulateur de f . Autrement dit χf P If i.e. µf divise χf .
Ce théorème nous donne en particulier des informations supplémentaires sur µf :
Corollaire 3.6.4. • 1 ď degpµf q ď n.
• Les racines de µf dans K (resp. dans la clôture algébrique de K) sont exactement les
racines de χf dans K (resp. dans la clôture algébrique de K), i.e. les valeurs propres de f
dans K (resp. dans la clôture algébrique de K), avec multiplicités différentes a priori.
Le théorème de Cayley-Hamilton nous donne ainsi un moyen de déterminer le polynôme
minimal de f à partir de la donnée du polynôme caractéristique :
Exemple 3.6.5. 1. On considère la matrice
¨ ˛
0 1 2
A “ ˝1 0 2‚
1 2 0
56 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

de M3 pRq. Son polynôme caractéristique est χA “ ´pX ` 1qpX ` 2qpX ´ 3q. Ainsi, néces-
sairement, µA “ pX ` 1qpX ` 2qpX ´ 3q.

2. On considère la matrice ¨ ˛
´1 1 1
A “ ˝ 1 ´1 1 ‚
1 1 ´1
de M3 pRq. Son polynôme caractéristique est χA “ ´pX ´ 1qpX ` 2q2 . Ainsi, nécessaire-
2
` µA “ pX ´ 1qpX
ment,
2
˘ ` 2q ou µA “ pX ´ 1qpX ` 2q . Comme deg ppX ´ 1qpX ` 2qq ă
deg pX ´ 1qpX ` 2q , on commence par tester si le polynôme pX ´ 1qpX ` 2q annule A.
On a ¨ ˛¨ ˛ ¨ ˛
´2 1 1 1 1 1 0 0 0
pA ´ I3 qpA ` 2I3 q “ ˝ 1 ´2 1 ‚˝1 1 1‚ “ ˝0 0 0‚
1 1 ´2 1 1 1 0 0 0
et donc pX ´ 1qpX ` 2q est le polynôme minimal de A.

3. On considère la matrice ¨ ˛
3 ´1 1
A “ ˝2 0 1‚
1 ´1 2
de M3 pRq. Son polynôme caractéristique est χA “ ´pX ´ 1qpX ´ 2q2 . Ainsi, nécessaire-
` µA “ pX ´ 1qpX
ment, ˘ ´ 2q ou µA “ pX ´ 1qpX ´ 2q2 . Comme deg ppX ´ 1qpX ´ 2qq ă
deg pX ´ 1qpX ´ 2q2 , on commence par tester si le polynôme pX ´ 1qpX ´ 2q annule A.
Or on constate que la matrice pA ´ I3 qpA ´ 2I3 q n’est pas la matrice nulle de M3 pRq donc,
nécessairement, µA “ pX ´ 1qpX ´ 2q2 .
On termine cette section par un critère de diagonalisabilité permettant de décider, à partir
de la donnée du polynôme minimal de f , si f est diagonalisable ou non :

Théorème 3.6.6. L’endomorphisme f est diagonalisable si et seulement si son polynôme mi-

nimal µf est scindé à racines simples.

Exemple 3.6.7. Les matrices des exemples 3.6.5 1. et 2. sont diagonalisables, la matrice de
l’exemple 3.6.5 3. n’est pas diagonalisable.
Remarque 3.6.8. Le théorème 3.6.6 permet de déterminer si un endomorphisme est diagonali-
sable ou non sans passer par le calcul des dimensions de ses espaces propres.

3.7 Triangularisabilité et triangularisation

Soit f P LpEq.
Si f n’est pas diagonalisable, on peut chercher à déterminer si f peut être réduit sous forme
triangulaire :

Définition 3.7.1. On dit que l’endomorphisme f est triangularisable s’il existe une base B de
E telle que MatB pf q est triangulaire (supérieure ou inférieure).
3.7. TRIANGULARISABILITÉ ET TRIANGULARISATION 57

De manière analogue, on dira qu’une matrice A de Mn pKq est triangularisable si A est

semblable à une matrice triangulaire.
Remarque 3.7.2. • Si T est une matrice triangulaire représentant f , les coefficients de la
diagonale de T sont les valeurs propres de f , apparaissant suivant leurs multiplicités dans
χf .
• Un endomorphisme diagonalisable est en particulier triangularisable.
On donne dès à présent le critère essentiel de triangularisabilité d’un endomorphisme :
Théorème 3.7.3. L’endomorphisme f est triangularisable si et seulement si son polynôme
caractéristique χf est scindé sur K (ssi son polynôme minimal µf est scindé sur K).
Corollaire 3.7.4. Tout endomorphisme d’un C-espace vectoriel est triangularisable.
Toute matrice de Mn pCq est semblable à une matrice triangulaire.
Exemple 3.7.5. Reprenons la matrice
¨ ˛
3 ´1 1
A “ ˝2 0 1‚
1 ´1 2

de l’exemple 3.6.5 3. On a vu plus haut que χA “ ´pX ´1qpX ´2q2 est scindé sur R. Donc, même
si A n’est pas diagonalisable, A est triangularisable d’après le théorème ci-dessus. Cherchons
une matrice triangulaire T de M2 pRq semblable à A.
Commençons
¨ par˛remarquer que chaque espace propre de A est de dimension 1. On a
2 ´1 1
A ´ I3 “ ˝2 ´1 1‚ donc
1 ´1 1
$¨ ˛ , $¨ ˛,
& x & 0 .
#
2x ´ y ` z “ 0 .
E1 “ ˝y ‚ P M3 pRq | “ Vect ˝1‚
%
z x ´ y ` z “ 0- %
1
-
¨ ˛
1 ´1 1
et A ´ 2I3 “ ˝2 ´2 1‚ donc
1 ´1 0
$¨ ˛ , $¨ ˛,
& x & 1 .
#
x´y`z “0 .
E2 “ ˝ y P M3 pRq |
‚ “ Vect ˝1‚
%
z x ´ y “ 0 - %
0
-
$¨ ˛ ¨ ˛,
& 0 1 .
Si on complétait la famille ˝1‚, ˝1‚ de M3,1 pRq ainsi obtenue en une base, i.e. de
1 0
% -
façon à ce que la matrice ¨ ˛
0 1 ‹
P :“ ˝1 1 ‹‚
1 0 ‹
58 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

soit inversible, on aurait alors ¨ ˛

1 0 ‹
P ´1 AP “ ˝0 2 ‹‚
0 0 2
(deux matrices semblables ont
¨ ˛les mêmes polynômes
¨ ˛ caractéristiques).
0 1
Ainsi, si on note X1 :“ ˝1‚ et X2 :“ ˝1‚, n’importe quel vecteur colonne X3 de M3,1 pRq
1 0
¨ ˛
1
n’appartenant à VecttX1 , X2 u convient. On choisit, par exemple, X3 :“ ˝0‚, on pose alors
0
¨ ˛
0 1 1
P :“ ˝1 1 0‚
1 0 0
est bien inversible et on a ¨ ˛
1 0 1
P ´1 AP “ ˝0 2 1‚
0 0 2
¨ ˛ ¨ ˛
1 0 1 1
Remarque 3.7.6. Si on avait posé X3 :“ ˝1‚ et P :“ ˝1 1 1‚, on aura eu P ´1 AP “
1 1 0 1
¨ ˛
1 0 0
˝0 2 1‚. En particulier, on peut donc triangulariser A de plusieurs façons.
0 0 2
Remarque 3.7.7. 1. Triangulariser un endomorphisme triangularisable f de E, c’est déter-
miner une base B de E dans laquelle la matrice représentative de f est triangulaire et
exprimer MatB pf q.

2. Triangulariser une matrice triangularisable A de Mn pKq, c’est déterminer une matrice

inversible P P GLn pKq telle que la matrice P ´1 AP soit triangulaire et exprimer P ´1 AP .
Si l’endomorphisme f est triangularisable, il existe des triangularisations plus “simples” que
d’autres. Commençons par la triangularisation suivant les sous-espaces caractéristiques, qui est
à la fois une triangularisation et une “diagonalisation par blocs” :
Définition 3.7.8. On suppose que f est triangularisable, i.e. χf “ p´1qn pi“1 pX ´ λi qmλi
ś
avec λ1 , . . . , λp les valeurs propres deux à deux distinctes de f .
Pour i P t1, . . . , pu, on appelle sous-espace caractéristique de f associé à la valeur propre λi
le sous-espace vectoriel
Nλi :“ Ker pf ´ λi IdE qmλi
de E.
Remarque 3.7.9. Avec les notations ci-dessus, pour tout i P t1, . . . , pu, Eλi Ă Nλi et f pNλi q Ă
Nλi .
3.7. TRIANGULARISABILITÉ ET TRIANGULARISATION 59

Exemple 3.7.10. Reprenons la matrice

¨ ˛
3 ´1 1
A “ ˝2 0 1‚ P M2 pRq
1 ´1 2

de l’exemple 3.7.5. Son polynôme caractéristique est χA “ ´pX ´ 1qpX ´ 2q2 . Le sous-espace
caractéristique de A associé à la valeur propre 1 est N1 “ Ker pA ´ I3 q “ E1 et le sous-espace
caractéristique de A associé à la valeur propre 2 est N2 “ Ker pA ´ 2I3 q2 . Or
¨ ˛
0 0 0
pA ´ 2I3 q2 “ ˝´1 1 0‚
´1 1 0
$¨ ˛ ¨ ˛ ,
& 1 0 .
donc N2 “ Ker pA ´ 2I3 q2 “ Vect ˝1‚, ˝0‚ .
0 1
% -

Dans la suite de cette section, on supposera que f est triangularisable i.e. que son polynôme
caractéristique est scindé et on gardera les notations de la définition précédente.

Proposition 3.7.11. Les sous-espaces caractéristiques de f sont en somme directe et, si l’on
reprend les notations de la définition ci-dessus,

E “ Nλ1 ‘ ¨ ¨ ¨ ‘ Nλp .

Remarque 3.7.12. Cette proposition est une conséquence du lemme des noyaux : si P1 , . . . , Pm P
KrXs sont des polynômes premiers entre eux deux à deux et si P :“ P1 ¨ ¨ ¨ Pm , alors

Ker P pf q “ Ker P1 pf q ‘ ¨ ¨ ¨ ‘ Ker Pm pf q.

On en vient à une triangularisation sous forme diagonale par blocs de l’endomorphisme

triangularisable f , suivant ses sous-espaces caractéristiques :

Théorème 3.7.13. Pour tout i P t1, . . . , pu, dim pNλi qq “ mλi et il existe une base Bi de Nλi
telle que, si B :“ tB1 , . . . , B2 u, MatB pf q est la matrice-blocs
¨ ˛
Mλ 1 0
˚ .. ‹
˝ . ‚
0 M λp
´ ¯
où, pour tout i P t1, . . . , pu, Mλi P Mmλi pKq est la matrice MatBi f|Nλ et est de la forme
i

¨ ˛
λi ‹
˚ .. ‚.
‹
˝ .
0 λi
60 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES
$¨ ˛ ,
& 0 .
Exemple 3.7.14. Reprenons la matrice A de l’exemple 3.7.10. La famille B1 :“ ˝1‚ est une
1
% -
$¨ ˛ ¨ ˛,
& 1 0 .
base de N1 “ E1 , la famille B2 :“ ˝1‚, ˝0‚ est une base de N2 et, si P désigne la matrice
0 1
% -
inversible ¨ ˛
0 1 0
˝1 1 0‚,
1 0 1
on a ¨ ˛
1 0 0
P ´1 AP “ ˝0 2 1‚
0 0 2
$¨ ˛ ¨ ˛, ¨ ˛
& 1 0 . 0 1 0
Remarque 3.7.15. Si on avait pris B2 :“ ˝1‚, ˝0‚ et P :“ ˝1 1 0‚, on aurait eu
0 3 1 0 3
% -

¨ ˛
1 0 0
P ´1 AP “ ˝0 2 3‚
0 0 2

Mais on peut aller encore plus loin dans la simplification de la représentation triangulaire de
l’endomorphisme triangularisable f : cette simplification “ultime” appelée réduction de Jordan
est l’objet de la section suivante. En particulier, on décrira un algorithme systématique de
triangularisation d’un endomorphisme triangularisable f sous “sa” forme dite de Jordan.

3.8 Réduction de Jordan

Soit f un endomorphisme triangularisable de E et soit χf “ p´1qn pi“1 pX ´ λi qmλi son
ś
polynôme caractéristique scindé sur K, avec λ1 , . . . , λp ses valeurs propres deux à deux distinctes.
Nous allons construire, par un processus algorithmique, une base de f dans laquelle la
matrice représentative de f est une matrice diagonale par blocs dont les blocs diagonaux sont
des blocs de Jordan :

Définition 3.8.1. Soit λ P K. Pour m P Nzt0u, on appelle λ-bloc de Jordan de taille m la

matrice carrée ¨ ˛
λ 1 0
˚ .. .. ‹
˚ . . ‹
Jm pλq :“ ˚
˚
..
‹
‹
˝ . 1‚
0 λ
de Mm pKq (par convention, J1 pλq “ pλq).
3.8. RÉDUCTION DE JORDAN 61

Pour m1 , . . . , mk P Nzt0u, on note Jm1 ,...,mk pλq la matrice diagonale par blocs
¨ ˛
Jm1 pλq 0
˚ .. ‹
˝ . ‚
0 Jmk pλq
de Mm1 `¨¨¨`mk pKq.
Dans cette section, nous allons précisément montrer le résultat de réduction suivant :
Théorème 3.8.2. Il existe une base B de E et, pour tout i P t1, . . . , pu, des entiers mi1 , . . . , miki P
Nzt0u telle que
¨ ˛
Jm11 ,...,m1 pλ1 q 0
k1
˚
MatB pf q “ ˝ .. ‹
‹.
˚ . ‚
0 Jmp1 ,...,mp pλp q
kp

De plus, à permutation près, les entiers mij ,

1 ď i ď p, 1 ď j ď ki , sont uniques et
on appellent les blocs de Jordan Jmi pλi q, 1 ď i ď p, 1 ď j ď ki , les blocs de Jordan de
j
l’endomorphisme triangularisable f . La matrice MatB pf q est appelée la forme de Jordan de f
(“la” forme de Jordan de f est unique à permutation près des blocs de Jordan).
¨ ˛
1 0 0
Exemple 3.8.3. Par unicité des blocs de Jordan, la matrice ˝0 2 1‚ obtenue dans l’exemple
0 0 2
¨ ˛
3 ´1 1
3.7.14 est donc la forme de Jordan de la matrice A “ ˝2 0 1‚.
1 ´1 2
Un résultat de “classification” découlant du théorème précédent est le suivant :
Corollaire 3.8.4. Deux matrices triangularisables de Mn pKq sont semblables si et seulement
si elles ont les mêmes blocs de Jordan.
Dans le reste de cette section, nous allons montrer l’existence de la réduction de Jordan de f
par un procédé constructif algorithmique. Nous ne montrerons pas l’unicité des blocs de Jordan
de f .

3.8.1 Etape 1
La première étape de cette réduction est une réduction suivant les sous-espaces caractéris-
tiques de f . Pour i P t1, . . . , pu, soit Bi une base de Nλi et notons B0 :“ tB1 , . . . , Bp u. On a alors,
comme E “ Nλ1 ‘ ¨ ¨ ¨ ‘ Nλp (proposition 3.7.11) et comme chaque sous-espace caractéristique
de f est stable par f (remarque 3.7.9),
¨ ˛
A1 0
MatB0 pf q “ ˝
˚ .. ‹
. ‚
0 Ap
62 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES
´ ¯
où, pour tout i P t1, . . . , pu, Ai :“ MatBi f|Nλ (cette réduction n’est pas nécessairement une
i
triangularisation comme dans le théorème 3.7.13 : il s’agit simplement d’une “diagonalisation
par blocs”).
1
¯ à présent que si, pour tout i P t1, . . . , pu, on trouve une base Bi de Nλi telle que
Remarquons
´
MatBi1 f|Nλ “ Jmi ,...,mi pλi q avec mi1 , . . . , miki P Nzt0u, alors, en notant B :“ tB11 , . . . , Bp1 u,
i 1 ki
on a
¨ ˛
Jm11 ,...,m1 pλ1 q 0
k1
˚
MatB pf q “ ˚ .. ‹
‹.
˝ . ‚
0 Jmp1 ,...,mp pλp q
kp

On va donc rechercher une telle base Bi1 pour tout i P t1, . . . , pu.

3.8.2 Etape 2
1
Soit donc λ une valeur propre de f . Nous allons
` ˘montrer qu’il existe une base B de Nλ et
des entiers m1 , . . . , mk P Nzt0u tels que MatB1 f|Nλ “ Jm1 ,...,mk pλq. Pour simplifier encore un
peu plus les écritures, notons N :“ Nλ .
On écrit
f|N “ λIdN ` f|N ´ λIdN .
Nous allons` en fait montrer
˘ qu’il existe une base B 1 de N et des entiers m1 , . . . , mk P Nzt0u tels
0
que MatB1 f|Nλ ´ λIdN “ Jm1 ,...,mk où
¨ 0 ˛
Jm1 0
0
Jm :“ ˝
˚ .. ‹
1 ,...,mk . ‚
0 0
Jm k

et, si m P Nzt0u, ¨ ˛
0 1 0
˚ .. .. ‹
0
˚ . . ‹
Jm :“ ˚
˚ ..
‹ “ Jm p0q P Mm pKq
‹
˝ . 1‚
0 0
0
(Jm “ Jm1 ,...,mk p0q et J10 “ p0q).
1 ,...,mk
On aura alors
0
` ˘ ` ˘
MatB1 f|N “ MatB1 pλIdN q ` MatB1 f|Nλ ´ λIdN “ λImλ ` Jm 1 ,...,mk
“ Jm1 ,...,mk pλq

(rappelons que mλ “ dim pNλ q).

Pour montrer l’existence d’une telle base B 1 , on commence par remarquer que l’endomor-
phisme u :“ f|N ´ λIdN de N est nilpotent, i.e. qu’il existe l P Nzt0u tel que ul est l’endomor-
phisme nul de N . En effet, si v P N “ Ker pf ´ λIdE qmλ , alors
˘m
umλ pvq “ f|N ´ λIdN λ pvq “ pf ´ λIdE qmλ pvq “ 0
`
3.8. RÉDUCTION DE JORDAN 63

(à noter que l’indice de nilpotence de u, i.e. le plus petit entier l P Nzt0u tel que ul ” 0, est
donc inférieur ou égal à mλ ).
Nous allons montrer, de façon algorithmique, que tout endomorphisme nilpotent peut être
réduit à une forme (de Jordan) Jm 0 avec m1 , . . . , mk P Nzt0u.
1 ,...,mk

Remarque 3.8.5. Si u est un endomorphisme nilpotent quelconque de E, alors 0 est une valeur
propre de u et c’est la seule. En effet, comme il existe l P Nzt0u tel que ul ” 0, le polynôme X l
est un polynôme annulateur de u et donc le polynôme minimal de u est de la forme µu “ X ν
avec 1 ď ν ď l. 0 est donc l’unique valeur propre de u. De plus, le degré ν du polynôme minimal
X ν de u est l’indice de nilpotence de u.

Théorème 3.8.6 (Réduction des endomorphismes nilpotents à la forme de Jordan). Soit u un

endomorphisme nilpotent quelconque de E. Il existe une base B de E et des entiers m1 , . . . , mk P
Nzt0u tels que

0
MatB puq “ Jm 1 ,...,mk
.

Démonstration. On prouve le résultat par récurrence sur la dimension. Précisément, on prouve

que pour tout n P Nzt0u, pour tout espace vectoriel E sur K de dimension n, pour tout endo-
morphisme nilpotent u de E, il existe une base B de E et des entiers m1 , . . . , mk P Nzt0u tels
0
que MatB puq “ Jm .
1 ,...,mk

Pour n “ 1, le résultat est vrai. En effet, soit E un espace vectoriel sur K de dimension 1 et
soit u un endomorphisme nilpotent de E. Soit v0 P E un vecteur engendrant E. Comme u est
un endomorphisme de E, il existe α P K tel que upv0 q “ αv0 . Soit maintenant l P Nzt0u tel que
ul soit identiquement nul, alors 0 “ ul pv0 q “ αl v0 et donc α “ 0 car v0 engendre E qui est de
dimension 1. Ainsi, si on note B :“ tv0 u, on a MatB puq “ p0q “ J10 .

Supposons maintenant le résultat vrai pour tout entier naturel non nul strictement inférieur
à un entier n P Nzt0u fixé, et soient E un espace vectoriel sur K de dimension n et u un
endomorphisme nilpotent de E.
On note ν l’indice de nilpotence de u. Si ν “ 1, u est identiquement nul et, dans toute base
B de E, MatB puq “ J1,...,10 . Si ν ą 1, Ker uν´1 ‰ E (ν est le plus petit entier naturel non plus
tel que uν ” 0 donc uν´1 n’est pas identiquement nul). (
Soit alors v P EzKer uν´1 : nous allons montrer que la famille uν´1 pvq, uν´2 pvq, . . . , upvq, v
est libre. Soient λ0 , . . . , λν´1 P K tels que

λ0 v ` λ1 upvq ` ¨ ¨ ¨ ` λν´1 uν´1 pvq “ 0E .

En appliquant uν´1 à cette égalité, on obtient (puisque uν ” 0)

λ0 uν´1 pvq “ 0E

et donc λ0 “ 0 car uν´1 pvq ‰ 0E par hypothèse. On applique ensuite uν´2 à l’égalité

λ1 upvq ` ¨ ¨ ¨ ` λν´1 uν´1 pvq “ 0E

64 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

pour obtenir λ1 uν´1 pvq “ 0E et donc λ1 “ 0. De proche en (proche, on obtient ainsi que
λ0 “ λ1 “ . . . “ λν´1 “ 0 et la famille B 1 :“ uν´1 pvq, . . . , upvq, v (est donc libre. Il s’agit donc
d’une base du sous-espace vectoriel F :“ Vect uν´1 pvq, . . . , upvq, v de E.
Remarquons ensuite que F est stable par u (i.e. upF q Ă F ) et
¨ ˛
0 1 0
` ˘ ˚ ... ... ‹
˚ ‹
MatB1 u|F “ ˚ ˚ ‹ “ Jν0 .
.. ‹
˝ . 1‚
0 0
` ˘
Si ν “ n, alors F “ E et MatB1 u|F “ MatB1 puq “ Jν0 . Supposons à présent que ν ă n. Nous
allons construire un supplémentaire G de F dans E qui soit également stable par u. Comme
dimpGq ă dimpEq, on pourra alors appliquer l’hypothèse de récurrence ` ˘ à G et u|G et considérer
une base B 2 de G et des entiers ν1 , . . . , νl P Nzt0u tels que MatB2 u|G “ Jν01 ,...,νl . De sorte que,
si B :“ tB 1 , B 2 u,
ˆ ` ˘ ˙ ˆ 0 ˙
MatB1 u|F 0` ˘ Jν 0 0
MatB puq “ “ “ Jν,ν .
0 MatB2 u|G 0 Jν01 ,...,νl 1 ,...,νl

` ˘
On construit un tel espace G en utilisant la dualité linéaire. Soit ϕ P E ˚ tel que ϕ uν´1 pvq ‰
0 (un tel ϕ existe car, sinon, uν´1 pvq serait nécessairement le vecteur nul par la proposition 1.3.6 (
2., ce qui n’est pas le cas par hypothèse sur v) et montrons que la famille ϕ, tupϕq, . . . , t uν´1 pϕq
de E ˚ est libre (tu est la transposée de u : cf définition 1.6.1). Soient µ0 , . . . , µν´1 P K tels que

µ0 ϕ ` µ1 tupϕq ` ¨ ¨ ¨ ` µν´1 tuν´1 pϕq ” 0.

On applique cette égalité d’endomorphismes au vecteur uν´1 pvq : on obtient

0 “ µ0 ϕ uν´1 pvq ` µ1 tupϕq uν´1 pvq ` ¨ ¨ ¨ ` µν´1 tuν´1 pϕq uν´1 pvq
` ˘ ` ˘ ` ˘

“ µ0 ϕ uν´1 pvq ` µ1 ϕ ˝ u uν´1 pvq ` ¨ ¨ ¨ ` µν´1 ϕ ˝ uν´1 uν´1 pvq

` ˘ ` ˘ ` ˘

“ µ0 ϕ uν´1 pvq
` ˘

` ˘
(car uν ” 0). Comme ϕ uν´1 pvq ‰ 0 par hypothèse, nécessairement µ0 “ 0. En appliquant
l’égalité
µ1 tupϕq ` ¨ ¨ ¨ ` µν´1 tuν´1 pϕq ” 0.
à uν´2 pvq, on déduit ensuite que µ1 “ 0. De proche en proche, ( on obtient ainsi que µ0 “ µ1 “
. . . “ µν´1 “ 0 et la famille C :“ ϕ, tupϕq, . . . , t uν´1 pϕq de E(˚ est donc libre. Il s’agit d’une
base du sous-espace vectoriel W :“ Vect ϕ, tupϕq, . . . , t uν´1 pϕq de E ˚ .
On considère ensuite l’annulateur W 0 de W (définition 1.5.1). Montrons que F XW 0 “ t0E u :
soit w “ λ0 v ` λ1 upvq ` ¨ ¨ ¨ ` λν´1 uν´1 pvq, λ0 , . . . , λν´1 P K, un vecteur de F annulé par toutes
les formes linéaires de W . En particulier,
t ν´1
0 “ u pϕqpwq
“ λ0 u pϕq pvq ` λ1 t uν´1 pϕq pupvqq ` ¨ ¨ ¨ ` λν´1 t uν´1 pϕq uν´1 pvq
t ν´1
` ˘

“ λ0 ϕ uν´1 pvq
` ˘
3.8. RÉDUCTION DE JORDAN 65
` ˘
(uν ” 0) et donc, comme ϕ uν´1 pvq ‰ 0, λ0 “ 0 et w “ λ1 upvq`¨ ¨ ¨`λν´1 uν´1 pvq. Le vecteur
w est également annulé par t uν´2 pϕq et on en déduit de façon analogue que λ1 “ 0. De proche
en proche, on obtient ainsi que λ0 “ λ1 “ . . . “ λν´1 “ 0 et donc w “ 0E . Les sous-espaces
vectoriels F et W `0 de ˘E sont donc en somme directe.
De
` plus,
˘ dim W 0 “ dimpEq ´ dimpW q “ n ´ ν (proposition 1.5.3) donc dimpF q `
dim W 0 “ ν ` n ´ ν “ n “ dimpEq et F et W 0 sont donc des sous-espaces vectoriels
supplémentaires dans E.
Montrons enfin que W 0 est stable par u : soit w P W 0 et soit ψ “ µ0 ϕ ` µ1 tupϕq ` ¨ ¨ ¨ `
µν´1 tuν´1 pϕq, µ0 , . . . , µν´1 P K, une forme linéaire de W . Alors

ψpupwqq “ µ0 ϕpupwqq ` µ1 tupϕqpupwqq ` ¨ ¨ ¨ ` µν´1 tuν´1 pϕqpupwqq

“ µ0 tupϕqpwq ` µ1 tu2 pϕqpwq ` ¨ ¨ ¨ ` µν´2 tuν´1 pϕqpwq ` 0
“ 0
(
car w P W 0 et W “ Vect ϕ, tupϕq, . . . , t uν´1 pϕq .
On pose alors G :“ W 0 : G est un supplémentaire de F dans E de dimension n ´ ν ă n et
stable par u. La restriction de u à G reste nilpotente et, par hypothèse `de récurrence,
˘ il existe
2 0
donc une base B de G et des entiers ν1 , . . . , νl P Nzt0u tels que MatB2 u|G “ Jν1 ,...,νl . Ainsi,
en posant B :“ tB 1 , B 2 u, on a
ˆ ` ˘ ˙ ˆ 0 ˙
MatB1 u|F 0` ˘ Jν 0 0
MatB puq “ “ “ Jν,ν 1 ,...,νl
.
0 MatB2 u|G 0 Jν01 ,...,νl

3.8.3 Description matricielle de la méthode de réduction à la forme de Jor-

dan
Résumons la méthode décrite ci-dessus en appliquant son pendant matriciel à une matrice
triangularisable A P Mn pKq. On suppose que l’on a déjà écrit le polynôme caractéristique χA
de A comme un produit
p
ź
n
χA “ p´1q pX ´ λi qmλi
i“1
dans KrXs, où λ1 , . . . , λp sont les valeurs propres (deux à deux distinctes) de A.

Etape 1 : Pour tout i P t1, . . . , pu, calculer la matrice pA ´ λi In qmλi et déterminer une base Bi de
Nλi “ Ker pA ´ λi In qmλi Ă Mn,1 pKq. Considérer la base B0 :“ tB1 , . . . , Bp u de Mn,1 pKq
et la matrice P0 dont les colonnes sont, dans l’ordre, les vecteurs colonnes de la base B0 .
Calculer la matrice P0´1 AP0 : elle est de la forme
¨ ˛
A1 0
˚ .. ‹
˝ . ‚
0 Ap

où, pour tout i P t1, . . . , pu, Ai P Mmλi pKq (et χAi “ p´1qmλi pX ´ λi qmλi ).
66 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

Etape 2 : Pour chaque i P t1, . . . , pu, calculer la matrice Ui :“ Ai ´λi Imλi de Mmλi pKq puis appliquer
à la matrice nilpotente Ui la méthode décrite ci-après de réduction des matrices nilpotentes
à la forme de Jordan : on obtient des entiers mi1 , . . . , miki P Nzt0u et une matrice inversible
Qi de taille mλi tels que Q´1 0
i Ui Qi “ Jmi ,...,mi
1 ki

Etape 3 : On note ¨ ˛
Q1 0
Pr :“ ˝
˚ .. ‚ P GLn pKq
‹
.
0 Qp
et alors
¨ ˛ ¨ ˛ ¨J 0 0
˛
A1 0 λ1 Imλ1 0 m11 ,...,m1k
1

Pr´1 ˝
˚ .. ‚Pr “ ˝
‹ ˚ .. ‹
‚` ˚
˚ .. ‹
. . ˝ . ‹
‚
0 λp Imλp 0 0
Jm
0 Ap p
,...,mp
1 kp
¨ ˛
Jm11 ,...,m1 pλ1 q 0
k1
˚
“ ˝ .. ‹
‹.
˚ . ‚
0 Jmp1 ,...,mp pλp q
kp

En posant P :“ P0 Pr, on obtient donc

¨ ˛
Jm11 ,...,m1 pλ1 q 0
k1

P ´1 AP “ ˚
˚ .. ‹
‹.
˝ . ‚
0 Jmp1 ,...,mp pλp q
kp

L’algorithme récursif permettant de réduire à la forme de Jordan une matrice nilpotente

U quelconque de Mm pKq, m P Nzt0u (la matrice dans la base canonique d’un endomorphisme
nilpotent u de Km ), est le suivant :

Etape a : Déterminer l’indice de nilpotence de U : il s’agit de la plus petite puissance ν P Nzt0u

telle que U ν est la matrice nulle.

Etape b : Choisir un vecteur colonne Y P Mm,1 pKq (le vecteur colonne des coordonnées dans la
base canonique d’un vecteur v de Km ) tel que( le vecteur colonne U ν´1 Y n’est pas nul, et
constituer la famille libre U ν´1 Y, . . . , U Y, Y de Mm,1 pKq.

Etape c : Si ν “ m, on note Q la matrice de GLm pKq dont les colonnes (sont, dans l’ordre, les
coordonnées des vecteurs colonnes de la base U ν´1 Y, . . . , U Y, Y de Mm,1 pKq, et on a
alors
0
Q´1 U Q “ Jm .

Si ν ‰ m, passer à l’étape d.
3.8. RÉDUCTION DE JORDAN 67

Etape d : Si ν ‰ m, choisir un vecteur colonne Z P Mm,1 pKq (le vecteur colonne des coordonnées
m ˚
dans la base duale de la base canonique` ˘ forme linéaire ϕ de pK q ) tel que la quantité
d’une
tZU ν´1 Y (qui est la quantité ϕ uν´1 pvq ) ne soit pas nulle, et constituer la famille libre
(
tZ, t U Z, . . . , t U ν´1 Zu de Mm,1 pKq (correspondant à la famille ϕ, tupϕq, . . . , t uν´1 pϕq de
pKm q˚ ).

Etape e : Déterminer une famille libre tX`1 , . . . ,˘Xm´n u de Mm,1 pKq telle que, pour tout i P t1, . . . , m´
νu et tout j P t0, . . . , ν ´ 1u, t t U j Z Xi “ tZU j Xi “ 0 (la famille libre
( tX1 , . . . , Xm´n u
correspond à une base de l’annulateur de Vect ϕ, tupϕq, . . . , t uν´1 pϕq ).

Etape f : On note Q0 la matrice de GLm pKq dont les colonnes sont, dans l’ordre, les coordonnées
des vecteurs colonnes de la base tY, U Y, . . . , U ν´1 Y, X1 , . . . , Xm´n u de Mm,1 pKq. Calculer
la matrice Q´1
0 AQ0 : elle est de la forme

ˆ 0 ˙
Jν 0
0 U
r

où U
r est une matrice nilpotente de Mm´ν,1 pKq.

Etape g : Appliquer la méthode à la matrice nilpotente U r (à partir de l’étape a). En appliquant

ce procédé récursif, on obtient une matrice inversible Q r P GLm´ν pKq et des entiers
r ´1 r r 0
ν1 , . . . , νl P Nzt0u tels que Q U Q “ Jν1 ,...,νl .

Etape h : On note
ˆ ˙
Iν 0
Q :“ Q0 r P GLm pKq,
0 Q

et on a
0
Q´1 U Q “ Jν,ν 1 ,...,νl
.

Exemple 3.8.7. On considère la matrice

¨ ˛
1 0 0 0
˚´1 4 1 ´2‹
A :“ ˚
˝2
‹
1 2 ´1‚
1 2 1 0

de M4 pRq.
68 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

Etape 0 : On calcule le polynôme caractéristique χA de A :

1´X 0 0 0
´1 4´X 1 ´2
χA “ det pA ´ XI4 q “
2 1 2 ´ X ´1
1 2 1 ´X
4´X 1 ´2
“ p1 ´ Xq 1 2 ´ X ´1
2 1 ´X
2´X 1 ´2
“ p1 ´ Xq 0 2 ´ X ´1
C1 ÐC1 `C3
2´X 1 ´X
1 1 ´2
“ p1 ´ Xqp2 ´ Xq 0 2 ´ X ´1
1 1 ´X
1 1 ´2
“ p1 ´ Xqp2 ´ Xq 0 2 ´ X ´1
L3ÐL3 ´L1
0 0 2´X
“ p1 ´ Xqp2 ´ Xq3

Etape 1 : La multiplicité de la valeur propre 1 dans χA étant 1, N1 “ E1 , et

¨ ˛ $¨ ˛ ,
0 0 0 0 ’
’ 1 /
&˚ ‹ /
3 1 ´2‹ 1‹
˚´1 ‹ .
E1 “ Ker pA ´ I4 q “ Ker ˚
˝2 “ Vect ˝ ‚ .
˚
1 1 ´1‚ ’
’ ´4 //
% -
1 2 1 ´1 ´1

La multiplicité de la valeur propre 2 dans χA est 3. Pour déterminer N2 “ Ker pA ´ 2I4 q3 ,

on commence par calculer la matrice pA ´ 2I4 q3 . On a
¨ ˛
´1 0 0 0
´1 0 0 0‹
pA ´ 2I4 q3 “ ˚
˚
‹
˝ 4 0 0 0‚
1 0 0 0

et donc
$¨ ˛ ¨ ˛ ¨ ˛ ,
’ 0
’ 0 0 / /
& ˚1‹ ˚0‹ ˚0‹.
N2 “ Vect ˝ ‚, ˝ ‚, ˝ ‚ .
˚ ‹ ˚ ‹ ˚ ‹
’
’ 0 1 0 / /
% -
0 0 1
3.8. RÉDUCTION DE JORDAN 69

On note P0 la matrice inversible

¨ ˛
0 0 0 1
˚1 0 0 1‹
˚ ‹
˝0 1 0 ´4‚
0 0 1 ´1

et on obtient ¨ ˛
4 1 ´2 0 ˆ ˙
˚1 2 ´1 0‹‹ “ A1 0
P0´1 AP0 “ ˚
˝2 1 0 0‚ 0 A2
0 0 0 1
Etape 2 : Le bloc A2 “ p1q P M1 pRq est déjà un bloc de Jordan J1 p1q.

On note U1 la matrice
¨ ˛ ¨ ˛
4 1 ´2 2 1 ´2
A1 ´ 2I3 “ ˝1 2 ´1‚´ 2I3 “ ˝1 0 ´1‚ P M3 pRq
2 1 0 2 1 ´2

et on applique la méthode de réduction à la forme de Jordan des matrices nilpotentes à U1 :

Etape a : Déterminons l’indice de nilpotence de U1 : on a

¨ ˛
1 0 ´1
U12 “ ˝0 0 0‚
1 0 ´1

et U13 est la matrice nulle de M3 pRq. Ainsi, l’indice de nilpotence de U1 est 3.

2
Etape b : On choisit ensuite un vecteur¨colonne
˛ ¨ ˛le noyau de¨U1˛ : on
qui ne soit pas dans
1 2 1
prend par exemple le vecteur colonne Y :“ ˝0‚ et on calcule U1 Y “ ˝1‚ et U12 Y “ ˝0‚.
0 2 1
Etape c : Comme l’indice de nilpotence de U1 est égal à la multiplicité de la valeur propre
2 dans χA , la famille libre tU12 Y, U1 Y, Y u est une base de M3,1 pRq et on pose
¨ ˛
1 2 1
Q1 :“ ˝0 1 0‚.
1 2 0

On a alors ¨ ˛
0 1 0
Q1´1 U1 Q “ ˝0 0 1‚.
0 0 0
70 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

Etape 3 : On note

¨ ˛
ˆ ˙ 1 2 1 0
Q1 0 ˚0 1 0 0‹
Pr :“ “˚ ‹
0 1 ˝1 2 0 0‚
0 0 0 1

¨ ˛
0 0 0 1
˚1 2 1 1‹
P :“ P0 Pr “ ˚
˝0
‹,
1 0 ´4‚
1 2 0 ´1

et on a

¨ ˛
2 1 0 0 ˆ ˙
˚ 0 2 1 0‹
‹ “ J3 p2q 0
P ´1 AP “ ˚
˝0 .
0 2 0‚ 0 J1 p1q
0 0 0 1

Exemple 3.8.8. On considère la matrice

¨ ˛
5 0 4 ´2 ´3
˚´2
˚ 3 ´3 2 4‹‹
˚0
A :“ ˚ 0 3 0 0‹‹
˝0 0 0 3 1‚
1 0 2 ´1 1

de M5 pRq.
3.8. RÉDUCTION DE JORDAN 71

Etape 0 : Calculons le polynôme caractéristique χA de A :

5´X 0 4 ´2 ´3
´2 3´X ´3 2 4
χA “ det pA ´ XI5 q “ 0 0 3´X 0 0
0 0 0 3´X 1
1 0 2 ´1 1´X
5´X 0 ´2 ´3
´2 3´X 2 4
“ p3 ´ Xq
0 0 3´X 1
1 0 ´1 1´X
5´X ´2 ´3
“ p3 ´ Xq2 0 3´X 1
1 ´1 1´X
3´X ´2 ´3
“ p3 ´ Xq2 3 ´ X 3 ´ X 1
C1 ÐC1 `C2
0 ´1 1´X
1 ´2 ´3
3
“ p3 ´ Xq 1 3´X 1
0 ´1 1´X
1 ´2 ´3
3
“ p3 ´ Xq 0 5´X 4
L2 ÐL2 ´L1
0 ´1 1´X
5´X 4
“ p3 ´ Xq3
´1 1´X
“ p3 ´ Xq3 rp5 ´ Xqp1 ´ Xq ` 4s
“ p3 ´ Xq3 pX 2 ´ 6X ` 9q
“ p3 ´ Xq5

3 est donc l’unique valeur propre de A.

Remarquons que
¨ ˛
2 0 4 ´2 ´3
˚´2
˚ 0 ´3 2 4‹‹
˚0
A ´ 3I5 “ ˚ 0 0 0 0‹‹
˝0 0 0 0 1‚
1 0 2 ´1 ´2
et que l’espace propre E3 “ Ker pA ´ 3I5 q est de dimension 2.

Etape 1 : 3 étant l’unique valeur propre de A, le sous-espace caractéristique N3 “ Ker pA ´ 3I5 q5

est M5,1 pRq tout entier (on “pose” P0 “ I5 et A1 :“ A).
72 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

Etape 2 : On note U :“ A ´ 3I5 .

Etape a : On calcule l’indice de nilpotence de U . On a

¨ ˛
1 0 2 ´1 ´2
˚0 0 0 0 0‹
˚ ‹
U2 “ ˚
˚0 0 0 0 0‹‹
˝1 0 2 ´1 ´2‚
0 0 0 0 0

et U 3 est la matrice nulle de M5 pRq donc l’indice de nilpotence de U est 3.

Etape b : On
¨ choisit
˛ à présent un vecteur
¨ colonne
˛ soit˛ pas dans le noyau de U 2 , par
qui ne ¨
1 2 1
˚0‹ ˚´2‹ ˚0‹
˚ ‹ ˚ ‹ 2
˚ ‹
˚0‹, puis on calcule U Y “ ˚ 0 ‹ et U Y “ ˚0‹.
exemple Y :“ ˚ ‹ ˚ ‹ ˚ ‹
˝0‚ ˝0‚ ˝1‚
0 1 0
Etape c : L’indice de nilpotence de U est strictement inférieur à 5.

Etape d : On choisit un vecteur colonne Z P M5,1 pRq tel que tZU 2 Y ‰ 0, par exemple
¨ ˛
1
˚0‹
˚ ‹
Z :“ ˚˚0‹ (attention Z est “moralement différent de Y ” : Z correspond à une forme linéaire),
‹
˝0‚
0
¨ ˛ ¨ ˛
2 1
˚0‹ ˚0‹
˚ ‹ ˚ ‹
et on calcule Z1 :“ t U Z “ ˚ t 2
˚ 4 ‹ et Z2 :“ U Z “ ˚ 2 ‹.
‹ ˚ ‹
˝´2‚ ˝´1‚
´3 ´2
Etape e : On détermine à présent une base du sous-espace vectoriel de M5,1 pRq des vecteurs
¨ ˛
x1
˚x2 ‹
˚ ‹ t t t
colonnes X “ ˚ ˚x3 ‹ qui vérifient ZX “ Z1 X “ Z2 X “ 0, i.e.
‹
˝x4 ‚
x5

$
&x1
’ “0
2x1 ` 4x3 ´ 2x4 ´ 3x5 “0
’
x1 ` 2x3 ´ x4 ´ 2x5 “0
%
3.8. RÉDUCTION DE JORDAN 73
$¨ ˛ ¨ ˛,
’
’ 0 0 //
&˚1‹ ˚0‹
’
’ ˚ ‹ ˚ /
/
‹.
par exemple la famille ˚0‹ , ˚1‹ .
˚ ‹ ˚ ‹
’
’
’ ˝0‚ ˝2‚/ /
/
’
% /
-
0 0
Etape f : On note ¨ ˛
1 2 1 0 0
˚0 ´2 0 1 0‹
˚ ‹
˚0 0 0 0 1‹
Q0 :“ ˚ ‹
˝1 0 0 0 2‚
0 1 0 0 0
et on a ¨ ˛
0 1 0 0 0
˚0 0 1 0 0‹
˚ ‹ 0
Q´1
0 U Q0 “ ˚0
˚ 0 0 0 0‹
‹ “ J3,2 .
˝0 0 0 0 1‚
0 0 0 0 0
Etape 3 : On note P :“ Q0 et on a
¨ ˛
3 1 0 0 0
˚0 3 1 0 0‹
˚ ‹
P ´1 ˚0
AP “ ˚ 0 3 0 0‹‹ “ J3,2 p3q.
˝0 0 0 3 1‚
0 0 0 0 3
Remarque 3.8.9. Le fait que, dans l’exemple 3.8.8 ci-dessus, la matrice Q´1
0 U Q0 ait directement
été de la forme voulue est un “heureux hasard”. Si l’on avait choisi, pour
$¨ ˛ base¨ du
˛,sous-espace
’
’ 0 0 /
/
1 ‹ ˚0‹/
’
’
&˚˚ ‹ ˚ ‹
/
.
t t t
vectoriel tX P M5,1 pRq | ZX “ Z1 X “ Z2 Xu de M5,1 pRq, la famille ˚ 1 ‹ , ˚1‹ , on aurait
˚ ‹ ˚ ‹/
’ 2
’
’
’ ˝ ‚ ˝2‚/ /
% /
-
0 0
posé ¨ ˛
1 2 1 0 0
˚0 ´2 0 1 0‹
˚ ‹
˚0 0 0 1 1‹ .
Q0 :“ ˚ ‹
˝1 0 0 2 2‚
0 1 0 0 0
Pour cette matrice Q0 , on a
¨ ˛
0 1 0 0 0
˚0 0 1 0 0‹ ˆ 0 ˙
˚ ‹ J3 0
Q´1
0 U Q0 “ ˚0
˚ 0 0 0 0 ‹“
‹
r .
˝0 0 U
0 0 1 1‚
0 0 0 ´1 ´1
74 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES

Dans
ˆ ce cas,˙on passe alors à l’étape g : on applique le procédé récursif à laˆmatrice
˙ nilpotente
1 1 1
U
r“ de M2 pRq : l’ordre de nilpotence de U
r est 2, le vecteur Yr :“ n’est pas dans
´1 ´1 0
ˆ ˙ ˆ ˙ ˆ ˙
1 1 1 0 1
son noyau et U Y “
r r . Si l’on note Q la matrice
r r ´1
, on a Q U Q “
r r “ J20 .
´1 0 ´1 0 0
ˆ ˙
I3 0
On passe ensuite à l’étape h : on note Q :“ Q0 r et on a
0 Q
ˆ 0 ˙
´1 J3 0 0
Q UQ “ “ J3,2
0 J20
¨ ˛
0 1 0 0 0
˚0 0 1 0 0‹
˚ ‹
“ ˚˚0 0 0 0 0‹
‹
˝0 0 0 0 1‚
0 0 0 0 0
A l’étape 3 de la méthode appliquée à A, on note alors P :“ Q et on a
¨ ˛
3 1 0 0 0
˚0 3 1 0 0‹
˚ ‹
P ´1 AP “ ˚
˚0 0 3 0 0‹ ‹.
˝0 0 0 3 1‚
0 0 0 0 3
Remarque 3.8.10. La réduction de Jordan permet entre autres de calculer les puissances suc-
cessives d’une matrice triangularisable. Précisément, soit A une matrice triangularisable de
Mn pKq, soient λ1 , . . . , λp les valeurs propres deux à deux distinctes de A et soient P P GLn pKq
et mi1 , . . . , miki P Nzt0u, i P t1, . . . , pu, tels que P ´1 AP soit de forme de Jordan
¨
Jm11 ,...,m1 pλ1 q 0
˛ ¨ ˛ ¨J 0 0
˛
Im 0 m 1 ,...,m1
1
˚ k1
.. ‹ ˚ λ1 . ‹ ˚
k1
.. ‹
˚ . ‹“˝ .. ‚ ` ˚ . ‹.
˝ ‚ ˝ ‚
0 Jmp1 ,...,mp pλp q 0 Imλp 0 0
Jm p p
kp 1,...,m
kp
` ˘k
Comme les deux matrices de cette dernière somme commutent, on peut calculer P ´1 AP “
P ´1 Ak P – et donc Ak – pour tout k P N à l’aide du binôme de Newton. De plus, la nilpotence
de la matrice de droite simplifie l’expression du développement.
¨ ˛
3 ´1 1
Exemple 3.8.11. Reprenons la matrice A “ ˝2 0 1‚ P M2 pRq de l’exemple 3.7.14. Pour
1 ´1 2
¨ ˛
0 1 0
P :“ ˝1 1 0‚ P GL3 pRq, on a
1 0 1
¨ ˛ ¨ ˛ ¨ ˛
1 0 0 1 0 0 0 0 0
P ´1 AP “ ˝0 2 1‚ “ ˝0 2 0‚` ˝0 0 1‚.
0 0 2 0 0 2 0 0 0
3.8. RÉDUCTION DE JORDAN 75
¨ ˛ ¨ ˛
1 0 0 0 0 0
Soit k P N. Comme les matrices ˝0 2 0‚ et ˝0 0 1‚ commutent, on a
0 0 2 0 0 0
¨ ˛k´i ¨ ˛i
k ˆ ˙ 1 0 0 0 0 0
ÿ i
P ´1 Ak P “ ˝0 2 0‚ ˝0 0 1‚
k
i“0 0 0 2 0 0 0
¨ ˛k ¨ ˛k´1 ¨ ˛ ¨ ˛2
1 0 0 1 0 0 0 0 0 0 0 0
“ ˝0 2 0‚ ` k ˝0 2 0‚ ˝0 0 1‚ (car la matrice ˝0 0 1‚ est nulle)
0 0 2 0 0 2 0 0 0 0 0 0
¨ ˛ ¨ ˛
1 0 0 0 0 0
“ ˝0 2k 0 ‚` k ˝0 0 2k´1 ‚
0 0 2k 0 0 0
¨ ˛
1 0 0
“ ˝0 2k k2k´1 ‚
0 0 2k
¨ ˛
´1 1 0
Enfin, P ´1 “˝ 1 0 0‚ donc
1 ´1 1
¨ k
2 ` k2k´1 ´k2k´1 k2k´1
¨ ˛ ˛
1 0 0
Ak “ P ˝0 2k k2k´1 ‚P ´1 “ ˝2k ` k2k´1 ´ 1 ´k2k´1 ` 1 k2k´1 ‚.
0 0 2k 2k ´ 1 ´2k ` 1 2k
76 CHAPITRE 3. RÉDUCTION DES ENDOMORPHISMES
Chapitre 4

Exponentielle de matrices

4.1 Introduction
On introduit dans ce chapitre une généralisation de la fonction exponentielle aux espaces
de matrices. Cette “exponentielle de matrices” permet notamment de résoudre les systèmes dif-
férentiels linéaires du premier ordre à coefficients constants, et peut se calculer à l’aide de la
réduction de Jordan.

Dans tout ce chapitre, K désigne les corps R ou C, et m est un entier naturel non nul.

4.2 Norme de matrices

On commence ce chapitre en munissant le K-espace vectoriel Mm pKq d’une norme. Tout
d’abord, si p, q P Nzt0u et si M “ pmi j q1ďiďp,1ďjďq P Mp,q pCq, on note M la matrice pmi j q1ďiďp,1ďjďq
de Mp,q pCq.

Définition et Proposition 4.2.1. Pour tout A “ pai j q1ďi,jďm P Mm pKq, on définit

d ÿ b ` ˘
}A} :“ |ai j |2 “ Tr t A A P r0, `8r.
1ďi,jďm

Mm pKq Ñ r0, `8r

L’application } ¨ } : est une norme et le couple pMm pKq, } ¨ }q est
A ÞÑ }A}
donc un K-espace vectoriel normé.

Mm pRq Ñ r0,a`8r
Démonstration. Si K “ R, l’application } ¨ } : est la norme
A ÞÑ }A} “ Tr ptA Aq
Mm pRq ˆ Mm pRq Ñ `R ˘ défini dans
euclidienne associée au produit scalaire x¨, ¨y :
pA, Bq ÞÑ Tr tAB
l’exemple 2.2.2 3.

77
78 CHAPITRE 4. EXPONENTIELLE DE MATRICES

Mm pCq Ñ r0,
b`8r
Si K “ C, l’application }¨} : ` ˘ est la norme induite de façon
A ÞÑ }A} “ Tr t A A
Mm pCq ˆ Mm pCq Ñ `C ˘ qui est un produit scalaire hermitien.
analogue par l’application
pA, Bq ÞÑ Tr t AB

Remarque 4.2.2. • Si E est un C-espace vectoriel, une application x¨, ¨y : E ˆ E Ñ C est

appelée produit scalaire hermitien si
1. pour tous v1 , v2 , w P E et tous λ, µ P C, xλv1 ` µv2 , wy “ λxv1 , wy ` µxv2 , wy,
2. pour tous v, w P E, xw, vy “ xv, wy (en particulier, pour tout v P E, xv, vy P R),
3. pour tout v P E, xv, vy ě 0, et xv, vy “ 0 si et seulement si v “ 0E ,
et, dans ce cas, elle induit une application } ¨ } : E Ñ r0; `8r ; v ÞÑ xv, vy qui vérifie
l’inégalité de Cauchy-Schwarz et est une norme, appelée norme hermitienne.
• Soit n P Nzt0u, pour tous v “ px1 , . . . , xn q et w “ py1 , . . . , yn q dans Cn , on définit
n
ÿ
xv, wycan :“ x1 y1 ` ¨ ¨ ¨ ` xn yn “ xi yi .
i“1

Cn ˆ Cn Ñ C
L’application x¨, ¨ycan : est alors un produit scalaire hermitien
pv, wq ÞÑ xv, wycan
sur Cn , appelé produit scalaire hermitien canonique sur Cn .
Cette norme } ¨ } sur Mm pKq possède une propriété qui n’est, en général, pas vérifiée par la
norme d’un espace vectoriel normé quelconque :
Lemme 4.2.3. Soient A, B P Mm pKq. On a }AB} ď }A}}B}.
Démonstration. On note A “ pai j q1ďi,jďm et B “ pbi j q1ďi,jďm . Pour i, j P t1, . . . , mu, on note
également vi :“ pai 1 , . . . , ai m q, wj :“ pb1 j , . . . , bm j q P Km (il s’agit respectivement de la ième
ligne de A et de la transposée de la j ème colonne de B. On a alors
ˇ ˇ2
ÿ ˇˇ ÿ m ˇ
2
ai k bk j ˇ
ˇ
}AB} “ ˇ
ˇ
1ďi,jďm k“1
ˇ
ˇxvi , wj y ˇ2
ÿ ˇ ˇ
“ can
1ďi,jďm
ÿ
ď }vi }2can }wj }2can
1ďi,jďm
˜ ¸˜ ¸
m m ˇ
ˇbl j ˇ2
ÿ ÿ 2
ÿ ˇ
“ |ai k |
1ďi,jďm k“1 l“1
¨ ˛¨ ˛
ÿ ÿ
“ ˝ |ai k |2 ‚˝ |bl j |2 ‚
1ďi,kďm 1ďj,lďm
2 2
“ }A} }B}
4.3. DÉFINITION ET PROPRIÉTÉS DE BASE 79

Remarque 4.2.4. En particulier, si A P Mm pKq et n P N, }An } ď }A}n .

En tant qu’espace vectoriel normé, on peut définir sur pMm pKq, } ¨ }q une notion de limite
et donc également une notion de continuité. A titre d’exemples, si A P Mm pKq, les applications
Mm pKq Ñ Mm pKq ; M ÞÑ AM et Mm pKq Ñ Mm pKq ; M ÞÑ M A sont continues : en effet, si
M0 , M P Mm pKq,
}AM ´ AM0 } “ }ApM ´ M0 q} ď }A}}M ´ M0 }

et
}M A ´ M0 A} “ }pM ´ M0 qA} ď }M ´ M0 }}A}.

On peut également définir une notion de convergence pour les suites et les séries de matrices.
Nous allons, dans la section suivante, associer à toute matrice de Mn pKq la somme d’une série de
matrices absolument convergente, dont l’expression généralise le développement en série entière
de la fonction exponentielle sur R (et C).

4.3 Définition et propriétés de base de l’exponentielle de ma-

trices
ÿ An
Proposition et Définition 4.3.1. Soit A P Mm pKq. La série est absolument conver-
n
n!
`8
ÿ An
gente (en particulier convergente) et on note exppAq :“ sa somme.
n“0
n!

ÿ An
Démonstration. Rappelons tout d’abord que la notation désigne la suite des sommes
n
n!
˜ ¸
k
ÿ An
partielles . Une série est dite convergente si sa suite des sommes partielles est
n“0
n!
kPN
convergente et, dans ce cas, on appelle somme de la série la limite de la suite des sommes
partielles.
ÿ An
Nous allons montrer que la série est absolument convergente i.e. que la série numé-
n
n!
ÿ › An ›
› ›
rique › › est convergente. Rappelons qu’une série absolument convergente est en particulier
› n! ›
n
convergente.
› n› n
Pour tout n P N, on a 0 ď › An! › ď }A}n! (par le lemme 4.2.3), or la série (numérique)
ÿ }A}n
est (absolument) convergente (sa somme est l’exponentielle de }A}), donc la série
n ›
n!
ÿ › An › ÿ An
›
› › converge également. Ainsi, la série est absolument convergente.
› n! › n!
n n
80 CHAPITRE 4. EXPONENTIELLE DE MATRICES

Définition 4.3.2. On appelle l’application

Mn pKq Ñ Mn pKq
`8
ÿ An
exp :
A ÞÑ exppAq “
n“0
n!

l’application exponentielle de Mn pKq.

Remarque 4.3.3. • Si A P Mn pKq, on note également eA :“ exppAq.

• Pour m “ 1, on retrouve l’expression (du développement en série entière) de la fonction

exponentielle exp : K Ñ K.
Exemple 4.3.4. 1. On calcule l’exponentielle d’une matrice ˛n ¨ n de Mm pKq˛:
¨ diagonale quelconque
a1 0 a1 0
soient a1 , . . . , am P K, alors, comme pour tout n P N, ˝
˚ . .. ‹
‚ “˝
˚ . .. ‚,
‹

0 am 0 n
am
on a
¨ ˛ ¨ an ˛
a1 0 `8
1
0
ÿ ˚ n!
exp ˝
˚ .. ‹
‚ “ .. ‹
. ˝ . ‚
n“0 a n
0 am 0 m
n!
¨ř`8 an ˛
n“0 n!
1
0
“ ˝
˚ .. ‹
. ‚
ř`8 anm
0
¨ a ˛ n“0 n!
e 1 0
“ ˝
˚ . .. ‹
‚
0 eam

En particulier, si λ P K, exppλIm q “ eλ Im , exppIm q “ eIm et, si 0m désigne la matrice

nulle de Mm pKq, expp0m q “ Im .
¨ ˛
A1 0
2. De manière analogue, si A est une matrice diagonale par blocs de la forme A “ ˝
˚ .. ‹
. ‚
0 Ar
¨ n ˛
A1 0
n
de Mm pKq, alors, pour tout n P N, A “ ˝
˚ . . ‚ et donc
‹
.
0 Arn

¨ A ˛
e 1 0
A
e “˝
˚ .. ‚.
‹
.
0 eAr
4.3. DÉFINITION ET PROPRIÉTÉS DE BASE 81

3. Soit J P Mm pKq une matrice nilpotente d’indice de nilpotence ν P Nzt0u. Alors, pour tout
n P N, si n ě ν, J n “ 0m et on a donc
ν
ÿ
J Jn J2 J ν´1
e “ “ Im ` J ` ` ¨¨¨ ` .
n“0
n! 2! pν ´ 1q!
¨ ˛
0 1 0
Par exemple, si J désigne la matrice nilpotente ˝0 0 1‚p“ J30 q de M3 pRq, on a J 2 “
0 0 0
¨ ˛
0 0 1
˝0 0 0‚, J 3 “ 03 et donc
0 0 0
J2
eJ “ I3 ` J `
2! ¨
0 0 12
¨ ˛ ˛ ¨ ˛
1 0 0 0 1 0
“ ˝0 1 0‚` ˝0 0 1‚` ˝0 0 0 ‚
0 0 1 0 0 0 0 0 0
1 1 12
¨ ˛

“ ˝ 0 1 1 ‚.
0 0 1
Avant d’énoncer la proposition suivante, on rappelle un résultat relatif
ř au produit
ř de Cauchy
de séries d’un espace vectoriel normé, appliqué ici à pMm pKq,ř} ¨ }qř: si n An et n Bn sont deux
séries absolument convergentes de Mm pKq, alors la série n p nk“0 Ak Bn´k q est absolument
`ř`8 ˘ `ř`8 ˘
convergente et a pour somme n“0 An n“0 B n .
Proposition 4.3.5. Soient A, B P Mm pKq et supposons que AB “ BA. Alors
eA`B “ eA eB .
Démonstration. Comme A et B commutent,ˆon˙peut appliquer la formule du binôme de New-
n
n
ÿ n k n´k
ton : pour tout n P N, on a pA ` Bq “ A B et donc
k“0
k
`8 `8 n
pA ` Bqn
ˆ ˙
A`B
ÿ ÿ ÿ 1 n k n´k
e “ “ A B
n“0
n! n“0 k“0
n! k
`8 n
ÿ ÿ 1
“ Ak B n´k
n“0 k“0
k!pn ´ kq!
`8 n
ÿ ÿ Ak B n´k
“
n“0 k“0
k! pn ´ kq!
˜ ¸˜ ¸
`8
ÿ An `8
ÿ Bn
“ (les deux séries sont absolument convergentes)
n“0
n! n“0
n!
“ eA eB
82 CHAPITRE 4. EXPONENTIELLE DE MATRICES

Remarque 4.3.6. Si A, B P Mm pKq commutent, on a eA eB “ eA`B “ eB`A “ eB eA , en

particulier les matrices eA et eB commutent également.
` ˘´1
Corollaire 4.3.7. Soit A P Mm pKq. La matrice eA P Mm pKq est inversible et eA “ eÁ .
Démonstration. Les matrices A et Á commutent : ApÁq “ ApÍm qA “ pÁqA. On a donc,
par la proposition précédente, eÁ eA “ eA eÁ “ eA`pÁq “ e0m “ Im .

Soit A P Mm pKq et soit P P GLm pKq une matrice inversible. L’exponentielle de la conjuguée
de A par P est la conjuguée de exppAq par P :
Proposition 4.3.8. On a
exp P ´1 AP “ P ´1 eA P.
` ˘

ÿ P ´1 AP n
` ˘
` ´1 ˘
Démonstration. exp P AP est la somme de la série . Or, si k P N,
n
n!
˘n ˜ ¸
k ` ´1 k n k n
ÿ P AP ÿ A ÿ A
“ P ´1 P “ P ´1 P,
n“0
n! n“0
n! n“0
n!

donc
k ` ´1 ˘n
` ´1
˘ ÿ P AP
exp P AP “ lim
kÑ`8
n“0
n!
˜ ¸
k
´1
ÿ An
“ lim P P
kÑ`8
n“0
n!
˜ ˜ ¸¸
k n
ÿ A Mm pKq Ñ Mm pKq
“ P ´1 lim P (l’application est continue)
kÑ`8 n! M ÞÑ P ´1 M P
n“0
“ P ´1 eA P.

Cette “compatibilité” de l’exponentielle de matrices avec le changement de base nous permet

en particulier de montrer l’égalité suivante :
Corollaire 4.3.9. On a
det eA “ eTrpAq .
` ˘

Démonstration. Considérons A comme une matrice de Mm pCq. En tant que telle, elle est tri-
angularisable dans¨ Mm pCq (corollaire
˛ 3.7.4) : il existe une matrice Q P Mm pCq et une matrice
λ1 ‹
triangulaire B “ ˝
˚ .. ‚ P Mm pCq telles que B “ Q´1 AQ (les scalaires λ1 , . . . , λm P C
‹
.
0 λm
sont les valeurs propres complexes, non nécessairement deux à deux distinctes, de A).
4.4. CALCUL VIA LA RÉDUCTION DE JORDAN 83
¨ n ˛
λ1 ‹
Remarquons que, pour tout n P N, B n “ ˝
˚ .. ‚ (le produit de deux matrices
‹
.
0 n
λm
triangulaires supérieures reste triangulaire supérieur) et donc
`8
Bn ÿ
eB “
n“0
n!
¨ λn ˛
1
`8 ‹
ÿ ˚ n!
“ .. ‹
˝ . ‚
n“0 λn
0 m
n!
¨ř`8 λn
1
˛
n“0 n! ‹
˚
“ ˝ .. ‹
. ‚
ř`8 λn
0 m
n“0 n!
¨ ˛
eλ1 ‹
˚
“ ˝ .. ‹
. ‚
0 e λm

Ainsi, comme A “ QBQ´1 , on a

eA “ QeB Q´1 (par la proposition précédente)

¨ λ ˛
e 1 ‹
“ Q˝
˚ .. ‹ ´1
‚Q
.
0 e λ m

et donc
¨ ˛
eλ1 ‹ m řm
det eA “ det ˝
` ˘ ˚ .. ‹ ź λj
“ e “ e j“1 λj “ eTrpBq “ eTrpAq
. ‚
0 e λm j“1

(la trace est invariante par changement de base).

4.4 Calcul de l’exponentielle d’une matrice via la réduction de

Jordan
Soit A une matrice de Mm pKq. Nous allons détailler une méthode pour calculer l’exponen-
tielle de A à partir de sa réduction de Jordan en tant que matrice de Mm pCq.

Soient λ1 , . . . , λp P C les valeurs propres complexes deux à deux distinctes de A. D’après

le théorème 3.8.2, il existe une matrice inversible P P GLm pCq et, pour tout i P t1, . . . , pu, des
entiers mi1 , . . . , miki P Nzt0u tels que
84 CHAPITRE 4. EXPONENTIELLE DE MATRICES

¨ ˛
Jm11 ,...,m1 pλ1 q 0
k1
˚
P ´1 AP “ ˚ .. ‹
‹.
˝ . ‚
0 Jmp1 ,...,mp pλp q
kp

Alors
¨ ¨ ˛ ˛
Jm11 ,...,m1 pλ1 q 0
k1
˚ ˚
exppAq “ exp ˚ P .. ‹ ´1 ‹
‹P ‹
˝ ˝
˚ . ‚ ‚
0 Jm1 ,...,m pλp q
p p
kp
¨ ˛
Jm11 ,...,m1 pλ1 q 0
k1
˚
“ P exp ˚ .. ‹ ´1
‹P (par proposition 4.3.8)
˝ . ‚
0 Jmp1 ,...,mp pλp q
kp
¨ ´ ¯ ˛
exp Jm11 ,...,m1 pλ1 q 0
˚ k1 ‹
“ P˚
˚ .. ‹ ´1
‹P (exemple 4.3.4 3.).
. ´ ¯‚
˝
0 exp Jmp1 ,...,mp pλp q
kp

Ainsi, pour pouvoir calculer exppAq, il nous suffit de savoir calculer exp pJm1 ,...,mk pλqq pour
tous k P Nzt0u, m1 , . . . , mk P Nzt0u et λ P C. Soient donc k P Nzt0u, m1 , . . . , mk P Nzt0u et
λ P C. Notons m0 :“ m1 ` ¨ ¨ ¨ ` mk . On a Jm1 ,...,mk pλq “ λIm0 ` Jm 0 . Or les matrices
1 ,...,mk
0 0
λIm0 et Jm1 ,...,mk commutent et la matrice Jm1 ,...,mk est nilpotente. Si on note ν l’indice de
nilpotence de cette dernière matrice que l’on note simplement J, on a alors

exp pJm1 ,...,mk pλqq “ exp pλIm0 ` Jq

“ exp pλIm0 q exp pJq
J2 J ν´1
ˆ ˙
λ
“ e Im0 Im0 ` J ` ` ¨¨¨ `
2! pν ´ 1q!
2 ν´1
ˆ ˙
λ J J
“ e Im0 ` J ` ` ¨¨¨ `
2! pν ´ 1q!

Remarque 4.4.1. Si A P Mm pRq, alors eA P Mm pRq : même si l’on considère la réduction de

Jordan “complexe” de A pour calculer eA , la matrice que l’on obtient à la fin du calcul ne
possède que des coefficients réels.
ˆ ˙
0 1
Exemple 4.4.2. 1. On considère la matrice A “ de M2 pRq. Son polynôme carac-
´1 0
2
ˆ est˙χA “ X ` 1 qui est scindé à racines simples i et í sur C : si on note
téristique
1 1
P :“ , on a
i í
ˆ ˙
´1 i 0
P AP “
0 í
4.4. CALCUL VIA LA RÉDUCTION DE JORDAN 85

(il s’agit de la réduction de Jordan de A) et

ˆ ˙ ˆ ˙ˆ i ˙ ˆ1 ˙ ˆ ˙
i 0 ´1 1 1 e 0 2
í
2
1 ei ` eí íei ` ieí
exppAq “ P exp P “ 1 i “ .
0 í i í 0 eí 2 2 2 iei ´ ieí ei ` eí

Or,
`8
ÿ in n `8 `8 `8
ÿ píqn ÿ in ` píqn ÿ 2p´1qp ÿ p´1qp
ei ` eí “ ` “ “ “2 “ 2 cosp1q
k“0
n! k“0
n! k“0
n! p“0
p2pq! p“0
p2pq!

et
`8
ÿ in n `8 `8 `8
ÿ píqn ÿ in`1 ` píqn`1 ÿ 2p´1qp`1 ÿ p´1qp
iei íeí “ i í “ “ “ ´2 “ ´2 sinp1q.
k“0
n! k“0
n! k“0
n! p“0
p2p ` 1q! p“0
p2p ` 1q!

Ainsi,
ˆ ˙
cosp1q sinp1q
exppAq “ .
´ sinp1q cosp1q
¨ ˛ ¨ ˛
3 ´1 1 0 1 0
2. Reprenons la matrice A “ ˝2 0 1‚ P M2 pRq de l’exemple 3.8.11. Pour P :“ ˝1 1 0‚ P
1 ´1 2 1 0 1
GL3 pRq, on a ¨ ˛
1 0 0 ˆ ˙
J1 p1q 0
P ´1 AP “ ˝0 2 1‚ “
0 J2 p2q
0 0 2
donc ˆ ˙
exppI1 q 0
exppAq “ P P ´1 .
0 exp pJ2 p2qq
ˆ ˙
0 1
Or J2 p2q “ 2I2 ` J20 et, si on note J :“ J20 “ , J 2 “ 02 donc
0 0
ˆˆ ˙ ˆ ˙˙ ˆ ˙
2 2 1 0 0 1 2 1 1
exp pJ2 p2qq “ e pI2 ` Jq “ e ` “e .
0 1 0 0 0 1
Ainsi, ¨ ˛
e 0 0
exppAq “ P ˝0 e2 e2 ‚P ´1 .
0 0 e2
¨ ˛
´1 1 0
Comme P ´1 “ ˝ 1 0 0‚, on a enfin
1 ´1 1
2e2 ´e2 e2
¨ ˛

exppAq “ ˝´e ` 2e2 e ´ e2 e2 ‚.

´e ` e2 e ´ e2 e2
86 CHAPITRE 4. EXPONENTIELLE DE MATRICES

Remarque 4.4.3. Dans le premier exemple, plutôt que de passer par la réduction de Jordan, on
aurait pu remarquer que, pour tout n P N,
$˜ ¸
’ 1 0
si n “ 4q, q P N,
’
’
’
’
’
’
’ ˜0 1 ¸ $˜ ¸
p
’
’
’ 0 1 ’ p´1q 0
si n “ 4q ` 1, q P N, si n “ 2p, p P N,
’ ’
ˆ ˙n ’ ’
& ´1 0
’
’ p
n 0 1
& 0 p´1q
A “ “ ˜ ¸ “ ˜ ¸
´1 0 ’ ´1 0 ’ 0 p´1q p
si n “ 4q ` 2, q P N, si n “ 2p ` 1, p P N.
’
’ ’
’
’
’
’ 0 ´1 % p´1qp`1
’
0
’
’ ˜ ¸
’
’
’ 0 ´1
si n “ 4q ` 3, q P N,
’
’
’
% 1 0

4.5 Application à la résolution des systèmes différentiels linéaires

d’ordre 1 à coefficients constants
On s’intéresse dans cette section aux systèmes différentiels linéaires de la forme

X 1 “ AX

où A est une matrice de Mm pKq quelconque fixée et où la fonction inconnue X désigne une
fonction vectorielle dérivable
R Ñ Km¨– Mm,1˛pKq
x1 ptq
˚ .. ‹ ,
t ÞÑ ˝ . ‚
xm ptq
autrement dit aux systèmes de la forme
$
1
&x1 “ a1 1 x1 ` ¨ ¨ ¨ ` a1 m xm
’
’
.. ..
’ . .
’
%x1
m “ am 1 x1 ` ¨ ¨ ¨ ` am m xm

où pai j q1ďi,jďm P Mm pKq et les fonctions inconnues x1 , . . . , xm sont des fonctions dérivables de
R dans R.

Précisément, soit A une matrice de Mm pKq. On souhaite déterminer l’ensemble des fonctions
vectorielles dérivables X : R Ñ Rm telles que, pour tout t P R, X 1 ptq “ AXptq.

Le premier pas dans cette direction est le suivant : considérons l’application

R Ñ Mm pKq
ϕ:
t ÞÑ etA

Nous allons montrer que ϕ est dérivable sur R et donner l’expression de la dérivée de ϕ :
4.5. RÉSOLUTION DES SYSTÈMES DIFFÉRENTIELS LINÉAIRES 87

Proposition 4.5.1. La fonction ϕ est dérivable sur R et, pour tout t P R, ϕ1 ptq “ AetA .

Démonstration. Soit t P R. On montre que l’expression

ept`hqA ´ etA
h

possède une limite finie quand h tend vers 0 et que cette limite est égale à AetA .
Soit donc h P R˚ . Remarquons tout d’abord que, puisque les matrices tA et hA commutent,

ept`hqA ´ etA ehA etA ´ etA ehA ´ Im tA

“ “ e ,
h h h
hA
et nous allons en fait montrer
› hA › que la quantité e h´Im tend vers A quand h tend vers 0, i.e. que
la quantité › e ´Ihm ´hA › tend vers 0 quand h tend vers 0.
› ›

phAqn ÿ phAqn
`8
ÿ `8
Comme ehA “ “ Im ` hA ` , on a
n“0
n! n“2
n!
› ›
› › `8 n› `8
ÿ }hA}n
› › ÿ phAq ›
›
› hA
›e ´ Im ´ hA› “ › ›ď “ e}hA} ´ 1 ´ }hA} “ e|h|}A} ´ 1 ´ |h|}A},
›n“2 n! › n“2 n!

donc › hA ›
› e ´ Im ´ hA › e|h|}A} ´ 1
› ›ď ´ }A}.
› h › |h|
e|h|}A} ´1
Or, quand h tend vers 0, |h| tend vers 0 et la quantité |h|tend alors vers la dérivée de
› hA ›
la fonction R Ñ R ; t ÞÑ et}A} en 0, c’est-à-dire }A}. Ainsi, la quantité › e Íhm ´hA › tend donc
› ›
bien vers 0 quand h tend vers 0.
pt`hqA tA hA
Au total, la quantité e h
é
“ e hÍm etA tend donc bien vers AetA quand h tend vers
0 : l’application ϕ est donc bien dérivable en t et ϕ1 ptq “ AetA .

On s’intéresse à présent à la résolution du système différentiel linéaire pSq X 1 “ AX de

fonction vectorielle dérivable inconnue X : R Ñ Km . Les solutions de pSq sont données par
l’exponentielle de matrices :

Proposition 4.5.2. Les solutions de pSq sont les fonctions vectorielles de la forme

R Ñ Km
X:
t Ñ etA X0

avec X0 P Km .
88 CHAPITRE 4. EXPONENTIELLE DE MATRICES

Démonstration. On montre tout d’abord que, si X0 P Km , la fonction dérivable X : R Ñ

Km ; t ÞÑ etA X0 est une solution de pSq : pour tout t P R, on a, d’après la proposition
précédente,
X 1 ptq “ AetA X0 “ AXptq.
Réciproquement, soit X : R Ñ Km une solution de pSq et considérons la fonction dérivable
Y : R Ñ Km ; t ÞÑ e´tA Xptq. Pour tout t P R, on a
` ˘
Y 1 ptq “ ´Ae´tA Xptq ` e´tA X 1 ptq “ e´tA X 1 ptq ´ AXptq “ 0

donc il existe un vecteur X0 P Rm tel que, pour tout t P R, Y ptq “ X0 ô Xptq “ etA X0 .

Remarque 4.5.3. • Si X0 P Km , la fonction X : R Ñ Km ; t ÞÑ etA X0 est l’unique solution

de pSq prenant pour valeur X0 en 0 (on a Xp0q “ e0m X0 “ Im X0 “ X0 ). L’égalité
Xp0q “ X0 est appelée condition initiale en 0.

• Pour m “ 1, on retrouve la résolution des équations différentielles linéaires du premier

ordre x1 ptq “ axptq avec a P K et x : R Ñ R.
Exemple 4.5.4. On considère la matrice
¨ ˛
3 ´1 1
A :“ ˝2 0 1‚ P M3 pRq
1 ´1 2

de l’exemple 4.4.2 2. et le système différentiel linéaire pSq X 1 “ AX, avec X : R Ñ R3 , dont on

souhaite déterminer l’ensemble des solutions.
D’après la proposition précédente, les solutions de pSq sont les fonctions de la forme X :
R Ñ Km ; t ÞÑ etA X0 avec X0 P R3 . Soit t P R et calculons donc etA .
En reprenant les notations de l’exemple 4.4.2 2., on a
¨ ˛
1 0 0 ˆ ˙
1 0
A “ P ˝0 2 1‚P ´1 “ P P ´1
0 J2 p2q
0 0 2

donc ¨ ˛
t 0 0 ˆ ˙
´1 t 0
tA “ P 0 2t t P “ P
˝ ‚ P ´1
0 tJ2 p2q
0 0 2t
et ˆ ˙
expptq 0
expptAq “ P P ´1 .
0 exp ptJ2 p2qq

Or tJ2 p2q “ 2tI2 ` tJ20 et, notant J :“ J20 , J 2 “ 02 donc ptJq2 “ t2 J 2 “ 02 et

ˆˆ ˙ ˆ ˙˙ ˆ ˙
2t 2t 1 0 0 t 2t 1 t
exp ptJ2 p2qq “ expp2tI2 q expptJq “ e pI2 ` tJq “ e ` “e .
0 1 0 0 0 1
4.5. RÉSOLUTION DES SYSTÈMES DIFFÉRENTIELS LINÉAIRES 89

Ainsi,
¨ t ˛
e 0 0
expptAq “ P ˝ 0 e2t te2t ‚P ´1
0 0 e2t
e2t ` te2t ´te2t te2t
¨ ˛

“ ˝ t 2t
´e ` e ` te 2t e ´ te2t
t te2t ‚
t
´e ` e 2t et ´ e2t e2t

Les solutions du système différentiel pSq sont donc les fonctions de la forme

R Ñ ¨ R3
e2t te2t ´te2t te2t
˛
`
t Þ Ñ ˝´et ` e2t ` te2t e ´ te2t
t te2t ‚X0
´et ` e2t et ´ e2t e2t

avec X0 P R3 .
90 CHAPITRE 4. EXPONENTIELLE DE MATRICES
Chapitre 5

Orthogonalité et réduction

5.1 Introduction
Dans ce chapitre, on aborde la question de la réductibilité de certaines classes d’endomor-
phismes des espaces euclidiens. En particulier, on montre que tout endomorphisme auto-adjoint
est diagonalisable dans une base orthonormale, et que tout endomorphisme orthogonal est dia-
gonalisable par blocs, suivant des blocs de rotations vectorielles de dimension 2 ou 1.
On abordera également la notion de positivité d’une matrice symétrique, montrant no-
tamment qu’une matrice symétrique positive possède une “racine carrée”. Cela nous permettra
d’établir l’existence d’une “décomposition polaire” pour toute matrice à coefficients réels inver-
sible.

5.2 Diagonalisabilité et diagonalisation des endomorphismes auto-

adjoints
Soit pE, x¨, ¨yq un espace euclidien de dimension n P Nzt0u et soit f un endomorphisme de
E. On rappelle tout d’abord la définition d’un endomorphisme auto-adjoint de E, donnée pour
la première fois à la remarque 2.7.3 :
Définition 5.2.1. On dit que l’endomorphisme f de E est auto-adjoint ou symétrique si f ˚ “ f .
Remarque 5.2.2. Suivant la définition de l’adjoint d’un endomorphisme d’un espace euclidien
(cf proposition et définition 2.7.1), l’endomorphisme f de E est symétrique si et seulement si,
pour tous vecteurs v et w de E,

xf pvq, wy “ xv, f pwqy .

L’endomorphisme f est symétrique si et seulement sa matrice dans une base orthonormale

de pE, x¨, ¨yq est symétrique :
Proposition 5.2.3. Soit B une base orthonormale de E et notons A :“ MatB pf q la matrice
représentative de f dans B. Alors f est symétrique si et seulement si la matrice A est symétrique
i.e. tA “ A.

91
92 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION

Démonstration. D’après la proposition 2.7.5, la matrice représentative de f ˚ dans B est la

transposée de A. Or f ˚ “ f si et seulement si les matrices représentatives de f et f ˚ dans B
sont égales i.e. si et seulement si tA “ A.

Exemple 5.2.4. L’endomorphisme h : R2 Ñ R2 ; px, yq ÞÑ px ` 2y, 2x ` yq de R2 est auto-adjoint

par rapport au produit scalaire canonique de R2 .
Une propriété remarquable des endomorphismes auto-adjoints est qu’ils sont diagonalisables,
et ce, dans une base orthonormale. Avant d’énoncer ce résultat, donnons la définition suivante :
deux sous-espaces vectoriels F1 et F2 de E sont dits orthogonaux si pour tous vecteurs v1 de
F1 et v2 de F2 , xv1 , v2 y “ 0.

Théorème 5.2.5. On suppose que l’endomorphisme f est auto-adjoint. Alors

• f est diagonalisable,

• les sous-espaces propres de f sont orthogonaux deux à deux.

En particulier, si l’on considère, pour chacun de ces espaces propres, une base orthonormale, la
réunion de ces bases est une base orthonormale de E : f est donc diagonalisable dans une base
orthonormale de E.

Démonstration. On commence par montrer que le polynôme caractéristique de f est scindé sur
R. Pour cela, soit B0 une base orthonormale de E et considérons la matrice A :“ MatB0 pf q de
f dans B0 . A est une matrice de Mn pRq et peut être également considérée comme une matrice
de Mn pCq. Nous allons montrer que les racines complexes du polynôme caractéristique de A
(autrement dit les valeurs propres complexes de A) sont toutes réelles : χf “ χA sera donc
également scindé sur R. ¨ ˛
x1
˚ .. ‹
Soit donc une valeur propre complexe λ P C de A et montrons que λ P R. Soit X “ ˝ . ‚ P
xn
Mn,1 pCq un vecteur propre de A associé à λ : on a donc AX “ λX. Nous allons appliquer la
conjugaison complexe à cette dernière égalité : si M “ pmi j q1ďiďp,1ďjďq est une matrice de
Mp,q pCq, la matrice conjuguée M de M est la matrice pmi j q1ďi,jďn de Mn pCq. On obtient alors

AX “ λX ô AX “ λ X ô AX “ λ X
(les coefficients de A sont réels).
On considère d’autre part l’égalité t pAXqX “ t XAX, satisfaite car t A “ A (car f est
symétrique : proposition 5.2.3). On y remplace AX par λX (X est un vecteur propre associé à
ÿn n
ÿ
λ) pour obtenir t pλXqX “ t Xλ X i.e. λ |xi |2 “ λ |xi |2 et donc λ “ λ car X n’est pas le
i“1 i“1
vecteur colonne nul (X est un vecteur propre). Ainsi, λ P R.
Le polynôme caractéristique de l’endomorphisme symétrique f est donc scindé sur R. En
particulier, le spectre de f est non-vide.
5.2. DIAGONALISABILITÉ DES ENDOMORPHISMES AUTO-ADJOINTS 93

On montre à présent que f est diagonalisable. On le montre par récurrence sur la dimension
n de E. Précisément, on montre par récurrence l’assertion suivante : pour tout n P Nzt0u, pour
tout espace euclidien pE, x¨, ¨yq de dimension n, pour tout endomorphisme symétrique f de E,
f est diagonalisable.
Toute matrice carrée de taille 1 étant diagonale, le résultat est vrai pour n “ 1.
Supposons à présent la propriété vraie au rang n ´ 1 pour n P Nzt0; 1u fixé, et montrons-la
pour l’endomorphisme symétrique f de l’espace euclidien E de dimension n. Soit λ P R une
valeur propre de f (un tel λ existe car SpR pf q ‰ H). Soit ensuite v un vecteur propre de f
associé à λ et notons F :“ tvuK “ pVect tvuqK . Montrons que F est stable par f : soit w P F
alors
xf pwq, vy “ xw, f pvqy (f est symétrique)
“ xw, λvy (v P Eλ )
“ λ xw, vy
“ 0 (car w P F “ tvuK ).
Ainsi F est stable par F et on peut donc restreindre f en un endomorphisme f|F de F , qui
est également symétrique
´ ¯ rapport à la restriction du produit scalaire x¨, ¨y sur F ). Comme
(par
K
dimpF q “ dim pVect tvuq “ dimpEq ´ dim pVecttvuq “ n ´ 1, on peut ensuite appliquer
l’hypothèse de récurrence à l’endomorphisme symétrique f|F de F : f|F est diagonalisable i.e. il
existe une base de F formée de vecteurs propres e2 , . . . , en pour f|F . Les sous-espaces vectoriels
Vecttxu et F étant en somme directe, la famille tv, e2 , . . . , en u est alors une base de E, formée
de vecteurs propres pour f donc f est diagonalisable.

On montre enfin que les sous-espaces propres de f sont deux à deux orthogonaux. Soient
donc λ1 et λ2 deux valeurs propres distinctes de f et soient v1 P Eλ1 , v2 P Eλ2 . Montrons que
les vecteurs v1 et v2 sont orthogonaux. On a d’une part
xf pv1 q, v2 y “ xλ1 v1 , v2 y “ λ1 xv1 , v2 y
et, d’autre part, comme f est symétrique,
xf pv1 q, v2 y “ xv1 , f pv2 qy “ xv1 , λ2 v2 y “ λ2 xv1 , v2 y.
Ainsi, λ1 xv1 , v2 y “ λ2 xv1 , v2 y i.e. pλ1 ´ λ2 qxv1 , v2 y “ 0 et donc xv1 , v2 y “ 0 car λ1 ‰ λ2 . Les
vecteurs v1 et v2 sont donc orthogonaux.

Exemple 5.2.6. On considère l’endomorphisme

R3 Ñ R3
f:
px, y, zq ÞÑ p5x ´ y ` 2z, ´x ` 5y ` 2z, 2x ` 2y ` 2zq
de R3 . La matrice représentative de f dans la base canonique de R3 (qui est une base orthonor-
male pour le produit scalaire canonique de R3 ) est
¨ ˛
5 ´1 2
A :“ ˝´1 5 2‚.
2 2 2
94 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION

La matrice A étant symétrique, l’endomorphisme f est auto-adjoint.

Le polynôme caractéristique de f est χf “ p6 ´ Xq2 p´Xq et les valeurs propres de f sont
donc 6 et 0.
On a
E6 “ Ker pf ´ 6 IdR3 q “ px, y, zq P R3 | ´ x ´ y ` 2z “ 0
(

et
E0 “ Ker f.
La famille tp2, 0, 1q, p1, 1, 0qu est une base de E6 . En appliquant le procédé d’orthonor-
malisation de Gram-Schmidt 3
! ) à cette famille libre de R , on obtient la base orthonormale
?1 p2, 0, 1q, ?1 p1, ´5, ´2q de E6 .
5 30
D’autre part, le vecteur ?16 p´1, ´1, 2q de norme 1 engendre E0 .
! )
Si l’on note B :“ ?15 p2, 0, 1q, ?130 p1, ´5, ´2q, ?16 p´1, ´1, 2q , la famille B est alors une base
orthonormale de R3 et la matrice représentative de f dans B est
¨ ˛
6 0 0
˝0 6 0‚.
0 0 0

Le pendant matriciel du théorème 5.2.5 consiste en l’énoncé suivant :

Corollaire 5.2.7. Soit A une matrice de Mn pRq. On suppose que A est symétrique i.e. tA “ A.
Alors il existe une matrice orthogonale O P On pRq et une matrice diagonale D P Mn pRq telles
que
D “ O´1 AO “ t OAO

Démonstration. A est la matrice représentative d’un endomorphisme h de Rn dans la base

canonique B0 de Rn , qui est une base orthonormale pour le produit scalaire canonique de Rn .
Comme A est symétrique, h est auto-adjoint et, par le théorème précédent, il existe une base
orthonormale B et une matrice diagonale D P Mn pRq telle que MatB phq “ D.
Les bases B0 et B étant des bases orthonormales de Rn , la matrice de passage O :“ PB0 ÑB
est une matrice orthogonale (proposition 2.8.12) et on a alors
t
OAO “ O´1 AO “ PBÑB0 MatB0 phq PB0 ÑB “ MatB phq “ D.

¨
˛
5 ´1 2
Exemple 5.2.8. Si l’on reprend la matrice A :“ ˝´1 5 2‚ définie dans l’exemple 5.2.6
2 2 2
précédent et si l’on note
?2 ?1 ?1
¨ ˛
5 30 6
O :“ ˝ 0
˚ ´5
? ?1 ‹ ,
30 6‚
?1 ´2
? ´2
?
5 30 6
5.3. MATRICES SYMÉTRIQUES POSITIVES 95

la matrice O est orthogonale et

¨ ˛
6 0 0
O´1 AO “ t OAO “ ˝0 6 0‚.
0 0 0

5.3 Matrices symétriques positives

Soit n P Nzt0u. Dans cette section, nous allons considérer des matrices symétriques réelles
particulières. On commence par noter Sn pRq l’ensemble des matrices symétriques de Mn pRq.

Définition 5.3.1. Soit A P Sn pRq. On dit que A est

• positive si, pour tout X P Mn,1 pRq, t XAX ě 0,

$¨ ˛,
& 0 /
’ .
• définie positive si, pour tout X P Mn,1 pRqz ˝ ... ‚ , t XAX ą 0.
˚ ‹
’ /
0
% -

¨ ˛
1 1 0
Exemple 5.3.2. 1. La matrice symétrique A :“ ˝1 2 0‚ P M3 pRq est définie positive :
0 0 3
¨ ˛
x
pour tout X “ ˝y ‚ P M3,1 pRq,
z

t
XAX “ x2 ` 2y 2 ` 3z 2 ` 2xy “ px ` yq2 ` y 2 ` 3z 2 ě 0,
¨ ˛
0
et cette quantité est égale à 0 ssi x “ y “ z “ 0 ssi X “ 0‚.
˝
0
˛¨
2 ´3 0
2. La matrice symétrique B :“ ˝´3 11 0‚ P M3 pRq est positive car, pour tous X “
0 0 0
¨ ˛
x
˝y ‚ P M3,1 pRq,
z

t
XBX “ 2x2 ` 11y 2 ´ 6xy “ px ´ 3yq2 ` x2 ` 2y 2 ě 0,
¨ ˛
` ˘ 0
mais elle n’est pas définie positive car 0 0 1 B ˝0‚ “ 0.
1
96 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION

Remarque 5.3.3. Une matrice symétrique A de Sn pRq est définie positive si et seulement si elle
représente un produit scalaire. En effet, notons tout d’abord B “ te1 , . . . , en u la base canonique
de Rn et définissons l’application

Rn ˆ Rn Ñ R ¨˛
y1
x¨, ¨y : ´ ¯
xn A ˝ ... ‚
řn řn t
` ˘ ˚ ‹
v“ i“1 xi ei , w “ j“1 yj ej ÞÑ x1 ¨ ¨ ¨
yn

Cette application est bilinéaire, symétrique (car A est symétrique), et elle est définie positive
ssi A est définie positive. L’application x¨, ÿ est donc un produit scalaire sur Rn ssi A est définie
positive et, dans ce cas, A “ Matps t
B px¨, ÿq car, pour tout i, j P t1, . . . , nu, Xi AXj “ xei , ej y (cf
preuve de la proposition 2.6.4).
Réciproquement, si A représente un produit scalaire x¨, ÿ d’un espace euclidien E de di-
mension n dans une base B, alors A est une matrice symétrique définie positive : pour tous
X, Y P Mn,1 pRq, t XAY “ xv, wy où v et w sont respectivement les vecteurs de E de coordon-
nées les coordonnées des vecteurs colonnes X et Y dans la base B, et le produit scalaire x¨, ÿ
est défini positif.
Soit A P Sn pRq. Nous allons à présent exhiber une caractérisation du caractère positif, resp.
défini positif, de A en termes de ses valeurs propres. Rappelons que, comme A est symétrique,
son polynôme caractéristique est scindé sur R (cf preuve du théorème 5.2.5).

Proposition 5.3.4. La matrice symétrique A est positive, resp. définie positive, si et seulement
si toutes ses valeurs propres sont positives ou nulles, resp. strictement positives.

Démonstration. Comme A est symétrique, d’après ¨ le corollaire˛5.2.7, il existe une matrice ortho-
λ1 0
gonale O P On pRq et une matrice diagonale D “ ˝
˚ . .. ‚ P Mn pRq telles que t OAO “ D.
‹

0 λn
En particulier, les scalaires λ1 , . . . , λn sont les valeurs propres (non nécessairement deux à deux
distinctes) de A.
Alors

pour tout X P Mn,1 pRq, t XAX ě 0 ssi pour tout Y P Mn,1 pRq, t pOY qApOY q ě 0 (O P GLn pRq)
` ˘
ssi pour tout Y P Mn,1 pRq, t Y t OAO Y ě 0
¨ ˛
y1
˚ .. ‹
ssi pour tout Y “ ˝ . ‚ P Mn,1 pRq, t Y DY ě 0
yn
n
ÿ
ssi pour tous y1 , . . . , yn P R, λi yi2 ě 0.
i“1

n
ÿ
Or, pour tous y1 , . . . , yn P R, λi yi2 ě 0 ssi pour tout i P t1, . . . , nu, λi ě 0 (car, si j P
i“1
5.3. MATRICES SYMÉTRIQUES POSITIVES 97

n
ÿ
t1, . . . , nu, λj “ λi δi2j ).
i“1
Ainsi, la matrice symétrique A est positive si et seulement si toutes ses valeurs propres sont
positives ou nulles.

De façon analogue,
$¨ ˛,
& 0 /
’ .
A est définie positive ssi pour tout X P Mn,1 pRqz ˝ ... ‚ , t XAX ą 0
˚ ‹
’ /
0
% -
n
ÿ
ssi pour tout py1 , . . . , yn q P Rn ztp0, . . . , 0qu, λi yi2 ą 0
i“1
ssi pour tout i P t1, . . . , nu, λi ą 0

n
ÿ
(si pour tout i P t1, . . . , nu, λi ą 0, alors, pour tout py1 , . . . , yn q P Rn , λi yi2 “ 0 ssi pour
i“1
tout i P t1, . . . , nu, yi “ 0).

Exemple 5.3.5. Reprenons les exemples de l’exemple 5.3.2.

! ? ? )
1. On a χA “ X 2 ´ 3X ` 1 p3 ´ Xq donc SppAq “ 3´2 5 , 3`2 5 , 3 , et on peut donc
` ˘

directement en déduire que la matrice symétrique A est définie positive.

! ? ? )
2. On a χB “ X 2 ´ 13X ` 13 p´Xq donc SppAq “ 13´2 117 , 13`2 117 , 0 , et on peut donc
` ˘

directement en déduire que la matrice symétrique B est positive, non définie positive.

Remarque 5.3.6. Une matrice symétrique définie positive est en particulier inversible.
Nous allons montrer plus bas qu’une matrice symétrique positive possède une “racine carrée”.
Pour pouvoir démontrer ce résultat, nous aurons besoin de la propriété de “diagonalisation
simultanée” suivante :

Proposition 5.3.7. Soient K un corps commutatif et E un espace vectoriel sur K de dimension

finie n. Soient f, g P LpEq. Si f et g sont diagonalisables et si f ˝ g “ g ˝ f , alors il existe une
base de E dans laquelle les matrices représentatives de f et g sont toutes deux diagonales (on
dit que f et g sont co-diagonalisables).

Démonstration. Supposons donc que les endomorphismes f et g de E sont diagonalisables et

commutent. Soient λ1 , . . . , λp P K les valeurs propres deux à deux distinctes de f .
98 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION

Soit i P t1, . . . , pu et montrons que le sous-espace propre Eλi de f associé à la valeur propre
λi est stable par g. Soit donc v P Eλi et montrons que gpvq P Eλi : on a

pf ´ λi IdE q pgpvqq “ pf ˝ gqpvq ´ λi gpvq

“ pg ˝ f qpvq ´ λi gpvq (car f et g commutent)
“ g pf pvq ´ λi vq (g est linéaire)
“ g p0E q (car v P Eλi )
“ 0E

donc gpvq appartient bien à Eλi . Comme Eλi est un sev de E stable par l’endomorphisme
diagonalisable g, la restriction g|Eλ de g à Eλi est un endomorphisme diagonalisable de Eλi :
i
il existe donc une base Bi de Eλi dans laquelle la matrice représentative de g|Eλ est diagonale.
i
Mais comme Eλi est le sous-espace propre de f associé à la valeur propre λi , Eλi est stable par
f et la matrice de la restriction f|Eλ est également diagonale dans cette base Bi .
i
Si l’on pose enfin B :“ tB1 , . . . , Bp u, les matrices représentatives de f et g dans la base B
de E sont toutes deux diagonales.

Remarque 5.3.8. • Dans la preuve ci-dessus, on a utilisé la propriété remarquable suivante :

si K est un corps commutatif, E est un K-espace vectoriel, F est un sev de E et f est un
endomorphisme diagonalisable de E tel que f pF q Ă F , alors la restriction de f à F est
un endomorphisme diagonalisable de l’espace vectoriel F . Pour prouver cette assertion,
on peut utiliser le théorème 3.6.6 : le polynôme minimal µf|F de la restriction f|F divise le
polynôme minimal µf de f (car µf est un polynôme annulateur de l’endomorphisme f|F
de F ), or, f étant diagonalisable, µf est un polynôme scindé à racines simples sur K. µf|F
est donc également scindé à racines simples et la restriction f|F est un endomorphisme
diagonalisable de F .

• Le pendant matriciel de la proposition 5.3.7 est l’énoncé suivant. Soient A, B P Mn pRq.

Si A et B sont diagonalisables et si AB “ BA, alors il existe une matrice inversible
P P GLn pRq et des matrices diagonales D1 , D2 P Mn pRq telles que P ´1 AP “ D1 et
P ´1 BP “ D2 (on dit que les matrices A et B sont co-diagonalisables).

• Avec les notations de la proposition 5.3.7, si E est un R-espace vectoriel euclidien et

f et g sont deux endomorphismes auto-adjoints (donc en particulier diagonalisables) qui
commutent, alors il existe une base orthonormale dans laquelle les matrices représentatives
de f et g sont toutes deux diagonales. En effet, conservant les notations de la preuve ci-
dessus, il suffit dans ce cas de considérer, pour chaque i P t1, . . . , pu, une base Bi de Eλi
qui soit orthonormale (la restriction de g à Eλi est également un endomorphisme auto-
adjoint de Eλi ) : les sous-espaces propres de f étant orthogonaux, la base B est alors une
base orthonormale de E.

• Le pendant matriciel de la remarque précédente est l’énoncé suivant. Soient A, B P Sn pRq.

Si AB “ BA, alors il existe une matrice orthogonale O P On pRq et des matrices diagonales
D1 , D2 P Mn pRq telles que t OAO “ D1 et t OBO “ D2 .
5.3. MATRICES SYMÉTRIQUES POSITIVES 99

Théorème et Définition 5.3.9. Soit A P Sn pRq une matrice positive. Il existe une unique
matrice R P Sn pRq positive telle que A “ R2 “ RR. De plus, si A est définie positive, R l’est
également. On appelle R la racine carrée de A.

Démonstration. Montrons tout d’abord l’existence de cette décomposition. Comme A est une
matrice symétrique
¨ ˛ il existe une matrice orthogonale O P On pRq et une matrice dia-
positive,
λ1 0
gonale D “ ˝
˚ .. ‚ P Mn pRq telles que t OAO “ D (car A est symétrique : corollaire
‹
.
0 λn
5.2.7), avec, pour tout i P t1, . . . , nu, ?
λi ě 0 (car A est positive : proposition précédente 5.3.4).
Pour i P t1, . . . , nu, notons µi :“ λi ě 0 et posons
¨ ˛
µ1 0
R :“ O ˝
˚ .. ‹t
‚ O.
.
0 µn

R P Mn pRq est une matrice symétrique (tR “ R) de valeurs propres µ1 , . . . , µn positives ou

nulles donc, par la proposition 5.3.4, R est positive.
Enfin,
¨ ˛ ¨ ˛
µ1 0 µ1 0
R2 “ RR “ O ˝
˚ .. ‹ `t
‚ OO ˝
˘˚ .. ‹t
‚O
. .
0 µn 0 µn
¨ ˛¨ ˛
µ1 0 µ1 0
“ O˝
˚ . .. ‹
‚˝
˚ . .. ‹t
‚ O (O est orthogonale)
0 µn 0 µn
¨ 2 ˛
µ1 0
“ O˝
˚ . .. ‹t
‚O
0 µn2
¨ ˛
λ1 0
“ O˝
˚ .. ‹t
‚O
.
0 λn
“ OD t O
“ A.

Remarquons que si A est définie positive alors, pour tout i P t1, . . . , pu, λi ą 0 donc µi ą 0, et
R est donc également définie positive.

Montrons ensuite l’unicité de la matrice R en tant que matrice symétrique positive dont le
carré est A. Soit R r2 “ A. En particulier, R
r P Sn pRq une matrice positive telle que R r commute
avec A donc avec tout polynôme de matrice en A. Or, si l’on considère un polynôme L P RrXs
100 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION

tel que, pour tout i P t1, . . . , nu, Lpλi q “ µi (par exemple le polynôme donné par l’interpolation
de Lagrange), on a

LpAq “ L OD t O
` ˘

“ OLpDqt O
¨ ˛
Lpλ1 q 0
“ O˝
˚ .. ‹t
‚O
.
0 Lpλn q
¨ ˛
µ1 0
“ O˝
˚ . .. ‹t
‚O
0 µn
“ R

et donc R r commute avec R “ LpAq. Comme, de plus, les matrices R et R r sont diagonalisables
(car symétriques), elles sont co-diagonalisables d’après la proposition 5.3.7 : il existe une matrice
inversible P P GLn pRq et des matrices diagonales D1 , D2 P Mn pRq de coefficients diagonaux
positifs ou nuls (R et Rr sont positives) telles que P ´1 RP “ D1 et P ´1 RP
r “ D2 . Alors

D12 “ P ´1 R2 P “ P ´1 AP “ P ´1 R
r2 P “ D2 .
2

Les matrices D1 et D2 étant toutes deux diagonales à coefficients positifs ou nuls, on obtient
finalement l’égalité D1 “ D2 et donc R “ P D1 P ´1 “ P D2 P ´1 “ R.
r

La preuve de l’existence de la racine carrée d’une matrice symétrique positive nous donne
une méthode pour la calculer :

Exemple 5.3.10. On considère la matrice symétrique

¨ ˛
11 ´5 5
A :“ ˝´5 3 ´3‚ P S3 pRq.
5 ´3 3
5.3. MATRICES SYMÉTRIQUES POSITIVES 101

On a

11 ´ X ´5 5
χA “ det pA ´ XI3 q “ ´5 3´X ´3
5 ´3 3´X
11 ´ X 0 5
“ ´5 ´X ´3
C2 ÐC2 `C3
5 ´X 3 ´ X
11 ´ X 0 5
“ p´Xq ´5 1 ´3
5 1 3´X
11 ´ X 0 5
“ p´Xq ´5 1 ´3
L3 ÐL3 ´L2
10 0 6´X
11 ´ X 5
“ p´Xq
10 6´X
16 ´ X 5
“ p´Xq
C1 ÐC1 `C2 16 ´ X 6 ´ X
1 5
“ p´Xqp16 ´ Xq
1 6´X
“ p´Xqp16 ´ Xqp1 ´ Xq.

En particulier, comme les valeurs propres de A sont positives ou nulles, A est positive (non
définie positive car 0 est une valeur propre de A). $¨ ˛,
& 0 /
¨ ˛ ¨ ˛ ¨ ˛
0 2 1 ’ .
˚ ?1 ‹
Par ailleurs, 1 P E0 (“ Ker A), ´1 P E16 et
˝ ‚ ˝ ‚ ˝ 1 P E1 donc ˝ 2 ‚ est une
‚
1 1 ´1 % ?1 /
’ -
$¨ 2 ˛, $¨2 1 ˛,
? ?
6 3
’
& /
. ’
& /
.
˚´ ?1 ‹ ˚ ?1 ‹
base orthonormale de E0 , ˝ 6‚
est une base orthonormale de E 16 et ˝ 3 ‚ est
% ?1 /
’ - % ´ ?1 /
’ -
6 3
une base orthonormale de E1 . La matrice

?2 ?1
¨ ˛
0 6 3
P :“ ˝ ?12 ´ ?16 ?1 ‹
˚
3 ‚
?1 ?1 ´ ?13
2 6

est alors une matrice orthogonale et on a

¨ ˛
0 0 0
P ´1 AP “ t P AP “ ˝0 16 0‚.
0 0 1
102 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION

La racine carrée de A est donc

¨ ˛ ¨ ˛
0 0 0 3 ´1 1
R :“ P ˝0 4 0‚t P “ ˝´1 1 ´1‚.
0 0 1 1 ´1 1

5.4 Décomposition polaire

Soit n P Nzt0u. L’existence d’une racine carrée pour toute matrice symétrique positive va
nous permettre de montrer le théorème de décomposition suivant :

Théorème 5.4.1 (Décomposition polaire). Soit A P GLn pRq une matrice inversible. Il existe
une matrice orthogonale O P On pRq et une matrice symétrique définie positive S P Sn pRq
telles que A “ OS. De plus, le couple pO, Sq est unique, et l’égalité A “ OS est appelée
la décomposition polaire de A.

Pour démontrer ce résultat, nous aurons besoin du lemme suivant :

Lemme 5.4.2. Soit M P Mn pRq. La matrice tM M de Mn pRq est symétrique positive. Si M est
de plus inversible, la matrice symétrique tM M est alors définie positive.

Démonstration. La matrice tM M est symétrique car

t t
M M “ tM t tM “ tM M.
` ˘ ` ˘

Montrons à présent que toutes les valeurs propres de la matrice symétrique tM M P Sn pRq
sont positives. Pour cela, notons f l’endomorphisme de Rn représenté par M dans la base
canonique. Alors la matrice symétrique tM M est la matrice représentative de l’endomorphisme
auto-adjoint f ˚ ˝ f de pRn , x¨, ¨ycan q dans la base canonique.
Soit donc λ P R une valeur propre de tM M et soit v P Rn un vecteur propre de f associé à
λ. D’une part, on a
xf ˚ ˝ f pvq, vycan “ xf pvq, f pvqycan “ }f pvq}2
et, d’autre part,
xf ˚ ˝ f pvq, vycan “ xλv, vycan “ λ}v}2 .
2
Ainsi, λ “ }f}v}
pvq}
2 ě 0.
Si l’on suppose de plus que M est inversible, alors f est un isomorphisme et, avec les
notations ci-dessus, f pvq ‰ 0Rn . On a donc }f pvq}2 ‰ 0 et λ ‰ 0. La matrice symétrique tM M
est donc dans ce cas définie positive.

Nous montrons maintenant le théorème 5.4.1 :

Démonstration du théorème 5.4.1. On considère la matrice tAA P Mn pRq, qui est symétrique
définie positive par le lemme précédent. On note ensuite S la racine carrée de tAA : S est
également symétrique définie positive.
5.4. DÉCOMPOSITION POLAIRE 103

On pose ensuite O :“ AS ´1 . On a

t t
` ˘
OO “ AS ´1 AS ´1
t ´1 t
“ S A A S ´1
t ´1
“ S S 2 S ´1 (S est la racine carrée de tAA)
t ´1
“ S S
“ S ´1
S (S est symétrique donc t S “ S)
“ In

donc O P On pRq, et on a A “ OS.

Montrons l’unicité de ce couple pO, Sq. Soient donc O r P On pRq une matrice orthogonale et
S P Sn pRq une matrice définie positive telle que A “ OS. Alors
r r r

´ ¯
t t
AA “ r Sr O
O r Sr
t rt
“ S O rOr Sr
tr
“ S Sr (O est orthogonale donc t O rO
r “ In )
“ Sr2 (Sr est symétrique donc t Sr “ S)
r

donc Sr est la racine carrée de t AA donc Sr “ S. Enfin, O

r “ AS ´1 “ O.

La preuve de l’existence de la décomposition polaire pour une matrice inversible nous donne
une méthode pour déterminer cette décomposition :

Exemple 5.4.3. On considère la matrice inversible

¨ ˛
1 2 1
A :“ ˝´2 ´1 ´1‚ P GL3 pRq.
´1 ´1 ´2

Pour déterminer sa décomposition polaire, on commence par calculer la racine carrée de

104 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION
¨ ˛
6 5 5
tAA : on a tAA “ ˝5 6 5‚ et

5 5 6

6´X 5 5
χA “ detpA ´ XI3 q “ 5 6´X 5
5 5 6´X
16 ´ X 5 5
“ 16 ´ X 6 ´ X 5
C1 ÐC1 `C2 `C3
16 ´ X 5 6´X
1 5 5
“ p16 ´ Xq 1 6 ´ X 5
1 5 6´X
1 5 5
“ p16 ´ Xq 0 1 ´ X 0
L2 ÐL2 ´L1 , L3 ÐL3 ´L1
0 0 1´X
“ p16 ´ Xqp1 ´ Xq2
$¨ 1 ˛ , $¨ ˛ ¨ ˛ ,
?
’
& 3 .
/ & 1 1 .
Une base orthonormale de E16 est ˝ ?13 ‚ . Une base de E1 est ˝´1‚, ˝ 0 ‚ . En ap-
˚ ‹
% ?1 /
’ - %
0 ´1
-
3
pliquant le procédé $ ¨ 1 ˛ ¨ 1 ˛,à cette dernière famille libre de M3,1 pRq, on obtient la
d’orthonormalisation
?
& ?2
’ 6
/
.
˚ ?1 ‹ ˚ ?1 ‹
base orthonormale ˝´ 2 ‚, ˝ 6 ‚ de E1 .
´ ?26 -
’ /
% 0
¨ 1 1 1
˛
? ? ?
3 2 6
˚ ?1 ´ ?12 ?1 ‹
En posant P :“ ˝ 3 6 ‚
P O3 pRq, on a alors
?1 0 ´ 6
?2
3
¨ ˛
16 0 0
t
AA “ P ˝ 0 1 0‚t P
0 0 1

et la racine carrée de tAA est donc

¨ ˛ ¨ ˛
4 0 0 2 1 1
S :“ P ˝0 1 0‚t P “ ˝1 2 1‚.
0 0 1 1 1 2
¨1 ˛ ¨ ˛ ¨ ˛
4 0 0 3 ´1 ´1 0 1 0
Enfin, S ´1 “ P ˝ 0 1 0‚t P “ 14 ˝´1 3 ´1‚et on calcule O :“ AS ´1 “ ˝´1 0 0 ‚ P
0 0 1 ´1 ´1 3 0 0 ´1
O3 pRq.
5.5. RÉDUCTION DES ENDOMORPHISMES ET MATRICES ORTHOGONAUX 105

La décomposition polaire de A est ainsi

¨ ˛¨ ˛
0 1 0 2 1 1
A “ ˝´1 0 0 ‚˝1 2 1‚.
0 0 ´1 1 1 2

Remarque 5.4.4. A l’aide d’arguments “topologiques”, on peut montrer que toute matrice de
Mn pRq admet une décomposition polaire (non unique en général).

5.5 Réduction des endomorphismes et matrices orthogonaux

Soit pE, x¨, ¨yq un espace euclidien de dimension n P Nzt0u et soit f un endomorphisme
orthogonal de E. Nous allons montrer le théorème de réduction :

Théorème 5.5.1. Il existe une base orthonormale B de E dans laquelle la matrice représentative
de f est de la forme
¨ ˛
1 0
˚ .. ‹
˚ . ‹
˚ ‹
˚ r ‹
MatB pf q “ ˚ ‹
˚
˚ Rpθ1 q ‹
‹
˚ .. ‹
˝ . ‚
0 Rpθs q

ˆ r, s P N, pour
où ˙ tout i P t1, . . . , ru, i P t`1; ´1u et, pour tout j P t1, . . . , su, Rpθj q “
cos θj ´ sin θj
avec θj P Rztkπ | k P Zu.
sin θj cos θj

La version matricielle de ce résultat est le suivant : si A P On pRq, il existe une matrice

orthogonale P P On pRq telle que P ´1 AP “ t P AP soit de la forme ci-dessus.
Remarque 5.5.2. En particulier, si l’on applique le théorème 5.5.1 en dimensions 2 et 3, on
obtient que :

• Les isométries directes (i.e. les endomorphismes orthogonaux ˆ de déterminant

˙ 1) de R2
cos θ ´ sin θ
sont les rotations de R2 , chacune de matrice représentative , θ P R, dans
sin θ cos θ
la base canonique de R2 .
Les isométries indirectes (i.e. les endomorphismes orthogonaux de déterminant ´1) de R2
sont les symétries
ˆ orthogonales
˙ par rapport à une droite vectorielle, chacune de matrice
1 0
représentative dans une base formée d’un vecteur engendrant la droite vectorielle
0 ´1
et d’un vecteur orthogonal au premier (par rapport au produit scalaire canonique de R2 ).
106 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION

• ¨
Les isométries directes
˛ de R3 sont les rotations autour d’un axe, chacune de matrice
1 0 0
˝0 cos θ ´ sin θ‚, θ P R, dans une base orthonormale correspondante (quand θ “ π,
0 sin θ cos θ
on parle de retournement).
Les isométries indirectes de R3 sont les compositions d’une symétrie orthogonale par rap-
port à un plan (une telle transformation est également appelée réflexion) et d’une rotation
autour de l’axe orthogonal à ce plan
¨ (par rapport au produit
˛ scalaire canonique de R3 ),
´1 0 0
chacune de matrice représentative ˝ 0 cos θ ´ sin θ‚, θ P R, dans une base orthonor-
0 sin θ cos θ
¨ ˛ ¨ ˛¨ ˛
´1 0 0 1 0 0 ´1 0 0
male correspondante (˝ 0 cos θ ´ sin θ‚ “ ˝0 cos θ ´ sin θ‚˝ 0 1 0‚).
0 sin θ cos θ 0 sin θ cos θ 0 0 1
Pour montrer le théorème 5.5.1, nous utiliserons le lemme suivant :
Lemme 5.5.3. Soit F un sev de E. Si F est stable par l’endomorphisme orthogonal f , alors
l’orthogonal F K de F est également stable par f .
Démonstration. Soit v P F K . On montre que f pvq P F K . Soit donc w P F . Comme, pour tous
w1 , w2 P F , on a xf pw1 q, f pw2 qy “ xw1 , w2 y (car f est orthogonal), la restriction f|F de f à F
(F est stable par f ) est un endomorphisme orthogonal de F , en particulier, il est bijectif : il
existe donc w r P F tel que w “ f pwq. r
On a alors
xf pvq, wy “ xf pvq, f pwqy
r
“ xv, wy
r (car f est orthogonal)
“ 0 (car v P F K et w
r P F ).

Démonstration du théorème 5.5.1. On procède par récurrence sur la dimension n de E : on

montre par récurrence que pour tout n P Nzt0u, tout espace euclidien pE, x¨, ¨yq de dimension n
et tout endomorphisme orthogonal f de E, il existe une base orthonormale de E dans laquelle
la matrice représentative de f est de la forme voulue.

Pour n “ 1, soit E “ Vecttvu un R-espace vectoriel de dimension 1 muni d’un produit

scalaire x¨, ¨y et soit f un endomorphisme orthogonal de E. Il existe α P R tel que f pvq “ αv
et alors }f pvq} “ }αv} “ |α|}v}. De plus, comme f est orthogonal, on a }f pvq} “ }v} donc
|α|}v} “ }v} et donc |α| “ 1 (}v} ‰ 0 car v ‰ 0E car v engendre E). ) α P t`1; ´1u et la
! Ainsi
v
matrice de f dans la base tvu, ainsi que dans la base orthonormale }v} , est pαq.

Supposons maintenant la propriété vérifiée pour tout entier naturel non nul strictement
plus petit que n avec n P Nzt0u fixé et considérons l’endomorphisme orthogonal f de l’espace
euclidien E de dimension n.
5.5. RÉDUCTION DES ENDOMORPHISMES ET MATRICES ORTHOGONAUX 107

On commence par traiter le cas où f possède une valeur propre réelle λ P R (i.e. le polynôme
caractéristique de f possède une racine dans R). Soit alors v un vecteur propre de f pour la
valeur propre λ. On a }f pvq} “ }λv} “ |λ|}v} et, d’autre part, }f pvq} “ }v} car f est orthogonal.
Ainsi |λ|}v} “ }v} et donc |λ| “ 1 (car v est un vecteur propre de f donc v ‰ 0E donc }v} ‰ 0).
Ainsi, λ P t`1; ´1u. De plus, comme F :“ Vecttvu est stable par f (car v est un vecteur
K
propre
` Kde˘ f ), l’orthogonal F de F est également stable par f par le lemme 5.5.3 : comme
dim F “ n ´ 1 ă n, on peut alors appliquer l’hypothèse de récurrence à l’endomorphisme
orthogonal f|F K de F K et obtenir l’existence d’une base orthonormale B0 de F K telle que
¨ ˛
1 0
˚ .. ‹
˚ . ‹
´ ¯ ˚˚ r
‹
‹
MatB0 f|F K “ ˚ ‹
˚
˚ Rpθ1 q ‹
‹
˚ .. ‹
˝ . ‚
0 Rpθs q

où r, s P N, pour
ˆ ˙ tout i P t1, . . . , ru, i P t`1; ´1u et, pour tout j P t1, . . . , su, Rpθj q :“
cos θj ´ sin θj
avec θj P Rztkπ | k P Zu. Considérant l’égalité F ‘ F K “ E (proposi-
sin θj cos θj ! )
v
tion 2.3.7) et la base orthonormale B 1 :“ }v} de F , la famille B :“ tB 1 , B0 u est une base
orthonormale de E et on a
¨ ˛
λ 0
˚
˚ 1 ‹
‹
˚
˚ . .. ‹
‹
˚ ‹
MatB pf q “ ˚
˚ r ‹
‹
˚
˚ Rpθ 1 q ‹
‹
˚ .. ‹
˝ . ‚
0 Rpθs q

Supposons à présent que f ne possède pas de valeur propre réelle (i.e. le polynôme caracté-
ristique de f ne possède pas de racine dans R). On considère alors l’endomorphisme h :“ f ` f ˚
de E. h est auto-adjoint : on a h˚ “ pf ` f ˚ q˚ “ f ˚ ` pf ˚ q˚ “ f ˚ ` f “ h. Considérons alors
une valeur propre λ P R de h (tout endomorphisme auto-adjoint est diagonalisable : cf théorème
5.2.5) et un vecteur propre v P E associé. D’une part, la famille tv, f pvqu est libre, car

• v ‰ 0E (car v est un vecteur propre de h),

• f pvq ‰ 0E (car f est injectif puisque f est orthogonal),

• f pvq ne peut s’écrire µv avec µ P R car f n’admet pas de valeur propre réelle.
108 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION

D’autre part, le sev F :“ Vecttv, f pvqu de E de dimension 2 est stable par f : on a hpvq “ λv
i.e. pf ` f ˚ q pvq “ λv, donc

λf pvq “ f pλvq “ f ˝ pf ` f ˚ q pvq “ f 2 pvq ` f ˝ f ˚ pvq “ f 2 pvq ` v

(f est orthogonal donc f ˝ f ˚ “ IdE ) d’où f 2 pvq “ λf pvq ´ v P F .

Considérons alors une base orthonormale B 1 de F . La matrice représentative de l’endomor-
phisme orthogonal f|F de F dans la base orthonormale B 1 est une matrice orthogonale de O2 pRq
ˆ ˙ ˆ ˙
cos θ ´ sin θ cos θ sin θ
(proposition 2.8.8). MatB1 pf q est donc de la forme ou avec
sin θ cos θ sin θ ´ cos θ
θ P R (cf feuille de TD 2, exercice 7). Mais, comme f n’admet pas de valeur propre réelle,
MatB1 pf q ne peut pas être symétrique donc ne peut pas être de la seconde forme. Ainsi, il existe
θ P R tel que ˆ ˙
cos θ ´ sin θ
MatB1 pf q “ “ Rpθq,
sin θ cos θ
avec θ R tkπ | k P Zu car MatB1 pf q n’est pas symétrique (Rp0q “ I2 , Rpπq “ ´I2 ).
Enfin, F K`est ˘également stable par f par le lemme 5.5.3 donc, par hypothèse de récurrence
(puisque dim F K ă n), il existe une base orthonormale B0 de F K telle que
¨ ˛
´ ¯ Rpθ 1 q 0
MatB1 f|F K “ ˝
˚ .. ‹
. ‚
0 Rpθs q
ˆ ˙
cos θj ´ sin θj
où, pour tout j P t1, . . . , su, Rpθj q :“ avec θj P Rztkπ | k P Zu (f ne
sin θj cos θj
possède pas de valeur propre réelle). En notant B :“ tB 1 , B0 u, la famille B est alors une base
orthonormale de E et on a
¨ ˛
Rpθq 0
˚ Rpθ1 q ‹
MatB pf q “ ˚
˚ ‹
. . ‹
˝ . ‚
0 Rpθs q

Remarque 5.5.4. • Au cours de la preuve, on a montré en particulier que les seules valeurs
propres réelles possibles pour un endomorphisme orthogonal sont 1 et ´1.

• Si, avec les notations ci-dessus, l’endomorphisme orthogonal f possède 1 et ´1 comme

valeurs propres, alors les sous-espaces propres associés E1 et E´1 sont orthogonaux. En
effet, si v P E1 z t0E u et w P E´1 z t0E u, on a d’une part

xf pvq, f pwqy “ xv, ´wy “ ´xv, wy,

et d’autre part
xf pvq, f pwqy “ xv, wy
5.5. RÉDUCTION DES ENDOMORPHISMES ET MATRICES ORTHOGONAUX 109

(car f est orthogonal) et donc xv, wy “ ´xv, wy donc xv, wy “ 0.

Par ailleurs, le sous-espace vectoriel E1 ‘ E´1 de E est stable par f donc pE1 ‘ E´1 qK
également.
Au total, pour calculer une réduction de f comme dans le théorème 5.5.1, on peut donc
commencer par déterminer une base orthonormale B 1 de E1 , une base orthonormale B 2
de E´1 puis une base du sous-espace stable tB 1 , B 2 uK (donné par des équations linéaires).
Dans la représentation matricielle correspondante de f , le bloc correspondant à la restric-
tion de f à ce dernier sous-espace stable est orthogonal sans valeur propre réelle et on
peut alors lui appliquer la méthode (algorithmique) du théorème pour ce cas.
Exemple 5.5.5. Considérons la matrice orthogonale
¨ ˛
2 ´1 2
1
A :“ ˝ 2 2 ´1‚
3
´1 2 2

de l’exemple 2.8.11 1. Calculons son polynôme caractéristique : on a

2
3 ´X ´ 13 2
3
2 2
χA “ det pA ´ XI3 q “ 3 3 ´X ´ 31
´ 13 2
3
2
3 ´X
1´X ´ 13 2
3
2
“ 1´X 3 ´X ´ 13
C1 ÐC1 `C2 `C3 2 2
1´X 3 3 ´X
1 ´ 13 2
3
2
“ p1 ´ Xq 1 3 ´X ´ 13
2 2
1 3 3 ´X
1 2
3 ´ 31
“ p1 ´ Xq 0 1 ´ X ´1
L2 ÐL2 ´L1 , L3 ÐL3 ´L1
0 1 ´X
` 2 ˘
“ p1 ´ Xq X ´ X ` 1
¨ ¨ ˛˛ ¨ ˛
´1 ´1 2 1
On a E1 “ Ker ˝ 13 ˝ 2 ´1 ´1‚‚ et le vecteur colonne Y1 :“ ?13 ˝1‚ de norme 1
´1 2 ´1 1
engendre E1 .
¨ $ ¨ ˛,˛K $¨ ˛ ,
& 1 . & x .
De plus, ˝Vect ?13 ˝1‚ ‚ “ ˝y ‚ P M3,1 pRq | x ` y ` z “ 0 , dont une base ortho-
1 z
% - % -
¨ ˛ ¨ ˛
1 1
normale est formée des vecteurs Y2 :“ ?12 ˝´1‚ et Y3 :“ ?16 ˝ 1 ‚.
0 ´2
110 CHAPITRE 5. ORTHOGONALITÉ ET RÉDUCTION

On a
¨ ˛ ¨ ˛
?1 ?1
¨ ˛
1 ?
˚ 2 ‹ 2 1 1 ´? ? ¯ 1 3
AY2 “ A ˝´ ?12 ‚ “ ˝ 0 ‚“ ? 0 “ ? 2 Y2 ` 6Y3 “ Y2 ` Y3
˚ ‹ ˝ ‚
2 ´1 2 2 2 2
0 ´ ?12

et
?1
¨ ˛ ¨ 1 ˛
6
´ ?6 ¨ ˛
´1 ´ ? ?
1 1 ? ¯ 3 1
A ˝ ?16 ‚ “
˚ ?2 ‹
AY3 “ ˝ 6 ‚ “ ? ˝ 2 ‚ “ ? ´3 2Y2 ` 6Y3 “ ´ Y2 ` Y3 .
˚ ‹
6 ´1 2 6 2 2
´ ?26 ´ ?16

Ainsi, si on note
?1 ?1 ?1
¨ ˛
3 2 2
P :“ ˝
˚ ?1 ´ ?12 0 ‹ ‚ P O3 pRq,
3
?1 0 ´ ?12
3
on a
¨ ˛ ¨
1 0 0?
˛
1 0` ˘ 0` ˘
t
´1
P AP “ P AP “ ˝0 1
´ 23 ‚ “ ˝0 cos ` π3 ˘ ´ sin` π3˘ ‚
˚ ‹
?2
0 3 1 0 sin π3 cos π3
2 2

La matrice A est donc la matrice représentative dans la base canonique de R3 de la rotation

d’axe la droite vectorielle engendrée par le vecteur p1, 1, 1q et d’angle π3 .
Chapitre 6

Normes matricielles subordonnées,

rayon spectral, conditionnement

6.1 Introduction
Dans ce chapitre, on étudie des normes particulières sur les espaces de matrices carrées
à coefficients réels ou complexes : les normes dites subordonnées. Ces normes possèdent des
propriétés adaptées à l’étude des matrices dans différents aspects et utilisations.
On fait également le lien avec la notion de rayon spectral : il s’agit du plus grand module des
valeurs propres complexes d’une matrice carrée complexe. On verra notamment que la donnée
du rayon spectral d’une matrice permet de déterminer si la suite de ses puissances successives
converge vers la matrice nulle ou non.
Enfin, on aborde la question de la sensibilité de la solution d’un système linéaire inversible
aux erreurs d’approximations sur les données, des perturbations que l’on maîtrise à l’aide d’une
quantité nommée conditionnement.

Dans tout ce chapitre, K désigne les corps R ou C, et n est un entier naturel non nul.

6.2 Normes matricielles subordonnées

Soit A “ pai j q1ďi,jďn une matrice de Mn pKq. Dans la définition et proposition 4.2.1, on
avait défini la norme d ÿ b ` ˘
|ai j |2 “ Tr t A A P r0, `8r.
1ďi,jďn

de A. Dans la suite, on la note }A}2 .

La norme } ¨ }2 sur Mn pKq, appelée norme de Frobenius sur Mn pKq, est induite, si K “
Mn pRq ˆ Mn pRq Ñ `R
R, par le produit scalaire x¨, ¨y : ˘ sur Mn pRq et, si K “ C,
pA, Bq ÞÑ Tr tAB
Mn pCq ˆ Mn pCq Ñ `C
par le produit scalaire hermitien ˘ (cf preuve de la définition
pA, Bq ÞÑ Tr t AB

111
112 CHAPITRE 6. NORMES SUBORDONNÉES ET RAYON SPECTRAL

et proposition 4.2.1), et nous avions montré qu’il s’agissait, dans les deux cas, d’une norme
matricielle :

Définition 6.2.1. Soit } ¨ } : Mn pKq Ñ r0, `8r une norme sur Mn pKq. On dit que } ¨ } est une
norme matricielle si pour tous A, B P Mn pKq, }AB} ď }A}}B}.

Exemple 6.2.2. • La norme

Mn pKq Ñ r0, `8r

} ¨ }1 : ,
A ÞÑ }A}1
ÿ
avec, pour A “ pai j q1ďi,jďn P Mn pKq, }A}1 :“ |ai j |, est également une norme
1ďi,jďn
matricielle. En effet, si A “ pai j q1ďi,jďn , B “ pbi j q1ďi,jďn P Mn pKq, on a
ˇ ˇ
ˇÿnÿ ˇ
ai k bk j ˇ
ˇ ˇ
}AB}1 “ ˇ
1ďi,jďn
ˇ ˇ
k“1
ÿ n
ÿ
ď |ai k bk j |
1ďi,jďn k“1
ÿ ÿ n
“ |ai k | |bk j |
1ďi,jďn k“1
˜ ¸
ÿ n
ÿ n
ÿ
ď |ai k | |bl j |
1ďi,jďn k“1 l“1
¨ ˛¨ ˛
ÿ ÿ
“ ˝ |ai k |‚˝ |bl j |‚
1ďi,kďn 1ďj,lďn

“ }A}1 }B}1

• La norme
Mn pKq Ñ r0, `8r
} ¨ }8 : ,
A ÞÑ }A}8
avec, pour A “ pai j q1ďi,jďn P Mn pKq, }A}8 :“ max |ai j |, n’est pas une norme ma-
1ďi,jďn
ˆ ˙ ˆ ˙
1 ´1 1 0
tricielle. En effet, si l’on considère par exemple les matrices et de
0 0 ´1 0
M2 pRq Ă M2 pCq, on a
›ˆ ˙ˆ ˙› ›ˆ ˙›
› 1 ´1 1 0 ›› › 2 0 ›
› “ › › “2
› 0 0 ´1 0 ›8 › 0 0 ›8
›ˆ ˙› ›ˆ ˙›
› 1 ´1 › › 1 0 ›
alors que ›
› › “ › › “ 1.
0 0 ›8 › ´1 0 ›8
6.2. NORMES MATRICIELLES SUBORDONNÉES 113

?
Remarquons que }In }2 “ n et }In }1 “ n. Pour différents usages, on aimerait construire
des normes matricielles pour lesquelles la norme de la matrice identité est 1. Les normes dites
“subordonnées” satisfont cette condition. Soit } ¨ } : Kn Ñ r0, `8r une norme sur Kn .

Proposition 6.2.3. Soit A P Mn pKq. L’application

Kn ztp0, . . . , 0qu Ñ r0, `8r

ψ: }Av}
v ÞÑ }v}

admet un maximum et on note

}Av}
~A~ :“ max .
vPKn ztp0,...,0qu }v}

Démonstration. Commençons par remarquer que, si v P Kn ztp0, . . . , 0qu,

› › › ˆ ˙›
}Av} ›› 1 › › v ››
ψpvq “ “› Av “ A
› ›
}v} }v} › › }v} ›

v n´1
et que }v} appartient à la sphère unité S}¨} :“ tw P Kn | }w} “ 1u.
Considérons alors l’application
n´1
S}¨} Ñ r0, `8r
f:
w ÞÑ }Aw}

f est une application continue (comme composée des applications continues } ¨ } : Kn Ñ r0, `8r
n´1
et Kn Ñ Kn ; w ÞÑ Aw) sur le compact S}¨} de Kn (la sphère Sn´1
}¨} est fermée bornée dans le
n
K-espace vectoriel normé de dimension finie pK , } ¨ }q) : f est donc bornée et atteint ses bornes.
Ensuite, pour tout v P Kn ztp0, . . . , 0qu,
› ˆ ˙› ˆ ˙
› v ›› v
ψpvq “ ›A
› “f ď max f pwq
}v} › }v} wPSn´1
}¨}

donc l’application ψ est bornée et sup ψpvq ď max f pwq. Enfin, si w P Sn´1
}¨} , f pwq “
vPKn ztp0,...,0qu wPSn´1
}¨}
ψpwq donc
max f pwq “ sup ψpvq “ max ψpvq.
wPSn´1 vPKn ztp0,...,0qu vPKn ztp0,...,0qu
}¨}

Remarque 6.2.4. Dans la démonstration précédente, on a montré au passage que

}Av}
~A~ “ max “ max }Av} .
vPKn ztp0,...,0qu }v} vPKn , }v}“1
114 CHAPITRE 6. NORMES SUBORDONNÉES ET RAYON SPECTRAL

Proposition et Définition 6.2.5. L’application

Mn pKq Ñ r0, `8r

~¨~:
A ÞÑ ~A~

est une norme matricielle sur Mn pKq, appelée norme subordonnée à la norme } ¨ }. De plus,
~In ~ “ 1.

Démonstration. Commençons par remarquer qu’en effet

}In v} }v}
~In ~ “ max “ max “ 1.
vPKn ztp0,...,0qu }v} vPKn ztp0,...,0qu }v}

Montrons ensuite que ~ ¨ ~ : Mn pKq Ñ r0, `8r est une norme sur Mn pKq :

• soient A P Mn pKq et λ P K, on a

}pλAqv} }Av}
~λA~ “ max “ max |λ| “ |λ|~A~.
vPKn ztp0,...,0qu }v} vPKn ztp0,...,0qu }v}

}Av}
• soit A P Mn pKq telle que ~A~ “ max “ 0, alors, pour tout v P Kn ztp0, . . . , 0qu,
}v}
vPKn ztp0,...,0qu
}Av} n
}v} “ 0 donc }Av} “ 0 donc Av “ p0, . . . , 0q (car } ¨ } est une norme sur K ). En parti-
culier, si te1 , . . . , en u désigne la base canonique de Kn , pour tout i P t1, . . . , nu, Aei “ 0
i.e. la ième colonne de A est nulle, et donc A “ 0n .
n´1
• soient A, B P Mn pKq, alors, pour tout v P S}¨} ,

}pA ` Bqv} “ }Av ` Bv}

ď }Av} ` }Bv} (car } ¨ } est une norme sur Kn )
ď ~A~ ` ~B~

et donc
~A ` B~ “ max }pA ` Bqv} ď ~A~ ` ~B~.
vPSn´1
}¨}

Montrons enfin que la norme ~ ¨ ~ sur Mn pKq est une norme matricielle. Soient donc A, B P
Mn pKq et soit v P Kn ztp0, . . . , 0qu. Si Bv “ p0, . . . , 0q, on a }pABqv}
}v} “ }ApBvq}
}v} “ 0 ď ~A~~B~.
Si Bv ‰ p0, . . . , 0q, on a

}pABqv} }pABqv} }Bv} }ApBvq} }Bv}

“ ˆ “ ˆ ď ~A~~B~.
}v} }Bv} }v} }Bv} }v}

}pABqv}
Ainsi, ~AB~ “ max ď ~A~~B~.
vPKn ztp0,...,0qu }v}
6.2. NORMES MATRICIELLES SUBORDONNÉES 115

Soit A “ pai j q1ďi,jďn P Mn pKq. On va donner les expressions de ~A~1 et ~A~8 en

n
ÿ
n
fonction des coefficients de A. On rappelle que, si v “ pv1 , . . . , vn q P K , }v}1 “ |vi | et
i“1
}v}8 “ max |vi |.
1ďiďn

Théorème 6.2.6. On a
n
ÿ
• ~A~1 “ max |ai j |,
1ďjďn
i“1
n
ÿ
• ~A~8 “ max |ai j |.
1ďiďn
j“1

Remarque 6.2.7. • Pour i et j dans t1, . . . , nu, si on note Li la ième ligne de A et Cj la j ème
colonne de A et si on les considère comme des vecteurs de Kn , on a

~A~1 “ max }Cj }1 et ~A~8 “ max }Li }1 .

1ďjďn 1ďiďn

• Attention : en général ~A~1 ‰ }A}1 (resp. ~A~8 ‰ }A}8 ).

ÿn
Démonstration du théorème 6.2.6. Montrons tout d’abord l’égalité ~A~1 “ max |ai j |.
1ďjďn
˜ ¸ i“1
n
ÿ n
ÿ
n
Soit v “ px1 , . . . , xn q P K ztp0, . . . , 0qu, on a Av “ a1 k xk , . . . , an k xk donc
k“1 k“1
ˇ ˇ
ÿn ˇÿ n ˇ
ai k xk ˇ
ˇ ˇ
}Av}1 “ ˇ
i“1
ˇ ˇ
k“1
n ÿ
ÿ n
ď |ai k xk |
i“1 k“1
ÿn ÿ n
“ |ai k | |xk |
i“1 k“1
˜ ¸
n
ÿ ÿn
“ |ai k | |xk |
k“1 i“1
˜ ¸
ÿn n
ÿ
ď max |ai j | |xk |
1ďjďn
k“1 i“1
˜ ¸
n
ÿ n
ÿ
“ max |ai j | |xk |
1ďjďn
i“1 k“1
˜ ¸
ÿn
“ max |ai j | }v}1
1ďjďn
i“1
116 CHAPITRE 6. NORMES SUBORDONNÉES ET RAYON SPECTRAL

n n
}Av}1 ÿ ÿ
et ainsi ď max |ai j | et ~A~1 ď max |ai j |.
}v}1 1ďjďn
i“1
1ďjďn
i“1
ÿn n
ÿ
Mais, si l’on note j0 l’indice de t1, . . . , nu tel que |ai j0 | “ max |ai j | et si te1 , . . . , en u
1ďjďn
i“1 i“1
désigne la base canonique de Kn , on a
n n
}Aej0 }1 ÿ ÿ
“ }Aej0 }1 “ |ai j0 | “ max |ai j |
}ej0 }1 i“1
1ďjďn
i“1

et donc
n
ÿ }Aej0 }1
~A~1 ď max |ai j | “ ď ~A~1 ,
1ďjďn
i“1
}ej0 }1
n
ÿ
d’où l’égalité ~A~1 “ max |ai j |.
1ďjďn
i“1
n
ÿ
Montrons à présent l’égalité ~A~8 “ max |ai j |.
1ďiďn
i“1
Avec les notations ci-dessus, on a
ˇ ˇ
ˇÿn ˇ
“ max ˇ ai k xk ˇ
ˇ ˇ
}Av}8
1ďiďn ˇ ˇ
k“1
n
ÿ
ď max |ai k xk |
1ďiďn
k“1
ÿn
“ max |ai k | |xk |
1ďiďn
k“1
ÿn ˆ ˙
ď max |ai k | max |xj |
1ďiďn 1ďjďn
k“1
ÿn
“ max |ai k | }v}8
1ďiďn
k“1
˜ ¸
ÿn
“ max |ai k | }v}8
1ďiďn
k“1
n n
}Av}8 ÿ ÿ
et ainsi ď max |ai k | et ~A~8 ď max |ai k |.
}v}8 1ďiďn
k“1
1ďiďn
k“1
ÿn n
ÿ
Notons ensuite i0 l’indice de t1, . . . , nu tel que |ai0 k | “ max |ai k | et notons v0 le
1ďiďn
k“1 k“1
vecteur de Kn dont, pour tout j P t1, . . . , nu, la j ème coordonnée notée yj est
#
e´i Argpai0 j q si ai0 j ‰ 0 (si ai0 j P R, e´i Argpai0 j q P t´1; 1u),
0 si ai0 j “ 0,
6.3. RAYON SPECTRAL 117

n
ÿ n
ÿ
alors a i0 k yk “ |ai0 k |.
k“1 k“1
Si v0 est le vecteur nul de Kn , cela signifie que tous les coefficients de la matrice A sont
n
ÿ
nuls et, dans ce cas, on a bien l’égalité ~A~8 “ max |ai j |. Si v0 n’est pas le vecteur nul,
1ďiďn
i“1
alors, comme les coefficients non nuls de v0 sont de module 1, v0 appartient à la sphère unité
Sn´1 n
}¨}8 “ tw P K | }w}8 “ 1u et on a
ˇ ˇ ˇ ˇ
n
ÿ n
ÿ n
ÿ ˇÿn ˇ ˇÿn ˇ
~A~8 ď max ai0 k yk ď ˇ ai0 k yk ˇ ď max ˇ ai k yk ˇ “ }Av0 }8 ď ~A~8 .
ˇ ˇ ˇ ˇ
|ai k | “ |ai0 k | “
1ďiďn ˇ ˇ 1ďiďn ˇ ˇ
k“1 k“1 k“1 k“1 k“1

n
ÿ
D’où l’égalité ~A~8 “ max |ai k |.
1ďiďn
k“1
˛ ¨
1 0 ´6
Exemple 6.2.8. Pour A :“ ˝´2 ´4 3 ‚ P M3 pRq, on a ~A~1 “ maxt1 ` 2 ` 1, 0 ` 4 ` 5, 6 `
´1 5 2
3 ` 2u “ 11 et ~A~8 “ maxt1 ` 0 ` 6, 2 ` 4 ` 3, 1 ` 5 ` 2u “ 9.
Remarque 6.2.9. Si A est une matrice symétrique ~A~1 “ ~A~8 .

6.3 Rayon spectral

Soit A P Mn pKq Ă Mn pCq. On considère dans cette partie les valeurs propres complexes de
A : on note SpC pAq le spectre de A en tant que matrice de Mn pCq.

Définition 6.3.1. On appelle rayon spectral de A la quantité ρpAq :“ max |λ| P r0, `8r.
λPSpC pAq
ˆ ˙
1 0
Exemple 6.3.2. • Le rayon spectral de la matrice P M2 pRq est 2.
0 ´2
ˆ ˙
´3i 0
• Le rayon spectral de la matrice P M2 pCq est 3.
0 i
ˆ ˙
1 2
• Si A :“ P M2 pRq, SpC pAq “ SpR pAq “ t2; 3u (exemple 3.3.2) donc ρpAq “ 3.
´1 4
ˆ ˙
0 1
• Si A :“ P M2 pRq, SpC pAq “ t´i; iu (remarque 3.3.3) donc ρpAq “ 1.
´1 0
¨ ˛
1 0 0 `? ˘` ? ˘
• Si A :“ ˝0 0 ´2‚ P M3 pRq, χA “ p1 ´ XqpX 2 ` 2q “ p1 ´ Xq 2 i ´ X ´ 2 i ´ X
0 1 0
? ? ( ?
donc SpC pAq “ 1, 2 i, ´ 2 i donc ρpAq “ 2.
118 CHAPITRE 6. NORMES SUBORDONNÉES ET RAYON SPECTRAL

Remarque 6.3.3. Si A P Mn pRq et χA est scindé sur R, SpC pAq “ SpR pAq et donc ρpAq “ max |λ|.
λPSpR pAq

Dans cette section, nous allons établir deux résultats importants en relation avec le rayon
spectral. Le premier consiste en une expression de la norme matricielle subordonnée à la norme
euclidienne de Rn mettant en jeu le rayon spectral. Le second est un lien entre le rayon spectral
d’une matrice complexe et la convergence de la suite de ses puissances successives.

Commençons par énoncer le premier résultat. Ci-dessous, la notation ~ ¨ ~2 désigne la norme

matricielle sur Mn pRq subordonnée aà la norme euclidienne
? } ¨ }2 sur Rn i.e. l’application qui à
n
tout vecteur v de R associe }v}2 :“ xv, vycan “ t vv (ici et ci-dessous, on identifie un vecteur
de Rn avec le vecteur colonne de ses coordonnées dans la base canonique de Rn ).
a
Théorème 6.3.4. Supposons que A P Mn pRq. Alors ~A~2 “ ρ ptAAq.

La preuve de ce théorème reposera sur le lemme technique suivant :

Lemme 6.3.5. Soit S P Sn pRq une matrice symétrique positive. On considère l’application

Rn ztp0, . . . , 0qu Ñ R
RS : t vSv
v ÞÑ t vv

(appelée quotient de Rayleigh). L’application RS est bornée et

sup RS pvq “ max RS pvq “ ρpSq.

vPRn ztp0,...,0qu vPRn ztp0,...,0qu

Démonstration. Comme S est une matrice symétrique positive, d’après le corollaire 5.2.7 et
la proposition
¨ 5.3.4,˛il existe une matrice orthogonale O P On pRq et une matrice diagonale
λ1 0
D “ ˝
˚ . . ‚ P Mn pRq avec λ1 , . . . , λn P r0, `8r telles que t OSO “ D. On peut
‹
.
0 λn
supposer, quitte à permuter les colonnes de la matrice O (ce qui modifie pas son caractère
orthogonal), que 0 ď λ1 ď ¨ ¨ ¨ ď λn . En particulier, ρpSq “ λn .
Soit maintenant v P Rn ztp0, . . . , 0qu et notons w “ pw1 , . . . , wn q :“ t Ov P Rn ztp0, . . . , 0qu
(les matrices O et t O sont inversibles). On a t w w “ t v O t O v “ t v v et
n
ÿ n
ÿ
λi wi2 λn wi2
t vSv tv O D tO v t wDw
i“1 i“1
RS pvq “ t vv
“ t vv
“ t ww
“ n ď n “ λn .
ÿ ÿ
wi2 wi2
i“1 i“1

La fonction RS est donc bornée. De plus, pour v0 :“ Oen , avec en le nème vecteur p0, . . . , 0, 1q
de la base canonique de Rn , on a t Ov0 “ en et
tv te
0 Sv0 n D en
RS pv0 q “ tv v
“ te e
“ t en D e n “ λn
0 0 n n
6.3. RAYON SPECTRAL 119

donc la borne λn est atteinte et

sup RS pvq “ max RS pvq “ λn “ ρpSq.

vPRn ztp0,...,0qu vPRn ztp0,...,0qu

Démonstration du théorème 6.3.4. Soit v P Rn ztp0, . . . , 0qu, on a

ˆ ˙2 t pAvqpAvq t v tAA v
}Av}2
“ t vv
“ t vv
“ R tAA pvq.
}v}2

Ainsi, comme la matrice tAA est symétrique positive (lemme 5.4.2),

ˆ ˙2 ˆ ˙2
}Av}2 }Av}2
~A~22 “ R tAA pvq “ ρ tAA
` ˘
max “ max “ max
vPRn ztp0,...,0qu }v}2 vPRn ztp0,...,0qu }v}2 vPRn ztp0,...,0qu

a
et donc ~A~2 “ ρ ptAAq.

Corollaire 6.3.6. Si A P Sn pRq, alors ~A~2 “ ρpAq.

Démonstration.
¨ A étant
˛ une matrice symétrique, il existe O P On pRq et une matrice diagonale
λ1 0
D “ ˝
˚ .. ‚ P Mn pRq telles que t OSO “ D. En particulier, SpC pAq “ SpR pAq “
‹
.
0 λn
tλ1 , . . . , λn u. Ainsi,
¨ 2 ˛
λ1 0
t 2
` t
˘2 2t .. ‹t
AA “ A “ OD O “ OD O “ O ˝ ‚O
˚
.
0 λ2n
` ˘ (
et SpR A2 “ λ21 , . . . , λ2n . Finalement,

~A~22 “ ρ tAA “
` ˘
max |µ|
µPSpR pA2 q
ˇ ˇ
“ max ˇλ2 ˇ
λPSpR pAq

“ max |λ|2
λPSpR pAq
ˆ ˙2
“ max |λ|
λPSpR pAq

“ ρpAq2

d’où le résultat (~A~2 et ρpAq sont deux quantités positives).

120 CHAPITRE 6. NORMES SUBORDONNÉES ET RAYON SPECTRAL

Exemple 6.3.7. • On considère la matrice

¨ ˛
1 2 1
A :“ ˝´2 ´1 ´1‚ P M3 pRq
´1 ´1 ´2
` ˘ ` ˘ a
de l’exemple 5.4.3. On a SpC tAA “ SpR tAA “ t1; 16u donc ~A~2 “ ρ ptAAq “
?
16 “ 4.

• On considère la matrice ¨ ˛
1 1 1
S :“ ˝1 1 1‚ P M3 pRq.
1 1 1
Il s’agit d’une matrice symétrique donc ~S~2 “ ρpSq. Or SpC pSq “ SpR pSq “ t0; 3u donc
~S~2 “ 3.

` le˘ rayon spectral ρpAq de la matrice A de

Nous allons à présent expliciter un lien entre
Mn pKq et la convergence éventuelle de la suite Ak kPN . Précisément, nous allons montrer le
résultat suivant :

Théorème 6.3.8. Les propriétés suivantes sont équivalentes :

1. la suite Ak kPN converge et lim Ak “ 0n ,

` ˘
kÑ`8

2. ρpAq ă 1.
´ ¯
pkq
Remarque 6.3.9. Considérons, pour tout k P N, une matrice Ak “ ai j de Mn pKq.
´ 1ďi,jďn
¯
pkq
Alors la suite pAk qkPN converge ssi pour tous i, j P t1, . . . , nu, la suite ai j converge, et
kPN
pAk qkPN converge vers une matrice B “ pbi j q1ďi,jďn ssi pour pour tous i, j P t1, . . . , nu, la suite
´ ¯
pkq
ai j converge vers bi j .
kPN
Cette convergence matricielle est au sens de n’importe quelle norme sur Mn pKq (en effet
Mn pKq est un K-espace vectoriel de dimension finie) et on peut par exemple montrer ces équi-
valences à l’aide de la norme } ¨ }8 sur Mn pKq.
Pour prouver le théorème 6.3.8, nous utiliserons une démonstration circulaire en faisant
intervenir deux assertions supplémentaires : nous montrerons le théorème

Théorème 6.3.10. Les propriétés suivantes sont équivalentes :

1. la suite Ak kPN converge et lim Ak “ 0n ,

` ˘
kÑ`8

2. pour tout v P Cn , la suite Ak v kPN de Cn converge et lim Ak v “ p0, . . . , 0q,

` ˘
kÑ`8

3. ρpAq ă 1,

4. il existe une norme matricielle subordonnée ~ ¨ ~ sur Mn pCq telle que ~A~ ă 1.
6.3. RAYON SPECTRAL 121

Dans la preuve de ce théorème, nous utiliserons le résultat qui suit. Nous ne démontrerons
pas celui-ci : pour une preuve, on pourra par exemple consulter le livre de Philippe G. Ciarlet
intitulé Introduction à l’analyse numérique matricielle et à l’optimisation (Théorème 1.4-3.).
Théorème 6.3.11. Soit }¨} une norme matricielle sur Mn pCq. Alors ρpAq ď }A}. De plus, pour
tout ą 0 il existe une norme matricielle subordonnée ~¨~ sur Mn pCq telle que ~A~ ď ρpAq`.
Remarque 6.3.12. On peut néanmoins donner une justification rapide du premier fait énoncé.
Soit λ P SpC pAq tel que ρpAq “ |λ| et soit v P Eλ ztp0, . . . , 0u. Soit maintenant w P Cn tel que
la matrice v t w de Mn pCq ne soit pas nulle (par exemple le k ème vecteur de la base canonique
de Cn si la k ème coordonnée de v est non nulle). Alors
› › › › › ` ˘› › › › › › ` › ›
ρpAq ›v t w› “ |λ| ›v t w› “ ›λ v t w › “ ›pλvq t w› “ ›pAvq t w› “ ›A v t w › ď }A} ›v t w›
˘›
› ›
(} ¨ } est une norme matricielle par hypothèse) et donc, comme ›v t w› ‰ 0 car v t w ‰ 0n et } ¨ }
est une norme, ρpAq ď }A}.

Démonstration du théorème 6.3.10.

` ˘
• 1. ñ 2. : On suppose que la suite Ak kPN converge, et ce vers la matrice nulle 0n . Soient
} ¨ } une norme sur Cn et ~ ¨ ~ la norme subordonnée à la norme } ¨ }. Soit v P`Cn . ˘Si v
est le vecteur nul, alors, pour tout k P N, Ak v est le vecteur nul et donc la suite Ak v kPN
converge vers le vecteur nul. Si v n’est pas le vecteur nul, alors, pour tout k P N, on a
}A k v }
k donc
}v} ď A › ›
0 ď ›Ak v › ď Ak }v}.
› ›
` ˘ ` ˘
Or, par hypothèse, la suite réelle Ak kPN converge vers 0 (la suite Ak kPN converge vers
0n au sens de n’importe quelle norme` sur le
C-espace
˘ vectoriel de dimension finie Mn pCq),
il en est donc de même pour la suite Ak }v} kPN et, par théorème d’encadrement, pour
`› ›˘ ` ˘
la suite ›Ak v › kPN . La suite Ak v kPN de Cn converge donc vers le vecteur nul.
• 2. ñ 3. : Montrons cette implication par contraposée ` : supposons
˘ que ρpAq ě 1 et mon-
trons qu’il existe un vecteur v P Cn tel que la suite Ak v kPN de Cn ne converge pas vers
le vecteur nul. Comme ρpAq ě 1, il existe une valeur propre λ de SpC pAq telle que |λ| ě 1.
Soit maintenant `v P˘Eλ ztp0, . . . , 0u. Pour tout k P N, on a alors A k k
` vk “˘ λ v, mais,
` ˘comme
|λ| ě 1, la suite λ kPN de C ne converge pas vers 0 et la suite A v kPN “ λk v kPN ne
k

converge donc pas vers le vecteur nul.

• 3. ñ 4. : On suppose ρpAq ă 1. Soit alors ą 0 tel que ρpAq ` ă 1 (par exemple,
“ 1´ρpAq
2 convient). D’après le théorème 6.3.11, il existe une norme subordonnée ~ ¨ ~
sur Mn pCq telle que ~A~ ď ρpAq ` ă 1.
• 4. ñ 1. : On suppose qu’il existe une norme matricielle subordonnée ~ ¨ ~ sur Mn pCq telle
que ~A~ ă 1. Alors, pour tout k k
` k kP˘ N, 0 ď ~A ~ ď ~A~ (car ~ ¨ ~ est une norme
matricielle) et la suite réelle ~A~ kPN converge vers 0 car ~A~ ă 1. Par théorème
` ˘ ` ˘
d’encadrement, la suite réelle ~Ak ~ kPN converge vers 0 i.e. la suite Ak kPN converge
vers la matrice nulle.
122 CHAPITRE 6. NORMES SUBORDONNÉES ET RAYON SPECTRAL

ˆ ˙
´31
Exemple 6.3.13. • La suite des puissances successives de la matrice 1 1 P M2 pRq, de
( 8 ´4
spectre 21 , 41 et de rayon spectral 12 , converge vers la matrice nulle de taille 2.

• Pour chacune des matrices de l’exemple 6.3.2, la suite de ses puissances successives ne
converge pas vers la matrice nulle.
` ˘
• La suite Ink kPN converge, vers la matrice identité.

6.4 Conditionnement
Pour amener et motiver la notion de “conditionnement” d’une matrice carrée inversible, on
étudie en préambule l’exemple suivant issu du livre cité précédemment de Philippe G. Ciarlet
(section 2.2).
On considère la matrice ¨ ˛
10 7 8 7
˚7 5 6 5‹
A :“ ˚
˝ 8 6 10 9 ‚
‹

7 5 9 10
de M4 pRq. Le déterminant de A est 1 et A est donc inversible. En particulier, pour tout vecteur
colonne B P M4,1 pRq, le système

AX “ B, X P M4,1 pRq
¨ ˛
32
˚ 23‹
possède une unique solution X “ A´1 B. Considérons par exemple le vecteur colonne B :“ ˚ ˝33‚
‹

31
¨ ˛
1
˚1‹
et le système linéaire AX “ B de solution X “ ˚ ˝1‚.
‹

1
¨ ˛
0, 1
˚´0, 1‹
Nous allons “perturber” le système AX “ B : on considère le vecteur B 1 :“ B ` ˚ ˝ 0, 1 ‚
‹

´0, 1
¨ ˛
9, 2
˚´12, 6‹
et la solution du système AX 1 “ B 1 est alors le vecteur X 1 “ ˚
˝ 4, 5 ‚. On constate ainsi que,
‹

´1, 1
}B´B 1 }8 0,1
même si l’“erreur relative” }B}8 de B 1 par rapport à B n’est “que” de 33 » 0, 003, l’erreur
6.4. CONDITIONNEMENT 123

}X´X 1 }8 13,6
relative de X 1 par rapport à X est elle de }X}8 “ 1 “ 13, 6 : le rapport d’“amplification”
13,6
de l’erreur est de 0,1 “ 4488 !
33
Si l’on remplace à présent la matrice A par la matrice
¨ ˛
0 0 0, 1 0, 2
˚ 0, 08 0, 04 0 0 ‹
A2 :“ A ` ˚˝ 0
‹,
´0, 02 ´0, 11 0 ‚
´0, 01 ´0, 01 0 ´0, 02
¨ ˛
´81
˚ 137 ‹
le système A2 X 2 “ B a pour solution X 2 “ ˚ 2
˝´34‚. L’erreur relative de A par rapport à A
‹

22
2 2
est }A´A
}A}8
}8
“ 0,2 2
10 “ 0, 02 et l’erreur relative de X par rapport à X est
}X´X }8
}X}8 “ 136, d’où
136
un rapport d’amplification de 0,02 “ 6800 !
Perturber même légèrement les données du système AX “ B peut donc entraîner des
perturbations très importantes sur sa solution, alors même que la matrice A peut paraître
“sympathique”
¨ (ici, la matrice
˛ est symétrique, son déterminant est 1, son inverse est A´1 “
25 ´41 10 ´6
˚´41 68 ´17 10 ‹
˚ ‹).
˝ 10 ´17 5 ´3‚
´6 10 ´3 2
Nous allons définir une notion qui va permettre d’étudier et de maîtriser ce phénomène. Soit
A une matrice inversible de Mn pKq.
Définition 6.4.1. Soit }¨} une norme sur Kn et ~¨~ la norme subordonnée sur Mn pKq associée.
Le conditionnement de A par rapport à la norme } ¨ } est la quantité

~A~~A´1 ~,
que l’on note condpAq.
Remarque 6.4.2. Le conditionnement de la matrice A dépend de la norme choisie sur Kn .
Usuellement, on note cond1 , cond2 et cond8 les conditionnements respectifs par rapport aux
normes } ¨ }1 , } ¨ }2 et } ¨ }8 sur Kn .
Exemple 6.4.3. • Pour la matrice A considérée ci-dessus, on a cond1 pAq “ cond8 pAq “
~A~8 ~A´1 ~8 “ 33 ˆ 136 “ 4488 (ici, on a utilisé le théorème 6.2.6 ainsi que la remarque
6.2.9).
¨ ˛ ¨ ˛
1 1 0 1 ´1 1
• Si A :“ ˝0 1 1‚ P M3 pRq, A´1 “ ˝0 1 ´1‚ et donc
0 0 1 0 0 1
cond8 pAq “ ~A~8 ~A´1 ~8 “ 2 ˆ 3 “ 6
et
cond1 pAq “ ~A~1 ~A´1 ~1 “ 2 ˆ 3 “ 6.
124 CHAPITRE 6. NORMES SUBORDONNÉES ET RAYON SPECTRAL
¨ ˛
6 5 5
• On considère la matrice symétrique A :“ ˝5 6 5‚ P S3 pRq. On a SpC pAq “ SpR pAq “
5 5 6
` ´1 ˘ 1
(
t1, 16u (voir exemple 5.4.3) et Sp A “ 16 , 1 donc
cond2 pAq “ ~A~2 ~A´1 ~2 “ 16 ˆ 1 “ 16
(on a utilisé ici le corollaire 6.3.6).
Soit } ¨ } une norme sur Kn . Nous allons tout d’abord énoncer quelques propriétés de base
du conditionnement cond associé :
Proposition 6.4.4. On a
` ˘
1. condpAq “ cond A´1 ,
2. pour tout λ P Kzt0u, condpλAq “ condpAq,
3. condpAq ě 1.
Démonstration. 1. On a
` ˘ ` ˘´1

cond A´1 “ A´1 A´1 “ A´1 ~A~ “ condpAq.

2. Soit λ P Kzt0u, on a
ˇ ˇ
´1
1 ´1 ˇ1ˇ
condpλAq “ ~λA~~pλAq ~ “ ~λA~ A “ |λ| ˇˇ ˇˇ ~A~~A´1 ~ “ ~A~~A´1 ~ “ condpAq.

λ λ
3. On a
1 “ ~In ~ “ ~AA´1 ~ ď ~A~~A´1 ~ “ condpAq
(~ ¨ ~ est une norme matricielle).

Etant donné un système AX “ B, on utilise le conditionnement de A pour estimer et

maîtriser l’erreur induite sur la solution du système par une perturbation ou une erreur d’ap-
proximation sur les données A ou B :
Théorème 6.4.5. Soient B, B 1 P Mn,1 pKq avec B différent du vecteur colonne nul. On note X
la solution du système linéaire AX “ B et X 1 la solution du système linéaire AX 1 “ B 1 . On a
}X ´ X 1 } }B ´ B 1 }
ď condpAq .
}X} }B}
1 1 1 ´1 1
Démonstration.
1
´1 On a d’une1 part A pX ´ X q “ B ´ B i.e. X ´ X “ A pB ´ B q et donc
}X ´ X } ď A }B ´ B }.
D’autre part, B “ AX donc }B} ď ~A~}X} donc }X} 1
ď ~A~
}B} .
Ainsi,
}X ´ X 1 } 1 ~A~ }B ´ B 1 }
“ }X ´ X 1 } ˆ ď A´1 }B ´ B 1 } ˆ “ condpAq .
}X} }X} }B} }B}
6.4. CONDITIONNEMENT 125

1
En conséquence, l’erreur relative }X´X}X}
}
sur la solution est d’autant plus petite que la
conditionnement de la matrice A (ainsi que l’erreur relative sur la donnée du second membre
}B´B 1 }
}B} ) est petit.
Le résultat relatif à la perturbation du premier membre autrement dit de la matrice A est
le suivant :

Théorème 6.4.6. Soit B P Mn,1 pKq différent du vecteur colonne nul. Soit A1 P GLn pKq et
notons X la solution du système linéaire AX “ B et X 1 la solution du système linéaire A1 X 1 “
B. On a

1 ´1
}X ´ X }1 1
~A ´ A ~ }X ´ X } 1 1
~A ´ A ~ A
1
ď condpAq et ď condpAq ´1
}X } ~A~ }X} ~A~ ~A ~

Démonstration. On a AX “ B “ A1 X 1 donc 0n “ AX ´ A1 X 1 “ AX ´ AX 1 ` AX 1 ´ A1 X 1 “
ApX ´ X 1 q ` pA ´ A1 qX 1 d’où X ´ X 1 “ Á´1 pA ´ A1 qX 1 et donc
› ›
}X ´ X 1 } “ ›A´1 pA ´ A1 qX 1 › ď A´1 pA ´ A1 q }X 1 }

ď A´1 A ´ A1 }X 1 }
~A ´ A1 ~ 1
“ A´1 ~A ~ }X }
~A ~
~A ´ A1 ~ 1
“ condpAq }X }
~A ~
1 1
Finalement, }X´X } ~AÁ ~
}X 1 } ď condpAq ~A~ .
Pour établir l’autre inégalité, on considère l’égalité 0n “ AX ´ A1 X 1 “ AX ´ A1 X ` A1 X ´
A X 1 “ pA ´ A1 qX ` A1 pX ´ X 1 q d’où X ´ X 1 “ Á1 ´1 pA ´ A1 qX et donc
1

› ›
› ´1 ´1
}X ´ X 1 } “ ›A1 pA ´ A1 qX › ď A1 pA ´ A1 q }X}
›

´1
ď A1 A ´ A1 }X}

1 ´1 condpAq
“ A A ´ A1 }X}
~A ~ ~A´1 ~

1 ´1
1
~A ´ A ~ A
“ condpAq }X}
~A ~ ~A´1 ~

}X´X 1 } 1 ~A1 ´1 ~
Finalement, }X} ď condpAq ~A´A
~A~
~
~A´1 ~
.

Remarque 6.4.7. Par continuité de l’application qui à une matrice inversible de GLn pKq associe
~A1 ´1 ~
son inverse, la quantité ~A´1 ~ tend vers 1 quand A1 tend vers A (i.e. quand ~A ´ A1 ~ tend
vers 0).
Ainsi, le conditionnement de la matrice inversible A permet de majorer l’erreur (relative)
sur la solution du système AX “ B quand il y a perturbations sur les données du premier ou
126 CHAPITRE 6. NORMES SUBORDONNÉES ET RAYON SPECTRAL

du second membre du système. Si l’on maîtrise les erreurs d’approximations sur les données, on
peut alors maîtriser les erreurs sur les solutions obtenues.
Un système AX “ B dont la matrice A possède un conditionnement petit (proche de 1)
sera d’autant plus robuste face aux perturbations (i.e. sa solution sera peu sensible aux erreurs
sur les données) et on dira qu’un tel système est bien conditionné. Dans le cas contraire (si le
conditionnement de A est grand), on dira que le système est mal conditionné.
Chapitre 7

Matrices stochastiques et théorèmes de

Perron-Frobenius

7.1 Introduction

On commence par un exemple de situation qui motive la progression du chapitre et les ré-
sultats qui y sont énoncés. Ces derniers sont appliqués dans d’autres situations plus générales
et complexes, comme l’algorithme de classification des pages web utilisé (en tout cas à ses dé-
buts) par un célèbre moteur de recherche dont l’appellation commence par la septième lettre
de l’alphabet latin.

Remarque : Cet exemple est repris du cours des années précédentes et toute ressemblance
avec une situation existante lors de l’année en cours (2020) est absolument fortuite.

La situation que nous considèrerons dans cet exemple introductif est celui de l’évolution
d’une maladie donnée au sein d’une population donnée. Pour la maladie considérée, chaque
individu de la population revêt l’un des trois états suivants :

• M : Malade

• I : Immunisé (sous-entendu pas malade)

• S : Sain (i.e. pas malade) mais non immunisé

D’une semaine sur l’autre, un individu peut “passer” d’un état à un autre : on parle de
transition d’un état à un autre. On modélise l’évolution de la maladie semaine après semaine par
la probabilité pour un individu de passer d’un état donné à un autre. Les différentes transitions
ainsi que leurs probabilités d’avènement sont représentées par le graphe suivant :

127
128 CHAPITRE 7. MATRICES STOCHASTIQUES ET THÉORÈME DE PERRON

0, 9

I 0, 8

0, 1 M 0, 2

S 0, 5
0, 5

Par exemple,

• la probabilité de passer, d’une semaine sur l’autre, de l’état I à l’état S (i.e. de perdre son
immunité) est de 0,1,

• la probabilité de passer, d’une semaine sur l’autre, de l’état S à l’état M (i.e. de tomber
malade) est de 0,5,

• la probabilité de passer, d’une semaine sur l’autre, de l’état M à l’état M (i.e. de rester
malade) est de 0,2.

On peut rassembler les probabilités d’avènement des différentes transitions dans une matrice

I S M
¨Ó Ó Ó ˛
0, 9 0 0, 8 ÐI
˝0, 1 0, 5 0 ‚ ÐS
0 0, 5 0, 2 ÐM

appelée matrice de transition.

Chaque colonne de la matrice de transition donne les probabilités de passer d’un état donné
à l’un des trois états. Par exemple, la troisième colonne consiste en les probabilités de passer de
l’état M à l’état I (0, 8), de passer de l’état M à l’état S (0) et de passer de l’état M à l’état M
(0, 2), i.e. les probabilités de passer à l’un des états (I, S ou M) “sachant que” l’on est à l’état
M (pour employer le langage des probabilités conditionnelles). Remarquons que les coefficients
de la matrice de transition sont positifs ou nuls et que, sur chaque colonne de la matrice de
transition, la somme des coefficients est égale à 1.
Notons A cette matrice. Elle va nous permettre de déterminer l’évolution semaine après
semaine de l’état de la population que l’on considère, en les termes suivants. Notons x la
proportion des individus qui sont immunisés (état I), y la proportion des individus ¨ ˛ sains (état
x
S) et z la proportion des individus malades (état M). On note ensuite V :“ y ‚ P M3,1 pRq.
˝
z
Remarquons que les coefficients de V sont positifs ou nuls et que leur somme est égale à 1.
7.1. INTRODUCTION 129

Le vecteur V représente l’“état” de la population à une semaine donnée (désignée semaine

0). L’état de la population à la semaine suivante est le vecteur
¨ ˛
0, 9x ` 0, 8z
V1 :“ AV “ ˝0, 1x ` 0, 5y ‚.
0, 5y ` 0, 2z

Par exemple, 90% des personnes immunisées sont restées immunisées et 80% des personnes
malades sont devenues immunisées.
Si k P N, notons Vk le vecteur de l’“état” de la population après k semaines. On a la relation
de récurrence Vk`1 “ AVk , k P N, et donc, pour tout k P N,

Vk “ Ak V.

L’état après k semaines dépend donc de la puissance k ème de la matrice de transition A et de

l’état initial V de la population.
Considérons la matrice

I S M
Ó Ó Ó ˛
2 ¨
A “ 0, 81 0, 4 0, 88 ÐI
˝0, 14 0, 25 0, 08‚ ÐS
0, 05 0, 35 0, 04 ÐM

Par exemple,

• le coefficient situé 0, 14 sur la ligne 2 et la colonne 1 de A2 est la probabilité de passer,

au bout de deux semaines, à l’état S sachant que l’on était à l’état I à la semaine 0, i.e.
la probabilité de perdre son immunité au bout de deux semaines,

• le coefficient 0, 05 situé sur la ligne 3 et la colonne 1 de A2 est la probabilité de passer,

au bout de deux semaines, à l’état M sachant que l’on était à l’état I à la semaine 0, i.e.
la probabilité de tomber malade au bout de deux semaines alors que l’on était immunisé
lors de la semaine 0.

L’intérêt de la matrice de transition A et de l’étude de ses puissances successives est ainsi

de pouvoir modéliser, comprendre, anticiper l’évolution de l’état de la population semaine après
semaine, et à long terme. ` ˘
Ici, une étude numérique nous apprend que la suite Ak kPN semble avoir une limite de la
forme ¨ ˛
0, 7547 . . . 0, 7547 . . . 0, 7547 . . .
˝0, 1509 . . . 0, 1509 . . . 0, 1509 . . .‚
0, 0943 . . . 0, 0943 . . . 0, 0943 . . .

où les trois colonnes de la matrice sont identiques. Ainsi, au bout d’un temps “suffisamment
130 CHAPITRE 7. MATRICES STOCHASTIQUES ET THÉORÈME DE PERRON

long”, i.e pour k assez grand, l’état de la population sera

¨ ˛ ¨ ˛¨ ˛
0, 7547 . . . 0, 7547 . . . 0, 7547 . . . 0, 7547 . . . 0, 7547 . . . 0, 7547 . . . x
˝0, 1509 . . . 0, 1509 . . . 0, 1509 . . .‚V “ ˝0, 1509 . . . 0, 1509 . . . 0, 1509 . . .‚˝y ‚
0, 0943 . . . 0, 0943 . . . 0, 0943 . . . 0, 0943 . . . 0, 0943 . . . 0, 0943 . . . z
¨ ˛
p0, 7547 . . .qx ` p0, 7547 . . .qy ` p0, 7547 . . .qz
“ ˝p0, 1509 . . .qx ` p0, 1509 . . .qy ` p0, 1509 . . .qz ‚
p0, 0943 . . .qx ` p0, 0943 . . .qy ` p0, 0943 . . .qz
¨ ˛
0, 7547 . . .
“ ˝0, 1509 . . .‚
0, 0943 . . .

(car x ` y ` z “ 1) et ce, quel que soit l’état initial de la population.

Ces constats soulèvent les questions suivantes :

` ˘
• pourquoi la suite Ak kPN admet-elle une limite et pourquoi toutes les colonnes de cette
limite sont-elles identiques ?

• peut-on déterminer l’“état limite” de la population a priori, i.e. sans passer par le calcul
des puissances successives de A ?

Nous allons répondre au cours de ce chapitre.

Tout au long de celui-ci, n désigne un entier naturel non nul.

7.2 Matrices stochastiques et vecteurs stochastiques

La matrice A de l’introduction vérifie une propriété particulière : ses coefficients sont tous
positifs ou nuls et la somme des coefficients de chaque colonne est égale à 1. Il s’agit de la
transposée d’une matrice dite stochastique :

Définition 7.2.1. Une matrice A de Mn pRq est dite stochastique si tous ses coefficients sont
positifs ou nuls et si, sur chaque ligne de A, la somme des coefficients est égale à 1.

Exemple 7.2.2. La transposée de la matrice A considérée dans l’introduction est stochastique

(la matrice A ne l’est pas).
Remarque 7.2.3. Même si cela peut paraître moins “naturel”, en théorie des probabilités, la
matrice de transition est “traditionnellement” définie comme la transposée de la matrice que
nous avions considérée. Le vecteur de l’état initial prend quant à lui la forme d’un vecteur ligne
et on obtient l’état suivant en effectuant le produit à gauche de ce vecteur par la matrice de
transition.
On commence par établir quelques propriétés des matrices stochastiques que nous utiliserons
par la suite :
7.2. MATRICES STOCHASTIQUES ET VECTEURS STOCHASTIQUES 131

Proposition 7.2.4. Soient A et B deux matrices stochastiques de Mn pRq. Alors le produit AB

est également une matrice stochastique.

Démonstration. Notons A “ pai j q1ďi,jďn et B “ pbi j q1ďi,jďn . Comme les matrices A et B sont
n
ÿ n
ÿ
stochastiques, on a, pour tout i P t1, . . . , nu, ai j “ 1 et bi j “ 1.
j“1 j“1
Soit maintenant i P t1, . . . , nu. Si j P t1, . . . , nu, la coefficient à la ligne i et la colonne j de
n
ÿ
AB est la somme ai k bk j , qui est positive ou nulle, et la somme des coefficients de la ligne i
k“1
de AB est donc
˜ ¸ ˜ ¸
ÿn n
ÿ n
ÿ n
ÿ
ai k bk j “ ai k bk j
j“1 k“1 k“1 j“1
ÿn n
ÿ
“ ai k (car B est stochastique donc, pour tout k P t1, . . . , nu, bk j “ 1)
k“1 j“1
n
ÿ
“ 1 (car A est stochastique donc ai k “ 1).
k“1

Proposition 7.2.5. La limite d’une suite convergente de matrices stochastiques de Mn pRq est
une matrice stochastique.

Démonstration. L’ensemble
# +
n
ÿ
pai j q1ďi,jďn P Mn pRq | @i, j P t1, . . . , nu, ai j ě 0, et, @i P t1, . . . , nu, ai j “ 1
j“1

des matrices stochastiques de Mn pRq est un fermé de Mn pRq, d’où le résultat.

` ˘
Corollaire 7.2.6. Soit A une matrice stochastique de Mn pRq. Si la suite Ak kPN des puissances
successives de A converge, alors sa limite est une matrice stochastique.

˘ on montre par récurrence que, pour tout k P N,

Démonstration. En utilisant la proposition`7.2.4,
Ak est une matrice stochastique. La suite Ak kPN est donc une suite de matrices stochastiques
de Mn pRq convergente : la proposition 7.2.5 précédente permet de conclure.

On définit également la notion de vecteur stochastique :

Définition 7.2.7. Un vecteur de Rn est dit stochastique si toutes ses coordonnées sont positives
ou nulles et si leur somme est égale à 1.

Exemple 7.2.8. Le vecteur V considéré dans l’introduction est stochastique.

132 CHAPITRE 7. MATRICES STOCHASTIQUES ET THÉORÈME DE PERRON

Remarque 7.2.9. Deux vecteurs stochastiques de Rn proportionnels sont égaux. En effet, soient
v “ pv1 , . . . , vn q et w “ pw1 , . . . , wn q deux vecteurs stochastiques de Rn et supposons qu’ils sont
proportionnels : il existe λ P Rzt0u tel que w “ λv (λ ne peut être nul car w est stochastique
donc en particulier différent du vecteur nul). On a alors
n
ÿ n
ÿ n
ÿ
1“ wj “ λvj “ λ vj “ λ
j“1 j“1 j“1

(v et w sont stochastiques) et donc w “ v.

7.3 Matrices positives, strictement positives, primitives, irréduc-

tibles
Afin de comprendre et expliquer les phénomènes constatés dans l’introduction, nous appli-
querons le théorème dit de Perron à des matrices stochastiques particulières. Afin de pouvoir
énoncer ce théorème ainsi que le théorème dit de Frobenius, nous introduisons les notions sui-
vantes :

Définition 7.3.1. Soit A “ pai j q1ďi,jďn P Mn pRq. On dit que A est :

• positive si pour tous i, j P t1, . . . , nu, ai j ě 0,

• strictement positive si pour tous i, j P t1, . . . , nu, ai j ą 0,

• primitive s’il existe k P N tel que la matrice Ak est strictement positive,

• `irréductible
˘ ˘ tous i, j P t1, . . . , nu, il existe k P N (k dépend de i et j) telk que
si` pour
k k
A i j ą 0 ( A i j désigne le coefficient à la ligne i et la colonne j de la matrice A ).

Exemple 7.3.2. • Toute matrice stochastique est positive.

ˆ ˙
1 2
• La matrice de M2 pRq est positive mais non stochastique.
3 4

• Toute matrice strictement positive est positive.

• La matrice nulle 0n de Mn pRq est positive mais non strictement positive.

• Toute matrice strictement positive est primitive.

ˆ ˙ ˆ ˙
0 ´1 1 1
• La matrice est primitive (car son carré est la matrice ) mais non
´1 ´1 1 2
positive (et donc non strictement positive).

• Toute matrice primitive est irréductible.

7.4. LES THÉORÈMES DE PERRON-FROBENIUS 133
ˆ ˙
0 1
• La matrice A :“ de M2 pRq est irréductible, car pAq1 2 ą 0, pAq2 1 ą 0 et, comme
1 0
ˆ ˙
1 0 ` 2˘ ` ˘
A2 “ , A 1 1 ą 0, A2 2 2 ą 0, mais A n’est pas primitive car, pour tout p P N,
0 1
ˆ ˙ ˆ ˙
2p 1 0 2p`1 0 1
les matrices A “ et A “ ne sont pas strictement positives.
0 1 1 0

• La matrice A de l’introduction est une matrice primitive (son carré A2 est une matrice
strictement positive) non strictement positive.
Remarque 7.3.3. Attention : il ne faut surtout pas confondre les notions de “positivité” de
matrices introduites ci-dessus avec les notions de matrice symétrique positive ou définie positive.
ˆ ˙
2 ´1
A titre d’exemple, la matrice S :“ est une matrice symétrique (définie) positive mais
´1 2
n’est pas une matrice positive.

7.4 Les théorèmes de Perron-Frobenius

Le théorème de Perron porte sur le rayon spectral des matrices positives et primitives.
Nous montrerons une partie de ses conclusions sous des hypothèses plus fortes. Dans la section
suivante, nous appliquerons le théorème de Perron aux matrices stochastiques primitives.
A la fin de cette section, nous énoncerons également, sans le démontrer, le théorème de
Frobenius, qui porte sur les matrices positives et irréductibles.
Théorème 7.4.1 (Théorème de Perron). Soit A une matrice positive et primitive de Mn pRq.
Alors
1. le rayon
` spectral
˘ ρpAq de A est une valeur propre (réelle) de A, de multiplicité 1 (ainsi
dim EρpAq “ 1),

2. il existe un vecteur propre v de Rn de coordonnées strictement positives pour la valeur

propre réelle ρpAq (on a EρpAq “ Vecttvu),

3. pour tout λ P SpC pAqztρpAqu, |λ| ă ρpAq (on dit que la valeur propre ρpAq de A est
dominante).
Nous allons établir certaines de ces conclusions sous des hypothèses plus fortes. Précisément,
nous montrerons le résultat suivant et nous admettrons le cas général énoncé ci-dessus (pour
une preuve du théorème de Perron 7.4.1, on renvoie au document de Bachir Bekka intitulé
“Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche”,
disponible sur sa page web).
Théorème 7.4.2. Soit A une matrice strictement positive telle que ρpAq “ 1. Alors
1. ρpAq “ 1 est une valeur propre (réelle) de A,

2. il existe un vecteur propre v P Rn pour la valeur propre ρpAq “ 1 de A, de coordonnées

strictement positives.
134 CHAPITRE 7. MATRICES STOCHASTIQUES ET THÉORÈME DE PERRON

Dans la preuve ci-dessous, nous utiliserons les notations suivantes :

¨ ˛ ¨ ˛
x1 y1
˚ .. ‹ ˚ .. ‹
• si v “ ˝ . ‚ et w “ ˝ . ‚ sont deux vecteurs de Rn , on note v ě 0 (resp. v ą 0) si,
xn yn
pour tout i P t1, . . . , nu, xi ě 0 (resp. xi ą 0), et v ě w (resp. v ą w) si v ´ w ě 0 (resp.
v ´ w ą 0) i.e. si, pour tout i P t1, . . . , nu, xi ě yi (resp. xi ą yi ),
¨ ˛ ¨ ˛
z1 |z1 |
• si u “ ˝ ... ‚ est un vecteur de Cn , on note |u| le vecteur ˝ ... ‚ de Rn : on a |u| ě 0.
˚ ‹ ˚ ‹

zn |zn |

Démonstration du théorème 7.4.2. Soit λ P SpC pAq telle que |λ| “ 1 (existe car ρpAq “ 1) et
soit u P Cn un vecteur propre (complexe) de A pour la valeur propre λ.

On montre tout d’abord que |u| ď A|u|. On a, d’une part, Au “ λu donc, si z1 , . . . , zn sont
les coordonnées de u dans Cn ,
¨ ˛ ¨ ˛ ¨ ˛
|λz1 | |λ||z1 | |z1 |
|Au| “ |λu| “ ˝ ... ‚ “ ˝ ... ‚ “ |λ| ˝ ... ‚ “ |u|
˚ ‹ ˚ ‹ ˚ ‹

|λzn | |λ||zn | |zn |

(car |λ| “ 1). D’autre part, si on note A “ pai j q1ďi,jďn , pour tout i P t1, . . . , nu, la ième
n
ÿ
coordonnée pAuqi du vecteur Au est ai j zj et on a
j“1

ˇ ˇ
ˇÿn ˇ ÿ n ÿn
ai j zj ˇ ď ai j |zj | “ pA|u|qi
ˇ ˇ
p|Au|qi “ |pAuqi | “ ˇ |ai j | |zj | “
ˇj“1 ˇ j“1 j“1

(les coefficients de A sont réels et positifs). Ainsi,

|u| “ |Au| ď A|u|.

Nous allons maintenant montrer que, nécessairement, |u| “ A|u|. Pour cela, on procède par
l’absurde : on suppose qu’il existe i P t1, . . . , nu tel que pA|u| ´ |u|qi ą 0. Comme A est une
matrice strictement positive, on a alors A pA|u| ´ |u|q ą 0 (appliquer une matrice de coefficients
tous strictement positifs à un vecteur de coordonnées positives ou nulles avec au moins une
coordonnée strictement positive donne un vecteur ´de coordonnées¯ strictement positives). Il
1
existe alors ą 0 tel que A pA|u| ´ |u|q ą A|u| i.e. 1` A A|u| ą A|u| (on peut par exemple
choisir de telle sorte que la plus grande coordonnée du vecteur A|u| soit strictement plus
petite que la plus petite coordonnée du vecteur A pA|u| ´ |u|q).
7.4. LES THÉORÈMES DE PERRON-FROBENIUS 135
´ ¯
1
On a ensuite, puisque la matrice 1` A est également à coefficients strictement positifs
´ ¯
1
(et préserve donc la relation 1` A A|u| ą A|u|),
ˆ ˙2 ˆ ˙
1 1
A A|u| ą A A|u| ą A|u|
1` 1`
puis, par récurrence, pour tout k P N,
ˆ ˙k
1
A A|u| ą A|u|.
1`
´ ¯
1 1 1
Or ρ 1` A “ 1` ρpAq “ ă 1. D’après le théorème 6.3.8 du chapitre précédent, la
1`
ˆ´ ¯k ˙ ´ ¯k
1 1
suite 1` A converge donc vers 0. Le vecteur 1` A A|u| converge donc vers le
kPN ´ ¯k
1
vecteur nul et, en faisant tendre k vers `8 dans l’inégalité de vecteurs 1` A A|u| ą A|u|,
on obtient que les coordonnées du vecteur A|u| sont négatives ou nulles, ce qui est impossible
car
• |u| ě 0,
• u n’est pas le vecteur nul (car vecteur propre),
• la matrice A est strictement positive (i.e. tous ses coefficients sont strictement positifs).

Ainsi, nécessairement, |u| “ A|u| i.e A|u| “ |u| et, comme |u| n’est pas le vecteur nul,
1p“ ρpAqq est donc une valeur propre de A. De plus, |u| “ A|u| ą 0 car |u| ě 0, u n’est pas le
vecteur nul et A est strictement positive. Le vecteur |u| de Rn est donc un vecteur propre pour
la valeur propre 1 “ ρpAq de coordonnées strictement positives.

Corollaire 7.4.3. Soit A une matrice strictement positive. Alors

1. ρpAq est une valeur propre (réelle) de A,
2. il existe un vecteur propre v P Rn pour la valeur propre ρpAq de A, de coordonnées stric-
tement positives.
Démonstration. Comme A est une matrice strictement positive, ρpAq ą 0. En effet, si ρpAq “
0, alors SpC pAq “ t0u et donc χA “ p´Xqn , en particulier A est nilpotente, ce qui est en
contradiction avec le fait que A est strictement positive (car comme A est strictement positive,
pour tout k P Nzt0u, Ak est strictement positive). ´ ¯
1 1
On applique alors le théorème 7.4.2 à la matrice ρpAq A dont le rayon spectral est ρ ρpAq A “
1 1
ρpAq ρpAq “ 1 : 1 est une valeur propre de ρpAq A et il existe un vecteur propre v P Rn pour
1 1
la valeur propre 1 de ρpAq A, de coordonnées strictement positives. Ainsi ρpAq Av “ v ô Av “
ρpAqv, et donc ρpAq est une valeur propre de A, et v est un vecteur propre pour la valeur propre
ρpAq de A, de coordonnées strictement positives.
136 CHAPITRE 7. MATRICES STOCHASTIQUES ET THÉORÈME DE PERRON

Remarque 7.4.4. Les conclusions du théorème de Perron ne sont plus vraies si l’on retire
l’hypothèse
ˆ de positivité
˙ de la matrice A. Si l’on considère par exemple la matrice primitive
0 ´1
M :“ de l’exemple 7.3.2, son polynôme caractéristique est χM “ X 2 ` X ´ 1 “
´1 ´1
´ ?
¯´ ?¯ ?
´1´ 5 ´1` 5 1` 5
X´ 2 X´ 2 donc ρpM q “ 2 n’est pas une valeur propre de M .
On énonce ensuite le théorème de Frobenius, théorème que nous admettrons également (pour
une preuve du théorème de Frobenius, on renvoie aux références citées dans le document de
Bachir Bekka déjà mentionné plus haut). Ce théorème généralise les deux premières conclusions
du théorème de Perron aux matrices positives et irréductibles.

Théorème 7.4.5 (Théorème de Frobenius). Soit A une matrice positive et irréductible. Alors

1. le rayon spectral ρpAq de A est une valeur propre de A, de multiplicité 1,

2. il existe un vecteur propre v de Rn de coordonnées strictement positives pour la valeur

propre réelle ρpAq.

Remarque 7.4.6. Si A est une matrice positive et irréductible, la valeur propre ρpAq de A n’est
pas nécessairement
ˆ ˙ dominante. Si on considère par exemple la matrice positive et irréductible
0 1
A :“ de M2 pRq, SppAq “ t´1; 1u et la valeur propre ρpAq “ 1 de A n’est pas dominante.
1 0

7.5 Le cas des matrices primitives stochastiques

Nous allons à présent appliquer le théorème de Perron au cas particulier des matrices pri-
mitives et stochastiques afin de répondre aux questions posées dans l’introduction.

Soit tout d’abord A une matrice stochastique quelconque de Mn pRq.

Proposition 7.5.1. Le rayon spectral ρpAq de la matrice stochastique A est 1.

¨ ˛ ¨ ˛
1 1
˚ .. ‹ ˚ .. ‹
Démonstration. On a A ˝ . ‚ “ ˝ . ‚ (car sur chaque ligne de A, la somme des coefficients est
1 1
égale est 1) donc 1 est une valeur propre de A. En particulier, ρpAq ě 1.
D’autre part, ρpAq ď ~A~8 , par la première assertion du théorème 6.3.11, et ~A~8 , qui est
la plus grande somme des valeurs absolues des coefficients sur les lignes de A par le théorème
6.2.6, est égal à 1 (car les coefficients de A sont positifs ou nuls et, sur chaque ligne, la somme
des coefficients est égale à 1).
Ainsi, on a
1 ď ρpAq ď 1
i.e. ρpAq “ 1.

Nous allons à présent nous intéresser aux matrices stochastiques primitives, pour lesquelles
on peut appliquer le théorème de Perron :
7.5. LE CAS DES MATRICES PRIMITIVES STOCHASTIQUES 137

Théorème
` k˘ 7.5.2. Supposons que la matrice stochastique A est de plus primitive. Alors la suite
A kPN des puissances successives de A converge, vers une matrice stochastique de la forme
¨ ˛
x1 ¨ ¨ ¨ xn
˚ .. .. ‹
˝. .‚
x1 ¨ ¨ ¨ xn

où x1 , . . . , xn P R forment un vecteur stochastique px1 , . . . , xn q P Rn .

Remarque 7.5.3. • Avec les` notations ci-dessus,

˘ le vecteur px1 , . . . , xn q, présenté sous la
forme d’un vecteur ligne x1 ¨ ¨ ¨ xn P M1,n pRq, est appelé état limite associé à A.

• Ce théorème répond à la première des deux questions de l’introduction.

Démonstration du théorème 7.5.2. On commence par triangulariser la matrice A, considérée en

tant que matrice de Mn pCq, sous forme de Jordan : il existe P P GLn pCq, s P N et pour tout
i P t1, . . . , su, mi P Nzt0u et λi P C tels que
¨ ˛
1 0
˚ Jm1 pλ1 q ‹
P ´1 AP “ ˚
˚ ‹
.. ‹
˝ . ‚
0 Jms pλs q

De plus, pour tout i P t1, . . . , su, |λi | ă 1 : en effet, comme A est stochastique, ρpAq “ 1 (par
proposition 7.5.1) et, comme A est primitive, ρpAq est une valeur propre simple de A et cette
valeur propre est dominante (par le théorème de Perron : théorème 7.4.1).
Afin de simplifier les écritures, notons, pour i P t1, . . . , su, Ji :“ Jmi pλi q. Alors, pour tout
k P N, on a
¨ ˛
1 0
˚ Jk ‹
k 1 ‹ ´1
A “P˚ ‹P .
˚
..
˝ . ‚
0 Jsk

` ˘
Pour tout i P t1, . . . , su, comme ρ pJi q “ |λi | ă 1, d’après le théorème 6.3.8, la suite Jik kě0
de Mmi pRq converge vers la matrice nulle 0mi . Ainsi,
¨ ˛ ¨ ˛
1 0 1 0
˚ Jk ‹ ˚ 0m1 ‹
˚ 1 ‹ ˚ ‹
˚ .. ‹ ÝÝÝÝÑ ˚ .. ‹
˝ . ‚ kÑ`8 ˝ . ‚
0 Jsk 0 0ms
138 CHAPITRE 7. MATRICES STOCHASTIQUES ET THÉORÈME DE PERRON

Mn pKq Ñ Mn pKq
et, par continuité de l’application ,
M ÞÑ P ´1 M P
¨ ˛
1 0
˚ 0m ‹
1
Ak ÝÝÝÝÑ P ˚
‹ ´1
‹P .
˚
..
kÑ`8 ˝ . ‚
0 0ms

¨ ˛ enfin la forme de cette matrice limite. Comme la matrice A est stochastique,

Déterminons
1
˚ .. ‹
le vecteur ˝ . ‚ est un vecteur propre de A pour la valeur propre 1 “ ρpAq. Comme A est de
1
¨ ˛associé à la valeur propre ρpAq est de dimension 1 (par le
plus primitive, le sous-espace propre
1
˚ .. ‹
théorème de Perron). Le vecteur ˝ . ‚ constitue donc une base de E1 et on peut supposer sans
1
¨ ˛
1
˚ .. ‹
perdre de généralité que la première colonne de la matrice de passage P est le vecteur ˝ . ‚. On
1
a alors ¨ ˛
1 0 ¨ ˛
˚ 0m ‹ 1 0 ¨¨¨ 0
1 ‹ ˚ .. .. .. ‹
P˚
˚
.. ‹ “ ˝. . .‚
˝ . ‚
1 0 ¨¨¨ 0
0 0ms
` ˘
et, si x1 ¨ ¨ ¨ xn est la première ligne de P ´1 ,
¨ ˛
1 0 ¨ ˛ ¨ ˛
˚ 0m ‹ 1 0 ¨¨¨ 0 x1 ¨ ¨ ¨ xn
1 ‹ ´1 ˚ .. .. .. ‹ P ´1 “ ˚ .. .. ‹ .
P˚ ‹ P “ ˝. .
˚
.. .‚ ˝. . ‚
˝ . ‚
1 0 ¨¨¨ 0 x1 ¨ ¨ ¨ xn
0 0ms
¨ ˛
x1 ¨ ¨ ¨ xn
Notons L cette matrice limite ˝ ... .. ‹. Comme
˚
. ‚
x1 ¨ ¨ ¨ xn
• Ak ÝÝÝÝÑ L,
kÑ`8

• pour tout k P N, Ak P Mn pRq,

• Mn pRq est un fermé de Mn pCq,
la matrice limite L est dans Mn pRq. De plus, comme la matrice A est stochastique, L est
également une matrice stochastique par le corollaire 7.2.6 : le vecteur px1 , . . . , xn q est donc un
vecteur stochastique de Rn .
7.5. LE CAS DES MATRICES PRIMITIVES STOCHASTIQUES 139

Avec les hypothèses

` et notations
˘ du théorème ci-dessus, on souhaiterait pouvoir déterminer
l’état limite l :“ x1 ¨ ¨ ¨ xn de la matrice stochastique primitive A sans passer par la
réduction de Jordan de A. La solution de ce problème est donnée par la proposition suivante.
Il s’agit de la réponse à la deuxième question de l’introduction.

Proposition 7.5.4. Supposons que la matrice stochastique A est primitive et notons l P M1,n pRq
son état limite. La matrice tA transposée de A possède un unique vecteur propre associé à la
valeur propre 1 qui soit stochastique, et ce vecteur est le vecteur colonne t l.

Démonstration. Comme la matrice A est primitive, se transposée tA l’est également (pour tout
` ˘k ` ˘ ` ˘
k P N, tA “ t Ak ). De plus, on a χtA “ χA donc 1 “ ρpAq “ ρ tA est une valeur propre
simple (par le théorème de Perron 7.4.1) de tA. L’espace propre E1 de tA est donc de dimension
1. De plus, comme tA est primitive, ` ˘ d’après le théorème de Perron 7.4.1, il existe un vecteur
propre v pour la valeur propre ρ tA “ 1 de tA qui soient de coordonnées strictement positives.
1
Si on note v1 , . . . , vn les coordonnées du vecteur v, le vecteur w :“ ÿ
n v est alors un vecteur
vi
i“1
stochastique de Rn , qui est également un vecteur propre pour la valeur propre 1 de tA. Comme
E1 est de dimension 1, tout vecteur propre stochastique de E1 sera proportionnel à w et donc
égal à w (remarque 7.2.9).
` ˘k
` Montrons
˘ à présent que w “ t l. On a tAw “ w et donc, pour tout k P N, tA w “ w ô
t Ak w “ w. Comme la transposition est une application continue sur M pRq, si L désigne la
n
matrice limite de la suite des puissances successives de A, on a alors, par passage `à la limite,˘
tLw “ w, autrement dit w “ tLw et w est donc dans l’image de la matrice tL. Or tL “ t l | ¨ ¨ ¨ | t l
(
et donc w P Im tL “ Vect t l . Il existe donc un scalaire α P R tel que w “ α t l. Mais le vecteur
t l “ pl , . . . , l q est, comme le vecteur w, un vecteur stochastique donc finalement w “ t l par la
1 n
remarque 7.2.9.

Ainsi, si la matrice stochastique A est primitive, son état limite est l’unique vecteur ligne
stochastique l tel que tAt l “ t l. Nous allons appliquer cette propriété à notre exemple introduc-
tif :

Exemple 7.5.5 (Retour à l’exemple introductif). La matrice stochastique

¨ ˛
0, 9 0, 1 0
A :“ ˝ 0 0, 5 0, 5‚
0, 8 0 0, 2

(il s’agit de la transposée de la matrice que nous avions considérée dans l’exemple) est primitive
car la matrice A2 est strictement positive, et l’état limite de A est le vecteur ligne stochastique
140 CHAPITRE 7. MATRICES STOCHASTIQUES ET THÉORÈME DE PERRON
` ˘
l “ l1 l2 l3 tel que
¨ ˛¨ ˛ ¨ ˛
0, 9 0 0, 8 l1 l1
t t
A l “ tl ô ˝0, 1 0, 5 0 ‚˝l2 ‚ “ ˝l2 ‚
0 0, 5 0, 2 l3 l3
$
&0, 9l1
’ ` 0, 8l3 “ l1 ,
ô 0, 1l1 ` 0, 5l2 “ l2
’
0, 5l2 ` 0, 2l3 “ l3
%
$
&´0, 1l1
’ ` 0, 8l3 “ 0
ô 0, 1l1 ´ 0, 5l2 “0
’
0, 5l2 ´ 0, 8l3 “ 0
%
#
l1 “ 8l3
ô , l3 P R
l2 “ 85 l3

De plus,
8 53 5
l1 ` l2 ` l3 “ 1 ô 8l3 ` l3 ` l3 “ 1 ô l3 “ 1 ô l3 “ ,
5 5 53
` 40 8 5
˘ ` ˘
donc l’état limite de A est le vecteur ligne l “ 53 53 53 “ 0, 7547 . . . 0, 1509 . . . 0, 0943 . . . .

Le théorème de Perron a également été utilisé pour le classement des pages web :
Exemple 7.5.6. Notons W :“ txi , i P Iu l’ensemble des pages web présentes sur le “World Wide
Web”, où I :“ t1, . . . , N u avec N entier supérieur à 13 ˆ 1013 .

On forme un graphe avec ces pages webs : pour i, j P I, on écrit xi Ñ xj si la page xi

contient un lien vers la page xj (on dit alors que xi pointe vers xj ).
Si, pour i P I, la page xi contient au moins un lien, on fait l’hypothèse que chacun des liens
présents sur la page xi pointe vers une page différente et que, depuis la page xi , la probabilité
de cliquer sur l’un de ces liens est toujours la même : si on note di le nombre de liens présents
sur une telle page xi , cette probabilité est de d1i .
Pour tous i, j P I, on pose alors
#
1
si xi pointe vers xj ,
ai j :“ di
0 si xi ne pointe pas vers xj ,

et on forme la matrice de transition A :“ pai j q1ďi,jďN (et, par exemple, si i, j P t1, . . . , nu, le
N
ÿ
coefficient A2 i j “
` ˘
ai k ak j de A2 est la probabilité, partant de la page xi , d’aboutir à la
k“1
page xj en deux clics).
N
ÿ
Soit i P I. Remarquons que s’il y a au moins un lien sur la page xi , alors la somme ai j
j“1
7.5. LE CAS DES MATRICES PRIMITIVES STOCHASTIQUES 141

ÿ 1 1
des coefficients de la ligne i de A est “ di ˆ “ 1 et que, s’il n’y a aucun lien
di di
j | xi Ñ xj
sur la page xi , tous les coefficients de la ligne i de A sont nuls. Afin de “rendre” cette matrice
stochastique, on remplace tous les coefficients des lignes nulles de A, lignes qui correspondent
à des pages sans lien, par N1 . On note A r la matrice ainsi obtenue, qui est alors une matrice
stochastique.
Cependant, la matrice A r n’est pas nécessairement primitive. Pour remédier à cela, on consi-
dère la matrice
Gα :“ αA r ` p1 ´ αqE

où α Ps0; 1r et E est la matrice de MN pRq dont les coefficients sont tous égaux à N1 . Alors la
matrice Gα est stochastique et strictement positive (en particulier primitive) : on peut donc
lui appliquer le théorème 7.5.2 et la proposition 7.5.4. En classant ensuite les coordonnées du
vecteur d’état limite de cette matrice de la plus grande à la plus petite valeur, on obtient un
classement des pages web, suivant “leur probabilité d’être visitée à la limite”.

Dans la pratique, il faut choisir un nombre α qui soit “proche” de 1 pour que la matrice Gα
soit “proche” de la matrice A, r mais “pas trop proche” pour que le calcul de l’état limite ne soit
“pas trop difficile”. Dans les derniers documents publics détaillant cette méthode de classement
des pages web, α avait été choisi égal à 0, 85.
142 CHAPITRE 7. MATRICES STOCHASTIQUES ET THÉORÈME DE PERRON
Chapitre 8

Résolution de systèmes linéaires,

décompositions LU et décomposition
de Cholesky

8.1 Introduction
Soit K “ R ou C et soit n un entier naturel non nul.
Soient une matrice A P Mn pKq et un vecteur colonne B P Mn,1 pKq, et considérons le système
linéaire
pSq AX “ B
de vecteur inconnu X P Mn,1 pRq. L’objectif de ce chapitre est de présenter des méthodes de
résolution d’un tel système qui soient “peu” coûteuses en calculs pour n “grand”.

Supposons tout d’abord que A est une matrice inversible. Dans ce cas, le système pSq possède
une unique solution X “ A´1 B. En particulier, le calcul de l’inverse A´1 de A permet de
résoudre le système pSq. Une méthode
` de ˘calcul de cet inverse consiste à déterminer les vecteurs
´1
colonnes de la matrice A “ Y1 | ¨ ¨ ¨ |Yn à l’aide de la résolution des n systèmes linéaires
$
&AY1 “ X1
’
’
..
’ .
’
%AY
n“X n

de vecteurs inconnus Y1 , . . . , Yn P Mn,1 pRq, où, pour i P t1, . . . , u, Xi désigne le vecteur colonne
de Mn,1 pRq dont toutes les coordonnées sont nulles sauf la ième coordonnée qui est 1 : on a
` ˘ ` ˘
AA´1 “ In ssi A Y1 | ¨ ¨ ¨ |Yn “ X1 | ¨ ¨ ¨ |Xn ssi @i P t1, . . . , nu, AYi “ Xi .

Dans la visée de la résolution du seul système pSq, cette méthode est bien trop coûteuse en
calculs. Il faut donc recourir à d’autres méthodes plus “efficaces”.

143
144 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES

Par exemple, lorsque A, en plus d’être inversible, est une matrice triangulaire supérieure,
il existe une méthode permettant de résoudre le système pSq avec un minimum de calculs :
la méthode dite de remontée. Cette méthode consiste à partir de la dernière équation du
système pSq et puis “remonter” les équations une à une pour déterminer successivement les
coordonnées
¨ du vecteur
˛ solution.
¨ ˛ Précisément,
¨ ˛on procède de la manière suivante. Notons
a1 1 ¨ ¨ ¨ a1 n b1 x1
A“˝ . .. .
.. ‚, B “ ˝ .. ‚ et X “ ˝ ... ‹
.
‚, alors
˚ ‹ ˚ ‹ ˚

0 an n bn xn
¨ ˛¨ ˛ ¨ ˛
a1 1 ¨ ¨ ¨ a1 n x1 b1
pSq AX “ B ô
˚ . .. .
.. ‚˝ .. ‚ “ ˝ ... ‹
‹ ˚ . ‹ ˚
˝ ‚
0 an n xn bn
$
’a1 1 x1 ` . . . ` a1 n xn “ b1
’
&
.. ..
ô . .
’
’
% an n xn “ bn
$
&a1 1 x1 ` . . . ` a1 n xn “ b1
’
’
.. ..
ô . .
’
xn “ abnnn
’
%
$
’
’ a1 1 x1 ` ... ` a1 n xn “ b1
’
’ .. ..
.
&
.
ô
’
’
’ an´1 n´1 xn´1 ` an´1 n xn “ bn´1
’
xn “ abnnn
%
$
’
’ a1 1 x1 ` . . . ` a1 n xn “ b1
’
’ .. ..
& . .
ô
’
’
’ xn´1 “ an´11 n´1 pbn´1 ´ pan´1 n xn qq
’
“ an1 n bn
%
xn
$
’
’
’ x1 “ a11 1 pb1 ´ pa1 2 x2 ` . . . ` a1 n xn qq
“ a21 2 pb2 ´ pa2 3 x3 ` . . . ` a2 n xn qq
’
’x2
’
’
..
&
ô .
’
’xn´1 “ a 1
’
’
’
’ n´1 n´1
pbn´1 ´ an´1 n xn q
bn
’
%x
n “ an n

(il est ici à noter que, pour¨tout˛ i P t1, . . . , nu, ai i ‰ 0, car A est inversible). On dit que l’on
x1
˚ .. ‹
a obtenu la solution X “ ˝ . ‚ du système pSq par “remontées successives” : on obtient une
xn
8.1. INTRODUCTION 145

coordonnée xi , i P t1, . . . , nu, à partir des coordonnées xj , j ą i déterminées “plus bas”. Les
calculs mis en œuvre dans cette méthode sont en particulier simples et “peu” nombreux.
Exemple 8.1.1. On considère le système
$
&x ´ 2y ` 5z “2
¨ ˛¨ ˛ ¨ ˛
1 ´2 5 x 2 ’
pSq 0 ´4 3
˝ ‚˝ y “ 0 ô
‚ ˝ ‚ ´4y ` 3z “0
0 0 ´1 z 3
’
“3
%
´z
¨ ˛
x
de vecteur inconnu ˝y ‚ P M3,1 pRq. Alors
z
$ $
&x ´ 2y ` 5z
’ “2 &x ´ 2y ` 5z “ 2
’
pSq ´4y ` 3z “0 ô ´4y ` 3z “ 0
’ ’
“3 z
% %
´z “ ´3
$
&x ´ 2y ` 5z “ 2
’
ô y “ ´3ˆp´3q
´4 “ ´ 49
’
z
%
“ ´3
$ ` 9˘ 25
&x “ 2 ` 2 ˆ ´ 4 ´ 5 ˆ p´3q “
’ 2
ô y “ ´ 94
’
z “ ´3
%

Remarque 8.1.2. On peut adapter la méthode de remontée décrite ci-dessus dans le cas où A
est une matrice triangulaire supérieure non inversible (i.e. au moins un coefficient diagonal de
A est nul). Considérons par exemple les deux systèmes suivants.
¨ ˛
x
Soit ˝y ‚ P M3,1 pRq. Alors le système
z
$
&3x ` 7y “1
¨ ˛¨ ˛ ¨ ˛
3 7 0 x 1 ’
˝0 0 2 ‚˝y ‚ “ ˝ 7 ‚ ô 2z “ 7
0 0 ´5 z
’
´2 %
´5z “ ´2
$
&3x ` 7y
’ “1
ô 2z “ 7
’
z “ 52
%
$
&3x ` 7y
’ “1
ô 0 “ 7 ´ 45
’
z “ 25
%
146 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES

n’a pas de solution, et le système

$
&x ´ 2y ` 3z “ 5
¨ ˛¨ ˛ ¨ ˛
1 ´2 3 x 5 ’
˝0 4 5 ‚ ˝ y “ 1
‚ ˝ ‚ ô 4y ` 5z “ 1
0 0 0 z 0
’
0 “0
%
$
&x ´ 2y ` 3z “ 5
’
ô y “ 1´5z
4
’
0 “0
%
# ` ˘
x “ 5 ` 2 1´5z
4 ´ 3z “ 11´11z
2
ô 1´5z
y “ 4
a pour ensemble de solutions
$ ¨ 11´11z ˛ ¨ 11 ˛ ¨ ´11 ˛ ˇ ,
ˇ
& 2 2 2 ˇ .
˝ 1´5z ‚ “ ˝ 1 ‚` z ˝ ´ 5 ‚ ˇ zPR .
4 4 4 ˇ
z 0 1
% ˇ -

Si la matrice A est triangulaire inférieure, il existe une méthode dite de descente, analogue
de la méthode de remontée pour les systèmes triangulaires supérieurs.
¨ ˛ On illustre la méthode
x
de descente avec le système triangulaire inférieur suivant : si ˝y ‚ P M3,1 pRq, alors
z
$
& 2x “3
¨ ˛¨ ˛ ¨ ˛
2 0 0 x 3 ’
˝´1 7 0‚˝y ‚ “ ˝ 2 ‚ ô ´x ` 7y “2
1 3 4 z
’
´1 %
x ` 3y ` 4z “ ´1
$
&x
’ “ 32
ô ´x ` 7y “2
’
x ` 3y ` 4z “ ´1
%
$
&x
’ “ 32
` ˘
ô y “ 71 2 ` 32 “ 12
’
x ` 3y ` 4z “ ´1
%
$
3
&x “ 2
’
ô y “ 12
’ ` ˘
z “ 14 ´1 ´ 23 ´ 3 ˆ 12 “ ´1
%

Les méthodes de résolution des systèmes linéaires que nous allons présenter dans ce chapitre
vont consister en des “factorisations matricielles” permettant de se ramener à des systèmes
triangulaires, systèmes triangulaires que l’on résout ensuite à l’aide des méthodes de remontée
et/ou de descente décrites plus haut.
Nous allons étudier une méthode qui permet de ramener la résolution du système pSq à la
résolution d’un système triangulaire supérieur.
8.2. MÉTHODE DU PIVOT DE GAUSS 147

8.2 Méthode du pivot de Gauss pour la résolution de systèmes

linéaires
Considérons le système pSq AX “ B comme dans l’introduction, avec A P Mn pRq quel-
conque. Une première méthode de résolution de ce système consiste à lui appliquer l’algorithme
du pivot de Gauss : en utilisant des “pivots”, on effectue des opérations sur les lignes de A et
sur les coordonnées du vecteur colonne B (les mêmes), de façon à se ramener à un système
triangulaire supérieur, pour lequel on peut alors employer la méthode de remontée.

¨ On introduit
˛ cette méthode avec l’exemple suivant. On
¨ suppose
˛ que A est la matrice
5 2 1 12
˝ 5 ´6 2‚ de M3 pRq et que B est le vecteur colonne ˝´1‚ de M3,1 pRq. Alors, si X “
´4 2 1 3
¨ ˛
x
˝y ‚ P M3,1 pRq,
z
$
& 5x ` 2y ` z “ 12
¨ ˛¨ ˛ ¨ ˛
’ 5 2 1 x 12
pSq AX “ B ô 5x ´ 6y ` 2z “ ´1 ô ˝ 5 ´6 2‚˝y ‚ “ ˝´1‚
´4 2 1 z 3
’
´4x ` 2y ` z “3
%

$
& 5x ` 2y ` z “ 12
¨ ˛¨ ˛ ¨ ˛
’ 5 2 1 x 12
ô ´8y ` z “ ´13 ô ˝0 ´8 1 ‚˝y ‚ “ ˝´13‚
L2 ÐL2 ´L1 , L3 ÐL3 ` 54 L1
0 18 9
z 63
’ 18 9
5 y ` 5z “ 63
%
5 5 5 5

$
& 5x ` 2y ` z “ 12
¨ ˛¨ ˛ ¨ ˛
’ 5 2 1 x 12
ô ´8y ` z “ ´13 ô ˝0 ´8 1 ‚˝y ‚ “ ˝´13‚
L3 ÐL3 ` 18 1
L
8 2 0 0 94 z 27
’ 9
5
4z “ 27
%
4 4

Ce dernier système étant triangulaire supérieure, on peut le résoudre par remontée et on a

finalement $
1 1
&x “ 5 p12 ´ p2y ` zqq “ 5 p12 ´ p2 ˆ 2 ` 3qq “ 1
’
pSq ô y “ ´ 18 p´13 ´ zq “ ´ 81 p´13 ´ 3q “ 2
’
z “ 49 ˆ 27 4 “3
%

¨ ˛ ¨ ˛
x 1
et le système pSq possède donc une unique solution ˝y ‚ “ ˝2‚.
z 3
Les opérations sur les lignes du système effectuées ci-dessus à chaque étape de l’algorithme
du pivot de Gauss reviennent à multiplier à gauche la matrice A et le vecteur B par certaines
matrices particulières, appelées matrices d’élimination :
148 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES

Définition 8.2.1. On appelle matrice d’élimination toute matrice de la forme

k
¨ Ó ˛
1
˚ .. ‹
˚ . ‹
˚ ‹
˚
˚ 1 ‹
‹ Ðk
˚
˚ α k`1
‹
‹
˚ .. .. ‹
˝ . . ‚
αn 1

(où tous les coefficients non indiqués sont nuls) avec k P t1, . . . , nu et αk`1 , . . . , αn P K. La
matrice ci-dessus est notée Ek pαk`1 , . . . , αn q.

Reprenons notre matrice A quelconque de Mn pKq et notons L1 , . . . , Ln ses lignes (dans

l’ordre). Alors :

Lemme 8.2.2. Soient k P t1, . . . , nu et αk`1 , . . . , αn P K. La matrice Ek pαk`1 , . . . , αn qA est

la matrice obtenue à partir de la matrice A en ajoutant, pour tout k P tl ` 1, . . . , nu, αl Lk à la
ligne Ll .

Démonstration. Soit l P tk ` 1, . . . , nu alors, pour tout j P t1, . . . , nu, le coefficient situé à la

ligne l et la colonne j de la matrice Ek pαk`1 , . . . , αn qA est αl ak j ` al j .

Dans l’exemple ci-dessus, la première étape de l’algorithme

¨ consistait
˛ à multiplier à gauche
` ˘ 1 0 0
A et B par la matrice d’élimination E1 ´1, 54 “ ˝´1 1 0‚, la deuxième à multiplier à
4
5 0 1
` 4
˘ ` 4
˘ `9˘
gauche la matrice E1 ´1, 5 A et le vecteur E1 ´1, 5 B par la matrice d’élimination E2 20 “
¨ ˛
1 0 0
˝0 1 0‚. Autrement dit, pour passer du système initial pSq au système triangulaire de la
9
0 20 1
fin de l’algorithme, nous avons multiplier à gauche la matrice A et le vecteur B par la matrice
¨ ˛ ¨ ˛
ˆ ˙ ˆ ˙ ˆ ˙ 1 0 0 1 0 0
9 4 9 ˝
M :“ E2 E1 ´1, “ E2 ´1 1 0‚ “ ˝´1 1 0‚
20 5 20 4 7 9
5 0 1 20 20 1

Remarque 8.2.3. • Pour k P t1, . . . , nu et αk`1 , . . . , αn P K, la matrice d’élimination Ek pαk`1 , . . . , αn q

est inversible d’inverse Ek p´αk`1 , . . . , ´αn q.

• Pour k P t1, . . . , nu et αk`1 , . . . , αn P K, det pEk pαk`1 , . . . , αn qAq “ 1.

• La matrice identité In est une matrice d’élimination : In “ E1 p0, . . . , 0q.

8.2. MÉTHODE DU PIVOT DE GAUSS 149

Lorsque l’on applique l’algorithme du pivot de Gauss pour résoudre un système linéaire, on
peut également être amené à effectuer un échange de lignes pour “déplacer” un pivot à la “bonne
place”. Par exemple, dans le système
¨ ˛¨ ˛ ¨ ˛
0 1 1 x ´1
˝1 0 1‚˝y ‚ “ ˝ 0 ‚
1 1 1 z 5
le coefficient situé à la ligne 1 et la colonne 1 de la matrice est nulle et on échange alors, par
exemple, les deux premières lignes de la matrice, afin de se ramener au système équivalent
¨ ˛¨ ˛ ¨ ˛
1 0 1 x 0
˝0 1 1‚˝y ‚ “ ˝´1‚
1 1 1 z 5
où le coefficient non nul situé à la ligne 1 et la colonne 1 peut être utilisé comme premier pivot.
Les échanges de deux lignes ainsi appliqués au cours de l’algorithme du pivot de Gauss
correspondent à des multiplications à gauche par des matrices dites de transposition :
Définition 8.2.4. On appelle matrice de transposition toute matrice obtenue à partir de la
matrice identité In en échangeant deux lignes. Pour i, j P t1, . . . , nu, la matrice de transposition
obtenue en échangeant les lignes i et j de In est notée Ti,j .
Lemme 8.2.5. Soient i, j P t1, . . . , nu. La matrice Ti,j A est la matrice obtenue à partir de la
matrice A en échangeant les lignes i et j de A.
Démonstration. Soit k, l P t1, . . . , nu. Si k R ti, ju, le coefficient situé à la ligne k et la colonne
n
ÿ
l de la matrice Ti,j A est δk,m am l “ ak l . Le coefficient situé à la ligne i et la colonne l de
m“1
la matrice Ti,j A, quant à lui, est aj l . Enfin, le coefficient situé à la ligne j et la colonne l de la
matrice Ti,j A est lui ai l .

Dans l’exemple considéré plus haut, on a¨multiplié˛à gauche la matrice et le vecteur consi-
0 1 0
dérés par la matrice de transposition T1,2 “ ˝1 0 0‚.
0 0 1
Remarque 8.2.6. Soient i, j P t1, . . . , nu. On a
• Ti,j “ Tj,i ,
• la matrice Ti,j est inversible et l’inverse de Ti,j est Ti,j elle-même,
• det pTi,j q “ ´1.
Nous allons à présent montrer que la méthode du pivot de Gauss pour la résolution de
systèmes linéaires fonctionne toujours, autrement dit qu’il est toujours possible, à partir d’un
système pSq AX “ B quelconque, de se ramener à un système triangulaire supérieur à l’aide
d’opérations élémentaires sur les lignes, i.e. à l’aide de produits à gauche par des matrices
d’éliminations et de transpositions :
150 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES

Théorème 8.2.7 (Méthode du pivot de Gauss). Il existe une matrice M P GLn pKq, produit
de matrices d’éliminations et de transpositions, telle que M A soit une matrice triangulaire
supérieure.

Remarque 8.2.8. Si M est une telle matrice alors, en particulier, le système pSq AX “ B est
équivalent au système M AX “ M B, qui est triangulaire supérieur.

Démonstration du théorème 8.2.7. On montre le résultat par récurrence sur n. Précisément, on

montre que pour tout n P Nzt0u, pour tout A P Mn pKq, il existe une matrice M P GLn pKq, pro-
duit de matrices d’éliminations et de transpositions, telle que M A est une matrice triangulaire
supérieure.

Le résultat est vrai pour n “ 1 car toute matrice carrée de taille 1 est en particulier trian-
gulaire supérieure.

Supposons à présent la propriété vérifiée au rang n ´ 1 pour n P Nzt0, 1u fixé et reprenons

notre matrice quelconque A de Mn pKq.
Si la première colonne de A est nulle, A est de la forme
¨ ˛
0 ‹ ¨¨¨ ‹
˚0 ‹
˚ ‹
˚ .. ‹
˝. B ‚
0

où B P Mn´1 pKq : d’après l’hypothèse de récurrence, il existe alors une matrice N P GLn´1 pKq,
produit de matrices N1 , . . . , Nm où m P N et, pour tout s P t1, . . . , mu, Ns est une matrice
d’élimination ou une matrice de transposition de Mn´1 pKq, telle que N B soit une matrice
triangulaire supérieure de Mn´1 pKq. Si l’on note alors
¨ ˛
1 0 ¨¨¨ 0
˚0 ‹
M :“ ˚ . ‹ P GLn pKq.
˚ ‹
˝ .. N ‚
0

et, pour tout s P t1, . . . , mu,

¨ ˛
1 0 ¨¨¨ 0
˚0 ‹
Ms :“ ˚ . ‹ P GLn pKq
˚ ‹
˝ .. Ns ‚
0
m
ź
on a M “ Ms . De plus, pour tout s P t1, . . . , mu, si Ns est une matrice d’élimination, resp.
s“1
de transition, de Mn´1 pKq, alors Ms est une matrice d’élimination, resp. de transposition, de
8.3. LA DÉCOMPOSITION LU 151

Mn pKq. Enfin, la matrice

¨ ˛¨ ˛ ¨ ˛
1 0 ¨¨¨ 0 0 ‹ ¨¨¨ ‹ 0 ‹ ¨¨¨ ‹
˚0 ‹ ˚0 ‹ ˚0 ‹
MA “ ˚.
˚ ‹˚ ‹ ˚ ‹
‹ ˚ .. ‹ “ ˚ ..
˝ ..
‹
N ‚˝ . B ‚ ˝. NB ‚
0 0 0
est triangulaire supérieure.
Supposons maintenant que la première colonne de A soit non nulle, et notons i0 le plus petit
indice i P t1, . . . , nu tel que ai 1 ‰ 0. Si i0 ‰ 1, on multiplie tout d’abord à gauche la matrice
A par la matrice de transposition Ti0 ,1 (afin d’échanger les lignes i0 et 1 de A) et´on considère
¯
alors la matrice A1 :“ Ti0 ,1 A. Si i0 “ 1, on pose A1 :“ A. Ainsi, si on note A1 “ a1i j ,
1ďi,jďn
on a dans tous les cas 1
a´ ‰ 0 et on peut¯alors multiplier, à gauche, la matrice A1 par la matrice
11
a1 a1
d’élimination E :“ E1 ´ a12 1 , . . . , ´ an1 1 afin d’éliminer les autres coefficients de la première
11 11
colonne de A1 : on a ¨ 1 ˛
a1 1 ‹ ¨ ¨ ¨ ‹
˚ 0 ‹
EA1 “ ˚ .
˚ ‹
˝ ..
‹
B ‚
0
où B P Mn´1 pKq. On applique ensuite l’hypothèse de récurrence à B comme dans le cas précé-
dent : reprenant les mêmes notations, le produit
¨ ˛¨ 1 ˛ ¨ 1 ˛
1 0 ¨¨¨ 0 a1 1 ‹ ¨ ¨ ¨ ‹ a1 1 ‹ ¨ ¨ ¨ ‹
˚0 ‹˚ 0 ‹ ˚ 0 ‹
M EA1 “ ˚ .
˚ ‹˚ ‹ ˚ ‹
.. “ ..
˝ ..
‹ ˚ ‹ ˚ ‹
N ‚ ˝ . B ‚ ˝ . NB ‚
0 0 0
est une matrice triangulaire supérieure, et la matrice M E Ti0 ,1 , resp. M E, est bien une matrice
inversible produit de matrices d’éliminations et de transpositions.

8.3 La décomposition LU
La décomposition dite LU consiste en la “factorisation” de matrices vérifiant une certaine
condition de “régularité” en le produit d’une matrice triangulaire inférieure (L pour “Lower”)
par une matrice triangulaire supérieure (U pour “Upper”). Cela permet de ramener la résolution
de systèmes linéaires mettant en jeu ces matrices particulières à la résolution de deux systèmes
triangulaires.
Précisément, la décomposition LU existe pour les matrices dont toutes les sous-matrices
principales sont inversibles :
Définition 8.3.1. Soit A P Mn pKq et soit i P t1, . . . , nu. La sous-matrice principale de taille i
de A est la sous-matrice de A obtenue en en supprimant les n ´ i dernières lignes et n ´ i
dernières colonnes. On appelle également mineur principal d’ordre i de A le déterminant de la
sous-matrice principale de taille i de A.
152 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES
¨ ˛
5 2 1 ˆ
` ˘ 5 2
˙
Exemple 8.3.2. Les sous-matrices principales de la matrice ˝ 5 ´6 2 sont 5 ,
‚
5 ´6
´4 2 1
¨ ˛
5 2 1
et ˝ 5 ´6 2‚, et les mineurs principaux de A sont donc 5, ´40 et ´90.
´4 2 1
Soit A P Mn pKq.

Théorème 8.3.3 (Décomposition LU ). On suppose que tous les mineurs principaux de A sont
non nuls (i.e. toutes les sous-matrices principales de A sont inversibles). Alors il existe des
matrices L et U de GLn pKq uniques telles que

• L est une matrice triangulaire inférieure dont tous les coefficients diagonaux sont égaux
à 1,

• U est une matrice triangulaire supérieure,

• A “ LU .

Remarque 8.3.4. Si tous les mineurs principaux de la matrice A sont non nuls, alors A est en par-
ticulier inversible (car la sous-matrice principale d’ordre n de A est A elle-même).
ˆ La ˙réciproque
0 1
est fausse : par exemple, le mineur principal d’ordre 1 de la matrice inversible P M2 pRq
1 0
est égal à 0.
La démonstration de l’existence de la décomposition LU va consister à appliquer l’algorithme
du pivot de Gauss. Dans la preuve du théorème 8.3.3, nous aurons également besoin du lemme
suivant :

Lemme 8.3.5. Supposons que tous les mineurs principaux de A sont non nuls, et soit E P
Mn pKq une matrice d’élimination. Alors tous les mineurs principaux de la matrice produit EA
sont non nuls.

Démonstration. Soit i P t1, . . . , nu. Notons Ai la sous-matrice principale de taille i de A. Alors

ˆ ˙
Ai B
A“
C D

avec B P Mi,ní pKq, C P Mní,i pKq et D P Mní pKq. Quant à la matrice d’élimination E, elle
est de la forme ˆ 1 ˙
E 0i,ní
C1 D1
où E 1 P Mi pKq et D1 P Mní pKq sont également des matrices d’éliminations, et C 1 P Mní,i pKq.
On a alors
ˆ 1 ˙ˆ ˙ ˆ 1 ˙ ˆ ˙
E 0i,ní Ai B E Ai ` 0i,ní C E 1 B ` 0i,ní D E 1 Ai E1B
EA “ “ “
C1 D1 C D C 1 Ai ` D 1 C C 1 B ` D1 D C 1 Ai ` D 1 C C 1 B ` D 1 D
8.3. LA DÉCOMPOSITION LU 153

et la matrice principale de taille i de EA est donc la matrice E 1 Ai . Or

detpE 1 Ai q “ detpE 1 qdetpAi q “ detpAi q ‰ 0.

Démonstration du théorème 8.3.3. On montre tout d’abord l’existence de la décomposition LU

de A, par récurrence sur n : on montre que pour tout n P Nzt0u, toute matrice A P Mn pKq
dont les mineurs principaux sont tous non nuls admet une décomposition A “ LU telle que
L P GLn pKq est une matrice triangulaire inférieure dont tous les coefficients diagonaux sont
égaux à 1, U P GLn pKq est une matrice triangulaire supérieure et A “ LU .
` ˘ ` ˘ ` ˘` ˘
Pour n “ 1, `si ˘ a P M1 pKq est inversible (i.e. a ‰ 0), alors a “ 1 a est une décompo-
sition LU pour a .

Maintenant, supposons la propriété vérifiée au rang n´1 pour n P Nzt0, 1u fixé, et reprenons
notre matrice A P Mn pKq dont tous les mineurs principaux sont supposés non nuls.
Notons A “ pai j q1ďi,jďn . On applique la première étape de l’algorithme du pivot de Gauss
à A en choisissant le coefficient a1 1 comme
´ pivot : a1 1 est¯le mineur principal d’ordre 1 de A et
est donc non nul. Si l’on note E1 :“ E1 ´ aa12 11 , . . . , ´ aan1 11 , on a alors
¨ ˛
a1 1 a1 2 ¨ ¨ ¨ a1 n
˚ 0 ‹
E1 A “ ˚ .
˚ ‹
˝ ..
‹
A1 ‚
0

où A1 P Mn´1 pKq. Soit i P t1, . . . , n ´ 1u et notons A1i la matrice principale d’ordre i de A1 et

pE1 Aqi`1 la matrice principale d’ordre i ` 1 de E1 A. On a
¨ ˛
a1 1 a1 2 ¨ ¨ ¨ a1 i`1
˚ 0 ‹
pE1 Aqi`1 “ ˚ .
˚ ‹
˝ .. 1
‹
A i
‚
0

et, d’après le lemme 8.3.5, det ppE1 Aqi`1 q ‰ 0. Or det ppE1 Aqi`1 q “ a1 1 det pA1i q donc det pA1i q ‰ 0.
On a ainsi montré que tous les mineurs principaux de la matrice A1 de Mn´1 pKq étaient non
nuls. On peut appliquer l’hypothèse de récurrence l’hypothèse de récurrence à A1 : il existe une
matrice triangulaire inférieure L1 P GLn´1 pKq de coefficients diagonaux tous égaux à 1 et une
matrice triangulaire supérieure U 1 P GLn´1 pKq telles que A1 “ L1 U 1 . On a alors
¨ ˛ ¨ ˛¨ ˛
a1 1 a1 2 ¨ ¨ ¨ a1 n 1 0 ¨¨¨ 0 a1 1 a1 2 ¨ ¨ ¨ a1 n
˚ 0 ‹ ˚0 ‹˚ 0 ‹
E1 A “ ˚ . ‹.
˚ ‹ ˚ ‹˚ ‹
“ ˚. .
˝ .. LU1 1
‹
‚ ˝. . L1
‹ ˚
‚˝ . . U 1 ‚
0 0 0
154 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES

et on pose
¨ ˛ ¨ ˛ ¨ ˛
1 0 ¨¨¨ 0 1 0 ¨¨¨ 0 a1 1 a1 2 ¨ ¨ ¨ a1 n
˚0 ‹ ˆ
a2 1 an 1 ˚0
˙˚ ‹ ˚ 0 ‹
L :“ pE1 q´1 ˚ . ‹ “ E1 ,..., ‹ et U :“ ˚ ..
˚ ‹ ‹ ˚ ‹
˚.
˝ .. a1 1 ˝ ..
‹
L1 ‚ a1 1 L1 ‚ ˝ . U1 ‚
0 0 0

La matrice L est une matrice triangulaire inférieure de GLn pKq dont tous les coefficients dia-
gonaux sont égaux à 1 (car L1 P Mn´1 pKq et pE1 q´1 P Mn pKq sont des matrices triangulaires
inférieures de coefficients diagonaux tous égaux à 1) et U est une matrice triangulaire supérieure
inversible de Mn pKq (car U 1 est une matrice triangulaire supérieure inversible de Mn´1 pKq et
a1 1 ‰ 0).

On montre enfin l’unicité de la décomposition LU de A : soit L r P GLn pKq une matrice

triangulaire inférieure dont tous les coefficients diagonaux sont égaux à 1 et soit U r P GLn pKq
une matrice triangulaire supérieure telles que A “ L rU
r . On montre que L r “ L et Ur “ U.
r r r ´1 r ´1 r ´1
On a LU “ LU et donc L L “ U U . Or le produit L L est une matrice triangulaire
inférieure dont tous les coefficients diagonaux sont égaux à 1 (car L, L r ´1 sont toutes
r et donc L
de telles matrices) et le produit Ur U ´1 est une matrice triangulaire supérieure (car Ur , U et U ´1
r ´1 r ´1
sont toutes de telles matrices). Ainsi, nécessairement, L L “ U U “ In , et donc L “ L r et
U “U r.
¨ ˛
5 2 1
Exemple 8.3.6. On calcule la décomposition LU de la matrice A :“ ˝ 5 ´6 2‚ P M3 pRq
´4 2 1
dont tous les mineurs principaux sont ¨ non nuls
˛ (exemple 8.3.2). ¨ ˛
1 0 0 d e f
Nous savons qu’il existe L :“ ˝a 1 0‚ P GL3 pRq et U :“ ˝0 g h‚ P GL3 pRq telles
b c 1 0 0 k
que ¨ ˛ ¨ ˛¨ ˛
5 2 1 1 0 0 d e f
A “ ˝ 5 ´6 2‚ “ ˝a 1 0‚˝0 g h‚.
´4 2 1 b c 1 0 0 k
On a alors
1. d “ 5, e “ 2, f “ 1, ainsi
¨ ˛ ¨ ˛¨ ˛
5 2 1 1 0 0 5 2 1
˝ 5 ´6 2‚ “ ˝a 1 0‚˝0 g h‚
´4 2 1 b c 1 0 0 k

2. 5 “ a ˆ 5 donc a “ 1, et ´4 “ b ˆ 5 donc b “ ´ 54 , ainsi

¨ ˛ ¨ ˛¨ ˛
5 2 1 1 0 0 5 2 1
˝ 5 ´6 2‚ “ ˝ 1 1 0‚˝0 g h‚
´4 2 1 ´ 45 c 1 0 0 k
8.3. LA DÉCOMPOSITION LU 155

3. ´6 “ 1 ˆ 2 ` 1 ˆ g donc g “ ´8, et 2 “ 1 ˆ 1 ` 1 ˆ h donc h “ 1, ainsi

¨ ˛ ¨ ˛¨ ˛
5 2 1 1 0 0 5 2 1
˝ 5 ´6 2‚ “ ˝ 1 1 0‚˝0 ´8 1‚
´4 2 1 ´ 45 c 1 0 0 k
` ˘
4. 2 “ ´ 45 ˆ 2 ` c ˆ p´8q donc c “ ´ 20
9
, ainsi
¨ ˛ ¨ ˛¨ ˛
5 2 1 1 0 0 5 2 1
˝ 5 ´6 2‚ “ ˝ 1 1 0‚˝0 ´8 1‚
4 9
´4 2 1 ´ 5 ´ 20 1 0 0 k
` ˘ ` 9˘
5. 1 “ ´ 54 ˆ 1 ` ´ 20 ˆ 1 ` 1 ˆ k donc k “ 94 , ainsi
¨ ˛ ¨ ˛¨ ˛
5 2 1 1 0 0 5 2 1
A “ ˝ 5 ´6 2‚ “ ˝ 1 1 0‚˝0 ´8 1 ‚
4 9
´4 2 1 ´ 5 ´ 20 1 0 0 49

et cette dernière expression est la décomposition LU de A.

Supposons que tous les mineurs principaux de la matrice A soient non nuls. Comme illustré
par l’exemple ci-dessus, le calcul de la décomposition LU de A est peu coûteux en calculs. De
plus, si B est un vecteur colonne de Mn,1 pRq, cette factorisation nous permet de résoudre le
système pSq AX “ B, de vecteur inconnu X P Mn,1 pRq, de manière particulièrement efficace.
En effet,
AX “ B ssi LpU Xq “ B.
Ainsi, X P Mn,1 pRq est l’unique solution du système pSq (unique car A est inversible) si et
seulement si le vecteur U X est l’unique solution Y P Mn,1 pRq du système LY “ B (L est
inversible). Résoudre le système pSq revient donc à résoudre successivement le système LY “
B puis le système U X “ Y (U est également inversible), qui sont tous deux des systèmes
triangulaires que l’on peut donc résoudre à l’aide des méthodes de remontée et de descente.
¨ ˛
5 2 1
Exemple 8.3.7. On reprend la matrice A :“ ˝ 5 ´6 2‚ P M3 pRq de l’exemple 8.3.6 précédent
´4 2 1
et on résout le système ¨ ˛
1
AX “ 2‚ ˝
3
¨ ˛
x
de vecteur inconnu X “ ˝y ‚ P M3,1 pRq.
z
La décomposition LU de A est
¨ ˛¨ ˛
1 0 0 5 2 1
A“˝ 1 1 0‚˝0 ´8 1 ‚ :
4 9
´ 5 ´ 20 1 0 0 94
156 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES
¨ ˛ ¨ ˛
1 0 0 5 2 1
notons L :“ ˝ 1 1 0 et U :“ 0
‚ ˝ ´8 1 ‚. Pour résoudre le système AX “ B, on
´ 45 9
´ 20 1 0 0 49
¨ ˛ ¨ ˛
1 a
commence par résoudre le système LY “ ˝2‚ de vecteur inconnu Y “ ˝ b ‚ P M3,1 pRq : on a
3 c
¨ ˛ ¨ ˛¨ ˛ ¨ ˛
1 1 0 0 a 1
LY “ ˝2‚ ô ˝ 1 1 0‚˝ b ‚ “ ˝2‚
3 ´ 45 ´ 20
9
1 c 3
$
&a
’ “1
ô a`b “2
’
% 4 9
´ 5 a ´ 20 b ` c “ 3
$
&a
’ “1
ô b “2´1“1
’
% 4 9
´ 5 a ´ 20 b ` c “ 3
$
&a “ 1
’
ô b “1
’
c “ 3 ` 45 ˆ 1 ` 20 9
ˆ 1 “ 17
%
4
¨ ˛
1
Puis on résout le système U X “ ˝ 1 ‚ : on a
17
4
¨ ˛ ¨ ˛¨ ˛ ¨ ˛
1 5 2 1 x 1
UX “ 1
˝ ‚ ô ˝0 ´8 1 ‚ ˝ y “ 1‚
‚ ˝
17 9 17
4 0 0 4 z 4
$
&5x ` 2y ` z “ 1
’
ô ´8y ` z “ 1
’ 9 17
4z “ 4
%
$
&5x ` 2y ` z “ 1
’
ô ´8y ` z “ 1
’
z “ 17
%
9
$
&5x ` 2y ` z “ 1 `
’
˘ 1
ô y “ ´ 18 1 ´ 17 9 “9
’ 17
z “ 9
%
$ ` ˘
1 1 17 10 2
&x “ 5 1 ´ 2 ˆ 9 ´ 9 “ ´ 45 “ ´ 9
’
ô y “ 19
’
z “ 17
%
9
8.4. LA DÉCOMPOSITION P LU 157
¨ ˛ ¨ ˛
´2 1
1˝
et le vecteur X “ 9 1 est l’unique solution du système AX “ 2‚.
‚ ˝
17 3

8.4 La décomposition P LU
Une généralisation de la décomposition LU existe pour toute matrice de Mn pKq. Cette
décomposition fait apparaître, en plus d’une matrice triangulaire inférieure de coefficients dia-
gonaux tous égaux à 1 et d’une matrice triangulaire supérieure, une matrice dite de permutation,
due aux éventuels échanges de lignes dans l’application de l’algorithme du pivot de Gauss.

Définition 8.4.1. Une matrice de permutation de Mn pKq est une matrice dans laquelle chaque
ligne et chaque colonne ne contient qu’un seul coefficient non nul, égal à 1.

Remarque 8.4.2. • Une matrice de permutation est obtenue par permutation (au sens du
groupe symétrique) des lignes de la matrice identité In i.e. en appliquant une permutation
du groupe symétrique Sn à l’ensemble des lignes de la matrice In . Il est à noter que, une
permutation de Sn étant une composition de transpositions et une matrice de transposi-
tion (définition 8.2.4) étant obtenue en appliquant une transposition (au sens du groupe
symétrique) à l’ensemble des lignes de la matrice In , une matrice de permutation est un
produit de matrices de transpositions.

• Si P P Mn pKq est une matrice de permutation obtenue en appliquant une permutation

σ P Sn aux lignes de la matrice identité In , detpP q “ pσq où pσq désigne la signature
de la permutation σ. En particulier, P est inversible.

• P P Mn pKq est une matrice de permutation obtenue en appliquant une permutation

σ P Sn aux lignes de In , et si M P Mn pKq, la matrice produit P M est la matrice obtenue
à partir de M en appliquant la même permutation σ aux lignes de M .
Considérons donc maintenant une matrice A quelconque de Mn pKq. On a le résultat de
décomposition/factorisation suivant :

Théorème 8.4.3 (Décomposition P LU ). Il existe des matrices P , L et U de Mn pKq telles que

• P est une matrice de permutation,

• L est une matrice triangulaire inférieure dont tous les coefficients diagonaux sont égaux
à 1,

• U est une matrice triangulaire supérieure,

• A “ P LU .

Dans la preuve de ce théorème, on utilisera, comme dans la preuve du théorème 8.3.3 de

décomposition LU , l’algorithme du pivot de Gauss mais en faisant, ici, également intervenir des
échanges de lignes. On emploiera également le lemme suivant :
158 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES

Lemme 8.4.4. Soient i, j, k P t1, . . . , nu tels que k ă i ă j. Soient αk`1 , . . . , αn P K et

considérons les matrices de transposition Ti,j et d’élimination Ek pαk`1 , . . . , αn q de Mn pKq.
Alors
Ek pαk`1 , . . . , αn q Ti,j “ Ti,j Ek pαk`1 , . . . , αj , . . . , αi , . . . , αn q
Démonstration. Commençons par remarquer que multiplier à droite une matrice M P Mn pKq
par une matrice de transposition Tr,s , r, s P t1, . . . , nu, r ‰ s, échange les colonnes r et s de la
matrice M .
Considérons ensuite la matrice Ek pαk`1 , . . . , αn q. Il s’agit de la matrice

k
¨ Ó ˛
1
˚ .. ‹
˚ . ‹
˚ ‹
˚
˚ 1 ‹
‹ Ðk
˚
˚ αk`1 ‹
‹
˚ .. .. ‹
˝ . . ‚
αn 1

La matrice Ek pαk`1 , . . . , αn q Ti,j , obtenue en échangeant les colonnes i et j de Ek pαk`1 , . . . , αn q,

est la matrice obtenue en échangeant les lignes i et j de la matrice Ek pαk`1 , . . . , αj , . . . , αi , . . . , αn q,
i.e. la matrice Ti,j Ek pαk`1 , . . . , αj , . . . , αi , . . . , αn q (k ă i ă j).

Démonstration du théorème 8.4.3. Nous allons montrer le résultat suivant, par récurrence sur
n P N : pour tout n P Nzt0u, pour toute matrice A dans Mn pKq, il existe une matrice triangulaire
supérieure U P Mn pKq, il existe r, s P N et des matrices de transposition T1 , . . . , Tr P Mn pKq
ainsi que des matrices d’élimination E1 , . . . , Es P Mn pKq telles que
˜ ¸˜ ¸
ź r źs
A“ Ti Ej U :
i“1 j“1
˜ ¸ ˜ ¸
źr s
ź
un tel produit Ti forme une matrice de permutation et le produit Ej forme une
i“1 j“1
matrice triangulaire inférieure de coefficients diagonaux tous égaux à 1.

Le résultat est vrai pour n “ 1 pour la même raison que celle évoquée dans la preuve du
théorème 8.3.3. Supposons donc maintenant le résultat vrai au rang n ´ 1 pour n P Nzt0, 1u
fixé, et considérons notre matrice quelconque A de Mn pKq.
Si la première colonne de A est nulle, A est de la forme
¨ ˛
0 a1 2 ¨ ¨ ¨ a1 n
˚0 ‹
˚ ‹
˚ .. ‹
˝. B ‚
0
8.4. LA DÉCOMPOSITION P LU 159

où B P Mn´1 pKq : d’après l’hypothèse de récurrence, il existe alors une matrice triangulaire
supérieure U 1 P Mn´1 pKq, il existe des entiers naturels r et s, il existe des matrices de trans-
1 1 1 1
˜ T1 , .¸. .˜, Tr P M
position ¸n´1 pKq et des matrices d’élimination E1 , . . . , Es P Mn´1 pKq telles que
źr źs
B“ Ti1 Ej1 U 1 .
i“1 j“1
On pose alors
¨ ˛
0 a1 2 ¨ ¨ ¨ a1 n
˚0 ‹
U :“ ˚ . ‹ P Mn pKq
˚ ‹
˝ .. U1 ‚
0

et, pour tout i P t1, . . . , ru et tout j P t1, . . . , su,

¨ ˛ ¨ ˛
1 0 ¨¨¨ 0 1 0 ¨¨¨ 0
˚0 ‹ ˚0 ‹
Ti :“ ˚ . ‹ et Ej :“ ˚ .. ‹.
˚ ‹ ˚ ‹
˝ .. Ti1 ‚ ˝. Ej1 ‚
0 0

Pour i P t1, . . . , r1 u, la matrice Ti est une matrice de transposition de Mn pKq et, pour j P
t1, . . . , s1 u, la matrice Ej est une matrice d’élimination de Mn pKq. Enfin,
˜ ¸˜ ¸
źr s
ź
A“ Ti Ej U.
i“1 j“1

Si la première colonne de A est non nulle, notons i0 le plus petit indice i P t1, . . . , nu tel
que ai 1 ‰ 0 : si i0 ‰ 1, on commence par multiplier à gauche la matrice A par la matrice de
transposition T :“ Ti0´ 1 1
,1 et¯on considère la matrice A :“ T A, et, si i0 “ 1, on pose A :“ A.
Ainsi, si on note A1 “ a1i j , a11 1 ‰ 0, on peut ensuite multiplier à gauche la matrice A1
1ďi,jďn
´ 1 ¯
a a1
par la matrice d’élimination E :“ E1 ´ a12 1 , . . . , ´ an1 1 afin d’éliminer les autres coefficients
11 11
de la première colonne de A1 : on a
¨ 1 ˛
a1 1 a11 2 ¨ ¨ ¨ a11 n
˚ 0 ‹
EA1 “ ˚ .
˚ ‹
˝ ..
‹
B ‚
0

où B P Mn´1 pKq. En procédant de la même manière que dans le cas précédent (i.e. en appliquant
l’hypothèse de récurrence à B) et en conservant les mêmes notations, on obtient alors l’égalité
˜ ¸˜ ¸
źr s
ź
EA1 “ Ti Ej U
i“1 j“1
160 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES

i.e. ˜ ¸˜ ¸
źr s
ź
A1 “ E ´1 Ti Ej U.
i“1 j“1
´ ´ 1 ¯¯´1 ´ 1 ¯
a a1 a a1
Maintenant, E ´1 “ E1 ´ a12 1 , . . . , ´ an1 1 “ E1 a21 1 , . . . , an1 1 . Comme les matrices de
11 11 11 11
transposition Ti , i P t1, . . . , ru, échangent des lignes d’indices strictement plus grands
˜ ¸ 1,˜il
que ¸
źr źr
existe, d’après le lemme 8.4.4, une matrice d’élimination E r P Mn pKq telle que E ´1 Ti “ Ti E,
r
i“1 i“1
et alors ˜ ¸ ˜ ¸
źr s
ź
1
A “ Ti E
r Ej U.
i“1 j“1

Enfin, dans le cas où i0 ‰ 1, T ´1 “ T et donc

˜ ¸ ˜ ¸
źr s
ź
A“T Ti Er Ej U.
i“1 j“1

Remarque 8.4.5. Il n’y a pas unicité de la décomposition P LU . Par exemple :

ˆ ˙ ˆ ˙ˆ ˙ ˆ ˙ˆ ˙ˆ ˙
1 1 1 0 1 1 0 1 1 0 2 3
“ I2 “ 1 .
2 3 2 1 0 1 1 0 2 1 0 ´ 21
¨ ˛
0 1 1
Exemple 8.4.6. Considérons la matrice A :“ ˝1 0 1‚ P M3 pRq. On applique l’algorithme du
1 1 1
pivot de Gauss pour déterminer une décomposition P LU de A.
On commence par échanger les deux premières lignes :
¨ ˛
1 0 1
T2,1 A “ ˝0 1 1‚.
1 1 1

Puis on élimine le coefficient non nul de la première colonne de cette dernière matrice :
¨ ˛
1 0 1
E1 p0, ´1q T2,1 A “ ˝0 1 1‚.
0 1 0

Enfin, on utilise le coefficient situé sur la ligne 2 et la colonne 2 de cette dernière matrice comme
pivot et on a : ¨ ˛
1 0 1
E2 p´1q E1 p0, ´1q T2,1 A “ ˝0 1 1 ‚.
0 0 ´1
8.4. LA DÉCOMPOSITION P LU 161
¨ ˛
1 0 1
On pose alors U :“ ˝0 1 1 ‚ (la matrice U P M3 pRq est triangulaire supérieure) et on a :
0 0 ´1

A “ pT2,1 q´1 pE1 p0, ´1qq´1 pE2 p´1qq´1 U

“ T2,1 E1 p0, 1q E2 p1q U.
¨ ˛ ¨ ˛
0 1 0 1 0 0
Si on pose P :“ T2,1 “ ˝1 0 0‚ et L :“ E1 p0, 1q E2 p1q “ ˝0 1 0‚, P est une matrice
0 0 1 1 1 1
de permutation de M3 pRq, L est une matrice triangulaire inférieure de M3 pRq de coefficients
diagonaux tous égaux à 1, et on a :
A “ P L U.

Une décomposition P LU d’une matrice A de Mn pKq permet notamment de résoudre effica-

cement tout système AX “ B de vecteur inconnu X P Mn,1 pKq, où B est un vecteur colonne
de Mn,1 pKq. La résolution d’un tel système revient à la résolution successive des trois systèmes

1. P Z “ B, de vecteur inconnu Z P Mn,1 pKq, système possédant une unique solution Z

rapide à calculer car P est une matrice de permutation (les coordonnées de Z “ P ´1 B
sont obtenues par permutation des coordonnées de B),

2. LY “ Z, de vecteur inconnu Y P Mn,1 pKq, système possédant une unique solution Y (L

est inversible) et résoluble par la méthode de descente (L est triangulaire inférieure),

3. U X “ Y , de vecteur inconnu X P Mn,1 pKq, qui est un système triangulaire supérieur et

donc résoluble par la méthode de remontée.

En effet, si X P Mn,1 pKq,

AX “ B ssi P L U X “ B ssi L U X “ P ´1 B “ Z ssi U X “ L´1 Z “ Y.

Exemple 8.4.7. Reprenons la matrice A de l’exemple précédent 8.4.6. Nous allons ¨

utiliser
˛ la
0
décomposition P LU calculée alors pour déterminer la solution du système AX “ ˝´1‚ de
5
¨ ˛
x
vecteur inconnu X “ ˝y ‚ P M3,1 pRq.
z
¨ ˛ ¨ ˛
0 α
On commence par résoudre le système P Z “ ˝´1‚ de vecteur inconnu Z “ ˝β ‚ P
5 γ
162 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES

M3,1 pRq : on a

¨ ˛ ¨ ˛¨ ˛ ¨ ˛
0 0 1 0 α 0
P Z “ ˝´1‚ ô ˝1 0 0‚˝β ‚ “ ˝´1‚
5 0 0 1 γ 5
$
&β
’ “0
ô α “ ´1
’
γ “5
%
$
&α
’ “ ´1
ô β “0
’
γ “5
%

¨ ˛ ¨ ˛
´1 a
Puis on résout le système LY “ ˝ 0 de vecteur inconnu Y “ b ‚ P M3,1 pRq : on a
‚ ˝
5 c

¨ ˛ ¨ ˛¨ ˛ ¨ ˛
´1 1 0 0 a ´1
LY “ ˝ 0 ‚ ô ˝0 1 0‚˝ b ‚ “ ˝ 0 ‚
5 1 1 1 c 5
$
&a
’ “ ´1
ô b “0
’
a`b`c “5
%
$
&a “ ´1
’
ô b “0
’
c “ 5 ´ p´1q ´ 0 “ 6
%
8.5. LA DÉCOMPOSITION DE CHOLESKY 163
¨ ˛
´1
Enfin, on résout le système U X “ ˝ 0 ‚ : on a
6

¨ ˛ ¨ ˛¨ ˛ ¨ ˛
´1 1 0 1 x ´1
U X “ ˝ 0 ‚ ô ˝0 1 1 ‚˝y ‚ “ ˝ 0 ‚
6 0 0 ´1 z 6
$
&x
’ ` z “ ´1
ô y`z “0
’
´z “ 6
%
$
&x
’ ` z “ ´1
ô y`z “0
’
z “ ´6
%
$
&x
’ ` z “ ´1
ô y “ ´p´6q “ 6
’
z “ ´6
%
$
&x “ ´1 ´ p´6q “ 5
’
ô y “6
’
z “ ´6
%

¨ ˛ ¨ ˛
5 0
et le vecteur X “ ˝ 6 est l’unique solution du système AX “ ´1‚.
‚ ˝
´6 5

8.5 La décomposition de Cholesky

La décomposition de Cholesky est une factorisation des matrices symétriques définies positives
(définition 5.3.1). Elle est construite à partir de la décomposition LU de ces matrices : les ma-
trices symétriques définies positives vérifient en effet l’hypothèse de “régularité” du théorème
8.3.3.

Proposition 8.5.1. Soit S P Sn pRq une matrice symétrique définie positive. Alors tous les
mineurs principaux de S sont strictement positifs.

Démonstration. Soit i P t1, . . . , nu et notons Si la sous-matrice principale

¨ ˛ de taille$i¨de˛S. ,
x1 & 0 /
’ .
˚ .. ‹ ˚ .. ‹
Remarquons tout d’abord que Si P Si pRq. Soit maintenant X “ ˝ . ‚ P Mi,1 pRqz ˝ . ‚
r
’ /
xi 0
% -
164 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES
¨ ˛
x1
˚ .. ‹
˚.‹ $¨ ˛ ,
˚ ‹
˚ xi ‹ & 0 /
’ .
et notons X :“ ˚ ‹ P Mn,1 pRqz ˝ ... ‚ . On a alors t XA r “ t XAX ą 0 et la matrice
r iX
˚ ‹ ˚ ‹
0 ’ /
0
˚ ‹ % -
˚ .. ‹
˝.‚
0
symétrique Si est donc définie positive. En particulier, la matrice Si P Si pRq est diagonalisable
(théorème 5.2.5) et ses valeurs propres sont strictement positives (proposition 5.3.4) : le déter-
minant de Si est alors égal au produit de ses valeurs propres (avec multiplicités) et est donc
strictement positif.

Corollaire 8.5.2. Soit S P Sn pRq une matrice symétrique définie positive. Alors S admet une
décomposition LU . De plus, les coefficients diagonaux de U sont strictement positifs.

Démonstration. D’après la proposition précédente, tous les mineurs principaux de S sont stric-
tement positifs, en particulier non nuls : on peut donc appliquer le¨théorème ˛8.3.3 à la ma-
1 0
˚ ..
trice S qui possède alors une décomposition S “ LU avec L “ ˝ . ‚ P Mn pRq et
‹

‹ 1
¨ ˛
u1 1 ‹
U “˝
˚ . . ‚ P Mn pRq.
‹
.
0 un n
Soit i P t1, . . . , nu et notons
¨ Si , L˛i et Ui les
¨ sous-matrices˛ principales de taille i respectives
1 0 u1 1 ‹
˚ .. . ..
de S, L et U : on a Li “ ˝ . ‚, Ui “ ˝ ‚ P Mi pRq et
‹ ˚ ‹

‹ 1 0 ui i
ˆ ˙ ˆ ˙ ˆ ˙
Si A Li 0i,n´i Ui F
S“ ,L “ ,U “
B C D E 0n´i,i G

avec A, F P Mi,ní pRq, B, D P Mní,i pRq et C, E, G P Mní pRq. Alors

ˆ ˙
Li Ui Li F
S “ LU “
DUi DF ` EG

i
ź
et, en particulier, Si “ Li Ui et donc det pSi q “ det pLi q det pUi q “ uj j . Or det pSi q ą 0 (par
j“1
i
ź
la preuve de la proposition précédente) donc uj j ą 0.
j“1
i
ź
On a ainsi montré que, pour tout i P t1, . . . , nu, uj j ą 0. En particulier u1 1 ą 0 et, si
j“1
8.5. LA DÉCOMPOSITION DE CHOLESKY 165

i
ź
uj j
i i´1
j“1
ź ź
i P t2, . . . , nu, uj j ą 0 et uj j ą 0 donc, nécessairement, ui i “ i´1
ą 0.
ź
j“1 j“1
uj j
j“1

Soit S P Sn pRq une matrice symétrique définie positive. Considérons donc la décomposition
LU de S suivant les notations de la preuve précédente. Nous allons utiliser cette factorisation
pour écrire S comme le produit d’une matrice triangulaire inférieure de coefficients diagonaux
strictement positifs et de de sa transposée :

Théorème 8.5.3 (Décomposition de Cholesky). Il existe une unique matrice T P Mn pRq trian-
gulaire inférieure à coefficients diagonaux strictement positifs (en particulier T est inversible)
telle que
S “ T t T.

Démonstration. On considère la décomposition S “ LU de S. D’après le corollaire 8.5.2 ci-

dessus, les coefficients diagonaux u1 1 , . . . , un n de U sont tous strictement positifs et on pose
alors ¨? ˛
u1 1 0
D :“ ˝
˚ .. ‚ P GLn pRq.
‹
.
?
0 un n
Remarquons que l’on a
S “ LU “ LDD´1 U.
¨? ˛ ¨? ˛
u1 1 0 u1 1 ‹
On pose ensuite T :“ LD “ ˝
˚ .. ‚ et Tr “ D´1 U “ ˝
‹ ˚ .. ‹
. . ‚
? ?
‹ un n 0 un n
¨?1 ˛
u1 1 0
´1
(D “ ˝
˚ .. ‚), et on a donc S “ T Tr. Notons que T est une matrice triangulaire
‹
.
0 ?1
un n
inférieure et que ses coefficients diagonaux sont tous strictement positifs.

Nous allons maintenant montrer que Tr “ t T . Comme S est une matrice symétrique, on a

T Tr “ S “ t S “ t Tr t T

et donc, comme la matrice Tr est inversible,

t r´1
T T “ t T Tr´1 .
¨?1 ˛ ¨ ˛
u1 1 ‹ 1 0
A présent, comme Tr´1 “ ˝
˚ .. ‚, on a t Tr´1 T “ ˝ . . . ‚ et t T Tr´1 “
‹ ˚ ‹
.
0 ?1 ‹ 1
un n
166 CHAPITRE 8. RÉSOLUTION DE SYSTÈMES LINÉAIRES
¨ ˛
1 ‹
˚ ..
. ‚, d’où
‹
˝
0 1
t r´1
T T “ t T Tr´1 “ In

et donc Tr “ t T .

Montrons enfin que la décomposition S “ T t T , avec T P Mn pRq triangulaire

¨ inférieure
˛
t1 1 0
à coefficients diagonaux strictement positifs, est unique. Soit donc T 1 “ ˝
˚ .. ‹
‚P
.
‹ tn n
Mn pKq une matrice triangulaire inférieure à coefficients diagonaux strictement positifs tels que
S “ T 1 t T 1 et montrons
¨ ˛ que T 1 “ T . Commençons par noter D1 la matrice diagonale inversible
t1 1 0
˚
˝ . .. ‚ P Mn pRq. On a
‹

0 tn n

´1
S “ T 1 t T 1 “ T 1 D1 D1 t T 1 :

comme T 1 D1 ´1 P M¨n pKq est une matrice triangulaire inférieure de coefficients diagonaux tous
1 ˛
t1 1 0
égaux à 1 (D 1 ´1 ˚
“˝ . .. ‚) et D1 t T 1 P Mn pKq est une matrice triangulaire supérieure,
‹
1
0 tn n
´ ¯`
l’égalité S “ T 1 D1 ´1 D1 t T 1 est la décomposition LU de S.
˘

On obtient ainsi les égalités L “ T 1 D¨ 1 ´1 et U “ D 1 t T 1 i.e. T D ´1 “ T 1 D 1 ´1 (T “ LD) et

˛ ¨2 ˛
u1 1 ‹ t1 1 ‹
D t T “ D1 t T 1 (t T “ D´1 U ). Or D t T “ ˝
˚ .. ‚ et D1 t T 1 “ ˝
‹ ˚ .. ‚ donc,
‹
. .
0 un n 0 2
tn n
2 ? 1
pour tout i P t1, . . . , nu, ti i “ ui i i.e. ti i “ ui i (car ti i ą 0), et donc D “ D. D’où, comme
T D´1 “ T 1 D1 ´1 , l’égalité T “ T 1 .

Exemple 8.5.4. Considérons la matrice symétrique

¨ ˛
6 2 ´2
S :“ ˝ 2 6 ´2‚ P S3 pRq.
´2 ´2 10

Son polynôme caractéristique est χS ¨“ p6 ´ Xqp4

˛ ´ Xqp12 ´ Xq donc la matrice symétrique S
a 0 0
est définie positive. On cherche T “ ˝ b c 0 ‚ P M3 pRq triangulaire inférieure de coefficients
d e f
8.5. LA DÉCOMPOSITION DE CHOLESKY 167

diagonaux strictement positifs telle que

¨ ˛¨ ˛
a 0 0 a b d
S “ T t T “ ˝ b c 0 ‚˝0 c e ‚.
d e f 0 0 f

On a alors
?
1. a2 “ 6 donc a “ 6 (car a ą 0),

2. ba “ 2 donc b “ ?2 ,
6

3. da “ ´2 donc d “ ´ ?26 ,
? b
16
4. b2 ` c2 “ 6 donc c “ 6 ´ b2 “ 3 (c ą 0),
b ` ˘ b
1 3 2
5. db ` ec “ ´2 donc e “ c p´2 ´ dbq “ 16 ´2 ` 3 “ ´ 43 3
16 ,
b
2 1
6. d2 ` e2 ` f 2 “ 10 donc f “ 10 ´ 3 ´ 3 “ 3 (f ą 0).

Ainsi ¨? ˛ ?
6 b0 0 ¨ 6 ?2 ´ ?26
˛
˚ ?2 16 ‹ b6 b ‹
S“˚ 0‹ ˚ 0 16
´ 43 163 ‚
˝ 6 b3 ‚ ˝ 3
´ ?26 ´ 43 3
16 3 0 0 3
est la décomposition de Cholesky de la matrice symétrique définie positive S.
Remarque 8.5.5. • Comme illustré dans l’exemple ci-dessus, le calcul de la décomposition
de Cholesky de S est plus avantageux que le calcul de la décomposition LU de S (il y a
moins de coefficients à déterminer).

• Si B est un vecteur colonne de Mn,1 pRq, la décomposition de Cholesky de la matrice S

permet de résoudre efficacement le système SX “ B de vecteur inconnu X P Mn,1 pRq :
résoudre ce système revient à résoudre successivement les deux systèmes triangulaires
inversibles T Y “ B, de vecteur inconnu Y P Mn,1 pRq, et t T X “ Y .

Vous aimerez peut-être aussi

Cours d'Algèbre Linéaire 1ère Année
Pas encore d'évaluation
Cours d'Algèbre Linéaire 1ère Année
111 pages
Introduction à l'Algèbre Linéaire
Pas encore d'évaluation
Introduction à l'Algèbre Linéaire
132 pages
Ecole Polytechnique de Louvain LEPL 1101
Pas encore d'évaluation
Ecole Polytechnique de Louvain LEPL 1101
43 pages
Cours et Exercices d'Algèbre Linéaire
100% (1)
Cours et Exercices d'Algèbre Linéaire
191 pages
Algèbre Linéaire Numérique et Matrices
Pas encore d'évaluation
Algèbre Linéaire Numérique et Matrices
63 pages
Diagonalisation
Pas encore d'évaluation
Diagonalisation
68 pages
Cours d'Algèbre Linéaire
Pas encore d'évaluation
Cours d'Algèbre Linéaire
91 pages
Systèmes d'équations linéaires et matrices
Pas encore d'évaluation
Systèmes d'équations linéaires et matrices
187 pages
Alg Lin MIP S2
Pas encore d'évaluation
Alg Lin MIP S2
165 pages
21-22 MI CoursAlgLin
Pas encore d'évaluation
21-22 MI CoursAlgLin
114 pages
Cours d'Analyse Matricielle et Algèbre
Pas encore d'évaluation
Cours d'Analyse Matricielle et Algèbre
245 pages
Deug Algébre
Pas encore d'évaluation
Deug Algébre
127 pages
Algebre Lineaire PDF
100% (4)
Algebre Lineaire PDF
162 pages
Cours d'Algèbre Linéaire Universitaire
Pas encore d'évaluation
Cours d'Algèbre Linéaire Universitaire
148 pages
Deug 105
Pas encore d'évaluation
Deug 105
148 pages
École Normale Supérieure de Rennes: Algèbre Linéaire & Bilinéaire
Pas encore d'évaluation
École Normale Supérieure de Rennes: Algèbre Linéaire & Bilinéaire
52 pages
Coursl1 2
Pas encore d'évaluation
Coursl1 2
120 pages
24-25 MI CoursAlgLin
Pas encore d'évaluation
24-25 MI CoursAlgLin
121 pages
Cours Algèbre 3 PDF
Pas encore d'évaluation
Cours Algèbre 3 PDF
73 pages
coursMP2I Algebre2
Pas encore d'évaluation
coursMP2I Algebre2
109 pages
Polycopie 2MA221
Pas encore d'évaluation
Polycopie 2MA221
124 pages
Introduction à l'Algèbre Linéaire
Pas encore d'évaluation
Introduction à l'Algèbre Linéaire
107 pages
M22 Cours
Pas encore d'évaluation
M22 Cours
59 pages
Algèbre 4
Pas encore d'évaluation
Algèbre 4
43 pages
Cours d'Algèbre Linéaire 2023-2024
Pas encore d'évaluation
Cours d'Algèbre Linéaire 2023-2024
84 pages
Introduction à l'Algèbre Linéaire
Pas encore d'évaluation
Introduction à l'Algèbre Linéaire
101 pages
Cours S3 Complet 23-24
Pas encore d'évaluation
Cours S3 Complet 23-24
68 pages
Algèbre Linéaire pour Économistes
Pas encore d'évaluation
Algèbre Linéaire pour Économistes
83 pages
Calcul matriciel : Théorie et applications
Pas encore d'évaluation
Calcul matriciel : Théorie et applications
128 pages
Extrait Livre BCPST2 Damin
Pas encore d'évaluation
Extrait Livre BCPST2 Damin
40 pages
Cours Analyse Numerique Matricielle
100% (1)
Cours Analyse Numerique Matricielle
63 pages
Algèbre 2: Espaces Vectoriels et Matrices
Pas encore d'évaluation
Algèbre 2: Espaces Vectoriels et Matrices
54 pages
Exercices sur les formes quadratiques
Pas encore d'évaluation
Exercices sur les formes quadratiques
41 pages
Cours d'Algèbre Linéaire Prépa Agro-Véto
Pas encore d'évaluation
Cours d'Algèbre Linéaire Prépa Agro-Véto
91 pages
Cours Complet d'Algèbre Linéaire
Pas encore d'évaluation
Cours Complet d'Algèbre Linéaire
96 pages
Algèbre 2
100% (1)
Algèbre 2
95 pages
Cours Algebre 2 Algebre Lineaire L1-FS-UN
Pas encore d'évaluation
Cours Algebre 2 Algebre Lineaire L1-FS-UN
51 pages
Livre Algèbre Linéaire
100% (1)
Livre Algèbre Linéaire
267 pages
Cours
Pas encore d'évaluation
Cours
271 pages
Polyc Algèbre 2 (2024 2025)
Pas encore d'évaluation
Polyc Algèbre 2 (2024 2025)
86 pages
Cours d'Algèbre Linéaire - Tronc Commun PC
Pas encore d'évaluation
Cours d'Algèbre Linéaire - Tronc Commun PC
64 pages
Analyse Matricielle Cours Et Exercices Résolus - 2e Édition Augmentée by Jean-Etienne Rombaldi
100% (5)
Analyse Matricielle Cours Et Exercices Résolus - 2e Édition Augmentée by Jean-Etienne Rombaldi
272 pages
Analyse Matricielle: Cours Et Exercices Résolus
Pas encore d'évaluation
Analyse Matricielle: Cours Et Exercices Résolus
22 pages
Algèbre Linéaire et Matrices Essentielles
Pas encore d'évaluation
Algèbre Linéaire et Matrices Essentielles
81 pages
L3 Algebre Poly 2022
Pas encore d'évaluation
L3 Algebre Poly 2022
29 pages
Théorie et Pratique du Calcul Matriciel
Pas encore d'évaluation
Théorie et Pratique du Calcul Matriciel
129 pages
Algèbre Linéaire et Bilinéaire I
Pas encore d'évaluation
Algèbre Linéaire et Bilinéaire I
112 pages
Introduction à l'Algèbre Linéaire
Pas encore d'évaluation
Introduction à l'Algèbre Linéaire
114 pages
Cours d'Algèbre 2 : Algèbre Linéaire
Pas encore d'évaluation
Cours d'Algèbre 2 : Algèbre Linéaire
136 pages
Cours Algebre Lineaire l3 2
Pas encore d'évaluation
Cours Algebre Lineaire l3 2
66 pages
Cours Algebre 070908
Pas encore d'évaluation
Cours Algebre 070908
74 pages
Cours Complet
Pas encore d'évaluation
Cours Complet
97 pages
Algèbre Linéaire Et Bilinéaire Licence Troisième Année Parcours Maths X5M0040 Sylvain Gervais PDF Download
100% (6)
Algèbre Linéaire Et Bilinéaire Licence Troisième Année Parcours Maths X5M0040 Sylvain Gervais PDF Download
60 pages
Analyse Numérique : Algèbre Linéaire
Pas encore d'évaluation
Analyse Numérique : Algèbre Linéaire
31 pages
Alg Lin Cours Long
Pas encore d'évaluation
Alg Lin Cours Long
139 pages
Cours D'algèbre 2 Pour MIP S2
Pas encore d'évaluation
Cours D'algèbre 2 Pour MIP S2
163 pages
Akhir Page Fhada
Pas encore d'évaluation
Akhir Page Fhada
5 pages
CAPES Mathématiques 2021 : Épreuves et Solutions
Pas encore d'évaluation
CAPES Mathématiques 2021 : Épreuves et Solutions
6 pages
Fiche Revision Generale Maths Elite Science Ts2 2025
Pas encore d'évaluation
Fiche Revision Generale Maths Elite Science Ts2 2025
20 pages
07 Les Suites Numeriques Cours Stinmaths
Pas encore d'évaluation
07 Les Suites Numeriques Cours Stinmaths
9 pages
Espaces Vectoriels et Applications Linéaires
Pas encore d'évaluation
Espaces Vectoriels et Applications Linéaires
10 pages
QCM et Exercices Matlab Génie Civil
100% (1)
QCM et Exercices Matlab Génie Civil
3 pages
Topologie et espaces métriques en mathématiques
Pas encore d'évaluation
Topologie et espaces métriques en mathématiques
192 pages
TD04 Trigonometrie
Pas encore d'évaluation
TD04 Trigonometrie
3 pages
Chap3 Sys Lin Directes Part2
Pas encore d'évaluation
Chap3 Sys Lin Directes Part2
7 pages
Diagonalisation Matrice Hermitienne et Métrique
Pas encore d'évaluation
Diagonalisation Matrice Hermitienne et Métrique
4 pages
Pythagore : Théorème et Réciproque
Pas encore d'évaluation
Pythagore : Théorème et Réciproque
8 pages
Examen Mathématique 9ème 2022
Pas encore d'évaluation
Examen Mathématique 9ème 2022
3 pages
Épreuve Maths Tle D1 Trimestre 1
Pas encore d'évaluation
Épreuve Maths Tle D1 Trimestre 1
2 pages
1APIC23
Pas encore d'évaluation
1APIC23
2 pages
Produit Scalaire Dans Le Plan 3eme Mathematiques
Pas encore d'évaluation
Produit Scalaire Dans Le Plan 3eme Mathematiques
5 pages
Epreuve Maths 3eme ESP 1 Quatrieme Sequence
Pas encore d'évaluation
Epreuve Maths 3eme ESP 1 Quatrieme Sequence
2 pages
Cours 6 Droite Dans Le Plan TCS
100% (1)
Cours 6 Droite Dans Le Plan TCS
7 pages
Explication Du Cours 4 Septembre 2025
Pas encore d'évaluation
Explication Du Cours 4 Septembre 2025
8 pages
2xp XHF Bac Juin 1978
Pas encore d'évaluation
2xp XHF Bac Juin 1978
9 pages
Lyapunov
Pas encore d'évaluation
Lyapunov
25 pages
Limite Et Continuité - 2 Bac SM - AYYADI
Pas encore d'évaluation
Limite Et Continuité - 2 Bac SM - AYYADI
15 pages
Épreuve de mathématiques Terminale D 2023
Pas encore d'évaluation
Épreuve de mathématiques Terminale D 2023
1 page
Fonction Logarithme Néperien
Pas encore d'évaluation
Fonction Logarithme Néperien
15 pages
TC 16 17 s1 Ds1a Arithmetique Et Ensembles
Pas encore d'évaluation
TC 16 17 s1 Ds1a Arithmetique Et Ensembles
1 page
Devoir 4 (Type A) : Exercice 1: 10 Points
Pas encore d'évaluation
Devoir 4 (Type A) : Exercice 1: 10 Points
2 pages
Matrices Circulantes et Fonctions Libres
Pas encore d'évaluation
Matrices Circulantes et Fonctions Libres
1 page
Produit scalaire et orthogonalité des vecteurs
Pas encore d'évaluation
Produit scalaire et orthogonalité des vecteurs
2 pages
Chap 3 - Cours Racines Carrées TB
100% (1)
Chap 3 - Cours Racines Carrées TB
3 pages
Espaces Vectoriels et Applications Linéaires
Pas encore d'évaluation
Espaces Vectoriels et Applications Linéaires
3 pages
FCT Exponentielle
Pas encore d'évaluation
FCT Exponentielle
5 pages