Cours de Mathématiques Partie III - Algèbre: Mpsi 4
Cours de Mathématiques Partie III - Algèbre: Mpsi 4
Cours de mathématiques
Partie III – Algèbre
MPSI 4
Alain TROESCH
Version du:
21 décembre 2016
Table des matières
18 Structures algébriques 17
I Lois de composition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
I.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
I.2 Propriétés d’une loi de composition . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
I.3 Ensembles munis de plusieurs lois . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
I.4 Stabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
II Structures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
II.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
II.2 Morphismes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
II.3 Catégories (HP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
III Groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
III.1 Axiomatique de la structure groupes . . . . . . . . . . . . . . . . . . . . . . . . . . 27
III.2 Exemples importants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
III.3 Sous-groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
III.4 Les groupes Z/nZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
III.5 Congruences modulo un sous-groupe . . . . . . . . . . . . . . . . . . . . . . . . . . 32
III.6 Ordre d’un élément . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
IV Anneaux et corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
IV.1 Axiomatiques des structures d’anneaux et de corps . . . . . . . . . . . . . . . . . . 34
IV.2 Sous-anneaux, sous-corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
IV.3 Calculs dans un anneau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
IV.4 Éléments inversibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2 Table des matières
21 Espaces vectoriels 87
I Notion d’espace vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
I.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
I.2 Combinaisons linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
I.3 Un exemple important : espace de fonctions . . . . . . . . . . . . . . . . . . . . . . 89
I.4 Produits d’espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
I.5 Sous-espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
I.6 Intersections de sev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
I.7 Sous-espace vectoriel engendré par un sous-ensemble . . . . . . . . . . . . . . . . . 92
I.8 Sommes de sev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
I.9 Sommes directes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
II Familles de vecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
II.1 Familles libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
II.2 Familles génératrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
II.3 Bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
III Espaces vectoriels de dimension finie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
III.1 Notion de dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
III.2 Dimension, liberté et rang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
III.3 Dimension de sous-espaces et de sommes . . . . . . . . . . . . . . . . . . . . . . . . 100
23 Matrices 121
I Matrice d’une application linéaire et opérations matricielles . . . . . . . . . . . . . . . . . 121
I.1 L’ensemble des matrices de type (n, p) . . . . . . . . . . . . . . . . . . . . . . . . . 122
I.2 Matrice d’une application linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
I.3 Structure d’espace vectoriel de Mn,p (K) . . . . . . . . . . . . . . . . . . . . . . . . 124
I.4 Définition du produit matriciel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
I.5 Produit matriciel revisité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
I.6 Expression matricielle de l’évaluation d’une AL . . . . . . . . . . . . . . . . . . . . 129
I.7 Transposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
II Matrices carrées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
II.1 L’algèbre Mn (K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
II.2 Matrices triangulaires et diagonales . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
II.3 Matrices symétriques et antisymétriques . . . . . . . . . . . . . . . . . . . . . . . . 136
II.4 Matrices inversibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4 Table des matières
On a donc autant d’équations linéaires qu’il n’y a d’inconnues à trouver ; les valeurs de ces
inconnues seront obtenues par l’élimination ordinaire.
Voyons maintenant, si cette élimination est toujours possible, ou si la solution peut quelquefois
devenir indéterminée ou même impossible
Carl Friedrich Gauss (traduction Edmond Dubois)
Ce sont les tournesols, ce merveilleux cadeau
D’origine céleste et de divine essence.
Et c’est en pivotant tous dans le même sens
Qu’ils adorent leur père sans lui tourner le dos.
(Vette de Fonclare)
Et les shadoks pivotaient, pivotaient, pivotaient...
(Libre adaptation, d’après Jacques Rouxel)
Introduction
Ce chapitre est consacré à la résolution d’équations linéaires. Ces équations interviennent dans de nom-
breux problèmes d’algèbre linéaire, il est donc important d’avoir une démarche permettant d’arriver au
bout des calculs de façon ordonnée et méthodique. L’algorithme du pivot de Gauss fournit une telle
méthode, qui de plus, par son aspect algorithmique simple, a l’avantage de pouvoir être très facilement
implémentée sur un ordinateur.
• Le terme arabe « Al-jabr » signifie « par réduction » (ie « en se ramenant à des situations-type par
manipulation des termes »). Il a donné naissance au terme « algèbre ».
Nous nous intéressons ici aux équations linéaires à n indéterminées, autrement dit aux systèmes d’équa-
tions linéaires. La méthode que nous exposons ici est celle appelée couramment « méthode d’élimination
de Gauss-Jordan », ou encore « méthode du pivot de Gauss », mais ses origines remontent à des temps
bien plus anciens.
Les xi sont les inconnues du système, les ai,j les coefficients, et les bi contituent le second membre.
L’idée principale de l’algorithme du pivot de Gauss est de se ramener, par des combinaisons de lignes, à un
système échelonné équivalent, c’est à dire un système où l’inconnue de plus petit indice apparaissant dans
une ligne n’apparaît plus dans les lignes suivantes. Par exemple, un système triangulaire est échelonné.
Un tel système est facile à résoudre en partant par le bas.
La somme matricielle est définie pour des matrices de même taille uniquement, coefficient par coefficient :
c’est-à-dire :
a1,1 ··· a1,p b1,1 ··· b1,p a1,1 + b1,1 ··· a1,p + b1,p
. .. . .. .. ..
.
. . + .. . = . .
an,1 · · · an,p bn,1 · · · bn,p an,1 + bn,1 · · · an,p + bn,p
Nous rappelons également l’expression du produit de 2 matrices, possible uniquement lorsque le nombre
de colonnes de la première est égal au nombre de lignes de la seconde.
Ainsi, pour obtenir l’élément en position (i, k) du produit AB, on considère la ie ligne de A et la k e
colonne de B, et on forme la somme des produits coefficient par coefficient des coordonnées de cette ligne
et cette colonne.
En d’autres termes, ci,k est le résultat du produit scalaire canonique dans Rn de la colonne obtenue en
redressant la ie ligne de A et de la k e colonne de B.
Nous admettons à ce stade toutes les règles usuelles sur les opérations matricielles, notamment les pro-
priétés d’associativité et de distributivité, similaires à celles des réels. Attention cependant au fait que le
produit matriciel n’est pas commutatif, et qu’une égalité M X = M Y n’implique pas toujours X = Y ,
même si M 6= 0 (la bonne condition est l’inversibilité de M ; plus généralement, dans une structure al-
gébrique, la possibilité de faire une telle simplification définit la notion d’élément régulier ; tout élément
inversible est régulier, la réciproque étant en général fausse).
L’intérêt de cette présentation matricielle est d’une part la rapidité apportée par le fait qu’on se dispense
de réécrire les variables, et d’autre part une présentation plus claire, du fait de l’alignement obligé des
coefficients dans la matrice. Ce n’est rien de plus que le principe de la disposition rectangulaire des chinois.
Une disposition méthodique de la sorte supprime une source importante d’erreurs d’inattention.
Nous renvoyons au chapitre concernant les équations différentielles pour la notion de sous-espace affine,
que nous retrouvons dans la situation présente :
Remarque 17.2.2
• L’itération de la première opération (permutation) autorise les permutations quelconques des
lignes d’une matrice. En effet, nous justifierons plus tard que toute permutation de Sn peut se
décomposer en composition de transpositions, c’est-à-dire en produit de permutations particu-
lières n’effectuant que l’échange de deux valeurs. On peut remarquer que la justification de la
correction de certains algorithmes de tri basés sur des transpositions (par exemple le tri par
insertion ou le tri à bulles) permet de prouver cette affirmation.
II Échelonnement d’une matrice par la méthode du pivot 11
• La combinaison des deux dernières règles amène la règle suivante souvent bien pratique :
Li ← λLi + µLj , si λ 6= 0.
Attention à ce que le coefficient devant la ligne modifiée par cette opération ne soit pas nul !
Avertissement 17.2.3
Les différentes opérations s’effectuent successivement (même si on les note ensemble dans la même
étape) : on ne peut pas effectuer des opérations simultanées. Ainsi, si on a dans la même étape deux
opérations L1 ← L1 + L2 et L2 ← L1 + L2 , cela signifie que la seconde est effectuée avec la ligne L1
obtenue à l’issue de la première opération, et non avec la ligne L1 initiale.
Théorème 17.2.4 (Effet des opérations sur les lignes sur un système)
Soit AX = B un système linéaire. Effectuer l’une des opérations ci-dessus (permutation, dilatation ou
transvection) à la fois sur A et sur B fournit un système équivalent, donc ne modifie pas l’ensemble
des solutions.
En effet, il suffit de savoir faire les opérations inverses, ramenant au système initial :
• L’opération inverse de Li ↔ Lj est Li ↔ Lj
• L’opération inverse de Li ← λLi (pour λ 6= 0) est Li ← λ1 Li
• L’opération inverse de Li ← Li + λLj est Li ← Li − λLj .
Ainsi que suggéré dans le théorème ci-dessus, nous allons donc transformer le système initial petit à
petit, en appliquant les mêmes transformations à la matrice A et à la matrice B. Par commodité, nous
adopterons la présentation suivante pour représenter les coefficients du système, en tenant compte de la
matrice B :
a1,1 ··· a1,p b1
. .. ..
(A | B) = ..
. .
an,1 · · · an,p bn
Ainsi, effectuer les mêmes opérations sur les lignes de A et B revient à effectuer ces opérations sur la
matrice (A | B).
Autrement dit, les lignes nulles sont regroupées au bas de la matrice (lignes k + 1 à m), les autres
lignes sont classées suivant la position de leur premier élément non nul, ces positions étant deux à deux
distinctes. Une matrice échelonnée admet donc la représentation suivante :
12 CHAPITRE 17. FANG CHENG, OU L’ÉLIMINATION DE GAUSS-JORDAN...
0 ··· 0 a1,j1 • ... •
0 ··· ··· 0 a2,j2 • ... •
. ..
.
. .
M =
0 ··· ··· 0 ak,jk • . . . • ,
0 ··· ··· 0
. ..
.
. .
0 ··· ··· 0
Remarque 17.2.8
Bien entendu, les critères de choix du pivot sont donnés ici en vue d’un calcul à la main. En vue d’une
implémentation sur ordinateur, le choix du pivot doit se faire de sorte à diminuer au maximum les
erreurs d’arrondi. Les critères sont, dans cette optique, différents de ceux énoncés ci-dessus. À première
approximation, le choix d’un pivot de valeur absolue maximale est à privilégier.
Nous donnons ci-dessous une description purement algorithmique en pseudo-code un peu lâche.
III Résolution d’un système échelonné 13
Exemple 17.2.11
Recherche d’une réduite de Gauss A′ , et de la matrice B ′ associée lorsque :
1 −4 −2 3 2 1
A= 2 2 1 0 1 et B = 2 .
−1 0 0 1 0 3
les lignes suivantes. Si on a déjà obtenu des valeurs pour les inconnues des dernières lignes, donner des
valeurs quelconques à toutes les nouvelles inconnues sauf une détermine alors la dernière inconnue.
On peut donc remonter le système en donnant des valeurs quelconques à toutes les nouvelles inconnues
de chaque ligne, sauf une. L’inconnue qui jouera ce rôle particulier est l’une quelconque des nouvelles
inconnues (en remontant), mais un choix s’impose naturellement : celui de la première inconnue interve-
nant de façon effective dans la ligne. Autrement dit, l’inconnue se plaçant à la position du pivot utilisé
sur cette ligne pour obtenir l’échelonnement.
Remarque 17.3.2
• La définition d’inconnue principale donnée ici est fortement dépendante de l’ordre des variables.
Une permutation des variables préservant l’échelonnement (c’est en général possible) donnerait
un autre système d’inconnues principales.
• Il existe une notion plus générale d’inconnues principales, se définissant bien à l’aide de détermi-
nants, portant sur des systèmes non nécessairement échelonnés. En gros, il s’agit d’un système
d’inconnues tel que le choix quelconque des autres inconnues déterminent de façon unique les
inconnues principales. Mais pour un système donné, le choix des inconnues principales n’est pas
unique.
• Dans ce cadre plus général, notre définition des inconnues principales n’est qu’un des plusieurs
choix possibles pour le système échelonné donné.
Exemple 17.3.4
Recherche d’une solution particulière dans le cas de l’exemple 17.2.11.
Proposition 17.3.6
L’ensemble des solutions du matrice échelonné AX = 0 est obtenu en résolvant le système triangu-
laire obtenu sur les inconnues principales en donnant toutes les valeurs possibles quelconques pour les
inconnues non principales.
Les inconnues non principales sont à voir comme des paramètres. Ainsi, on détermine les inconnues
principales en fonction de ces paramètres par la résolution d’un système triangulaire, qu’on effectue par
remontée. On obtient de la sorte la description de S0 , l’espace des solutions de l’équation homogène, sous
forme d’un espace paramétré par les inconnues non principales.
On peut remarquer qu’effectuer cette opération directement sur le système non homogène permet, de la
même façon, de trouver directement une paramétrisation de l’espace affine S.
16 CHAPITRE 17. FANG CHENG, OU L’ÉLIMINATION DE GAUSS-JORDAN...
18
Structures algébriques
THÉORÈME. Soit une équation donnée, dont a, b, c, ... sont les m racines. Il y aura toujours
un groupe de permutations des lettres a, b, c, ... qui jouira de la propriété suivante :
1. Que toute fonction des racines, invariable par les substitutions de ce groupe, soit ration-
nellement connue ;
2. Réciproquement, que toute fonction des racines, déterminable rationnellement, soit inva-
riable par les substitutions.
[...] Nous appellerons groupe de l’équation le groupe en question.
(Évariste Galois)
Restez groupir !
(hum...)
La notion de structure algébrique repose de façon essentielle sur la notion de loi de composition (c’est-
à-dire d’opération définie sur un ensemble, comme l’addition ou la multiplication) et sur les différentes
propriétés que ces lois de composition peuvent vérifier. Nous commençons donc notre étude par l’examen
de ces propriétés, après avoir défini de façon précise ce qu’est une loi de composition.
I Lois de composition
I.1 Définitions
Dans ce qui suit, E est un ensemble quelconque.
18 CHAPITRE 18. STRUCTURES ALGÉBRIQUES
Exemples 18.1.2
• Les lois + et × sont des lois de composition internes sur N, Z, R ou C.
• La loi + est une loi de composition interne sur Rn ou Cn .
• (λ, X) 7→ λX (multiplication d’un vecteur par un scalaire) est une loi de composition externe
sur Rn (ou Cn ), d’ensemble d’opérateurs R (ou C).
• De même pour la multiplication des polynômes par des scalaires.
• La composition ◦ définit une loi de composition interne sur E E .
• Le produit scalaire sur Rn n’est pas une loi de composition (interne ou externe), car le résultat
de l’opération n’est pas un élément de Rn .
Ainsi, lorsque E est muni d’une loi associative, on peut effectuer les opérations dans l’ordre que l’on
veut, à condition de respecter la position respective des éléments les uns par rapport aux autres. Si
la loi est commutative, on peut échanger la position respective des éléments (mais pas nécessairement
faire les opérations dans l’ordre qu’on veut si la loi n’est pas associative). Pour énoncer cette propriété
d’associativité généralisée, on commence par définir ce qu’est un parenthésage admissible.
Remarque 18.1.5
Le parenthésage le plus externe n’est pas complètement utile, et ne sert qu’à continuer la construction
si d’autres termes doivent s’ajouter à l’expression. Ainsi, dans une expression munie d’un parenthésage
admissible, on omet souvent le jeu de parenthèses externes. Par exemple, l’expression (x1 ⋆ x2 ) est
munie d’un parenthésage admissible, mais on écrira plutôt x1 ⋆ x2 . De même, on écrira x1 ⋆ (x2 ⋆ x3 )
plutôt que (x1 ⋆ (x2 ⋆ x3 )).
Exemples 18.1.6
En utilisant la convention de la remarque précédente, lesquelles des expressions ci-dessous sont munies
d’un parenthésage admissible ?
• (x1 ⋆ x2 ) ⋆ (x3 ⋆ x4 ) ⋆ x5
• (x1 ⋆ x2 ) ⋆ ((x3 ⋆ x4 ) ⋆ x5 )
• (x1 ⋆ x2 ) ⋆ x3 ) ⋆ ((x4 ⋆ x5 )
Ce résultat qui paraît évident intuitivement n’est pas si évident que cela à démontrer. Une démonstration
consiste à montrer par récurrence forte sur n (en se servant de la structure inductive), toute expression
convenable parenthésée est égale à l’expression munie du parenthésage croissant, dans lequel les opérations
sont faits dans l’ordre de lecture. La démonstration consiste alors à décomposer une expressions en deux,
écrire l’expression de droite avec un parenthésage croissant en utilisant l’hypothèse de récurrence, utiliser
l’associativité pour isoler xn puis réutiliser l’hypothèse de récurrence sur l’expression de gauche constituée
maintenant de n − 1 termes.
On peut aussi donner une propriété de commutativité généralisée, lorsqu’on a à la fois l’associativité et la
commutativité. Dans le cas d’une structure commutative non associative, la description est plus délicate.
Ici encore, le théorème semble assez évident. Mais une démonstration rigoureuse nécessite un petit ef-
fort de reflexion, et l’utilisation de quelques propriétés des permutations. On peut montrer que toute
permutation s’écrit comme composée de permutations très simples consistant simplement à échanger 2
termes consécutifs, en laissant les autres fixes. C’est ce qu’on fait par exemple lorsqu’on effectue un tri à
bulles, ou un tri par insertion, si on remonte les éléments au fur et à mesure. En admettant ce résultat,
on passe donc de l’expression de gauche à l’expression de droite en faisant une succession d’échanges
20 CHAPITRE 18. STRUCTURES ALGÉBRIQUES
de deux termes consécutifs. Par associativité généralisée, on peut trouver un parenthésage associé qui
regroupe ces deux termes, et donc l’échange de ces deux termes ne chage pas la valeur de l’expression
(par commutativité).
En attendant de disposer de ce résultat, on peut montrer à la main que l’échange de deux termes quel-
conques non nécessairement consécutifsne change pas la valeur de l’expression, ce qui permet d’échanger
xn et xϕ(n) dans l’expression de droite (si n 6= ϕ(n)), puis on termine par récurrence, en considérant
l’expression formée des n − 1 premiers termes.
Avertissement 18.1.11
Attention à toujours bien indiquer le parenthésage lorsque la loi n’est pas associative, ou lorsque
plusieurs lois sont en jeu sans qu’il n’ait été défini de façon explicite de relation de priorité sur les
opérations.
Ainsi, vous avez déjà l’habitude d’écrire ab au lieu de a × b ou a · b. Cet usage, courant dans R ou
C, est aussi fréquent pour les opéraions matricielles, à la fois pour le produit interne que le produit
externe (multiplication d’une matrice par un scalaire). De façon peut-être plus troublante, il est fréquent
d’omettre le ◦ de la composition, en particulier lorsqu’on compose des applications linéaires (il n’y a alors
pas d’ambiguïté sur le sens de ce produit, les éléments de l’espace d’arrivée ne pouvant en général pas se
multiplier entre eux)
Si E admet un élément neutre e pour la loi ⋆ (voir ci-dessous), on note par convention x⋆0 = e. Remarquez
qu’alors, la définition par récurrence est aussi valable pour passer de l’exposant 0 à l’exposant 1.
I Lois de composition 21
Dans le cas où plusieurs lois sont en jeu, la notation xn peut prêter à confusion. En général, dans les
structures faisant intervenir deux lois dont une commutative, on utilise la multiplication × (loi multi-
plicative) et l’addition + (loi additive). On distingue les itérations des lois sans introduire de lourdeur
d’écriture en utilisant une notation particulière pour l’itération de l’addition, calquée sur ce qu’il se passe
dans R :
Attention au fait que généralement, n n’étant pas élément de E, la notation · est à distinguer d’une
éventuelle multiplication dans E (cela définit une loi externe à opérateurs dans N). Si N ⊂ E, la loi
externe · peut coïncider avec le produit, si E est muni d’une structure suffisamment riche. C’est ce qui
se produit dans la plupart des structures qui contiendront N que nous aurons l’occasion de considérer.
Nous voyons maintenant des propriétés liées à l’existence de certains éléments particuliers de E.
Pour une loi commutative, e est neutre ssi e est neutre à droite ssi e est neutre à gauche.
Une loi ne peut pas admettre plusieurs éléments neutres, comme le montre la propriété suivante.
Exemples 18.1.23
1. Dans N seul 0 admet un opposé pour +.
2. Dans Z, R, Q, C, tout élément admet un opposé pour +.
3. Dans N seul 1 admet un inverse, dans Z, seuls 1 et −1 admettent un inverse. Dans R, Q et C
tous les éléments non nuls admettent un inverse.
4. Dans E E muni de ◦, sous réserve de l’axiome du choix, les éléments symétrisables à gauche sont
les injections, les éléments symétrisables à droite sont les surjections, les éléments symétrisables
sont les bijections. Une injection non surjective admet plusieurs symétriques à gauche ; une
surjection non injective admet plusieurs symétriques à droite.
Traduisons pour une loi multiplicative : si x et y sont inversibles, d’inverses x−1 et y −1 , alors xy aussi, et
(xy)−1 = y −1 x−1 .
Dans le cas d’une loi additive (commutative par convention d’usage), on obtient
Exemples 18.1.26
1. 0 est absorbant pour × dans N, Z, Q, R, C.
2. Pour la loi (x, y) 7→ y, tout élément y de E est absorbant à droite. Il n’y a pas d’élément
absorbant à gauche si E est de cardinal au moins 2.
∀(y, z) ∈ E 2 , x ⋆ y = x ⋆ z =⇒ y = z.
∀(y, z) ∈ E , y ⋆ x = z ⋆ x =⇒ y = z.
• Un élément x est dit régulier (ou simplifiable) s’il est à la fois régulier à gauche et à droite.
Ainsi, le fait de pouvoir simplifier une égalité par un réel ou complexe non nul x ne vient pas tant de
la non nullité que de l’inversibilité de x. Par exemple, la non nullité n’est pas un critère suffisant de
régularité dans Mn (R) : il est nécessaire d’avoir l’inversibilité de la matrice que l’on veut simplifier.
Il convient toutefois de noter que la condition d’inversibilité, si elle est suffisante, n’est en général pas
nécessaire.
Exemple 18.1.29
Donnez des exemples de structures algébriques simples dans lesquelles certains éléments sont réguliers
sans être inversibles.
Exemples 18.1.31
1. La loi × est distributive sur + dans N, Z, R, C, Mn (R)...
2. La loi ∩ est distributive sur ∪ sur P(X). Inversement, la loi ∪ est distributive sur ∩.
3. Que peut-on dire de la loi ∩ par rapport à elle-même ? De la loi ∪ ?
24 CHAPITRE 18. STRUCTURES ALGÉBRIQUES
Remarque 18.1.32
La première relation x ⋆ (y ⋄ z) = (x ⋆ y) ⋄ (x ⋆ z) a également un sens lorsque ⋆ est une loi externe.
Ainsi, dans Rn , muni de l’addition en loi interne, et de la multiplication des scalaires en loi externe, on
a λ(X + Y ) = λX + λY : la loi externe est distributive sur la loi interne.
Exemple 18.1.34
Comprendre la formule ci-dessus pour l’expression (x1 + x2 ) × (y1 + y2 + y3 ) × (z1 + z3 ).
Cette propriété est par exemple satisfaite sur Rn pour la multiplication par un scalaire : (λµ)X = λ(µX).
Plus généralement, un espace vectoriel vérifiera cette propriété de pseudo-associativité.
I.4 Stabilité
Définition 18.1.36
Soit E un ensemble muni d’une loi ⋆ et F ⊂ E un sous-ensemble de E. On dit que F est stable par ⋆,
si la restriction de la loi de E à F × F peut se corestreindre à F , autrement dit si :
∀(x, y) ∈ F 2 , x ⋆ y ∈ F.
Dans ce cas, la loi de E se restreint en une loi ⋆F : F × F → F , appelée loi induite sur F par ⋆.
II Structures
II.1 Généralités
Définition 18.2.1
• Une structure de « truc » est la donnée d’un certain nombre d’axiomes (définissant ce qu’on
appelle un « truc ») portant sur un ensemble fini de lois de composition (internes et/ou externes).
• On dit qu’un ensemble E est muni d’une structure de truc ssi E est muni d’un nombre fini de
lois de composition vérifiant les axiomes de structure de truc.
II Structures 25
Exemples 18.2.2
1. Une structure de magma se définit comme la donnée d’une loi de composition, et un ensemble
vide d’axiomes. Ainsi, tout ensemble E muni d’une loi de composition est muni d’une structure
de magma.
2. Une structure de monoïde se définit comme la donnée d’une loi de composition, et de deux
axiomes : l’associativité de la loi et l’existence d’un élément neutre. Par exemple (N, +) est muni
d’une structure de monoïde (on dit plus simplement que (N, +) est un monoïde). L’ensemble
des mots sur un alphabet A, muni de l’opération de concaténation est aussi un monoïde (appelé
monoïde libre sur l’alphabet A). Contrairement à N, le monoïde libre n’est pas commutatif.
3. Ainsi, la structure de monoïde est plus riche que celle de magma : tout monoïde est aussi un
magma ; un monoïde peut être défini comme un magma dont la loi est associative et possède un
élément neutre.
4. Une structure de groupe est une structure de monoïde à laquelle on rajoute l’axiome d’existence
de symétriques. Par exemple (Z, +) est un groupe, mais pas (N, +).
Avertissement 18.2.4
En général, F ne peut pas être muni d’une structure de truc, mais seulement d’une structure moins
riche, certains des axiomes de la structure de truc pouvant ne pas être préservée par restriction.
Exemple 18.2.5
(N, +) est la structure induite sur N par la structure de groupe additif de (Z, +). En revanche, (N, +)
n’est pas un groupe. On a perdu l’existence des opposés par restriction.
Nous verrons comment traduire de façon effective cette notion dans le cas de sous-groupes et sous-anneaux.
II.2 Morphismes
Lorsqu’on dispose d’une structure de truc, on est souvent amené à considérer des applications entre
ensembles munis de la structure de truc. Cependant seules nous intéressent les applications compatibles
dans un certain sens avec la structure de truc : les autres ne sont pas pertinentes dans le contexte (si on
26 CHAPITRE 18. STRUCTURES ALGÉBRIQUES
a à s’en servir, c’est qu’on sort de la structure de truc, et que la structure de truc n’est plus le contexte
adapté).
• Si l’existence du neutre ei pour la loi ⋆ est imposée dans les axiomes (et donc le neutre e′i pour
i
la loi ⋄ existe aussi), f doit être compatible avec le neutre : f (ei ) = e′i .
i
On peut avoir à rajouter certaines propriétés liées à la structure étudiée. On peut aussi ajouter l’exis-
tence d’un homomorphisme nul (ne vérifiant pas la compatibilité avec les neutres non additifs), afin
d’obtenir une structure intéressante sur l’ensemble des morphismes.
Ainsi, un homomorphisme entre deux ensembles muni d’une certaine structure est une application « res-
pectant » cette structure.
Pour chaque structure étudiée, nous redéfinirons de façon précise la notion d’homomorphisme associée, si
celle-ci est à connaître. Nous donnons une propriété générale, dont la démonstration dans le cadre général
nous dispensera des démonstrations au cas par cas.
Terminologie 18.2.10
• Un isomorphisme de truc est un homomorphisme de truc bijectif.
• Un endomorphisme de truc est un homomorphisme de truc de E dans lui-même (muni des
mêmes lois)
• Un automorphisme de truc est un endomorphisme qui est également un isomorphisme.
Proposition 18.2.11
Si f : E −→ F est un isomorphisme de truc, alors f −1 est un isomorphisme de truc.
Ainsi, la réciproque d’un isomorphisme est bijective (ça, ce n’est pas une surprise), et, ce qui est moins
évident, c’est aussi un homomorphisme de truc.
Cette notion de catégorie nous permet de travailler dans un certain contexte. Se donner une catégorie
permet de se concentrer sur un certain type d’objets, et un certain type d’applications, et de les étudier
d’un point de vue formel.
La notion de catégorie dépasse largement le cadre de l’étude des structures algébriques, car si les structures
algébriques fournissent des catégories, de nombreuses catégories sont issues d’autres contextes, comme :
• la catégorie des ensembles, les morphismes étant toutes les applications ;
• la catégorie des ensembles ordonnés, les morphismes étant les applications croissantes
• la catégorie des espaces topologiques, les morphismes étant les applications continues
• ou encore, la catégorie des catégories, les morphismes étant les foncteurs de C dans D, associant
à chaque objet de C un objet de D, et à chaque flèche de C une flèche de D, tout en respectant
un certain nombre de règles de compatibilité.
• ou encore, des catégories de foncteurs entre deux catégories, les objets étant cette fois des foncteurs,
et les flèches étant des « transformations naturelles » entre foncteurs...
III Groupes
III.1 Axiomatique de la structure groupes
En vertu des définitions générales données dans le paragraphe précédent, nous donnons la définition
suivante :
Exemples 18.3.9
1. (Z, +), (Q, +), (R, +), (C, +) sont des groupes commutatifs notés additivement.
2. (Q∗ , ×), (R∗ , ×), (C∗ , ×), (Q∗+ , ×), (R∗+ , ×) sont des groupes commutatifs notés multiplicative-
ment.
3. (N, +), (Q, ×), (Z, ×), « (R∗− , ×) » sont-ils des groupes ?
4. (U, ×) et (Un , ×) sont des groupes.
III Groupes 29
f : (Z, +) −→ (Un , ×)
ℓ 7→ ωkℓ
III.3 Sous-groupes
Toujours en suivant les définitions plus générales, nous donnons la définition suivante :
Remarquez qu’on n’a pas donné l’appartenance du neutre à H dans la définition, celle-ci étant automa-
tique en vertu de :
Dans la pratique, pour vérifier que H est un sous-groupe de G on utilise le résultat suivant, ou sa version
compactée :
On traduit cette dernière propriété dans les deux cas les plus fréquents :
• pour un sous-groupe d’un groupe additif, la vérification de stabilité à faire est donc :
∀(x, y) ∈ H 2 , x − y ∈ H;
• pour un sous-groupe d’un groupe multiplicatif, la vérification de stabilité à faire est donc :
∀(x, y) ∈ H 2 , xy −1 ∈ H.
Dans certaines situations, il est plus commode de dissocier l’étude de la stabilité par produit et de la
stabilité par inversion.
De façon évidente, étant donné G un groupe, d’élément neutre e, {e} et G sont des sous-groupes de G.
Cette proposition implique que la relation « être un sous-groupe de » est une relation d’ordre. Cela justifie
la notation ci-dessous, qu’on rencontre dans certains ouvrages, et qui est un raccourci bien commode :
Remarque 18.3.18
Une union de sous-groupes est-elle un sous-groupe ?
Les sous-groupes de Z sont donc des groupes monogènes (additifs) , dans le sens suivant (donné multi-
plicativement) :
III Groupes 31
H = {xn , n ∈ Z}
h{x}i = hxi .
Nous avons déjà eu l’occasion de prouver en exercice le résultat suivant, pour l’employer dans des situa-
tions particulières :
Proposition 18.3.25
(Z/nZ, +) est un groupe abélien monogène fini.
Ces groupes jouent un rôle important pour l’étude des groupes abéliens finis. On peut en effet montrer
que tout groupe abélien fini est produit cartésien de groupes de ce type (théorème de structure).
Exemple 18.3.27
Soit n > 2. On a Un ≃ Z/nZ. En fait, Z/nZ est le groupe monogène additif d’ordre n de référence,
alors que Un est le groupe monogène multiplicatif d’ordre n de référence.
∀(x, y) ∈ G, x ≡d y mod H ⇐⇒ xy −1 ∈ H.
Exemple 18.3.30
Si G = Z et H = nZ, cela correspond (en notation additive cette fois) à la relation de congruence
modulo n.
Proposition 18.3.31
Les relations de congruence à gauche et à droite modulo H sont des relations d’équivalence.
On en déduit une des propriétés les plus importantes des cardinaux des groupes finis.
III Groupes 33
Remarquez aussi que pour que les deux relations de congruence coïncident il faut et il suffit que pour
tout a ∈ G, aH = Ha, ou encore aHa−1 = H. Cela motive la définition suivante, très importante dans
l’étude des tours de composition, à la base de la théorie de Galois. C’est sous cette condition en effet que
la loi quotient de la loi G par la relation de congruence munira le quotient d’une structure de groupe.
Lorsque H est un sous-groupe distingué de G, les relations d’équivalence définies par les congruences à
droite et à gauche coïncident. On note G/H l’ensemble quotient de cette relation d’équivalence. Ainsi,
formellement,
G/H = {aH, a ∈ G} = {Ha, a ∈ G}.
(aH)(bH) = (ab)H,
où le produit (aH)(bH) désigne l’ensemble formé de tous les produits xy, avec x ∈ aH et y ∈ bH.
(aH)(bH) = (ab)H.
Autrement dit, elle correspond au produit terme à terme décrit plus haut. Cette propriété autorise les
manipulations formelles sur les éléments de G/H représentés sous la forme aH.
34 CHAPITRE 18. STRUCTURES ALGÉBRIQUES
Remarque 18.3.40
Lorsque G est un groupe abélien, tout sous-groupe H de G est distingué. Ainsi, tout quotient G/H
peut être muni d’une structure de groupe, par quotient de la structure de G.
ord(x) = min{n ∈ N∗ | xn = 1}
Cet ordre peut être +∞ par convention si l’ensemble ci-dessus est vide.
ord(x) = | hxi |
Ainsi, l’ordre de x est égal à l’ordre du sous-groupe monogène engendré par x (éventuellement infini).
Plus précisément, si cet ordre est fini,
On en déduit :
Dans le cas où G est abélien, on peut donner une démonstration élémentaire de ce théorème n’utilisant
pas les classes de congruence modulo un sous-groupe.
IV Anneaux et corps
IV.1 Axiomatiques des structures d’anneaux et de corps
Remarque 18.4.2
Certains ouvrages (notamment anciens) n’imposent pas l’existence de l’élément neutre 1 pour le produit
et parlent alors d’anneau unifère ou unitaire pour ce que nous appelons ici simplement un anneau. La
convention que nous adoptons concernant l’existence d’un élément neutre est celle généralement adoptée
actuellement, et nous suivons en cela le programme officiel de la classe de MPSI.
Exemples 18.4.3
1. {0} muni des opérations triviales est un anneau ; ici le neutre pour le produit est 0.
2. Z, R, Q et C munis des opérations usuelles sont des anneaux.
3. Pour tout n ∈ N∗ , Z/nZ est un anneau. La structure circulaire de ces anneaux explique la
terminologie.
4. L’ensemble R[X] des polynômes à coefficients réels est un anneau. De même pour Z[X], Q[X]
ou Z[X].
5. N n’est pas un anneau.
6. L’ensemble Mn (R) des matrices carrées est un anneau.
7. L’ensemble (P(E), △, ∩) est un anneau (anneau de Boole).
8. (RR , +, ◦) est-il un anneau ?
Proposition 18.4.5
Si A est un anneau ayant au moins deux éléments, alors 1 6= 0.
Les exemples donnés ci-dessus sont des exemples d’anneaux commutatifs, à l’exception d’un exemple.
Lequel ?
Enfin, conformément à la définition générale, nous donnons :
Ainsi, un homomorphisme d’anneaux (à part le morphisme nul un peu particulier) est à la fois un
homomophisme du groupe (A, +) et du monoïde (A, ×).
Un corps est un anneau vérifiant une condition supplémentaire :
Ainsi K est un corps si et seulement si c’est un anneau commutatif non réduit à {0}, et tel que tout
élément non nul soit inversible. En particulier, {0} n’est en général pas considéré comme un corps.
Remarque 18.4.9
• Conformément au programme, nous adoptons la convention stipulant que tout corps doit être
commutatif. Là encore, les ouvrages anciens n’imposent pas cette condition. Il est d’usage ac-
tuellement d’appeler corps gauche un ensemble muni d’une structure vérifiant tous les axiomes
de la structure de corps, à l’exception de la commutativité de la multiplication. On rencontre
aussi parfois la terminologie anneau à divisions, traduction de la terminologie anglaise division
ring.
• Dans le cas des corps finis, les deux notions coïncident, d’après le théorème de Wedderburn,
stipulant que « tout corps fini est commutatif », ce qui, avec notre terminologie, se réexprime :
« tout corps gauche fini est un corps. ».
Exemples 18.4.10
1. R, Q et C sont des corps.
2. Z n’est pas un corps.
3. En général Z/nZ n’est pas un corps. Par exemple, 2 n’est pas inversible dans Z/4Z.
La notation utilisée s’explique par la terminologie anglaise (field ) pour un corps. Par exemple, F2 = Z/2Z
est un corps à 2 éléments. C’est le plus petit corps possible, puisqu’un corps contient 0, et par définition,
n’est pas réduit à {0}.
Remarque 18.4.12
On peut montrer que tout corps fini a un cardinal égal à pn , où p est un nombre premier et n un entier.
On peut également montrer que pour de telles données, il existe (à isomorphisme près) un unique corps
à q = pn éléments, qu’on note Fq . Lorsque n = 1, on retrouve les corps Fp du point précédent.
Remarque 18.4.17
• Un corps fini est toujours de caractéristique non nulle, donc première.
• Il existe des corps infinis de caractéristique p (par exemple le corps des fractions rationnelles à
coefficients dans Fp )
• Si K est un corps de caractéristique p, alors pour tout x de K, px = x + · · · + x = 0 (avec p
facteurs dans la somme).
Remarquez qu’encore une fois, on ne dit rien de l’appartenance de 0A à B, celle-ci étant ici aussi auto-
matique (puisque (B, +) est un sous-groupe de (A,( +)). En !
revanche,)l’appartenance de 1A à B n’est pas
λ 0
automatique, comme le montre l’exemple de B = , λ ∈ R , sous-ensemble de M2 (R), stable
0 0
pour les lois + et ×. Ce n’est pas un sous-anneau au sens que nous en avons donné puisque I2 6∈ B. En
revanche, les restrictions
! de × et + définissent tout de même une structure d’anneau sur B, le neutre
1 0
étant alors .
0 0
Exemples 18.4.20
1. Z est un sous-anneau de Q qui est un sous-anneau de R qui est un sous-anneau de C.
2. Z/nZ n’a d’autre sous-anneau que lui-même.
Remarque 18.4.22
On pourrait remplacer l’hypothèse 1K ⊂ L par le fait que L contient un élément x 6= 0K .
Exemples 18.4.24
Q est un sous-corps de R, R est un sous-corps de C. Entre Q et R, il existe un grand nombre de
√
corps intermédiaires (corps de nombres), par exemple Q[ 2], plus petit sous-corps de R contenant les
√
rationnels et 2. Plus explicitement,
√ √
Q[ 2] = {a + b 2, (a, b) ∈ Q}
par ailleurs, les calculs nécessitant de permuter l’ordre de certains facteurs multiplicatifs ne peuvent pas
être effectués en toute généralité dans un anneau non commutatif. Ainsi :
• Pour des calculs dans un anneau : considérer l’analogie avec Z (plutôt que R), et se méfier :
∗ des inversions intempestives
∗ des simplifications abusives
∗ des problèmes de commutativité, qui nécessitent parfois l’introduction d’hypothèses supplé-
mentaires, à vérifier scrupuleusement.
L’analogie avec Z n’est pas toujours suffisante, puisqu’il peut se produire des situations bien
particulières, n’ayant pas lieu dans Z, comme par exemple l’existence de « diviseurs de zéro » (voir
un peu plus loin)
• Pour des calculs dans un corps : toute analogie avec R est permise.
Nous rappelons qu’on peut définir dans un anneau A le produit nx où n ∈ Z, et x ∈ A de la manière
suivante :
• Si n = 0, nx = 0
• Si n > 0, nx = x + · · · + x (n facteurs)
• Si n < 0, nx = −|n|x.
Nous pouvons définir même an , pour tout n ∈ N, et même pour tout n ∈ Z si a est inversible.
Nous voyons, outre les règles usuelles découlant des règles d’associativité et de distributivité, deux résul-
tats déjà évoqués dans le cas de R ou C, et que nous voyons plus généralement dans le cadre d’anneaux,
mais qui nécessitent une hypothèse de commutativité.
n−1
X
n n
a − b = (a − b) an−1−k bk .
k=0
n−1
X
1 − an = (1 − a) ak .
k=0
Si 1 − a est inversible (condition plus forte que a 6= 1), on peut alors écrire :
n−1
X
(1 − a)−1 (1 − an ) = ak
k=0
En revanche, évitez d’écrire cela sous forme de fraction lorsqu’on n’est pas dans une structure commuta-
tive, et attention à placer l’inverse du bon côté (même si, pour l’expression considérée, ce ne serait pas
gênant car les facteurs considérés commutent, même si globalement l’anneau n’est pas commutatif ; mais
autant prendre dès maintenant de bonnes habitudes)
Attention en revanche au cas où on n’a pas commutativité de a et b : il convient de bien distinguer les
deux facteurs ab et ba appraissant dans le développement de (a + b)(a + b) (par exemple, pour n = 2) :
(a + b)(a + b) = a2 + ab + ba + b2 6= a2 + 2ab + b2 ,
si ab 6= ba. Cette situation peut se produire notamment dans le cadre du produit matriciel. Il faut être
toujours bien vigilant à vérifier l’hypothèse de commutativité ab = ba.
Remarque 18.4.33
Remarquez la cohérence avec les notations déjà rencontrées R∗ , Q∗ , C∗ ... mais pas avec Z∗ . C’est pour
cette raison qu’on rencontre aussi parfois la notation A× , pour distinguer l’ensemble des inversibles de
l’ensemble des non nuls. Dans le cas d’un corps, cette distinction n’a pas lieu d’être.
Exemples 18.4.34
1. (Mn (R))∗ = GLn (R), ensemble des matrices inversibles, appelé groupe linaire
2. L’ensemble des inversibles de Z : Z× = U (Z) = {−1, 1}.
3. (Z/4Z)∗ = {1, 3}
4. (Z/pZ)∗ = (Z/pZ) \ {0}, si p est premier. On peut montrer que ce groupe multiplicatif est
isomorphe au groupe additif Z/(p − 1)Z.
5. Que dire plus généralement de (Z/nZ)∗ ?
L’étude de Z/4Z amène un résultat peu commun pour qui n’a pas l’habitude de travailler dans des
structures algébriques abstraites : 2 × 2 = 0. Autrement dit, on a deux éléments a et b non nuls, et
vérifiant ab = 0. La vieille règle, bien pratique pour résoudre des équations, qui nous dit que si ab = 0,
alors a = 0 ou b = 0, ne s’applique donc pas dans ce contexte. Comme elle est bien pratique tout de
même, nous allons établir un contexte dans lequel elle est vraie, en définissant une propriété adéquate
des anneaux nous permettant de l’utiliser.
Proposition 18.4.36
Un élément a non nul d’un anneau est régulier à droite si et seulement s’il n’est pas diviseur de 0.
IV Anneaux et corps 41
En particulier, dans un anneau intègre, toutes les simplifications par des éléments non nuls sont possibles,
puisque le seul élément non régulier est 0.
Exemples 18.4.38
1. Z est intègre, R[X] est intègre, tout corps est intègre.
2. Mn (R) n’est pas intègre.
3. À quelle condition sur n, Z/nZ est-il intègre ?
Ainsi, I est un sous-groupe de (A, +), stable par multiplication par un élément de A.
Nous n’étudierons pas les idéaux cette année, mais nous illuminerons parfois quelques résultats à l’éclat
de cette notion, notamment en arithmétique. Nous donnons tout de même quelques exemples importants :
Exemples 18.4.40
1. Pour tout n ∈ N∗ , nZ est un idéal de Z.
2. L’ensemble des polynômes de R[X] s’annulant en 0 est un idéal de R[X]. Comment généraliseriez-
vous ce résultat ?
3. L’ensemble des polynômes {XP (X, Y ) + Y Q(X, Y ), (P, Q) ∈ R[X, Y ]} est un idéal de l’anneau
R[X, Y ] des polynômes à deux indéterminées.
4. Que peut-on dire des idéaux d’un corps ?
Dans les deux premiers exemples, on constate que l’idéal considéré est de la forme {λa, λ ∈ A}, donc
engendré par un unique élément a, par multiplication par les éléments λ de A. Un idéal vérifiant cette
propriété est appelé idéal principal :
I = aA = {ay, y ∈ A},
pour un certain a ∈ A.
Théorème 18.4.43
Z est un anneau principal.
Cette définition, qui peut paraître anodine, est à la base d’une généralisation possible de la notion de
pgcd et de ppcm à des anneaux autres que Z. Cette propriété, aussi vérifiée pour R[X] ou C[X], permet
par exemple de généraliser l’arithmétique connue de Z au cas des polynômes.
19
Arithmétique des entiers
La mathématique est la reine des sciences, mais la théorie des nombres est la reine des sciences
mathématiques.
(Carl-Friedrich Gauss)
Les nombres sont le plus haut degré de la connaissance. Le nombre est la connaissance même.
(Platon)
(Pythagore)
Décomposer un cube en deux autres cubes, une quatrième puissance, et généralement une
puissance quelconque en deux puissances de même nom, au dessus de la seconde puissance,
est chose impossible et j’en ai assurément trouvé l’admirable démonstration. La marge trop
exiguë ne la contiendrait pas.
(Pierre de Fermat)
• Les concepts essentiels de l’arithmétique ont également été généralisés dans des contextes différents
de celui des entiers. C’est une des motivations de l’introduction de la notion d’anneau et d’idéal. Un
exemple que vous aurez l’occasion d’étudier prochainement est l’étude de l’arithmétique des polynômes.
Mais cela ne s’arrête pas là !
Remarque 19.1.5
• Ce résultat peut sembler trivial et sans intérêt. Sa version plus générale, pour un anneau intègre
A, est plus intéressante, et affirme que les éléments associés diffèrent d’une constante mutlipli-
cative appartenant au groupe A∗ des inversibles de A.
• Par exemple, dans K[X], les éléments associés à un polynôme P sont tous les λP , pour λ ∈ K∗ .
• Dans Z[i] (entiers de Gauss), les éléments associés à un nombre z sont les 4 éléments z, −z, i z
et − i z.
• Les éléments associés de x sont les éléments qui jouissent des mêmes propriétés de divisibilité
que x.
a = bq + r et 0 6 r < |b|.
Exemples 19.1.7
1. 27 = 6 × 4 + 3 = 6 × 3 + 9 = 6 × 6 − 3.
Ainsi, des identités a = bq + r, il y en a beaucoup, mais une seule vérifie la condition imposée
sur r. Ici, le quotient de la division de 27 par 6 est 4, et son reste est 3.
2. 27 = (−6) × (−4) + 3 = (−6) × (−5) − 3.
Sans la valeur absolue dans la condition sur r, c’est la deuxième égalité qui aurait été la bonne.
Mais la valeur absolue impose un reste positif. Ainsi, le quotient de la division de 27 par −6 est
−4, et le reste est 3
3. −27 = 6 × (−4) − 3 = 6 × (−5) + 3.
Ici, on voit que si on change le signe du nombre divisé, le quotient n’est pas simplement l’opposé
(attention, cela ne correspond pas à la plupart des implémentations informatiques de la division
euclidienne). Ainsi, la première identité ne convient pas. Le quotient de la division euclidienne
de −27 par 6 est −5, le reste est 3.
Remarquez que la situation est la même que pour la partie entière, pour laquelle ⌊−x⌋ = 6 −⌊x⌋,
sauf lorsque x est entier. C’est normale, puisque la partie entière n’est autre que le quotient de
la division euclidienne (réelle) par 1.
4. −27 = (−6) × 5 + 3.
Sans surprise, le quotient de la division euclidienne de −27 par −6 est 5, le reste est 3.
La plupart des propriétés arithmétiques de Z (pour ne pas dire toutes) découlent de l’existence de cette
division euclidienne. On peut définir de façon similaire dans certains anneaux une division euclidienne,
la condition sur le reste étant un peu plus dure à exprimer. On parle dans ce cas d’anneau euclidien.
Exemple 19.1.9
• Quel est le stathme pour la division euclidienne dans Z ?
• Quel est le stathme pour la division euclidienne dans C[X] ?
• On peut montrer que Z[i] est euclidien, de stathme z 7→ |z|2 .
Ainsi, Z et R[X] sont des anneaux euclidiens. Cette dernière propriété nous permettra d’établir un certain
nombre de propriétés arithmétiques pour les polynômes, très similaires à celles qu’on a pour les entiers.
Remarques 19.1.10
• Certains auteurs appellent préstathme la notion de stathme telle que nous l’avons définie. Ils
imposent une condition supplémentaire pour les stathmes. La différence n’est pas trop gênante
dans la mesure où on peut montrer qu’avec leur terminologie, tout anneau intègre muni d’un
préstathme peut aussi être muni d’un stathme.
• Dans la notion générale de division euclidienne définie par stathme, on n’impose pas de pro-
priété d’unicité. Par exemple, dans Z[i], on n’a pas de propriété d’unicité. D’ailleurs, dans Z, la
définition générale de division euclidienne nous donne deux divisions euclidiennes possibles, la
46 CHAPITRE 19. ARITHMÉTIQUE DES ENTIERS
division euclidienne usuelle n’est que l’une des deux divisions possibles (ou on impose en plus la
positivité du reste).
I.2 Congruences
De façon quasi-indissociable de la notion de division euclidienne, nous définissons :
On trouve aussi assez souvent la notation a ≡ b mod n, ou un mélange des 2 : a ≡ b [mod n].
Nous rappelons les résultats suivants, que nous avons déjà eu l’occasion de démontrer.
Théorème 19.1.13
La relation de congruence modulo n est une relation d’équivalence.
Théorème 19.1.14
La relation de congruence modulo n est compatible avec le produit et la somme : soit (a, a′ , b, b′ ) ∈ Z4
tels que a ≡ a′ [n] et b ≡ b′ [n]. Alors a + b ≡ a′ + b′ [n] et ab ≡ a′ b′ [n]
En d’autre terme, c’est une congruence sur les monoïdes (Z, +) et (Z, ×), au sens vu dans le chapitre sur
les ensembles.
Ces règles sont importantes pour pouvoir mener à bien le calcul modulaire de façon efficace : il permet
de faire lors d’une succession d’opérations, des réductions modulo n étape par étape, plutôt que de tout
calculer dans N et de réduire à la fin.
Exemples 19.1.15
Calculer le reste de la division euclidienne de 12 × 21 × 28 × 18 × 75 × 23 par 11.
Cette possibilité de réduire les opérations à chaque étape est également important pour l’implémentation
informatique du calcul modulaire, permettant ainsi de travailler avec des entiers plus petit, diminuant
de la sorte la complexité des calculs. On peut ainsi, contrairement au cas du calcul dans Z, borner
explicitement le temps de calcul des opérations modulo n par un réel dépendant de n mais ne dépendant
pas des opérandes.
Nous avons aussi, de façon immédiate :
I Divisibilité, nombres premiers 47
Proposition 19.1.16
Si n divise m alors pour tout a et b dans Z :
a ≡ b [m] =⇒ a ≡ b [n].
Ainsi, le calcul des premières puissances jusqu’à obtenir un résultat déjà obtenu auparavant permet de
trouver la période, puis d’en déduire toutes les autres puissances. On peut donc de cette manière calculer
ap modulo n :
Exemple 19.1.19
Calculer le reste de la division euclidienne de 16851750 par 12.
Remarquez que l’existence de deux diviseurs distincts exclut d’office 1 de l’ensemble des nombres premiers,
puisqu’il n’a qu’un diviseur.
Proposition 19.1.22
Tout nombre composé admet un diviseur strict premier.
C’est bien joli tout ça, mais comment faire pour déterminer les nombres premiers (pas trop gros) ?
Erathostène, mathématicien, astronome, bibliothécaire en chef d’Alexandrie (excusez du peu), astéroïde
et cratère lunaire, répondit à cette question il y a déjà très longtemps, par un procédé d’élimination.
Cet algorithme est très facile à implémenter dans un langage informatique. Il n’est évidemment efficace
que pour des petites valeurs de n, mais ne peut pas servir à la recherche de très grands nombres premiers.
Notamment, il est à peu près inutilisable pour répondre à la question de savoir si un très grand nombre
donné est premier ou non (question cruciale dans certaines situations en rapport avec des cryptages,
comme la méthode RSA).
II PGCD et PPCM
II.1 PGCD et PPCM d’un couple d’entiers
Ainsi, le PGCD de a et b est entièrement caractérisé par l’égalité des idéaux (en notant (a) l’idéal engendré
par a) :
(a) + (b) = (a ∧ b).
Remarquez que pour établir ce point partant de la description usuelle (premier point), on se sert du fait
que tout idéal de Z s’écrit Z·a, donc que Z est principal. Le fait que Z est principal nous assure également
que le plus petit idéal contenant a et b est engendré par un élément. C’est là une façon de définir le pgcd,
comme élément générateur de l’idéal engendré par a et b.
Cette définition est valide dans tout anneau principal :
Dans certains cas, un choix de pgcd s’impose (le pgcd positif dans Z par exemple). Dans ce cas on peut
utiliser une notation non ambiguë (a ∧ b par exemple), et parler du PGCD. Dans les autres cas, on parle
d’UN PGCD, et on ne peut utiliser une notation qu’à abus près.
Le PGCD se détermine très facilement algorithmiquement en remarquant que si a = bq + r, a ∧ b = b ∧ r.
Ainsi, en prenant des restes divisions euclidiennes successives le dernier reste non nul fournira le PGCD :
Encore une fois, ce dernier point peut être pris comme définition dans un anneau principal.
50 CHAPITRE 19. ARITHMÉTIQUE DES ENTIERS
Ce qui est parfois évident sur les idéaux ne l’est pas toujours autant pour les autres descriptions :
d = ax + by,
alors a ∧ b | d.
La démonstration passant par les idéaux peut se généraliser dans un anneau principal. Elle possède
l’inconvénient de ne pas être constructive. Il peut être intéressant de trouver explicitement des entiers x
et y assurant l’égalité ax + by = a ∧ b. L’algorithme de la division euclidienne itéré permet à la fois de
déterminer a ∧ b, et d’obtenir une identité de Bézout : il s’agit de l’algorithme d’Euclide. Il est intéressant
de noter que cet algorithme est valide à partir du moment où l’on dispose d’une notion de division
euclidienne : il peut donc être généralisé à tout anneau euclidien, dans le sens évoqué précédemment.
Ainsi, par exemple, il nous permettra d’obtenir des identités de Bézout dans R[X].
Lemme 19.2.10
Soit a et b deux entiers positifs, b 6= 0. Soit r le reste de la division euclidienne de a par b. Alors
a ∧ b = b ∧ r.
II PGCD et PPCM 51
a ∧ b = axk + byk .
Exemple 19.2.12
• Trouver à l’aide de l’algorithme d’Euclide le pgcd de 27 et 33, ainsi qu’une identité de Bézout.
• Comment trouver une autre identité de Bézout ?
• À retenir : on n’a pas unicité de la relation de Bézout !
52 CHAPITRE 19. ARITHMÉTIQUE DES ENTIERS
De la même façon :
La caractérisation par idéaux, ou encore la caractérisation par borne inférieure (et l’associativité des
bornes inférieures) nous assure que ces notions correspondent aux PGCD et PPCM itérés :
a1 ∧ · · · ∧ an = ((a1 ∧ a2 ) ∧ . . . ) ∧ an et a1 ∨ · · · ∨ an = ((a1 ∨ a2 ) ∨ . . . ) ∨ an .
a1 ∧ · · · ∧ an = x1 a1 + · · · + xn an .
d = x1 a1 + · · · + xn an ,
Méthode 19.2.16
Les coefficients x1 , . . . , xn peuvent se trouver explicitement, par itération de l’algorithme d’Euclide : on
cherche d’abord une relation de Bézout entre d1 = a1 ∧ a2 , a1 et a2 , puis entre d2 = d1 ∧ a3 , d1 et a2 ;
III Entiers premiers entre eux 53
Enfin, toutes les notions introduites dans ce paragraphe peuvent être généralisées à des entiers relatifs
quelconques ; le pgcd et le ppcm ne sont alors définis correctement qu’au signe près (c’est le cas général
dans un anneau principal, ou le pgcd ne peut être déterminé qu’à un facteur multiplicatif inversible près).
Dans le cas de Z, on a un choix privilégié qui consiste à prendre la valeur positive. Le pgcd et les relations
de Bézout se trouvent de la même façon, en les cherchant d’abord pour les valeurs absolues, puis en
modifiant les signes de façon adéquate.
En particulier :
On déduit de ce dernier point le théorème important suivant, parfois appelé « petit » théorème de Fermat,
par opposition à un autre qui a donné tant de fil à retordre à des générations de mathématiciens.
54 CHAPITRE 19. ARITHMÉTIQUE DES ENTIERS
Remarque 19.3.8
Si p est un noimbre premier et n un entier naturel, p ∧ n est soit égal à p si p divise n, soit à 1 si p ne
divise pas n.
Un résultat souvent très utile pour les propriétés de divisibilité, et dont on peut déduire facilement le
lemme d’Euclide :
En utilisant le lemme de Gauss de façon convenable sur une relation de Bézout, on obtient :
Proposition 19.3.12
Si a et b sont premiers entre eux et a|c et b|c, alors ab|c.
Cette relation sera limpide lorsqu’on aura la description du PGCD et du PPCM en terme de décomposition
primaire.
III Entiers premiers entre eux 55
x1 a1 + · · · + xn an = 1.
Par exemple 10, 12 et 15 sont premiers entre eux dans leur ensemble. Vous remarquerez en revanche que
deux quelconques d’entre eux ne sont pas premiers entre eux !
La reciproque, en revanche est vraie :
Proposition 19.3.17
Soit (a1 , . . . , an ) ∈ Nn . Si a1 , . . . , an sont premiers entre eux deux à deux (il suffit même en fait que
deux d’entre eux soient premiers entre eux) alors ils sont premiers entre eux dans leur ensemble.
On peut montrer (voir exercices ou problèmes) que ϕ est multiplicative : si a ∧ b = 1, ϕ(ab) = ϕ(a)ϕ(b).
On peut également calculer facilement ϕ(pk ), pour p premier. On peut en déduire une expression de ϕ(n)
pour tout n, à condition de connaître la décomposition primaire de n.
56 CHAPITRE 19. ARITHMÉTIQUE DES ENTIERS
n = p1 × · · · × pk ,
Un anneau dans lequel on a une propriété d’existence et d’unicité (à facteurs multiplicatifs inversibles
près, et à l’ordre près des facteurs) d’une décomposition en facteurs irréductibles est appelé anneau
factoriel. Ainsi, quitte à multiplier par l’élément inversible −1 pour obtenir la décomposition d’un entier
relatif, ce résultat se réexprime en disant que Z est un anneau factoriel. On peut montrer que tout anneau
principal est factoriel. Par ailleurs tout anneau euclidien est principal (même démonstration que dans Z).
Donc tout anneau euclidien est factoriel. C’est par exemple le cas de K[X], lorsque K est un corps (ainsi
tout polynôme se décompose de façon unique, à éléments inversibles près, comme produit de polynômes
irréductibles). C’est par exemple aussi le cas de l’anneau Z[i] des entiers de Gauss. La question se pose
alors, notamment dans ce dernier cas, de savoir décrire les éléments irréductibles. C’est une question pas
complètement triviale dans Z[i], en rapport avec le théorème des deux carrés (donnant la description des
entiers s’écrivant comme somme de deux carrés).
Il s’agit donc de l’unique entier v tel que pv divise n mais pas pv+1 .
En notant P l’ensemble des nombres premiers, il vient donc :
ce produit ayant un sens, puisque constitué d’un nombre fini de termes non égaux à 1.
Exemples 19.4.5
1. Déterminer, pour p premier, vp ((p2 )!), et plus généralement vp ((pk )!), puis plus généralement
vp (n!) (formule de Legendre)
n
2. Déterminer vp en fonction de n et k.
k
On obtient en particulier le :
Lemme 19.4.6
p
Soit p un nombre premier. Alors pour tout k ∈ [[1, p − 1]], ≡ 0 [p].
k
De ce lemme, on tire :
Proposition 19.4.7
Soit a et b deux entiers et p un nombre premier. Alors (a + b)p ≡ ap + bp [p].
Ce résultat affirme en fait que l’application x 7→ xp est un endomorphisme du corps Fp (c’est en fait
l’identité d’après le petit théorème de Fermat), et plus généralement sur tout corps de caractéristique p.
Il est appelé morphisme de Frobenius.
La proposition précédente, ainsi que nous venons de le suggérer, a un rapport très étroit avec le petit
théorème de Fermat. On peut en fait démontrer ce dernier à partir de cette proposition par une récurrence
assez immédiate.
Évidemment, cette preuve explique moins bien la raison profonde du résultat que la preuve voyant ce
résultat comme un cas particulier du théorème de Lagrange, appliqué au groupe (Z/pZ)∗ .
Remarque 19.4.8
Le petit de théorème de Fermat est notamment beaucoup utilisé dans les tests de non primalité (avec
un ordinateur !). En effet, pour montrer qu’un entier p n’est pas premier, il suffit de trouver un entier
a tel que ap 6≡ a [p]. Ainsi, par exemple, à l’aide d’un ordinateur, on peut trouver facilement, pour
n = 91 (1031 − 1) (nombre contitué de 31 chiffres 1) que 2n 6≡ 2 [n]. Ainsi, n n’est pas premier. Trouver
une décomposition de n est une autre paire de manches...
En revanche, déduire de la validité de tests de Fermat qu’un nombre est premier est beaucoup plus délicat,
car le petit théorème de Fermat ne caractérise pas les nombres premiers : il existe des nombres composés
vérifiant les identités du théorème de Fermat (la seconde identité étant alors donnée pour tout x premier
avec n). Ces nombres sont appelés nombres de Carmichael.
Étant donné deux nombres a et b, le pgcd et le ppcm de a et b s’obtiennent facilement à l’aide de leur
décomposition primaire. Par exemple :
150 = 2 × 3 × 52 et 180 = 22 × 32 × 5.
58 CHAPITRE 19. ARITHMÉTIQUE DES ENTIERS
Proposition 19.4.10
Soit a et b deux entiers strictement positifs. Alors, pour tout p ∈ P,
La relation
(a ∧ b) × (a ∨ b) = ab
devient alors évidente.
Cette description du PGCD et du PPCM peut bien sûr être généralisée au calcul du PGCD et du PPCM
d’une famille finie quelconque d’entiers naturels.
Proposition 19.5.5
L’application B 7→ X(B) est un morphisme de groupes, de (Zn , +) dans Z/AZ.
Ainsi, il suffit de déterminer les valeurs de X(ei ) pour les vecteurs ei = (0, . . . , 0, 1, 0, . . . , 0), le 0 étant
en position i. En effet, pour un vecteur B = (b1 , . . . , bn ), on aura alors
n
X
X(B) = bi X(ei ).
i=1
Pour déterminer X(ei ), on part de la constatation que les résultats précédents permettent de réduire le
système au système à deux inconnues : (
x ≡ 1 [ai ]
x ≡ 0 [abi ],
Y
où nous avons noté abi = aj . Ce système peut être résolu en utilisant une relation de Bézout, du fait
j6=i
que ai et abi sont premiers entre eux. On commence donc par déterminer (par l’algorithme d’Euclide
étendu) ui et vi tels que
ui ai + vi abi = 1.
Nous avons alors :
vi abi ≡ 0 [abi ] et vi abi ≡ 1 [ai ].
Ainsi, X(ei ) = v abi (classe dans Z/AZ).
On énonce :
Ainsi, toutes les équations du nouveau système obtenu sont réduites modulo une puissance d’un nombre
premier. Un même nombre premier peut intervenir dans plusieurs lignes, avec un exposant éventuellement
60 CHAPITRE 19. ARITHMÉTIQUE DES ENTIERS
différent. La compatibilité de ces équations est aisée à vérifier (pour chaque paire d’équations modulo pα
et pβ , avec disons α 6 β, on doit obtenir les mêmes équations en réduisant la seconde modulo pα ). Si
les équations ne sont pas compatibles, il n’y a pas de solution, sinon, on garde la plus contraignante des
équations (à savoir celle faisant intervenir le plus grand exposant). On est alors ramené à un système tel
qu’étudié plus haut, auquel on peut appliquer le théorème des restes chinois.
Exemple 19.5.7
Résoudre les deux systèmes suivants :
(
x ≡ 3 [42]
1.
x ≡ 10 [49]
(
x ≡ 3 [42]
2.
x ≡ 9 [49]
20
Polynômes et fractions rationnelles
On a ainsi traité le problème comme s’il s’agissait simplement de déterminer la forme des
racines, dont l’existence est admise sans démonstration, manière de raisonner qui est ici
entièrement illusoire et en fait une véritable petitio principis.
La remarque précédente semble justifier de considérer un polynôme comme une suite de coefficients. Seul
un nombre fini de ces coefficients doit être non nul.
Exemples 20.1.3
1. R[X] ou C[X], polynômes formels à coefficients réels ou complexes ;
2. Q[X], ensemble des polynômes à ceofficients rationnels ;
3. Z[X], ensemble des polynômes à coefficients entiers ;
4. (Z/nZ)[X], polynômes à coefficients dans Z/nZ, dont un cas particulier important est Fp [X].
Avertissement 20.1.8
Ne généralisez pas trop vite « A anneau =⇒ A[X] anneau » en « K corps =⇒ K[X] corps ». Cette
dernière affirmation est fausse ! Ainsi, si K est un corps, tout ce qu’on peut dire, c’est que K[X] est un
anneau.
Cependant, lorsque K est un corps on peut munir K[X] d’une structure plus riche. En effet, la multipli-
cation par un scalaire munit K[X] d’une structure d’espace vectoriel sur le corps K, compatible d’une
I Polynômes à coefficients dans un anneau commutatif 63
certaine manière avec la structure d’anneau (voir chapitre ultérieur). La structure totale (espace vectoriel
+ anneau) est appelée structure d’algèbre. Dans le cas où A n’est pas un corps, on peut adapter la défi-
nition des espaces vectoriels, en définissant la notion de module sur un anneau A : A[X] est alors muni
d’une structure de module sur A.
Ainsi, X n’est pas une variable (au sens fonctionnel), mais un polynôme bien précis, auquel on donne un
nom particulier, et auquel on attribue une notation bien particulière, dont le but est l’analogie avec les
fonctions polynomiales.
Avertissement 20.1.11
• En particulier, l’indéterminée formelle X n’étant pas une variable, elle ne doit pas être quantifiée,
et ne peut pas être utilisée pour résoudre des équations.
• Un polynôme n’est pas une fonction de l’indéterminée formelle, donc la notation P (X) en lieu
et place de P n’est pas de mise. On l’utilise néanmoins dans certaines situations, notamment
lorsque plusieurs indéterminées sont en jeu. Cette notation peut être justifiée rigoureusement
par la notion de spécialisation qu’on verra un peu plus loin.
Encore une fois, il faut bien comprendre ce que signifie cette égalité : il s’agit bien d’une somme de
polynômes, et non d’éléments de A (signification de l’indéterminée).
64 CHAPITRE 20. POLYNÔMES ET FRACTIONS RATIONNELLES
Les règles de calcul sur les polynômes de A[X] résultent alors des règles usuelles de calcul dans un anneau
découlant des associativités, des commutativités, et des distributivités.
Exemples 20.1.15
1. Calcul de (2 + 3X + 2X 2 )(3X + X 2 + 2X 3 ) dans F5 [X].
2. Calcul de (X 2 + X + 2)7 dans F7 [X].
Ainsi, tout polynôme est une somme de monômes de degrés deux à deux distincts.
Les polynômes formels peuvent aussi se composer. En effet, étant donné un polynôme P , on peut consi-
dérer, pour tout n ∈ N, le polynôme P k (en a en particulier P 0 = 1 et P 1 = P ). On définit alors la
composée de deux polynômes de la sorte :
d
X
Q◦P = ak P k .
k=0
I.4 Dérivation
On sait facilement dériver (au sens analytique) une fonction polynomiale à coefficients réels, x 7→ xn se
dérivant en x 7→ nxn−1 . Cette règle de dérivation peut être vue de façon purement formelle, permettant
de généraliser la dérivation des polynômes à un anneau quelconque (dans lequel on ne dispose pas des
techniques d’analyse, spécifiques à R).
La linéarité s’exprime en terme de structures en affirmant que la dérivation est une application linéaire
(c’est-à-dire un homomorphisme d’espaces vectoriels) lorsque A est un corps, ou un homomophisme de
A-modules sinon.
Vu que la définition de la dérivation est calquée sur la dérivée analytique des fonctions polynomiales
réelles, on a, sans surprise, des règles de dérivation similaires, et notamment :
(P Q)′ = P ′ Q + P Q′ .
Avec un petit abus de notation, on pourrait considérer cette égalité également au rang n = 0 (le terme
P −1 n’est pas bien défini, mais le produit par n annule l’ensemble). On généralise le corollaire précédent
de la sorte
Exemples 20.1.23
1. Que peut-on dire de (P Q)(p) dans Fp [X], p étant premier ?
2. La formule de Faa di Bruno est-elle valable dans A[X] ?
Proposition 20.1.26
On a évidemment A0 [X] ⊂ A1 [X] ⊂ · · · ⊂ An [X] ⊂ · · · et
+∞
[
A[X] = An [X].
n=0
Remarque 20.1.27
On a évidemment A0 [X] ≃ A. On identifie souvent les deux, de sorte à pouvoir considérer que A ⊂ A[X].
Exemples 20.1.30
1. Trouver dans (Z/6Z)[X] un exemple contredisant le point 2.
2. Trouver dans (Z/6Z)[X] un exemple contredisant le point 3.
3. Trouver un exemple d’un polynôme non constant pour lequel l’inégalité du point 4 est stricte.
Remarques 20.1.34
• An [X] est-il un sous-anneau de A[X] ?
• Trouver un polynôme de Fp [X] n’admettant pas de primitive.
On précise un peu dans certains cas la relation entre dérivée de P et dérivée de P ′ : dans les situations
que vous connaissez, dériver un polynôme non constant baisse son degré de 1. Cependant, ceci n’est pas
vrai en toute généralité. Nous avons besoin pour cela d’hypothèses plus fortes.
Remarque 20.1.36
1. Trouver dans Fp [X] un polynôme non constant pour lequel cette égalité est fausse.
2. Si K est un corps de caractéristique p, quelle condition donner au degré de P pour avoir deg(P ′ ) =
deg(P ) − 1 ?
Corollaire 20.1.37
Soit K un corps de caractéristique nulle, et soit P et Q deux polynômes de K[X]. Si P ′ = Q′ , alors P
et Q diffèrent d’une constante additive.
Exemple 20.1.38
Donner un contre-exemple dans le cas où K = Fp .
On pourrait établir pour les valuations des règles similaires à celles qu’on a pour les degrés. La notion
de valuation n’étant pas explicitement au programme, nous laissons le lecteur intéressé établir ces règles
par lui-même.
Cet algorithme peut facilement être implémenté dans un langage informatique dans R[X] ou C[X] ; un
polynôme est dans ce cas représenté par la liste de ses coefficients (on revient à la définition formelle des
polynômes sous forme d’une suite finie).
Exemple 20.2.3
Division euclidienne de X 6 + 3X 2 + 1 par X 2 + X + 1.
On verra un peu plus loin une méthode basée sur l’étude des racines pour déterminer rapidement le reste
d’une division euclidienne par un polynôme de petit degré dont on connaît les racines.
Remarque 20.2.4
L’algorithme de la division euclidienne peut-il être mené sans restriction dans A[X] lorsque A est un
anneau commutatif quelconque ? Donner une condition sur le polynôme B pour qu’on puisse effectuer
dans A[X] la division euclidienne d’un polynôme A quelconque par B.
Remarques 20.2.6
• {XP + Y Q, P, Q ∈ R[X, Y ]} est un idéal non principal de R[X, Y ] = R[X][Y ] = R[Y ][X]. Ainsi,
le résultat précédent rentre en défaut lorsque K n’est pas un corps (dans l’exemple, on considère
les polynômes )à coefficients dans l’anneau R[X]).
• En fait, on peut montrer que K[X] est principal si et seulement si K est un corps.
• Nous avons vu en exercice que tout anneau euclidien est principal. Ce n’est donc ici qu’une
conséquence de ce résultat plus général.
II.3 Divisibilité
Soit K un corps. Ainsi, K[X] est principal. On note (P ) l’idéal engendré par un élément P de K[X], à
savoir
(P ) = {P Q, Q ∈ K[X]}.
Comme dans le cadre général, on dit que le couple (A, B) est un couple de polynômes associés si A divise
B et B divise A. Il vient alors de la description des idéaux de A[X] que :
Notation 20.2.12 (A ∧ B)
En particulier, si A et B sont deux polynômes de K[X] dont l’un au moins est non nul, il existe un
unique PGCD unitaire de A et B. Ce PGCD unitaire est noté A ∧ B.
Comme dans le cas de Z, on déduit du troisième point équivalent de la définition l’existence de relations
de Bézout.
Comme dans Z, on peut déterminer un PGCD et une relation de Bézout par l’algorithme d’Euclide
étendu, en utilisant le lemme suivant :
Lemme 20.2.14
Soit A et B deux polynômes tels que B 6= 0. Soit Q et R le quotient et le reste de la division de A par
B. Alors A ∧ B = B ∧ R
Exemple 20.2.16
Trouver les PGCD de X 8 − 1 et X 12 − 1, et une relation de Bézout.
Comme pour le cas de Z, la définition du PGCD s’étend au cas du PGCD de n polynômes. On obtient
alors :
Notation 20.2.20 (A ∨ B)
En particulier, si A et B sont deux polynômes non nuls de K[X], il existe un unique PPCM unitaire
de A et B. Ce PPCM unitaire est noté A ∨ B.
Exemple 20.2.21
P = (X + 1)2 et Q = (X + 1)(X − 1).
Définition 20.2.22
Soit A et B deux polynômes de K[X]. On dit que A et B sont premiers entre eux si A ∧ B = 1.
Autrement dit, les seuls diviseurs communs à A et B sont les polynôems constants non nuls.
Plus généralement, on définit comme dans Z la notion de famille finie de polynômes deux à deux premiers
entre eux, ou premiers entre eux dans leur ensemble.
Ici encore, les propriétés valables dans Z se généralisent :
Exemple 20.2.24
Soit λ 6= µ dans K. Alors les polynômes X − λ et X − µ sont premiers entre eux.
Corollaire 20.2.26
Soit A, B et C trois polynômes tels que A et B divisent C et A et B soient premiers entre eux. Alors
AB divise C.
Comme dans Z, on a une relation simple entre PPCM et PGCD, à ceci près que comme ces notions sont
définies à constante multiplicative près, il faut faire attention au coefficient dominant :
72 CHAPITRE 20. POLYNÔMES ET FRACTIONS RATIONNELLES
Exemples 20.2.29
1. Les polynômes X − λ sont irréductibles (λ ∈ K)
2. Dans R[X], tout polynôme aX 2 + bX + c tel que ∆ < 0 est irréductible.
3. Ces polynômes ne sont pas irréductibles dans C[X].
Lemme 20.2.30
Soit P un polynôme irréductible de K[X] et A un polynôme, non multiple de P . Alors A et P sont
premiers entre eux.
Corollaire 20.2.32
Soit A et B deux polynômes de K[X] et P un polynôme irréductible. Alors, si P ne divise ni A ni B,
P ne divise pas AB.
P = λP1 · · · Pk .
2. Cette décomposition est unique, à l’ordre près des facteurs, et à multiplication près de chaque
facteur (y compris λ) par un élément non nul de K.
3. En particulier, si on impose que les Pi soient unitaires, cette décomposition est unique, à l’ordre
près des facteurs.
Nous verrons un peu plus loin la description complète des polynômes irréductibles de R[X] et de C[X].
Pour cela, il nous faut étudier d’un peu plus près les propriétés liées aux racines d’un polynôme.
III Racines d’un polynôme 73
La seule condition pour pouvoir faire cela de façon plus générale dans A[X] est de pouvoir faire dans A
des produits (donc calculer des puissances) et des sommes. Comme A est un anneau commutatif, cela ne
pose pas de problème particulier, et on peut donc définir :
Intuitivement, il apparaît clair que lorsque K = R ou C, on peut identifier les polynômes formels à
coefficients dans K et les fonctions polynomiales sur K. C’est ce que nous exprimons dans le théorème
suivant :
Remarques 20.3.5
1. En considérant le petit théorème de Fermat, montrer que cette propriété n’est pas vraie pour
tous les corps K.
2. On montrera un peu plus loin qu’une condition suffisante pour que cette identification soit vraie
est que K soit un corps infini. C’est le cas en particulier lorsque K est de caractéristique nulle.
74 CHAPITRE 20. POLYNÔMES ET FRACTIONS RATIONNELLES
Avertissement 20.3.6
Si K n’est pas un corps infini (par exemple K = Fp ), deux polynômes distincts P et Q de K[X] peuvent
correspondre à la même application polynomiale. Ainsi, les polynômes sont davantage différenciés dans
K[X] que dans K[x]. On n’a donc pas possibilité en général d’identifier polynômes formels et fonctions
polynomiales.
Enfin, dans le cas spécifique de R (seul cas dans lequel on peut considérer la dérivée au sens analytique),
on a également, du fait même des définitions :
Proposition 20.3.7
f′ = Pe ′ .
Pour tout polynôme P de R[X], P
Ainsi, les opérations définies formellement coïncident avec les opérations sur les fonctions polynomiales,
y compris la dérivation dans le cas de R.
Il est important de constater que le cadre formel qu’on s’est donné pour définir les polynômes permet
d’« appliquer » un polynôme à des éléments qui sortent du cadre initialement fixé. Pour prendre un
Pd
exemple, étant donné un polynôme P = ak X k de R[X] et M une matrice carrée à coefficients réels,
k=0
on peut considérer le polynôme de matrices
k
X
P (M ) = ak M k ,
k=0
Exemple 20.3.8 !
1 2
Soit P = 2 + 3X + 3X 2 , et M = . Calculer P (M ).
2 3
On peut formaliser ce type de construction, mais nous resterons assez vague, car nous débordons du
programme. Le bon cadre à se fixer est celui donné par la structure de A-algèbre : un ensemble B est une
A-algèbre si et seulement si B est un anneau et est muni d’une loi de composition externe d’ensemble
d’opérateurs A, avec un certain nombre de propriétés (associativité externe, distributivité de la loi externe
sur chacune des lois additives de A et de B, respect du neutre multiplicatif de A). En gros, ce qu’il faut en
retenir, c’est que dans une A-algèbre B, on peut faire, avec des règles de calcul raisonnablement semblables
aux situations usuelles, la somme et le produit d’éléments de B ainsi que le produit d’un élément de A par
Pd
un élément de B. En particulier, étant donné un polynôme P = ak X k de A[X] et b ∈ B, l’expression
k=0
suivante a un sens :
d
X
P (b) = ak b k .
k=0
0
Il convient de bien noter que par convention b = 1B .
On parle de spécialisation du polynôme P en b ∈ B.
Exemples 20.3.9
1. L’ensemble des matrices carrées de taille n, à coefficients réels, est une R-algèbre : la situation
décrite plus haut est un cas particulier de cette situation plus générale.
III Racines d’un polynôme 75
Remarque 20.3.12
Ce théorème reste valable dans A[X] pour un anneau commutatif quelconque. Pourquoi ?
Si après factorisation P = (X − r)Q, r est encore racine de Q, alors r est « plusieurs fois » racine de P .
En comptant le nombre de fois qu’on peut mettre X − r en facteur, on obtient la multiplicité de r :
Remarque 20.3.14
La multiplicité de la racine r correspond donc à la valuation du facteur (X − r) dans la décomposition
primaire de P .
Par convention, on dira que r est racine de multiplicité 0 si r n’est pas racine de P . Une racine de
multiplicité 1 est aussi appelée racine simple de P , et une racine de multiplicité 2 est appelée racine
double. Lorsque la multiplicité est supérieure ou égale à 2, on parlera de racine multiple.
Cette mise en facteur maximale de (X − r)r peut être mise en valeur par la formule de Taylor pour les
polynômes, nécessitant une hypothèse supplémentaire sur K.
Xd
P (n) (a)
P = (X − a)n .
n=0
n!
Ainsi, si v est le plus petit indice pour lequel le terme de la somme est non nul, on obtient
76 CHAPITRE 20. POLYNÔMES ET FRACTIONS RATIONNELLES
Xd
P (n) (a)
P = (X − a)v (X − a)n−v .
n=v
n!
Remarques 20.3.16
Pourquoi supposer que K est de caractéristique nulle ?
Ainsi, il faut toujours garder à l’esprit des deux facettes de la multiplicité des racines : la propriété de
divisibilité, et la caractérisation par les dérivées.
Corollaire 20.3.18
Soit K un corps de caractéristique nulle. Soit P ∈ K[X] et r ∈ R. Si r est racine d’ordre k de P , alors
r est racine d’ordre k − 1 de P ′ .
Remarque 20.3.19
Quelles restrictions mettre à la caractérisation par les dérivées lorsque K est de caractéristique p
première ?
Théorème 20.3.20
Soit K un corps. Soit P ∈ K[X], et r1 , . . . , rk des racines deux à deux distinctes de P , de multiplicités
respectives α1 , . . . , αk . Alors (X − r1 )α1 · · · (X − rk )αk divise P , et r1 , . . . , rk ne sont pas racines du
quotient.
Exemple 20.3.22
Soit K un corps dont Fp est un sous-corps. Montrer que pour tout x ∈ K, xp = x si et seulement si
x ∈ Fp .
On en déduit le résultat très important suivant, qu’on décline sous 3 formes équivalentes.
III Racines d’un polynôme 77
Par ailleurs, le dernier point du théorème ci-dessus affirme l’unicité sous réserve d’existence d’un polynôme
de degré au plus n − 1 prenant des valeurs données en n points fixés. Il n’est pas dur de construire
explicitement un tel polynôme, fournissant ainsi l’existence. C’est le but du paragraphe suivant.
Lemme 20.3.27
Le polynôme Li est l’unique polynôme de degré au plus n tel que pour tout j ∈ [[0, n]] \ {i}, Li (xj ) = 0,
et Li (xi ) = 1.
78 CHAPITRE 20. POLYNÔMES ET FRACTIONS RATIONNELLES
En particulier, si f est une fonction définie sur un intervalle I contenant les xi , le polynôme d’inter-
polation de Lagrange de f associé à la famille (xi ) est l’unique polynôme Pf coïncidant avec f sur les
xi , à savoir :
Xn
Pf = f (xi )Li .
i=0
Corollaire 20.3.29
Soit P le polynôme d’interpolation de Lagrange associée à la famille (xi )i∈[[0,n]] , et aux valeurs (yi )i∈[[0,n]] .
Soit P0 = (X − x0 ) . . . (X − xn ). L’ensemble E des polynômes Q (sans restriction de degré) tels que
pour tout i ∈ [[0, n]], Q(xi ) = yi est alors décrit par :
Remarque 20.3.30
Quelle est la structure algébrique de l’ensemble E du théorème précédent ?
P = λ(X − x1 )(X − x2 ) · · · (X − xn ),
et on a α1 + · · · + αk = n.
IV Polynômes irréductibles dans C[X] et R[X] 79
Ainsi, un polynôme est scindé si et seulement si sa décomposition en facteurs irréductibles ne fait intervenir
que des polynômes irréductibles de degré 1.
Dans R[X], certaines techniques d’analyse peuvent aider à étudier cette propriété. Ainsi, le théorème de
Rolle permet de montrer facilement que :
Proposition 20.3.33
Soit P un polynôme scindé de R[X], à racines simples. Alors P ′ est scindé, et ses racines séparent
celles de P .
Une propriété importante des polynômes scindés est la possibilité de trouver facilement des relations
entre les coefficients et les racines, par développement de la forme factorisée, et par identification des
coefficients :
Le terme de gauche de cette expression est appelé polynôme symétrique élémentaire de degré k en les
racines et souvent noté Σk (r1 , . . . , rn ).
On peut montrer que tout expression symétrique en r1 , · · · , rn peut s’exprimer comme expression polyno-
miale (à coefficients dans K des polynômes symétriques en r1 , . . . , rn , donc comme expression polynomiale
en les coefficients du polynôme. Par une construction itérative, on peut même déterminer cette expression
polynomiale. Ainsi, par exemple, calculer la somme des racines cubiques d’un polynôme peut se faire sans
calculer explicitement les racines (ce qui bien souvent, est de toute façon impossible), juste en se servant
des coefficients.
Cette propriété est notamment très utile pour des propriétés d’algébricité puisqu’elle permet de dire que
toute expression symétrique à coefficients rationnels en les racines d’un polynôme lui aussi à coefficients
rationnels est rationnelle.
Corollaire 20.4.2
Tout polynôme de C[X] est scindé, donc admet exactement autant de racines (comptées avec multipli-
cité) que son degré.
Corollaire 20.4.3
Dans C[X], les seuls polynômes irréductibles sont les polynômes de degré 1, c’est-à-dire les polynômes
aX + b, a 6= 0.
Exemple 20.4.4
Quelles sont les racines et leurs multiplicités du polynôme X n − 1 ? Factoriser ce polynôme en facteurs
irréductibles dans C[X].
Tous les polynômes de C[X] se factorisant en polynômes non constants de degré minimal, on obtient alors
une caractérisation simple de la divisibilité :
Ainsi, les racines non réelles d’un polynôme à coefficients réels peuvent être groupées en paires de racines
conjuguées de même multiplicité.
Le théorème de d’Alembert-Gauss amène alors :
2. Ainsi, tout polynôme P ∈ R[X] peut être factorisé en produit de polynômes de R[X] de degré 1,
ou de degré 2, de discriminant strictement négatif.
Exemple 20.4.9
Factorisation dans R[X] de X n − 1.
V Fractions rationnelles
La contruction formelle que nous avons donnée des polynômes nous empêche a priori de former des
quotients de polynômes (donc des fractions rationnelles), comme nous pouvons le faire pour les fonctions
polynomiales. En effet, si K est un corps, les seuls polynômes inversibles sont les polynômes constants
non nuls.
Remarque 20.5.1
1. Quels sont les polynômes inversibles de A[X] lorsque A est intègre ?
2. Trouver un polynôme inversible et non constant de (Z/4Z)[X]
Une construction similaire à celle permettant de définir Q à partir de Z nous permet cependant de définir
formellement des quotients de polynômes.
Proposition 20.5.2
La relation ci-dessus est une relation d’équivalence sur K[X] × K[X]∗ .
P R
Ainsi, la relation P S = QR amène assez logiquement l’égalité des fractions rationnelles = .
Q S
Pour définir les lois de composition sur K(X), on commence par les définir sur K[X] × K[X]∗. On définit,
pour tout (P1 , Q1 ) et (P2 , Q2 ) de K[X] × K[X]∗ :
Lemme 20.5.4
1. Les opérations × et + sont associatives et commutatives
2. La relation ∼ est une congruence sur les monoïdes (K[X] × K[X]∗ , ×) et (K[X] × K[X]∗ , +).
82 CHAPITRE 20. POLYNÔMES ET FRACTIONS RATIONNELLES
P
En particulier, si P = AB, alors B = A.
Proposition/Définition 20.5.8
Soit F ∈ K(X) une fraction rationnelle. Il existe un représentant (P, Q), unique à multiplication près
P P
par un scalaire non nul, tel que P ∧ Q = 1 et F = Q . On dit que Q est la forme irréductible de la
fraction rationnelle F .
P
deg(F ) = deg(P ) − deg(Q) où F =
Q
Il s’agit d’un entier relatif, ou de −∞ si P = 0.
Les degrés des fractions rationnelles vérifient des propriétés semblables aux degrés des polynômes :
F =P +G et deg(G) < 0.
Remarque 20.5.13
P
Puisque Q est irréductible, r ne peut pas être à la fois racine de P et racine de Q.
Exemple 20.5.14
(X − 2)2
Racines, pôles et leurs multiplicités, de ?
X 3 (X − 1)4
P (x)
∀x ∈ K \ P, F (x) = .
Q(x)
De plus, le polynôme E est la partie entière de la fraction rationnelle F , donc obtenue en effectuant la
P
division euclidienne de P par Q, où F = Q
Exemples 20.5.19
X7
1. Forme de la décomposition en éléments simples de .
(X − 1)3 (X + 1)4
1
2. Forme de la décomposition en éléments simples de
(1 + X 2 )3
P′
Un cas important de décomposition en éléments simples est le cas de la fraction rationnelle P .
P′
Théorème 20.5.21 (Décomposition en éléments simples de P
)
Soit P un polynôme non nul de C[X]. Soit r1 , . . . , rk les racines de P , de muliplicités α1 , . . . , αk . Alors
′ ′
les pôles de PP sont r1 , . . . , rk et sont tous des pôles simples. La DÉS de PP est :
k
X αi
P′
= .
P i=1
X − ri
Nous avons déjà vu que les racines de la dérivée P ′ d’un polynôme scindé sont situées entre la racine
′
minimale et la racine maximale de P . De la décomposition de PP , on déduit une propriété similaire dans
C[X] :
facteurs irréductibles de Q dans R[X]. Ainsi, les Qi sont de degré 1 ou 2. Alors il existe un unique
polynôme E, et d’uniques polynômes Ai,j , de degré strictement plus petit que Qi , tels que
αk
k X
X Ai,j
F =E+ .
i=1 j=1 Qji
Remarques 20.5.24
1. Si Qi est de degré 1, la partie correspondante dans la DÉS dans R(X) est la même que dans
C(X).
VI Primitivation de fractions rationnelles 85
La première impulsion est venue de considérations sur la signification des nombres négatifs en
géométrie. Habitué à voir AB comme une longueur, j’étais néanmoins convaincu que AB =
AC + CB, quelle que soit la position de A, B et C sur une droite.
(Herrmann Günther Grassmann)
Il semble que ce soit le destin de Grassmann d’être redécouvert de temps en temps, à chaque
fois comme s’il avait été pratiquement oublié.
(A.C. Lewis)
Si une entité possède une grandeur et une direction, sa grandeur et sa direction prises ensemble
constituent ce qui est appelé un vecteur. La description numérique d’un vecteur nécessite trois
nombres, mais rien ne nous empêche d’utiliser une seule lettre pour sa désignation symbolique.
Une algèbre ou une méthode analytique dans laquelle une seule lettre ou une autre expression
est utilisée pour spécifier un vecteur peut être appelée une algèbre vectorielle, ou une analyse
vectorielle.
(Josiah Gibbs)
La structure d’espace vectoriel est une structure rigide, généralisant le cadre géométrique usuel.
Il s’agit d’une structure algébrique liée à la donnée d’un corps, qui va constituer l’unité de la dimension :
la droite réelle représente l’espace vectoriel typique sur R de dimension 1, alors que le C-espace vectoriel
typique de dimension 1 ressemblera au plan complexe, donc à un objet géométrique, qui, en tant que
R-espace vectoriel sera en fait de dimension 2.
La rigidité de la structure se traduit par le fait qu’on peut multiplier un élément par un scalaire (un
élément du corps de base), ceci de façon injective (sauf pour 0) : ainsi, si un élément x est dans un espace
vectoriel E, tous les éléments λx, λ ∈ K seront aussi dans E, et si x 6= 0, l’ensemble des λx, λ ∈ K
« ressemble » à K (il y a une bijection entre les deux). On parle de la droite engendrée par x. Ainsi un
espace vectoriel est une structure droite, qui, dès qu’elle contient un élément non nul, contient tout la
droite (au sens du corps K) contenant x.
La rigidité d’un espace vectoriel est même plus forte que cela : plus que la stabilité par multiplication
par un scalaire, on a la stabilité par combinaison linéaire (et encore une fois, l’application qui à (λ, µ)
de K2 associe λx + µy est bijective, sauf si x et y sont colinéaire). Ainsi, si E contient deux points (non
colinéaires), il contient tout un K-plan passant par ces deux points et par l’origine.
Cette structure rigide (plate pourrait-on dire) généralise la situation du plan réel usuel (approximation
de la surface localement plate de la Terre sur laquelle nous faisons notre géométrie) ou de l’espace usuel,
donc de la géométrie euclidienne classique. Elle ne permet en revanche pas de prendre en compte de façon
implicite des phénomènes de courbure intrinsèque (géométrie sphérique définie intrinsèquement sur un
objet de dimension 2, sans plongement dans un espace de dimension 3, ou propriétés de courbures de
l’espace-temps) : ces structures courbes nécessitent l’introduction d’objets plus complexes (les variétés).
88 CHAPITRE 21. ESPACES VECTORIELS
Dans tout le chapitre, on considère un corps K. Vous pouvez considérer que K = R ou C (seul cas à
connaître si on respecte le programme), mais sauf mention explicite du contraire, les définitions et les
résultats sont valables pour tout corps (commutatif selon notre définition des corps).
Propriétés 21.1.2
Soit E un K-ev. Pour tout x ∈ E :
1. 0 · x = 0, c’est-à-dire 0K · x = 0E ;
2. λ · 0E = 0E ;
3. (−1) · x = −x.
4. Si x 6= 0, λ · x = 0 =⇒ λ = 0
5. Si λ 6= 0, λ · x = 0 =⇒ x = 0.
Terminologie 21.1.3
• Les éléments de E sont appelés vecteurs.
• Les éléments de K sont appelés scalaires.
• Deux éléments x et y de E sont colinéaires s’il existe (λ, µ) ∈ K2 tels que (λ, µ) 6= (0, 0) et
λx + µy = 0.
Si I lui même est finie, toute famille indexée sur I est à support fini. Ainsi, cette notion est surtout
pertinente lorsque I est infini.
Ainsi, toute combinaison linéaire sur une famille infinie est une combinaison linéaire d’un nombre fini de
vecteurs de cette famille.
On peut alors déduire la structure de certains objets mathématiques fréquents, en se servant du lemme
suivant :
on munit G d’un structure d’espace vectoriel. Ces deux définitions de lois se traduisent sous forme d’un
diagramme commutatif.
Comme dans le cas des groupes et des anneaux, nous disposons d’un critère simple permettant de court-
circuiter un certain nombre de vérifications :
∀x, y ∈ F 2 , ∀λ ∈ K, λx + y ∈ F.
Exemples 21.1.13
1. Étant donné un espace vectoriel E, le sous-espace vectoriel nul {0E } et le sous-espace vectoriel
total E.
2. Étant donné un vecteur X de R2 , la droite RX = {λX, λ ∈ R}
3. Étant donné a, b et c trois réels, le plan de R3 d’équation ax + by + cz = 0.
4. R[X] espace des polynômes
5. C(R, R) ensemble des fonctions continues sur R ;
6. Plus généralement C(I, R), ensemble des fonctions continues sur un intervalle I ;
I Notion d’espace vectoriel 91
Vous remarquerez dans les premiers exemples les deux points de vue différents pour définir un sous-espace
vectoriel : par l’intérieur (sous-espace engendré par un vecteur) ou par l’extérieur (sous-espace défini par
une équation sur les coordonnées). On retrouvera souvent ces deux points de vue par la suite.
Proposition 21.1.16
Soit E un K-espace vectoriel, et D1 et D2 deux droites vectorielles. Alors soit D1 ∩ D2 = {0E }, soit
D1 = D2 .
Corollaire 21.1.17
Soit D une droite vectorielle d’un espace vectoriel E, et x ∈ D. Si x 6= 0, alors D = Kx.
Remarque 21.1.19
L’aspect géométrique d’une droite vectorielle dépend du corps de base K :
• Si le corps de base est R, une droite vectorielle a l’aspect d’une droite géométrique usuelle.
• Si K = C, une droite a l’aspect d’un plan complexe : une droite complexe est donc un objet de
dimension géométrique égale à 2.
• Si K = Fp , alors une droite est constituée d’un nombre fini de points « alignés circulairement »
si on peut dire cela ainsi...
• Par exemple, si K = F2 , une droite est constituée de deux points : il y a dans ce cas autant de
droites que de vecteurs non nuls de E, les droites étant les ensembles {0, x}, x 6= 0.
Remarque 21.1.21
Que dire de l’union de deux sev ?
Proposition 21.1.22
Soit (Ei )i∈I une chaîne de sous-espaces vectoriels de E, donc vérifiant, pour tout couple (i, j) ∈ I 2 ,
[
Ei ⊂ Ej ou Ej ⊂ Ei . Alors Ei est un sous-espace vectoriel de E.
i∈I
Remarque 21.1.24
Pourquoi un tel espace existe-t-il ?
Si X est exprimée sous forme d’une famille (xi )i∈I , on note Vect(X) = Vect(xi )i∈I . Si X est fini et
enuméré par exemple x = {x1 , . . . , xn }, on notera Vect(X) = Vect(x1 , . . . , xn ).
x = λ1 x1 + · · · + λn xn .
Exemples 21.1.27
1. Vect(x) = {λx, λ ∈ K} = Kx
2. Vect(x, y) = {λx + µy, (λ, µ) ∈ K2 }
• si x = y = 0, Vect(x, y) = {0}
• si x et y sont colinéaires, non tous deux nuls (disons x 6= 0), Vect(x, y) = Vect(x)
• si x et y ne sont pas colinéaires, Vect(x, y) est un plan vectoriel.
E + F = Vect(E ∪ F ).
Par définition de Vect, E + F est donc la borne supérieure de {E, F } dans l’ensemble des sous-espaces
vectoriels de G muni de l’ordre d’inclusion.
E + F = {x + y | x ∈ E, y ∈ F } = {z ∈ G | ∃(x, y) ∈ E × F, z = x + y}.
E1 + · · · + En = Vect(E1 ∪ · · · ∪ En )
Proposition 21.1.32
Soit (xi )i∈I et (xj )j∈J deux familles (pas nécessairement disjointes). Alors :
Proposition 21.1.33
Soit (xi )i∈I et (xj )j∈J deux familles (pas nécessairement disjointes). Alors :
Exemples 21.1.34
1. Vect(x1 , x2 , x4 , x5 ) + Vect(x3 , x4 , x6 ) = Vect(x1 , x2 , x3 , x4 , x5 , x6 ).
2. Soit E un ev, et x1 , . . . , xn des éléments de E. Alors :
La démonstration de ce théorème repose sur le lemme de Zorn, donc sur l’axiome du choix. On en verra
une démonstration plus élémentaire, indépendante de l’axiome du choix, lorsque E est de dimension finie.
II Familles de vecteurs
Nous rappelons que toute combinaison linéaire d’une famille (finie ou infinie) s’exprime, par définition,
comme somme finie d’éléments de cette famille, multipliés par des scalaires.
Si de plus, I = [[1, n]], les points (i) et (ii) sont équivalents aux points suivants :
(iii) les xi sont non nuls et la somme Kx1 ⊕ · · · ⊕ Kxn est directe ;
(iv) La fonction ϕ : Kn −→ E définie par ϕ(λ1 , . . . , λn ) = λ1 x1 + · · · + λn xn est injective.
Remarque 21.2.3
Une famille contenant 0 peut-elle être libre ?
La proposition suivante permet de ramener l’étude de la liberté des familles infinies à l’étude de la liberté
de familles finies.
Si un tel ajout est impossible, on dira que la famille libre est maximale :
Proposition 21.2.8
Une famille libre maximale est génératrice dans le sens ci-dessous
Lorsque cette situation n’est vérifiée pour aucun élément de la famille, on parle de famille génératrice
minimale :
Proposition 21.2.15
Une famille génératrice minimale est libre.
II.3 Bases
Ainsi :
L’existence traduit le caractère générateur, l’unicité traduit la liberté. Les coefficients λi de cette
combinaison linéaire sont appelés coordonnées de x dans la base (bi )i∈I .
Le choix d’une base de E permet donc de définir un système de coordonnées : la donnée d’un vecteur x
équivaut à la donnée de ses coordonnées dans une base fixée.
Exemple 21.2.18
• Les coordonnées cartésiennes dans R2 correspondent aux coordonnées dans la base canonique
((1, 0), (0, 1)).
• Un autre choix de base fournit d’autres coordonnées, par exemple (2, 3) dans la base ((1, 0), (1, 1))
Ce dernier exemple a une généralisation importante, qui mérite d’être citée en tant que proposition :
Avertissement 21.2.23
La réciproque est fausse !
Proposition 21.3.2
Soit E un espace vectoriel de dimension finie. Alors de toute famille génératrice de E, on peut extraire
une famille génératrice finie.
Ce résultat n’affirme pas l’existence d’une base ! Nous allons maintenant montrer l’existence d’une base,
qu’on va obtenir par complétion d’une famille libre quelconque (par exemple de la famille vide). Il s’agit
du théorème de la base incomplète, affirmant que toute famille libre peut être vue comme le début d’une
base.
En particulier, si (xi )16i6n est génératrice de E, et (xi )i∈I est libre, pour I ⊂ [[1, n]], il existe J tel que
I ⊂ J ⊂ [[1, n]], tel que (xj )j∈J soit une base de E.
Remarque 21.3.5
La preuve du théorème de la base incomplète laisse penser que cette propriété est également vraie en
dimension infinie, en utilisant le lemme de Zorn (donc en supposant l’axiome du choix).
Corollaire 21.3.6 (Caractérisation de la dimension finie par le cardinal des familles libres)
Soit E un espace vectoriel. Alors E est de dimension finie si et seulement si toute famille libre de E
est de cardinal fini.
L’importance de ce théorème provient du fait qu’il permet de définir la notion fondamentale suivante :
La notion de dimension est la formalisation de la notion de nombre de degrés de liberté dont on dispose
pour construire un objet. Par exemple, pour définir entièrement une suite par une récurrence linéaire
homogène d’ordre 3, on dispose de 3 degrés de liberté, à savoir le choix des trois premiers termes de la
suite. L’espace des suites vérifiant une telle relation de récurrence est de facto de dimension 3.
Exemples 21.3.11
1. Dimension de Kn .
2. Dimension de Kn [X].
3. Dimension de l’ensemble des suites vérifiant une récurrence linéaire homogène d’ordre k.
4. Dimension de l’ensemble des solutions d’une équation différentielle linéaire homogène d’ordre 1,
d’ordre 2 à coefficients constants.
5. Dimension de C en tant que...
6. Dimension de Mn,m (R), de Mn (R).
Plus précisément, si (b1 , . . . , bm ) et (c1 , . . . , cn ) sont des bases de E et F , une base de E × F est
((b1 , 0), . . . , (bm , 0), (0, c1 ), . . . , (0, cn )).
Exemple 21.3.16
Montrer que toute matrice M ∈ Mn (R) admet un polynôme annulateur, c’est-à-dire un polynôme P
tel que P (M ) = 0. Quelle est la structure de l’ensemble des polynômes annulateurs de M ? Justifier
l’existence d’un polynôme annulateur minimal pour la relation de divisibilité.
On en déduit en particulier :
Par ailleurs, étant donnés deux sous-espaces vectoriels de E, la dimension de leur somme sera facile à
déterminer s’il n’y a pas de redondance (autrement dit, si on a unicité des écritures), ce qui se traduit
par le fait que la somme est directe. Cette absence de redondances correspond aussi intuitivement au cas
où la dimension de la somme est maximale par rapport aux sommes des deux sous-espaces, ce que l’on
justifiera rigoureusement plus tard.
Le principe de la démonstration est aussi important que le résultat lui-même, car il donne une façon de
construire une base de la somme directe à partir d’une base de chaque membre, par concaténation.
On en déduit facilement, par récurrence :
n
M n
X
dim Ei = dim Ei .
i=1 i=1
On en déduit en particulier la dimension des supplémentaires, après avoir justifié leur existence de façon
plus élémentaire qu’en début de chapitre, dans le cadre de la dimension finie :
Pour terminer, nous donnons une formule générale exprimant la dimension d’une somme quelconque :
Comme évoqué plus haut, ces deux derniers résultats affirment que moins il y a de redondances dans
l’écriture d’une somme, plus la dimension de la somme est importante ; elle est maximale lorsqu’il n’y a
aucune redondance, ce qui s’exprime par le fait que la somme est directe.
Remarque 21.3.25
• Comparez cette formule à |A ∪ B| = |A| + |B| − |A ∩ B|
• Peut-on généraliser, en trouvant pour les dimensions une formule analogue à la formule du crible
de Poincaré :
[n Xn X \
Ai = (−1)j+1 Ai ?
i=1 j=1 J⊂[[1,n]] i∈J
|J|=j
102 CHAPITRE 21. ESPACES VECTORIELS
Est-il déraisonnable d’imaginer que cette linéarité ne pourrait être que l’approximation d’une
non-linéarité plus précise (mais aussi plus subtile) ?
(Roger Penrose)
Comme à chaque fois qu’on définit une nouvelle structure algébrique, il vient une notion de morphisme,
adaptée à cette structure. La catégorie des espaces vectoriels sur un corps K est ainsi formée d’un ensemble
d’objets (les K-ev), et de flèches représentant les morphismes entre espaces vectoriels, c’est-à-dire, selon
les définitions générales qu’on en a données, les applications respectant les deux lois définissant un espace
vectoriel. La propriété définissant ces morphismes se traduit par une propriété de linéarité f (λx + µy) =
λf (x) + µf (y). Pour cette raison, les morphismes d’espaces vectoriels sont plus fréquemment appelés
applications linéaires.
Le but de ce chapitre est de donner les propriétés élémentaires des applications linéaires, d’étudier les pro-
priétés de rigidité des applications linéaires (comme pour les polynômes, il suffit en général de connaître
l’image d’un petit nombre de vecteurs pour déterminer entièrement une application linéaire), d’étudier
certains types d’applications linéaires (endomorphismes, isomorphismes, projecteurs, symétries), de tra-
duire certaines propriétés d’une application linéaire sur son comportement sur une base (caractérisations
de l’injectivité, de la surjectivité).
Nous verrons ensuite des résultats spécifiques aux applications linéaires définies sur des espaces de di-
mension finie, notamment une formule reliant la dimension du noyau et la dimension de l’image (formule
du rang).
Pour terminer nous donnons un aperçu de la notion d’espace dual, lié à la notion de forme linéaire et
d’hyperplan.
Il est important de remarquer que la notion d’application linéaire en dimension finie est indissociable de
la notion de matrice. Nous étudierons ce point de vue plus en détail dans le chapitre suivant.
Dans tout ce qui suit, K désigne un corps quelconque. Vous pouvez considérer, conformément au pro-
gramme, que K = R ou C, mais, sauf mention explicite du contraire, les résultats donnés sont valables
pour tout corps.
Exemples 22.1.4
1. L’application de R2 dans R définie par f (x, y) = 2x + 3y ?
2. L’application de R3 dans R définie par f (x, y, z) = 3x + 4y + 2z + 1 ?
3. L’application de R2 dans R définie par f (x, y) = xy ?
P
4. La somme , de Cn dans C.
5. L’intégrale, de C 0 ([a, b]) dans R.
6. L’opérateur de dérivation D de C n dans ...
7. L’opérateur de dérivation D de R[X] dans R[X].
8. Étant donné une matrice M ∈ Mn,p (K), et en assimilant Kn à Mn,1 (K), l’application de Kp
dans Kn qui à une matrice colonne X associé la matrice colonne M X.
Nous verrons dans le chapitre suivant que ce dernier exemple fournit la description générique d’une
application linéaire en dimension finie, après choix de bases de E et de F .
Nous obtenons ainsi l’ensemble des flèches entre deux objets de la catégorie des K-espaces vectoriels.
Autrement dit, une combinaison linéaire d’applications linéaires de E vers F est encore une application
linéaire.
Étudions maintenant des propriétés liées à la composition.
De manière générale, la composition d’applications à valeurs dans un espace vectoriel est toujours linéaire
à gauche, c’est-à-dire (λf + µg) ◦ h = λf ◦ h + µg ◦ h. Si les applications considérés sont linéaires, on
obtient aussi la linéarité à droite. On rappelle :
La propriété énoncée plus haut pour les compositions s’exprime alors de la manière suivante :
On pourrait de façon similaire définir une notion d’application n-linéaire (à n variables vectorielles). La
composition de n AL est alors n-linéaire. On verra dans un chapitre ultérieur comment cette notion
d’application multilinéaire est également liée à la notion de déterminant.
La structure algébrique de l’image et du noyau découle d’un résultat plus général de préservation de la
structure par image directe et réciproque :
De façon évidente, l’image mesure le défaut de surjectivité, De façon symétrique, le noyau mesure le
défaut d’injectivité : si Ker(f ) n’est pas un singleton, les définitions amènent de façon immédiate la non
injectivité de f . La réciproque découle du fait que tout défaut d’injectivité peut être translaté en 0 par
linéarité. Nous obtenons :
Connaissant une famille génératrice de E (par exemple une base), il n’est pas dur de déterminer l’image
de f :
En particulier, si f transforme une famille génératrice de E en une famille génératrice de F , alors f est
surjective.
Si nous appliquons la propriété précédente à l’application de Kp dans Kn définie par X 7→ M X, nous
obtenons la description très simple d’une famille génératrice de Im(f ), dans le cas où f est donnée
matriciellement :
Exemple 22.1.16 1 2 3
3
Décrire l’image de f : X ∈ R 7→ 2 4 6 X.
1 2 3
On en déduit :
I.3 Endomorphismes
Conformément à la terminologie générale, un endomorphisme est une application linéaire d’un espace
dans lui-même :
Exemples 22.1.21
1. L’identité IdE : x 7→ x de E dans E.
2. L’homothétie (vectorielle) de rapport λ : λIdE : x 7→ λx, de E dans E (λ ∈ K).
3. La dérivation formelle D : R[X] → R[X]
4. La dérivation analytique D : C ? ([a, b]) → C ? ([a, b])
5. L’application matricielle X 7→ M X si M est...
La bilinéarité de la composition des applications linéaires permet de définir sur L(E) une loi de composi-
tion ◦, distributive sur la somme. On obtient alors la structure de l’ensemble L(E) des endomorphismes
de E :
∀λ ∈ K, ∀(x, y) ∈ A2 , λ · (x × y) = (λ · x) × y = x × (λ · y),
La composition ayant les propriétés usuelles d’un produit, on utilise souvent les conventions de notation
usuelles pour les produits. En particulier la notation vu désigne l’endomorphisme v ◦ u (omission du signe
opératoire), et :
Remarquez que ces conventions de notation ne sont pas gênantes dans la mesure où dans l’espace vectoriel
E, on ne dispose pas d’un produit. L’expression v(x)u(x) n’ayant pas de sens, la notation vu ne peut
désigner que la composition. De même pour f n , l’expression f (x)n n’ayant pas de sens.
Remarque 22.1.25
1. L’anneau L(E) est-il commutatif ? À quelle condition nécessaire et suffisante sur la dimension
de E l’est-il ?
2. L’anneau L(E) est-il intègre ?
Exemple 22.1.27
0 1 0
1. X 7→ 0 0 1 X
0 0 0
2. La dérivation, vue comme endomorphisme de ...
Ainsi, d’une certaine façon, si u est nilpotent d’incide n, l’endormophisme u « annule » le polynôme X n .
On dira alors que X n est polynôme annulateur de u. Un autre polynôme annulateur est X n+1 , ou encore
X n (X − 1). La valeur de n étant minimale, X n est le polynôme unitaire de plus bas degré annulant u :
on dira dans ce cas qu’il s’agit du polynôme minimal de u. Nous généralisons ci-dessous ces notions pour
des endomorphismes quelconques.
Remarquez qu’il s’agit d’un cas particulier de spécialisation d’un polynôme à des éléments d’une algèbre,
ainsi que nous l’avons vu dans le chapitre sur les polynômes.
Deux polynômes d’un même endomorphisme commutent, ce qui découle de la commutativité dans K[X],
via le lemme suivant :
I Généralités sur les applications linéaires 109
Cela permet en particulier d’exploiter une factorisation d’un polynôme P pour le calcul de P (u).
Exemple 22.1.31
D désignant l’endomorphisme de dérivation de C ∞ (R), et P désignant le polynôme P = (X − 1)(X −
2)(X − 3) = X 3 − 6X 2 + 11X − 6, on obtient, pour une fonction f de classe C ∞ :
Nous pouvons alors généraliser les notions entrevues lors de l’étude des endomorphismes nilpotents.
Nous verrons plus loin que si E est de dimension finie n, alors L(E) est également de dimension finie,
égale à n2 . Cela se comprend facilement une fois assimilée la corespondance entre applications linéaires
et matrices. Admettant provisoirement ce résultat, nous obtenons :
La théorie de la réduction des endormophismes (et en particulier le théorème de Cayley-Hamilton que vous
verrez l’an prochain) permet d’établir que le polynôme minimal est de degré au plus n. Le théorème de
Cayley-Hamilton permet de déterminer de façon explicite un polynôme annulateur d’un endomorphisme
dont on connaît une représentation matricielle dans une base, à l’aide des déterminants.
110 CHAPITRE 22. APPLICATIONS LINÉAIRES
I.4 Automorphisme
Comme on le verra, dans le chapitre suivant, si E est de dimension n, il existe un isomophisme de groupe
entre GL(E) et le groupe GLn (K) des matrices inversibles de taille n × n à coefficients dans K.
II Projecteurs et symétries
Ainsi, un projecteur est par définition un endomorphisme dont X 2 − X est polynôme annulateur, et une
symétrie est un endomorphisme dont X 2 − 1 est polynôme annulateur.
• Si λ est une valeur propre de f , Ker(f − λId) est appelé sous-espace propre de f associé à la
valeur propre λ.
Ainsi, dire que f est diagonalisable revient à dire que E est somme directe des sous-espaces propres de f .
Vous verrez l’année prochaine que cela équivaut en dimension finie à l’existence d’une base (par exemple
la base donnée dans l’énoncé de la définition) relativement à laquelle la matrice de f est diagonale (voir
chapitre suivant pour la notion de matrice associée à un endomorphisme)
Corollaire 22.2.5
Un projecteur distinct de 0 ou Id, admet exactement deux valeurs propres 0 et 1, et est diagonalisable.
Remarque 22.2.6
Les valeurs propres de u sont les racines du polynôme annulateur X 2 − X. Ce n’est pas anodin. L’en-
semble des valeurs propres est toujours inclus dans l’ensemble des racines d’un polynôme annulateur,
et on a l’égalité s’il s’agit du polynôme minimal.
Ce dernier résultat traduit le fait que s est diagonalisable, et si s est distinct de IdE et −IdE , alors les
valeurs propres de s sont exactement 1 et −1. On peut à nouveau remarquer qu’il s’agit des racines du
polynôme annulateur X 2 − 1.
Encore une fois, le théorème précédent est une caractérisation des symétries, et donne l’interprétation
géométrique des symétries.
Cette dernière identité traduit le fait que s est la symétrie géométrique par rapport à F parallè-
lement à G.
• Dans ce cas, on a F = Ker(s − IdE ) et G = Ker(s + IdE ).
• Ainsi, une symétrie au sens algébrique s est une symétrie géométrique par rapport à Ker(s−IdE )
(l’ensemble des points fixes), parallèlement à Ker(s + IdE ).
Ainsi, une application linéaire de E dans F est entièrement déterminée par l’image d’une base de E.
Exemples 22.3.2
1. Déterminer l’expression générale de l’application linéaire de R2 dans R2 telle que f (1, 0) = (3, 2)
et f (0, 1) = (2, 1).
2. Montrer que toute application linéaire de Rp dans Rn est de la forme X 7→ M X, et décrire M
à partir d’une base de Rp .
3. Soit (bi )i∈I une base de E et (cj )j∈J une base de F . Alors pour tout (i, j) ∈ I × J, il existe une
unique application linéaire ui,j telle que ui,j (bi ) = cj et pour tout k 6= i, ui,j (bk ) = 0.
Remarques 22.3.5
1. Pensez au cas des applications linaires de Kp dans Kn , qui sont obtenues, comme on l’a vu plus
haut, sous la forme uM : X 7→ M X, avec M ∈ Mn,p (K). Il n’est pas dur de voir que M 7→ uM
est un isomorphisme d’espace vectoriel entre Mn,p (K) et L(Kp , Kn ). Or, une matrice étant la
donnée de n × p coefficients indépendants, la dimension de Mn,p (K) est np. On retrouve sur cet
exemple le résultat précédent.
III Applications linéaires et familles de vecteurs 113
2. Ce n’est d’ailleurs pas qu’un exemple, car comme on le verra dans le paragraphe suivant, tout K-
espace vectoriel E de dimension finie est isomorphe à Kn , où n = dim(E). Via cet isomophisme,
la situation décrite ci-dessus est générique.
3. En partant des bases canoniques de Kp et de Kn , la base décrite ci-dessus de L(Kp , Kn ) corres-
pond à la base de Mn,p (K) formée des matrices Ei,j , constituées de coefficients tous nuls, sauf
le coefficient en position (i, j), égal à 1. Il s’agit de la base canonique de Mn,p (K).
4. L’espace vectoriel Mn,p (K) est isomorphe à Knp par l’isomophisme consistant à réordonner
les coefficients en les écrivant en une seule ligne (ou en une seule colonne), en juxtaposant les
différentes lignes les unes à la suite des autres. Via cet isomorphisme, quitte à réordonner les
éléments de la base, la base canonique de Mn,p (K) correspond à la base canonique de Knp .
On en déduit en particulier :
114 CHAPITRE 22. APPLICATIONS LINÉAIRES
Plus précisément, un isomorphisme tel que dans (i) est obtenu par le choix d’une base de E, et correspond
alors à la donnée des coordonnées d’un vecteur x dans cette base.
Le dernier résultat peut se réexprimer en remarquant que la relation d’isomorphisme définit une relation
d’équivalence, notée ≃, sur l’ensemble Ef des K-ev de dimension finie. L’espace quotient est alors :
(Ef / ≃) = N.
III.3 Recollements
Une généralisation de la détermination d’une application linéaire par l’image d’une base est la possibilité
de définir, et ceci de façon unique, une application linéaire à partir de ses restrictions sur une famille
L
(Ei )i∈I de sous-espaces vectoriels tels que Ei = E. Le cas de la détermination à partir de l’image
i∈I
d’une base en découle en considérant la famille (Vect(bi ))i∈I . On énonce :
Théorème 22.3.11
M
Soit I un ensemble fini. Soit (Ei )i∈I une famille de sous-espaces vectoriels de E tels que Ei = E,
i∈I
et soit pour tout i ∈ I, ui ∈ L(Ei , F ). Alors il existe une et une seule application linéaire u ∈ L(E, F )
telle que pour tout i ∈ I, ui = u|Ei .
Si, sous les mêmes conditions sur les Ei , les ui sont des endomorphismes des Ei , on peut faire la même
chose en considérant les applications vi = ji ◦ ui , où ji est l’inclusion de Ei dans E. L’application u
obtenue est alors un endomorphisme de E.
En revanche, contrairement au cas précédent où toute application linéaire de L(E, F ) peut être obtenue
comme recollement d’applications linéaires de L(Ei , F ), tout endormophisme de E ne peut pas être obtenu
comme recollement d’endomorphismes des Ei (le problème provenant de la corestriction faite sur l’espace
image). Matriciellement, si E est de dimension finie, après choix d’une base de E obtenue par recollement
de bases des Ei , un endomorphisme pouvant s’obtenir ainsi est un endormorphisme dont la matrice sera
diagonale par blocs (voir chapitre suivant)
Nous donnons une condition pour que ce soit le cas :
Proposition 22.3.13 (Décomposition d’un endomorphisme sur une somme de sev stables)
M
Soit E un K-ev et (Ei )i∈I des sev en nombre fini, tels que E = Ei . Soit u ∈ L(E). Si les Ei sont
i∈I
tous stables par u, et si ui désigne l’endomorphisme de L(Ei ) induit par u, alors u est le recollement
des endomorphismes ui dans le sens évoqué ci-dessus.
IV Applications linéaires en dimension finie 115
rg(u) = dim(Im(u)).
Proposition 22.4.2
Soit (xi )i∈I une famille génératrice de E. Le rang de u, s’il existe, est égal au rang de la famille
(u(xi ))i∈I .
On en déduit en particulier :
En particulier :
116 CHAPITRE 22. APPLICATIONS LINÉAIRES
Remarquez que ce dernier résultat ne nécessite pas d’hypothèse de finitude. Cependant, si E n’est pas de
dimension finie, il est nécessaire de supposer l’axiome du choix, afin d’assurer l’existence du supplémentaire
S.
On déduit du corollaire précédent le très important :
V Formes linéaires
Nous terminons ce chapitre par l’étude d’une famille importante d’applications linéaires : les formes
linéaires, qui correspondent aux applications linéaires à valeurs dans le corps de base. Les formes linéaires
sont intimement liées à la notion d’hyperplan (généralisant la notion de plan en dimension 3). Elles sont
aussi à la base des théories de dualité (qui ne sont pas au programme).
Exemples 22.5.2
Z b
1. f 7→ f (t) dt sur ...
a
2. La trace sur Mn (R).
3. L’évaluation des polynômes en a.
Exemples 22.5.6
1. Les plans vectoriels de R3 .
2. Les droites vectorielles de R2 .
3. Les polynômes sans terme constant.
Remarquez qu’en dimension finie, après choix d’une base (b1 , · · · , bn ), une forme linéaire sera décrite par
une expression du type
Xn
ϕ(x) = ai xi ,
i=1
où les xi sont les coordonnées de x dans la base (b1 , . . . , bn ). Ainsi, l’équation d’un hyperplan est de la
forme
a1 x1 + · · · + an xn = 0.
On retrouve les équations usuelles d’une droite dans R2 (ax+by = 0) ou d’un plan dans R3 (ax+by +cz =
0), les x, y et z correspondant ici aux coordonnées dans la base canonique.
Ce que dit le dernier théorème est alors simplement le fait qu’un sous-espace de dimension n − m (donc
de codimension m) peut être décrit par un système de m équations de ce type.
On peut alors identifier l’espace E et son bidual E ∗∗ . Le principe de dualité est alors que toute propriété
de dualité démontrée pour les couples (E, E ∗ ) reste vraie pour les couples (E ∗ , E).
Il peut être intéressant, de ce fait, de transcrire les objets définis sur E en des objets analogues (leur
correspondant par dualité) sur E ∗ . Nous commençons par les applications linéaires.
On peut vérifier que pour tout x ∈ E et tout ϕ ∈ E ∗ , hx, tf (ϕ)i = hf (x), ϕi.
On peut également vérifier que, modulo l’isomophisme J, on a t( tf ) = f .
La notation tf n’est pas anodine. Par la notion de base duale exposée ci-dessous, et en anticipant les
représentations matricielles des applications linéaires (voir chapitre suivant), la matrice de tf dans la
base duale est la transposée de la matrice de f dans la base initiale de E.
V Formes linéaires 119
Cette base duale, qui est donc l’objet associé par dualité à une base de E se définit de la manière suivante.
On suppose ici que E est de dimension finie, et on considère une base (e1 , . . . , en ) de E.
Remarquez qu’il ne s’agit de rien d’autre que la base de L(E, F ) décrite plus haut, dans le cas où F = K,
de base (1). Remarquez également que e∗i est caractérisé par l’équation :
Exemple 22.5.15
Si ϕ ∈ E ∗ fournit une équation de l’hyperplan H de E, on a H ◦ = Vect(ϕ).
dim A◦ = n − dim A.
On peut retrouver de la sorte la description des intersections d’hyperplans (les égalités étant à comprendre
via J) :
Comme Vect(ϕ1 , . . . , ϕk ) est de dimension au plus k, son dual est de dimension au plus n− k. On a égalité
si et seulement si les équations des hyperplans Hi sont linéairement indépendantes (i.e. (ϕ1 , . . . , ϕn ) est
une famille libre).
120 CHAPITRE 22. APPLICATIONS LINÉAIRES
La deuxième propriété du même théorème en découle aussi : si F est un sous-espace vectoriel de dimension
n − m de E, F ◦ est de dimension m. Ainsi, il existe une base (ϕ1 , . . . , ϕm ) de F ◦ , et on a alors :
Nous ne poussons pas plus l’étude de la dualité, qui pourrait nous mener fort loin, notre but étant
uniquement de donner un premier aperçu d’une notion que vous développerez ultérieurement de façon
plus approfondie.
23
Matrices
La Matrice est universelle. Elle est omniprésente. Elle est avec nous ici, en ce moment même.
(Matrix – Lana et Andy Wachowski)
Comme nous l’avons vu dans le chapitre précédent, la notion de matrice est indissociable de celle d’appli-
cation linéaire. Nous avons déjà constaté au cours d’exemples que toute application linéaire de Kp dans
Kn peut se représenter matriciellement sous la forme X 7→ M X. Cela reste vrai pour toute application
linéaire entre deux espaces vectoriels de dimension finie, à condition d’avoir fixé au préalable une base de
chacun de ces espaces : les systèmes de coordonnées définis par ces bases nous ramènent alors au cas de
L(Kp , Kn ).
Il est important de retenir de cette histoire que l’expression un peu compliquée du produit matriciel n’a
pas été donnée au hasard : la définition du produit matriciel a été motivée historiquement par les règles
de composition des applications linéaires.
Avant de pouvoir faire cette construction, nous définissons les différents objets qui interviennent.
Une matrice est souvent représentée sous forme d’un tableau, explicite dans le cas d’une matrice déter-
minée de petite taille, ou avec des « . . . » dans le cas de matrice explicites ou non, de taille variable. Par
exemple :
1 4 2 1 ··· n
. ..
M1 = 5 2 2 M2 = (i + j − 1)16i,j6n = .. .
7 6 1 n · · · 2n − 1
a1,1 ··· a1,n
. ..
M3 = (ai,j )16i,j6n
= ..
. .
an,1 · · · an,n
Dans une telle représentation, le premier indice est toujours l’indice de ligne, et le second l’indice de
colonne.
Terminologie 23.1.4 (Matrices colonnes, matrices lignes) x1
.
• Une matrice X ∈ Mn,1 (K) est appelée matrice colonne, et est représentée par : X = ..
xn
• Une matrice X ∈ M1,n (K) est appelée matrice ligne, et est représentée par : X = (x1 · · · xn )
• On peut identifier Kn indifféremment à Mn,1 (K) ou M1,n (K), suivant la situation.
• M1,1 (K) peut être identifié à K (matrice constituée d’un unique coefficient)
Les puristes distinguent Kn et Mn,1 (K) ou M1,n (K). D’ailleurs, dans la notation sous forme de n-uplet,
les virgules permettent de distinguer un tel objet d’une matrice ligne. Sans une telle identification, on
I Matrice d’une application linéaire et opérations matricielles 123
ne peut alors pas considérer aussi facilement l’application linéaire X 7→ M X comme une application de
L(Kp , Kn ).
Nous ne ferons pas une telle distinction dans la suite du cours.
Même si la plupart d’entre vous connaissez déjà les opérations sur les matrices, on considère au début
de ce chapitre qu’on ne sait ni sommer ni multiplier des matrices. On montre dans la suite du chapitre
comment la correspondance avec les applications linéaires permet de motiver la définition des opérations
sur les matrices.
Ainsi, il s’agit de la matrice de type (n, p) dont la i-ème colonne donne les coordonnées du vecteur
f (bi ) dans la base C.
Réciproquement, étant données des bases B et C de E et F , et M une matrice de taille adaptée, la propriété
de rigidité des applications linéaires nous assure qu’il existe une unique application linéaire envoyant pour
tout i le i-ième vecteur de la base B sur le vecteur dont les coordonnées dans C sont données par la i-ème
colonne de M . En d’autres termes, il existe une unique application linéaire de L(E, F ) dont la matrice
relativement aux bases B et C est M . On énonce :
Remarque 23.1.9
Si on prend E = Kp , F = Kn , et pour B et C les bases canoniques de ces espaces, on retrouve la matrice
Matb.c. (f ). On dit dans ce cas que Matb.c. (f ) est la matrice canoniquement associée à f ∈ L(Kp , Kn ).
Réciproquement, étant donné une matrice M ∈ Mn,p (K), l’unique application linéaire f ∈ L(Kp , Kn )
dont la matrice relativement aux bases canoniques est M est appelée application linéaire canoniquement
associée à la matrice M .
Exemple 23.1.10
1. Soit f : R2 −→ R définie par f (x, y) = 2x + 3y. Déterminer MatB,C (f ) lorsque :
• B = b.c., C!= (1)
!!
1 1
• B= , C = (2)
1 2
2. Soit f : R2 −→ R2 définie par f (x, y) = (2x − y, x + 2y).
• Matb.c. (f )? ! !!
1 1
• MatB,C (f ) lorsque B = C =
−1 2
3. Matrice de l’opérateur de dérivation D ∈ L(Rn [X]) relativement à la base canonique (au départ
et à l’arrivée)
4. Trouver une base B de Rn [X] telle que
0 1 0
··· 0
. .. ..
. ..
.. . . .. .
. .. .
MatB,B (D) = Jn+1 =
.. . ..
0 .
.
. ..
. . 1
0 ··· ··· ··· 0
La construction du transfert (et l’isomophisme qui s’en déduit) se généralise bien sûr à d’autres structures
que les espaces vectoriels.
Ainsi, on peut munir Mn,p (K) de la structure d’espace vectoriel transférée de la structure de L(E, F )
via la bijection u 7→ MatB,C (u). Cette structure dépend a priori de E et F et du choix des bases sur cet
espace. La proposition ci-dessous montre que tel n’est pas le cas :
I Matrice d’une application linéaire et opérations matricielles 125
Ainsi, la somme de matrices et la multiplication par un scalaire se fait coefficient par coefficient.
Exemples 23.1.14
! ! !
1 2 3 1 1 2 2 3 5
1. + =
4 5 6 2 2 1 6 7 7
! !
1 2 1 3 6 3
2. 3 · =
2 2 3 6 6 9
! !
1 2 2 1
3. 5 × = ... ? ? ?...
0 1 0 2
Avertissement 23.1.15
On ne somme que des matrices de même taille (même nombre de lignes et de colonnes) !
On obtient facilement une base de Mn,p (K), qui n’est d’ailleurs que la base obtenue par l’isomorphisme
ci-dessus de la base (ui,j ) de L(E, F ) décrite dans le chapitre précédent.
Avertissement 23.1.18
On ne peut considérer le produit matriciel AB que si le nombre de colonnes de A est égal au nombre
de lignes de B. Ainsi, on définit le produit matriciel de Mn,p × Mp,q , à valeurs dans Mn,q (par examen
des dimensions des espaces).
On définit alors le produit matriciel par transfert, de façon dépendante a priori du choix d’espaces
vectoriels et de bases.
Ainsi, la j-ième colonne du produit AB est obtenu en faisant la combinaison linéaire des colonnes de
A par les coefficients de la j-ième colonne de B :
· · · b1,j · · ·
..
= · · · b1,j C1 + · · · + bp,j Cp · · ·
C1 . . . Cp × .
· · · bp,j · · ·
Cette formule est la clé de l’interprétation matricielle des applications linéaires. C’est en particulier elle
qui fournit les formules de changement de base, en composant par l’identité, dont la matrice sera prise
relativement à des bases différentes au départ et à l’arrivée.
Avertissement 23.1.24
Le produit matriciel n’est pas commutatif, même lorsque les tailles sont compatibles pour effectuer les
opérations dans les deux sens (par exemple pour des matrices carrées).
Exemple 23.1.25
! ! ! !
1 2 1 0 1 0 1 2
Comparer · et · .
3 4 0 0 0 0 3 4
on obtient :
* a1 b1 +
. .
L × C = .. , ..
=
t
L, C .
ap bp
Vous pouvez noter que si K = R, l’application bilinéaire h•, •i est le produit scalaire canonique de Rp .
En étudiant ligne par ligne l’expression du produit M X, on obtient alors la description :
Les propositions 23.1.20 et 23.1.32 permettent alors d’obtenir une description coefficients par coefficients
du produit matriciel.
128 CHAPITRE 23. MATRICES
Remarque 23.1.28
La description du produit par colonnes est parfois plus efficace que la description coefficient par co-
efficient, notamment lorsque la matrice de droite possède un grand nombre de 0. On obtient souvent
une vision plus immédiate de la matrice, même si formellement le nombre de calculs est exactement le
même. Par ailleurs, pour des arguments sur des matrices de taille générique n, la rédaction est souvent
simplifiée par la description par les colonnes.
Exemple 23.1.29
2 6 12 1 0 2
1. Calculer 2 −7 2 · −1 2 0.
8 5 11 0 0 1 0 1 0 ··· 0
. .
.. . . . . . . . . ...
. .. ..
2. Quel est l’effet de la multiplication à droite par Cn = .. . . 0
?
..
0 . 1
1 0 ··· ··· 0
0 1 0 ··· 0
. .
.. . . . . . . . . ...
. . .
3. Même question avec la matrice « de Jordan » Jn = . . . . . . 0
.
. ..
. . 1
0 ··· ··· ··· 0
4. Calculer pour tout k ∈ N, Cnk et Jnk . Que constatez-vous ?
La parfaite symétrie de l’expression obtenue suggère une version duale des descriptions 23.1.32 et 23.1.20
en inversant le rôle des lignes et des colonnes (cela provient de la description complètement symétrique
I Matrice d’une application linéaire et opérations matricielles 129
Nous terminons cette section par l’étude du produit des éléments de la base canonique.
On peut aussi voir cette égalité comme un cas particulier de composition d’applications linéaires. En effet,
en considérant D = (1) la base canonique de K, la matrice colonne X correspond, relativement aux bases
D et B, à l’application linéaire de K dans E envoyant 1 sur X, donc l’application g : λ 7→ λX. En notant
M = MatB,C (f ), le produit M X correspond à l’application composée f ◦ g, donc l’unique application qui
à 1 associe f (X). Sa représentation matricielle relativement aux bases D et C est donc la matrice colonne
[f (X)]C . Le théorème de représentation matricielle d’une composée amène alors le résultat.
Ce résultat admet une réciproque :
[f (x)]C = M X,
alors M = MatB,C (f ).
(∀X ∈ Mp,1 , M X = 0) ⇐⇒ M = 0
En revanche, il n’est bien sûr pas suffisant d’avoir M X = 0 pour une valeur de X pour pouvoir conclure
que M = 0 (tout ce qu’on peut en déduire, c’est que X est dans le noyau de l’application linéaire
canoniquement associée à M ).
I.7 Transposition
On décrit dans ce paragraphe une autre construction, unaire, sur les matrices, définissant une application
linéaire sur l’ensemble des matrices.
On trouve aussi assez souvent la notation AT (attention à la position du T, différent suivant la notation).
Exemple 23.1.36
!
1 2 3
Transposée de ?
4 5 6
La proposition 23.1.27 montre qu’on peut échanger le rôle de A et B, à condition d’intervertir lignes et
colonnes et d’échanger les indices, autrement dit de transposer les matrices. Ainsi, on a « commutativité
du produit à transposition près » dans le sens suivant :
II Matrices carrées
II.1 L’algèbre Mn (K)
Le neutre multiplicatif de cette algèbre est l’image par l’isomorphisme L(E) → Mn (K) de l’identité, à
savoir la matrice identité notée In :
1 0 ··· 0
0 . . . . . . ...
In = .
. .. ..
. . . 0
0 ··· 0 1
En particulier le théorème précédent affirme que Mn (K) est un anneau, et toutes les règles de calcul
que nous avons développées de façon générale dans les anneaux sont donc valables dans Mn (K), en
particulier :
n−1
X
An − B n = (A − B) An−1−k B k .
k=0
132 CHAPITRE 23. MATRICES
n−1
X
In − An = (In − A) Ak .
k=0
Exemple 23.2.6 2 1 0
1. Déterminer An , pour tout n ∈ N, où A = 0 2 1
0 0 2
2. Plus généralement, si Jn est définie comme dans l’exemple 23.1.29, calculer (aIn + Jn )k , pour
tout k ∈ N.
On en déduit une méthode assez efficace, mais pas toujours réalisable, de calcul des puissances.
Remarque 23.2.7
L’anneau Mn (K) est-il intègre ?
Les notions relatives aux polynômes d’endomorphisme se traduisent en terme de matrices carrées. En
particulier, toute matrice carrée d’ordre n admet un polynôme annulateur de degré inférieur ou égal à n2
(et même inférieur ou égal à n). De là découle l’existence d’un polynôme minimal.
Exemple 23.2.8
0 1 1
1. Déterminer un polynôme annulateur de 1 0 1.
1 1 0
2. Déterminer un polynôme annulateur de Cn
3. Déterminer un polynôme annulateur de Jn . Un polynôme minimal.
Le polynôme annulateur peut être efficace pour la recherche des puissances successives d’une matrice A.
Exemple 23.2.10
n
0 1 1
Calculer 1 0 1 .
1 1 0
où les • désignent des coefficients quelconques. On définit également les matrices strictement triangulaires
supérieures ou inférieures, nulles également sur la diagonale.
Notation 23.2.13
Nous noterons dans ce cours Dn (K) l’espace des matrices diagonales d’ordre n, Tn+ (K) l’espace des
+
matrices triangulaires supérieures, Tn− (K) l’espace des matrices triangulaires inférieures, T n (K) l’es-
−
pace des matrices strictement triangulaires supérieures, et T n (K) l’espace des matrices strictement
triangulaires inférieures.
134 CHAPITRE 23. MATRICES
Proposition 23.2.14
Nous avons de façon évidente :
+ −
Tn+ (K) = T n (K) ⊕ Dn (K) et Tn− (K) = T n (K) ⊕ Dn (K),
ainsi que :
+ − + −
Mn (K) = T n (K) ⊕ Dn (K) ⊕ T n (K) = T n (K) ⊕ Tn− (K) = Tn+ (K) ⊕ T n (K)
Une notion commode (mais hors-programme) pour établir un certain nombre de propriétés sur les matrices
triangulaires (ou plus généralement de matrices dont le type se décrit à l’aide de diagonales) est la notion
de drapeau.
Le fait que les inclusions soient strictes est équivalent à dire que pour tout i ∈ [[0, n]], dim(Ei ) = i. En
particulier, E0 = {0} et En = E.
Exemple 23.2.16
Étant donnée une base (b1 , . . . , bn ) de E, on note, pour tout i ∈ [[0, n]], Ei = Vect(bk , k ∈ [[1, i]]). Alors
(E0 , . . . , En ) est un drapeau.
On remarquera que toute base définit un unique drapeau dont elle est adaptée (on parlera du drapeau
associé à B).
Proposition 23.2.18 (Caractérisation des matrices triang. par stabilisation d’un drapeau)
Soit B = (b1 , . . . , bn ) une base de E et u ∈ L(E). Soit (Ek ) le drapeau associé à B.
Alors, MatB (u) est triangulaire supérieure si et seulement si u stabilise le drapeau (Ek ) (c’est-à-dire
pour tout k ∈ [[0, n]], u(Ek ) ⊂ Ek ).
Exemple 23.2.19
(Rk [X])k∈[[0,n]] , auquel on ajoute {0} initialement, est un drapeau, associé à la base canonique de
Rn [X]. Les endomorphismes conservant, ou diminuant le degré, stabilisent ce drapeau (par exemple
u(P ) = αP + βP ′ ).
+
On définit de façon plus générale, pour tout k ∈ [[−(n−1), n]] le sous-espace vectoriel Tn,k (K) des matrices
(ai,j ) de Mn (K) telles que ai,j = 0 pour tout (i, j) tel que i + k > j on ait ai,j = 0. Il s’agit donc des
+
matrices nulles sauf éventuellement sur les n − k diagonales supérieures. Par exemple, Tn,n (K) = {0},
II Matrices carrées 135
+ + + +
Tn,−(n−1) = Mn (K), Tn,0 (K) = Tn+ (K) et Tn,1 (K) = T n (K). On a alors une caractérisation par les
drapeaux similaire à celle pour les matrices triangulaires :
+
Proposition 23.2.20 (Caractérisation des matrices de Tn,k (K))
+
Soit u un endomorphisme de E, B une base de E, et (Ek ) le drapeau associé. Alors MatB (u) ∈ Tn,k (K)
si et seulement si pour tout i ∈ [[1, n]] ∩ [[k, n + k]], u(Ei ) ⊂ Ei−k .
La caractérisation par les drapeaux permet alors d’obtenir de façon quasi-immédiate la règle suivant sur
les produits :
+
Proposition 23.2.21 (Produits de matrices de Tn,k (K))
+ +
Soit A ∈ Tn,k (K) et B ∈ Tn,ℓ (K). Alors :
+
• si k + ℓ ∈ [[−(n − 1), n]], AB ∈ Tn,k+ℓ .
• si k + ℓ > n, AB = 0
• si k + ℓ 6 −n, on n’obtient rien d’intéressant (rien de plus que AB ∈ Mn (K)).
On peut regarder plus précisément les termes diagonaux de ces produits. On obtient sans peine le com-
plément suivant :
Proposition 23.2.27
Soit K un corps de caractéristique distincte de 2. Les sous-espaces Sn (K) et An (K) sont supplémentaires
l’un de l’autre dans Mn (K).
Remarque 23.2.28
• À quoi ressemble la diagonale d’une matrice antisymétrique ?
• An (K) et Sn (K) sont-elles des sous-algèbres de Mn (K) ?
Avertissement 23.2.30
Par définition, une matrice inversible est toujours une matrice carrée.
Cette caractérisation explique qu’on se limite aux matrices carrées : en effet un isomorphisme préserve
les dimensions, donc une matrice non carrée ne peut pas être canoniquement associée à un isomorphisme.
Nous déduisons alors de la caractérisation des isomophismes en dimension finie que :
II Matrices carrées 137
Proposition 23.2.32
Soit A ∈ Mn (K). Pour que A soit inversible, il suffit qu’il existe une matrice B ∈ Mn (K) telle que
AB = In OU BA = In . Dans ce cas B = A−1 .
( tA)−1 = t(A−1 ).
En particulier, une matrice diagonale est inversible si et seulement si tous ses coefficients diagonaux sont
non nuls, et dans ce cas :
−1
d1 0 0 d−1
1 0 0
.. ..
D−1 =
0 . 0
=
0 .
0 .
0 0 dn 0 0 d−1
n
1 0
··· ··· ··· ··· ··· 0
..
0 1 ... .
. . ..
.. .. 0 ... 1 . i
. .. ..
..
.. . 1 . .
.
..
2
∀(i, j) ∈ [[1, n]] , i 6= j, E(i, j) = . . .. 1 ...
. .
.. .. .. .. j
. 1 . 0 . .
.. . .. 1
. 0
0 ··· ··· ··· ··· ··· 0 1
i j
Proposition 23.2.39 (Interprétation matricielle des opérations élémentaires sur les lignes)
Soit M ∈ Mm,n (K). Soit i 6= j dans [[1, m]], et λ ∈ K.
(i) La matrice N obtenue de M par l’opération Li ↔ Lj , est N = E(i, j) · M ;
(ii) La matrice N obtenue de M par l’opération Li ← Li + λLj est N = Ei,j (λ) · M ;
(iii) La matrice N obtenue de M par l’opération Li ← λLi , λ 6= 0, est N = Ei (λ) · M .
Ainsi, partant d’une matrice M à laquelle on applique le pivot de Gauss, on obtient une matrice N , et
une matrice P telles que N = P M , telle que P soit un produit de matrices de transvection, de dilatation
et de permutation.
La validité du pivot de Gauss provient alors du résultat suivant, exprimant que toute opération valide du
pivot est réversible :
II Matrices carrées 139
∀X ∈ Mp,1 (K), M X = B ⇐⇒ P M X = P B.
Ce théorème exprime la stabilité des solutions d’une équation matricielle par multiplication de l’équation
par une matrice inversible.
Au passage, si M lui-même est inversible, ce même théorème affirme qu’on a l’équivalence :
M X = Y ⇐⇒ X = M −1 Y.
Réciproquement, l’existence et l’unicité d’une solution pour tout second membre Y implique la bijectivité
de l’application canoniquement associée à M , donc l’inversibilité de M .
Exemple 23.2.43
2 1 1
Calcul de l’inverse de A = 1 2 1 .
1 1 2
Ainsi, un système est de Cramer si et seulement si la matrice de ses coefficients est inversible.
Dans le cas de matrices 2 × 2, on a une méthode plus rapide :
Théorème 23.2.45
! (Inverse des matrices 2 × 2 par la comatrice)
a b
Soit M = ∈ M2 (K). Alors M est inversible si et seulement si ad − bc 6= 0, et
c d
!
1 d −b
M −1 = .
ad − bc −c a
140 CHAPITRE 23. MATRICES
Remarque 23.2.47
Il existe une notion de déterminant pour des matrices carrées de taille quelconque n. Nous définirons
cette notion générale dans le chapitre suivant. La non nullité du déterminant caractérise alors l’inver-
sibilité de la matrice, et comme dans le cas n = 2, il existe une formule générale de l’inverse d’une
matrice basée sur la notion de comatrice. Dans des situations concrètes, cette formule est cependant
assez peu efficace, sauf pour n = 2, et éventuellement n = 3 (et encore...)
Une deuxième méthode générale de calcul de l’inverse d’une matrice repose sur l’observation suivante : la
méthode du pivot de Gauss consiste en des multiplications à gauche par des matrices codant les opérations
élémentaires. Ainsi, si à l’aide d’opérations élémentaires sur les lignes, on parvient à transformer la matrice
initiale A en la matrice identité, on aura l’existence d’une matrice inversible P (obtenue en multipliant
les matrices de codage) telle que P A = In . Ainsi, cette matrice P est l’inverse de A. Or, P = P In , et est
donc obtenu en appliquant à la matrice In les mêmes opérations sur ses lignes que celles qui ont permis
de transformer A en In . On en déduit la méthode suivante :
Méthode 23.2.48 (Calcul de l’inverse d’une matrice (seconde méthode, pivot de Gauss))
• Juxtaposer la matrice A et la matrice In (séparées d’une barre verticale)
• Effectuer un pivot sur A, en faisant les mêmes opérations sur la matrice In , pour obtenir une
matrice échelonnée à la place de A
• La matrice A est inversible si et seulement si la matrice échelonnée obtenue est inversible (c’est-
à-dire s’il s’agit d’une matrice triangulaire supérieure à ceofficients diagonaux non nuls)
• Dans ce cas, faire un pivot remontant, pour annuler les coefficients au dessus de chaque pivot,
et toujours en effectuant les mêmes opérations sur la matrice de droite.
• En normalisant les coefficients diagonaux, on obtient à gauche la matrice identité, et à droite la
matrice A−1 .
En particulier, puisque les colonnes de M sont les images par f des éléments de la base canonique, nous
obtenons :
Im(M ) = Vect(C1 , . . . , Cp ).
Un exemple important, auquel on se ramène souvent par utilisation du pivot de Gauss est le suivant :
Ainsi, la multiplication à gauche par une matrice inversible conserve le noyau et la multiplication à
droite conserve l’image.
rg(P M Q) = rg(M )
On observe que :
Lemme 23.3.12
Une matrice échelonnée a même rang que sa transposée.
En effectuant sur la matrice tA les opérations sur les colonnes correspondant aux opérations sur les lignes
effectuées par A pour se ramener à une matrice échelonnée par la méthode du pivot, on en déduit alors :
IV Changements de base 143
Ainsi, la matrice B est obtenue en ne conservant de A que les lignes d’indice i1 , . . . , iq et les colonnes
d’indice j1 , . . . , jr .
g = p ◦ f ◦ i.
IV Changements de base
La correspondance entre applications linéaires et matrice dépend du choix de bases de l’espace de départ
E et de l’espace d’arrivée F . Le but de ce paragraphe est d’étudier l’effet d’un changement de base sur E
ou sur F : la matrice relativement aux nouvelles bases se déduit-elle d’une certaine manière de la matrice
relativement aux anciennes bases ?
Ainsi, la i-ème colonne de cette matrice est constituée des coordonnées du i-ème vecteur de la base B2
dans la base B1 . Il s’agit donc de la matrice de la famille des vecteurs de la seconde base B2 dans la
première base B1 .
144 CHAPITRE 23. MATRICES
Par ailleurs, toute matrice inversible peut être interprétée comme une matrice de passage. Plus précisé-
ment :
Proposition 23.4.3
Soit P ∈ GLn (K) une matrice inversible, et E un espace vectoriel de dimension n.
• Pour toute base B de E, il existe une base C telle que P = PBC .
• Pour toute base C de E, il existe une base B telle que P = PBC .
Puisque [X]B1 = MatB2 ,B1 (Id)[X]B2 , on obtient l’expression de l’effet d’un changement de base sur les
coordonnées d’un vecteur :
Proposition 23.4.4 (Effet d’un changement de base sur les coordonnées d’un vecteur)
Soit X ∈ E. Alors [X]B1 = PBB12 · [X]B2 .
En composant à gauche et à droite par l’identité, avec bases différentes, on obtient, toujours d’après la
formule de composition, la très importante formule de changement de base.
MatB2 ,C2 (f ) = PCC21 · MatB1 ,C1 (f ) · PBB12 = (PCC12 )−1 · MatB1 ,C1 (f ) · PBB12
Ainsi, cette formule s’écrit M ′ = Q−1 M P , où M est la matrice dans les bases initiales, M ′ la matrice dans
les nouvelles bases, P et Q les matrices de passage de la première base vers la seconde, respectivement
dans E et dans F .
Exemple 23.4.6
1. Retrouver les matrices des exemples précédents.
2. Donner une relation entre la matrice de D dans la base canonique de Rn [X] (au départ et à
l’arrivée) et la matrice de Jordan Jn+1 .
Proposition 23.4.8
Cela définit une relation d’équivalence.
Ainsi, on obtient :
Théorème 23.4.9
Soit f ∈ L(E, F ).
(i) Deux matrices M et N représentant f dans des choix différents de bases sont équivalentes ;
(ii) Réciproquement, si M = MatB1 ,C1 (f ) est la matrice de f relativement à deux bases B1 et C1 , et si
N est équivalente à M , alors il existe deux bases B2 et C2 de E et F telles que N = MatB2 ,C2 (f ).
Soit, pour tout (n, p) ∈ (N∗ )2 , et pour tout r ∈ [[0, min(n, p)]], soit
1 0··· ··· 0 ··· ··· 0
.. ..
0 1 . . . . .
. . ..
.. .
.. .. . . . ... .
Ir 0r,p−r
In,p,r = .. .. =
. . 1 0 · · · · · · 0
0 · · · · · · 0 0 · · · · · · 0
0n−r,r 0n−r,p−r
.. .. .. ..
. . . .
0 ··· ··· 0 0 ··· ··· 0
la matrice de type (n, p), constituée de 1 sur ses r premiers coefficients diagonaux, et de 0 partout ailleurs.
Théorème 23.4.10
Soit E et F des espaces de dimensions respectives p et n. Soit f ∈ L(E, F ), de rang r. Il existe deux
bases B et C, respectivement de E et de F , telles que
MatB,C (f ) = In,p,r .
Corollaire 23.4.11
Toute matrice de Mn,p (K) de rang r est équivalente à In,p,r .
Ainsi, dans Mn,p (R), les classes d’équivalence, pour la relation d’équivalence des matrices, sont les sous-
ensembles de matrices de même rang r ∈ [[0, min(n, p)]]. En particulier, l’espace quotient est en bijection
avec [[0, min(n, p)]].
Ainsi, cette relation s’écrit : M ′ = P −1 M P , où M est la matrice de f dans l’ancienne base, M ′ la matrice
de f dans la nouvelle base, et P la matrice de passage de l’ancienne base vers la nouvelle base.
Exemple 23.4.14
1. Soit p un projecteur de rang r d’un espace de dimension n. Montrer qu’il existe une base B de
E telle que MatB (p) = In,n,r .
2. Décrire de même une matrice simple représentant une symétrie dans un certain choix de base.
3. Déterminer une base relativement à laquelle la matrice de f : (x, y) 7→ (3x − 2y,
! x) est diagonale.
3 −2
En déduire une relation entre cette matrice diagonale et la matrice .
1 0
!
3 −2
On dit qu’on a diagonalisé , ou de façon équivalente, qu’on a diagonalisé f .
1 0
La notion de diagonalisation est liée à l’étude des classes d’équivalence de la relation fournie par les
changements de base pour les endomorphismes. Cela motive la définition de la relation d’équivalence
idoine, définissant la notion de matrices semblables.
Ainsi :
Corollaire 23.4.17
Les matrices d’un endomorphisme dans différentes bases de E sont semblables.
La classification des matrices semblables est beaucoup plus compliquée que la classification des matrices
équivalentes. Cette classification est à l’origine du problème de la réduction des endomorphismes. Le
problème de la réduction des endomophismes consiste à trouver un système simple de représentants des
classes de similitude, donc de trouver une matrice simple canonique équivalente à une matrice donnée.
La diagonalisation des matrices (ou des endomorphismes) est une des branches de ce problème, mais
les matrices diagonales ne suffisent pas à donner un système de représentants des classes de similitude.
Par ailleurs, il est important de noter que cette notion dépend beaucoup du corps de base. En effet,
toutes matrice de Mn (C) est C-semblable à une matrice triangulaire supérieure (et même à une matrice
de forme assez particulière, avec seulement deux diagonales non nulles), donc toute matrice de Mn (R)
aussi ; en revanche elles ne sont pas toutes R-semblables à une matrice triangulaire supérieure. Trouver
IV Changements de base 147
un système de représentants des classes de R-similitude est un problème plus compliqué que trouver un
système de représentants de C-similitude.
La classification des classes de similitude étant loin d’être triviale, une étape importante est la recherche
d’invariants de similitude, c’est-à-dire de propriétés ou quantités préservées par similitude. Ces invariants
permettent de distinguer certaines matrices non semblables (si elles n’ont pas même invariant) mais sont
en général insuffisants pour prouver qu’elles sont semblable (sauf si l’invariant caractérise la similitude).
Nous avons déjà étudié un invariant de similitude : le rang. En effet, deux matrices semblables sont
équivalentes. Cet invariant est assez faible, puisqu’il ne permet de classer les matrices de Mn (K) qu’en
n + 1 catégories.
Un deuxième invariant, encore plus facile à calculer, est la trace, que nous étudions dans le paragraphe
suivant.
Remarquez que A et B ne sont pas des matrices carrées, mais de format transposé. Ainsi, AB est une
matrice carrée d’ordre n alors que BA est une matrice carrée d’ordre p.
Avertissement 23.4.22
Le théorème affirme qu’on peut inverser l’ordre d’un produit dans la trace, lorsque la matrice dont
on cherche la trace s’exprime comme produit de 2 termes. Cela ne signifie pas qu’on peut commuter
comme on veut les termes d’un produit de n termes à l’intérieur de la trace. Ainsi, on peut écrire :
Exemple 23.4.23
! ! !! ! ! !!
1 0 0 1 1 1 1 0 1 1 0 1
Comparer tr et tr .
0 0 1 0 0 0 0 0 0 0 1 0
On en déduit notamment que, comme pour les matrices, la trace est une forme linéaire sur L(E), et que
pour tout u ∈ L(E, F ) et v ∈ L(F, E), on a tr(uv) = tr(vu).
En particulier, on a :
Nous donnons sans preuve la description complète d’un système de représentant des classes de similitude
dans Mn (C). Pour cela, nous définissons, pour tout ℓ ∈ [[1, n]] et tout λ ∈ C, la matrice :
λ 1 0 ··· 0
.. ..
0 λ 1 . .
. .. .. ..
Jℓ (λ) = λIℓ + Jℓ =
.. . . . 0
.
. ..
. . λ 1
0 ··· ··· 0 λ
Dans le cas où n = 1, la matrice J1 (λ) est réduite à la matrice à une seul coefficient (λ).
V Produit matriciel par blocs 149
Alors, toute matrice de Mn (C) est semblable, à permutation près des blocs diagonaux, à une unique
matrice
Jℓ1 (λ1 ) 0 0
..
. , ℓ1 + · · · + ℓk = n, (λ1 , . . . , λk ) ∈ Ck ,
0 0
0 0 Jℓk (λk )
matrice constituée de blocs diagonaux carrés égaux aux matrices Jℓi (λi ).
Le problème de la réduction d’un endomorphisme u, ou de façon équivalente, d’une matrice M , est de
trouver une base relativement à laquelle la matrice de u est de la forme ci-dessus, ou de façon équivalente,
de trouver une matrice P inversible telle que P −1 M P soit de la forme ci-dessus.
Si les ℓk sont tous égaux à 1, la matrice obtenue est diagonale. Ainsi, les matrices diagonales (à permutation
près des facteurs) font partie de la famille décrite ci-dessus. Le problème de la diagonalisation est donc
un sous-problème du problème plus vaste de la réduction, et si elle n’aboutit pas, il faudra chercher un
représentant de la classe de M sous le format plus général donné ci-dessus. Nous définissons :
Trouver une telle matrice diagonale (et la matrice de passage associée) s’appelle « diagonaliser » l’en-
domorphisme ou la matrice. Vous verrez l’année prochaine des techniques efficaces pour diagonaliser un
endomorphisme ou une matrice.
De façon plus générale, trouver un représentant sous la forme générale exposée ci-dessus (et la matrice
de passage correspondante) s’appelle « réduire » ou « jordaniser » l’endomorphisme ou la matrice.
Pour la culture, le résultat qui est à la base du théorème de jordanisation, disant que toute matrice à
coefficients complexes est jordanisable, est le théorème suivant :
De plus, cette suite est stationnaire, et « s’essouffle », dans le sens où les sauts de dimension forment
une suite décroissante, ultimement nulle.
0 = i0 < i1 < i2 < · · · < iq−1 < iq = n et 0 = j0 < j1 < j2 < · · · < jr−1 < jr = p.
Les blocs sont alors définis par Ak,ℓ = (ai,j )(i,j)∈[[ik−1 −1,ik ]]×[[jℓ−1 +1,jℓ ]] . La matrice Ak,ℓ est donc la matrice
obtenue par extraction des lignes ik−1 + 1 à ik et des colonnes jℓ−1 + 1 à jℓ de A. On dira que le découpage
150 CHAPITRE 23. MATRICES
0 = i0 < i1 < i2 < · · · < iq−1 < iq = n et 0 = j0 < j1 < j2 < · · · < jr−1 < jr = p.
Par ailleurs, étant donné E, muni de la base B = (b1 , . . . , bp ), nous définissons la décomposition de E
associée à la suite
0 = j0 < j1 < j2 < · · · < jr−1 < jr = p
par
E = E1 ⊕ · · · ⊕ Er ,
décomposition que nous écrivons F = F1 ⊕ · · · ⊕ Fq . La suite (ji ) définit également des tranches adaptées
Cℓ de la base C, comme ci-dessus.
Enfin, étant donnée la décomposition en sommes directes F = F1 ⊕ · · · ⊕ Fq , on appelle projection sur le
k-ième facteur l’application linéaire de L(E, Ek ) définie par :
pk (x1 + · · · + xq ) = xk .
∀x ∈ F, x = p1 (x) + · · · + pq (x).
Les deux premières suites définissent un découpage par blocs A = (Ai,j )(i,j)∈[[1,q]]×[[1,r]] de A et les deux
dernières définissent un découpage par blocs B = (Bj,k )(j,k)∈[[1,r]]×[[1,s]].
Le produit AB admet alors une représentation par blocs :
AB = (Ci,k )(i,k)∈[[1,q]]×[[1,s]] ,
r
X
où pour tout (i, k) ∈ [[1, q]] × [[1, s]], Ci,k = Ai,j Bj,k .
j=1
V Produit matriciel par blocs 151
Exemple 23.5.3
1 1 0 0 0
0 1 1 0 0
Calcul des puissances successives de 0 0 1 0 0
0 0 0 2 1
0 0 0 0 2
152 CHAPITRE 23. MATRICES
24
Groupe symétrique et déterminants
L’examen de ces Formules fournit cette Règle générale. Le nombre des équations & des in-
connues étant n, on trouvera la valeur de chaque inconnue en formant n fractions dont le
dénominateur commun a autant de termes qu’il y a de divers arrangements de n choses dif-
férentes. Chaque terme est composé des lettres ZY XV etc. toujours écrites dans le même
ordre, mais auquelles on distibue, comme exposants, les n premiers chiffres rangés en toutes
les manières possibles [les Z i , Y i ... représentent les coefficients du système d’équations]. Ainsi,
lorsqu’on a trois inconnues, le dénominateur a (1×2×3 =) 6 termes, composés des trois lettres
ZY X qui recoivent successivement les exposants 123, 132, 213, 231, 312, 321. On donne à
ces termes les signes + ou −, selon la règle suivante. Quand un exposant est suivi, dans le
même terme, médiatement ou immédiatement, d’un exposant plus petit que lui, j’appellerai
cela un dérangement. Qu’on compte, pour chaque terme, le nombre de dérangements : s’il est
pair ou nul, le terme aura le signe + ; s’il est impair, le terme aura le signe −. Par ex. dans
le terme Z 1 Y 2 V 3 [sic] il n’y a aucun dérangement : ce terme aura donc le signe +. Le terme
Z 3 Y 1 X 2 aura le signe + parce qu’il y a deux dérangements, 3 avant 1 & 3 avant 2. Mais le
terme Z 3 Y 2 X 1 qui a trois dérangements, 3 avant 2, 3 avant 1 & 2 avant 1, aura le signe −.
Le dénominateur commun étant ainsi formé, on aura la valeur de z en donnant à ce déno-
minateur le numérateur qui se forme en changeant, dans tous ses termes, Z en A [(les Ai
forment le second membre)]. Et la valeur d’y est la fraction qui a le même dénominateur &
pour numérateur la quantité qui résulte quand on change Y en A dans tous les termes du
dénominateur. Et on trouve de manière semblable la valeur des autres inconnues.
(Gabriel Cramer)
Le texte ci-dessus décrit la règle de Cramer pour la résolution des systèmes linéaires. Au passage, Cra-
mer donne une description des numérateurs et dénominateurs correspondant à la définition actuelle des
déterminants. La signature des permutations y est défini par le nombre d’inversions (terminogie actuelle
pour désigner ce que Cramer appelait des dérangements ; la notion de dérangement désigne actuellement
plutôt des permutations sans point fixe ; on peut retenir au passage qu’avant de se fixer, la terminologie
mathématique peut être fluctuante).
M. Gauss s’en est servi avec avantage dans ses Recherches analytiques pour découvrir les
propriétés générales des formes du second degré, c’est-à-dire des polynômes du second degré
à deux ou plusieurs variables, et il a désigné ces mêmes fonctions sous le nom de détermi-
nants. Je conserverai cette dénomination qui fournit un moyen facile d’énoncer les résultats ;
j’observerai seulement qu’on donne aussi quelquefois aux fonctions dont il s’agit le nom de
résultantes à deux ou à plusieurs lettres. Ainsi les deux expressions suivantes, déterminant et
résultante, devront être regardées comme synonymes.
(Augustin de Cauchy)
154 CHAPITRE 24. GROUPE SYMÉTRIQUE ET DÉTERMINANTS
Nous rappelons que le groupe symétrique Sn ou Sn est le groupe des permutations de [[1, n]], la loi du
groupe étant la composition. L’étude algébrique des groupes Sn est très intéressante, et aboutit à des
résultats aussi importants que la non résolubilité par radicaux des équations de degré au moins 5. Cette
étude va bien au-delà des objectifs du programme, qui sont uniquement d’introduire les outils nécessaires
pour pouvoir définir correctement les déterminants. Nous nous limiterons donc, avec beaucoup de regrets,
à ces objectifs.
I Groupe symétrique
Notre but est d’introduire les outils nécessaires à la définition de la signature d’une permutation, notion
utilisée ensuite dans l’étude des déterminants. La signature d’une permutation est définie comme l’unique
morphisme de groupes ε : Sn 7→ {−1, 1} non constant. Notre objectif est donc de montrer l’existence et
l’unicité de ce morphisme.
Exemple 24.1.2
1. Décrire de la sorte tous les éléments de S2 et S3 .
2. Décrire de la sorte la permutation de Sn inversant l’ordre : σ(k) = n + 1 − k.
Certaines permutations ont un comportement particulier : elles effectuent une rotation sur un ensemble
d’éléments (qu’on peut ranger en cercle), et laissent les autres invariants. On appelle cycle ces permuta-
tions. Pour rendre le caractère cyclique plus visible sur les notations on adopte pour ces permutations
une notation plus adaptée. Nous définissons de façon plus précise :
Exemple 24.1.4 ! !
1 2 3 4 5 6 1 2 3 4 5 6
Sont-ce des cycles : ? ?
1 4 5 3 2 6 3 4 5 2 6 1
I Groupe symétrique 155
σ = (i1 i2 . . . ik ).
Son support est donc l’ensemble I = {i1 , . . . , ik }. La longueur du cycle est l’entier k = Card(I).
Cette notation signifie que tout élément de la liste est envoyé sur l’élément suivant, le dernier étant envoyé
sur le premier.
Exemple 24.1.6
1. Écrire le cycle de l’exemple 24.1.4 avec les notations 24.1.5.
2. Écrire le cycle (1 5 8 2 9 7 3) avec les notations 24.1.1.
Avertissement 24.1.7
Attention, l’ordre des éléments i1 , . . . , in est important.
Remarque 24.1.8
La représentation d’un cycle sous la forme 24.1.5 est-elle unique ?
On rencontre parfois :
Ainsi, un grand cycle effectue une rotation, dans un certain ordre, entre les n éléments de [[1, n]]. Un
exemple important de grand cycle est :
Exemple 24.1.11
Écrire les permutations circulaires directes et indirectes avec les notations 24.1.1.
Une famille importante de cycles est constituée des cycles de longueur 2. En effet, il s’agit d’une famille
génératrice de Sn , comme on le verra plus tard.
Exemple 24.1.13
Écrire la transposition τ = (2 5) de S6 avec les notations 24.1.1.
Lemme 24.1.15
Soit σ ∈ Sn . On a :
Y Y Y
(σ(j) − σ(i)) = δσ (X) = (j − i)
16i<j6n X∈P2 ([[1,n]]) 16i<j6n
Théorème 24.1.17
La signature ε est un morphisme de groupes de (Sn , ◦) dans ({−1, 1}, ×).
De l’étude du signe de l’expression définissant ε(σ), il découle que celui-ci-dépend du nombre de couples
(i, j) avec i < j tel que σ(i) > σ(j).
ε(σ) = (−1)Inv(σ) .
I Groupe symétrique 157
Une transposition (i i + 1) n’admettant que le couple (i, i + 1) comme inversion, il vient alors :
Proposition 24.1.20
Notons, pour tout i ∈ [[1, n − 1]], τi = (i i + 1). On a alors ε(τi ) = −1.
Or, toute transposition peut s’écrire à l’aide de ces transpositions entre éléments consécutifs :
Nous avons donc répondu au problème de l’existence d’un morphisme ε : Sn → {−1, 1}, prenant la valeur
−1 sur les transpositions.
Pour étudier son unicité, nous allons établir que toute permutation s’écrit comme composition de trans-
position. Ainsi, la valeur d’un morphisme ε sur une permutation est entièrement déterminée par la valeur
de ε sur les transpositions. Imposer la valeur sur les transpositions fournit dans ce cas l’unicité.
Les transpositions étant elles mêmes engendrées par les τi , on se rend compte que toute permutation s’écrit
comme produit des τi . Cela ne soit pas nous étonner, on l’avait déjà prouvé en étudiant la correction de
certains algorithmes de tri (lesquels ?)
Remarque 24.1.24
Le rapport obtenu entre signature et décomposition en produit de transpositions permet d’affirmer que
la parité du nombre de terme de toute décomposition en produits de transpositions d’une permutation
donnée est la même.
Pour montrer l’unicité du morphisme non trivial ε, nous montrons qu’un morphisme ϕ : Sn → {−1, 1}
attribue la même valeur à toute transposition. Pour cela, nous établissons deux lemmes. Nous supposons
donné un tel morphisme ϕ.
Lemme 24.1.25
Soit s ∈ Sn . Alors ϕ(σ) = ϕ(σ −1 )
Corollaire 24.1.27
Soit α ∈ {−1, 1}. S’il existe une transposition τ0 telle que ϕ(τ0 ) = α, alors pour toute transposition τ ,
ϕ(τ ) = α.
Proposition 24.1.31
La relation ≡σ est une relation d’équivalence.
Soit x ∈ [[1, n]], et Sx l’unique classe d’équivalence contenant x. Par définition de la relation ≡σ , Sx =
{σ i (x), i ∈ N}.
Proposition 24.1.32
Soit k le cardinal de Sx . Alors les σ i (x), i ∈ [[0, k − 1]], sont deux-à-deux distincts, on a Sx =
{x, σ(x), . . . , σ k−1 (x)}, et σ induit sur Sx une permutation de Sx , égale au cycle (x, σ(x), . . . , σ k−1 (x)).
Lemme 24.1.33
Soit x et y des éléments d’une même classe d’équivalence modulo ≡σ . Alors Cx = Cy .
I Groupe symétrique 159
Cette dernière hypothèse signifie que les cycles considérés sont à supports disjoints, et que tout élément
de [[1, n]] est dans un cycle, quitte à considérer dans la décomposition des cycles de longueur 1 (en ayant
en mémoire la possibilité de différencier) leur support.
Remarque 24.1.35
• Les cycles Ci sont les cycles associés à un système de représentants modulo la relation ≡σ .
• L’ordre dans lequel on effectue cette composition importe peu, du fait du lemme qui suit.
• Certains auteurs ne considèrent que des cycles de longueur au moins égale à deux (cas où la
donnée du support est déterminée par la donnée du cycle). Dans ce cas, le résultat se réénonce
en disant que toute permutation est de façon unique (à permutation près) composée de cycles à
supports disjoints.
Exemple 24.1.38
Trouver la décomposition en cycles à supports disjoints de :
!
1 2 3 4 5 6 7 8 9 10
σ= .
5 2 8 10 7 9 1 3 4 6
Dans ces deux dernières définitions, il est nécessaire de tenir compte aussi des supports de taille 1.
160 CHAPITRE 24. GROUPE SYMÉTRIQUE ET DÉTERMINANTS
Dans le cas où k = 1, le terme de droite est réduit à un produit vide de transpositions (égal à l’identité)
ε(C) = (−1)ℓ(C)−1 .
ε(σ) = (−1)n−c(σ) .
II Déterminants
Dans cette section, nous étudions les déterminants. Nous verrons cette notion tout d’abord vue comme
un objet défini sur une famille de vecteurs, puis nous en déduirons une notion de déterminant d’un
endomorphisme, puis d’une matrice carrée. Notre but étant en grande partie de caractériser l’inversibilité
d’une matrice grâce à cet objet, nous introduisons ensuite des techniques calculatoires efficaces. Nous
voyons enfin comment donner une expression de l’inverse d’une matrice à l’aide des déterminants, même
si en pratique, la formule obtenue manque d’efficacité.
ϕ : E1 × · · · × En −→ F
telle que pour tout i ∈ [[1, n]], ϕ soit linéaire par rapport à sa i-ième variable, les autres étant fixées
quelconques, donc si pour tout x1 , . . . , xn , x′i et λ,
Une application est une application multilinéaire si elle est n-linéaire pour un certain n > 2.
Proposition 24.2.3
Soit ϕ une application n-linéaire. Alors ϕ(x1 , . . . , xn ) = 0 dès lors qu’une des variables xi est nulle.
Exemple 24.2.5
1. Voici des exemples de formes ou applications bilinéaires (n = 2) :
• (x, y) ∈ (Rn )2 7→ hx, yi, le produit scalaire canonique
• (x, y) ∈ C2 7→ xy
• (f, g) ∈ L(E) 7→ f ◦ g
• (X, Y ) ∈ (Rn )2 7→ tY M X
2. (x1 , . . . , xn ) 7→ x1 · · · xn
Z 1
3. (f1 , . . . , fn ) 7→ f1 (t) · · · fn (t) dt
0
4. L’aire (signée) du parallélogramme défini par deux vecteurs x et y
5. Le volume du parallélépipède défini par trois vecteurs.
Avertissement 24.2.7
Les indices des sommes doivent être indépendants !
162 CHAPITRE 24. GROUPE SYMÉTRIQUE ET DÉTERMINANTS
Exemple 24.2.8
Dans le cas de la bilinéarité, on obtient :
k
X ℓ
X k X
X ℓ
ϕ λi ai , µj b j = λi µj ϕ(ai , bj ).
i=1 j=1 i=1 j=1
Proposition 24.2.10
On a un isomorphisme d’espaces vectoriels :
Notation 24.2.11
Lorsque E1 = · · · = En , on notera plus simplement Ln (E; F ) l’espace des applications n-linéaires de E
dans F , et Ln (E) l’espace des formes n-linéaires.
Comme pour les applications linéaires, pour déterminer entièrement une application n-linéaire (et donc
en particulier une forme n-linéaire), il suffit d’en connaître l’image sur les vecteurs d’une base.
Exemple 24.2.13
Soit (e1 , . . . , en ) la base canonique de Kn . Une forme bilinéaire ϕ sur Kn est entièrement déterminée
par la donnée de n2 scalaires ϕ(ei , ej ). En notant M la matrice carrée définie par ces scalaires (M =
II Déterminants 163
(ϕ(ei , ej ))16i,j6n ), on peut vérifier que pour tout X, Y ∈ Kn (qu’on identifie au vecteur colonne des
coordonnées dans la base canonique), on a :
ϕ(X, Y ) = tXM Y.
Plus généralement, toute forme bilinéaire sur un espace vectoriel E de dimension finie s’écrit de la sorte
après choix d’une base de E (voir un chapitre ultérieur).
Exemple 24.2.15
1. Le produit scalaire canonique est une forme bilinéaire symétrique
2. (A, B) 7→ tr(AB) est une forme bilinéaire symétrique
3. (A, B, C) 7→ tr(ABC) est-elle symétrique ?
4. L’aire du parallélogramme formé par deux vecteurs de R2 est une forme bilinéaire alternée.
5. Le volume du parallélépipède formé par trois vecteurs de R3 est une forme trilinéaire alternée.
Lemme 24.2.17
Soit ϕ une forme alternée. Alors pour tout (x1 , . . . , xn ) ∈ E n , et tout (i, j) ∈ [[1, n]]2 tel que i 6= j :
ϕ(x1 , . . . , xi , . . . , xj , . . . , xn ) = −ϕ(x1 , . . . , xj , . . . , xi , . . . , xn ).
Réciproquement, si cette condition est satisfaite, alors, si K n’est pas de caractéristique 2, ϕ est alternée.
Des deux lemme ci-dessus, on déduit immédiatement le sens direct ci-dessous. La réciproque nécessite
une hypothèse supplémentaire sur K.
164 CHAPITRE 24. GROUPE SYMÉTRIQUE ET DÉTERMINANTS
Proposition 24.2.19 (Image d’une famille liée par une forme alternée)
Soit (x1 , . . . , xn ) une famille liée, et ϕ une forme alternée. Alors ϕ(x1 , . . . , xn ) = 0.
Nous aurons l’occasion de reparler de formes n-linéaires symétriques (et plus particulièrement pour n = 2),
lorsque nous étudierons les produits scalaires (la symétrie étant une des 3 propriétés requises pour qu’une
forme bilinéaire définisse un produit scalaire). Pour l’heure, nous nous concentrons sur la notion de forme
alternée, fortement liée, d’après les exemples, aux problèmes de calculs d’aires et de volumes. Nous allons
voir qu’à un scalaire multiplicatif près, en dimension n, la mesure des hypervolumes est la seule forme
n-linéaire.
Théorème 24.2.20 (Détermination des formes alternées par l’image d’une base)
Soit E un espace vectoriel de dimension finie, muni d’une base (e1 , . . . , en ), et p ∈ N∗ .
• Si p > n, la seule forme p-linéaire alternée sur E est la forme nulle.
• Si p 6 n, une forme p-linéaire alternée ϕ est complètement déterminée, de façon unique, par la
donnée de ϕ(ei1 , . . . , eip ), pour 1 6 i1 < · · · < ip 6 n.
Plus précisément, il s’agit de l’unique forme p-linéaire sur E telle que pour tout (i1 , . . . , ip ) ∈ [[1, n]]p ,
(
0 s’il existe j 6= k tel que ij = ik
ϕ(ei1 , . . . , eip ) =
ε(τ )ϕ(eiτ (1) , . . . , eiτ (p) ) sinon,
Remarques 24.2.22
• Si la première condition n’est pas satisfaite, les eik sont deux à deux distincts, et en nombre
n, donc sont constitués des éléments ei pris chacun une et une seule fois. Aussi la famille (ei,k )
peut-elle être vue comme une permutation de la famille (ei ), ce qui permet de l’écrire sous la
forme (eσ(1) , . . . , eσ(n) ).
• La correspondance entre la permutation σ du corollaire précédent, et la permutation τ qui
précède le corollaire est (lorsque p = n) : σ = τ −1 .
II Déterminants 165
Cette unique forme n-linéaire alternée va être notre définition du déterminant (par rapport à une base
B).
Ainsi, le déterminant par rapport à B est l’unique forme n-linéaire alternée prenant la valeur 1 sur la
famille B.
Remarque 24.2.24
Si E est un R-espace vectoriel, cette notion est à relier à la notion d’hypervolume relative à une base :
le déterminant de n vecteurs par rapport à B est le volume (orienté) du parallélépipède défini par les
n vecteurs, l’unité de volume étant le parallélépipède défini par les vecteurs de la base B.
Exemples 24.2.25
1. Voir l’interprétation géométrique dans R2 et R3 , muni de la base canonique, puis dans R2 muni
d’une base quelconque.
! !!
a c
2. Déterminant par rapport à la base canonique de , .
b d
a1 b1 c1
3. Déterminant par rapport à la base canonique de a2 , b2 , c2 .
a3 b3 c3
On a alors :
X X
det(x1 , . . . , xn ) = ε(σ)aσ(1),1 · · · aσ(n),n = ε(τ )a1,τ (1) · · · an,τ (n) .
B
σ∈Sn τ ∈Sn
Ainsi, changer de base ne nous fait pas sortir de la droite Vect(detB ). Comme par ailleurs, une autre base
B ′ , définira également une droite Vect(detB′ ), aussi égale à l’ensemble des formes n-linéaires alternées,
166 CHAPITRE 24. GROUPE SYMÉTRIQUE ET DÉTERMINANTS
on peut donc affirmer que detB et detB′ diffèrent d’une constante multiplicative. En évaluant en B ′ , on
obtient alors :
Remarque 24.2.29
En échangeant le rôle de B et B ′ , ou en évaluant en B, on obtient la relation suivante :
1
det(B ′ ) = .
B detB′ (B)
Les deux formes detB et detB′ étant non nulles, et ayant déjà vu l’image par une forme alternée d’une
famille liée, on obtient la caractérisation suivante :
Nous verrons un peu plus loin que cette caractérisation équivaut à l’inversibilité de la matrice de la famille
B ′ dans la base B, cette matrice étant alors la matrice de passage de la base B à la base B ′ .
Proposition 24.2.31
La relation R est une relation d’équivalence. Pour cette relation d’équivalence, il existe précisément
deux classes d’équivalence.
II Déterminants 167
Remarque 24.2.34
La notion d’orientation directe ou indirecte relève de la convention : elle ne peut se définir dans l’absolue,
et nécessite la donnée d’une base de référence. Dans certaines situations, il existe une base de référence
naturelle. Ainsi, dans le cas de Rn , la base canonique constituera en général la base directe de référence.
Par ailleurs, les espaces vectoriels (y compris Rn ) sont définis indépendamment de toute représentation
planaire, spatiale ou autre. Ainsi, définir une orientation directe par certaines caractéristiques d’une
représentation planaire ou spatiale relève également de la convention, mais s’avère bien pratique, en
physique notamment. Remarquez qu’une telle convention pour R2 est inversée si on regarde le plan
par l’autre coté ! De même pour les conventions dans R3 , si on plonge l’espace R3 dans R4 , et qu’on le
regarde par deux côtés différents.
En particulier, l’échange de deux vecteurs modifie l’orientation, puisqu’une transposition est impaire.
Lemme 24.2.36
Soit u ∈ L(E). Soit, pour toute forme n-linéaire alternée ϕ sur E, ϕu définie par
Proposition 24.2.40
Soit n la dimension de E. Soit u ∈ L(E) et λ ∈ K. On a det(λu) = λn det(u).
Enfin, notre but étant de caractériser les matrices inversibles (donc les automorphismes), on obtient :
Enfin, si E et F sont de même dimension, la donnée d’un isomorphisme Φ : E → F permet de relier les
déterminants d’endomorphismes de E et les déterminants d’endomorphismes de F :
det(M ) = det(C1 , . . . , Cn ).
b.c.
Les résultats obtenus pour les endomorphismes se transfèrent alors de façon immédiate aux matrices :
Ces règles nous permettent d’établir le fait que le déterminant est un invariant de similitude :
Pour des matrices décrites par la donnée tabulaire de leurs coefficients, on utilise souvent la notation
suivante :
Nous transcrivons aussi la description initiale que nous avions donnée pour les familles de vecteurs grâce
aux permutations :
170 CHAPITRE 24. GROUPE SYMÉTRIQUE ET DÉTERMINANTS
a b
1. On a : = ad − bc
c d
2. (Règle de Sarrus) On a :
a b c
d e f = aei + bf g + cdh − gec − hf a − idb,
g h i
Avertissement 24.2.54
Prenez garde à ne pas généraliser trop vite la règle de Sarrus à des matrices d’ordre supérieur ! Pour
n > 4, une règle aussi simpliste est fausse ! Il faut considérer toutes les permutations possibles !
La description explicite par les coefficients permet également d’établir de façon quasi-immédiate :
λ1 • ··· •
.. .. ..
0 . . .
.. = λ1 λ2 · · · λn .
.. ..
. . . •
0 ··· 0 λn
III Calcul des déterminants 171
Exemple 24.3.5 1 −2 1 0
1 0 1 1
1. Déterminant de
2 1 0 1
0 0 1 1
a 1 ··· 1
..
1 . . . . . . .
2. Déterminant de .
. .. ..
. . . 1
1 ··· 1 a
Exemples 24.3.7 1 2 3 5
2 2 2 8
1. Déterminant de
0 0 1 3
0 0 −1 2
A1 • ··· •
.. . .. !
0
. .. .
cos(θi ) − sin(θi )
2. Déterminant de . , où Ai =
. .. .. sin(θi ) cos(θi )
. . . •
0 · · · 0 Ak
3. On peut combiner avec les opérations du pivot, pour éviter la dernière opération (ou les deux
dernières), en se ramenant ainsi au calcul d’un déterminant d’ordre 2 ou 3 (par Sarrus).
Si la formule elle-même s’avère assez inefficace pour n > 2, la caractérisation de l’inversibilité par la non
nullité du déterminant est d’une très grande utilité.
Les formules de Cramer (décrites par ce dernier BIEN AVANT la formule d’inversion) sont une consé-
quence de la formule d’inversion :
Corollaire 24.3.12 (Cramer) x1
.
Soit à résoudre le système AX = B, de l’inconnue X =
.. . Soit A1 , . . . , An les colonnes de A. On
xn
a alors, pour tout k ∈ [[1, n]] :
Voyons maintenant quelques exemples de calculs de déterminant par la méthode de développement suivant
une colonne.
a+b a 0 ··· 0
.. .. .. ..
Exemples 24.3.13 b . . . .
.. .. ..
1. Déterminant de la matrice tridiagonale
0 . . .
0 .
..
.. .. ..
. . . . a
0 ··· 0 b a+b
2. On peut combiner pivot de Gauss et développement suivant les lignes ou colonnes, en annulant
d’abord un grand nombre de termes par les opérations élémentaires avant de développer. Nous
illustrons ceci sur le calcul du déterminant de Vandermonde :
1 1 ··· 1 1
x1 x2 · · · xn−1 xn
2
V (x1 , . . . , xn ) = x1 x22 · · · x2n−1 x2n
.. .. .. ..
. . . .
n−1 n−1 n−1
x1 x2 · · · xn−1 xnn−1 .
Cet exemple est un peu plus qu’un exemple, nous le consignons dans la proposition suivante :
Nous voyons dans la section suivante une autre façon de calculer ce déterminant de Vandermonde.
Exemple 24.3.17
Calcul de Vn (x1 , . . . , xn ).
(Jean Dieudonné)
Un espace préhilbertien réel est un espace vectoriel muni d’un produit scalaire. Cet outil permet de
parler d’orthogonalité, et donc d’introduire un certain nombre de concepts permettant de généraliser la
géométrie euclidienne du plan à des situations plus abstraites.
Pour commencer nous introduisons donc cette notion abstraite de produit scalaire, ce qui nous oblige à
faire quelques rappels sur les formes bilinéaires, déjà rencontrées dans le chapitre précédent.
Tous les espaces vectoriels considérés dans ce chapitre sont des espaces vectoriels sur R.
I Produits scalaires
I.1 Formes bilinéaires
Les résultats de cette sous-section sont valables dans un cadre plus général que les espaces sur R, mais
toute la suite du chapitre nécessitant de travailler avec des espaces vectoriels sur R, nous nous limitons
également à ce cadre dans les rappels qui suivent.
Ce dernier exemple est très important, car si E est de dimension finie, toute forme bilinéaire peut être
représenté de cette forme après choix d’une base de E. C’est ce que nous étudions maintenant.
La forme quadratique q est en général associée à plusieurs formes linéaires. Par exemple les formes linéaires
sur R2 définies par
Exemples 25.1.8
1. Matrice des variances-covariances si X1 , . . . , Xn sont linéairement indépendants.
Z 1
2. Matrice dans la base canonique de ϕ : (P, Q) 7→ P (x)Q(x) dx sur Rn [X].
0
3. Matrice du produit scalaire canonique de Rn dans la base canonique ; dans la base B =
(b1 , . . . , bn ), où bi est constitué de 1 sur les coordonnées 1 à i, et de 0 ailleurs.
où X et Y sont les vecteurs colonnes représentant les coordonnées de x et y dans la base B, et M est
la matrice de ϕ relativement à cette même base B.
Une base B étant fixée, cette relation caractérise d’ailleurs la matrice MatB (ϕ) :
Exemple 25.1.11
L’égalité Matbc (ϕ) = In se traduit par ϕ(X, Y ) = tXIn Y = tXY ; c’est le produit scalaire usuel.
Remarque 25.1.12
À quelle condition nécessaire et suffisante sur leur représentation matricielle relativement à une base
donnée deux formes bilinéaires ϕ et ψ définissent-elles la même forme quadratique q ?
178 CHAPITRE 25. ESPACES PRÉHILBERTIENS RÉELS
Corollaire 25.1.13
L’application
Φ : B(E) −→ Mn (R)
ϕ 7−→ MatB (ϕ)
est un isomorphisme.
dim(B(E)) = n2 .
Comme pour les applications linéaires, les changements de base s’expriment facilement par des opérations
matricielles.
Exemple 25.1.16
Explicitation du changement de la base canonique à la base B dans l’exemple 25.1.8, pour le produit
scalaire canonique.
Pour cette raison, on parle assez rarement de forme définie, cette propriété étant indissociable d’une
propriété de positivité ou de négativité. On parlera alors de forme définie positive, ou définie négative.
I Produits scalaires 179
Exemples 25.1.20
1. ϕ : (x, y) 7→ xy sur R est symétrique, définie, positive.
2. cov est symétrique positive, mais pas définie.
3. Le produit scalaire canonique sur Rn est symétrique, défini, positif.
Z b
4. ϕ : (f, g) 7→ f (t)g(t) dt sur C 0 ([a, b]) est symétrique, définie et positive.
a
1
ϕ(x, y) = (q(x + y) − q(x) − q(y)).
2
Voici enfin un résultat d’une importance capitale, que nous avons déjà rencontré en cours d’année dans
différents contextes, qui sont tous des cas particuliers du contexte général exposé ici.
Exemple 25.1.23
Pour toutes variables aléatoires X et Y admettant une variance, on a :
|cov(X, Y )| 6 σ(X)σ(Y ).
Nous verrons d’autres exemples plus loin, lorsque nous aurons réexprimé plus simplement le cas d’égalité
lorsque ϕ est un produit scalaire.
Remarque 25.1.25
La symétrie et la linéarité par rapport à la première variable entraînent la linéarité par rapport à la
seconde variable.
Voici les exemples usuels (les 3 premiers), desquels on peut dériver d’autres exemples. Ces exemples sont
à considérer comme des exemples du cours.
Ainsi, on n’a pas unicité d’un produit scalaire sur un espace vectoriel E.
Soit ϕ un produit scalaire, noté ϕ(x, y) = hx, yi. Alors en particulier, ϕ est une forme bilinéaire, et si
B = (e1 , . . . , en ) est une base de E :
Proposition 25.1.28
La matrice d’un produit scalaire dans une base quelconque est symétrique. La réciproque est fausse.
Un produit scalaire étant une forme bilinéaire symétrique, on dispose aussi de la formule de polarisation,
s’écrivant ici :
1
hx, yi = kx + yk2 − kxk2 − kyk2 .
2
Cette formule n’est autre que le développement d’un carré :
L’inégalité de Cauchy-Schwarz est également vraie, et le caractère défini permet de simplifier la condition
d’égalité.
I Produits scalaires 181
Comme promis plus haut, nous donnons deux inégalités de Cauchy-Schwarz à connaître impérativement.
à savoir : ! 21 ! 12
n
X n
X n
X
xi yi 6 x2i yi2 ,
i=1 i=1 i=1
ou encore : !2 ! !
n
X n
X n
X
xi yi 6 x2i yi2 ,
i=1 i=1 i=1
Z Z ! 21 Z ! 12
b b b
0 2 2
∀(f, g) ∈ C ([a, b]), f (t)g(t) dt 6 f (t) dt g(t) dt ,
a a a
Proposition 25.1.34
L’application x 7→ kxk est une norme sur E.
182 CHAPITRE 25. ESPACES PRÉHILBERTIENS RÉELS
1
ϕ(x, y) = (N (x + y)2 − N (x)2 − N (y)2 ).
2
On vérifie ensuite que ϕ est une application bilinéaire. En cas de bilinéarité, le caractère symétrique
défini positif est immédiat par définition de N . Le point à étudier de plus près est donc la bilinéarité :
c’est là que se trouve l’éventuelle obstruction.
Exemple 25.1.38
Soit n > 2, et N : (x1 , . . . , xn ) 7→ max(|x1 |, . . . , |xn |) est une norme sur Rn , mais n’est pas une norme
euclidienne.
S’il n’y a pas d’ambiguïté sur le produit scalaire, on parlera plus simplement de l’espace préhilbertien E,
au lieu de (E, h·, ·i).
Par exemple Rn muni du produit scalaire canonique est un espace euclidien. Rn [X] muni d’un produit
scalaire intégral est un espace euclidien. En revanche, R[X] muni du même produit scalaire n’est qu’un
espace préhilbertien réel, ainsi que C 0 ([a, b]) muni du produit scalaire intégral.
II Orthogonalité
Dans toute cette section, on considère (E, h·, ·i) un espace préhilbertien réel. Il sera précisé euclidien dans
certains cas.
II Orthogonalité 183
Exemples 25.2.2
1. ∀x ∈ E, x⊥0.
2. Soit (e1 , . . . , en ) la base canonique de Rn . Alors pour tout i 6= j, ei ⊥ej .
1 −4
2 −3
3. ⊥ , pour le produit scalaire usuel.
3 2
4 1
Z 1
4. x 7→ sin πx et x 7→ cos πx sont orthogonaux pour le produit scalaire hf, gi = f (t)g(t) dt sur
−1
C 0 ([−1, 1]).
Vous savez depuis longtemps déterminer si deux vecteurs du plan euclidien sont orthogonaux, par exemple
en vérifiant qu’ils forment un triangle rectangle. Cette caractérisation des triangles rectangles se généra-
lise :
Le théoèrme de Pythagore se généralise alors ainsi (pour une famille finie), mais on perd ici l’équivalence
(ce n’est pas une caractérisaion de l’orthogonalité) :
n 2 n
X X
xi = kxi k2 .
i=1 i=1
Un fait qu’il est important de garder en mémoire est la facilité d’expression vectorielle des objets dans
une base orthonormale. Nous pouvons donner dès maintenant l’expression d’un vecteur dans une b.o.n.,
nous verrons un peu plus loin l’expression de la matrice d’un endomorphisme.
Proposition 25.2.8 (Expression des coordonnées d’un vecteur dans une b.o.n.)
Soit E un espace euclidien. Soit B = (b1 , . . . , bn ) une base orthonormale de E. Alors :
n
X
∀X ∈ E, X = hX, bi i bi .
i=1
Exemples 25.2.10
1. Dans R3 , le plan (Oxy) et la droite (Oz).
1
3
2. Dans R , le plan d’équation x + y + z = 0, et la droite engendrée par 1.
1
3. Dans C 0 ([−1, 1]) muni du ps usuel, le sous espace P des fonctions paires, et le sous-espace I des
fonctions impaires.
Du fait de la bilinéarité du produit scalaire, il n’est pas nécessaire d’établir l’orthogonalité de toutes les
paires de vecteurs de E et F pour obtenir l’orthogonalité des deux espaces. Il suffit en fait de verifier
cette orthogonalité sur des vecteurs de familles génératrices.
Proposition 25.2.19
Soit F un sev de E. Alors F ⊥F ⊥ , donc en particulier, la somme F ⊕ F ⊥ est directe.
Avertissement 25.2.20
Attention, contrairement à l’idée intuitive qu’on se fait en considérant l’orthogonalité dans R3 , F ⊥ n’est
pas forcément un supplémentaire de F dans E. On montrera que c’est le cas si E est de dimension
finie, mais que cette propriété entre en défaut si E est de dimension infinie.
Exemple 25.2.21
Déterminer l’orthogonal dans R4 muni de la base canonique de
1 1
0 1
F = Vect , .
1 0
0 1
normale (b1 , . . . , bm ) de F . Alors le projeté orthogonal de y sur F existe, est unique, et vaut :
m
X
z= hy, bi i bi .
i=1
Remarques 25.2.26
1. On verra dans la suite du cours qu’un espace vectoriel de dimension finie et muni d’un produit
scalaire admet toujours au moins une base orthonormale pour ce produit scalaire : l’hypothèses
d’existence de cette base est donc superflue dans le théorème ci-dessus.
2. Si (b1 , . . . , bn ) est une base orthogonale, mais non orthonormale, on obtient la formule suivante
pour le projeté orthogonale de y sur F :
Xm
bi bi
z= y, · .
i=1
kb i k kb ik
3. Si y ∈ F , son projeté est bien entendu lui-même, et on obtient, pour une b.o.n. (b1 , . . . , bm ) de
F :
m
X
y= hy, bi i bi .
i=1
Ainsi, on retrouve l’expression des coordonnées d’un vecteur y dans une base orthonormale.
Vect(e1 , . . . , ek ) = Vect(f1 , . . . , fk ).
Cette famille peut être construite explicitement par la description récursive suivante :
X k−1
e1 uk
f1 = et ∀k ∈ [[2, n]], fk = , où uk = ek − hek , fi i fi .
ke1 k kuk k i=1
Ainsi, pour tout k ∈ [[1, n]], (f1 , . . . , fk ) est une b.o.n. de Vect(e1 , . . . , ek ). En particulier, si initialement,
(e1 , . . . , en ) est une base de E, alors (f1 , . . . , fn ) en est une base orthonormale.
Remarque 25.2.28
Le procédé de Gram-Schmidt construit donc à partir d’une base quelconque une base orthonormale qui
préserve le drapeau et les orientations intermédiaires.
188 CHAPITRE 25. ESPACES PRÉHILBERTIENS RÉELS
Exemples 25.2.29 1 0
1. Base orthonormale de F = Vect 1 , 1
0 1
2. Orthonormalisée de Schmidt de (1, X) dans Rn [X] muni de :
Z 2
hP, Qi = P (t)Q(t) dt.
0
Proposition 25.3.4
Soit E un espace euclidien, et F et G deux sous-espaces.
1. (F ⊥ )⊥ = F
2. (F ∩ G)⊥ = F ⊥ + G⊥ .
Corollaire 25.3.6
Soit E un espace euclidien, et F1 , . . . , Fp des sous-espaces vectoriels de E, deux à deux orthogonaux.
Alors la somme F1 + · · · + Fp est directe, et on obtient une base orthonormale de F1 ⊕ · · · ⊕ Fp en
juxtaposant des bases orthonormales des espaces F1 , . . . , Fp .
III Espaces euclidiens 189
Corollaire 25.3.7
Soit E un espace euclidien, F un sous-espace vectoriel de E, et F ⊥ son supplémentaire orthogo-
nal. Soit (b1 , . . . , bp ) une base orthonormale de F et (c1 , . . . , cq ) une base orthonormale de F ⊥ . Alors
(b1 , . . . , bp , c1 , . . . , cq ) est une base orthonormale de E.
On a déjà vu comment exprimer les coordonnées et la norme dans une base orthonormale :
Enfin, l’expression de la matrice du produit scalaire dans la base B permet de caractériser facilement les
bases orthonormales.
hx, yi = tXY,
Théorème 25.3.11 (propriété des matrices de passage d’une b.o.n. à une autre)
Soit B et C deux b.o.n. de E. Soit P = [B → C] la matrice de passage de la base B à la base C. Alors :
t
P P = In = P tP, donc: P −1 = tP.
Une matrice orthogonale peut se caractériser également par l’orthonormalité de ses colonnes :
Théorème 25.3.15 (Caractérisation des matrices de passage entre b.o.n. par orthogonalité)
Soit E un espace euclidien.
1. Toute matrice de passage d’une b.o.n. de E à une autre b.o.n. de E est une matrice orthogonale.
2. Réciproquement, soit B une b.o.n. de E, et P une matrice orthogonale. Alors il existe une unique
base C telle que P soit la matrice de passage de B à C, et cette base C est une b.o.n. de E.
Le choix d’une matrice orthogonale P telle que det(P ) = −1 définit alors une bijection de SO(n) dans
O− (n) = O(n) \ SO(n) par Q 7→ P Q.
III Espaces euclidiens 191
Définition 25.3.20
Soit E un espace euclidien, et F un sous-espace vectoriel de E. Soit x ∈ E. On dit qu’un vecteur y de
E est un projeté orthogonal de x sur F si et seulement si :
(i) y ∈ F
(ii) x − y ∈ F ⊥ .
Comme nous l’avons vu plus haut, étant donnée une base orthonormale d’un sous-espace de dimension
finie F de E, on dispose d’une formule simple de projection orthogonale, assurant l’existence et l’unicité
de ce projeté. Comme nous avons montré entre temps que tout espace euclidien de dimension finie admet
une b.o.n., on peut rééxprimer ce théorème ainsi, en se limitant au cas euclidien (assurant l’hypothèse de
la dimension de F ) :
Proposition 25.3.23
Évidemment, pF est un projecteur.
Définition 25.3.24
Rappel : soit p un projecteur quelconque de E. Alors idE − p est un projecteur de E, appelé projecteur
associé de p.
• Première méthode : trouver une b.o.n. de F , et utiliser la formule donnant le projeté à l’aide
d’une b.o.n.
• Deuxième méthode : trouver une b.o.n. de F ⊥ et projeter sur F ⊥ puis passer au projecteur
associé
Les méthodes sont symétriques. Les calculs seront d’autant plus longs que la dimension de l’espace
sur lequel on projette est grande. Ainsi, on adoptera la première méthode plutôt lorsque dim(F ) 6
dim(F ⊥ ), et la seconde dans le cas contraire.
∀y ∈ F, kx − pF (x)k 6 kx − yk,
Définition 25.3.28
On dit que pF (x) est la meilleure approximation de x dans F . On appelle distance de x à F le réel
suivant :
d(x, F ) = kx − pF (x)k = min kx − yk.
y∈F
IV Géométrie affine
Comme vous le savez pour l’avoir déjà utilisé en physique, un plan (non vectoriel) peut être défini par la
donné d’un de ses points et d’un vecteur normal. Cela nécessite pour commencer une définition rigoureuse
du cadre de la définition affine.
Il faut voir E comme un ensemble de points sur lequel un ensemble T de vecteurs agit par translation.
Proposition 25.4.2
Soit E un espace affine attaché à T . Soit x ∈ E. L’application t 7→ t + x est une bijection de T sur E.
IV Géométrie affine 193
La loi externe de l’espace affine E est donc donnée par une relation du type B = A + −
→
u , où A et B sont
→
−
deux points de l’espace affine et u un élément de l’espace vectoriel.
Notation 25.4.6
−−→
Soit A et B deux points de l’espace affine A. On notera AB l’unique vecteur −
→
u de E tel que B = A+ −
→
u.
−−→ −−→
Ainsi, AB est entièrement déterminé par la relation B = A + AB.
τt (X) = {t + x, x ∈ X} = {y ∈ A | ∃x ∈ X, y = t + x}.
Cette définition est indépendante d’une correspondance stricte entre les éléments de l’espace affine et les
éléments de l’espace vectoriel, et reste vraie dans un espace affine général. Dans le cas de la structure
affine usuelle d’un espace vecoriel, les points et les vecteurs étant assimilés, la description précédente
correspond à l’espace obtenu par translation de V par le vecteur x.
194 CHAPITRE 25. ESPACES PRÉHILBERTIENS RÉELS
Lemme 25.4.9
Soit F un sous-espace affine obtenu d’un espace vectoriel V par translation de x0 . Alors pour tout
x ∈ F, F = x + V .
Proposition 25.4.11
Soit F un sous-espace affine de E de direction V , et A ∈ F . Alors pour tout point B de E, B ∈ F ⇐⇒
−−→
AB ∈ V .
Certains auteurs définissent parfois la notion de sous-variété affine : il s’agit d’un sous-espace affine, ou
de l’ensemble vide. Ainsi, l’intersection de sous-variétés affines est toujours une sous-variété affine.
Un théorème important fournissant des sous-espaces affines (et on en a déjà vu des cas particuliers) est
le suivant :
IV.2 Barycentres
Nous voyons maintenant quelques propriétés des sous-espaces affines liés aux barycentres.
Remarque 25.4.18
L’addition n’est définie que dans l’espace vectoriel E, et non dans l’espace affine. Il faut donc revenir à
des vecteurs pour définir une combinaison de points. La réexpression précédente peut être vue comme
définition d’une combinaison de points, relativement à un choix d’une origine O.
Il est fréquent de normaliser les poids de sorte que λ1 + · · · + λn = 1. Si cette égalité est satisfaite, le
barycentre se réécrit simplement :
Xn
A= λi Ai .
i=1
Évidemment, vous aurez compris qu’il ne s’agit de rien d’autre que d’une moyenne pondérée (avec pos-
sibilité d’avoir des poids négatifs aussi).
Lemme 25.4.19
La définition du barycentre est indépendante du choix de l’origine O.
{λ1 A1 + · · · + λn An | λ1 + · · · + λn = 1}
Tout sous-espace affine d’un espace de dimension finie peut même être retrouvé ainsi, en partant d’un
ensemble de point de cardinal égal à un de plus que la dimension de son espace directeur :
Par exemple, une droite passant par A et B correspond au translaté par A de la droite vectorielle dirigée
−−→
par AB (ce vecteur en est donc une base). La construction précédente affirme que (AB) est alors l’ensemble
des barycentres de A et B. Cela fournit la paramétrisation usuelle de la droite (AB) :
IV.3 Repères
Proposition 25.4.25
Soit E un espace affine de dimension n muni d’un repère. L’application qui à A associe le vecteur de
ses coordonnées est une bijection de E dans Rn .
La donnée donnée d’un vecteur normal et de A permet de trouver facilement une équation de l’hyperplan
dans une base orthonormale, et réciproquement :
B ∈ H ⇐⇒ a1 x1 + · · · + an xn = b,
−−→
où [OB]B = (x1 , . . . , xn ).
Exemples 25.4.30
Donner une description par point et vecteur normal dans les cas suivants :
1. D est la droite de R2 d’équation y = 3x − 1
2. P est le plan de R3 d’équation x + 2y + z = 2.
∀x ∈ E, kf (x)k = kxk.
Ainsi, une isométrie est par définition un endomorphisme conservant la norme. La notation O(E) est
très voisine de celle utilisée pour désigner le groupe orthogonal. Cela n’a rien d’anodin, comme on le
constatera plus tard.
Exemples 26.1.3
1. IdE , −IdE
2. Dans R2 muni de la structure eulidienne
! canonique, les endomorphismes
! canoniquement associés
cos(θ) − sin(θ) cos(θ) sin(θ)
aux matrices et .
sin(θ) cos(θ) sin(θ) − cos(θ)
3. Les symétries orthogonales par rapport à un sous-espace F , explicitement données en fonction
de la projection orthogonale par sF = 2pF − idE .
4. En particulier, les reflexions (symétries par rapport à un hyperplan)
5. Les projecteurs orthogonaux ?
Sans avoir défini correctement la notion d’angle entre deux vecteurs, mais par analogie à la situation bien
connue de R2 , cette propriété est à voir comme une propriété de conservation de l’angle (non orienté), en
plus de la norme (obtenue pour x et y). En particulier, on a la conservation de l’orthogonalité : si x⊥y
alors u(x)⊥u(y). Cela explique la seconde terminologie utilsiée pour désigner les isométries.
On peut obtenir une caractérisation par l’orthogonalité de la sorte, mais en rajoutant une information
permettant de récupérer la conservation des normes, dans toutes les directions.
∼
Ainsi, le choix d’une base orthonormale B de E détermine un isomorphisme (de groupes) O(E) −→ O(n).
Via cet isomorphisme, on peut considérer le sous-groupe de O(E), image réciproque du sous-groupe SO(n)
des matrices orthogonales positives, c’est-à-dire les isométries u telles que det(MatB(u) ) = 1, ou, de façon
équivalente, par définition du déterminant d’un endomorphisme, telles que det(u) = 1
II Isométries vectorielles en dimension 2 201
On a de plus une règle simple pour le produit de matrices de SO(2). En notant, pour tout θ ∈ R,
!
cos(θ) − sin(θ)
R(θ) = ,
sin(θ) cos(θ)
on obtient :
Dans R2 muni de son produit scalaire canonique, cette définition correspond bien à la définition géomé-
trique élémentaire et intuitive d’une rotation de centre 0 et d’angle θ. Son effet est de tourner la base
canonique d’un angle θ.
Remarque 26.2.6
Si on décide d’inverser l’orientation de E, cela a pour effet sur la rotation de changer son angle θ en
−θ.
Les règles de produit matriciel dans SO(2) amènent directement les règles de composition des rotations,
dont l’interprétation géométrique est assez intuitive :
Nous pouvons définir la notion d’angle orienté entre deux vecteurs grâce aux rotations. Pour cela, nous
utilisons le lemme suivant :
Lemme 26.2.8
Soit E un espace euclidien orienté, et soit x et y deux vecteurs de norme 1 de E. Il existe une unique
rotation ρ telle que ρ(x) = y.
Des règles de composition des rotations découlent immédiatement les trois premières des règles suivantes
sur les angles :
Nous voyons maintenant comment déduire de toutes les définitions ci-dessus l’expression du produit
scalaire vue au lycée à l’aide de l’angle entre les vecteurs, ainsi que l’expression du déterminant. Pour
cela, nous introduisons une définition générale, valable en dimension n quelconque.
Une matrice de SO(n) ayant un déterminant égal à 1, la formule de changement de base pour les déter-
minants permet d’affirmer que le déterminant relativement à une base orthonormée d’une famille de n
vecteurs d’un espace euclidien de dimension n ne dépend pas du choix de cette base orthonormale.
[
hx, yi = kxk · kyk · cos (x, y) et [
[x, y] = kxk · kyk · sin (x, y)
Ainsi, cette proposition permet une formalisation plus rigoureuse de la conservation de l’angle par les
isométries, évoquée plus haut à propos de la conservation du produit scalaire : l’expression ci-dessus
affirme en fait la conservation du cosinus de l’angle par une isométrie, donc une conservation de la valeur
absolue de l’angle. La conservation ou non du signe du déterminant distingue alors les cas de conservation
de l’angle orienté ou de passage à l’opposé ; cela distingue donc les isométries positives et les isométries
négatives.
Nous donnons, donc, pour les isométries positives de E de dimension 2 :
\
∀(x, y) ∈ E 2 , (ρ(x), [
ρ(y)) = (x, y).
Lemme 26.2.14
Pour tout θ et θ′ dans R, on a :
(i) S(θ)S(θ′ ) = R(θ − θ′ )
(ii) S(θ)R(θ′ ) = S(θ − θ′ )
(iii) R(θ)S(θ′ ) = S(θ + θ′ ).
Observez que contrairement au cas des rotations, l’angle θ dépend ici du choix de la base orthonormale
choisie.
De façon peu surprenante, les symétries inversent les angles. Pour le démontrer nous utilisons le lemme
suivant :
Lemme 26.2.16
Soit σ une reflexion et ρ une rotation. Alors σ ◦ ρ ◦ σ −1 = ρ−1 .
On obtient
\
∀(x, y) ∈ E 2 , (σ(x), [
σ(y)) = −(x, y).