Cours Alg
Cours Alg
1
Quelques références choisies.
J’utiliserai beaucoup et je recommande comme référence (en particulier pour l’algèbre à l’agrégation) le
Cours d’algèbre, D. Perrin (collection Ellipses)
Sauf les parties D et F, ce livre traite tous les thèmes abordés dans ce cours. Parmi les traités généraux
d’algèbre traitant également l’algèbre linéaire je signale
Algebra, S. Lang (collection Addison-Wesley), très dense et riche.
Cours d’algèbre, R. Godement (collection Hermann), la partie cours est du niveau des deux premières années
d’université mais les exercices permettent d’aller au niveau licence-maı̂trise.
Algebra, M. Artin (collection Prentice-Hall), très pédagogique et attrayant.
Algebra, Birkhoff & MacLane (collection Chelsea), un classique.
Pour approfondir la notion d’action de groupes, les applications à la géométrie citons
Eléments de géométrie, R. Mneimné (collection Cassini) foisonnant et instructif.
Pour une introduction aux représentations de groupes finis, il est difficile de surpasser
Représentations linéaires des groupes finis, J-P. Serre (collection Hermann).
Pour finir, je recommande de jeter un coup d’oeil au volume de l’encyclopédie russe
Basic notions of algebra, I. Shafarevic (collection Springer).
2
A. GROUPES ET ACTIONS ET GROUPES
Une présentation des groupes, de leurs quotients avec des exemples. La notion centrale présentée est celle
d’action de groupe.
Définition.
e si n = 0
x
| .{z
. . x} si n > 0
(n fois)
xn :=
−1
. . x−1}
x
| .{z si n < 0
(|n| fois)
3
Soit G1 et G2 deux groupes. On définit le produit de groupes qui a comme ensemble sous-jacent G1 × G2 par
la loi de composition :
(g1 , g2 ) ∗ (g10 , g20 ) := (g1 g10 , g2 g20 ).
Une application f : G1 → G2 entre deux groupes est un homomorphisme de groupes si elle vérifie
Remarques. Les rotations forment un sous-groupe de Dn isomorphe à Z/nZ. Si r est une rotation et s une
symétrie, alors srs−1 = srs = r−1 (vérifiez-le). On peut utiliser cela pour montrer que le centre de Dn est
trivial si n est impair et d’ordre 2 (engendré par la rotation d’angle π) si n est pair. On peut aussi interpréter
D2 comme le groupe des isométries planes laissant invariant un segment (il est isomorphe à Z/2Z × Z/2Z).
4
Soit H un sous-groupe de G, on définit deux relations d’équivalence par
xRy ⇔ xH = yH ⇔ y −1 x ∈ H
xR0 y ⇔ Hx = Hy ⇔ xy −1 ∈ H
On notera G/H l’ensemble quotient G/R (resp. H\G l’ensemble quotient G/R0 ). Vérifions, par exemple,
que R est une relation d’équivalence. On a x−1 x = e ∈ H donc xRx. Si xRy alors y −1 x ∈ H donc
x−1 y = (y −1 x)−1 ∈ H et yRx. Si xRy et yRz alors y −1 x ∈ H et z −1 y ∈ H donc z −1 x = (z −1 y)(y −1 x) ∈ H
et xRz.
Remarque. Hormis ces relations d’équivalence “jumelles”, la seule autre relation d’équivalence “intéressante”
est la relation de conjugaison : xRy si il existe g ∈ G avec y = gxg −1 . Les classes d’équivalence pour cette
relation s’appelle naturellement classes de conjugaison.
Il faut faire attention qu’en général gH 6= Hg (on verra plus loin que l’égalité n’est vraie pour tout g que
si le sous-groupe H est distingué). Par contre la transformation A 7→ A−1 envoie gH sur Hg −1 donc il y a
une bijection naturelle entre G/H et H\G. Remarquons ensuite que les classes d’équivalence ont toutes le
même cardinal que H. En effet l’application de H vers gH (resp. H.g) qui, à x associe gx (resp. xg) est
visiblement une bijection. On a ainsi démontré le théorème suivant
Théorème. (Lagrange) Soit G un groupe et H un sous-groupe, alors card(G/H) = card(H\G) et
Exemples. On tire facilement que si x ∈ G et G fini, alors l’ordre de g divise card(G). Ainsi, comme (Z/pZ)∗
a pour cardinal p − 1 on en tire que, pour a entier premier avec p, on a ap−1 ≡ 1 mod p, ou encore que pour
tout entier ap ≡ a mod p (“petit théorème” de Fermat). Plus généralement, si on note φ(n) = card(Z/nZ)∗
on obtient que, pour a entier premier avec n, on a aφ(n) ≡ 1 mod p (théorème d’Euler).
Définition. Un sous-groupe H de G est distingué si, pour tout g ∈ G, on a H = gHg −1 .
Remarquons qu’il est équivalent de demander que, pour tout g ∈ G, on ait gH = Hg ou encore que, pour tout
g ∈ G, on ait H ⊂ gHg −1 . Par ailleurs, le noyau d’un homomorphisme f : G → G0 est toujours distingué;
en effet si y ∈ Ker(f ) alors f (xyx−1 ) = f (x)f (y)f (x)−1 = f (x)e0 f (x)−1 = e0 donc xyx−1 ∈ Ker(f ).
Proposition. L’intersection de sous-groupes distingués est un sous-groupe distingué. Si f : G → G0 est un
homomorphisme de groupes et si H 0 / G0 alors f −1 (H 0 ) / G; si H / G alors f (H) / f (G).
Preuve. Immédiat.
Remarquons que dans la dernière partie de la proposition, on ne peut pas conclure que f (H) est distingué
dans G0 , sauf si f est surjective.
Le principal intérêt des sous-groupes distingués est le suivant.
Proposition. Soit H un sous-groupe de G. Il existe une structure de groupe sur l’ensemble G/H telle
que la surjection canonique s : G → G/H soit un homomorphisme si et seulement si le sous-groupe H est
distingué.
Preuve. Supposons qu’une telle structure existe sur G/H alors H est le noyau de l’homomorphisme s : G →
G/H donc est distingué dans G. Supposons inversement H distingué dans G, on est amené à définir une
loi sur G/H par la formule (xH) ∗ (yH) = xyH (pour que s soit un homomorphisme) et le point est de
vérifier que cette formule est bien définie, i.e. que si x0 ∈ xH et y 0 ∈ yH alors x0 y 0 H = xyH. Or on a bien,
puisque H est distingué et x0 = xh, y 0 = yh0 , l’égalité x0 y 0 H = xhyh0 H = xhyH = xhHy = xHy = xyH.
L’application s : G → G/H est surjective et vérifie donc s(x) ∗ s(y) = s(xy); on en tire immédiatement que
G/H muni de la loi ∗ est un groupe.
5
f = fˆ ◦ c si et seulement si H ⊂ Ker(f ). Dans ce cas, si de plus H est un sous-groupe distingué (et donc
G/H un groupe), alors fˆ est un homomorphisme de groupes, fˆ(G/H) = f (G) et Ker(fˆ) = Ker(f )/H.
Preuve. La condition ensembliste garantissant l’existence de fˆ est que s(x) = s(y) entraı̂ne f (x) = f (y). Or
s(x) = s(y) équivaut à xH = yH ou encore x−1 y ∈ H alors que f (x) = f (y) équivaut à f (x−1 y) = e0 ou
encore x−1 y ∈ Ker(f ). La deuxième partie est immédiate sauf peut-être la détermination du noyau de fˆ.
Soit xH un élément de G/H qui soit dans le noyau de fˆ alors f (x) = fˆ(xH) = e0 donc x ∈ Ker(f ) d’où
l’égalité Ker(fˆ) = Ker(f )/H.
Applications. a) Le sous-groupe hxi engendré par un élément x ∈ G est isomorphe soit à Z (on dira que x est
d’ordre infini) soit à Z/nZ avec n ≥ 1 (on dira que x est d’ordre n). En effet d’après le corollaire appliqué
à l’homomorphisme défini par f (m) := xm de Z vers hxi ⊂ G, on a hxi ∼ = Z/ Ker(f ).
b) Le noyau de l’homorphisme G → Aut(G) qui a un élément associe l’automorphisme intérieur associé
est le centre de G, noté Z(G); si l’on note Int(G) le groupe des automorphismes intérieurs, on a donc
Int(G) ∼= G/Z(G).
G×H → H
a b az+b
,z 7→ cz+d
c d
xRy ⇔ ∃g ∈ G, y = g.x
dont les classes d’équivalence G.x = {g.x | g ∈ G} s’appellent les orbites de l’action. L’ensemble quotient
X/R sera noté X/G, l’orbite de x sera notée O(x).
Définitions. Le stabilisateur d’un élément x ∈ X est le sous-groupe de G des éléments qui fixe x, i. e.
Gx = {g ∈ G | g · x = x}. Le noyau d’une action est l’intersection des stabilisateurs de tous les points (c’est
aussi le noyau de l’homomorphisme associé). Une action est dite fidèle si son noyau est trivial, transitive s’il
n’y a qu’un orbite.
6
sur H donnée
Exemples. Le noyau de l’action de SL(2, R) ci-dessus est ±I, l’action
de SL(2, R) est transitive,
a b
le stabilisateur de i ∈ H est SO(2, R) = a, b ∈ R, a2 + b2 = 1 .
−b a
Remarques. Si on dispose d’une action G × X → X, on peut lui associer les actions suivantes:
(a) Pour tout sous-groupe H de G, une action de H sur X.
(b) Si K = ∩x∈X Gx est le noyau de l’action, alors on hérite d’une action de G/K sur X qui est fidèle.
(c) Si P(X) (resp. Pn (X)) désigne l’ensemble des parties de X (resp. l’ensemble des parties de cardinal n)
alors onpeut définir une action de G sur P(X) (resp. Pn (X)) par g · A = {g · a | a ∈ A}.
Formule des classes (1ère forme). X
card(X) = card(C)
C∈X/G
X G = {x ∈ X | ∀g ∈ G, g · x = x} = {x ∈ X | Gx = G}
Un groupe de cardinal une puissance d’un nombre premier p sera appelé un p-groupe.
Corollaire. Soit G un p-groupe agissant sur un ensemble fini X alors
|X G | ≡ |X| mod p.
Exercice. Montrer que si (G : H) = p est le plus petit nombre premier divisant card(G) alors H est distingué
dans G. (Indication : considérer l’action de G sur G/H par translation, introduire l’homomorphisme associé
ρ : G → Sp = Bij(G/H) et montrer que H = Ker(ρ)).
7
Théorème. (Sylow) Soit p un nombre premier et G un groupe de cardinal pr m avec m non divisible par p.
(i) Il existe un sous-groupe P de cardinal pr (un tel sous-groupe s’appelle un p-sous-groupe de Sylow de
G).
(ii) Soit H un p-sous-groupe et P un p-sous-groupe de Sylow de G, alors il existe g ∈ G tel que H ⊂ gP g −1 .
En particulier deux p-sous-groupes de Sylow de G sont conjugués.
(iii) Soit np le nombre de p-sous-groupes de Sylow de G. Alors np ≡ 1 mod p et np divise m.
Preuve. Il s’agit de variations sur le thème des actions de groupes et de la formule des classes.
(i) Considérons l’action de G sur lui-même par translation et l’action induite sur X = Ppr (G). Si R désigne
un ensemble des représentants des classes d’équivalence, on a par la formule des classes
r X
p
Cmpr = |X| = (G : GA ).
A∈R
Admettons provisoirement (voir lemme ci-dessous) que p ne divise pas |X|. Alors il existe une orbite,
disons celle de A0 de cardinal premier avec p. On a donc (G : GA0 ) non divisible par p donc |GA0 | est
divisible par pr . Mais par ailleurs, si l’on choisit a0 ∈ A0 , on peut considérer l’application GA0 → A
définie par g 7→ ga0 qui est clairement injective donc |GA0 | est majoré par pr et divisible par pr donc
égal à pr . Ainsi GA0 est un p-sous-groupe de Sylow. La preuve sera complète grâce au lemme
Lemme. Soit m non divisible par un nombre premier p, alors
r
p
Cmpr ≡ m mod p.
Or si k = ps ` alors (mpr − k)(pr − k)−1 = (mpr−s − `)(pr−s − `)−1 ≡ 1 mod p d’où le lemme.
Une deuxième preuve du lemme consiste à appliquer la formule des classes précédente avec G = Z/pr Z ×
Z/mZ, vérifier que Z/pr Z × {0} est le seul sous-groupe à pr éléments et que les seules parties à pr éléments
qu’il laisse stable sont les Z/pr Z × {x}; toutes ces parties forment une orbite unique de cardinal m, les autres
pr
parties vérifient (G : GA ) ≡ 0 mod p et donc on a bien Cmp r = |Ppr (G)| ≡ m mod p.
(ii) Soit P un p-sous-groupe de Sylow (dont l’existence est maintenant garantie) et H un p-sous-groupe de
G. Nous faisons agir H sur G/P par la formule (h, gP ) 7→ hgP . Comme le cardinal de G/P n’est
pas divisible par p et que H est un p-groupe, on en déduit l’existence d’un point fixe. Donc il existe
g0 ∈ G tel que pour tout h ∈ H on ait hg0 P = g0 P ou encore hg0 ∈ g0 P ou encore h ∈ g0 P g0−1 . Ainsi
H ⊂ g0 P g0−1 ; si de plus H est un p-sous-groupe de Sylow, on a donc égalité.
(iii) Notons X = Sy`p l’ensemble des p-sous-groupes de Sylow de G et np son cardinal. Si P ∈ X alors
gP g −1 est de nouveau un p-sous-groupe de Sylow de G. On dispose ainsi d’une action par conjugaison
de G sur X qui est transitive d’après le résultat précédent. Si P est un p-sous-groupe de Sylow de G,
on a clairement P ⊂ GP puisque P est un sous-groupe, par conséquent
|G| m
np = (G : GP ) = = .
(GP : P )|P | (GP : P )
Ainsi np divise m. Considérons maintenant l’action de P sur Sy`p , toujours par conjugaison. L’élément
P est visiblement fixe; nous allons montrer qu’il est l’unique point fixe et nous pourrons alors conclure
que
np ≡ |Sy`P | ≡ 1 mod p
Soit donc Q ∈ Sy`P et introduisons G0 = hP, Qi le sous-groupe engendré par P et Q (argument dit “de
Frattini”). On constate que P et Q sont encore deux p-sous-groupes de Sylow de G0 et par conséquent
8
sont conjugués dans G0 : il existe y ∈ G0 tel que P = yQy −1 mais Q est fixé par P (par hypothèse) et,
bien sûr, est fixé par Q donc par G0 et on peut conclure que P = Q.
Corollaire. Soit G un groupe fini. Il existe un élément d’ordre p dans G si et seulement si p divise card(G).
Preuve. La nécessité provient du théorème de Lagrange. Supposons que p divise card(G), alors il existe un
p-sous-groupe non trivial H (par exemple un p-sous-groupe de Sylow) et y ∈ H \ {e}. L’élément y est d’ordre
r−1
une puissance de p, disons pr avec r ≥ 1. On voit immédiatement que l’élément x = y p est d’ordre p.
9
A.5. Produit semi-direct.
Nous voulons expliciter un peu et illustrer par des exemples la notion de produit semi-direct. Il s’agit
d’étudier la situation suivante où l’on a un groupe G et deux sous-groupes K et H tels que :
(i) H ∩ K = {e}
(ii) Tout élément g de G s’écrit g = kh avec k ∈ K et h ∈ H (ou encore K.H = G).
Par exemple, si (i) est réalisée et si, de plus, G est fini et card(G) = card(K) card(H) alors la condition (ii)
est aussi vérifiée.
Ces hypothèses entraı̂nent que l’application
f
K ×H −→ G
(k, h) 7−→ kh
est une bijection. Si on suppose de plus que les éléments de H et K commutent, alors f est un isomorphisme
de groupe : on a G ∼ = K × H. C’est évidemment faux en général et l’objet de ce paragraphe est d’étudier
le groupe G dans l’hypothèse où l’un des sous-groupes, disons K est distingué dans G. On verra qu’alors G
est isomorphe à un groupe que l’on peut fabriquer à partir de K et H, l’ensemble sous-jacent étant K × H
mais la loi de groupe étant différente de la loi de groupe produit. On dira que G est un produit semi-direct.
Exercice. Vérifier les assertions suivantes concernant l’application f : K × H → G donnée par (k, h) 7→ kh.
a) l’application est injective si et seulement si H ∩ K = {e}. b) le sous-ensemble K.H n’est pas toujours un
sous-groupe (donner un contre-exemple). c) Si K est distingué (ou H) alors K.H est un sous-groupe. d) f
est un isomorphisme entre K × H et K · H si et seulement si les éléments de K commutent avec ceux de H
et H ∩ K = {e}. e) si H ∩ K = {e} et les deux sous-groupes sont distingués, alors f est un isomorphisme.
Exemples.
1. Considérons dans le groupe S3 les sous-groupes K = A3 et H = {id, (1, 2)} alors on a bien K / G et
H ∩ K = {e} ainsi que S3 = K.H mais S3 n’est pas isomorphe à K × H (qui est commutatif).
2. Soit Dn le groupe (de cardinal 2n) des isométries d’un polygone régulier à n côtés. La rotation ρ de
centre O le centre du polygone et d’angle 2π/n engendre un sous-groupe K distingué dans Dn et d’ordre n.
Une symétrie s par rapport à une droite passant par O et un sommet engendre un sous-groupe H d’ordre 2
et on a Dn = K.H et H ∩ K = {e}. Cependant Dn n’est pas isomorphe à K × H (qui est commutatif).
3. Soit Af f = Af f (Rn ) le groupe des transformations affines, c’est-à-dire:
Af f := {f : Rn → Rn | f (X) = AX + b , A ∈ GL(n, R) , b ∈ Rn }
Rappelons que GL(n, R) désigne le groupe des matrices n × n inversibles à coefficient dans le corps R. Le
sous-groupe des translations K = {f ∈ Af f | f (X) = X + b} est distingué dans Af f et le sous-groupe des
applications linéaires H = {f ∈ Af f | f (0) = 0} est tel que Af f = K.H et H ∩ K = {id} ; cependant Af f
n’est pas isomorphe à K × H.
Nous allons maintenant construire et définir le produit semi-direct et voir que ces trois exemples sont des
produits semi-directs.
Premier point de vue (description). On suppose K / G et les conditions (i) et (ii) vérifiées. Pour décrire le
groupe G, on utilise la bijection f : K ×H → G pour définir une nouvelle loi de groupe sur l’ensemble K ×H ;
on pose (k, h) ∗ (k 0 , h0 ) = f −1 (f (k, h).f (k 0 , h0 )). On vérifie alors immédiatement que f ((k, h) ∗ (k 0 , h0 )) =
f (k, h).f (k 0 , h0 ). On peut calculer ∗ en observant que (kh).(k 0 h0 ) = k(hk 0 h−1 )hh0 et que hk 0 h−1 ∈ K puisque
K est distingué dans G. Si l’on note φh (x) = hxh−1 on obtient :
Ceci suggère que, inversement, on puisse reconstruire le groupe G comme l’ensemble K × H muni de la loi
définie par (1) ; nous allons voir qu’il en est bien ainsi.
10
Deuxième point de vue (construction). On considère deux groupes K et H avec un homomorphisme φ :
H → Aut(K) (ainsi H agit sur K) ; on définit sur l’ensemble K × H la loi de composition :
Remarquons que cette loi est la loi de groupe produit “ordinaire” si et seulement si φ est l’homomorphisme
“trivial” : ∀h ∈ H, φ(h) = id.
K ×φ H ou K >/φ H.
Preuve. 1) L’élément neutre est (e, e0 ) (où e est l’élément neutre de K et e0 celui de H); l’inverse de (h, k)
est (φ(h−1 )(k −1 ), h−1 ). On vérifie enfin l’associativité :
((k, h) ∗ (k 0 , h0 )) ∗ (k 00 , h00 ) = (kφ(h)(k 0 ), hh0 ) ∗ (k 00 , h00 ) = (kφ(h)(k 0 )φ(hh0 )(k 00 ), hh0 h00 )
alors que
(k, h) ∗ ((k 0 , h0 ) ∗ (k 00 , h00 )) = (kφ(h)(k 0 φ(h0 )(k 00 )), hh0 h00 ) = (kφ(h)(k 0 )φ(hh0 )(k 00 ), hh0 h00 )
Exercices.
a) Montrer que K >/φ H est commutatif si et seulement si K et H sont commutatifs et φ trivial (produit
“direct”).
b) Plus généralement, décrire le centre de K >/φ H en terme de φ et des centres de K et H.
c) Soient H, K deux sous-groupes distingués de G avec K ∩ H = {e}, montrer que les éléments de K et et
H commutent et en déduire que le groupe engendré par H et K est isomorphe à K × H.
Illustrations. Reprenons les trois exemples du début et explicitons φ sur chacun de ces exemples.
1. Notons τ = (1, 2) et ρ = (1, 2, 3) ∈ S3 alors τ ρτ −1 = (2, 1, 3) = (1, 3, 2) = ρ−1 donc la conjugaison par τ
agit sur A3 = {id, (1, 2, 3), (1, 3, 2)} = {id, ρ, ρ−1 } comme j : x 7→ x−1 . Si l’on pose φ(τ ) = j, φ(id) = id on
obtient un homomorphisme φ : H → Aut(A3 ) tel que
S3 ∼
= A3 >/φ Z/2Z
11
Exercice. Décrire un homomorphisme φ : Z/2Z → Aut(An ) tel que Sn ∼
= An >/φ Z/2Z.
2. Si ρ est la rotation plane d’angle 2π/n, de centre l’origine, et s une symétrie (par rapport à la bissectrice
d’un des angles formés par les côtés d’un polygone régulier à n côtés), un calcul laissé en exercice montre
que sρs−1 = sρs = ρ−1 . Si l’on désigne par φ l’homomorphisme (de Z/2Z dans Aut(Z/nZ)) qui associe à 1
l’automorphisme φ(1) : x 7→ −x on obtient :
Dn ∼
= Z/nZ >/φ Z/2Z.
3. Considérons l’action de GL(2, R) sur R2 donnée par (A, X) 7→ AX (où A est une matrice inversible et X
un vecteur de R2 ) ; cette action induit un homomorphisme φ : GL(2, R) → Aut(R2 ) et on obtient ainsi :
Af f ∼
= R2 >/φ GL(2, R)
On voit qu’il est important en général de déterminer le groupe d’automorphisme d’un groupe K pour étudier
ensuite les homomorphismes H → Aut(K) et les produits semi-directs associés ; c’est en général assez difficile
et nous le ferons ici seulement dans le cas des groupes finis abéliens de la forme K = (Z/nZ)r .
En effet soit f ∈ Aut(Z/nZ) alors x = f (1) doit être un générateur de Z/nZ et f est entièrement déterminé
par f (1) (puisque f (n) = nx). Inversement si x ∈ (Z/nZ)∗ alors f (n) = nx définit bien un automorphisme
de Z/nZ. Enfin on vérifie sans difficulté que si f et g sont des automorphismes de Z/nZ alors (g ◦ f )(1) =
g(1)f (1).
Proposition. Le groupe Aut ((Z/pZ)r ) est isomorphe au groupe GL(r, Z/pZ) des matrices inversibles de
taille r × r à coefficients dans Z/pZ.
Preuve. En effet un homomorphisme de groupe f de (Z/pZ)r vers (Z/pZ)r est forcément Z/pZ-linéaire
puisque f (nx) = nf (x). Dire que f est bijectif équivaut à dire que la matrice associée est inversible.
Exercice. Montrer que Aut ((Z/nZ)r ) est isomorphe au groupe GL(r, Z/nZ) des matrices inversibles de taille
r × r à coefficients dans Z/nZ. Plus généralement, pouvez-vous décrire le groupe Aut (Z/pZ)r × (Z/p2 Z)s
ou encore Aut ((Z/pZ)r1 × . . . × (Z/pm Z)rm ) ?
Application. Nous allons déterminer les classes d’isomorphismes de groupes de cardinal pq où p et q sont
des nombres premier distincts.
Supposons p < q, alors les théorèmes de Sylow nous indique qu’il existe un unique q-Sylow (on ne peut avoir
p ≡ 1 mod q) que l’on désignera par K ; appelons H un p-Sylow et φ : H → Aut(K) l’action par conjugaison
de H sur K. Comme K est isomorphe à Z/qZ et H est isomorphe à Z/pZ, on a H ∩ K = {e} et ensuite
G = K.H et G ∼ = K >/φ H. On doit donc étudier les homomorphismes de Z/pZ dans Aut(Z/qZ) = (Z/qZ)∗ .
On doit alors distinguer deux cas.
1er cas : q 6≡ 1 mod p. Dans ce cas le seul homomorphisme φ : Z/pZ → Aut(Z/qZ) = (Z/qZ)∗ est trivial
donc G ∼= Z/qZ × Z/pZ ∼ = Z/pqZ
2ème cas : q ≡ 1 mod p. Dans ce cas, le groupe Aut(Z/qZ) = (Z/qZ)∗ contient des éléments d’ordre p et
il y a donc un homomorphisme non trivial φ : Z/pZ → Aut(Z/qZ) = (Z/qZ)∗ et l’on peut donc fabriquer
le produit semi-direct G ∼= Z/qZ >/φ Z/pZ. On obtient ainsi deux groupes de cardinal pq non isomorphes
(on laisse en exercice, voir lemme à la fin, la vérification du fait que deux homomorphismes non triviaux
φ : Z/pZ → Aut(Z/qZ) = (Z/qZ)∗ induisent des groupes isomorphes).
Remarque : Lorsque p = 2, on a toujours q ≡ 1 mod 2 et on retrouve les deux groupes Z/2qZ et Dq . Lorsque
p = 3 on s’aperçoit par exemple qu’il n’y a qu’un groupe de cardinal 15 (c’est Z/15Z) alors qu’il y en a deux
de cardinal 21 (ce sont Z/21Z et le produit semi-direct Z/7Z >/φ Z/3Z).
12
Exercices. Soit p un nombre premier impair, on se propose de décrire les groupes de cardinal p2 et p3 .
A1) Soit G un groupe de cardinal p2 , montrer que, ou bien G est cyclique (et isomorphe à Z/p2 Z), ou bien
tous les éléments différents de l’élément neutre sont d’ordre p.
A2) Soit G un groupe non cyclique d’ordre p2 , soit K un sous-groupe d’ordre p, montrer que K / G et qu’il
existe H sous-groupe d’ordre p tel que K ∩ H = {e}. En déduire que G est un produit semi-direct de Z/pZ
par Z/pZ.
A3) Montrer que tout groupe de cardinal p2 est commutatif et isomorphe à Z/p2 Z ou Z/pZ × Z/pZ.
1 1
B1) Montrer que la matrice T = est un élément d’ordre p de GL(2, Z/pZ). En déduire que
0 1
l’application φ de Z/pZ dans GL(2, Z/pZ) définie par m 7→ T m est un homomorphisme de groupes.
B2) Vérifier que le groupe G1 = (Z/pZ)2 >/φ Z/pZ (où φ est défini comme en B1) est de cardinal p3 , n’est
pas commutatif bien que tous ses éléments distincts de e soient d’ordre p.
∗
C1) Montrer que la classe de p + 1 modulo p2 est d’ordre p dans le groupe Z/p2 Z et en déduire que
l’application φ de Z/pZ dans (Z/p2 Z)∗ définie par m 7→ (1 + p)m est un homomorphisme de groupes.
C2) Montrer que le groupe G2 = Z/p2 Z >/φ Z/pZ (où φ est défini comme en C1) n’est ni commutatif ni
isomorphe à G1 .
D) On donne des indications pour montrer qu’un groupe de cardinal p3 est isomorphe à l’un des cinq groupes
suivants (N.B. p est supposé impair) :
ou G5 = Z/p3 Z
Si G non cyclique, montrer que ou bien il existe K sous-groupe cyclique de cardinal p2 ou bien tous les
éléments (6= e) sont d’ordre p et alors il existe K sous-groupe isomorphe à (Z/pZ)2 ; dans les deux cas K / G
avec G/K ∼ = Z/pZ. Montrer (c’est la partie difficile) qu’il existe un sous-groupe H de cardinal p tel que
K ∩ H = {e} et en déduire que G ∼ = K >/φ Z/pZ et conclure en étudiant les homomorphismes de Z/pZ
vers Aut(K) = (Z/p2 Z)∗ ou GL(2, Z/pZ). Si tous les éléments sont d’ordre p il n’y a pas de difficulté (et
le fait que p est impair n’intervient pas) sinon choisir x générateur de K ∼ = Z/p2 Z et y ∈ / K. On montre
qu’il existe c tel que y = x y soit d’ordre p et alors le sous-groupe engendré par y 0 fournit le sous-groupe H
0 c
yxy −1 = xa et y p = xb
2
parce que < x >= K est distingué et parce que G/K est d’ordre p. On observe que b = pb0 car e = y p = xpb
m
et a ≡ 1 mod p car ap ≡ 1 mod p2 . On en tire d’abord que xc y m = y m xa c puis enfin que
p−1
(xc y)p = xb+c(a +...+a+1)
.
On doit alors résoudre l’équation b + c(ap−1 + . . . + a + 1) = 0 dans Z/p2 Z sachant que p ne divise pas a
mais divise b. Il suffit que ap−1 + . . . + a + 1 6≡ 0 mod p2 . On a a = 1 + pr et donc ap−1 + . . . + a + 1 ≡
p + p2 r(p − 1)/2 ≡ p 6≡ 0 mod p2 (ceci est vrai car p est impair !).
Pour la vérification que tous les produits semi-directs non triviaux sont isomorphes à G1 ou G2 voir
l’application du lemme plus loin.
E) Le groupe des matrices 3 × 3 triangulaires supérieures avec des 1 sur la diagonale à coefficients dans
Z/pZ est non commutatif de cardinal p3 . Si p est impair, est-il isomorphe à “G1 ” ou “G2 ” (Cf. exercice
précédent); si p = 2, est-il isomorphe à “D4 ” ou “H” (Cf. exercice suivant).
Attention : Si K est un sous-groupe distingué de G, il n’est pas toujours vrai que G soit isomorphe à
K >/φ G/K ; pour cela il faut qu’il existe un sous-groupe H tel que la surjection canonique s : G → G/K
donne un isomorphisme H → G/K.
13
Exemple. Soit K l’unique sous-groupe de cardinal p dans G = Z/p2 Z. On a G/H isomorphe à Z/pZ mais
G n’est pas isomorphe à un produit demi-direct H >/φ Z/pZ. Comme autre exemple moins trivial on peut
considérer le groupe quaternionique
On vérifie que tous les sous-groupes sont distingués mais si on prend un des sous-groupes d’ordre 4 (engendré
par ±i, ±j ou ±k) le quotient de H par ce sous-groupe est Z/2Z sans que l’on puisse écrire H comme produit
semi-direct.
Exercice. Montrer qu’il y a 5 groupes d’ordre 8 (à isomorphisme près): Z/8Z, Z/4Z × Z/2Z, (Z/2Z)3 , D4
(le groupe des isométries du carré) et H (le groupe quaternionique précédent).
Applications. 1) Soit
M une matrice d’ordre p dans GL(2, Z/pZ) alors il existe une matrice inversible P telle
1 1
que M = P P −1 donc le produit semi-direct non trivial (Z/pZ)2 >/φ Z/pZ associé à φ(m) = M m
0 1
1 1
est isomorphe à celui obtenu en prenant M0 = . 2) Soit y un élément d’ordre p dans (Z/p2 Z)∗
0 1
alors y = (p + 1)a avec a premier avec p donc le produit semi-direct non trivial Z/p2 Z >/φ Z/pZ associé à
φ(m) = y m ∈ (Z/p2 Z)∗ est isomorphe à celui obtenu en choisissant y = p + 1; en effet β(m) = am définit un
automorphisme de Z/pZ puisque a est premier avec p.
Attention. L’énoncé du lemme ne dit pas que ce sont les seuls isomorphismes entre produits semi-directs. Par
exemple considérons φ : Z/2Z → Int(S3 ) l’homorphisme qui associe à 1 la conjugaison par une transposition,
alors φ est non trivial mais pourtant Sn >/φ Z/2Z est isomorphe à Sn × Z/2Z (vérification “à la main” ou
voir l’exercice suivant).
Exercice. Soit x un élément d’ordre r dans un groupe G. On note φ : Z/rZ → Aut(G) l’homomorphisme
qui à 1 associe l’automorphisme intérieur associé à x (i.e. φ(1)(g) = xgx−1 ). Le produit semi-direct
G >/φ Z/rZ n’est pas trivial, montrer néanmoins que l’application f : G >/φ Z/rZ → G × Z/rZ définie par
f (g, m) = (gxm , m) est un isomorphisme de groupes
Exercice. Soit N = pm ms
1 . . . ps
1
un entier impair avec sa décomposition en facteurs premiers. Montrer que
le sous-groupe U := {a ∈ (Z/N Z)∗ | a2 = 1} est isomorphe à (Z/2Z)s . En déduire une description des
différents produits semi-directs Z/nZ >/φ Z/2Z. (Indication : il y a, à isomorphisme près, 2s tels groupes,
dont Z/N Z et DN ). Comment doit-on modifier l’énoncé si N = 2m0 pm ms
1 . . . ps
1
?
14
A.6. Groupes abéliens.
Remarquons tout de suite qu’un groupe abélien est la même chose qu’un Z-module (i.e. un “espace vectoriel”
sur l’anneau Z). Comme exemples de groupes abéliens nous citerons au départ Z, Z/nZ, (Z/nZ)∗ , Q, Q/Z.
Un groupe abélien est de type fini s’il possède un nombre fini de générateurs; il est dit libre s’il possède
une base sur Z, libre de rang fini s’il possède une base finie (et est donc isomorphe à Zr ). Les groupes
abéliens en général ne sont pas libres, en effet Z/nZ, par exemple, ne peut pas être libre. Dans le groupe
Q deux éléments sont toujours liés mais le groupe n’est pas isomorphe à Z. Un élément x ∈ G est dit de
torsion s’il existe m ≥ 1 tel que xm = e. Tous les éléments de Q/Z sont de torsion sans que le groupe
soit fini, donc il ne peut pas être de type fini. L’ensemble des éléments de torsion dans G abélien forme
un sous-groupe Gtorsion := {g ∈ G | ∃m ≥ 1, g m = e}; en effet si x est d’ordre m et y d’ordre n alors
(xy)mn = (xm )n (y n )m = e. Observons d’ailleurs que, si de plus m et n sont premiers entre eux, alors l’ordre
de xy est exactement mn; en effet si (xy)k = e, alors xkn = e (resp. y km = e) donc m divise kn (resp. n
divise km) donc m divise k (resp. n divise k) et enfin mn divise k.
Notation. Dans ce chapitre nous noterons (sauf mention contraire) additivement les groupes abéliens;
l’élément neutre de (G, +) sera noté 0.
Les groupes Z et Z/nZ (rappels).
Le groupe Z est l’unique groupe (à isomorphisme près) qui est cyclique (engendré par un élément) et infini.
Tous ses sous-groupes sont du type mZ pour m ≥ 0. L’ensemble Z est également muni d’une multiplication
qui en fait un anneau commutatif. Dans cet anneau on a la notion de divisibilité et l’on suppose connue la
notion de PGCD et PPCM (que l’on révisera dans le cadre plus général des anneaux). Dans le cas de Z on
voit que la notion d’idéal (voir le chapitre sur les anneaux) coı̈ncide avec celle de sous-groupe. On peut en
déduire facilement le théorème suivant
Théorème. (Bézout) Soit m, n ∈ Z et soit d leur PGCD, alors il existe a, b ∈ Z tels que
d = am + bn.
Le groupe Z/nZ est l’unique groupe cyclique à n éléments (à isomorphisme près) i.e. engendré par un
élément d’ordre n. On peut déjà étudier ses générateurs
Proposition. Soit m ∈ Z et m̄ sa classe dans Z/nZ, les trois propriétés suivantes sont équivalentes
(i) L’élément m̄ est un générateur de Z/nZ.
(ii) Les éléments m et n sont premiers entre eux.
(iii) L’élément m̄ est inversible modulo n, c’est-à-dire qu’il existe m0 ∈ Z tel que mm0 ≡ 1 mod n ou encore
m̄m̄0 = 1 ∈ Z/nZ.
Preuve. Supposons que m̄ engendre Z/nZ alors il existe m0 ∈ Z tel que m0 m̄ = 1 ∈ Z/nZ; ainsi mm0 ≡
1 mod n ce qui signifie que m est inversible modulo n. Si mm0 ≡ 1 mod n alors mm0 = 1 + an et donc m
est premier avec n. Si m est premier avec n alors, d’après le théorème de Bézout, il existe a, b tels que
am + bn = 1 donc am̄ = 1 ∈ Z/nZ et donc m̄ engendre Z/nZ.
En particulier on voit que l’ensemble des éléments inversibles de Z/nZ, qui forment automatiquement un
groupe, est égal à
(Z/nZ)∗ = {m̄ ∈ Z/nZ | m est premier avec n}.
On note φ(n) := card ((Z/nZ)∗ ) l’indicatrice d’Euler. On en déduit facilement que, si p est premier, φ(pr ) =
pr − pr−1 = (p − 1)pr−1 . Le calcul en général de φ(n) se fait grâce au lemme classique suivant.
15
Proposition. (Lemme chinois) Soit m, n ∈ Z, supposons m et n premiers entre eux, alors les groupes Z/mnZ
et Z/mZ × Z/nZ sont naturellement isomorphes. De plus cet isomorphisme est aussi un isomorphisme
d’anneaux et, par conséquent induit un isomorphisme entre (Z/mnZ)∗ et (Z/mZ)∗ × (Z/nZ)∗ .
Preuve. Considérons l’application f : Z → Z/mZ × Z/nZ donnée par x 7→ (x mod m, x mod n). C’est un
homomorphisme de groupe de noyau PPCM(m, n)Z, d’où une injection
Comme m et n sont supposés premiers entre eux, on a PPCM(m, n) = mn et, pour des raisons de cardinalité,
l’homomorphisme fˆ doit être un isomorphisme. De manière générale, si A et B sont des anneaux, on a
(A × B)∗ = A∗ × B ∗ d’où la deuxième assertion.
Comme application, on peut en tirer la formule (que nous utiliserons plus bas)
X
n= φ(d).
d|n
En effet on écrit Z/nZ comme union (disjointe) des ensembles d’éléments d’ordre d pour d divisant n. Le
nombre de ces éléments est le nombre de générateurs de l’unique sous-groupe de cardinal d, et comme ce
dernier est isomorphe à Z/dZ, le nombre de générateurs est φ(d).
Les groupes (Z/nZ)∗ .
On notera (à titre d’exception dans ce chapitre) multiplicativement la loi du groupe (Z/nZ)∗ . D’après ce
que nous avons vu, si n = pα αs
1 . . . ps alors
1
(Z/nZ)∗ ∼
= (Z/pα ∗ αs
1 Z) × . . . × (Z/ps Z)
1 ∗
et en particulier
s s
Y
αi −1
Y 1
φ(n) = φ(pα αs
pα
1 ) . . . φ(ps ) =
1
i
i
− p i = n 1 −
i=1 i=1
pi
16
bien il en existe un qui engendre alors un sous-groupe cyclique H d’ordre d. Tous les éléments de H sont
solutions de l’équation X d = 1, mais, comme k est un corps commutatif, une telle équation possède au plus
d racines dans k; tous les éléments d’ordre ∼
P d sont donc
P dans H et il en a φ(d) puisque H = Z/dZ. Ainsi ψ(d)
vaut zéro ou φ(d), mais comme n = d | n ψ(d) = d | n φ(d), on voit que ψ(d) = φ(d) pour tout d divisant
n. En particulier ψ(n) = φ(n) ≥ 1, ce qui implique bien que G est cyclique.
Lemme. Soit p premier impair, la classe de p + 1 dans (Z/pα Z)∗ est d’ordre pα−1 .
Preuve du lemme. Montrons d’abord par récurrence la congruence
k
(p + 1)p ≡ 1 + pk+1 mod pk+2 .
k−1 k
Pour k = 0, la congruence est triviale. Supposons donc (p + 1)p = 1 + pk + apk+1 alors (p + 1)p =
k k+1 p k k+1 k+1 k+2
1 + p + ap ≡ 1 + p(p + ap )≡1+p mod p . Pour l’avant-dernière congruence, on a besoin
de p 6= 2; en effet la formule du binôme de Newton fait apparaı̂tre des termes multiples de pkr donc nuls
modulo pk+2 sauf peut-être si r = 2 et k = 1 mais le terme s’écrit alors Cp2 p2 qui est bien nul modulo p3 si
α−1 α−2
p est impair. En particulier, on voit que (p + 1)p ≡ 1 mod pα mais (p + 1)p ≡ 1 + pα−1 6≡ 1 mod pα , ce
α−1 α ∗
qui implique bien que p + 1 est d’ordre p dans (Z/p Z) .
On peut maintenant terminer la preuve de la proposition pour p impair. Soit x ∈ Z tel que x modulo p
engendre (Z/pZ)∗ i.e. est d’ordre p − 1 dans (Z/pZ)∗ ; alors x̄ est d’ordre m(p − 1) dans (Z/pα Z)∗ et donc
y = x̄m est d’ordre exactement p − 1 dans (Z/pα Z)∗ . L’élément y(p + 1) est donc d’ordre pα−1 (p − 1) donc
est un générateur de (Z/pα Z)∗ (car pα−1 et p − 1 sont premiers entre eux).
Lemme. La classe de 5 dans (Z/2α Z)∗ est d’ordre 2α−2 . De plus la classe de −1 n’appartient pas au
sous-groupe engendré par la classe de 5.
Preuve du lemme. On montre d’abord par récurrence que
k
52 ≡ 1 + 2k+2 mod 2k+3 .
k−1 k
La congruence est triviale pour k = 0, supposons donc que 52 = 1 + 2k+1 + a2k+2 alors 52 = (1 + 2k+1 +
α−2
a2k+2 )2 = 1 + 2(2k+1 + a2k+2 ) + 22(k+1) (1 + 2a)2 ≡ 1 + 2k+2 mod 2k+3 . En particulier 52 ≡ 1 mod 2α
α−3
2 α−1 α α−2
mais 5 ≡ 1+2 6≡ 1 mod 2 donc 5 est bien d’ordre 2 . Supposons que 5 ≡ −1 mod 2α alors
β
2β α α−2 α−3
5 ≡ 1 mod 2 donc 2 divise 2β donc 2 divise β ou encore β = γ2α−3 . Comme 5 est d’ordre 2α−2 , on
α−2
peut considérer β comme un entier modulo 2 et donc γ modulo 2. L’entier γ doit être impair donc on peut
α−3 α−3
le supposer égal à 1, c’est-à-dire 52 ≡ 1 mod 2α , mais 52 ≡ 1 + 2α−1 mod 2α donc −1 ≡ 1 + 2α−1 mod 2α
α−1 α α−2 α−1
ou encore 2 + 2 ≡ mod 2 soit 1 + 2 ≡ mod 2 , ce qui n’est pas possible.
Pour la démonstration de la deuxième partie de la proposition, on peut supposer α ≥ 3 (en effet le calcul
de (Z/2Z)∗ et (Z/4Z)∗ est immédiat). La classe de 5 engendre donc un sous-groupe isomorphe à Z/2α−2 Z
et −1 engendre un sous-groupe d’ordre 2 non contenu dans le précédent donc (Z/2α Z)∗ = h5i ⊕ h−1i ∼ =
Z/2α−2 Z × Z/2Z.
Exercice. Montrer que si la classe de x ∈ Z engendre (Z/p2 Z)∗ alors elle engendre aussi (Z/pα Z)∗ (pour p
impair).
Remarque. Le sous-groupe quaternionique H8 = {±1, ±i, ±j, ±k} est un sous-groupe fini du groupe multi-
plicatif du corps H mais n’est pas cyclique (cela ne contredit pas le lemme vu car H n’est pas commutatif).
Théorèmes de structure.
Les produits finis de groupes cycliques sont évidemment abéliens de type fini. Nous allons voir réciproquement
que tout groupe abélien de type fini est en fait isomorphe à un groupe de la forme Zr ×Z/m1 Z×. . .×Z/ms Z.
Toutefois le lemme chinois indique qu’une telle décomposition n’est pas a priori unique. On peut néanmoins
en extraire des éléments invariants ou canoniques.
17
Théorème. Tout groupe abélien G de type fini est produit de groupes cycliques. Plus précisément il existe
r ≥ 0 et a1 , . . . as avec ai ≥ 2 et ai divise ai+1 tels que
G∼ = Zr × Z/a1 Z × . . . × Z/as Z.
De plus les entiers r, s, a1 , a2 , . . . as sont uniques.
Nous allons utiliser dans la preuve un autre théorème de structure, décrivant les sous-groupes de Zr , qui est
démontré au chapitre sur les modules sur les anneaux principaux.
Théorème. Soit H un sous-groupe de Zr alors
(i) Le groupe H est libre de rang s ≤ r.
(ii) Il existe e1 , . . . , er base de Zr et a1 , . . . as ≥ 1 tels que ai divise ai+1 et a1 e1 , . . . as es forment une base
de H.
Preuve (du théorème antérieur). Supposons que G possède n générateurs, alors on en déduit un homomor-
phisme surjectif f : Zn → G et un isomorphisme Zn / Ker(f ) ∼ = G. On applique le théorème précédent à
Ker(f ) et on obtient des ei et ai tels que Zn = Ze1 ⊕ . . . Zen et tels que Ker(f ) = Za1 e1 ⊕ . . . Zam em . D’où
l’on tire aisément
G∼ = Zn / Ker(f ) ∼
= Z/a1 Z × . . . × Z/am Z × (Z)n−m
avec ai divisant ai+1 et ai ≥ 1. En éliminant les facteurs correspondant à ai = 1, on obtient l’existence de
la décomposition annoncée. Montrons maintenant l’unicité. Nous allons utiliser le
Lemme. Soit M ≥ 1 alors le sous-groupe M Z/nZ est cyclique de cardinal n/ PGCD(n, M ); le quotient
(Z/nZ)/M (Z/nZ) est cyclique de cardinal PGCD(n, M ).
×M
Preuve. Notons d = P GCD(n, M ) et n = n0 d, M = M 0 d. Considérons la composée Z −→ Z → Z/nZ.
Son noyau est le sous-groupe des x ∈ Z tels que n divise M x ou encore tels que n0 divise x d’où un
isomorphisme entre Z/n0 Z et l’image, c’est-à-dire M Z/nZ. Enfin (Z/nZ)/M (Z/nZ) est cyclique de cardinal
d donc isomorphe à Z/dZ.
Supposons maintenant
0
G∼
= Zr × Z/a1 Z × . . . × Z/as Z ∼
= Zr × Z/b1 Z × . . . × Z/bt Z
avec ai , bi ≥ 2 et ai divise ai+1 , resp. bi divise bi+1 . On commence par choisir un entier M multiple de as et
0
bt alors M G ∼ = Zr ∼
= Zr donc r = r0 . En remplaçant G par Gtorsion on peut maintenant supposer G fini (i.e.
r = r0 = 0). Choisissons p divisant a1 (noter que a1 ≥ 2) alors P GCD(p, ai ) = p et P GCD(p, bi ) = p ou 1
suivant que p divise bi ou non. Donc d’après le lemme G/pG ∼ = (Z/pZ)s ∼ = (Z/pZ)t−card{i | p ne divise pas bi } .
Ainsi s ≤ t et, par symétrie t = s et donc p divise b1 . Ecrivons donc ai = pa0i et bi = pb0i , alors pG ∼ =
Z/a01 Z × . . . × Z/a0s Z ∼
= Z/b01 Z × . . . × Z/b0s Z. par récurrence sur card(G) on en tire que a0i = b0i et donc
ai = bi .
Revenons aux groupes abéliens finis et montrons qu’on peut écrire une autre décomposition canonique.
Théorème. Un groupe abélien fini G est somme directe de ses p-sous-groupes de Sylow. Un p-groupe
abélien est isomorphe à un produit (Z/pZ)m1 × (Z/p2 Z)m2 × . . . × (Z/pr Z)mr avec mi ≥ 0. De plus les mi
sont uniques.
Le groupe G est abélien donc possède un unique p-sous-groupe de Sylow. On voit aisément que celui-ci est
égal à Gp := {x ∈ G | ∃m ≥ 0, pm x = 0}. La première partie du théorème est alors une conséquence du
lemme ci-dessous; la deuxième partie découle directement du théorème de structure précédent.
Lemme. Soit G un groupe de cardinal M N avec M et N premiers entre eux. Soit G1 = {x ∈ G | M x = 0}
et G2 = {x ∈ G | N x = 0}, alors G = G1 ⊕ G2 .
Preuve. D’après le théorème de Bézout, il existe a, b ∈ Z tels que aM + bN = 1. Si x ∈ G1 ∩ G2 alors
x = (aM + bN )x = 0. Si maintenant x ∈ G alors x = bN x + aM x et, comme M N est un exposant pour G,
on a bN x ∈ G1 et aM x ∈ G2 .
Exercice. Soit une décomposition G ∼ = Z/a1 Z × . . . × Z/as Z avec ai ≥ 2 et ai divise ai+1 . Montrer que
l’exposant de G est égal à as et que le nombre minimal de générateurs de G est s.
18
A.7. Le groupe Sn .
Le groupe Sn est le groupe des bijections de l’ensemble [1, n] = {1, 2, . . . , n}, il est isomorphe au groupe des
bijections d’un ensemble fini de cardinal n. Il intervient donc chaque fois qu’un groupe agit sur un ensemble
fini, en particulier dans les questions de combinatoire. D’un autre côté, le groupe Sn est “trop” riche pour
pouvoir être entièrement décrit; par exemple tout groupe fini est sous-groupe d’un Sn : en effet, l’action de
G par translation sur lui-même est fidèle et induit donc une injection de G dans les bijections de G.
Le support d’une permutation σ ∈ Sn est le sous-ensemble {i ∈ [1, n] | σ(i) 6= i}. Le groupe Sn agit
transitivement sur [1, n] et le stabilisateur de n est naturellement isomorphe à Sn−1 donc la formule des
classes nous dit que card(Sn /Sn−1 ) = n d’où l’on tire aisément par récurrence
card(Sn ) = n!
Une première façon de noter les éléments de Sn est simplement d’écrire la liste des images, par exemple
la permutation σ définie par σ(1) = 2, σ(2) = 6, σ(3) = 3, σ(4) = 5, σ(5) = 8, σ(6)= 4, σ(7) = 10,
1 2 3 4 5 6 7 8 9 10
σ(8) = 9, σ(9) = 1, σ(10) = 7, peut être notée σ = . Cette notation
2 6 3 5 8 4 10 9 1 7
est toutefois lourde et ne reflète pas vraiment les propriétés de σ (par exemple : quel est son ordre?). La
situation est un peu similaire à l’écriture d’un nombre entier : l’écriture de la décomposition en facteurs
premiers contient beaucoup plus d’information arithmétique que la donnée du nombre en base 10. Il est
donc utile d’introduire une telle notion pour les permutations.
Définition. Un cycle de longueur m (ou m-cycle) est associé à un sous-ensemble ordonné I = {i1 . . . , im }
et est donné par σ(i1 ) = i2 , . . . , σ(im−1 ) = im , σ(im ) = i1 et, pour tout j ∈
/ I, σ(j) = j. L’ensemble I
s’appelle le support du cycle. On note une telle permutation σ = (i1 . . . , im ). Un cycle de longueur 2 est une
transposition.
Remarquons que, avec la notation introduite (i1 . . . , im ) = (i2 . . . , im , i1 ), etc. Un cycle de longueur m a
clairement pour ordre m. L’intérêt de cette notion provient en bonne partie du résultat suivant.
Théorème. (Décomposition en cycles) Soit σ ∈ Sn \ {id} il existe σ1 , . . . , σr , cycles de longueurs m1 , . . . , mr
ayant des supports disjoints, tels que
σ = σ1 · · · σr .
De plus, l’union des supports des σi est le support de σ, les σi commutent entre eux et sont uniques (à l’ordre
près).
Preuve. On décompose l’ensemble X = [1, n] sous l’action du groupe engendré par σ en orbites. Sur chaque
orbite Xi de cardinal m ≥ 2, la permutation σ agit comme un cycle σi de support Xi . Il est alors immédiat
que σ est égale au produit des σi et celles-ci sont uniquement déterminées par σ. Deux permutations dont
les supports sont disjoints commutent; le reste est clair.
Si σ s’écrit σ1 · · · σr comme dans l’énoncé du théorème, i.e. est produit de cycles à supports disjoints de
longueur m1 , . . . , mr , on dira que σ est de type (m1 , . . . , mr ).
Corollaire. Soit σ une permutation de type (m1 , . . . , mr ), alors son ordre est égal au PPCM de m1 , . . . , mr .
Preuve. Notons M := PPCM(m1 , . . . , mr ). Comme σ = σ1 . . . σr on a σ M = σ1M . . . σrM = id et d’autre part
si σ N = σ1N . . . σrN = id, alors σ N agit sur le support de σi comme σiN et comme l’identité donc σiN = id et
mi divise N donc M divise N .
Exemple. La décomposition de la permutation donnée ci-dessus s’écrit σ = (1, 2, 6, 4, 5, 8, 9)(7, 10). Elle a
donc pour ordre 14.
Corollaire. La classe de conjugaison d’une permutation de type (m1 , . . . , mr ) est l’ensemble des permuta-
tions de même type.
19
Preuve. Commençons par vérifier la “formule-clef” suivante où ρ désigne une permutation quelconque :
annoncé. Ainsi le conjugué d’un m-cycle est un m-cycle; de plus si σ 0 = (j1 , . . . , jm ) est un autre m-cycle
on peut choisir ρ ∈ Sn telle que ρ(ik ) = jk et donc σ 0 = ρσρ−1 . Ainsi la classe de conjugaison d’un m-cycle
est l’ensemble des m-cycles. Dans le cas général, si σ = σ1 . . . σr , alors ρσρ−1 = (ρσ1 ρ−1 ) . . . (ρσr ρ−1 ) donc
le conjugué d’une permutation de type m1 , . . . , mr est encore du même type et réciproquement.
Pour la deuxième affirmation, il suffit de vérifier que ((1, 2)) = −1 ce qui est élémentaire.
Remarques. On sait (Cf plus loin) que toute permutation peut s’écrire comme le produit d’un certain
nombre de transpositions, disons σ = τ1 . . . τs ; on en déduit que (σ) = (−1)s . Un m-cycle est le produit de
m − 1 transpositions donc la signature d’un m-cycle est (−1)m−1 , la signature d’une permutation de type
(m1 , . . . , mr ) est (−1)m1 +...+mr −r .
Corollaire. Le sous-groupe An est distingué dans Sn et card(An ) = n!/2.
Preuve. Immédiat.
Générateurs de Sn et An .
Tout d’abord l’ensemble des cycles est un ensemble de générateurs de Sn d’après le théorème de décomposition
en cycles. Ensuite tout cycle peut s’écrire comme produit de transpositions car
donc l’ensemble des transpositions est un ensemble de générateurs de Sn . On peut même se restreindre
au sous-ensemble des transpositions de la forme (i, i + 1) pour 1 ≤ i ≤ m − 1. En effet si i < j et
ρ = (i + 1, i + 2) . . . (j − 1, j) alors ρ(i) = i et ρ(j) = i + 1 donc ρ(i, j)ρ−1 = (i, i + 1). A titre d’exercice on
pourra montrer qu’une transposition et un cycle de longueur n forme un système minimal de générateurs.
Montrons que les cycles de longueur 3 engendrent An . Un élément σ ∈ An s’écrit comme un produit d’un
nombre pair de transpositions (puisque (σ) = +1) donc An est engendré par les éléments de la forme
(i, j)(k, `), où l’on peut supposer (i, j) 6= (k, `). Si card ({i, j}{k, `}) = 1 alors (i, j)(k, `) est un 3-cyle, sinon
on peut écrire (i, j)(k, `) = (i, j)(j, k)(j, k)(k, `) et chacune des permutations (i, j)(j, k) et (j, k)(k, `) est un
3-cycle.
Exemple de sous-groupes de Sn (resp. de An ).
(a) Si n ≤ 2, le groupe Sn est commutatif, cependant si n ≥ 3, le centre de Sn est trivial. En effet si
ρ ∈ Z(Sn ) alors (i, j) = (ρ(i), ρ(j)) donc {ρ(i), ρ(j)} = {i, j}; supposons qu’il existe i avec ρ(i) 6= i,
alors pour tout j 6= i on a ρ(i) = j, ce qui est aburde dès que n ≥ 3.
20
n
(b) Soit m ≤ n, un cycle de longueur m dans Sn est déterminé par son support (il y a Cnm = m possibilités)
et l’ordre donné à ce support (à permutation cyclique près, soit (m − 1)! possibilités). Ainsi Sn contient
(m − 1)!Cnm cycles de longueur m et le nombre de sous-groupes cycliques que ceux-ci engendrent est
(m − 1)!Cnm /φ(m). Attention : ce n’est pas, en général, le nombre de sous-groupes cycliques de cardinal
m, néanmoins, si p est premier et p ≤ n < 2p, un sous-groupe de cardinal p est engendré par un p-cycle
et il y a donc (p − 2)!Cnp tels sous-groupes. (Exercice : vérifier dans ce cas un des théorèmes de Sylow
qui affirme que (p − 2)!Cnp ≡ 1 mod p et en déduire le théorème de Wilson (p − 2)! ≡ 1 mod p).
(c) Soit n = n1 + n2 + . . . + nr une partition de n, alors on dispose d’une injection Sn1 × . . . × Snr ,→ Sn
en associant à (σ1 , . . . , σr ∈ Sn1 × . . . × Snr la permutation définie, pour 1 ≤ i ≤ r et 1 ≤ j ≤ ni , par
σ(n1 + . . . + ni−1 + j) = n1 + . . . + ni−1 + σi (j).
(d) Il existe néanmoins d’autres façons de plonger Sm dans Sn . Ainsi le groupe S5 possède six 5-sous-groupes
de Sylow d’où une injection S5 ,→ S6 . Notons que l’image de S5 ne stabilise aucun élément puisqu’il
agit transitivement.
(e) (centralisateur d’un élément) Soit σ ∈ Sn , on veut déterminer le sous-groupe
C(σ) := {ρ ∈ Sn | ρσ = σρ}.
Si σ = (i1 , . . . , im ) un m-cycle, un élément ρ commute avec σ si l’on a l’égalité de cycles (ρ(i1 ), . . . , ρ(im ))
donc si et seulement si le sous-ensemble {i1 , . . . , im } est une orbite (sous l’action du sous-groupe engendré
par σ) sur lequel σ agit par permutation circulaire. Si l’on identifie le sous-groupe des permutations de
support {i1 , . . . , im } (resp. fixant le sous-ensemble {i1 , . . . , im })avec Sm (resp. Sn−m ) alors Sn−m ,→
C(σ); de plus le sous-groupe Sn−m est distingué dans C(σ) et le quotient est isomorphe au sous-groupe
engendré par σ (i.e. à Z/mZ); en particulier card(C(σ)) = (n−m)!m. Montrer plus généralement que si
σ est le produits de r2 transpositions, r3 cycles de longueur 3 etc (avec disons n = r1 +2r2 +3r3 +. . .+srs )
alors
card(C(σ)) = r1 !r2 ! . . . rs !2r1 . . . srs .
Le groupe S1 est trivial, le groupe S2 est commutatif. Le groupe S3 possède trois sous-groupes de cardinal 2
(autant que de transpositions), un unique sous-groupe de cardinal 3 : le sous-groupe A3 (puisque A3 /S3 ) qui
est cyclique. En particulier S3 est résoluble. Le groupe S4 contient quatre sous-groupes isomorphes à S3 qui
sont tous conjugués (les stabilisateurs de 1, 2, 3, 4) et donc quatre sous-groupes de cardinal 3 (qui sont tous
conjugués). Les 2-sous-groupes de Sylow de S4 sont au nombre de 3 et sont isomorphes au groupe dièdral
D4 . En effet l’action de D4 sur les sommets d’un carré induit un isomorphisme de D4 sur un sous-groupe
de S4 ; ce sous-groupe ne peut être distingué car sinon il contiendrait tous les éléments d’ordre 2 ou 4 de S4
donc il y a 3 tels sous-groupes (qui sont tous conjugués). On peut en déduire un sous-groupe particulier
Le sous-groupe de Klein de S4 est l’intersection de ses 2-sous-groupes de Sylow, ou encore le sous-groupe
constitué de l’élément neutre et des doubles transpositions
Ce sous-groupe est donc distingué dans S4 et isomorphe à Z/2Z × Z/2Z. En particulier la suite S4 ⊃ A4 ⊃
K ⊃ {id, (1, 2)(34)} ⊃ {id} est une suite de composition avec quotients successifs Z/2Z, Z/3Z, Z/2Z et
Z/2Z donc S4 est résoluble. Le groupe quotient S4 /K est isomorphe S3 ; en effet, si l’on fait agir S4 sur ses
2-sous-groupes de Sylow, le stabilisateur (normalisateur) de chacun de ces sous-groupes de Sylow est égal
à lui-même, donc leur intersection est K; l’homomorphime ρ : S4 → S3 associé à cette action a donc pour
noyau K et est donc surjectif.
Théorème. Soit H un sous-groupe distingué non trivial de Sn , alors ou bien H = An ou bien n = 4 et H
est le sous-groupe de Klein. Le groupe Sn est résoluble si et seulement si n ≤ 4, le groupe An est simple si
et seulement si n ≥ 5.
Preuve. Montrons d’abord que, si n ≥ 5 tous les 3-cycles sont conjugés dans An et donc un sous-groupe
distingué qui contient un 3-cycle les contient tous et est donc égal à An . Soit σ = (i, j, k), dès que ρ(1) =
i, ρ(2) = j et ρ(3) = k, on a ρ(1, 2, 3)ρ−1 = (i, j, k). A priori ρ ∈ Sn mais, si n ≥ 5 on peut s’arranger pour
que ρ ∈ An , quitte à remplacer éventuellement ρ par ρ(4, 5).
21
Montrons que A5 est simple. Soit H 6= {id} sous-groupe distingué de A5 . Si H contient un 3-cycle alors
H = A5 . Si H contient une double transposition σ = (i, j)(k, `), alors, en posant ρ = (k, `, m) avec m le
cinquième élément, on a σρσρ−1 = (k, `, m) ∈ H donc H = A5 . Si H contient un 5-cycle alors il contient un
5-Sylow de A5 et donc tous et donc les 24 cycles de longueur 5; mais 25 ne divise pas card(A5 ) = 60 donc
H contient d’autres éléments donc un 3-cycle ou une double transposition.
Montrons que An−1 simple entraı̂ne An simple (pour n ≥ 6). Soit H / An un sous-groupe non trivial.
Considérons Gi = {σ ∈ An | σ(i) = i} ∼ = An−1 , on a H ∩ Gi / Gi donc H ∩ Gi = Gi ou {id}. Si Gi ⊂ H alors
H contient un 3-cycle et H = An . Il nous reste à montrer qu’on ne peut avoir H ∩ Gi = {id}. Soit donc
σ ∈ H \ {id}. On a σ(1) = i 6= 1, choisissons j 6= 1, i alors σ(j) = k et on peut choisir `, m ∈
/ {1, i, j, k}. Soit
ρ = (j, `, m) ∈ An alors τ := ρ−1 σ −1 ρσ est dans H et τ (1) = 1 alors que τ (j) = ` onc τ ∈ H ∩ G1 \ {id}, ce
qui est une contradiction.
Enfin montrons que H / Sn et H 6= {id}, Sn entraı̂ne H = An pour n ≥ 5 (les cas n ≤ 4 sont laissés en
exercice). On a ou bien H ∩ An = An mais alors H = An ou bien H ∩ An = {id} mais alors card(H) = 2
ce qui est impossible car les conjugués d’un produit de transposition ne lui sont pas tous égaux. L’analyse
des cas où n ≤ 4 est laissée au lecteur.
Remarques. Le groupe A5 a pour cardinal 60, c’est le plus petit groupe simple (non commutatif); Le groupe
A5 contient 5 “copies” de A4 (les stabilisateurs de 1, 2, 3, 4, 5) qui contiennent chacun une copie du groupe
de Klein, ce qui fournit les cinq 2-sous-groupes de Sylow. En effet si on écrit K ⊂ A4 ⊂ A5 on sait que A4
normalise K et en fait doit être égal au normalisateur de K dans A5 car K ne peut pas être distingué; il y
a donc bien 5 = (A5 : A4 ) sous-groupes de Sylow.
Montrons qu’un groupe simple G de cardinal 60 est isomorphe à A5 . Un tel groupe n’admet pas d’homomor-
phisme non trivial vers S4 (sinon le noyau contredirait la simplicité de G) donc pas d’action non triviale
sur des ensembles de cardinal ≤ 4. D’après les théorèmes de Sylow, le nombre de 2-sous-groupes de Sylow
est donc a priori 5 ou 15, Le nombre de 5-sous-groupes de Sylow est 6 (donc il y a 24 éléments d’ordre 5)
et le nombre de 3-sous-groupes de Sylow est 10 (donc il y a 20 éléments d’ordre 3). Supposons n2 = 5,
alors l’action de G sur les 2-sous-groupes de Sylow donne une injection G ,→ S5 . L’image est d’indice deux
donc distinguée donc c’est A5 . Supposons n2 = 15, alors un décompte des éléments montre qu’il existe
deux 2-sous-groupes de Sylow tels que card(P1 ∩ P2 ) > 1 (sinon l’union des 2-sous-groupes de Sylow aurait
pour cardinal (15 × 3) + 1 = 46). Soit x ∈ P1 ∩ P2 \ {e}, alors P1 et P2 , étant commutatifs, sont dans le
commutateur C(σ) qui est donc de cardinal 4m avec m > 1. Le groupe G agit transitivement sur G/C(σ)
qui est de cardinal 15/m. mais on a vu que m > 1 et que 15/m ≥ 5 donc G/C(σ) a pour cardinal 5 et on
en tire un homorphisme ρ : G → S5 qui, comme précédemment doit être un isomorphisme avec A5 . (Bien
entendu la possibilité n2 = 15 est impossible a posteriori).
Exercices (illustrations géométriques). 1) Soit K un corps commutatif, montrer que l’action naturelle de
SL(2, K) sur K 2 induit une action transitive sur P1 (K) (l’ensemble des droites de K 2 passant par l’origine)
et que son noyau est {±Id}. On note PSL(2, K) le quotient de SL(2, K) par {±Id}. En déduire les
isomorphismes suivants :
(i) PSL(2, Z/2Z) ∼= S3
(ii) PSL(2, Z/3Z) ∼= A 4 ⊂ S4
(iii) PSL(2, Z/5Z) ∼= A5 ⊂ A 6
2) Considérons G le groupe du cube (qu’on peut supposer centré en l’origine) et faisons-le agir sur les quatre
“grandes” diagonales. Montrer que cette action induit un homomorphisme ρ : G → S4 dont le noyau est
{±Id} et en déduire que
G∼ = S4 × {±Id}.
Décrire les isométries correspondant aux transpositions, cycles, etc.
22
A.8. Le b-a-ba de la classification des groupes finis.
On donne quelques compléments “culturels” sur les groupes, leurs descriptions, pour la plupart sans preuves.
G
. &
H1 K1
↓ & . ↓
H2 H1 ∩ K 1 K2
↓ ↓ ↓
H3 L3 K3
.. .. ..
. . .
↓ ↓ ↓
{e} = Hm Lr Kn = {e}
De plus tous les quotients sont simples; c’est clair par construction, sauf pour les inclusions de H1 ∩ K1 dans
K1 et H1 où cela résulte du lemme suivant
Lemme. Dans la situation ci-dessus, si H1 6= K1 alors G/H1 ∼
= K1 /H1 ∩ K1 et G/K1 ∼
= H1 /H1 ∩ K1 . En
particulier K1 /H1 ∩ K1 et H1 /H1 ∩ K1 sont simples.
Preuve. L’application K1 ,→ K1 H1 → K1 H1 /H1 a pour noyau H1 ∩ K1 d’où l’isomorphisme classique
K1 /H1 ∩ K1 ∼
= K1 H1 /H1 . Par ailleurs on a K1 / K1 H1 / G, mais, vues les hypothèses, K1 6= K1 H1 donc
H1 K1 = G.
23
Suite de la preuve. On dispose donc de deux suites de composition de H1 de longueur m − 1 et r − 1; on peut
donc apppliquer l’hypothèse de récurrence et conclure que m = r et les quotients {H1 /H2 , . . . , Hm−1 /Hm }
et {H1 /H1 ∩ K1 , H1 ∩ K1 /L3 , . . . , Lr−1 /Lr } sont isomorphes deux à deux. Le même raisonnement appliqué
aux deux suites de composition de K1 montre que n = r et que les quotients {K1 /K2 , . . . , Kn−1 /Kn }
et {K1 /H1 ∩ K1 , H1 ∩ K1 /L3 , . . . , Lr−1 /Lr } sont isomorphes deux à deux. On en tire, en se souvenant
du lemme précédent, que les quotients {G/H1 , H1 /H2 , . . . , Hm−1 /Hm } sont isomorphes (à permutation
près) aux quotients {K1 /H1 ∩ K1 , H1 /H1 ∩ K1 , H1 ∩ K1 /L3 , . . . , Lr−1 /Lr } donc également aux quotients
{K1 /K2 , H1 /H1 ∩ K1 , K2 /K3 , . . . , Kn−1 /Kn } et enfin aux quotients {K1 /K2 , G/K1 , K2 /K3 , . . . , Kn−1 /Kn }
comme annoncé.
Il est naturel d’introduire la définition suivante qui a par ailleurs une grande importance historique : d’après
Galois, les équations polynomiales P (x) = 0 dont on peut exprimer les racines à l’aides des opérations de
√
corps et de radicaux n sont celles qui ont un groupe résoluble.
Définition. Un groupe G est résoluble s’il existe une suite G = G0 ⊃ G1 ⊃ . . . ⊃ Gn = {e} telle que
Gi+1 / Gi et Gi /Gi+1 est abélien.
Si le groupe G est fini, il revient au même de demander que ses facteurs de Jordan-Holder soient isomorphes
à Z/pZ. Un des théorèmes les plus difficiles de la théorie des groupes finis (Feit-Thomson) dit qu’un groupe
de cardinal impair est toujours résoluble.
Exercices. Montrer que, si H / G alors G est résoluble si et seulement si H et G/H sont résolubles. Montrer
qu’un groupe de cardinal ≤ 100 et 6= 60 est résoluble. Montrer qu’un groupe G de cardinal 2n avec n impair
contient un sous-groupe distingué d’indice 2 et en particulier n’est pas simple (Indication : l’action par
translation induit ρ : G → S2n , montrer que Ker( ◦ ρ) est d’indice 2 dans G). En admettant le théorème de
Feit-Thomson, montrer que G est résoluble.
A.8.2. Classification des petits groupes (début).
On peut chercher à classer les “petits” groupes à isomorphisme près. Si l’on note γ(n) le nombre de classes
d’isomorphisme de groupes de cardinal n, on a déjà vu que γ(p) = 1, γ(p2 ) = 2 γ(p3 ) = 5 et γ(pq) = 2 ou
1 suivant que q ≡ 1 mod p ou non. Si on poursuit les calculs, on peut obtenir par exemple la table suivante
pour n ≤ 34 :
n 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
γ(n) 1 1 2 1 2 1 5 2 2 1 5 1 2 1 14 1
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
5 1 5 2 2 1 15 2 2 5 4 1 4 1 51 1 2
Pour n = 24 les calculs sont plus longs (voir exercice ci-dessous), pour n = 16 ou 32, ils deviennent plus
délicats, pour les autres valeurs, donnons sans preuve une description des classes d’isomorphismes.
(a) Pour n = 8 les cinq groupes sont les trois groupes abéliens (Z/2Z)3 , Z/4Z × Z/2Z et Z/8Z et les deux
non commutatifs D4 et H8 = {±1, ±i, ±j, ±k}.
(b) Pour n = 12 les cinq groupes sont Z/12Z, Z/6Z × Z/2Z, D3 × Z/2Z, A4 et le produit semidirect
Z/3Z >/φ Z/4Z où φ : Z/4Z → Z/2Z ∼ = (Z/3Z)∗ est l’homomorphisme surjectif qui associe à x mod 4
l’élément x mod 2 (remarquer que D6 est isomorphe à D3 × Z/2Z).
(c) Pour n = 18 les cinq groupes sont Z/18Z, Z/6Z × Z/3Z, D9 , D3 ×Z/3Z et un produit semi-direct
2 0 1
(Z/3Z) >/φ Z/2Z où φ : Z/2Z → GL(2, Z/3Z) est donné par φ(1) = .
1 0
(d) Pour n = 20 les cinq groupes sont Z/20Z, Z/10Z × Z/2Z, D10 , D5 × Z/2Z et un produit semi-direct
Z/5Z >/φ Z/4Z où φ : Z/4Z → (Z/5Z)∗ est un isomorphisme.
24
(e) Pour n = 28 les quatre groupes sont Z/28Z, Z/14Z × Z/2Z, D14 , D7 × Z/2Z.
(f) Pour n = 30 les quatre groupes sont Z/30Z, D3 × Z/5Z, D15 , D5 × Z/3Z.
Exercices. Démontrer les affirmations (a) . . . (f ). Classifier les groupes de cardinal 24 ainsi:
(i) On appelle P (resp. Q) un 2-sous-groupe de Sylow (resp. un 3-sous-groupe de Sylow) et n2 (resp. n3 )
le nombre de 2-sous-groupes de Sylow (resp. de 3-sous-groupes de Sylow). Montrer que n2 = 1 ou 3
(resp. n3 = 1 ou 4). En déduire que soit G = Q >/φ P soit G = P >/φ Q soit n2 = 3 et n3 = 4 et alors
G∼ = S4 .
(ii) Si n2 = 1, montrer qu’il y a 8 groupes possibles. Si P ∼ = (Z/2Z)3 les groupes possibles sont Z/6Z ×
(Z/2Z) , Z/2Z × A4 ou un produit semi-direct (Z/2Z)3 >/φ Z/3Z où φ : Z/3Z → GL(3, Z/2Z) est
2
donné par la permutation circulaire des coordonnées; si P ∼ = Z/4Z × Z/2Z alors G ∼ = Z/12Z × Z/2Z; si
P ∼= Z/8Z alors G ∼= Z/24Z; si P ∼ = D4 alors G ∼ = D4 × Z/3Z; si P ∼ = H8 alors ou bien G ∼
= H8 × Z/3Z
ou bien
±1 + ±i + ±j + ±k
G = H8 >/φ Z/3Z ∼ = ±1, ±i, ±j, ±k, .
2
(iii) Si n3 = 1 et n2 = 3 il ya 6 groupes possibles : D3 × (Z/2Z)2 , D6 × Z/2Z, D3 Z/4Z, D12 et des produits
semidirects Z/3Z >/φ P (avec φ : P → Z/2Z = Aut(Z/3Z) surjective et P = Z/8Z, D4 ou H8 ).
25
PSUn (Fq2 ) le quotient par le centre Z = {aI | aq+1 = 1}. Le groupe PSUn (Fq2 ) est simple pour n ≥ 2.
[Exceptions : n = 2 et q 2 = 4 ou 9; n = 3 et q 2 = 4]
Il existe en plus des groupes de type de Lie exceptionnels G2 , F4 , E6 , E7 et E8 de dimension 14, 52, 78, 133
et 248 qui conduisent aussi à des groupes simples finis. Enfin il existe des formes “tordues” de certains de
ces groupes que je ne décrirai pas. (Voir les deux tableaux).
Corollaire. Tout groupe peut s’écrire comme quotient d’un groupe libre. Plus précisément si G admet
admet pour générateur un sous-ensemble S, alors G est un quotient de L(S).
Preuve. Il suffit de considérer l’application φ : L(S) → G associée par la propriété universelle à l’injection
S ,→ G et de remarquer que φ(L(S)) est un sous-groupe contenant S donc égal à G tout entier. On a donc
bien G ∼
= L(S)/ Ker(φ).
Les groupes libres présentent des analogies avec les espaces vectoriels (ou les groupes abéliens libres) mais
réservent aussi quelques surprises. Par exemple deux groupes libres L(X) et L(Y ) sont isomorphes si et
seulement si card(X) = card(Y ) et un sous-groupe d’un groupe libre est encore libre (théorème de Nielsen-
Schreier). Cependant un sous-groupe même de Ln (le groupe libre à n générateurs) peut être de n’importe
quel rang : ainsi si (Ln : H) = m alors H est un groupe libre à (n − 1)m + 1 générateurs; pire, si n > 1
26
alors Ln contient des sous-groupes qui ne sont pas de type fini! Le sous-groupe des commutateurs est un tel
exemple.
Le groupe libre à n générateurs est important en topologie puisque c’est le groupe fondamental du plan
privé de n points. Le groupe fondamental d’une variété s’écrit souvent naturellement commme quotient
d’un groupe libre. Par exemple le groupe fondamental d’une surface compacte à g trous est le quotient du
groupe libre à 2g générateurs x1 , y1 , x2 , y2 , . . . , xg , yg par le sous-groupe distingué engendré par la relation
x1 y1 x−1 −1 −1 −1
1 y1 . . . xg yg xg yg .
Exercice. Montrer que les groupes de cardinal de la forme N = pa , pq, pqr, 4pq (sauf 60) ou 2(2m + 1)
ne sont pas simples. Indications : les deux premiers cas a été traités en cours, pour les deux suivants
utiliser les théorèmes de Sylow, dans le dernier cas considérer l’action de G sur lui-même par translation et
le morphisme ρ : G → S2(2m+1) correspondant, montrer que l’image d’un élément d’ordre 2 a pour signature
−1 et conclure. On montrera plus tard (chapitre F) qu’un groupe de cardinal pa q b est résoluble. Montrer
qu’un groupe de cardinal N ≤ 200 n’est pas simple sauf si N ∈ {60, 168}.
27
APPENDICE : LA LISTE DES GROUPES SIMPLES FINIS
I. Les 17 familles infinies de groupes simples finis non abéliens et leurs cardinaux
n!
An 2
n(n+1) Qn+1
(1) 1
An (q) P SLn+1 (q) (n+1,q−1) q
2
i=2 (q i − 1)
n(n+1) Qn+1
2 (1) 1
An (q) P SUn+1 (q) (n+1,q+1) q
2
i=2 (q i − (−1)i )
n2
(2) 1
Qn 2i
Bn (q) P Ω2n+1 (q) (2,q−1) q i=1 (q − 1)
2 (3)
Bn (q) Sz(q) q 2 (q − 1)(q 2 + 1)
n2
1
Qn 2i
Cn (q) P Sp2n (q) (2,q−1) q i=1 (q − 1)
Qn−1
Dn (q) P Ω+
2n (q)
1
(4,q n −1) q
n(n−1) n
(q − 1) i=1 (q 2i − 1)
Qn−1
2
Dn (q) P Ω−
2n (q)
1
(4,q n +1) q
n(n−1) n
(q + 1) i=1 (q 2i − 1)
3
D4 (q) q 12 (q 2 − 1)(q 8 + q 4 + 1)(q 6 − 1)
G2 (q) q 6 (q 2 − 1)(q 6 − 1)
2 (4)
G2 (q) q 3 (q − 1)(q 3 + 1)
2 (5)
F4 (q) q 12 (q − 1)(q 3 + 1)(q 4 − 1)(q 6 + 1)
1 36 2
E6 (q) (3,q−1) q (q − 1)(q 5 − 1)(q 6 − 1)(q 8 − 1)(q 9 − 1)(q 12 − 1)
2 1 36 2
E6 (q) (3,q+1) q (q − 1)(q 5 + 1)(q 6 − 1)(q 8 − 1)(q 9 + 1)(q 12 − 1)
1 63 2
E7 (q) (2,q−1) q (q − 1)(q 6 − 1)(q 8 − 1)(q 10 − 1)(q 12 − 1)(q 14 − 1)(q 18 − 1)
(1)
A1 (2), A1 (3) et 2 A2 (2) sont résolubles.
(2)
B2 (2) = C2 (2) et G2 (2) ont un sous-groupe des commutateurs d’indice 2 qui est simple.
(3)
définis seulement pour q = 22n+1 ; 2 B2 (2) est résoluble
(4)
définis seulement pour q = 32n+1 ; 2 G2 (3) a un sous-groupe des commutateurs d’indice 3 qui est simple.
(5)
définis seulement pour q = 22n+1 ; 2 F4 (2) a un sous-groupe des commutateurs d’indice 2 qui est simple.
Les notations de la colonne de gauche proviennent de la classification des algèbres de Lie simples. Les nota-
tions de la page suivante correspondent le plus souvent aux initiales des découvreurs des groupes sporadiques.
28
II. Les 26 groupes simples finis sporadiques et leurs cardinaux
J4 221 .33 .5.7.113 .23.29.31.37.43 = 86 775 571 046 077 562 880
Co1 221 .39 .54 .72 .11.13.23 = 4 157 776 806 543 360 000
Co2 218 .36 .53 .7. 11.23 = 42 305 421 312 000
F i23 218 .313 .52 .7.11.13.17.23 = 4 089 460 473 293 004 800
F i024 221 .316 .52 .73 .11.13.17.23.29 = 1 255 205 709 190 661 721 292 800
F3 215 .310 .53 .72 .13.19.31 = 998 205 382 766 592 000
F2 241 .313 .56 .72 .11.13.17.19.23.31.47 = 4 154 781 581 226 426 191 177 580 544 000 000
= 808 017 424 794 512 875 886 459 904 961 710 757 005 754 368 000 000 000
29
B. ANNEAUX.
Si, de plus, la loi × est commutative, on dit que l’anneau est commutatif. L’anneau est un corps si tout
élément distinct de 0A est inversible (pour la loi ×).
L’exemple type d’anneau est Z muni de l’addition et de la multiplication usuelles, de même Z/nZ est un
anneau. Les ensembles Q, R et C sont des corps. Nous traiterons surtout des anneaux commutatifs mais
donnons néanmoins deux exemples d’anneaux non commutatifs. Si A est un anneau, Mat(n × n, A) muni de
l’addition et de la multiplication de matrices, est un anneau qui n’est pas commutatif dès que n ≥ 2. Il est
plus difficile de construire un corps non commutatif, voici l’exemple classique des quaternions, dû à Hamilton.
L’ensemble sous-jacent est un R-espace vectoriel de dimension 4 possédant une base qu’il est classique de
noter {1, i, j, k}, l’addition est simplement l’addition de deux vecteurs, la multiplication est R-bilinéaire et
définie sur les éléments de la base par le fait que 1 est élément neutre et
L’arithmétique (les nombres) fournit un grand nombre d’exemples d’anneaux, mais ces derniers sont présents
aussi en théorie des ensembles, en analyse, etc. Si on note P(X) l’ensemble des parties d’un ensemble X et
∆ la différence symétrique A ∆ B := (A ∪ B) \ (A ∩ B) alors (P(X), ∆, ∩) est un anneau commutatif qui
a la particularité que pour tout x, on a x + x = 0 et x · x = x. Si K = R ou C (ou plus généralement
un anneau commutatif), l’ensemble F(X, K) des fonctions de X vers K est un anneau; si X est un espace
topologique, l’ensemble C 0 (X, R) des fonctions continues est également un anneau, idem avec les fonctions
de classe C k (si X est un ouvert de Rn ou plus généralement une variété différentielle); l’ensemble des
fonctions de R dans R développables en série entière forme aussi un anneau. Si l’on considère l’espace
vectoriel L1 (Rn ) des fonctions intégrables
R (modulo les fonctions nulles presque partout) on peut le munir du
produit de convolution (f ∗ g)(x) = Rn f (x − y)g(y)dm(y) et ce produit vérifie tous les axiomes de structure
d’anneau commutatif sauf l’existence d’un élément neutre. Un analogue purement algébrique du produit de
convolution est fourni par l’algèbre de groupe A[G] (où A est un anneau commutatif et G un groupe) dont
l’ensemble sous-jacent est l’ensemble des fonctions presque nulles de G vers A, la somme est la somme de
fonctions et le produit est défini par la formule :
X X
f ∗ g(x) = f (y)g(z) = f (y)g(y −1 x).
yz=x y∈G
30
qu’on obtient bien une structure d’anneau qui est commutatif si et seulement si A et B sont commutatifs.
Remarquons que A × {0B } est un sous-ensemble de A × B stable par addition et multiplication et possédant
un élément neutre (1A , 0B ); c’est donc un anneau mais ce n’est pas un sous-anneau de A × B puisque son
élément neutre n’est pas celui de A × B. Observons qu’on a facilement l’égalité (A × B)∗ = A∗ × B ∗ .
Soient A, B deux anneaux, une application f : A → B est un homomorphisme d’anneaux si f (x + y) =
f (x) + f (y), f (xy) = f (x)f (y) et f (1A ) = 1B . C’est un isomorphisme d’anneaux si c’est de plus une
bijection (en effet la bijection réciproque est automatiquement un homomorphisme).
On suppose désormais que les anneaux considérés sont commutatifs.
On a vu la construction du quotient d’un groupe par un sous-groupe; on peut se demander quelle propriété
doit avoir un sous-groupe (additif) d’un anneau A pour que le quotient garde une structure d’anneau, la
réponse est précisément la notion d’idéal.
Définition. Un idéal d’un anneau A est un sous-ensemble qui est un sous-groupe pour l’addition et vérifie
∀a ∈ A, ∀j ∈ I, aj ∈ I.
Remarques et exemples. Si on ne supposait pas l’anneau A commutatif, il faudrait distinguer les idéaux à
gauche (tels que AI ⊂ I) ou à droite (tels que IA ⊂ I) ou bilatère. Soit a ∈ A, l’ensemble aA = {ab | b ∈ A}
est un idéal de A appelé idéal principal. Tous les idéaux de l’anneau Z sont de la forme aZ puisque cela
est déjà vrai pour les sous-groupes. Il est souvent intéressant de traduire les propriétés des éléments en des
propriétés d’idéaux, par exemple:
Définition. Un idéal I distinct de A est premier si ab ∈ I entraı̂ne a ou b est dans I. Un élément a ∈ A est
premier si l’idéal aA est premier.
On voit facilement que, dans le cas A = Z les élément premiers sont les nombres ±p avec p nombre naturel
premier (au sens usuel).
Il est immédiat de voir que le noyau d’un homomorphisme est un idéal, que l’intersection d’idéaux est un
idéal, que l’image réciproque d’un idéal par un homomorphisme f : A → B est encore un idéal; par contre
l’image d’un idéal n’est a priori un idéal que dans f (A) et pas dans B. L’image réciproque d’un idéal
premier par un homomorphisme d’anneaux est un idéal premier. Enfin les idéaux permettent de construire
les anneaux quotient.
Théorème. Soit A un anneau et I un idéal, il existe une unique structure d’anneau sur A/I telle que
la surjection canonique s : A → A/I soit un homomorphisme d’anneaux. Ce quotient vérifie la propriété
universelle suivante:
Soit f : A → B un homomorphisme d’anneaux, l’application f se factorise en f = fˆ ◦ s si et seulement si
I ⊂ Ker(f ). Si cette condition est vérifiée, l’application fˆ : A/I → B est un homomorphisme d’anneaux et
l’on a
(i) L’image fˆ(A/I) est égale à l’image f (A).
(ii) Le noyau Ker(fˆ) est égal à Ker(f )/I.
Preuve. Le théorème a déjà été prouvé en termes de groupes, il suffit donc de vérifier que fˆ, quand elle existe,
est un homomorphisme d’anneaux, étant entendu que la multiplication est définie sur A/I par (a+I)·(b+I) =
ab + I et que cette définition est indépendante du choix des représentants des classes précisément parce que
I est un idéal. Soit donc ā = a + I et b̄ = b + I deux éléments de A/I; on a fˆ(ā · b̄) = fˆ(ab) = fˆ ◦ s(ab) =
f (ab) = f (a)f (b) = fˆ(ā)fˆ(b̄).
Remarquons que, si l’on avait pas supposé l’anneau commutatif, il aurait fallu considérer un idéal bilatère
pour avoir (a + i)(b + j) = ab + ib + aj + ij ∈ ab + I.
On pourra vérifier à titre d’exercice que l’application I 7→ s−1 (I) fournit une correspondance bijective entre
les idéaux de A/I et les idéaux de A contenant I. Comme pour les groupes, on peut en déduire de nombreux
isomorphismes dont le plus fondamental est f (A) ∼ = A/ Ker(f ).
31
Pour n’importe quel anneau, on dispose d’un homomorphisme canonique d’anneaux iA : Z → A défini par
m 7→ m1A . Le noyau est de la forme Ker(iA ) = mA Z avec mA entier ≥ 0. D’après ce qui précède, iA (Z) est
un sous-anneau de A isomorphe à l’anneau Z/mA Z. L’entier mA s’appelle la caractéristique de l’anneau A.
On a déjà observé que l’intersection d’idéaux est encore un idéal; on peut définir d’autres opérations sur les
idéaux, notamment la somme de deux idéaux I, J est définie comme I + J := {i + j | i ∈ I et j ∈ J} alors
que le produit de deux idéaux I, J est défini comme IJ := {i1 j1 + . . . + im jm | ih ∈ I et jh ∈ J}. On peut
définir d’ailleurs la somme d’idéaux indexés par un ensemble quelconque et le produit d’idéaux indexés par
un ensemble fini. On remarque que l’on a toujours IJ ⊂ I ∩ J mais en général on n’a pas égalité; en effet
si I = J = 2Z dans A = Z alors IJ = 4Z 6= 2Z = I ∩ J. Voici un énoncé classique d’isomorphisme qui est
souvent utile.
Proposition. (Lemme chinois généralisé) Soient I, J deux idéaux de A tels que I + J = A alors IJ = I ∩ J
et, de plus,
A/IJ ∼= A/I × A/J.
Preuve. Considérons l’homomorphisme f : A → A/I × A/J produit des deux surjections canoniques. Son
noyau est clairement I ∩ J. Montrons que f est surjective. Pour cela observons que, par hypothèse, il existe
i ∈ I et j ∈ J tels que i + j = 1. Si a, b ∈ A, considérons c := aj + bi on a c = a(j + i) + i(b − a) ∈ a + I et
de même c = b(i + j) + j(a − b) ∈ b + J donc f (c) = (sI (a), sJ (b)), ce qui prouve bien que f est surjective.
On a donc A/I ∩ J ∼ = A/I × A/J et il reste à voir que IJ = I ∩ J. On a toujours IJ ⊂ I ∩ J; soit donc
a ∈ I ∩ J, on peut écrire a = ai + aj mais a ∈ J donc ai ∈ IJ et a ∈ I donc aj ∈ IJ donc a ∈ IJ.
On vérifie directement qu’on a bien défini un anneau. Posons X := (0, 1A , 0, . . . , 0, . . .), on montre
aisément par récurrence que X i est la suite dont le seul terme non nul est situé au cran i et vaut 1A et
on récupère ainsi la notation usuelle P = (an )n∈N = a0 +a1 X +. . .+ad X d . On note classiquement A[X]
l’anneau des polynômes à coefficients dans A. On peut définir le degré d’un polynôme par la formule
avec la convention que deg(0) = −∞ (ou n’est pas défini). On a immédiatement les deux formules:
deg(P + Q) ≤ max{deg(P ), deg(Q)} et deg(P Q) ≤ deg(P ) + deg(Q) avec égalité dans la deuxième
formule dès que l’anneau A est intègre (ou plus généralement si le coefficient dominant de P n’est pas un
diviseur de zéro). Il n’y a pas de difficulté (sauf peut-être l’empilement de notations) à généraliser cette
construction aux polynômes en n variables ou même à une infinité de variables. L’ensemble A[Xi | i ∈ I]
est défini comme les “suites” presque nulles d’éléments de A indexées par N(I) = {(ni )i∈I ∈ NI | ni =
0 pour presque tout i} et l’addition et la multiplication de manière analogue. On montre aisément qu’on
a des isomorphismes canoniques comme (A[X])[Y ] = (A[Y ])[X] = A[X, Y ], c’est-à-dire que l’on peut
voir un polynôme en X, Y à coefficients dans A comme un polynôme en X (resp. en Y ) à coefficients
dans A[Y ] (resp. dans A[X]).
(ii) Si S est une partie multiplicative de A (i.e. 1 ∈ S et S est stable par multiplication) on définit l’anneau
des fractions S −1 A ainsi : on définit une relation d’équivalence sur A × S par
32
On note [(a, s)] ∈ A × S/R la classe d’un couple (a, s) ∈ A × S. On définit deux lois sur l’ensemble
S −1 A := A × S/R par
[(a, s)] + [(a0 , s0 )] = [(as0 + a0 s, ss0 )] et [(a, s)] · [(a0 , s0 )] = [(aa0 , ss0 )]
Remarquons que l’introduction de s00 dans la définition de R est inutile si l’anneau A est intègre (et
0∈/ S) mais est nécessaire en général pour que R soit transitive. Par ailleurs, on dispose d’une application
naturelle i : A → S −1 A donnée par a 7→ [(a, 1A )], c’est un homomorphisme d’anneaux qui permet
d’établir une bijection entre d’une part les idéaux propres de S −1 et d’autre part les idéaux de A ne
rencontrant pas S (un sens de la bijection est donnée par J 7→ i−1 (J)).
Une application classique de cette construction est la construction du corps des fractions d’un anneau intègre
(i.e sans diviseur de zéro). En effet, si A est intègre, on peut choisir S = A \ {0} comme partie multiplicative
et on constate alors que l’anneau S −1 A est un corps et que i : A → S −1 A est injective. En effet [(a, 1A )] =
[(0A , s)] équivaut à sa = 0A et donc a = 0A ; par ailleurs si a ∈ A et b ∈ A \ {0}, alors l’élément [(b, a)] est
inverse de [(a, b)]. Cette construction est l’analogue de la construction de Q à partir de Z. On note souvent
Frac(A) le corps ainsi construit. Comme autre exemple citons K(X1 , . . . , Xn ) = Frac (K[X1 , . . . , Xn ]) le
corps des fractions rationnelles en n indéterminées.
L’exemple suivant est important en algèbre commutative. On prend pour S le complémentaire d’un idéal
premier P , i.e. S := A \ P (la définition d’un idéal premier dit précisément que S est multiplicative).
L’anneau S −1 A se note alors AP et jouit une propriété remarquable : il possède un unique idéal maximal,
l’idéal formé des éléments [(a, s)] avec a ∈ P (et s ∈ S); on dit que AP est un anneau local.
Exercice. (Fonction polynôme) Soit P ∈ A[X1 , . . . , Xn ], on lui associe une fonction fP : An → A définie
par fP (x) = P (x). L’application P 7→ fP est un homomorphisme d’anneaux. Montrer sur un exemple
que cette application n’est pas nécessairement injective. Si A est intègre et infini, montrer que l’application
P 7→ fP est injective (indication : si n = 1 montrer qu’un polynôme non nul n’a qu’un nombre fini de racine
et procéder par induction sur le nombre de variables). Si A = Z/pZ et n = 1, montrer que le noyau est
engendré par X p − X.
En effet (⇐) est trivial et, si b = ca et a = c0 b alors b = (cc0 )b ou encore b(1 − cc0 ) = 0 mais on peut supposer
b 6= 0 (sinon on a b = a = 0 et l’énoncé est banal) et donc, comme A est intègre cc0 = 1, ce qui signifie bien
que c, c0 ∈ A∗ . On dira que a et b sont associés si b = ua avec u ∈ A∗ ; cette relation est visiblement une
relation d’équivalence.
Un élément a ∈ A est irréductible s’il est non nul, non inversible et vérifie la propriété suivante : si a = bc
alors b ou c est inversible. On a vu qu’un élément a est premier si l’idéal aA est premier, ou encore si
on a l’implication a divise bc entraı̂ne a divise b ou c. Il est clair qu’un élément premier est irréductible
(prouvez-le!) mais la réciproque est fausse en général.
On a vu au paragraphe précédent la définition d’un idéal premier; un idéal I ⊂ A est maximal si I 6= A et
I ⊂ J ⊂ A entraı̂ne J = I ou J = A.
Proposition. Un idéal I est premier si et seulement si A/I est intègre. Un idéal est maximal si et seulement
si A/I est un corps.
Preuve. L’anneau A/I est intègre si et seulement si le produit de deux classes ā et b̄ est nul (i.e. ab ∈ I)
dans le seul cas où ā = 0 (i.e. a ∈ I) ou b̄ = 0 (i.e. b ∈ I), ce qui signifie bien que I est premier. Si A/I
33
est un corps, ses seuls idéaux sont {0} et A/I donc les seuls idéaux de A contenant I sont I et A, ce qui
montre bien que I est maximal. Si I est maximal, soit ā ∈ A/I \ {0}, alors a ∈ / I donc I 6= I + aA ⊂ A donc
A = I + aA et il existe b ∈ A et i ∈ I tels que 1 = i + ab donc āb̄ = 1 ∈ A/I. Ainsi A/I est bien un corps.
Par analogie avec les propriétés déjà connues de l’anneau Z on définit les propriétés suivantes pour un anneau
commutatif intègre A.
Définition. Un anneau A est euclidien s’il existe une application φ : A \ {0} → N telle que pour tout a ∈ A,
b ∈ A \ {0}, il existe q, r ∈ A tels que a = bq + r et ou bien r = 0 ou bien φ(r) < φ(b).
Définition. Un anneau A est principal si tout idéal de A est principal i.e. de la forme aA.
Définition. Un anneau A est noethérien si tout idéal est engendré par un nombre fini d’éléments.
Remarque. Cette propriété est équivalente à la propriété souvent donnée comme définition qui dit qu’une
suite croissante d’idéaux de A doit être stationnaire. En effet si I1 ⊂ . . . ⊂ In ⊂ In+1 ⊂ . . . est une suite
croissante d’idéaux de A noethérien, considérons I = ∪n≥1 In , c’est un idéal engendré par disons a1 , . . . , ar
mais il existe n0 tel que a1 , . . . , ar ∈ In0 donc pour tout n ≥ n0 , on a In = In0 . Inversement si toute suite
croissante d’idéaux de A est stationnaire et si I est un idéal de A, effectuons la construction suivante. Soit
a1 ∈ I et I1 = a1 A, si I = I1 alors I est de type fini, sinon soit a2 ∈ I \ I1 . Posons alors I2 = a1 A + a2 A, ou
bien I = I2 ou bien il existe a3 ∈ I \ I2 etc. La construction doit d’arrêter au bout d’un nombre fini d’étapes
car I1 ⊂ I2 . . . est stationnaire.
Définition. Un anneau A est factoriel si tout élément non nul et non inversible peut s’écrire comme produit
(fini) d’éléments irréductibles et d’une unité et que cette décomposition est unique au sens suivant : si
a = upm mr
1 . . . pr
1
= u0 q1n1 . . . qsns avec u, u0 ∈ A∗ et les pi (resp. les qj ) sont irréductibles non associés deux
à deux et mi , nj ≥ 1 alors r = s et il existe une permutation σ ∈ Sr telle que pi est associé avec qσ(i) et
mi = nσ(i) .
On peut écrire cette définition de manière un peu plus concrète en introduisant P un ensemble de repré-
sentants des éléments irréductibles modulo la relation d’équivalence “être associé”. L’anneau A est alors
factoriel si pour tout élément non nul, il existe une unité u ∈ A∗ et une unique suite presque nulle d’entier
positifs (mp (a))p∈P telles que
Y
a=u pmp (a) .
p∈P
En général on n’a pas de manière simple de choisir les éléments de P toutefois dans le cas de Z on choisit
bien sûr l’élément irréductible positif et dans le cas de K[X] on choisit le polynôme irréductible unitaire.
Définition. Un anneau A est intégralement clos si pour tout élément x ∈ Frac(A) le fait d’être racine d’une
équation du type xd + ad−1 xd−1 + . . . + a0 = 0 avec ai ∈ A entraı̂ne x ∈ A.
Nous allons étudier les propriétés des anneaux de ce type et en particulier prouver les implications suivantes.
La notion de divisibilité introduit une notion d’ordre (partiel) sur les idéaux d’un anneau A; il est naturel
d’examiner l’existence de majorant, borne supérieure, etc. au sens de cette relation d’ordre. Cette notion
est traditionnellement formulée en termes des éléments, bien que, pour être précis il faudrait considérer les
classes d’équivalence d’éléments associés.
Définition. Un élément d ∈ A est un PGCD de a et b s’il vérifie les deux propriétés suivantes:
(i) L’élément d divise a et b,
(ii) Si un élément d0 divise a et b, alors d0 divise d.
Un élément m ∈ A est un PPCM de a et b s’il vérifie les deux propriétés suivantes:
(i) L’élément m est un multiple de a et b,
(ii) Si un élément m0 est un multiple de a et b, alors m0 est un multiple de m.
34
Il est clair qu’un PGCD (resp. un PPCM), s’il existe est unique à un élément inversible près, i.e. l’idéal
engendré est unique. Les premières propriétés du PGCD et PPCM, quand ils existent sont les suivantes.
Lemme. Soit A un anneau dans lequel P GCD et P P CM existent, soient a1 , . . . , am , a, b, c ∈ A, alors
(i) PGCD(aa1 , . . . , aam ) = a PGCD(a1 , . . . , am ),
(ii) PGCD(a + bc, b) = PGCD(a, b),
(iii) PPCM(aa1 , . . . , aam ) = a PPCM(a1 , . . . , am ).
Preuve. Laissée en exercice.
On peut traduire ces définitions en terme d’idéaux. En effet a divise b si et seulement si bA ⊂ aA; ainsi d
est un diviseur de a et b si et seulement si a, b ∈ dA ou encore si et seulement si aA + bA ⊂ dA, et m est un
multiple de a et b si et seulement si m ∈ aA ∩ bA ou encore si et seulement si mA ⊂ aA ∩ bA. On a ainsi
prouvé :
Proposition. Un PGCD de a et b existe dans A si et seulement si il existe un plus petit idéal principal
contenant aA + bA et dans ce cas PGCD(a, b)A est cet idéal. Un PPCM de a et b existe dans A si et
seulement si il existe un plus grand idéal principal contenu dans aA ∩ bA et dans ce cas PPCM(a, b)A est
cet idéal.
Cette proposition rend transparent le prochain théorème.
Théorème. Soit A un anneau principal, alors le PGCD et PPCM existent toujours et vérifient
(i) PGCD(a, b)A = aA + bA.
(ii) P P CM (a, b) = aA ∩ bA.
De plus PGCD(a, b) PPCM(a, b)A = abA et la propriété de Bézout est vérifiée : si d est un PGCD de a et b
alors
∃u, v ∈ A, au + bv = d.
Preuve. Le seul point qui reste à prouver est que ab et dm sont associés (où d est un PGCD et m un PPCM).
Ecrivons a = da0 et b = db0 alors a0 et b0 sont premiers entre eux et il existe u, v tels que a0 u + b0 v = 1.
L’élément da0 b0 est un multiple de a et b; inversement si m0 = ac = bc0 est un multiple de a et b alors
m0 = m0 (a0 u + b0 v) = bc0 a0 u + acb0 v = da0 b0 (c0 u + cv) est un multiple de da0 b0 ce qui prouve que ce dernier
est un PPCM de a et b.
35
Preuve (du lemme). L’existence d’une Qrdécomposition Qs en nirréductibles étant acquise, il s’agit d’en prouver
l’unicité. Supposons donc que a = u i=1 pm i
i
= v q
j=1 j
j
avec p i irréductibles non associés deux à deux,
mi ≥ 1 (idem pour qj et nj ) et u, v ∈ A∗ . Raisonnons par récurrence sur la longueur d’une décomposition
de a. Si a admet une décomposition de longueur 1, i.e. a irréductible, alors p1 divise a donc a et p1 sont
(m −1) Qr mi
associés et a = u0 p1 avec u0 ∈ A∗ donc p1 1 i=2 pi = u0 , ce qui n’est possible que si r = 1 et m1 = 1.
En général, p1 divise a donc l’un des qj ; quitte à les renuméroter, Qron peut supposer que p1 divise q1 donc
1 −1 n1 −1 Qs nj
q1 = wp1 avec w ∈ A∗ . En divisant par p1 on obtient upm 1 i=2 ip mi
= vwq 1 j=2 qj et on peut
appliquer l’hypothèse de récurrence pour conclure.
Remarques. On peut observer que si a est irréductible dans A principal alors A/aA est un corps; en effet
l’idéal aA est maximal car si aA ⊂ I ⊂ A alors I = bA et donc b divise a donc est soit inversible (auquel cas
I = bA = A) soit associé à a (auquel cas I = bA = aA). Cette propriété n’est plus vraie en général dans les
anneaux factoriels. Par exemple dans K[X, Y ] qui est factoriel (voir plus loin) l’élément X est irréductible
(et premier) mais K[X, Y ]/XK[X, Y ] ∼ = K[Y ] n’est pas un corps; de même le théorème de Bézout n’est plus
vérifié dans cet anneau. Cependant un grand nombre des propriétés des anneaux principaux sont préservées
dans le cadre des anneaux factoriels, en particulier:
Proposition. Dans un anneau factoriel A, le PGCD et PPCM existe toujours et le produit ab est associé au
produit PGCD(a, b) PPCM(a, b)A. Un élément irréductible est premier et les lemmes d’Euclide et de Gauss
restent vrais.
Preuve. Ecrivons chaque élément a ∈ A sous la forme a = u p∈P pmp (a) , où u ∈ A∗ et P désigne un
Q
ensemble de représentants des éléments irréductibles modulo les éléments inversibles. Il est alors clair que
Y Y
PGCD(a, b) = pmin{mp (a),mp (b)} et PPCM(a, b) = pmax{mp (a),mp (b)} .
p∈P p∈P
De plus ces formules montrent que le produit du PGCD par le PPCM est associé à ab. Si p irréductible
divise ab, on a ab = pc et en écrivant la décomposition en éléments irréductibles de a, b et c et en utilisant
l’unicité, on voit que (un élément associé à) p apparaı̂t dans la décomposition de ab donc dans celle de a ou
b. Le même raisonnement permet de vérifier le lemme de Gauss.
Venons-en a des exemples concrets d’anneaux non factoriels que nous choisirons √ d’abord dans
√ le cadre de
l’arithmétique. Tout d’abord notons que les anneaux du type A1 = Z 5 ou A2 = Z i 3 ne sont pas
√ √
intégralement clos car (1 + 5)/2 ∈ / A1 (bien qu’étant racine de X 2 − X − 1 = 0) et (1 + i 3)/2 ∈ /A√2 (bien
qu’étant racine de X 2 − X + 1 = 0) donc A1 et A2 ne sont pas factoriels. Cependant l’anneau Z i 5 est
intégralement clos (voir ci-dessous) mais n’est pas factoriel, en effet
√ √
6 = 2 · 3 = (1 + i 5)(1 − i 5)
√ √
or chacun des éléments 2, 3, 1 + i 5, 1 − i √5 est irréductible.
√ Pour voir cela regardons leurs modules au carré
que nous appellerons norme; si 2 = (a+bi 5)(a0 +b0 i 5) alors 4 = (a2 +5b2 )(a02√+5b02 ) mais a2 +5b√2 = 2 est
impossible donc on doit avoir a2 + 5b2 = 1 ou a02 + 5b02 = 1 e qui entraı̂ne a + bi 5 = ±1 ou a0 + b0 i 5 = ±1.
On remarquera que ces éléments sont irréductibles mais ne sont pas premiers.
Il est donc intéressant de regarder les anneaux les plus “complets” possible. Nous ne donnerons pas de
définition générale mais observerons simplement que si d ∈ Z \ {0, 1} est sans facteurs carrés, et si nous
introduisons
√ √
Ad := {α = x + y d ∈ Q( d) | α est racine d’une équation aα2 + bα + c = 0 avec a, b, a ∈ Z}
36
alors Ad est forcément intégralement clos si c’est bienun anneau. On peut montrer que c’est bien le cas et
√ √
que Ad = Z[ω] = {a + bω | a, b ∈ Z} où ω = 1 + d /2 si d ≡ 1 mod 4 et ω = d sinon. Pour étudier ces
anneaux les propriétés suivantes (laissées en exercice) seront utiles:
√
Lemme. La norme est multiplicative : N (αβ) = N (α)N (β). Les unités de Z[i d] (ou Z[ω]) sont les
éléments de norme 1. Enfin pour α 6= 0 on a N (α) = card(Z[ω]/αZ[ω].
Exercice. Soit K un corps de nombres, c’est-à-dire un sous-corps de C qui est de dimension finie sur Q
(comme espace vectoriel). Si α ∈ K alors la multiplication par α définit un endomorphisme Q-linéaire
de K, on définit N (α) comme le déterminant de cet endomorphisme (resp. T r(α) comme la trace de
l’endomorphisme). Montrer√que N (αβ) = N (α)N (β) et que N coı̈ncide avec la norme précédemment
définie. Montrer que α ∈ Q( d) est racine d’une équation X 2 + aX + b = 0 avec a, b ∈ Z si et seulement si
N (α) et T r(α) sont entiers.
√ √
Théorème. Soit d ≥ 1, sans facteur carré et ω = 1 + i d /2 si d ≡ 3 mod 4 et ω = i d sinon. L’anneau
Z[ω] est eucliden si et seulement si d ∈ {1, 2, 3, 7, 11}.
Preuve. Pour prouver
√ que les anneaux
√ cités sont euclidiens, on prouve qu’ils sont euclidiens pour la norme
définie sur Q(i d) par N (u + vi d) = u2 + dv 2 . Pour cela on établit le lemme suivant où l’on suppose que
d ∈ {1, 2, 3, 7, 11}.
√ √ √
Lemme. Soit u + vi d ∈ Q(i d), il existe α ∈ Z[ω] tel que N (u + vi d − α) < 1.
Preuve (du lemme). On utilise qu’un rationnel x (ou même un réel) possède un entier m (resp. un demi-entier
√
m/2) tel que |x − m| ≤ 1/2 (resp. |x − m/2| ≤ 1/4). Donc, pour m, n ∈ Z bien choisis, N (u + vi d − (m +
√ √ √
ni d)) = (u − m)2 + d(v − n)2 ≤ (d + 1)/4 < 1 si d = 1 ou 2 et par ailleurs N (u + vi d − (m + n 1+i2 d )) =
(u − m − n/2)2 + d(v − n/2)2 ≤ 1/4 + d/16 < 1 si d = 3, 7 ou 11.
On en déduit aisément que ces anneaux sont euclidiens : si z, z 0 ∈ Z[ω] \ {0} et si α ∈ Z[ω] est tel
que N (zz 0−1 − α) < 1 alors N (z − αz 0 ) < N (z 0 ) donc en posant r = z − αz 0 on obtient bien une division
euclidienne. Inversement, si Z[ω] est euclidien, choisissons α ∈ Z[ω] non inversible et tel que N (α) soit
minimale. La division par α donne toujours un reste nul ou inversible et on a donc
mais on voit aisément que (sauf pour d = 1 et 3) Z[ω]∗ = {±1} donc N (α) ≤ 2, 3. Mais l’équation a2 +db2 = 2
ou 3 (avec a, b ∈ Z) n’a pas de solution pour d > 3 et l’équation (a + b/2)2 + d4 b2 = a2 + ab + d+1 2
4 b = 2 ou
3 (avec a, b ∈ Z) n’a pas de solution pour d > 12 d’où le résultat.
Citons sans démonstration le théorème suivant (dont la preuve dépasse le niveau de ce cours) :
√ √
Théorème. Soit d ≥ 1, sans facteur carré et ω = 1 + i d /2 si d ≡ 3 mod 4 et ω = i d sinon. L’anneau
Z[ω] est principal si et seulement si d ∈ {1, 2, 3, 7, 11, 19, 43, 67, 163}.
Il est très difficile de démontrer que ce sont les seuls anneaux principaux; démontrer que ces anneaux sont
principaux est plus élémentaire. Nous le ferons pour le premier non euclidien.
h √ i
Proposition. L’anneau Z 1+i2 19 est principal et non euclidien.
h √ i
Preuve. Notons A = Z 1+i2 19 . Commençons par montrer que 2A est un idéal maximal dans A. Le
√
polynôme minimal de ω = 1+i2 19 est P = X 2 − X + 5 donc A = ∼ Z[X]/P Z[X] (considérer l’évaluation
Z[X] → A donnée par Q 7→ Q(ω)) et A/2A ∼ = Z/2Z[X]/P̄ Z/2Z[X]. Le polynôme P̄ ∈ Z/2Z[X] est
irréductible (car de degré 2 et sans racine dans Z/2Z) donc A/2A est un corps et 2A est maximal. Ensuite
montrons que l’on peut toujours √effectuer une √ division euclidienne (au sens de la norme) soit de a par
b, soit de 2a par b. Soit x + iy 19 ∈ Q(i 19), il suffit de voir qu’il existe m, n ∈ Z tels que N1 =
√ √
1+i 19
√ √
1+i 19
N (x + iy 19 − m − n 2 ) < 1 ou N2 = N (2(x + iy 19) − m − n 2 ) < 1. Or ou bien il existe n ∈ Z
37
tel que |y − n/2| ≤ 1/6 et alors on peut choisir m ∈ Z tel que N1 ≤ (1/4) + (19/36) < 1 ou bien il existe
n ∈ Z tel que (n/2) + 1/6 < y < (n + 1)/2 − 1/6 et alors |2y − (n + 1/2)| ≤ 1/6 et alors on peut choisir
m ∈ Z tel que N2 ≤ (1/4) + (19/36) < 1. Soit maintenant I un idéal non nul de A et b un élément non
nul de I de norme minimale, nous allons montrer que I = bA. On a clairement bA ⊂ I. Inversement soit
a ∈ I, si l’on peut effectuer la division euclidienne a = bq + r alors r ∈ I et N (r) < N (b) entraı̂ne r = 0
et a = bq ∈ bA; on peut donc supposer 2a = bq + r et donc, pour la même raison 2a = bq. Comme 2 est
premier, ou bien 2 divise q et alors a ∈ bA, ou bien 2 ne divise pas q et donc 2 divise b, i.e. b = 2b0 . Mais
alors comme 2A est maximal et q ∈ / 2A on a 2A + qA = A ou encore il existe u, v ∈ A tels que 2u + qv = 1.
On en tire b0 = 2ub0 + qvb0 = ub + va ∈ I, mais N (b0 ) = N (b)/4 < N (b) ce qui contredit l’hypothèse que
N (b) est minimale et achève la démonstration.
√
Exercice. Soit d > 1 Montrer que l’anneau Z[ω] = {a + bω | a, b ∈ Z} où ω = 1 + d /2 si d ≡ 1 mod 4
√
et ω = d sinon, est euclidien, donc principal pour les valeurs d ∈ {2, 3, 5, 6, 7, 11, 13, 14}. Montrer que
l’anneau Z[ω] n’est pas factoriel pour d = 10 ou 15.
On ignore si il existe une infinité de valeur d > 1 sans facteur carré tels que Z[ω] soit principal (on sait que,
pour ces anneaux, principal équivaut à factoriel).
Un autre exemple classique d’anneau principal est l’anneau des polynômes à une variable et à coefficients
dans un corps. En fait cet anneau est euclidien, ce qui est un corollaire de l’énoncé classique suivant.
Proposition. (division euclidienne de polynômes) Soit A un anneau et soient P, B deux polynômes de A[X]
tels que le coefficient dominant de B soit inversible dans A, alors il existe Q, R ∈ A[X] tels que
(i) P = QB + R
(ii) deg(R) < deg(B).
Preuve. Ecrivons B = bd X d +. . .+b0 avec bd ∈ A∗ donc b−1 n
d ∈ A, et notons P = an X +. . .+a0 . Raisonnons
par récurrence sur le degré n de P . Si n < d alors on peut choisir Q = 0 et R = P . Si n ≥ d considérons
P1 := P − an b−1d X
n−d
B, on a clairement deg(P1 ) < deg(P ) donc, par hypothèse de récurrence, il existe
Q1 , R1 tels que P1 = Q1 B + R1 et deg(R1 ) < deg(B). On constate alors que Q = Q1 + an b−1 d X
n−d
et
R = R1 conviennent.
Remarque. La démonstration fournit un algorithme qui est d’ailleurs l’algorithme usuel de calcul de la
division de polynômes.
En particulier si A est un corps, la seule condition pour avoir une division euclidienne est que B soit non nul
et l’anneau A[X] est donc euclidien et principal. On peut aisément voir que A[X] est principal seulement
lorsque A est un corps. Si A n’est pas intègre, alors A[X] non plus et n’est donc pas principal. Si maintenant
A est intègre mais n’est pas un corps, il existe un élément a non nul et non inversible, montrons alors que
l’idéal engendré par a et X dans A[X] n’est pas principal. Si P était un générateur, on aurait X = P Q et
a = P Q0 donc P devrait être une constante inversible et donc A[X] = aA[X] + XA[X]. Mais une égalité
1 = aS + XR est impossible car, en regardant les coefficients constants, on en déduirait que a est inversible.
Application. L’idéal des polynômes de K[X1 , . . . , Xn ] nuls en x = (x1 , . . . , xn ) ∈ K n est engendré par
X1 − x1 , . . . , Xn − xn . En effet le résultat est connu pour n = 1 et on peut procéder par récurrence : si
P (x) = 0, on effectue la division de P par Xn − xn dans l’anneau A[Xn ] = K[X1 , . . . , Xn−1 ][Xn ], soit
P = (Xn − xn )Q + R avec R ∈ K[X1 , . . . , Xn−1 ]. On constate que R(x1 , . . . , xn−1 ) = 0 donc, d’après
l’hypothèse de récurrence, R est dans l’idéal engendré par X1 − x1 , . . . , Xn−1 − xn−1 .
38
Preuve. Il suffit bien sûr de prouver que A[X] est noethérien. Soit I un idéal de A[X], nous allons chercher
un ensemble fini de générateurs. Introduisons les ensembles
on voit facilement que ce sont des idéaux de A et que In ⊂ In+1 . Comme A est noethérien, il existe n0 tel
(n) (n)
que, pour n ≥ n0 on ait In = In0 et, par ailleurs, il existe un nombre fini d’éléments a1 , . . . , amn ∈ In
qui engendrent In . Pour simplifier les notations, on peut supposer que mn = m pour n ≤ n0 . Considérons
(n) (n) (n)
également, pour n ≤ n0 des polynômes Pj = aj X n + . . . ∈ I et montrons que l’ensemble fini {Pj | n ≤
n0 , j ≤ m} engendre l’idéal I. Notons J l’idéal engendré par ces polynômes, on a J ⊂ I. Considérons donc
P ∈ I et raisonnons par récurrence sur d = deg(P ). Si d ≤ n0 alors P = aX d + . . . et a ∈ Id et donc il
(d) (d) (d) (d)
existe bj ∈ A tels que a = b1 a1 + . . . + bm am . Le polynôme P 0 := P − (b1 P1 + . . . + bm Pm ) est donc
0
dans I et a un degré < d, on peut donc supposer par récurrence qu’on sait déjà que P est dans J et donc
(d) (d)
P = P 0 + b1 P1 + . . . + bm Pm est également dans J. Si maintenant d > n0 , on sait que a ∈ In0 , on écrit
(n ) (n ) (n ) (n )
a = b1 a1 0 + . . . + bm am 0 et on raisonne de même avec P 0 := P − X d−n0 (b1 P1 0 + . . . + bm Pm 0 ).
Lorsque A est factoriel (plus généralement si un PGCD existe toujours dans A) on peut introduire le contenu
d’un polynôme P ∈ A[X] qui est, par définition, un PGCD de ses coefficients :
Un polynôme P est dit primitif si c(P ) = 1. On peut toujours factoriser un polynôme comme P = c(P )P 0
avec P 0 polynôme primitif du même degré que P .
Lemme. (lemme de Gauss) Soit A un anneau factoriel, soient P , Q deux polynômes de A[X], alors c(P Q) =
c(P )c(Q).
Preuve. Ecrivons P = c(P )P 0 et Q = c(Q)Q0 avec P 0 , Q0 primitifs, alors P Q = c(P )c(Q)P 0 Q0 et donc
c(P Q) = c(P )c(Q)c(P 0 Q0 ) et on voit qu’il suffit de montrer que le produit de deux polynômes primitifs
est primitif. Soit donc P, Q primitifs et supposons c(P Q) 6= 1 alors il existe p irréductible dans A qui
divise c(P Q). Comme A est factoriel, p est premier et B = A/pA est intègre. Considérons l’application
A[X] → B[X] qui, à un polynôme P , associe le polynôme P̄ avec les coefficients réduits modulo pA; c’est un
homomorphisme d’anneaux. On constate que P̄ 6= 0 et Q̄ 6= 0 alors que P Q = 0 ce qui contredit le fait que
B[X] est intègre.
Lemme. Soit A un anneau factoriel, soit K := Frac(A), les éléments irréductibles de A[X] sont, d’une part,
les polynômes constants qui sont irréductibles dans A, d’autre part les polynômes de A[X] qui sont primitifs
et irréductibles dans K[X].
Preuve. Il est facile de vérifier que ces éléments sont irréductibles. En effet un polynôme constant ne peut
se factoriser qu’en produit de deux polynômes constants, donc un élément a est irréductible dans A si et
seulement si il est irréductible dans A[X]; si P est primitif et irréductible dans K[X] et si P = QR avec
Q, R ∈ A[X] alors Q ou R est inversible dans K[X] donc constant donc inversible sinon il ne serait pas
primitif. Inversement soit P un polynôme non constant. S’il n’est pas primitif, il n’est pas irréductible
puisqu’on peut le factoriser P = c(P )P 0 avec c(P ) et P 0 non inversibles. Si P est primitif et non irréductible
dans K[X], montrons qu’il n’est pas irréductible dans A[X]. En effet si P = QR avec Q, R ∈ K[X] et
deg(Q), deg(R) ≥ 1, on peut écrire Q = (a/b)Q0 et R = (c/d)R0 avec a, b, c, d ∈ A et Q0 , R0 ∈ A[X] primitifs.
On a donc bdP = acQ0 R0 donc bd et ac diffèrent d’un élément inversible, disons u, donc P = uQ0 R0 avec
u ∈ A∗ .
39
donc B aussi. On remarquera que, si I est infini, l’anneau B n’est pas noethérien, même si A est noethérien
ou même est un corps.
Preuve. Il suffit de prouver que si A est factoriel, alors A[X] est factoriel. Introduisons K := Frac(A) le
corps des fractions de A. Montrons d’abord l’existence d’une décomposition en éléments irréductibles. Tout
polynôme P ∈ A[X], se factorise sous la forme P = Qm 1 . . . Qr
1 mr
avec Qi irréductibles dans K[X]. Ecrivons
comme précédemment Qi = (ai /bi )Q0i avec ai , bi ∈ A et Q0i ∈ A[X] primitifs. On obtient bm mr
1 . . . br P =
1
mr 0m1
am
1
1
. . . ar Q 1 . . . Q 0mr
r et, en observant qu’il existe c ∈ A tel que a m1
1 . . . a mr
r = cbm1
1 . . . b mr
r on conclut que
P = cQ0m 1
1
. . . Q0mr
r . En écrivant c comme produit d’irréductibles de A on obtient la décomposition cherchée.
Montrons maintenant l’unicité de la décomposition en éléments irréductibles. Soit donc P se décomposant
en
P = a`11 . . . a`t t Qm
1 . . . Qr
1 mr
= bh1 1 . . . bhuu R1n1 . . . Rsns
avec ai , bj irréductibles dans A et Qi , Rj non constants et irréductibles dans A[X], donc primitifs et
irréductibles dans K[X]. En utilisant l’unicité de la décomposition dans K[X], on voit que r = s et que,
quitte à permuter les indices, Qi = λi Ri avec λi ∈ K ∗ et mi = ni . Mais si l’on écrit λi = αi /βi avec
αi , βi ∈ A on voit que βi Qi = αi Ri ∈ A[X] donc, comme Qi et Ri sont primitifs, βi et αi sont associés et
λ est une unité de A. On en déduit que Qi et Ri sont associés et que λa`11 . . . a`t t = bh1 1 . . . bhuu avec λ ∈ A∗ .
L’unicité de la décomposition dans A permet alors de conclure.
40
B.4. Ensembles algébriques et idéaux de K[X1 , . . . , Xn ]
On désigne par K un corps quelconque. A un moment donné on supposera K algébriquement clos i.e. que tout
polynôme non constant à coefficients dans K possède une racine dans K (par exemple C est algébriquement
clos). Le point de départ de la géométrie algébrique est l’étude des ensembles de zéros communs d’une famille
de polynômes.
Définition. Un sous-ensemble algébrique de K n est un ensemble du type
Z = {x ∈ K n | ∀P ∈ S, P (x) = 0}
Remarque. Il y a deux raisons simples qui font qu’en général l’inclusion I ⊂ I (V(I)) n’est pas une égalité.
(a) Si le corps K n’est pas algébriquement clos, il existe P ∈ K[X], polynôme non constant et sans racine
dans K; considérons donc I = P K[X]. Par hypothèse V(I) = ∅ et donc I (V(I)) = K[X] 6= I.
(b) Même si K est algébriquement clos il y un obstacle dû au fait que “P = 0” et “P m = 0” définissent les
mêmes ensembles algébriques. Concrètement si P est un polynôme irréductible de K[X1 , . . . , Xn ] tel
que, si I1 = P K[X1 , . . . , Xn ], on a I (V(I1 )) = I1 , posons Im = P m K[X1 , . . . , Xn ]. On constate alors
que I (V(Im )) = I1 6= Im .
On peut remédier à l’obstacle (a) en remplaçant K par sa clôture algébrique. On peut remédier à l’obstacle
(b) en remplaçant I par son radical :
Définition. Le radical d’un idéal
√ I dans un anneau (commutatif) A est l’ensemble des éléments dont une
puissance est dans I; on le note I. En symbole :
√
I := {a ∈ A | ∃m ≥ 1, am ∈ I}.
41
√ √
Remarque. On a clairement,
p√ pour tout idéal I légalité V(I) = V( I) et les inclusions I ⊂ I ⊂ I (V(I)).
√ √
On a visiblement I = I; cela suggère de considérer les idéaux I réduits, i.e. tels que I = I. On va
montrer que, lorsque K est algébriquement clos, les correspondances I 7→ V(I) et Z 7→ I(Z) induisent deux
bijections réciproques l’une de l’autre entre idéaux réduits de K[X1 , . . . , Xn ] d’une part et sous-ensembles
algébriques de K n d’autre part. Le point clef est le célèbre résultat:
Théorème. (Nullstellensatz ou Théorème des zéros de Hilbert) Soit K un corps algébriquement clos.
Soient P1 , . . . , Pm , Q ∈ K[X1 , . . . , Xn ] tels que, pour tout x ∈ K n , on ait P1 (x) = . . . = Pm (x) = 0 implique
Q(x) = 0, alors il existe t ≥ 1 et A1 , . . . , Am ∈ K[X1 , . . . , Xn ] tels que
Qt = A1 P1 + . . . + Am Pm .
√
Ce résultat peut se traduire en le fait que, pour tout idéal I, on a I(V(I)) = I et en particulier, si I est
réduit, I(V(I)) = I.
Preuve. Nous allons donner la preuve pour K = C en indiquant ce qui resterait à démontrer dans le cas
général. Tout d’abord nous allons déduire le théorème du résultat apparemment plus faible.
Proposition. (Nullstellensatz “faible”) Soit K un corps algébriquement clos. Soient P1 , . . . , Pm des
polynômes de K[X1 , . . . , Xn ] sans zéros communs dans K n , alors il existe A1 , . . . , Am ∈ K[X1 , . . . , Xn ]
tels que
1 = A1 P1 + . . . + Am Pm .
Preuve (que la version “faible” entraı̂ne le théorème). On introduit pour la preuve une indéterminée
supplémentaire T et on observe que les polynômes P1 , . . . , Pm , 1 − T Q n’ont aucun zéro commun dans
K n+1 et donc il existe A1 , . . . , Am , B ∈ K[X1 , . . . , Xn , T ] tels que
42
vectoriel. Pour chaque xi , ou bien xi est algébrique sur K ou bien il est transcendant sur K. Mais, dans
le cas où l’un des xi serait transcendant, on aurait K[T ] ∼= K[xi ] ⊂ L donc K(T ) ∼ = K(xi ) ⊂ L (puisque L
est un corps). Or la théorie de la décomposition en éléments simples des fractions rationnelles nous apprend
que les fractions
1
|a∈K
T −a
sont K-linéairement indépendantes. Si card(K) > card(N) ceci entraı̂ne une contradiction et termine la
preuve.
Terminons par quelques remarques concernant la topologie de Zariski. Tout d’abord chaque sous-ensemble
algébrique de K n est muni d’une topologie induite par celle de Zariski. La correspondance entre idéaux et
sous-ensembles algébriques, plus le fait que K[X1 , . . . , Xn ] est noethérien entraı̂ne l’assertion suivante.
Proposition. Soit . . . ⊂ Zn+1 ⊂ Zn ⊂ . . . ⊂ Z1 ⊂ K n une suite décroissante de sous-ensemble algébriques,
alors cette suite est stationnaire.
Preuve. En effet Zi = V(I(Zi )) et I(Zn ) ⊂ I(Zn+1 ) donc la suite des I(Zn ) est stationnaire.
Remarquons que cette propriété peut s’interpréter comme une propriété de compacité (sans la propriété
d’être séparé) : d’une intersection vide de fermés, on peut extraire une intersection finie qui est encore vide.
Par ailleurs, si K est fini, la topologie de Zariski est la topologie discrète sur K n . On supposera donc K
infini pour la suite. On peut étudier les notions classiques (connexité, compacité, etc.); en fait la notion
suivante est plus naturelle dans ce contexte:
Définition. Un espace topologique Z est irréductible s’il n’est pas réunion de deux fermés non triviaux,
c’est-à-dire que Z = F1 ∪ F2 avec F1 , F2 fermés entraı̂ne F1 = Z ou F2 = Z.
Remarque. Il revient au même de demander que tous les ouverts non vides soient denses dans Z (considérer
Oi = Z \ Fi ). On voit donc qu’un espace irréductible n’est jamais séparé (sauf s’il est réduit à un point).
Exemple. Lorsque K est infini, l’espace K n , muni de la topologie de Zariski est irréductible. Il suffit, pour
vérifier cela, de montrer qu’un polynôme P ∈ K[X1 , . . . , Xn ] s’annulant sur le complémentaire des zéros
d’un polynôme Q non nul est en fait identiquement nul. Mais, dans ce cas, le polynôme P Q s’annule sur
K n tout entier et est donc nul (ici l’on utilise l’hypothèse K infini) donc, comme Q n’est pas nul, on en tire
bien P = 0.
Proposition. Un ensemble algébrique Z ⊂ K n est irréductible si et seulement si l’idéal I(Z) est premier.
Preuve. Supposons Z = Z1 ∪ Z2 avec Z1 6⊂ Z2 et Z2 6⊂ Z1 et posons Ii = I(Zi ) pour i = 1, 2. On a donc
I2 6⊂ I1 et I1 6⊂ I2 et on peut choisir P1 ∈ I1 \ I2 et P2 ∈ I2 \ I1 de sorte que P1 P2 s’annule sur Z donc
P1 P2 ∈ I(Z) mais P1 (resp. P2 ) ne s’annule pas sur tout Z2 (resp. sur tout Z1 ) et donc P1 ∈ / I(Z) (resp.
P2 ∈/ I(Z)), ce qui montre que I(Z) n’est pas premier. Supposons maintenant que I(Z) ne soit pas premier
et soit P1 , P2 ∈
/ I(Z) tels que P1 P2 ∈ I(Z). Posons Zi := {x ∈ Z | Pi (x) = 0} pour i = 1, 2. On a clairement
Zi fermé et Z = Z1 ∪ Z2 . Si on avait disons Z1 ⊂ Z2 alors P2 s’annulant sur Z2 s’annulerait sur Z et on
aurait P2 ∈ I(Z), ce qui est une contradiction.
Tous les ensembles algébriques ne sont pas irréductibles. Par exemple si Z ⊂ K 2 est défini par xy = 0 on
voit immédiatement que Z est réunion de deux fermés – les droites définies par x = 0 et y = 0 – qui sont
irréductibles. Ce phénomène est général.
Proposition. Soit Z un sous-ensemble algébrique de K n , alors Z est réunion finie de sous-ensembles
algébriques irréductibles Z = Z1 ∪ . . . ∪ Zm . Si de plus on impose que Zi 6⊂ Zj pour i 6= j, alors les Zi sont
uniques.
Preuve. Le fait que Z soit réunion finie de sous-ensembles irréductibles est immédiat à partir du caractère
noethérien : si ce n’était pas le cas on pourrait écrire une suite infinie strictement décroissante de sous-
ensembles algébriques. En effet si Z n’est pas irréductible Z = Z1 ∪ Z2 et si, disons, Z2 n’est pas irréductible
on continue la décomposition. Il est clair que l’on peut construire (en éliminant les composantes “inutiles”)
43
une décomposition Z = Z1 ∪. . .∪Zm avec Zi 6⊂ Zj pour i 6= j. Si Z = Y1 ∪. . .∪Yn est une autre décomposition
en irréductibles, Observons que Y1 = (Z1 ∩ Y1 ) ∪ . . . ∪ (Zm ∩ Y1 ) donc, comme Y1 est irréductible il existe i
tel que Zi ∪ Y1 = Y1 c’est-à-dire Y1 ⊂ Zi . Par symétrie Zi doit être contenu dans un des Yj donc dans Y1
(sinon on aurait Y1 ⊂ Yj ). On conclut que Y1 est égal à Zi .
44
C. CORPS.
Remarque. Le lemme ne dit pas que φ est un isomorphisme, et d’ailleurs il n’est pas en général surjectif
(prendre par exemple K = (Z/pZ)(X)); par contre φ est toujours injectif, comme le montre un lemme
ci-dessous, et définit donc un isomorphisme avec un sous-corps de K que l’on note souvent K p . Dans le cas
K = (Z/pZ)(X) on voit aisément que K p = (Z/pZ)(X p ) 6= (Z/pZ)(X).
Un autre phénomène spécifique à la caractéristique p est la possibilité pour un polynôme d’avoir une dérivée
identiquement nulle sans être constant. En effet si car(K) = p et si P ∈ K[X] est non constant, posons
Q(X) := P (X p ) alors Q0 (X) ≡ 0. On définit ici bien sûr formellement la dérivée de P = an X n + . . . + a0 par
P 0 = nan X n−1 + (n − 1)an−1 X n−2 + . . . + a1 . Montrons que la dérivée permet néanmoins de caractériser
les racines simples d’un polynôme même en caractéristique p.
Lemme. Soit K un corps, α ∈ K et P ∈ K[X]. Alors (X − α) divise P si et seulement si P (α) = 0; de plus
(X − α)2 divise P si et seulement si P (α) = P 0 (α) = 0.
Preuve. On écrit d’abord la division euclidienne P = (X − α)Q + R avec deg(R) < 1 donc R est constant
et P (α) = R d’où le premier énoncé. On écrit ensuite la division euclidienne P = (X − α)2 Q + R avec
deg(R) ≤ 1 donc R(X) = aX + b. On a donc P 0 (α) = R0 (α) = a donc P 0 (α) = 0 entraı̂ne a = 0 et alors
P (α) = b = 0.
K ×L → L
(x, y) 7→ f (x)y
45
Preuve. Nous donnons la preuve lorsque ces dimensions sont finies, en fait l’énoncé et même la preuve restent
valables avec des cardinaux quelconques. Considérons e1 , . . . , em une base de L sur K et f1 , . . . , fn une base
de F sur L, nous allons montrer que {ei fj | 0 ≤ i ≤ m, 0 ≤ j ≤ n} fournit une base de LP sur K. Montrons
n
d’abord que c’est une partie génératrice. Soit x ∈ F , alors il existe λi ∈ L tels Pm que x = i=1 λi fi (car les
fj forment une L-base de F ). Par P ailleurs il existe αij ∈ K tels que λ i = j=1 αij e j (car les ej forment
une K-base de L) et donc x = i,j α ij ej f i . Montrons maintenant l’indépendance linéaire. Si αij ∈ K
P P P P
et i,j αij ej fi = 0 alors i j αij ej fi = 0 donc j αij ej = 0 (puisque les fi sont L-linéairement
indépendants) et donc les αij sont nuls (puisque les ej sont K-linéairement indépendants).
Un corollaire “évident” est que, si K ⊂ L ⊂ F alors [L : K] ≤ [F : K]; de plus, si ces dimensions sont finies,
on a [L : K] = [F : K] si et seulement si F = L.
Terminons ce paragraphe en citant sans détail d’autres exemples de corps.
(i) Soit p premier, considérons
Y
Zp := (an )n≥1 ∈ Z/pn Z | an+1 ≡ an mod pn .
n≥1
C’est un anneau intègre, appelé l’anneau des entiers p-adiques, son corps des fractions Qp appelé le corps
des nombres p-adiques. On peut montrer que Qp est un analogue de R au sens qu’il est la complétion
de Q pour la valeur absolue |x|p := p−ordp (x) .
(ii) Soit U un ouvert connexe du plan complexe, alors l’ensemble M(U ) des fonctions méromorphes sur U
est un corps.
P∞
(i) Soit K un corps, l’ensemble des séries formelles n=0 an X n peut être muni d’une structure d’anneau
noté K[[X]]. En rendant inversible X, on obtient un corpsPappelé corps des séries formelles et noté
∞
K((X)). On peut aussi le voir comme l’ensemble des séries n≥−n0 an X n .
46
Preuve. Il suffit de montrer que [K(α, β) : K] < ∞. En effet on aura alors, pour tout élément x ∈ K(α, β)
l’inégalité [K(x) : K] ≤ [K(α, β) : K] < ∞ et donc x algébrique sur K. Mais par ailleurs on a
est un sous-corps de L.
Preuve. L’ensemble F est stable par toutes les opérations de corps donc est un sous-corps de L.
Exemple. Considérons Q̄ := {x ∈ C | est algébrique sur Q}, c’est un sous-corps de C. De plus Q̄ est
algébriquement clos. En effet soit P = X n + an−1 X n−1 + . . . + a0 ∈ Q̄[X], montrons qu’il possède une racine
dans Q̄. Introduisons K = Q(a0 , . . . , an−1 ) alors [K : Q] < ∞. En effet
et [Q(a0 , . . . , ai ) : Q(a0 , . . . , ai−1 )] ≤ [Q(ai ) : Q] < ∞. Soit maintenant x ∈ C une racine de P (il en existe
puisque C est algébriquement clos) alors, comme P ∈ K[X] on a [K(x) : K] < ∞ donc [Q(x) : Q] ≤ [K(x) :
Q] = [K(x) : K][K : Q] < ∞. Donc x est algébrique sur Q et appartient donc bien à Q̄.
Nous disposons maintenant de tous les outils nécessaires pour construire des extensions de corps. Nous
savons déjà construire, à partir de K le corps K(X) = Frac(K[X]). Soit P = a0 + a1 X + . . . + an X n un
polynôme irréductible de K[X] alors L := K[X]/P K[X] est un corps qui contient de manière naturelle un
sous-corps isomorphe à K. En effet considérons
j s
i = s ◦ j : K ,→ K[X] → K[X]/P K[X]
on obtient K 0 := i(K) ∼ = K. Montrons que l’élément α ∈ L égal à la classe de X dans K[X]/P K[X] est
racine de P 0 = i(a0 ) + i(a1 )X + . . . + i(an )X n ∈ K 0 . En effet
On voit qu’ainsi on peut fabriquer des extensions L d’un corps K quelconque, telles que des polynômes
donnés à coefficients dans K admettent des racines dans L. On peut se demander si de telles constructions
sont uniques en un certain sens. Voici la réponse.
47
Théorème. Soit K un corps et P ∈ K[X] non constant.
(i) Il existe L ⊃ K telle que L contienne une racine de P . De plus, si P est irréductible dans K[X] et si L
est minimale (i.e. si K ⊂ L0 ⊂ L et P possède une racine dans L0 alors L = L0 ) alors L est unique à
isomorphisme près et s’appelle un corps de rupture de P (en fait L ∼ = K[X]/P K[X]).
(ii) Il existe une extension L ⊃ K telle que P soit scindé sur L c’est-à-dire P = a(X − α1 ) . . . (X − αn ) avec
a, α1 , . . . , αn ∈ L et minimale; une telle extension est unique à isomorphisme près et s’appelle le corps de
décomposition de P sur K.
Preuve. (i) Soit L un corps contenant une racine α de P , alors K(α) ⊂ L donc L est minimal si et seulement
si L = K(α); dans ce cas l’évaluation en α induit un isomorphisme K[X]/P K[X] ∼ = K(α) = L. Prouvons
maintenant, par récurrence sur n = deg(P ), l’existence d’un corps de décomposition. Soit P1 un facteur
irréductible de P et K1 un corps de rupture minimal de P1 dans lequel il acquiert une racine α1 . Alors, dans
K1 [X] on peut factoriser P = (X −α1 )Q. On dispose, par hypothèse de récurrence, d’une extension L1 ⊃ K1
sur laquelle Q, et par conséquent P est scindé, i.e. P = a(X − α1 ) . . . (X − αn ) avec a, α1 , . . . , αn ∈ L1 .
On pose L := K(α1 , . . . , αn ) et alors P est encore scindé sur L et L est minimal puisque si K ⊂ L0 ⊂ L et
P scindé sur L0 alors L0 contient K et les racines de P , c’est-à-dire α1 , . . . , αn donc contient L. Prouvons
maintenant, par récurrence sur n = deg(P ), l’unicité (à isomorphisme près) d’un corps de décomposition.
Pour faciliter l’induction, on va démontrer un résultat un tout petit plus général (qui achèvera la preuve du
théorème) :
Lemme. Soit i : K → K 0 un isomorphisme de corps. Soit P un polynôme de K[X] et L un corps de
décomposition de P sur K et soit L0 un corps de décomposition de i(P ) sur K 0 alors il existe un isomorphisme
φ : L → L0 qui prolonge i.
Preuve. Tout d’abord on étend i en un isomorphisme K[X] → K 0 [X] que l’on note encore i. Soit α1 ∈ L
une racine de P et P1 son polynôme minimal alors P = P1 Q et i(P ) = i(P1 )i(Q). Soit α10 ∈ L0 une racine
de i(P1 ). Alors L1 = K(α1 ) est un corps de rupture de P1 et L01 = K(α10 ) est un corps de rupture de
i(P1 ) donc on peut prolonger i en un isomorphisme φ1 : L1 :→ L01 qui envoie α1 sur α10 . La factorisation
P = (X − α1 )R dans L1 [X] se traduit par la factorisation i(P ) = (X − α10 )φ1 (R) dans L01 [X]. Mais L est
un corps de décomposition de R sur L1 et L0 est un corps de décomposition de φ1 (R) sur L01 donc, par
hypothèse de récurrence, l’isomorphisme φ1 se prolonge en un isomorphisme φ : L → L0 .
√
Exemple de corps de décomposition. Soit K =√Q et P = X n − 2, alors un corps
√ de rupture est Q( n 2) et
un corps de décomposition L = Q exp(2iπ/n) n 2, k = 0, 1, . . . , n − 1 = Q n 2, exp(2iπ/n) .
Ces théorèmes généraux montrent l’importance des polynômes irréductibles dans K[X]. Il est clair que les
polynômes de degré 1 sont toujours irréductibles. De même un polynôme de degré 2 ou 3 est irréductible
si et seulement si il ne possède pas de racine dans K. Déterminer les autres polynômes irréductibles est
nettement plus délicat en général. Nous rappelons seulement ici que les seuls polynômes irréductibles de
R[X] sont les polynômes de degré 1 et les polynômes du second degré sans racines réelles; nous donnons
aussi deux critères d’irréductibilité et l’exemple des polynômes cyclotomiques.
Proposition. Soit A un anneau factoriel et K := Frac(A), soit P = an X n + . . . + a0 ∈ A[X] et soit p ∈ A
un élément irréductible.
(i) (Critère d’Eisenstein) Supposons que p ne divise pas an , que p divise an−1 , . . . , a0 , mais que p2 ne divise
pas a0 , alors P est irréductible dans K[X].
(ii) (Critère de réduction) Supposons que p ne divise an , et que P̄ ∈ (A/pA)[X] soit irréductible, alors P
est irréductible dans K[X].
Preuve. Pour les deux critères, on considère l’homomorphisme de réduction des coefficients d’un polynôme
P 7→ P̄ de A[X] dans (A/pA)[X]. Supposons donc que P = QR avec Q, R ∈ A[X], on en déduit P̄ = Q̄R̄.
L’hypothèse de (i) indique que P̄ = uX n avec u 6= 0. Ainsi uX n = Q̄R̄ entraı̂ne Q̄ = vX d et R̄ = wX n−d , si
d 6= 0, n on en tirerait que Q = qd X d + . . . + q0 avec p divisant q0 et R = rn−d X n−d + . . . + r0 avec p divisant
r0 ; d’où p2 divise q0 r0 , ce qui contredirait les hypothèses. On conclut que Q̄ ou R̄ est constant et donc Q ou
R est constant. L’hypothèse de (ii) indique que Q̄ ou R̄ est inversible donc constant dans (A/pA)[X]. Mais
l’hypothèse an ∈ / pA entraı̂ne que les coefficients dominants de Q et R ne sont pas non plus divisibles par p
et donc que deg(Q) = deg(Q̄) et deg(R) = deg(R̄) donc l’un des deux est constant.
48
Remarques et exemples. Si l’on sait de plus que c(P ) = 1 alors, sous les hypothèses de l’un des deux critères,
on a P irréductible dans A[X]. En utilisant le critère d’Eisenstein pour A = Z et p = 2, on voit que X n −2 est
irréductible dans Q[X] (ou Z[X]). En utilisant le critère d’Eisenstein pour A = Z[Y ] et p = Y , on voit que
P = (Y − 1)X n − Y 2 X + Y est irréductible dans A[Y ] = Z[X, Y ]. Le polynôme P̄ = X 4 + X + 1 ∈ Z/2Z[X]
est irréductible, en effet il n’a pas de racine dans Z/2Z et le seul polynôme irréductible sur Z/2Z de degré
deux est X 2 + X + 1 qui ne divise pas P̄ . Par conséquent le polynôme P = 11X 4 − 6X 3 + 4X 2 + 7X − 5 est
irréductible dans Q[X] (ou Z[X]).
Les polynômes cyclotomiques sont les facteurs irréductibles de X n − 1 dans Q[X] (ou Z[X]); on peut les
définir ainsi:
Définition. Soit n ≥ 1, le n-ème polynôme cyclotomique est défini par
Y
Φn (X) = (X − ζ)
ζ∈µ∗
n
où µ∗n est l’ensemble des racines n-èmes primitives de l’unité (dans C).
Avec la définition donnée Φn ∈ C[X] et il est clair que deg(Φn ) = φ(n) et que
Y
Xn − 1 = Φd (X) (∗)
d|n
Cependant il est moins évident qu’en fait Φn ∈ Z[X] et que Φn est irréductible dans Q[X] (ou Z[X]).
Commençons par voir que les coefficients de Φn sont entiers. Il est clair que Φ1 (X) = X − 1 ∈ Z[X]. On
peut alors
Q démontrer ce que l’on veut par induction sur n en utilisant la formule (∗). En effet le polynôme
B := d | n,d6=n Φd (X) est unitaire et, par hypothèse de récurrence, à coefficients entiers; on peut donc
effectuer dans Z[X] la division euclidienne X n = BQ + R. La formule (∗) garantit alors que R = 0 et
Q = Φn . Nous concluons avec le résultat suivant:
Théorème. Le polynôme Φn est irréductible dans Z[X].
Preuve. Soit ζ une racine primitive n-ème de l’unité et P son polynôme minimal sur Q, on veut montrer
que P = Φn . Observons d’abord que P ∈ Z[X]. Choisissons ensuite p un nombre premier ne divisant pas n
alors ζ p est encore une racine primitive n-ème de l’unité. Soit Q son polynôme minimal qui est également
dans Z[X]. Si P et Q étaient distincts, le produit P Q diviserait Φn . Mais comme Q(ζ p ) = 0 on voit que ζ
est racine de Q(X p ) et donc Q(X p ) = P (X)R(X) pour un certain R ∈ Z[X]. En réduisant les coefficients
modulo p on obtient:
Q̄(X p ) = Q̄(X)p = P̄ (X)R̄(X).
ou encore P̄ (X) divise Q̄(X)p dans (Z/pZ)[X] mais les facteurs de X n − 1 et donc de P̄ (X) sont simples
dans (Z/pZ)[X] (la dérivée de X n − 1 est nX n−1 et on a pris soin de choisir p ne divisant pas n) donc en fait
P̄ (X) divise Q̄(X). Mais alors P̄ (X)2 divise Φ̄n (X) dans (Z/pZ)[X], ce qui contredit le fait que les facteurs
de Φ̄n (X) sont simples. En résumé on a prouvé que, pour p premier ne divisant pas n, le polynôme minimal
de ζ annulait ζ p . On en tire aisément que, si m est premier avec n alors P (ζ m ) = 0. Ainsi deg(P ) ≥ φ(n)
et comme P divise Φn , on a donc P = Φn et ce dernier est irréductible.
49
C.3. Corps finis.
Nous verrons en appendice qu’un corps fini est nécessairement commutatif. Si K est fini, sa caractéristique
est un nombre premier p et K est un espace vectoriel de dimension finie (disons n) sur Z/pZ. On en tire en
particulier que card(K) = card ((Z/pZ)n ) = pn . Nous allons démontrer
Théorème. Soit p un nombre premier et un entier n ≥ 1, alors il existe un corps de cardinal pn , unique à
isomorphisme près. On le note Fpn .
Remarque. Si n = 1 on connait déjà ce résultat et en fait Fp = Z/pZ. Cependant, si n ≥ 2, on a
Fpn ∼= (Z/pZ)n en tant que Z/pZ-espaces vectoriels ou en tant que groupes additifs mais pas en tant
qu’anneaux. On a ainsi trois anneaux à ne pas confondre : Z/pn Z, (Z/pZ)n et Fpn .
Exemple. Le polynôme X 2 + X + 1 ∈ F2 [X] est irréductible donc F2 [X]/(X 2 + X + 1)F2 [X] est un corps
de dimension 2 sur F2 donc de cardinal 4 donc isomorphe à F4 .
Revenons à un corps fini K de cardinal q = pn . On sait donc que card(K ∗ ) = q − 1 et donc que pour tout
x ∈ K ∗ on a xq−1 = 1 et donc pour tout x ∈ K on a xq − x = 0. Remarquons que Q si X q − X est considéré
q
comme un polynôme à coefficients dans Fp on obtient la factorisation X − X = α∈K (X − α) ∈ K[X].
Ceci suggère l’énoncé suivant:
Théorème. Soit q = pn et K le corps de décomposition de X q − X sur Fp = Z/pZ. C’est un corps de
cardinal q = pn et tout corps de cardinal q lui est isomorphe.
q
Qq de décomposition de X − X sur Fq p = Z/pZ, c’est un corps
Preuve. Il suffit de prouver que si K est le corps
q
de cardinal q. Dans K[X] on a X − X = i=1 (X − αi ). Posons S := {α ∈ K | α − α = 0}. L’ensemble S
des racines de X q − X dans K a pour cardinal q car X q − X est scindé sur K et les racines sont simples car
la dérivée est le polynôme constant −1. Montrons que S est un sous-corps de K et donc K = S. En effet si
αq − α = 0 et β q − β = 0 alors (α + β)q − (α + β) = αq + β q − α − β = 0 et donc α + β ∈ S; par ailleurs si
p 6= 2, on a (−α)q − (−α) = −αq + α = 0 donc −α ∈ S; enfin (αβ)q = αq β q = αβ donc αβ ∈ S et (si α est
non nul) (α−1 )q = α−q = α−1 donc α−1 ∈ S.
Remarques. Il est clair que l’homomorphisme φ : Fpn → Fpn défini par φ(x) = xp est un isomorphisme car
une application injective entre deux ensembles finis de même cardinal est une bijection. On a clairement
n
φn = idFpn puisque xp = x pour tout x ∈ Fpn . Par ailleurs, nous avons vu qu’un sous-groupe fini de K ∗
(avec K corps commutatif) est cyclique, donc F∗pn est isomorphe (comme groupe) à Z/(pn − 1)Z. On voit
donc que l’application x 7→ xm définit une bijection de F∗pn (ou Fpn ) si et seulement si PGCD(m, pn − 1) = 1;
c’est un homomorphisme de groupe sur F∗pn mais bien sûr pas un homomrphisme d’anneaux sur Fpn . Lorsque
d := PGCD(m, pn − 1) est différent de 1, le noyau est cyclique de cardinal d et on a (F∗pn : F∗m
pn ) = d.
Exercices. Montrer que Fq est (isomorphe à) un sous-corps de Fq0 si et seulement si q = pm et q 0 = pn avec
m divisant n.
Appendice : le théorème de Wedderburn.
Il s’agit du résultat suivant:
Théorème. (théorème de Wedderburn) Soit K un corps fini, alors K est commutatif.
Preuve. Soit Z = {x ∈ K | ∀y ∈ K, xy = yx} alors Z est clairement un sous-corps commutatif de K; notons
q = card(Z) et n = dimZ K. On va montrer par l’absurde qu’on ne peut avoir n ≥ 2. Considérons le groupe
K ∗ et son action sur lui-même par conjugaison. Soit y ∈ K ∗ , si on pose C(y) = {x ∈ K | xy = yx} alors
C(y) est un sous-corps de K qui contient Z; notons ny = dimZ C(y). On a C(y) = K si et seulement si
y ∈ Z et le stabilisateur de y sous l’action de K ∗ est C(y)∗ = C(y) \ {0}, ainsi la formule des classes s’écrit:
X card(K ∗ ) X qn − 1
q n − 1 = card(K ∗ ) = card(Z ∗ ) + ∗
=q−1+
card(C(y) ) q ny − 1
y∈R y∈R
50
le polynôme cyclotomique. On voit donc que q n − 1 = d | n Φd (q) et donc que Φn (q) divise q n − 1 et même
Q
(q n − 1)/(q ny − 1) lorsque ny < n. En revenantQ à l’équation des classes, on voit donc que Φn (q) divise q − 1.
En particulier |Φn (q)| ≤ q − 1. Mais |Φn (q)| = ζ |q − ζ| où ζ parcourt les racines n-èmes primitives et l’on
a |q − ζ| ≥ q − 1, d’où une contradiction si n ≥ 2.
En particulier, si P est homogène de degré d < n alors P possède un zéro non trivial (i;e. distinct de 0). On
pourra procéder ainsi P :
(a) Montrer que x∈k xm est nul si m = 0 ou si q − 1 ne divise pas m mais vaut −1 dans les autres cas.
[Comme le polynôme ”X 0 ” est le polynôme constant, il est naturel 0
P de prendre ici la convention 0 = 1].
(b) Soit P ∈ k[x1 , . . . , xn ] avec deg(P ) < (q − 1)n, en déduire que x∈kn P (x) = 0.
(c) Appliquer le résultat précédent à P (x)q−1 et conclure.
(d) Démontrer par une méthode analogue la généralisation suivante. Soient P1 , . . . , Ps des polynômes de
degrés d1 , . . . , ds avec d1 + . . . + ds < n, montrer que
En particulier, si les polynômes sont homogènes, ils ont un zéro commun non trivial.
Exercice. Montrer que Fpm ⊂ Fpn si et seulement si m divise n.
51
D. MODULES.
On donne une brève présentation de la théorie des modules sur un anneau commutatif avec comme objectif
et motivation la description de la décomposition d’un endomorphisme d’espace vectoriel et la détermination
de sa classe de similitude.
52
Soit N un sous-module de M , on peut construire le module quotient M/N comme le groupe abélien M/N
(déjà construit) muni de la multiplication par un scalaire a · (x + N ) = (a · x) + N . On a alors la propriété
universelle du quotient
Théorème Soit f : M → M 0 un homomorphisme de A-modules et soit N un sous-module et s : M → M/N
la surjection canonique.
(i) Il existe une application fˆ : M/N → M 0 telle que f = fˆ ◦ s si et seulement si N ⊂ Ker(f ).
(ii) Dans ce cas l’application fˆ est un homomorphisme de modules, son image est égale à celle de f (i. e.
fˆ(M/N ) = f (M )) et son noyau est Ker(f )/N .
Preuve. En terme de groupe quotient “tout” a déjà été prouvé; il reste seulement à vérifier que l’application
fˆ, quand elle existe, est bien un homomorphisme de modules, ce qui est immédiat.
Par exemple on en déduit que M/ Ker(f ) = ∼ Im(f ). Si N1 et N2 sont deux sous modules de M , l’application
x 7→ (x, −x) identifie N1 ∩ N2 à un sous-module de N1 × N2 et l’on voit que N1 + N2 ∼
= (N1 × N2 )/(N1 ∩ N2 ).
Les notions de combinaison linéaire, partie libre, de partie génératrice ou de base se définissent comme en
algèbre linéaire sur un corps. Néanmoins une différence notable est la non-existence de base d’un module
en général. En fait on peut introduire la notion suivante (qui n’a d’intérêt que si M n’est pas un espace
vectoriel ou encore si A n’est pas un corps).
Définition. Soit x élément d’un A-module M , on appelle annulateur de x l’idéal
Ann(x) = {a ∈ A | a · x = 0}.
Remarquons qu’un A-module M est automatiquement un A/ Ann(M )-module en posant ā · x = ax (ce qui
est loisible puisque ax ne dépend que de la classe ā de a modulo l’idéal Ann(M )).
Exemple. Soit M = A/I vu comme A-module (avec I idéal de A), on a clairement Ann(M ) = I. Considérons
M = Q/Z vu comme Z-module, pour tout élément x égal à la classe de a/b avec a et b premiers entre eux
on a Ann(x) = bZ, néanmoins Ann(M ) = {0}. Remarquons que l’ensemble
est un sous-module de M .
Supposons A intègre, lorsque l’annulateur d’un élémént non nul de M n’est pas réduit à {0} on voit tout de
suite qu’il ne peut pas exister de base sur A. On donne donc un statut spécial aux modules possédant une
base. On définit de même l’analogue de la dimension finie dans les espaces vectoriels.
Définition. Un A-module M est libre s’il possède une base (i. e. une partie libre et génératrice sur A). Il
est de type fini s’il possède une partie génératrice finie.
Ainsi un module libre de type fini est isomorphe à An . Il n’est pas évident que l’entier n soit unique, même si
cela est vrai ; au paragraphe suivant on vérifie que si A est principal et An ∼= Am alors m = n. Remarquons
aussi que A, considéré comme A-module, est libre de rang 1 et que ses sous-modules non nuls (c’est-à-dire
ses idéaux non nuls) sont libres de rang 1 si et seulement si A est principal.
53
Proposition. Soit A un anneau principal, M un A-module admettant deux bases B et B 0 alors card(B) =
card(B 0 ). Si M = N ⊕ N 0 et si B et B 0 sont des bases de N et N 0 respectivement, alors B ∪ B0 est une base
de M .
Preuve. Si A est un corps, le résultat est la base de l’algèbre linéaire. Sinon, soit a un élément irréductible
de A, alors k = A/aA est un corps et le module quotient M/aM est annulé par aA donc peut être vu comme
un k-module c’est-à-dire un k-espace vectoriel. Mais si e1 , . . . , er forment une base de M sur A et si l’on
désigne par ēi la classe de ei modulo aM , il est immédiat que ē1 , . . . , ēr forment une base de M/aM sur k.
L’entier r est donc la dimension du k-espace vectoriel M/aM et ne dépend donc pas de la base choisie. La
deuxième affirmation est immédiate.
Définition. Si M est un A-module libre de type fini, on appelle rang de M le cardinal d’une base.
Théorème Soit A un anneau principal, M un A-module libre de rang r, et N un sous-module alors
(i) Le module N est libre de rang s ≤ r.
(ii) Il existe e1 , . . . , er base de M sur A et a1 , . . . , as ∈ A tels que ai divise ai+1 et
N = Aa1 e1 ⊕ . . . ⊕ Aas es .
Preuve. La preuve se fait par récurrence sur l’entier r, le cas r = 1 étant vérifié précisément parce que
l’anneau A est supposé principal. Commençons par la preuve de (i). Si l’on note e1 , . . . , er une base de M
on peut écrire M = Ae1 ⊕ . . . ⊕ Aer et considérer l’homomorphisme de A-modules e∗r : M → A défini par
e∗r (a1 e1 + . . . + ar er ) = ar . L’ensemble e∗r (N ) est un sous-module, c’est-à-dire un idéal de A. Choisissons
x0 ∈ N tel que e∗r (x0 ) = a avec e∗r (N ) = aA. On va appliquer le lemme suivant
Lemme. Soit f : M → A un homomorphisme non nul de modules et x tel que f (x)A = f (M ) alors
M = Ker(f ) ⊕ Ax.
Preuve du lemme. Soit y ∈ Ker(f ) ∩ Ax alors y = ax et f (y) = af (x) = 0, mais f (x) 6= 0 car sinon
l’homomorphisme f serait nul, donc a = 0 (l’anneau A est intègre) et y = 0. Soit maintenant y ∈ M , on sait
qu’il existe b ∈ A tel que f (y) = bf (x) = f (bx), donc f (y − bx) = 0 et y − bx ∈ Ker(f ). On peut donc écrire
y = (y − bx) + (bx) ∈ Ker(f ) + Ax.
Si N ⊂ Ker(e∗r ) alors, comme Ker(e∗r ) = Ae1 ⊕ . . . ⊕ Aer−1 , on peut appliquer l’hypothèse de récurrence
et conclure que N est libre de rang ≤ r − 1. Sinon, en appliquant le lemme à e∗r : N → A on obtient que
N = (Ker(e∗r ) ∩ N ) ⊕ Ax0 . En appliquant l’hypothèse de récurrence au sous-module Ker(e∗r ) ∩ N ⊂ Ker(e∗r ),
on obtient que Ker(e∗r ) ∩ N est libre de rang ≤ r − 1. Donc N est libre de rang ≤ r.
Montrons maintenant (ii), toujours par récurrence sur r. Pour chaque homomorphisme de modules f : M →
A tel que f (N ) 6= 0, on choisit af ∈ A tel que f (N ) = af A et uf ∈ N tel que f (uf ) = af . On choisit ensuite
f1 tel que af1 A soit maximal parmi les af A. Remarque : cela signifie que si af1 A ⊂ af A alors af1 A = af A
mais on ne peut pas, à ce stade de la preuve, affirmer que af1 divise tous les af . Pour alléger les notations
on écrira a1 = af1 ; on choisit aussi u1 ∈ N tel que f1 (u1 ) = a1 . Montrons d’abord que pour tout f on a a1
divise f (u1 ). Appelons d = PGCD(a1 , f (u1 )), alors, d’après le théorème de Bézout, il existe b, c ∈ A tels que
d = ba1 + cf (u1 ). Considérons alors l’homomorphisme f 0 = bf1 + cf , on a f 0 (u1 ) = d donc af 0 divise d qui
divise a1 ou encore a1 A ⊂ af 0 A d’où a1 A = dA = af 0 A. Mais a1 = PGCD(a1 , f (u1 )) signifie exactement que
a1 divise f (u1 ). On en tire l’existence de e1 ∈ M telP que u1 = a1 e1 etP donc f (e1 ) = 1; en effet si y1 , . . . , yr
est une base de M alors yi∗ (u1 ) = a1 bi et donc u1 = i yi∗ (u1 )yi = a1 ( i bi yi ). On applique alors le lemme
précédent à f1 : M → A avec l’élément e1 puis à f1 : N → A avec l’élément u1 , ce qui donne
Comme, d’après (i), Ker(f1 ) est libre de rang r − 1, on peut lui appliquer l’hypothèse de récurrence et
conclure qu’il existe une base e2 , . . . , er de Ker(f1 ) et des éléments ar , . . . , ar ∈ A tels que ai divise ai+1 et
54
Il reste donc seulement à vérifier que a1 divise a2 . Pour cela considérons f = e∗1 + e∗2 ; on a f (a2 e2 ) = a2
donc af divise a2 et par ailleurs f (u1 ) = f (a1 e1 ) = a1 donc af divise a1 mais on a vu que cela entraı̂nait
a1 A = af A donc on a bien a1 qui divise a2 .
M∼
= Ar × A/a1 A × . . . × A/am A,
M∼
= An /N = (Ae1 ⊕ . . . ⊕ Aen ) / (Aa1 e1 ⊕ . . . ⊕ Aan en ) ∼
= A/a1 A × . . . × A/an A.
∼A
On peut omettre dans cette décomposition les facteurs avec ai inversible et si ai = 0 on peut écrire A/ai A =
d’où le résultat annoncé. L’unicité se démontre aisément à partir de l’observation que, d’une part M/bM ∼=
(A/bA)r × A/ PGCD(a1 , b)A × . . . × A/ PGCD(an , b)A et d’autre part bM ∼ = Ar × A/(a1 / PGCD(a1 , b))A ×
. . . × A/(an / PGCD(an , b))A.
Pour accentuer le parallèle avec les groupes abéliens, définissons un A-module cyclique comme un A-module
isomorphe à A/aA. Le théorème précédent affirme qu’un module de torsion et de type fini est isomorphe à
un produit ou somme fini de modules cycliques. Ceci est bien une généralisation du théorème décrivant les
groupes finis abéliens comme produit de groupes cycliques.
Terminons ce paragraphe en donnant une version utile du théorème de structure des sous-modules de An .
Lemme. Soit M ∈ Mat(n × m, A) avec A principal, il existe U ∈ GLn (A) et V ∈ GLm (A) et a1 , . . . , as ∈
A \ {0} avec s = rang(M ) ≤ min(m, n) et ai divisant ai+1 tels que
a1 O
0 a2
M =U ... 0 V.
as 0
0
Variante. Soit un homomorphisme f : An → Am , il existe e1 , . . . , en base de An et f1 , . . . , fm base de Am
et a1 , . . . , as ∈ A \ {0} avec s = rang(f ) ≤ min(m, n) et ai divisant ai+1 tels que
ai fi si 1 ≤ i ≤ s
f (ei ) =
0 sinon
Preuve. Prouvons par exemple la variante. Il existe ai et fi tels que le sous-module f (An ) ⊂ Am soit
égal à a1 Af1 ⊕ . . . ⊕ as Afs . Choisissons ei ∈ An tel que f (ei ) = ai fi (pour 1 ≤ i ≤ s); on a alors
An = Ae1 ⊕ . . . ⊕ Aes ⊕ Ker(f ). En choisissant es+1 , . . . , en une base de Ker(f ) on obtient l’énoncé.
55
On notera Eu le K[X]-module ainsi obtenu. On remarque tout de suite qu’il s’agit d’un module de type
fini. De plus, Ann(Eu ) est non trivial puisqu’il contient le polynôme caractéristique (théorème de Cayley-
Hamilton) donc le module Eu est de torsion (on peut aussi utiliser le fait que, pour x ∈ E, les vecteurs
x, u(x), u2 (x), . . . , un (x) sont liés).
Proposition. Soit u, v ∈ Endk (E), alors les K[X]-modules Eu et Ev sont isomorphes si et seulement si les
endomorphismes u et v sont semblables, c’est-à-dire qu’il existe une application K-linéaire inversible h telle
que v = h ◦ u ◦ h−1 .
Preuve. Pour distinguer les structures de K[X]-modules Eu et Ev dans cette preuve nous noterons P ·u x =
P (u)(x) et P ·v x = P (v)(x). Supposons qu’il existe h linéaire inversible telle que v = h ◦ u ◦ h−1 , alors
v m = h ◦ um ◦ h−1 et plus généralement P (v) = h ◦ P (u) ◦ h−1 donc
Par ailleurs, avant d’appliquer à notre situation les théorèmes de structure du paragraphe précédent, ob-
servons qu’un K[X]-sous-module de Eu n’est rien d’autre qu’un sous-espace vectoriel stable par u. Ainsi
une décomposition en somme de sous-modules correspond à une décomposition en somme de sous-espaces
vectoriels stables par u. De même un sous-module cyclique correspond à un sous-espace vectoriel engendré
par un vecteur x et ses images successives u(x), u2 (x), . . . par l’endomorphisme u.
D.3.2. Facteurs invariants d’un endomorphisme.
Le module Eu est isomorphe à K[X]/P1 K[X] × . . . × K[X]/Pr K[X] avec Pi non constants et Pi divise Pi+1 ,
de plus les Pi sont uniques (à un scalaire près), ce qui justifie la
Définition. Les polynômes Pi s’appellent les facteurs invariants de u.
Remarquons qu’il est assez facile de voir (démontrez-le!) que Pr est le polynôme minimal de u, tandis que le
polynôme caractéristique est égal au produit P1 . . . Pr . Nous allons généraliser cette observation ci-dessous.
D’après ce qui précède, u et v sont semblables si et seulement si ils ont mêmes facteurs invariants. Donnons
maintenant une interprétation de ces invariants et une méthode de calcul (théorique). Le module Eu se
décompose en E1 ⊕ . . . ⊕ Er avec Ei module cyclique de la forme K[X]/P K[X]. Ces sous-modules corre-
spondent à des sous-espaces vectoriels stables par u sur lequel u agit comme la multiplication par X sur
K[X]/P K[X]. Soit P = X d + pd−1 X d−1 + . . . + p0 , prenons comme K-base de K[X]/P K[X] les éléments
1, X, . . . , X d−1 et soit e1 , . . . , ed la K-base correspondante de Ei , la matrice de u dans cette base est une
matrice dite compagnon :
0 −p0
..
1 .
Mat(u; e1 , . . . , ed ) = . . . 0 −p
d−2
1 −pd−1
On obtient en particulier que toute matrice est semblable à une matrice dont les blocs diagonaux sont les
matrices compagnon associées à ses facteurs invariants.
Soit A la matrice de u dans une base. Définissons Di = Di (A) comme le PGCD des mineurs d’ordre i de la
matrice A − XId. En particulier Dn est le polynôme caractéristique de u ou A.
Théorème Les matrices A et B sont semblables si et seulement si Di (A) = Di (B) pour 1 ≤ i ≤ n.
56
Preuve. Posons A = Mat(u; (e1 , . . . , en ). La matrice A−Xid définit un endomorphisme Φ : K[X]n → K[X]n ;
définissons également µ : K[X]n → Eu par
Par ailleurs on a vu que le théorème de structure des sous-modules de modules libres peut s’interpréter
comme l’existence de deux matrices de changement de base U et V (à coefficient dans K[X]) et de polynômes
Q1 , . . . , Qn avec Qi divise Qi+1 et A − Xid = U diag(Q1 , . . . , Qn )V . On voit, d’une part, que le PGCD
des mineurs d’ordre i est Di = Q1 . . . Qi et d’autre part que K[X]n /Φ(K[X]n ) ∼ P × ... ×
= K[X]/Q1 K[X]
K[X]/Qn K[X] d’où l’on tire que K[X]n /Φ(K[X]n ) est un K-espace vectoriel de dimension deg(Qi ) =
deg det(A − Xid) = n. Comme K[X]n / Ker(µ) est de même dimension, on en tire Φ(K[X]n ) ⊂ Ker µ
et Eu ∼ = K[X]n /Φ(K[X]n ). L’unicité des facteurs invariants de u, disons, P1 , . . . , Pr , implique donc que
(Q1 , . . . , Qn ) = (1, . . . , 1, P1 , . . . , Pr ). Ainsi la donnée des facteurs invariants Pi équivaut à celle des Di , ce
qui achève la preuve.
Commentaire. La théorie des K[X]-modules nous donne que deux matrices (ou endomorphismes) sont
semblables si elles ont les mêmes polynômes “Pi ” et le raisonnement précédent montre que la donnée des
“Pi ” équivaut à celle des “Di ”. En fait explicitement Dn−i = P1 . . . Pr−i et Dn−r = . . . = D1 = 1.
Corollaire. Les matrices A et t A sont semblables.
Preuve du corollaire. En effet on a clairement Di (t A) = Di (A).
Exercice. Fabriquer deux matrices 4 × 4 non semblables ayant les mêmes polynômes caractéristiques et
minimaux (indication : choisir le polynôme minimal (X − λ)2 et le polynôme caractéristique (X − λ)4 ).
Peut-on fabriquer de tels exemples en dimension 2 ou 3 ?
Exercice. Démontrer de deux façons (en utilisant les résultats précédents et directement) l’énoncé suivant :
deux matrices A, B ∈ Mat(n × n, R) sont semblables sur C (i. e. il existe U ∈ GL(n, C) telle que B =
U AU −1 ) si et seulement si elles sont semblables sur R (i. e. il existe U ∈ GL(n, R) telle que B = U AU −1 ).
D.3.3. Classes de conjugaison de matrices sur un corps algébriquement clos.
On suppose dans ce paragraphe que le corps K est algébriquement clos et donc tout polynôme est scindé
sur K.
Définition. On appelle bloc de Jordan de taille d et valeur propre λ la matrice carrée
λ 0 ...
1 λ
..
0
1 .
J(d; λ) :=
.. ..
. .
1 λ 0
0 1 λ
Si λ = 0 on note simplement J(d) = J(d, 0). Remarquons que certains auteurs appellent bloc de Jordan
la transposée de J(d, λ) ; le principal intérêt de ces matrices est de fournir des représentants explicites des
classes de conjugaison de matrices et d’après le corollaire précédent J et t J sont semblables donc choisir
l’une ou l’autre a peu d’influence sur le résultat fondamental suivant
57
Théorème (Décomposition de Jordan) Toute matrice carrée est semblable à une matrice composée de blocs
de Jordan sur la diagonale et de zéros ailleurs, i.e. du type
J(d1 , λ1 )
J =
..
.
J(dr , λr )
{0} ⊂ K1 ⊂ . . . ⊂ Kr .
Choisissons Hi un supplémentaire de Kr−i dans Kr−i+1 c’est-à-dire tel que Kr−i+1 = Kr−i ⊕ Hi . Observons
que la restriction de u à Hi est injective (en effet Ker(u) = K1 ⊂ Kr−i donc Ker(u) ∩ Hi = {0}) et montrons
qu’on peut de plus imposer u(Hi−1 ) ⊂ Hi (ce qui montrera également que hi−1 ≤ hi ). En effet, une fois
choisi Hi , on remarque que si x ∈ Hi ⊂ Kr−i+1 est non nul, alors u(x) ∈ Kr−i mais u(x) ∈ / Kr−i−1 (sinon
x ∈ Kr−i ); on a donc u(Hi ) ∩ Kr−i−1 = {0} et u(Hi ) ⊂ Kr−i et l’on peut construire un supplémentaire
Hi+1 de Kr−i−1 dans Kr−i qui contienne u(Hi ). Le choix de H1 est arbitraire.
On peut maintenant choisir une base de E = ⊕i Hi ainsi (où l’on note hi = dim(Hi )
• On choisit B1 = (e1,j )1≤j≤h1 base de H1 .
• On choisit B2 = (e2,j )1≤j≤h2 base de H2 en imposant e2,j = u(e1,j ) pour j ≤ h1 .
• Ayant construit Bi = (ei,j )1≤j≤hi base de Hi , on choisit Bi+1 = (ei+1,j )1≤j≤hi+1 base de Hi+1 en
imposant ei+1,j = u(ei,j ) pour j ≤ hi .
On regroupe maintenant E = ⊕hj=1 r
Ej avec Ej le sous-espace vectoriel ayant pour base Bj0 = (ei,j )i∈Ij (où
Ij = {i | 1 ≤ i ≤ r et j ≤ hi }). On voit facilement que les Ej sont stables par u et que la matrice de u|Ej
dans la base Bj0 est une matrice de Jordan de taille dj = card(Ij ); en effet par construction u(ei,j ) = ei+1,j
sauf le dernier qui est nul. On obtient donc la matrice de u dans la base B 0 = B10 ∪ . . . Bh0 r
J(d ) 0 ...
1
0 J(d2 )
Mat(u, B 0 ) =
..
. 0
0 J(dhr )
58
La combinatoire un peu embrouillée peut être clarifiée par l’introduction des tableaux de Young. On calcule
hi = dim(Kr−i+1 ) − dim(Kr−i ). On dessine un premier tableau en rangeant hr carrés sur la première
ligne, puis hr−1 carrés sur la seconde et ainsi de suite (sur le dessin h7 = 6, h6 = h5 = 5, h4 = 2 et
h3 = h2 = h1 = 1), le tableau dual s’obtient en inversant ligne et colonnes. On obtient alors d1 carrés sur
la première ligne, d2 sur la deuxième etc. (sur l’exemple d1 = 7, d2 = 4, d3 = d4 = d5 = 3 et d6 = 1), ce
qui donne la taille des blocs de Jordan. Ce procédé permet, inversement, de calculer dim(Ki ) à partir de la
taille des blocs de Jordan.
59
E. GROUPES CLASSIQUES.
La géométrie “classique” ne considère souvent que la norme euclidienne sur Rn donnée par ||x||2 = x21 +
. . . + x2n et le produit scalaire associé hx|yi = x1 y1 + . . . + xn yn ainsi que la norme sur Cn donnée par
||z||2 = z1 z̄1 + . . . + zn z̄n et le produit hermitien associé hz|wi = z1 w̄1 + . . . + zn w̄n ainsi bien sûr que les
isométries associées. Plusieurs théories amènent néanmoins à considérer des formes plus générales :
• La relativité (ou l’équation des ondes) conduit à considérer la forme quadratique de Minkowski qui, en
notant (x1 , x2 , x3 , t) un vecteur de R4 , s’écrit ||x||2 = x21 + x22 + x23 − c2 t2 .
• Les équations de la mécanique de Lagrange (ou Hamilton) amène à introduire pour x, y ∈ R2n le produit
B(x, y) = (x1 y2 − x2 y1 ) + . . . + (x2n−1 y2n − x2n y2n−1 ). La parité de la dimension de l’espace s’explique par
le fait qu’on considère ensemble la “position” et la “vitesse” d’une particule (espace des phases).
• L’arithmétique oblige à considérer d’autres corps que R ou C, par exemple le problème de savoir si, pour
n et D donnés, on peut trouver des solutions entières de x2 + Dy 2 = n ou x21 + . . . + x2r = n.
• Les géométries finies (utiles en théorie des groupes, en combinatoire et bien sûr en informatique) requièrent
de travailler sur des corps finis Z/pZ ou plus généralement Fq .
Le paysage usuel se trouve ainsi démultiplié : si le corps K possède une topologie (par exemple, si K = R ou
C) on peut se demander si le groupe est compact, connexe, etc ; si le corps K est fini, on peut se demander
quel est le cardinal de ces groupes, etc. Néanmoins, une “surprise” est que cette diversification n’entraı̂ne
pas la multiplication des groupes associés. En fait à tous les étages, ce sont les groupes dit classiques,
c’est-à-dire le groupe des matrices carrés inversibles, le groupe des matrices de déterminant 1, le groupe des
matrices respectant une forme quadratique (groupe orthogonal), le groupe des matrices respectant une forme
alternée (groupe symplectique), le groupe des matrices respectant une forme hermitienne (groupe unitaire)
qui fournissent, à quelques exceptions près, les groupes “intéressants”. Nous ne montrerons pas cela (voir
l’article de Tits cité en bibliographie) mais incluons néanmoins cette affirmation pour motiver l’étude des
groupes classiques.
E.1. Formes sesqui-linéaires.
Définition. Soit E, F des K-espaces vectoriels, σ un automorphisme de K, une application f : E → F
est σ-linéaire si f (x + y) = f (x) + f (y) et f (ax) = σ(a)f (x). Une forme B : E × F → K est σ-sesqui-
linéaire si, pour y ∈ F , l’application B(., y) : E → K est une forme linéaire et, pour x ∈ E, l’application
B(x, .) : F → K est une forme σ-linéaire.
On appelle noyau à gauche de B (resp. à droite) l’ensemble
Kerg (B) = {x ∈ E |∀y ∈ F, B(x, y) = 0} (resp. Kerd (B) = {y ∈ F |∀x ∈ E, B(x, y) = 0})
Il est immédiat de voir que ce sont des sous-espaces vectoriels. On dit que B est non dégénérée si ses
noyaux à gauche et à droite sont nuls. La forme B induit une forme B̄ : E/ Kerg (B) × F/ Kerd (B) → K
définie par B̄(x + Kerg (B), y + Kerd (B)) := B(x, y). La forme B̄ est non dégénérée. Ces considérations
permettent en général de se ramener au cas des formes non dégénérées. Dans le cas d’une forme non
dégénérée B : E × F → K, on voit que l’application y → B(., y) induit une injection de F vers E ∗
donc dim(F ) ≤ dim(E ∗ ) ; l’application x → σ −1 ◦ B(x, .) induit une injection de E vers F ∗ et donc
dim(E) ≤ dim(F ∗ ). Dans le cas où E (ou F ) est de dimension finie, on en tire donc que dim(E) = dim(F )
et que B permet d’identifier E et F ∗ (ou F et E ∗ ). Les espaces E et F étant donc isomorphes, on voit que
le cas essentiel à considérer est celui d’une forme non dégénérée B : E × E → K, cas que nous considérons
donc désormais.
Il est naturel de considérer la relation d’orthogonalité x ⊥ y si B(x, y) = 0. Une condition naturelle à
imposer est que cette relation soit symétrique (i. e. x ⊥ y ⇔ y ⊥ x) ; une telle relation est décrite par la
proposition suivante
Proposition. Soit B : E × E → K une forme σ-sesqui-linéaire non dégénérée et vérifiant
x⊥y⇔y⊥x (∗)
60
alors on est dans un des trois cas suivant :
(i) (Forme symétrique) On a σ = id et ∀x, y ∈ E, B(x, y) = B(y, x).
(ii) (Forme anti-symétrique) On a σ = id et ∀x, y ∈ E, B(x, y) = −B(y, x).
(iii) (Forme σ-hermitienne) On a σ 6= id mais σ 2 = id et il existe α ∈ K ∗ tel que, si B 0 (x, y) = αB(x, y),
alors on a ∀x, y ∈ E, B 0 (x, y) = σ ◦ B 0 (y, x).
Preuve. Si dim(E) = 1, l’énoncé est trivial (et sans intérêt) ; on peut donc supposer dim(E) ≥ 2. Soit
x ∈ E \ {0}, considérons les formes linéaires fx (y) = B(y, x) et gx (y) = σ −1 ◦ B(x, y) ; elles ont, par
hypothèse, même noyau donc sont proportionnelles, c’est-à-dire qu’il existe α(x) ∈ K ∗ tel que fx = α(x)gx
ou encore B(y, x) = α(x)σ −1 ◦ B(x, y). Montrons d’abord que α ne dépend pas de x. Considérons pour cela
l’application i : E → E ∗ donnée par x 7→ fx qui est σ-linéaire et bijective et l’application j : E → E ∗ donnée
par x 7→ gx qui est σ −1 -linéaire et bijective. Introduisons h = j −1 ◦i : E → E, alors comme i(x) = α(x)j(x) on
a h(x) = j −1 (α(x)j(x)) = σ(α(x))j −1 ◦j(x) = σ(α(x))x. Ainsi h(x) = λ(x)x (en posant λ(x) = σ(α(x))) ; de
plus l’application h est σ 2 -linéaire. Si x, y sont non colinéaires, on a d’une part h(x+y) = λ(x+y)y+λ(x+y)x
d’autre part h(x + y) = h(x) + h(y) = λ(x)x + λ(y)y donc λ(x) = λ(x + y) = λ(y). Si enfin x et y sont
colinéaires, on peut choisir z non colinéaire avec x, y (car dim(E) ≥ 2) donc λ(x) = λ(z) = λ(y) et ainsi
α(x) = α(y) = α. On voit ainsi que h est linéaire (donc σ 2 = id) et que B(y, x) = ασ −1 ◦ B(x, y). Supposons
d’abord σ = id alors B(y, x) = αB(x, y) = α2 B(y, x) donc α2 = 1 ou encore α = ±1, ce qui donne les
deux premiers cas (i) et (ii). Supposons maintenant σ 6= id et commençons par montrer qu’il existe x0 ∈ E
tel que B(x0 , x0 ) = β 6= 0. En effet sinon on aurait pour tout x, y ∈ E l’égalité 0 = B(x + y, x + y) =
B(x, x) + B(x, y) + B(y, x) + B(y, y) = B(x, y) + B(y, x) donc B antisymétrique et bilinéaire contredisant
σ 6= id. Posons alors B 0 = β −1 B, remarquons que β = B(x0 , x0 ) = ασ −1 ◦ B(x0 , x0 ) = ασ −1 (β) et calculons
Si la caractéristique de K est deux, alors +1 = −1 et, par convention, on considèrera que si B(x, y) = B(y, x)
la forme est anti-symétrique (on exclut donc le cas (i)) en caractéristique 2). Dans le cas (i), la forme B
est associée à une forme quadratique Q(x) := B(x, x) et on parle de géométrie orthogonale ; le groupe
{f ∈ GL(E) | ∀x, y ∈ E, B(f (x), f (y)) = B(x, y)} s’appelle le groupe orthogonal de la forme Q (ou B) et se
note O(E, Q) ou O(Q). Le sous-groupe O(E, Q) ∩ SL(E) se note SO(Q) ; il est d’indice deux dans O(Q).
Dans le cas (iii), la forme B est associée à une forme hermitienne H(x) := B(x, x) et on parle de géométrie
unitaire ; le groupe {f ∈ GL(E) | ∀x, y ∈ E, B(f (x), f (y)) = B(x, y)} s’appelle le groupe unitaire de la forme
H (ou B) et se note U(E, H) ou U(H). Le sous-groupe U(E, H) ∩ SL(E) se note SU(H). Dans le cas (ii),
on parle de géométrie symplectique ; le groupe {f ∈ GL(E) | ∀x, y ∈ E, B(f (x), f (y)) = B(x, y)} s’appelle
le groupe symplectique de la forme B et se note Sp(E, B) ou Sp(B). On verra que Sp(B) ⊂ SL(E).
Remarque. Si B est symétrique et on pose Q(x) = B(x, x) on voit facilement que
1
B(x, y) = (Q(x + y) − Q(x) − Q(y))
2
et donc la donnée de la forme bilinéaire équivaut à la donnée de la forme quadratique Q. La même remarque
vaut en fait quand on compare une forme σ-hermitienne B et H(x) := B(x, x).
On peut classifier les involutions non triviales d’un corps K à l’aide de ses sous-extensions quadratiques. Si
la caractéristique de K n’est pas 2, cette classification est donnée ci-dessous, voir les exercices pour le cas de
caractéristique 2.
Proposition. Soit K un corps de caractéristique 6= 2 et σ une involution non triviale de K, alors K0 :=
{x ∈ K | σ(x) = x} est un sous-corps avec [K : K0 ] = 2 et il existe α ∈ K \ K0 tel que α2 = d ∈ K0 et alors
σ est donnée par σ(a + bα) = a − bα (lorsque a, b ∈ K0 ). Inversement, toute extension K/K0 de degré 2
correspond à une telle involution.
Preuve. Soit σ 6= id une involution de K, il est immédiat de vérifier que K0 := {x ∈ K | σ(x) = x} est un
sous-corps. Si x ∈ K \ K0 alors σ(x) + x et σ(x)x sont dans K0 donc le polynôme X 2 − (σ(x) + x)X + σ(x)x
61
est dans K0 [X] et annule x et [K0 (x) : K0 ] = 2. L’élément α := x − σ(x) vérifie σ(α) = −α donc α ∈
/ K0
et K0 (α) = K0 (x). Par ailleurs si y ∈ K \ K0 et β = y − σ(y) alors σ(β) = −β et K0 (β) = K0 (y), donc
σ(α/β) = α/β donc α/β ∈ K0 donc β ∈ K0 (α) et ainsi K = K0 (α). Inversement si [K : K0 ] = 2, soit
x ∈ K \ K0 , alors K = K0 (x) et x est racine de X 2 + aX + b ∈ K0 [X]. Posons α = x + a/2 (c’est ici que
l’on doit supposer car(K) 6= 2) alors α est racine de X 2 − d = 0 avec d = (a2 − 4b)/4. On vérifie alors
directement que la formule σ(a + bα) = a − bα définit un automorphisme involutif de K tel que K0 soit le
sous-corps fixé.
Exercice. Montrer qu’on peut reconstruire un produit hermitien à partir de la forme hermitienne en montrant
que, si σ(α) = −α alors
1 1 1
B(x, y) = H(x + y) − H(x − y) − H(x + αy) + H(x − αy) .
4 α α
62
particulier la dimension de E est paire et il existe une base dite symplectique e1 , . . . , e2n telle que B(ei , ej ) = 0
sauf B(ei , ei+n ) = −B(ei+n , ei ) = 1 pour 1 ≤ i ≤ n.
Si l’on identifie K n et E, via une base e1 , . . . , en de E, puis GL(E) et GL(n, K) l’interprétation matricielle
d’une forme σ-sesquilinéaire est donnée par une matrice carrée A dont les coefficients sont les B(ei , ej ) :
Dans le cas où la forme est symétrique ou hermitienne, on peut se ramener à une matrice A diagonale à
coefficients dans K si la forme est bilinéaire, à coefficients dans K0 = {x ∈ K | σ(x) =
x} si la forme est
0 I
σ-hermitienne. Enfin si la forme est antisymétrique, on peut se ramener à A = et écrire le groupe
−I 0
symplectique
A B t t t t
Sp(2n, K) = M = | AC et BD sont symétriques et AD − CB = I .
C D
D’un point de vue géométrique, d’autres groupes sont naturels à considérer, notamment celui des simili-
tudes et isométries affines, ainsi que les groupes résultant de l’action sur l’espace projectif; définissons-les
brièvement.
Définition Soit B : E × E → K une forme sesqui-linéaire, on appelle similitude un automorphisme f de E
tel qu’il existe µ ∈ K ∗ tel que
63
Remarque On peut aussi introduire l’espace des sous-espaces vectoriels de dimension r dans E (un K-espace
vectoriel de dimension n + 1). Celui-ci s’appelle Grasmannienne et est muni d’une action transitive de
GLn+1 (K) ou encore de PGLn+1 (K), définie par (σ, F ) 7→ σ(F ).
Nous allons maintenant étudier brièvement les groupes orthogonaux, symplectiques et unitaires. Mais avant
d’étudier ces groupes classiques donnons quelques raisonnements généraux concernant les groupes. En partic-
ulier, nous allons introduire un argument assez général dû essentiellement à Iwasawa qui permet de démontrer
la simplicité de quelques groupes.
Proposition Soit ρ : G → Bij(X) une action doublement transitive; supposons qu’il existe des sous-groupes
abéliens {Ax }x∈X dont la réunion engendre G et tels que gAx g −1 = Ag·x . Si N est un sous-groupe distingué
de G alors ou bien N ⊂ Ker(ρ), i.e. N agit trivialement, ou bien N agit transitivement et contient D(G).
En particulier, si de plus G = D(G) alors le groupe G/ Ker(ρ) est simple.
Preuve. Soit x ∈ X et H := Gx , la double transitivité se traduit par le fait que bien sûr G agit transitivement
sur X mais aussi que H agit transitivement sur X \ {x}. On en tire en particulier que, dès que g ∈ / H, on a
G = H ∪ HgH et en particulier que H est un sous-groupe (propre) maximal. Si maintenant N / G alors N 0 =
N H est un sous-groupe donc est égal soit à G (si N 6⊂ H) soit à H (si N ⊂ H). Dans le premier cas, d’après
ce qui précède, l’action de N est transitive, dans le second cas on a N = gN g −1 ⊂ gHg −1 = Gg·x donc N agit
trivialement. Si N agit transitivement, il suffit de voir que N Ax = G car alors G/N = N Ax /N ∼ = Ax /Ax ∩ N
est abélien et donc D(G) ⊂ N ; il suffit donc de montrer que tous les sous-groupes Ay sont contenus dans
N Ax . Mais N Ax est aussi le sous-groupe engendré par N et Ax ; soit y ∈ X alors il existe n ∈ N tel que
n · x = y donc Ay = nAx n−1 est contenu dans N Ax . Si de plus G = D(G), soit s : G → G/ Ker(ρ) la
surjection canonique et {e} = 6 M / G/ Ker(ρ); considérons N := s−1 (M ), il n’agit pas trivialement sur X et
il est distingué dans G donc la démonstration précédente montre que D(G) est contenu dans N et donc que
N = G et finalement que M = G/ Ker(ρ).
Proposition. Soit G un groupe, notons G2 le sous-groupe engendré par les carrés d’éléments de G.
(i) Le sous-groupe G2 est distingué et contient D(G).
(ii) Si G est engendré par des éléments d’ordre 2, alors G2 = D(G).
(iii) Si G est engendré par des éléments d’ordre 2 tous conjugués, alors (G : D(G)) ≤ 2.
Preuve. Comme yx2 y −1 = (yxy −1 )2 , on voit que G2 est bien distingué dans G; de plus le quotient G/G2
est d’exposant 2 donc abélien [en effet (ab)2 = abab = e entraı̂ne ab = ba] et donc D(G) ⊂ G2 . Si x1 , . . . , xm
sont des éléments d’ordre 2 alors (x1 . . . xm )2 = x1 . . . xm x−1 −1
1 . . . xm est un produit de commutateurs donc
2
si tout élément de G est de la forme x1 . . . xm , on a bien G = D(G). Enfin si on note x̄ l’image de x dans
G/D(G), on a yxy −1 = x̄ et donc, sous les hypothèses de (iii), l’image d’un des éléments d’ordre 2 engendre
G/D(G).
Les relations entre les groupes GLn (k), SLn (k), PGLn (k) et PSLn (k) peuvent être décrites par le diagramme
suivant où les lignes et colonnes sont exactes et où la flèche GLn (k) → k ∗ dans la ligne centrale est le
64
déterminant et où on note µn (k) := {x ∈ k ∗ | xn = 1} et k ∗n := {xn | x ∈ k ∗ }.
0 0 0
↓ ↓ ↓
0 → µn (k) → k∗ → k ∗n → 0
↓ ↓ ↓
0 → SLn (k) → GLn (k) → k∗ → 0
↓ ↓ ↓
0 → PSLn (k) → PGLn (k) → k ∗ /k ∗n → 0
↓ ↓ ↓
0 0 0
et on peut en déduire le cardinal des autres groupes SLn (k), PGLn (k) et PSLn (k).
On va maintenant décrire des transformations donnant un ensemble très utile de générateurs de SLn (k).
Définition. Une transvection est un élément de SLn (k) \ {Id} laissant fixe un hyperplan.
On voit aisément qu’une telle application est nécessairement de la forme u(x) = x + f (x)a avec a vecteur non
nul et f forme linéaire non nulle contenant a dans son noyau. La droite engendré par a est caractérisée par
u et on dira que u est une transvection de droite hai. L’ensemble des transvections de direction une droite
forment un sous-groupe isomorphe à k n−1 . Si σ = t(a, f ) désigne la transvection telle que σ(x) = x + f (x)a
alors, pour ρ ∈ GL(E), on a : ρ ◦ t(a, f ) ◦ ρ−1 = t(ρ(a), f ◦ ρ−1 ). Enfin, dans une base convenable la matrice
d’une transvection est une matrice avec des 1 sur la diagonale et un unique coefficient non nul au dessus de
la diagonale et que l’on peut prendre égal à 1. En particulier toutes les transvections sont conjuguées dans
GLn (k); on voit aisément que cela reste vrai dans SLn (k) lorsque n ≥ 3 (ce dernier point n’est plus vrai dans
SL2 (k)).
Thorme. Le centre de GLn (k) est le sous-groupe des homothéties que l’on peut identifier à k ∗ ; Le centre
de SLn (k) est le sous-groupe des homothéties de rapport une racine n-ième, que l’on peut identifier à µn (k).
Preuve. Une matrice commutant avec la transvection t(a, f ) doit laisser stable la droite engendrée par a.
On a vu qu’une telle application doit être une homothétie. Enfin l’homothétie de rapport λ est dans SLn (k)
si et seulement si λn = 1.
Thorme. Le groupe des commutateurs de GLn (k) est D(GLn (k)) = SLn (k) sauf pour n = 2 et k = F2 . Le
groupe des commutateurs de SLn (k) est D(SLn (k)) = SLn (k) sauf pour n = 2 et k = F2 ou F3 .
Preuve. On a clairement D(SLn (k)) ⊂ D(GLn (k)) ⊂ SLn (k). Soit σ une transvection. Si car(k) 6= 2, alors
σ 2 est encore une transvection (de même droite) donc s’écrit σ 2 = ρσρ−1 (si n ≥ 3 on peut même choisir
65
ρ ∈ SLn (k)). Ainsi σ = σ 2 σ −1 = ρσρ−1 σ −1 est un commutateur de GLn (k) (et même un commutateur
de SLn (k) si n ≥ 3). Pour examiner les cas n = 2 ou car(k) = 2, il suffit essentiellement d’observer
que si k 6= F2 ou F3 il y a des matrices
diagonales dans SL2 (k) qui ne sont pas des homothéties,
tout
a 0 1 1
simplement les matrices ρ = avec a ∈ k \ {0, 1, −1}. Si l’on choisit σ = et on observe
0 a−1 0 1
1 a2 − 1
que ρσρ−1 σ −1 = on voit que D(SL2 (k)) contient une et donc toutes les transvections et donc
0 1
tout SL2 (k)).
Thorme. Soit k un corps (commutatif) et n ≥ 2 alors le groupe PSLn (k) est simple sauf pour n = 2 et
k = F2 ou F3 .
Preuve. On va utiliser, pour varier, la méthode d’Iwasawa cité en introduction à ce chapitre. Soit E un
k-espace vectoriel de dimension n ≥ 2. Considérons l’action de G = SL(E) sur X = P(E), un élément x ∈ X
peut être vu comme une droite vectorielle de E; considérons Ax le sous-groupe des transvections de droite
x. Il est immédiat de vérifier que Ax ∼
= k n−1 est commutatif et on vérifie bien gAx g −1 = Ag·x : en effet si
a est un vecteur non nul de direction x, tout élément u ∈ Ax s’écrit u(y) = y + f (y)a avec f forme linéaire
nulle en a. Appelons donc Ex∗ = {f ∈ E ∗ | f (a) = 0} alors f 7→ u : y → y + f (y)a définit un isomorphisme
de groupes de Ex∗ vers Ax et comme vuv −1 (y) = y + f (v −1 (y))v(a), on a bien vAx v −1 = Av(x) . Par ailleurs,
on sait que les transvections engendrent SL(E). On a vu que D(SL(E)) = SL(E) sauf si n = 2 et k = F2 ou
F3 ; on en déduit donc le théorème.
Remarque. Comme PSL2 (F2 ) ∼ = S3 et PSL2 (F3 ) ∼= A4 ne sont pas égaux à leurs sous-groupes de commu-
tateurs, ils ne sont pas simples. En considérant l’action de PSL2 (F4 ) sur P1 (F4 ) de cardinal 5, on voit que
ρ : PSL2 (F4 ) → S5 induit un isomorphisme ρ0 : PSL2 (F4 ) → A5 .
Si −D est un carré
√
dans K alors SO(Q) ∼ = K ∗ ; si −D n’est pas un carré dans K alors SO(Q) ∼ = {x ∈
√ ∗ K( −D) −
K( −D) | NK (x) = 1}; en particulier le groupe SO(Q) est abélien. Les éléments de O (Q) sont des
symétries par rapport à une droite et, si s ∈ O− (Q) et r ∈ SO(Q), alors srs−1 = r−1 .
a b
Preuve. Un calcul direct montre que M = est dans O(Q) si et seulement si a2 + Dc2 = 1,
c d
b2 + Dd2 = D et ab + Dcd = 0. Si c = 0 on voit que b = 0 et donc a2 = d2 = 1. Si c 6= 0 , on en
tire d = −ab/cD puis b2 = c2 D2 ou encore b = cD (avec = ±1), puis d = −a et det(M ) = −. Si
0 1
la forme est isotrope, on peut en fait se ramener à une matrice et on voit alors aisément que
1 0
√
a 1
SO(Q) = | a ∈ k ∗ est isomorphe à k ∗ . Si la forme est anisotrope, posons ω = −D , on a
0 a−1
a −cD
un homomorphisme k(ω)∗ → GL2 (k) défini par a + cω 7→ qui induit l’isomorphisme annoncé
c a
entre {a + cω | a2 + Dc2 = 1} et SO(Q). Les dernières affirmations se vérifient directement.
66
Remarque. Le groupe SO(Q) est donc commutatif si E est un plan (dim(E) = 2). On obtient ainsi une
généralisation de la notion d’angle : si le plan contient un vecteur isotrope (i. e. si −D est un carré) alors un
“angle” est donné par un élément α ∈ K ∗ ; si le plan ne contient pas de vecteur isotrope (i. √e. si −D n’est
√ K( −D)
pas un carré) alors un “angle” est donné par un élément α ∈ K1 = {x ∈ K( −D)∗ | NK (x) = 1}.
Par exemple, si K = R on retrouve que dans le cas de la géométrie hyperbolique, un angle est donné par
un réel non nul et dans le cas de la géométrie euclidienne un angle est donné par un complexe α de module
1. Dans le dernier cas on a un homomorphisme surjectif de K = R vers K1 donné par t 7→ exp(2πit). On
retrouve donc l’expression des rotations sous la forme
cos(θ) − sin(θ)
R(θ) = .
sin(θ) cos(θ)
B(x, y)
σ(y) = y − 2 x.
B(x, x)
Preuve. Dans le cas (ii) on a E = hxi ⊥ H et comme σ(H) = H on en tire que σ(x) ∈ hxi donc il existe
λ ∈ K tel que σ(x) = λx. Comme σ est une isométrie, on a λ = ±1. Si λ = 1 alors σ = id et si λ = −1 alors
σ est la symétrie par rapport à l’hyperplan H donné par la formule annoncée. En effet tout vecteur y ∈ E
se décompose en y = (y − (B(y, x)/B(x, x))x) + (B(y, x)/B(x, x))x avec y − (B(y, x)/B(x, x))x ∈ hxi⊥ = H
donc
σ(y) = (y − (B(y, x)/B(x, x))x) − (B(y, x)/B(x, x))x = y − 2(B(x, y)/B(x, x))x.
Dans le cas (i), on a x ∈ H et il existe z ∈ E tel que B(x, z) = 1. On a alors hx, zi⊥ = H0 ⊂ H et
E = hx, zi ⊥ H0 . On sait que σ(H0 ) = H0 donc σ(z) = λx + µz ; on sait aussi que σ(x) = x. On a donc
1 = B(z, x) = B(σ(z), σ(x)) = λB(x, x) + µB(z, x) = µ d’où µ = 1, ainsi que B(z, z) = B(σ(z), σ(z)) =
λ2 B(x, x) + 2λµB(z, x) + µ2 B(z, z) = 2λ + B(z, z) d’où λ = 0 et σ(z) = z donc σ = id.
Si Q(x) 6= 0, on notera sx la symétrie hyperplane caractérisée par ∀y ∈ hxi⊥ , sx (y) = y et sx (x) = −x.
Remarquons que sax = sx pour a ∈ K ∗ ; en fait sx = sy équivaut à x, y colinéaires. Par ailleurs, si ρ est une
isométrie, ρsx ρ−1 = sρ(x) .
Thorme. Les symétries hyperplanes sx avec Q(x) 6= 0 engendrent O(Q).
Preuve. On raisonne par récurrence, le résultat étant facile si n = 1 ou 2. Soit donc σ ∈ O(Q), si il existe
x ∈ E tel que Q(x) 6= 0 et σ(x) = x alors on décompose E = hxi ⊕ hxi⊥ = hxi ⊕ H (disons). Alors
σ 0 := σ|H s’écrit comme produit de symétries hyperplanes s0xi dans H, c’est-à-dire σ 0 = s0x1 . . . s0xm . Notons
donc sxi la symétrie dans E associée à xi ∈ H on a alors σ = sx1 . . . sxm puisque les deux applications sont
des isométries et coı̈ncident sur x et sur H. Soit maintenant x1 non isotrope et x2 = σ(x1 ), si x1 − x2
est non isotrope, alors sx1 −x2 (x1 ) = x2 donc sx1 −x2 ◦ σ fixe x1 et s’écrit donc comme produit de symétries
hyperplanes, donc σ également. Observons que Q(x1 + x2 ) + Q(x1 − x2 ) = 2Q(x1 ) + 2Q(x2 ) = 4Q(x1 ), donc,
si x1 − x2 est isotrope, alors x1 + x2 n’est pas isotrope, et on a sx1 +x2 (x1 ) = −x2 donc sx2 ◦ sx1 +x2 (x1 ) = x2
et sx1 +x2 ◦ sx2 ◦ σ fixe x1 donc est produit de symétries hyperplanes, donc σ également.
Remarque. On peut raffiner l’énoncé précédent en montrant que σ s’écrit comme le produit d’au plus
n = dim(E) symétries hyperplanes (théorème de Cartan-Dieudonné).
Les symétries hyperplanes sont en quelque sorte les involutions les plus simples de O(Q) (sous-espace propre
pour la valeur propre 1 de codimension 1) ; l’analogue pour SO(Q) est constitué par les renversements,
67
c’est-à-dire les isométries directes fixant un sous-espace F de codimension 2 non isotrope (i.e. F ∩ F ⊥ = {0})
et agissant par −1 sur son supplémentaire orthogonal ; ce sont bien sûr également des involutions.
Thorme. Supposons dim(E) ≥ 3, alors les renversements engendrent SO(Q).
Preuve. Remarquons que la conclusion de l’énoncé est fausse en général si dim(E) = 2. Prouvons d’abord
l’énoncé pour n = 3. D’après le théorème précédent, ρ ∈ SO(Q) peut s’écrire comme produit d’un nombre
pair de symétries hyperplanes, il suffit donc de montrer que le produit sx1 sx2 de deux symétries hyperplanes
peut s’écrire comme le produit de deux renversements. Mais en dimension 3, −sx est un renversement et
sx1 sx2 = (−sx1 )(−sx2 ), ce qui achève ce cas. Reprenons le cas général, on peut supposer x1 et x2 non
colinéaires (sinon sx1 sx2 = id) et donc L = hx1 , x2 i⊥ est de codimension 2 et, comme Q(x1 ) et Q(x2 ) 6= 0, on
a dim(L ∩ L⊥ ) ≤ 1 donc on peut choisir L1 hyperplan de L tel que, si on note L2 = L⊥ 1 , on ait E = L1 ⊥ L2 .
Or sx1 sx2 fixe L1 point par point et agit sur L2 comme s0x1 s0x2 (où s0xi désigne la restriction de sxi à L2 ). Mais
L2 est un espace de dimension 3 donc s0x1 s0x2 = ρ01 ρ02 avec ρ0i renversement de L2 . Désignons par ρi l’isométrie
agissant comme l’identité sur L1 et comme ρ0i sur L2 , alors ρi est un renversement et sx1 sx2 = ρ1 ρ2 .
Connaissant comme générateurs de O(Q) les symétries hyperplanes et comme générateurs de SO(Q) les
renversements (lorsque n ≥ 3), on en tire aisément que les éléments du centre sont des homothéties.
Proposition. Le centre de O(Q) est le sous-groupe à deux éléments {±I}; le centre de SO(Q) est réduit au
sous-groupe trivial si n ≥ 3 est impair et égal à {±I} si n ≥ 4 est pair.
Regardons maintenant deux cas particulièrement intéressants : celui des groupes orthogonaux réels usuels
(i. e. pour la forme euclidienne) et celui des corps finis.
Thorme. Le groupe SO(3, R) est simple. Plus généralement le groupe SO(2n + 1, R) est simple alors que,
pour n ≥ 3 le groupe SO(2n, R) contient comme unique sous-groupe normal non trivial {+1, −1} et donc
PSO(2n, R) est simple.
Preuve. On suppose d’abord n = 3 et on commence par un lemme géométriquement évident dont on laisse
le lecteur formaliser la démonstration :
Lemme. Soit x1 , x2 , y1 , y2 des vecteurs de la sphère de R3 tels que ||x1 − x2 || = ||y1 − y2 ||, alors il existe
une rotation ρ ∈ SO3 (R) telle que ρ(x1 ) = y1 et ρ(x2 ) = y2 .
Soit maintenant H un sous-groupe distingué de SO3 (R) possédant un élément σ distinct de l’identité. Soit
∆ l’axe de σ et e1 un point de la sphère hors de l’axe. Posons 0 < δ0 = ||e1 − σ(e1 )||, lorsque x parcourt
l’arc du méridien passant par e1 et rejoignant l’axe ∆, la distance ||x − σ(x)|| décroit continûment de δ0 à
0. En particulier, si δ est assez petit (δ ≤ δ0 suffit), il existe x1 sur la sphère tel que ||x1 − σ(x1 )|| = δ. Soit
maintenant y1 , y2 deux points de la sphère tels que ||y1 − y2 || = δ; d’après le lemme, il existe ρ ∈ SO3 (R)
telle que ρ(x1 ) = y1 et ρ(σ(x1 )) = y2 . Ainsi σ 0 = ρσρ−1 ∈ H et σ 0 (y1 ) = y2 . En itérant ce procédé, on voit
que H opère transitivement sur la sphère. En particulier, il existe σ 00 ∈ H telle que σ 00 (e1 ) = −e1 , mais alors
σ 00 est un renversement et donc H contient tous les renversements et est donc égal à SO3 (R).
Dans le cas n ≥ 5, on se ramène au cas de dimension 3 ainsi : chaque sous-espace F de dimension 3 induit
une décomposition Rn = F ⊕ F ⊥ et une injection SO3 (R) ,→ SOn (R); si H est un sous-groupe distingué
contenant σ 6= ±I, il suffit de voir que H rencontre l’un des SO3 (R) non trivialement car alors il le contiendra
en entier et contiendra donc un renversement et donc tous et sera donc égal à SOn (R) entier.
Comme σ 6= ±I, σ doit bouger un plan, disons F . Notons ρ le renversement de plan F , alors σ 0 = ρσρ−1 σ −1
est dans H \ {±I} et peut s’écrire comme le produit des deux renversements de plan F et σ(F ) donc possède
un sous-espace de points fixes de dimension ≥ n − 4. Il y a donc un point fixe disons x1 non nul (puisque
n ≥ 5!). Soit maintenant x2 tel que x2 et σ(x2 ) ne soient pas colinéaires, posons r = sx2 sx1 (produit de deux
symétries hyperplanes). On a alors
σ 00 := σ 0 rσ −1 r−1 = σ 0 sx2 σ 0−1 σ 0 sx1 σ 0−1 sx1 sx2 = (σ 0 sx2 σ 0−1 )sx2
est dans H \ {I} et est un produit de deux symétries hyperplanes. Ainsi σ 00 possède un sous-espace de points
fixes de dimension n − 2 donc est contenu dans un SO3 (R), ce qui achève la preuve.
68
Remarque. Le groupe PSO4 (R) n’est pas simple, voir le chapitre sur les quaternions (E.6) pour une preuve
de ce fait et une description. De manière générale l’étude des quaternions et de leurs généralisations (algèbres
de Clifford) permet d’approfondir l’étude des groupes orthogonaux (Cf ibidem); en particulier on peut ainsi
élucider la structure de SO(Q) lorsqu’il existe au moins un vecteur isotrope non nul. Cette dernière condition
est automatiquement vérifiée lorsque k est un corps fini et n ≥ 3 comme l’indique le lemme suivant.
Lemme. Une forme quadratique sur un espace de dimension n ≥ 3 sur Fq possède un vecteur non nul
isotrope.
Preuve. On se ramène à trouver un zéro non trivial au polynôme x2 + ay 2 + bz 2 avec ab 6= 0. Le nombre de
carrés dans Fq est (q + 1)/2 donc les fonctions x2 + a et −bz 2 ont une valeur commune au moins.
E = P1 ⊥ . . . ⊥ Pm ⊥ F
avec Pi plan hyperbolique et F soit nul, soit de dimension 1, soit de dimension 2 sans vecteur isotrope non
nul.
Si n est pair on note = +1 si la forme quadratique est équivalente à x1 x2 + x3 x4 + . . . + xn−1 xn et = −1
/ F∗2
si la forme quadratique est équivalente à x1 x2 + x3 x4 + . . . + xn−3 xn−2 + x2n−1 − ax2n avec a ∈ q .
Thorme. Soit G le groupe orthogonal d’une forme quadratique non dégénérée sur un espace de dimension
n sur Fq alors
(n−1)2 Q n−1
(
2i
q 4 i=1 (q − 1) si n est impair
2
card(G) = n(n−2) n Q n−2 2i
q 4 (q 2 − ) i=1 (q − 1) si n est impair
2
On donne la preuve sous forme d’exercice (ref. Artin, chapitre III, p 145-147).
Exercice. 1) Montrer que φn (Q) := card{x ∈ Fnq | Q(x) = 0} vaut q n−1 si n impair et (q n/2 −)(q n/2−1 +)+1
si n pair. 2) Montrer que le nombre de paires hyperboliques (i. e. de paires (e1 , e2 ) telles que Q(e1 ) = Q(e2 ) =
0 et B(e1 , e2 ) = 1) est λn = q n−2 (φn − 1). 3) Montrer que si E = P ⊥ F avec P plan hyperbolique et si on
note Q0 = Q|F alors card SO(Q) = λn card SO(Q0 ).
Proposition. (Pfaffien) Il existe un polynôme Pf à coefficients entiers (appelé Pfaffien) tel que si les
coefficients xij d’une matrice A sont des variables telles que xij = −xji alors
det(A) = Pf(xij )2 .
69
anneau est factoriel et que Q2 /R2 ∈ Z[. . . , xij , . . .], on en déduit que R divise Q dans Z[. . . , xij , . . .] et
donc que det(P ) ∈ Z[. . . , xij , . . .]. On pose alors Pf(. . . , xij , . . .) = ± det(P ) en choisissant le signe de
sorte que Pf(J) = +1. Pour la deuxième formule on voit que det(yij ) = det(xij ) det(C)2 donc Pf(yij ) =
± det(C) Pf(xij ). On détermine le signe en choisissant C = I.
Corollaire. On a Sp(E) ⊂ SL(E), c’est-à-dire que pour toute matrice M ∈ Sp(n, K) on a det(M ) = +1.
Preuve. Une matrice M est dans Sp(E) si J =t M JM donc Pf(J) = det(M ) Pf(J) et det(M ) = 1.
Etudions maintenant les transformation symplectiques qui fixent un hyperplan. On sait déjà que se sont
des transvections de la forme σ(x) = x + f (x)a avec f forme linéaire vérifiant f (a) = 0. Calculons donc
B(f (x), f (y))−B(x, y) = B(f (x)a, y)+B(x, f (y)a) = B(f (y)x−f (x)y, a) ; en remarquant que l’ensemble des
f (y)x − f (x)y est Ker(f ), on voit que la transvection σ est symplectique si et seulement si B(Ker(f ), a) ≡ 0,
c’est-à-dire si a ∈ Ker(f ) ∩ Ker(f )⊥ . Ceci justifie la définition suivante
Définition. Une transvection symplectique est une application de la forme σ(x) = x + f (x)a avec 0 6= a ∈
Ker(f ) ∩ Ker(f )⊥ . On peut aussi l’écrire σ(x) = x + λB(x, a)a.
Thorme. Les transvections symplectiques engendrent le groupe Sp(E).
Remarque. Comme une transvection est clairement une matrice de SL2n (k), on obtient ainsi une nouvelle
preuve que Sp2n (k) ⊂ SL2n (k).
Preuve. Le lemme suivant permet de démontrer le théorème par récurrence (passant d’un espace de dimension
2n à un espace de dimension 2n − 2).
Lemme. Soit P = hx1 , x2 i et P 0 = hy1 , y2 i deux plan hyperboliques (i.e. B(x1 , x2 ) = B(y1 , y2 ) = 1) alors il
existe ρ un produit de transvections symplectiques tel que ρ(x1 ) = y1 et ρ(x2 ) = y2 .
Preuve du lemme. Commençons par envoyer x1 sur y1 . Si B(x1 , y1 ) 6= 0 alors une transvection suffit :
on choisit t(x) = x + λB(x, a)a avec λ = B(x1 , y1 )−1 et a = y1 − x1 de sorte que t(x1 ) = y1 . Si jamais
B(x1 , y1 ) = 0, on prend un vecteur z tel que B(x1 , z) = 1 mais tel que B(x2 , z) et B(y1 , z) sont non nuls et
on passera de x1 à z puis à y1 avec deux transvections. Envoyons maintenant x2 sur y2 en laissant fixe x1 .
De nouveau, si B(x2 , y2 ) 6= 0, une transvection suffit : on choisit t(x) = x + λB(x, a)a avec λ = B(x2 , y2 )−1
et a = y2 − x2 de sorte que B(x1 , a) = B(x1 , y2 ) − B(x1 , x2 ) = 1 − 1 = 0 donc t(x1 ) = x1 et t(x2 ) = y2 .
Si jamais B(x2 , y2 ) = 0 on va choisir z tel que B(x1 , z) = 1 mais B(x2 , z) et B(y2 , z) non nuls car alors on
pourra passer de x2 à z puis à y2 en laissant fixe x1 par deux transvections. On vérifie immédiatement que
z = x1 + y2 convient.
70
Exercice. Montrer, par une méthode similaire à celle suggérée pour les groupes orthogonaux, que :
n
2 Y
card(Sp2n (Fq )) = q n (q 2i − 1)
i=1
0 → SU(B) → U(B) → S → 0.
B(x, e)
uλ,e (x) = x + (λ − 1) e avec λ ∈ S et e non isotrope.
B(e, e)
On a bien sûr uλ,e (x) = x si x ∈ hei⊥ et uλ,e (e) = λe; ainsi det(uλ,e ) = λ. On peut calquer la démonstration
faite pour le groupe orthogonal et montrer que les quasi-symétries engendrent le groupe unitaire (au moins
en caractéristique différente de 2). On omet également la démonstration du théorème suivant, qui utilise des
techniques assez similaires à celles utilisées dans les paragraphes précédents.
Thorme. Supposons qu’il existe un vecteur isotrope non nul et que l’on est pas dans le cas n = 2 et q = 2
ou 3, ou n = 3 et q = 2. Alors le groupe PSU(B) est simple. Si k = Fq2 et dim E = n on a
71
Il existe bien sûr de nombreux liens entre les groupes que nous avons brièvement étudié. Par exemple,
définissons, pour n ≥ 1 l’espace de Siegel
Lorsque n = 1, on retrouve le demi-plan de Poincaré et l’action classique de SL2 (R). L’action de G sur Hn
est transitive et le stabilisateur de iI est un sous-groupe compact isomorphe à Un (C) par l’application
Avec cette identification, on vérifie facilement que Un (C) = O2n (R) ∩ Sp2n (R).
Exercices de topologie. On termine en proposant un certain nombre de propriétés des groupes classiques
sur R ou C dont on pourra trouver une preuve (et beaucoup plus!) dans le livre de Mneimné et Testard cité
ci-dessous.
(a) Les groupes On (R), SOn (R), Un (C) et SUn (C) sont compacts; les trois derniers sont connexes alors
que le premier a deux composantes connexes.
(b) (décomposition polaire sur R) Tout élément M de GLn (R) se décompose de manière unique en produit
M = OS avec O ∈ On (R) et S symétrique définie positive. En déduire que GLn (R) est homéomorphe
à On (R) × Rn(n+1)/2 et possède donc deux composantes connexes.
(c) (décomposition polaire sur C) Tout élément M de GLn (C) se décompose de manière unique en produit
M = U H avec U ∈ Un (C) et H hermitienne définie positive. En déduire que GLn (C) est homéomorphe
2
à Un (C) × Rn et connexe.
(d) (Décomposition d’Iwasawa). Soit Q K = SOn (R), notons A le sous-groupe des matrices diagonales
diag(λ1 , . . . , λn ) avec λi > 0 et i λi = 1 et N le sous-groupe des matrices triangulaires possédant
des 1 sur la diagonale. L’application de K × A × N vers SLn (R) définie par (k, a, n) → kan définit un
homéomorphisme.
(e) Les groupes SLn (R), SLn (C), Sp2n (R) et Sp2n (C) sont connexes de même que SOn (C) et SOn (R).
(f) Par contre SOp,q (R) possède deux composantes connexes si p, q ≥ 1 (et le groupe n’est pas compact).
(g) Le groupe fondamental de SOn (R) ou de SLn (R) est Z/2Z si n ≥ 3 et Z si n = 2.
(h) Les groupes SUn (C), SLn (C) sont simplement connexes. Les groupes Un (C), GLn (C) et Sp2n (R) ont
pour groupe fondamental Z. Le groupe SUp,q (C) est connexe et son groupe fondamental est isomorphe
à Z.
On termine par quelques références spécifiques à ce chapitre (l’article de Tits contient notamment la classi-
fication des groupes simples avec les groupes exceptionnels E6 , E7 , E8 , F4 et G2 ).
Artin, E., Geometric Algebra, Interscience, 1957.
Dieudonné, J., La géométrie des groupes classiques, Ergebnisse d. Math. Springer, 1955.
Mneimné, R. et Testard, F., Introduction à la théorie des groupes de Lie classiques. Hermann, 1986.
Tits, J., Groupes simples et géométries associées, Actes du congrès international des mathématiciens de
Stockholm (1962), pages 197-221.
72
E.6. Quaternions, arithmétique et groupe orthogonal.
Nous allons construire l’exemple classique de corps non commutatif : le corps des quaternions découvert
par Hamilton, et développer deux applications, l’une arithmétique (le théorème des quatre carrés), l’autre
géométrique (l’étude des groupes d’isométries SO(3, R), SO(4, R) et SU(2, C)). Nous montrerons aussi que
le corps des quaternions est le “seul” corps non commutatif de dimension fini sur R.
E.6.1. Le corps des quaternions.
La façon la plus concrète de construire le corps des quaternions est comme un espace vectoriel réel de
dimension 4 muni d’une base 1, I, J, K et d’une multiplication R-bilinéaire définie par le fait que 1 est
élément neutre et les formules
Il faut alors vérifier “à la main” l’associativité : par exemple (IJ)K = K 2 = −1 et I(JK) = I 2 = −1. Pour
s’épargner cette vérification on peut aussi définir H comme sous-algèbre des matrices 2 × 2 complexes ou
4 × 4 réelles (l’associativité est alors immédiate mais il faut vérifier que les matrices introduites vérifient les
formules (∗)). On peut ainsi définir
α −β
H= α, β ∈ C
β̄ ᾱ
1 1 i 0 0 1 0 i
avec 1 = ,I= ,J= et K = ou encore
0 1 0 −i −1 0 i 0
a −b −c −d
b a −d c
H= a, b, c, d ∈ R
c d
a −b
d −c b a
avec
1 0 0 0 0 −1 0 0 0 0 −1 0 0 0 0 −1
0 1 0 0 1 0 0 0 0 0 0 1 0 0 −1 0
1= , I = , J = , K =
0 0 1 0 0 0 0 −1 1 0 0 0 0 1 0 0
0 0 0 1 0 0 1 0 0 −1 0 0 1 0 0 0
Remarque. Une fois construit H, on peut remarquer que c’est une R-algèbre engendrée par deux éléments
i, j avec les relations i2 = j 2 = −1 et ij = −ji. En effet en posant k := ij on en déduit la table de
multiplication puisque k 2 = ijij = −iijj = −1 et ik = iij = −j = (ii)j = −iji = −ki etc. Le fait que H
ne soit pas commutatif se lit déjà sur la table de multiplication, mais plus précisément nous avons le lemme
suivant
Lemme. Le centre de H est R1 (que l’on identifiera, le cas échéant, à R). Si z ∈ H \ R1 alors
C(z) := {z 0 ∈ H | zz 0 = z 0 z} = R1 + Rz
qq 0 = (aa0 − bb0 − cc0 − dd0 )1 + (ab0 + ba0 + cd0 − dc0 )I + (ac0 − bd0 + ca0 + db0 )J + (ad0 + bc0 − cb0 + da0 )K
73
On voit donc que tous les éléments commutent avec a1 + bI + cJ + dK si b = c = d = 0 mais, si z ∈ H \ R1,
alors un calcul simple montre que le rang du système est égal à deux donc dimR C(z) = 2, or clairement
R(z) ⊂ C(z) et [R(z) : R] = 2 donc R(z) = C(z).
H∗ ∼
= R∗+ × G (isomorphisme de groupes)
p p
donnée par z 7→ ( N(z), z/ N(z)). Toutefois on prendra garde que le groupe G (analogue du cercle unité
pour les complexes) n’est pas un groupe commutatif, en fait il est isomorphe au groupe SU(2, C) (alors que
le cercle unité peut être vu comme SU(1, C)). Ce dernier point peut se montrer facilement à partir de la
représentation
H = C ⊕ Cj
dans laquelle il faut faire attention que, si z = a + bi ∈ C, alors
Exercice. Montrer que l’équation X 2 − 1 = 0 possède exactement deux solutions dans H mais que l’équation
X 2 + 1 = 0 possède une infinité de solutions dans H (indication : on montrera que la sphère a = b2 + c2 +
d2 − 1 = 0 décrit l’ensemble des solutions).
Exercice. Montrer que H∗ contient un sous-groupe fini non-cyclique (rappel : ceci est impossible dans le
groupe multiplicatif d’un corps commutatif).
74
nous ne le démontrerons pas ici, que tous les autres entiers peuvent s’écrire comme somme de trois carrés
d’entiers (par exemple 2.7 = 14 = 32 + 22 + 12 , 23 .7 = 62 + 42 + 22 et 30 = 52 + 22 + 12 ).
Remarque. L’ensemble des sommes de deux carrés (resp. de quatre carrés) est stable par produit mais pas
l’ensemble des sommes de trois carrés. En effet 18 = 2.32 = 42 + 12 + 12 et 14 = 2.7 = 32 + 22 + 12 mais
18.14 = 4.9.7 n’est pas somme de trois carrés.
Si on pose
C2 := {n ∈ N | ∃x, y ∈ N, n = x2 + y 2 } et C4 := {n ∈ N | ∃x, y, z, t ∈ N, n = x2 + y 2 + z 2 + t2 }
on veut donc montrer que n ∈ C2 si et seulement si tout nombre premier congru à 3 modulo 4 apparaı̂t avec
un exposant pair et que C4 = N. On va introduire l’anneau Z[i] et les deux anneaux
1+I +J +K
A0 = Z1 + ZI + ZJ + ZK et A = A0 + Z .
2
N(β)
N(α − qβ) ≤ < N(β).
2
75
(Somme de deux carrés). L’anneau Z[i] est principal donc factoriel et on voit facilement que Z[i]∗ = {±1, ±i}
(voir exercice) ; déterminons maintenant les éléments irréductibles. Tout d’abord 2 = −i(1 + i)2 et 1 + i est
irréductible car sa norme est 2. Un nombre premier p congru à 3 modulo 4 est irréductible dans Z[i] car si
p = αβ alors N(α) N(β) = p2 mais l’égalité N(α) = p est impossible donc N(α) ou N(β) vaut 1 et donc α ou
β est inversible. Enfin, soit p un nombre premier congru à 1 modulo 4, on sait que le groupe (Z/pZ)∗ est
cyclique d’ordre p − 1 donc contient un élément ā d’ordre 4 donc tel que a2 ≡ −1 mod p. En particulier on
a donc (a + i)(a − i) = a2 + 1 ∈ pZ[i] mais ni a + i ni a − i ne peuvent appartenir à pZ[i] qui n’est donc pas
un idéal premier. Comme Z[i] est principal l’élément p n’est pas irréductible et on peut donc écrire p = αβ
avec N(α) = N(β) = p (on a en fait forcément β = ᾱ). On peut résumer cela en
Lemme. Les éléments irréductibles de Z[i] (non associés deux à deux) sont : 1 + i, les premiers p congrus
à 3 modulo 4, les deux facteurs αp , βp de p congrus à 1 modulo 4 décomposant p = αp βp .
La norme d’un entier de Gauss dont la factorisation s’écrit
Y Y
q = ir (1 + i)s αpmp βpnp p` p
p≡1 mod 4 p≡3 mod 4
Exercice. Montrer qu’un élément de Z[i], A ou A0 est inversible si et seulement si sa norme vaut 1. En
déduire que
∗ ∗ ∗ ∗ ±1 ± I ± J ± K
Z[i] = {±1, ±i}, A0 = {±1, ±I, ±J, ±K} et A = A0 ∪
2
(A∗0 et A∗ sont les groupes quaternioniques d’ordre 8 et 24 respectivement). Le groupe A∗ est-il isomorphe
à S4 ? Montrer que A0 n’est pas principal (à gauche). En déduire également qu’un élément de norme égale
à un nombre premier est irréductible.
Remarquons en particulier que R1 est l’orthogonal de E dans H. On étudie maintenant l’action par
conjugaison Φ(q)(x) = qxq −1 . Cette action fournit un homomorphisme Φ : H∗ → GLR (H). En fait
N(Φ(q)(x)) = N(qxq −1 ) = N(x) donc Φ(q) est une isométrie et de plus Φ(q)(1) = 1 donc Φ(q) laisse stable
E∼= R3 d’où en fait un homomorphisme de H∗ vers O(3, R) qu’on note encore Φ. Comme H∗ est connexe,
76
l’image de Φ est en fait dans SO(3, R). Par ailleurs on a R∗ ⊂ Ker(Φ) (en fait on a égalité puisque R est
le centre de H) donc on peut restreindre Φ à G (le groupe des quaternions de norme 1) sans changer son
image. On a donc défini un homomorphisme
Φ : G → SO(3, R) (∗)
dont le noyau est R∗ ∩ G = {+1, −1} ; pour voir que Φ est surjectif on démontre le lemme suivant qui a son
propre intérêt :
Lemme. Soit x un quaternion de E de norme 1 (i.e. une solution de x2 + 1 = 0), considérons q =
cos(θ) + sin(θ)x, alors Φ(q) est la rotation d’angle 2θ et d’axe (orienté) x.
Preuve. On a qxq −1 = x puisque q commute avec x. Déterminons maintenant l’action de Φ(q) sur le plan P
orthogonal à x (dans E). L’équation 2x · y = Tr(xȳ) = xȳ + yx̄ = 0 équivaut, puisque dans E on a ȳ = −y, à
l’équation xy + yx = 0. Choisissons donc y de norme 1 tel que xy = −yx, alors z = xy permet de compléter
la famille libre {x, y} en une base orthonormé {x, y, z}. On calcule alors (en remarquant que xyx = y et
x2 = y 2 = −1)
Φ(q)(y) = (cos(θ) + sin(θ)x)y(cos(θ) − sin(θ)x)
= cos2 (θ) − sin2 (θ) y + 2 cos(θ) sin(θ)xy
= cos(2θ)x + sin(2θ)xy
et
Φ(q)(xy) = (cos(θ) + sin(θ)x)xy(cos(θ) − sin(θ)x)
= cos2 (θ) − sin2 (θ) xy − 2 cos(θ) sin(θ)y
= cos(2θ)xy − sin(2θ)y
ainsi Φ(q) est bien la rotation d’angle 2θ et d’axe x.
Remarque. On voit en particulier que les renversements, i.e. les rotations d’angle π, correspondent à des
quaternions imaginaires purs. Il n’est pas très difficile de voir que tout quaternion non nul peut s’écrire
comme produit de quaternions imaginaires purs (exercice : le démontrer) et on en tire que les renversements
sont des générateurs de SO(3, R) (Cf le paragraphe E.3). Remarquons enfin que, si on se restreint à q ∈ G
alors Φ(q)(x) = qxq̄ puisque q −1 = q̄.
Pour étudier SO(4, R), on considère l’action de H∗ ×H∗ sur H donnée par Ψ(q, r)(x) = qxr−1 . Il s’agit d’une
similitude directe de rapport N(qr−1 ) puisque N(Ψ(q, r)(x)) = N(qxr−1 ) = N(qr−1 ) N(x) ; en particulier, si
on se restreint à G × G, on obtient un homomorphisme de groupes
Ψ : G × G → SO(4, R)
dont on démontre de manière similaire qu’il est surjectif. Par ailleurs, il a pour noyau le sous-groupe
Ker(Ψ) = {(+1, +1), (−1, −1)}. En effet, si u ∈ SO(4, R) et u(1) = z, posons v(x) = z −1 u(x), alors
v(1) = 1 donc v est une rotation de E et on a vu qu’une telle rotation s’écrivait v(x) = yxy −1 pour un
certain y ∈ G. On a donc u(x) = (zy)xy −1 = Ψ(zy, y)(x). Par ailleurs, si ∀x ∈ H, Ψ(q, r)(x) = x alors, en
prenant x = 1 on obtient q = r et donc q, de norme 1, est dans le centre de H donc vaut ±1. On a donc
bien démontré
Thorme. Le groupe G est isomorphe à SU(2, C) ; l’homorphisme Φ induit un isomorphisme G/{+1, −1} ∼ =
SO(3, R) ; l’homorphisme Ψ induit un isomorphisme G × G/{(1, 1), (−1, −1)} ∼= SO(4, R). En particulier
SO(4, R)/{±id} n’est pas simple.
Exercices. a) Vérifier
par un calcul
direct que SU(2, C) est l’ensemble des matrices 2 × 2 à coefficients
α −β
complexes de la forme telles que |α|2 + |β|2 = 1. Redémontrer ainsi que G ∼
= SU(2, C).
β̄ ᾱ
b) Donner, à l’aide des quaternions, une (“deuxième”) preuve que le groupe SO(3, R) est simple. (indications :
on pourra considérer H sous-groupe distingué de G, montrer que si H contient un quaternion pur imaginaire
77
de norme un, il les contient tous et que si H n’est pas contenu dans le centre {±1} il contient un tel
quaternion).
On définit la conjugaison comme (p1 + p2 L) = p̄1 − p2 L et la norme d’un octave de Cayley par la formule
N(p1 + p2 L) = (p1 + p2 L)(p1 + p2 L) = N(p1 ) + N(p2 ). On voit donc que l’inverse de p1 + p2 L est N(p1 +
p2 L)−1 (p1 + p2 L). La multiplication n’est pas associative : par exemple ((jL)i) L = −k 6= k = (jL) (iL),
mais vérifie une propriété un peu plus faible (qu’on laisse vérifier en exercice) :
78
Exercice. Démontrer que la norme est multiplicative sur Ca (i. e. N(qq 0 ) = N(q) N(q 0 )) et en déduire une
identité du type ! 8 !
X 8 X X8
2 2
xi yi = Bi (x, y)2
i=1 i=1 i=1
ce qui montre bien que Φ(α) est une isométrie. L’analogue du lemme décrivant une rotation de R3 comme
“Φ(q)” est le suivant
Lemme. Soit x ∈ E non isotrope (i.e. Q(x) 6= 0) et sx la symétrie hyperplane associée, alors Φ(x) = −sx .
En particulier SO(Q) est contenu dans l’image Φ(G).
Observons que x ◦ x = Q(x)1 donc x−1 = Q(x)−1 x et comme x ◦ y + y ◦ x = 2B(x, y), on en tire
B(x, y)
x ◦ y ◦ x−1 = −y + 2B(x, y)x−1 = −y + 2 x = −sx (y).
Q(x)
79
Soit r ∈ SO(Q), alors r = sx1 . . . sx2m donc r = Φ(x1 ◦ . . . ◦ x2m ).
Pour calculer le noyau de Φ : G → SO(Q), il faut trouver les éléments inversibles commutant avec tout
x ∈ E. Ce calcul est basé sur la formule suivante qui se vérifie directement à partir de la définition du
produit de l’algèbre C(Q) :
eI ◦ eJ ◦ e−1
I = (−1)
|I||J|−|I∩J|
eJ
et on en tire
{x ∈ C + (Q) | ∀y ∈ E, x ◦ y = y ◦ x} = K.
On obtient donc que Φ : G → SO(Q) est surjective de noyau K ∗ . Comme tout élément de SO(Q) est produit
(d’un nombre pair de) symétries hyperplanes, on voit aussi que tout élément de G s’écrit ax1 ◦ . . . ◦ xr avec
a ∈ K ∗ et xi ∈ E.
L’analogue de la norme est le suivant : on définit une involution x 7→ x̄, de C(Q) dans C(Q) par la formule
(pour i1 < . . . < ir )
ei1 ◦ . . . eir = eir ◦ . . . ei1 = (−1)r(r−1)/2 ei1 ◦ . . . eir
puis la norme spinorielle
Nsp (α) = α ◦ ᾱ
et on peut alors montrer
Lemme. L’involution x 7→ x̄ est un anti-isomorphisme de C(Q), pour les éléments de G (ou G1 ) on a
Nsp (α ◦ β) = Nsp (α) Nsp (β).
Preuve. La première affirmation est claire, la deuxième est un peu plus subtile (d’ailleurs l’énoncé n’est pas
vrai pour tous les éléments de C(Q)). En fait un élément de G (ou G1 ) s’écrit α = ax1 ◦ . . . ◦ xr (resp. β =
by1 ◦ . . . ◦ yr ) avec a, b ∈ K et xi , yi ∈ E donc Nsp (α) = a2 Q(x1 ) . . . Q(xr ) (resp. Nsp (β) = b2 Q(y1 ) . . . Q(yr )),
or Nsp (α ◦ β) = α ◦ β ◦ β̄ ◦ ᾱ = Nsp (β)α ◦ ᾱ = Nsp (α) Nsp (β).
Ceci permet de montrer que, si x1 , . . . , xr sont des vecteurs non isotropes de E et si sx1 . . . sxr = idE
alors Q(x1 ) . . . Q(xr ) ∈ K ∗2 . En effet r doit être pair et donc Φ(x1 ◦. . .◦xr ) = id et donc x1 ◦. . .◦xr = a ∈ K ∗ .
Mais alors a2 = Nsp (x1 ◦ . . . ◦ xr ) = Q(x1 ) . . . Q(xr ).
Introduisons maintenant Ω(Q) = Ω(E, Q) le sous-groupe des commutateurs de SO(Q). On a démontré les
parties a) et b) de l’énoncé suivant
Thorme. a) L’application Φ induit un isomorphisme G/K ∗ → SO(Q).
b) Soit ρ ∈ SO(Q) décomposée en produit de symétries hyperplanes ρ = sx1 . . . sxm , alors l’élément M (ρ) :=
Q(x1 ) . . . Q(xm ) ∈ K ∗ /K ∗2 ne dépend pas de la décomposition et l’application M : SO(Q) → K ∗ /K ∗2
est un homomorphisme de groupes dont le noyau contient Ω(E, Q).
c) Supposons de plus qu’il existe x ∈ E \ {0} tel que Q(x) = 0 (on dit que la forme est isotrope) alors
la norme spinorielle induit un isomorphisme SO(E, Q)/Ω(E, Q) ∼ = K ∗ /K ∗2 . Si, de plus n ≥ 5, alors
PΩ(E, Q) := Ω(E, Q)/Z(Ω(E, Q)) est simple.
Plus exactement, on a démontré la première affirmation et la deuxième découle des remarques précédentes.
Il est clair, puisque K ∗ /K ∗2 est commutatif que Ω(Q) ⊂ Ker(M ). Pour le point c) on renvoie aux livres
d’Artin (Algèbre géométrique) et Dieudonné (Géométrie des groupes classiques). On notera qu’en général,
l’hypothèse de l’existence d’un vecteur isotrope (i.e. d’un x 6= 0 tel que Q(x) = 0) est indispensable aux
conclusions de c) (Cf ibidem), néanmoins dans le cas où K = R et Q est la forme quadratique définie positive,
on a vu que le groupe PO(E, Q) = PO(n, R) est simple dès que n = dim(E) = 3 ou ≥ 5.
80
F. REPRÉSENTATIONS DES GROUPES FINIS.
Une représentation d’un groupe G est un homomorphisme ρ de G vers GL(E) où E est un K-espace vectoriel;
par abus on parlera de la représentation E si le contexte est sans ambigüité. On peut voir ρ comme une action
linéaire de G sur E. On s’intéressera exclusivement au cas où E est de dimension finie et principalement au
cas où G est fini et K est de caractéristique zéro (voir ci-dessous pourquoi).
Une variante consiste à introduire l’algèbre de groupe K[G] qui est l’algèbre ayant pour ensemble sous-jacent
l’ensemble des fonctions de G dans K muni de la somme (f +g)(x) = f (x)+g(x) et du produit de convolution :
X
(f ∗ g)(x) = f (y)g(y −1 x).
y∈G
En notant eg (x) = 1 si x = g et 0 sinon, on a K[G] = ⊕g∈G Keg et le produit d’algèbre s’écrit eg · eg0 = egg0 .
L’algèbre K[G] est commutative si et seulement si G est commutatif, en fait plus précisément on vérifie
aisément que f est dans le centre de K[G] si et seulement si f (hgh−1 ) = f (g) c’est-à-dire f est constante sur
les classes de conjugaison (on dit que f est centrale). Une représentation est simplement un K[G]-module!
F.1. Généralités.
Donnons deux exemples pour commencer. Un homomorphisme φ : G → C∗ est une représentation de
dimension 1, son image est un groupe fini cyclique. Ensuite on peut définir ρ : Sn → GL(n, K) par
ρ(σ)(ei ) = eσ(i) .
Une représentation est dite fidèle si Ker(ρ) = {e}; remarquons que ρ induit toujours une représentation fidèle
de G/ Ker(ρ).
Un homomorphisme f : E1 → E2 entre deux représentations ρi : G → GL(Ei ) est un homomorphisme de
K[G]-module, ou, en d’autres termes une application K-linéaire telle que pour tout g ∈ G on ait ρ2 (g) ◦ f =
f ◦ ρ1 (g). L’ensemble des homomorphismes forment un groupe noté HomG (E1 , E2 ); l’ensemble des endomor-
phismes d’une représentation E forme un anneau noté EndG (E). Un isomorphisme de représentations est
un homomorphisme bijectif.
La somme de deux représentations ρi : G → GL(Ei ) est la représentation ρ : G → GL(E1 ⊕ E2 ) définie par
ρ(g)(x1 + x2 ) = ρ1 (g)(x1 ) + ρ2 (g)(x2 ). Si Ai est la matrice de ρi (g) dans unebase de Ei , la matrice de ρ(g)
A1 0
dans la base de E obtenu en réunissant les vecteurs des bases de E1 , E2 est .
0 A2
On note Ě le dual de E. La représentation duale ou contragrédiente d’une représentation ρ : G → GL(E)
est la représentation ρ̌ : G → GL(Ě) définie par
Si A est la matrice de ρ(g) dans une base de E, la matrice de ρ̌(g) dans la base duale est tA−1 .
La représentation régulière de G est définie ainsi : on prend comme espace E := K[G] = ⊕g∈G Keg et comme
action ρ(g)(eh ) = egh . Dans la base des eg les matrices des ρ(g) sont des matrices de permutation.
Une sous-représentation est un sous-espace F de E stable sous l’action de G (c’est un K[G]-sous-module).
La représentation quotient notée ρ̄ ou ρ̄E/F est la représentation qu’on obtient par action sur E/F (c’est le
K[G]-module quotient). Si on choisit F 0 un supplémentaire (non nécessairement G-invariant) et une base de
E respectant la décomposition E = F ⊕ F 0 , si A est la matrice de ρF (g) dans la base de F et B la matrice
0 A ∗
de ρ̄E/F (g) dans la base de E/F déduite de celle de F alors la matrice de ρ(g) est de la forme .
0 B
Par exemple E G := {x ∈ E | ∀g ∈ G, ρ(g)(x) = x} est une sous-représentation.
Remarque. Il n’est pas vrai en général que E soit isomorphe à F ⊕ E/F comme le montre l’exemple du
groupe T des matrices triangulaires de GL(2, K) agissant sur E = K 2 . Il y a un sous-espace stable (une
droite) mais aucun supplémentaire n’est stable.
81
Une représentation est irréductible si elle n’admet aucune sous-représentation autre qu’elle-même et la
représentation nulle. Une représentation de dimension 1 est clairement irréductible, nous verrons plus loin
que tout groupe non abélien admet au moins une représentation irréductible de dimension ≥ 2. Les deux
énoncés suivants expliquent en grande partie l’importance de cette notion.
Lemme. (Lemme de Schur) Soit f : E1 → E2 un homomorphisme entre deux représentations irréductibles
ρi : G → GL(Ei ), alors
(i) Si les deux représentations ne sont pas isomorphes, alors f = 0.
(ii) Si E1 = E2 et ρ1 = ρ2 , alors f est une homothétie.
Preuve. On observe que Ker(f ) est une sous-représentation de E1 , et Im(f ) une sous-représentation de E2
donc ou bien Ker(f ) = E1 et f est nulle, ou bien Ker(f ) = {0} et f est injective. Dans le deuxième cas,
Im(f ) est non nul donc égal à E2 . Pour prouver le point (ii) on remplace f par f − λid avec λ valeur propre
de f ; comme Ker(f − λid) 6= {0} on conclut que Ker(f − λid) = E1 et donc f = λid.
Théorème. Toute représentation d’un groupe fini G sur un corps de caractéristique première à card(G) se
décompose en somme de représentations irréductibles.
Preuve. On a recours au procédé de la moyenne dû à Weyl. Une première méthode, lorsque K = R ou C
est d’introduire sur E un produit scalaire invariant par G. Précisément, si (., .) est un produit scalaire ou
hermitien sur E, on pose X
(x, y)G := (ρ(g)(x), ρ(g)(y)).
g∈G
On voit immédiatement que c’est de nouveau un produit scalaire ou hermitien et que ρ(g) est une isométrie
pour ce produit scalaire. Si F est une sous-représentation de E, on constate que F 0 := F ⊥ est invariant
par ρ(G) et E = F ⊕ F 0 ; bien entendu l’orthogonal est pris au sens du produit scalaire (., .)G . Une variante
p : E → F est un projecteur
de ce procédé consiste à construire un projecteur G-invariant de E sur F . Si P
1 −1
quelconque de E sur F (i.e. pour x ∈ F on a p(x) = x), posons pG = card(G) g∈G ρ(g)pρ(g) , on vérifie
que, si x ∈ F alors pG (x) = x puisque ρ(g)(x) ∈ F pour tout g ∈ G. Le noyau du projecteur pG fournit
alors le supplémentaire cherché. On remarquera que cette variante nécessite uniquement comme hypothèse
que card(G) soit inversible dans K.
Remarques. a) L’exemple où G est le groupe des matrices 2 × 2 triangulaires supérieures à coefficients dans
Fp agissant sur V = F2p montre que l’hypothèse du théorème n’est pas superflue. En effet, il y a bien dans
ce cas une sous-représentation de dimension 1 mais pas de supplémentaire stable.
b) On peut traduire cet énoncé en disant que les K[G]-modules de type fini sont semi-simples. Soit ρ : G →
GL(E) une représentation, il existe des entiers mi ≥ 1 et des représentations irréductibles E1 , . . . , Er deux
à deux non isomorphes telles que E ∼ = E1m1 ⊕ . . . ⊕ Ermr . On dit que mi est la multiplicité de Ei dans la
représentation E (on verra plus loin que cette multiplicité est intrinsèque) et, dans ce cas, le lemme de Schur
se traduit en le fait que
EndG (E) ∼
= End(E1m1 ) × . . . × End(Ermr ) ∼
= Mat(m1 × m1 , K) × . . . × Mat(mr × mr , K).
On peut par exemple se demander quelle est la décomposition de la représentation régulière. Cette question
est résolue plus loin à l’aide de la théorie des caractères mais notonsP
tout de suite que la représentation
régulière n’est jamais irréductible (sauf si G = {e}) puisque, si eG = g∈G eg , la droite F = KeG définit
une sous-représentation triviale.
Le produit tensoriel de deux représentations ρi : G → GL(Ei ) est la représentation ρ : G → GL(E1 ⊗ E2 )
définie par
ρ(g)(x1 ⊗ x2 ) := (ρ1 (g)(x1 )) ⊗ (ρ2 (g)(x2 )) .
Si A = (aij ) (resp. B = (bij )) est la matrice de ρ1 (g) dans une base ei (resp. de ρ2 (g) dans une base fj ) alors
la matrice de ρ dans la base ei ⊗fj est le produit tensoriel des matrices A et B i.e. ci1 ,j1 ;i2 ,j2 = ai1 j1 bi2 j2 . En se
rappelant que Hom(E, F ) = Ě ⊗ F on voit que si ρ : G → GL(E) et ρ0 : G → GL(F ) sont des représentations
82
de G on obtient une représentation de G dans Hom(E, F ) en tensorisant la représentation contragrédiente
de ρ par ρ0 . On peut l’écrire explicitement : si f ∈ Hom(E, F ), on a (ρ̌ ⊗ ρ0 )(g)(f ) = ρ0 (g) ◦ f ◦ ρ(g −1 ). En
particulier les éléments invariants de cette représentation sont les homomorphismes de représentation (i.e.
les f ∈ Hom(E, F ) tels que ρ0 (h) ◦ f = f ◦ ρ(h)), en d’autres termes Hom(E, F )G = HomG (E, F ).
Exercice. Soit ρ : G → GL(E) une représentation de dimension n en caractéristique 6= 2 et ρ(2) : G →
GL(E ⊗ E) la représentation produit tensoriel de deux copies de ρ. Soit δ : E ⊗ E → E ⊗ E linéaire telle
que δ(x1 ⊗ x2 ) = x2 ⊗ x1 et F + (resp; F − ) le sous-espace des éléments invariants (resp. anti-invariants)
de l’involution δ. Montrer que F + et F − sont des sous-représentations de E de dimensions respectivement
n(n+1)/2 et n(n−1)/2 et que E = F + ⊕F − . La représentation F + (resp. F − ) s’appelle le carré symétrique
(resp. le carré alterné) et se note souvent Sym2 (E) (resp. Λ2 (E)).
On peut décrire les représentations irréductibles (et donc les autres) de G1 ×G2 à partir de celles de G1 et G2 .
Tout d’abord si ρi : Gi → GL(Ei ) sont des représentations de G, on définit ρ1 ⊗ ρ2 : G1 × G2 → GL(E1 ⊗ E2 )
par la formule (ρ1 ⊗ ρ2 )(g1 , g2 ) = ρ1 (g1 ) ⊗ ρ2 (g2 ). On peut remarquer que l’application de K[G1 ] ⊗ K[G2 ]
vers K[G1 × G2 ] définie par eg1 ⊗ eg2 7→ e(g1 ,g2 ) est un isomorphisme. On a alors
Proposition. La représentation ρ1 ⊗ ρ2 est une représentation irréductible si et seulement si ρ1 et ρ2 sont
irréductibles. De plus toute représentation irréductible de G1 × G2 est de cette forme.
La preuve est plus facile une fois qu’on a développé la théorie des caractères et est donc renvoyée au para-
graphe suivant.
Décrivons toutes les représentations d’un groupe abélien fini, en supposant pour simplifier que le corps de
base est C. D’après ce qui précède, il suffit de considérer les représentations de Z/mZ. Les matrices ρ(g) sont
toutes diagonalisables car leurs polynômes minimaux divisent X card(G) − 1 et possèdent donc des racines
simples; elles sont mêmes simultanément diagonalisables. Ainsi, à changement de base près, il existe n
homomorphismes φi : G → C∗ tels que
φ (g) 0
1
0 φ2 (g)
ρ(g) = .. .
.
φn (g)
On note tout de suite quelques propriétés évidentes : χρ (e) = dim(ρ), χρ (g −1 ) = χρ (g) et χρ est constant
sur les classes de conjugaison. De plus on a les formules :
(i) χρ1 ⊕ρ2 (g) = χρ1 (g) + χρ2 (g).
(ii) χρ1 ⊗ρ2 (g) = χρ1 (g)χρ2 (g).
(iii) χρ̌ (g) = χρ (g −1 ).
(iv) Si ρ est isomorphe à ρ0 alors χρ = χρ0 .
Preuve. On a χρ (e) = Tr idE = dim(E). Ensuite les matrices ρ(g) sont diagonalisables avec pour valeurs
propres des racines de l’unité donc les valeurs propres de ρ(g −1 ) sont les conjuguées d’icelles et l’on en
déduit bien χρ (g −1 ) = χρ (g). Par ailleurs χ −1 −1
ρ (hgh ) = Tr(ρ(h)ρ(g)ρ(h) ) = Tr ρ(g) = χρ (g). Les formules
A 0
(i), (ii) et (iii) découlent du fait que Tr = Tr A + Tr B, que Tr A ⊗ B = (Tr A)(Tr B) et que
0 B
Tr(tA) = Tr A. Enfin si ρ0 (g) = f ◦ ρ(g) ◦ f −1 on a χρ0 (g) = Tr ρ0 (g) = Tr(f ◦ ρ(g) ◦ f −1 ) = Tr ρ(g) = χρ (g).
83
On introduit maintenant un produit scalaire sur les fonctions de G dans C :
1 X
(f, f 0 ) := f (g)f 0 (g).
card(G)
g∈G
Mais le lemme de Schur indique que la dernière dimension est nulle si χ1 6= χ2 et vaut un si E1 ∼
= E2 .
d’où le résultat.
Remarque. En particulier cet énoncé permet de vérifier que la multiplicité ne dépend pas de la décomposition
de la représentation E.
On en déduit facilement l’important résultat suivant :
Théorème. Deux représentations sont isomorphes si et seulement si elles ont mêmes caractères.
Preuve. En effet si χρ = χρ0 alors les deux représentations contiennent une représentation irréductible de
caractère χ avec la même multiplicité (χρ , χ) = (χρ0 , χ) et sont donc isomorphes à la même somme de
représentations irréductibles.
On peut aussi observer que si E = E1m1 ⊕ . . . ⊕ Ermr est une décomposition de la représentation ρ en
irréductibles deux à deux non isomorphes alors (χρ , χρ ) = m21 + . . . m2r et en déduire l’énoncé suivant :
Proposition. Soit ρ : G → GL(E) une représentation, alors (χρ , χρ ) est un entier strictement positif qui
est égal à 1 si et seulement si ρ est irréductible.
Nous sommes maintenant en mesure de calculer la décomposition de la représentation régulière.
Théorème. Soit Irr(G) l’ensemble des représentations irréductibles de G (à isomorphismes près), si χ est
le caractère d’une de ces représentations, on note χ(e) = mχ sa dimension. On a lors
X
χreg = mχ χ
χ∈Irr(G)
84
ou encore
RegG = ⊕E∈Irr(G) E mE
et en particulier X
|G| = m2χ .
χ∈Irr(G)
Preuve. On voit directement que χreg (g) = 0 si g ∈ G \ {e} (resp. χreg (e) = card(G)). En effet pour g 6= e
la matrice de ρ(g) est une matrice de permutation sans point fixe. On en tire
1 X 1
(χreg , χ) = χreg (g −1 )χ(g) = (card(G)χ(e)) = χ(e) = mχ
card(G) card(G)
g∈G
Exemple. Le nombre de représentation de G de dimension 1 est (G : D(G)) (où D(G) désigne le sous-groupe
des commutateurs). En effet GL(1) est commutatif et donc une telle représentation se factorise par G/D(G).
Application. Nous sommes en mesure de démontrer les résultats annoncés au paragraphe précédent sur les
représentations de G1 × G2 . Soient ρi : Gi → GL(Ei ) deux représentations des groupes Gi de cardinal Ni et
χi leurs caractères respectifs, le caractère de ρ = ρ1 ⊗ ρ2 est donné par χ(g1 , g2 ) = χ1 (g1 )χ2 (g2 ) donc
1 X
(χ, χ) = χ(g1 , g2 )χ(g1 , g2 )
N1 N2
(g1 ,g2 )∈G1 ×G2
1 X 1 X
= χ1 (g1 )χ1 (g1 ) χ2 (g2 )χ2 (g2 )
N1 N2
g1 ∈G1 g2 ∈G2
= (χ1 , χ1 )(χ2 , χ2 ).
On en déduit que ρ est irréductible si et seulement si (χ, χ) = 1 donc si et seulement si (χ1 , χ1 ) = (χ2 , χ2 ) = 1
donc si et seulement si ρ1 et ρ2 sont irréductibles. Remarquons que l’application de Irr(G1 ) × Irr(G2 ) vers
Irr(G1 × G2 ) définie par (ρ1 , ρ2 ) 7→ ρ1 ⊗ ρ2 est injective car le caractère χ1 (resp. χ2 ) se récupère à partir de
χ par la formule χ1 (g1 ) = χ(g1 , 1) (resp. χ2 (g2 ) = χ(1, g2 )). Enfin on vérifie que l’application est également
surjective car
X X X X
m2ρ1 ⊗ρ2 = m2ρ1 m2ρ2 = |G1 | · |G2 | = m2ρ .
ρ1 ∈Irr(G1 ),ρ2 ∈Irr(G2 ) ρ1 ∈Irr(G1 ) ρ2 ∈Irr(G2 ) ρ∈Irr(G1 ×G2 )
Nous allons montrer deux autres résultats sur les représentations irréductibles.
Théorème. Les représentations irréductibles sont en bijection avec les classes de conjugaison.
Preuve. Considérons la sous-algèbre A de C[G] consituée des fonctions centrales i.e. constantes sur les classes
de conjugaison, sa dimension sur C est égale au nombre de classes de conjugaison (c’est aussi le centre de
l’algèbre C[G]). Les caractères χ1 , . . . , χr des représentations irréductibles de G sont dans A et forment une
famille orthonormale. Montrons qu’ils fournissent une base de A, ce qui achèvera la preuve. Il suffit de
montrer que si f : G → C est une fonction dans A orthogonale P aux χi alors f est nulle. Introduisons, pour
toute représentation ρ : G → GL(E) l’application linéaire ρf = g∈G f (g)ρ(g). On peut calculer ρf à l’aide
du lemme suivant
Lemme. Si ρ est de dimension n, irréductible de caractère χ alors ρf est une homothétie de rapport
1 X card(G)
f (g)χ(g) = (f, χ̄).
n n
g∈G
85
Preuve du lemme. On commence par montrer que ρf est un endomorphisme de la représentation, en effet :
X X X
ρ(h)−1 ρf ρ(h) = f (g)ρ(h)−1 ρ(g)ρ(h) = f (g)ρ(h−1 gh) = f (hkh−1 )ρ(k) = ρf .
g∈G g∈G k∈G
Le lemme de Schur garantit donc que ρf est une homothétie et sa trace vaut
X X
Tr ρf = f (g) Tr ρ(g) = f (g)χ(g)
g∈G g∈G
d’où le résultat.
La preuve montre que card(Irr(G)) est égal au nombre de classes de conjugaison de G car chacun des deux
ensembles est en bijection naturelle avec les éléments d’une base d’un même espace vectoriel, mais ne fournit
pas de bijection naturelle entre ces classes et les représentations irréductibles; en fait on ne connait de telle
bijection que pour certains groupes particuliers (par exemple les groupes Sn ). Revenons au cas où f est
orthogonale aux caractères des représentations irréductibles donc à tous les caractères; on voit donc que
ρf = 0 pour toutes les représentations et en particulier pour la représentation régulière. Ceci entraı̂ne que,
si ρ est la représentation régulière, on a
X X
0 = ρf (eh ) = f (g)ρ(g)(eh ) = f (g)egh .
g∈G g∈G
Puisque les eg sont linéairement indépendants, on en déduit bien que f (g) = 0 pour tout g ∈ G.
Corollaire. Un groupe G est abélien si et seulement si toutes ses représentations irréductibles sont de
dimension 1.
Preuve. On a déjà vu que si G est abélien, alors ses représentations irréductibles sont de dimension 1.
Inversement si ses représentations irréductibles sont de dimension 1, on a card(G) = 12 + . . . + 12 donc il
y a card(G) représentations irréductibles, donc autant de classes de conjugaison, ce qui signifie que G est
abélien.
Exemples. Donnons maintenant pour quelques “petits” groupes finis G une description des représentations
irréductibles et de leurs caractères.
(a) Si G est abélien de cardinal n, il existe n homomorphismes différents G → C∗ = GL(1, C) et ainsi
n = 12 + . . . + 12 . Si G = Z/nZ, ces homomorphismes s’écrivent φk (m) = exp(2iπkm/n). Plus
généralement, si G = Z/a1 Z × . . . × Z/ar Z, ces homomorphismes s’écrivent
k1 m1 kr mr
φk (m1 , . . . , mr ) = exp 2iπ + ... + pour 0 ≤ ki ≤ ai − 1.
a1 ar
86
6 = 12 +12 +22 ). On peut décrire cette représentation comme la sous-représentation de la représentation
de permutation ρ : S3 → GL(3, C) définie par le plan d’équation x1 + x2 + x3 = 0.
(c) Si G = Dn , alors G contient un sous-groupe abélien (cyclique) d’indice 2 donc les représentations
irréductibles sont de dimension 1 ou 2. On a G/D(G) ∼ = Z/2Z si n est impair (resp. ∼= (Z/2Z)2 ) si n
est pair). Ainsi le nombre de représentations irréductibles de dimension 2 est (2n − 2)/4 = (n − 1)/2 si
n est impair et (2n − 4)/4 = n/2 − 1 si n est pair. Notons x ∈ G une rotation d’ordre n et y ∈ G une
symétrie (donc xn = y 2 = e et yxy = yxy −1 = x−1 ), on peut décrire les représentations de dimension 2
par les formules
exp(2kπi/n) 0 0 1
ρk (x) = et ρk (y) = .
0 exp(−2kπi/n) 1 0
(d) Plus généralement si p, q sont premiers tels que q = mp + 1, soit G = Z/qZ >/φ Z/pZ le groupe non
commutatif de cardinal pq. Les représentations de G ont une dimension inférieure à p et qui divise pq
donc égale à 1 ou p. Par ailleurs G/D(G) ∼ = Z/pZ donc il y a p représentations de dimension 1 et m
représentations de dimension p. On a bien pq = p12 + mp2 . On peut vérifier qu’il y a bien m + p classes
de conjugaison : la classe du neutre, les éléments d’ordre p se répartissent en p − 1 classes de cardinal q,
les éléments d’ordre q se répartissent en m classes de cardinal p. Pour construire les représentations de
dimension p on peut procéder comme suit. On note x ∈ G un générateur du sous-groupe d’ordre q et y
un élément d’ordre p de sorte que yxy −1 = xu où u entier qui est d’ordre p dans (Z/qZ)∗ ; on choisit α
racine q-ième de l’unité et on pose :
α 0 1
0 αu 1 0
ρα (x) = ..
et
ρα (y) = ..
.
.
.
p−2
αu 0
p−1
αu 0 1 0
p−1
X
χk (xa ) = exp(2kauj πi/q) et χk (y b xa ) = 0.
j=0
On obtient un ensemble non redondant en choisissant k1 , . . . , km tels que l’ensemble des ki uj (pour
i = 1, . . . , m et j = 0, . . . , p − 1) décrive tout (Z/qZ)∗ .
(e) Si G = H8 . Il y a 5 classes de conjugaison. Le quotient de G par son centre {±1} est isomorphe à
(Z/2Z)2 donc il y a quatre représentations de dimension 1 et une représentation de dimension 2 puisque
8 = 12 + 12 + 12 + 12 + 22 . La représentation de dimension 2 est la représentation “standard” donnée
par :
i 0 0 1 0 i
ρ(±1) = ±Id, ρ(i) = , ρ(j) = et ρ(k) = ,
0 −i −1 0 i 0
le caractère s’écrivant χ(±1) = ±2 et χ(x) = 0 si x 6= ±1.
(f) Si G = A4 , il y a 4 classes de conjugaison et le quotient de G par le groupe de Klein est isomorphe à Z/3Z
et c’est G/D(G), donc il y a exactement trois représentations de dimension 1 et donc une quatrième
représentation irréductible qui doit être de dimension 3 puisque 12 = 12 + 12 + 12 + 32 . Considérons la
représentation de permutation sur C4 et E le sous-espace x1 + x2 + x3 + x4 = 0, on vérifie facilement
que c’est la représentation cherchée.
87
(g) Si G = A5 , il y a 5 classes de conjugaison : la classe de l’élément neutre, la classe C2,2 des doubles
transpositions (15 éléments), la classe C3 des 3-cycles (20 éléments) et deux classes C5 et C50 décrivant
les 5-cycles (12 éléments chacune). Comme G est simple, la seule représentation de dimension 1 est la
représentation triviale. La représentation de permutation sur C5 contient une sous-représentation E :
le sous-espace x1 + x2 + x3 + x4 + x5 = 0, on vérifie facilement que c’est une représentation irréductible,
on la note ρ4 . Le groupe A5 contient six sous-groupes de Sylow de cardinal 5 et on a donc une injection
“exotique” A5 ,→ S6 ; on obtient une sous-représentation F de dimension 5 donnée par l’hyperplan
somme des coordonnées égale zéro dans la représentation de permutation ; on vérifie également que
c’est une représentation irréductible de A5 , on la note ρ5 . Les deux autres représentations irréductibles
sont de dimension 3 puisque 60 = 12 + 32 + 32 + 42 + 52 . On sait que A5 est le groupe d’isométrie
de l’icosaèdre, d’où une première représentation ρ2 de dimension 3, la deuxième s’obtient en modifiant
celle-ci par l’automorphisme φ “conjugaison par une transposition” (qui n’est pas intérieur dans A5 ),
c’est-à-dire ρ3 := ρ2 ◦ φ. Comme φ échange C5 et C50 et comme χ2 (C5 ) 6= χ2 (C50 ) on voit que ρ2 et ρ3 ne
sont pas isomorphes.
On peut vérifier que le tableau des valeurs des 5 caractères χi := χρi est le suivant :
1 C2,2 C3 C5 C50
χ1 1 1 1 1 1
√ √
1+ 5 1− 5
χ2 3 -1 0 2 2
√ √
1− 5 1+ 5
χ3 3 -1 0 2 2
χ4 4 0 1 -1 -1
χ5 5 1 -1 0 0
Passons maintenant à des considérations d’intégralité. La première remarque est que les valeurs propres d’un
ρ(g) étant des racines de l’unité, les valeurs prises par un caractère sont des entiers algébriques. On peut
être plus précis et montrer
Proposition. Soit f : G → C une fonction centrale dont les valeursPsont des entiers algébriques, et soit χ le
caractère d’une représentation irréductible de dimension n alors n1 g∈G f (g)χ(g) est un entier algébrique.
P
Preuve. Soit C1 , . . . , Ch les classes de conjugaison de G et eCi = g∈Ci g ∈ Z[G]. Alors B = ZeC1 +. . .+ZeCh
est un sous-anneau commutatif de Z[G] (ou C[G]) dont tous les éléments sont entiers sur Z (i.e. racine d’un
polynôme
P unitaire à coefficients dans Z). On en déduit que le polynôme caractéristique (ou minimal) de
ρf = g∈G f (g)ρ(g) est à coefficients entiers et donc que sa valeur propre n1 g∈G f (g)χ(g) est un entier
P
algébrique.
Application. Montrons qu’un groupe G de cardinal pa q b est résoluble (résultat dû à Burnside). Il suffit en
fait de montrer qu’il n’est pas simple.
Lemme. Soit ρ une représentation irréductible de G de dimension n, soit χ son caractère et soit C une
classe de conjugaison de cardinal h avec PGCD(h, n) = 1, alors ou bien χ(C) = 0 ou bien χ(C) = nζ avec ζ
racine de l’unité et ρ(C) est dans le centre de la représentation.
88
Preuve du lemme. Choisissons x ∈ C, ou bien toutes les valeurs propres de ρ(x) sont égales et alors ρ(x) = ζid
et bien sûr χ(x) = nζ, ou bien les valeurs propres ζ1 , . . . , ζn ne sont pas toutes égales. Dans le dernier cas
on a donc |χ(x)| = |ζ1 + . . . + ζn | < n. Par ailleurs nous avons vu que hχ(x)/n est un entier algébrique, or
l’hypothèse entraı̂ne par le théorème de Bézout l’existence de u, v ∈ Z tels que uh + vn = 1 donc
χ(x) hχ(x)
=u + vχ(x)
n n
est encore un entier algébrique. Etant de module < 1 dans tout plongement, il est donc nul (car sa norme
est un entier < 1).
Soit maintenant G de cardinal pa q b , choisissons x 6= e dans le centre d’un q-sous-groupe de Sylow, alors
ou bien x est dans le centre de G qui n’est donc pas simple, ou bien la classe de conjugaison de x a pour
cardinal une puissance positive de p. Soit χ le caractère de ρ une des représentations irréductibles de G,
d’après le lemme, ou bien p divise la dimension mχ de la représentation, ou bien χ(x) = 0, ou bien ρ(x) est
dans le centre de ρ(G). Mais, en écrivant
X X
0 = χreg (x) = mχ χ(x) = 1 + mχ χ(x)
χ∈Irr(G) χ6=1
on voit qu’on ne peut avoir χ(x) = 0 pour tous les χ tels que p ne divise pas mχ , sinon on obtiendrait une
égalité du type 0 = 1 + p(entier). Par conséquent pour une de ces représentations, ρ(x) est dans le centre de
ρ(G) et donc G n’est pas simple.
89