0% ont trouvé ce document utile (0 vote)

102 vues89 pages

Cours Alg

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

102 vues89 pages

Cours Alg

Transféré par

Alain Rolland

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

COURS D’ALGÈBRE AU MAGISTÈRE DE CACHAN

Marc HINDRY, Université Paris 7.

[email protected]

A. GROUPES ET ACTIONS DE GROUPES.

A.1. Généralités page 3
A.2. Quotient d’un groupe par un sous-groupe page 4
A.3. Action de groupes page 6
A.4. Théorèmes de Sylow page 7
A.5. Produit semi-direct page 10
A.6. Groupes abéliens page 15
A.7. Le groupe Sn page 19
A.8. Le b-a-ba de la classification des groupes finis page 23
B. ANNEAUX.
B.1. Généralités, exemples page 30
B.2. Divisibilité et idéaux page 33
B.3. Anneaux de polynômes page 38
B.4. Ensembles algébriques et idéaux de k[X1 , . . . , Xn ] page 41
C. CORPS.
C.1. Généralités, exemples page 45
C.2. Eléments algébriques et transcendants page 46
C.3. Corps finis page 50
D. MODULES.
D.1. Généralités, exemples page 52
D.2. Modules de type fini sur les anneaux principaux page 53
D.3. Facteurs invariants de matrices page 55
E. GROUPES CLASSIQUES.
1. Formes sesqui-linéaires Géométrie orthogonale, unitaire et symplectique page 60
2. Les groupes GL(n, K) et SL(n, K) page 64
3. Groupe orthogonal page 66
4. Groupe symplectique page 69
5. Groupe unitaire page 71
6. Quaternions, arithmétique et groupe orthogonal page 73
F. REPRÉSENTATIONS DES GROUPES FINIS.
F.1. Généralités, exemples page 81
F.2. Caractères page 83

En un semestre A, B, C et D ont été traitées et il a été fait allusion aux parties E et F.

1
Quelques références choisies.
J’utiliserai beaucoup et je recommande comme référence (en particulier pour l’algèbre à l’agrégation) le
Cours d’algèbre, D. Perrin (collection Ellipses)
Sauf les parties D et F, ce livre traite tous les thèmes abordés dans ce cours. Parmi les traités généraux
d’algèbre traitant également l’algèbre linéaire je signale
Algebra, S. Lang (collection Addison-Wesley), très dense et riche.
Cours d’algèbre, R. Godement (collection Hermann), la partie cours est du niveau des deux premières années
d’université mais les exercices permettent d’aller au niveau licence-maı̂trise.
Algebra, M. Artin (collection Prentice-Hall), très pédagogique et attrayant.
Algebra, Birkhoff & MacLane (collection Chelsea), un classique.
Pour approfondir la notion d’action de groupes, les applications à la géométrie citons
Eléments de géométrie, R. Mneimné (collection Cassini) foisonnant et instructif.
Pour une introduction aux représentations de groupes finis, il est difficile de surpasser
Représentations linéaires des groupes finis, J-P. Serre (collection Hermann).
Pour finir, je recommande de jeter un coup d’oeil au volume de l’encyclopédie russe
Basic notions of algebra, I. Shafarevic (collection Springer).

2
A. GROUPES ET ACTIONS ET GROUPES

Une présentation des groupes, de leurs quotients avec des exemples. La notion centrale présentée est celle
d’action de groupe.

A.1. Généralités sur les groupes.

Définition. Un groupe est la donnée d’un ensemble G et d’une loi interne G × G → G vérifiant
(i) (élément neutre) Il existe e ∈ G tel que, pour tout g ∈ G, on ait e ∗ g = g ∗ e = g.
(ii) (associativité) Pour tout g, g 0 , g 00 ∈ G, on a (g ∗ g 0 ) ∗ g 00 = g ∗ (g 0 ∗ g 00 ).
(iii) (inverse d’un élément) Pour tout g ∈ G, il existe g 0 ∈ G tel que, g 0 ∗ g = g ∗ g 0 = e.
Remarques. L’ensemble G s’appelle l’ensemble sous-jacent; par abus de langage, on parlera du groupe G,
sous-entendant ainsi la loi que l’on notera le plus souvent comme un produit; l’inverse de g sera alors noté
g −1 . Lorsque la loi vérifie de plus g ∗ g 0 = g 0 ∗ g, on dira que le groupe est commutatif ou abélien et l’on
notera alors parfois la loi comme une addition et l’inverse de g s’écrira −g.
Exemples. Vous connaissez déjà bien sûr des groupes comme Z, Z/nZ (munis de l’addition), ou Sn (le
groupe des permutations sur n éléments) ou GL(n, R), le groupe des matrices de taille n × n inversibles à
coefficients réels. Comme exemple initial, ajoutons l’ensemble des transformations linéaires préservant une
figure dans le plan, l’espace ou plus généralement Rn ; ces transformations sont d’ailleurs des isométries.
Concrètement l’ensemble des transformations linéaires du plan préservant un polygone régulier à n côtés
est un groupe noté Dn (dont on montre ci-dessous qu’il est de cardinal 2n); l’ensemble des transformations
linéaires du plan préservant un cube est un groupe (dont on peut montrer qu’il est de cardinal 48);
Premiers calculs. Dans un groupe, “on peut toujours simplifier”, c’est-à-dire que xy = xz entraı̂ne y = z.
En effet il suffit de multiplier par x−1 :

y = ey = (x−1 x)y = x−1 (xy) = x−1 (xz) = (x−1 x)z = ez = z.

L’inverse de x−1 est x et l’inverse de xy est y −1 x−1 , en effet :

(xy)(y −1 x−1 ) = x(yy −1 )x−1 = xex−1 = xx−1 = e.

Définition. 

 e si n = 0





 x
| .{z
. . x} si n > 0

 (n fois)

xn :=

−1
. . x−1}



 x
| .{z si n < 0


 (|n| fois)




On a xm .xn = xm+n et (xm )n = xmn . Si y = gxg −1 alors y n = gxn g −1 .

Un sous-ensemble H d’un groupe G est un sous-groupe si la loi de groupe sur G induit une loi de groupe
sur H. C’est-à-dire si H est stable par multiplication, passage à l’inverse et contient l’élément neutre
(l’associativité est alors automatique). On voit facilement que cette condition équivaut à dire que e ∈ H et
que x, y ∈ H entraı̂ne xy −1 ∈ H. De même il est immédiat de montrer que l’intersection de sous-groupes
est un sous-groupe.
Si S est un sous-ensemble d’un groupe G on définit le sous-groupe engendré par S comme le plus petit
sous-groupe de G contenant S, i.e. l’intersection de tous les sous-groupes contenant H. C’est un exercice
facile de voir que c’est aussi l’ensemble des produits x11 · · · xrr avec r ≥ 0, xi ∈ S et i = ±1.

3
Soit G1 et G2 deux groupes. On définit le produit de groupes qui a comme ensemble sous-jacent G1 × G2 par
la loi de composition :
(g1 , g2 ) ∗ (g10 , g20 ) := (g1 g10 , g2 g20 ).

Une application f : G1 → G2 entre deux groupes est un homomorphisme de groupes si elle vérifie

∀x, y ∈ G1 , f (xy) = f (x)f (y);

c’est un isomorphisme si elle est bijective, un automorphisme si de plus G1 = G2 . On appelle noyau le

sous-groupe Ker(f ) = {x ∈ G1 | f (x) = e} et image le sous-groupe f (G1 ) = {y ∈ G2 | ∃x ∈ G1 , f (x) = y}.
Il est immédiat que le composé d’homomorphismes (resp. d’isomorphismes, resp. d’automorphismes) est
encore un homomorphisme (resp. un isomorphisme, resp. un automorphisme). En particulier l’ensemble des
automorphismes d’un groupe G est un groupe que l’on notera Aut(G). Remarquons aussi que la bijection
réciproque d’un isomorphisme est automatiquement un homomorphisme.
Exemples. L’application x 7→ x2 est un homomorphisme de groupes si et seulement si le groupe G est abélien
(i.e. commutatif). Soit x ∈ G, l’application φx : G → G définie par φx (y) := xyx−1 est un automorphisme
appelé automorphisme intérieur de G; de plus l’application x 7→ φx de G dans Aut(G) est un homomorphisme
de groupes. L’ensemble des images par automorphisme intérieur d’un élément y ∈ G s’appelle la classe de
conjugaison de y.
Décrivons maintenant l’exemple cité plus haut de groupe d’origine géométrique: le groupe dièdral Dn .
Théorème. Le groupe des isométries planes d’un polygone régulier à n côtés (n ≥ 3), de centre O a pour
cardinal 2n; il contient n rotations, les rotations d’angle 2kπ/n et de centre O et n symétries, les symétries
orthogonales fixant les droites passant par O et un sommet ou le milieu d’une arête.
Preuve. On voit facilement que les isométries décrites dans l’énoncé laissent invariant le polygone, il s’agit
de démontrer que ce sont les seules. Pour cela on va utiliser le lemme suivant (dont on laisse la preuve en
exercice) :
Lemme. Soit s une isométrie plane laissant invariant un polygone régulier à n côtés, de centre O et sommets
A1 , . . . , An alors
- Si s fixe deux sommets adjacents, alors s est l’identité;
- Si s fixe un sommet Ai , alors s est soit l’identité soit la symétrie par rapport à la droite OAi .
Soit maintenant σ une isométrie du polygone, il existe une rotation r d’angle 2kπ/n telle que r ◦ σ(A1 ) = A1
(en effet ces rotations permutent circulairement les sommets). Donc, d’après le lemme, ou bien r ◦ σ = id et
alors σ est une rotation d’angle −2kπ/n ou bien r ◦ σ est la symétrie s1 par rapport à OA1 et σ = r−1 ◦ s1 .
Cela suffit pour voir que card(Dn ) = 2n et permet de vérifier (indirectement) que r−1 ◦ s1 est une des
symétries décrites.

Remarques. Les rotations forment un sous-groupe de Dn isomorphe à Z/nZ. Si r est une rotation et s une
symétrie, alors srs−1 = srs = r−1 (vérifiez-le). On peut utiliser cela pour montrer que le centre de Dn est
trivial si n est impair et d’ordre 2 (engendré par la rotation d’angle π) si n est pair. On peut aussi interpréter
D2 comme le groupe des isométries planes laissant invariant un segment (il est isomorphe à Z/2Z × Z/2Z).

A.2. Quotient d’un groupe par un sous-groupe.

On intoduit les notations suivantes, si A et B sont des parties d’un groupe G. On pose A.B := {a.b | a ∈
A, b ∈ B} et de même A−1 := {a−1 | a ∈ A}. On écrira g.A pour {g}.A

4
Soit H un sous-groupe de G, on définit deux relations d’équivalence par
xRy ⇔ xH = yH ⇔ y −1 x ∈ H
xR0 y ⇔ Hx = Hy ⇔ xy −1 ∈ H

On notera G/H l’ensemble quotient G/R (resp. H\G l’ensemble quotient G/R0 ). Vérifions, par exemple,
que R est une relation d’équivalence. On a x−1 x = e ∈ H donc xRx. Si xRy alors y −1 x ∈ H donc
x−1 y = (y −1 x)−1 ∈ H et yRx. Si xRy et yRz alors y −1 x ∈ H et z −1 y ∈ H donc z −1 x = (z −1 y)(y −1 x) ∈ H
et xRz.
Remarque. Hormis ces relations d’équivalence “jumelles”, la seule autre relation d’équivalence “intéressante”
est la relation de conjugaison : xRy si il existe g ∈ G avec y = gxg −1 . Les classes d’équivalence pour cette
relation s’appelle naturellement classes de conjugaison.
Il faut faire attention qu’en général gH 6= Hg (on verra plus loin que l’égalité n’est vraie pour tout g que
si le sous-groupe H est distingué). Par contre la transformation A 7→ A−1 envoie gH sur Hg −1 donc il y a
une bijection naturelle entre G/H et H\G. Remarquons ensuite que les classes d’équivalence ont toutes le
même cardinal que H. En effet l’application de H vers gH (resp. H.g) qui, à x associe gx (resp. xg) est
visiblement une bijection. On a ainsi démontré le théorème suivant
Théorème. (Lagrange) Soit G un groupe et H un sous-groupe, alors card(G/H) = card(H\G) et

card(G) = card(H) card(G/H).

Exemples. On tire facilement que si x ∈ G et G fini, alors l’ordre de g divise card(G). Ainsi, comme (Z/pZ)∗
a pour cardinal p − 1 on en tire que, pour a entier premier avec p, on a ap−1 ≡ 1 mod p, ou encore que pour
tout entier ap ≡ a mod p (“petit théorème” de Fermat). Plus généralement, si on note φ(n) = card(Z/nZ)∗
on obtient que, pour a entier premier avec n, on a aφ(n) ≡ 1 mod p (théorème d’Euler).
Définition. Un sous-groupe H de G est distingué si, pour tout g ∈ G, on a H = gHg −1 .
Remarquons qu’il est équivalent de demander que, pour tout g ∈ G, on ait gH = Hg ou encore que, pour tout
g ∈ G, on ait H ⊂ gHg −1 . Par ailleurs, le noyau d’un homomorphisme f : G → G0 est toujours distingué;
en effet si y ∈ Ker(f ) alors f (xyx−1 ) = f (x)f (y)f (x)−1 = f (x)e0 f (x)−1 = e0 donc xyx−1 ∈ Ker(f ).
Proposition. L’intersection de sous-groupes distingués est un sous-groupe distingué. Si f : G → G0 est un
homomorphisme de groupes et si H 0 / G0 alors f −1 (H 0 ) / G; si H / G alors f (H) / f (G).
Preuve. Immédiat.

Remarquons que dans la dernière partie de la proposition, on ne peut pas conclure que f (H) est distingué
dans G0 , sauf si f est surjective.
Le principal intérêt des sous-groupes distingués est le suivant.
Proposition. Soit H un sous-groupe de G. Il existe une structure de groupe sur l’ensemble G/H telle
que la surjection canonique s : G → G/H soit un homomorphisme si et seulement si le sous-groupe H est
distingué.
Preuve. Supposons qu’une telle structure existe sur G/H alors H est le noyau de l’homomorphisme s : G →
G/H donc est distingué dans G. Supposons inversement H distingué dans G, on est amené à définir une
loi sur G/H par la formule (xH) ∗ (yH) = xyH (pour que s soit un homomorphisme) et le point est de
vérifier que cette formule est bien définie, i.e. que si x0 ∈ xH et y 0 ∈ yH alors x0 y 0 H = xyH. Or on a bien,
puisque H est distingué et x0 = xh, y 0 = yh0 , l’égalité x0 y 0 H = xhyh0 H = xhyH = xhHy = xHy = xyH.
L’application s : G → G/H est surjective et vérifie donc s(x) ∗ s(y) = s(xy); on en tire immédiatement que
G/H muni de la loi ∗ est un groupe.

Théorème. (Propriété universelle du quotient) Soit f : G → G0 un homomorphisme de groupes. Soit H

un sous-groupe et s : G → G/H la surjection canonique. Il existe une application fˆ : G/H → G0 telle que

5
f = fˆ ◦ c si et seulement si H ⊂ Ker(f ). Dans ce cas, si de plus H est un sous-groupe distingué (et donc
G/H un groupe), alors fˆ est un homomorphisme de groupes, fˆ(G/H) = f (G) et Ker(fˆ) = Ker(f )/H.
Preuve. La condition ensembliste garantissant l’existence de fˆ est que s(x) = s(y) entraı̂ne f (x) = f (y). Or
s(x) = s(y) équivaut à xH = yH ou encore x−1 y ∈ H alors que f (x) = f (y) équivaut à f (x−1 y) = e0 ou
encore x−1 y ∈ Ker(f ). La deuxième partie est immédiate sauf peut-être la détermination du noyau de fˆ.
Soit xH un élément de G/H qui soit dans le noyau de fˆ alors f (x) = fˆ(xH) = e0 donc x ∈ Ker(f ) d’où
l’égalité Ker(fˆ) = Ker(f )/H.

Corollaire. Soit f : G → G0 un homomorphisme de groupe, alors f (G) ∼

= G/ Ker(f ).
Preuve. On applique la propriété universelle avec H = Ker(f ) alors Ker(fˆ) = Ker(f )/ Ker(f ) est trivial
donc fˆ injective.

Applications. a) Le sous-groupe hxi engendré par un élément x ∈ G est isomorphe soit à Z (on dira que x est
d’ordre infini) soit à Z/nZ avec n ≥ 1 (on dira que x est d’ordre n). En effet d’après le corollaire appliqué
à l’homomorphisme défini par f (m) := xm de Z vers hxi ⊂ G, on a hxi ∼ = Z/ Ker(f ).
b) Le noyau de l’homorphisme G → Aut(G) qui a un élément associe l’automorphisme intérieur associé
est le centre de G, noté Z(G); si l’on note Int(G) le groupe des automorphismes intérieurs, on a donc
Int(G) ∼= G/Z(G).

A.3. Action de groupe.

La notion suivante est fondamentale; d’une part les groupes apparaissent naturellement dans la plupart des
problèmes à travers leurs actions (ou représentations) et d’autre part, pour étudier les groupes eux-mêmes,
on verra qu’il est souvent avantageux de les faire agir.
Définition. Une action d’un groupe G sur un ensemble X est une application Φ : G × X → X telle que
(i) Φ(e, x) = x.
(ii) Φ(g, Φ(g 0 , x)) = Φ(gg 0 , x).
Remarque. Il est équivalent de se donner un homomorphisme ρ : G → Bij(X). La correspondance est donnée
par
ρ(g)(x) = Φ(g, x).

On abrègera en général Φ(g, x) en g.x.

Exemple. Si φ est une bijection de X sur X, alors Z agit sur X par l’action n · x = φn (x). Le groupe
GL(2, R) agit naturellement sur R2 ; voici une action moins évidente. Choisissons G = SL(2, R) et H :=
{z ∈ C | Im(z) > 0} le demi-plan de Poincaré, l’application suivante est une action de groupe:

G×H → H
a b az+b
,z 7→ cz+d
c d

Une action définit une relation d’équivalence

xRy ⇔ ∃g ∈ G, y = g.x

dont les classes d’équivalence G.x = {g.x | g ∈ G} s’appellent les orbites de l’action. L’ensemble quotient
X/R sera noté X/G, l’orbite de x sera notée O(x).
Définitions. Le stabilisateur d’un élément x ∈ X est le sous-groupe de G des éléments qui fixe x, i. e.
Gx = {g ∈ G | g · x = x}. Le noyau d’une action est l’intersection des stabilisateurs de tous les points (c’est
aussi le noyau de l’homomorphisme associé). Une action est dite fidèle si son noyau est trivial, transitive s’il
n’y a qu’un orbite.

6
sur H donnée
Exemples. Le noyau de l’action de SL(2, R) ci-dessus est ±I, l’action
de SL(2, R) est transitive,
a b
le stabilisateur de i ∈ H est SO(2, R) = a, b ∈ R, a2 + b2 = 1 .
−b a
Remarques. Si on dispose d’une action G × X → X, on peut lui associer les actions suivantes:
(a) Pour tout sous-groupe H de G, une action de H sur X.
(b) Si K = ∩x∈X Gx est le noyau de l’action, alors on hérite d’une action de G/K sur X qui est fidèle.
(c) Si P(X) (resp. Pn (X)) désigne l’ensemble des parties de X (resp. l’ensemble des parties de cardinal n)
alors onpeut définir une action de G sur P(X) (resp. Pn (X)) par g · A = {g · a | a ∈ A}.
Formule des classes (1ère forme). X
card(X) = card(C)
C∈X/G

Formule des classes (2ème forme).

card(O(x)) = card(G/Gx ).
En effet, considérons l’application f : G → O(x) définie par f (g) = g.x. On a alors f (g) = f (g 0 ) si et
seulement si g.x = g 0 .x ou encore x = (g −1 g 0 ).x ou encore g −1 g 0 ∈ Gx ou encore gGx = g 0 Gx . Ainsi, d’après
la propriété universelle du quotient, f passe au quotient pour donner une bijection fˆ : G/Gx → O(x). On
en tire
Théorème. (Formule des classes) Soit G fini agissant sur X fini et soit R un système d’éléments de X
représentant les classes de X/G, alors
X X card(G)
card(X) = card(G/Gx ) = .
card(Gx )
x∈R x∈R

On note X G l’ensemble des points fixes, c’est-à-dire

X G = {x ∈ X | ∀g ∈ G, g · x = x} = {x ∈ X | Gx = G}

Un groupe de cardinal une puissance d’un nombre premier p sera appelé un p-groupe.
Corollaire. Soit G un p-groupe agissant sur un ensemble fini X alors

|X G | ≡ |X| mod p.

En particulier, si |X| n’est pas divisible par p, il existe un point fixe.

Preuve. On écrit la formule des classes en observant que l’orbite d’un point fixe est, bien sûr, réduite à un
P les autres orbites ont pour cardinal (G : Gx ) avec Gx 6= G donc ce cardinal est divisible par p
point et que
et |X| ≡ x∈X G 1 mod p.

Corollaire. Le centre d’un p-groupe est non trivial.

Preuve. Soit G un p-groupe. Considérons l’action de G sur lui-même par conjugaison (i.e. X = G et
g · x = gxg −1 ). On voit aisément que X G = Z(G) et donc |Z(G)| est divisible par p d’après le corollaire
précédent.

Exercice. Montrer que si (G : H) = p est le plus petit nombre premier divisant card(G) alors H est distingué
dans G. (Indication : considérer l’action de G sur G/H par translation, introduire l’homomorphisme associé
ρ : G → Sp = Bij(G/H) et montrer que H = Ker(ρ)).

A.4. Théorèmes de Sylow.

Le théorème suivant recense essentiellement ce que l’on peut dire d’un groupe fini en ne connaissant que son
cardinal.

7
Théorème. (Sylow) Soit p un nombre premier et G un groupe de cardinal pr m avec m non divisible par p.
(i) Il existe un sous-groupe P de cardinal pr (un tel sous-groupe s’appelle un p-sous-groupe de Sylow de
G).
(ii) Soit H un p-sous-groupe et P un p-sous-groupe de Sylow de G, alors il existe g ∈ G tel que H ⊂ gP g −1 .
En particulier deux p-sous-groupes de Sylow de G sont conjugués.
(iii) Soit np le nombre de p-sous-groupes de Sylow de G. Alors np ≡ 1 mod p et np divise m.
Preuve. Il s’agit de variations sur le thème des actions de groupes et de la formule des classes.
(i) Considérons l’action de G sur lui-même par translation et l’action induite sur X = Ppr (G). Si R désigne
un ensemble des représentants des classes d’équivalence, on a par la formule des classes
r X
p
Cmpr = |X| = (G : GA ).
A∈R

Admettons provisoirement (voir lemme ci-dessous) que p ne divise pas |X|. Alors il existe une orbite,
disons celle de A0 de cardinal premier avec p. On a donc (G : GA0 ) non divisible par p donc |GA0 | est
divisible par pr . Mais par ailleurs, si l’on choisit a0 ∈ A0 , on peut considérer l’application GA0 → A
définie par g 7→ ga0 qui est clairement injective donc |GA0 | est majoré par pr et divisible par pr donc
égal à pr . Ainsi GA0 est un p-sous-groupe de Sylow. La preuve sera complète grâce au lemme
Lemme. Soit m non divisible par un nombre premier p, alors
r
p
Cmpr ≡ m mod p.

On peut démontrer cela directement, en effet

r
−1
pY
(mpr )! mpr − k

pr
Cmp r = r = m .
(p )!(mpr − pr )! pr − k
k=1

Or si k = ps ` alors (mpr − k)(pr − k)−1 = (mpr−s − `)(pr−s − `)−1 ≡ 1 mod p d’où le lemme.
Une deuxième preuve du lemme consiste à appliquer la formule des classes précédente avec G = Z/pr Z ×
Z/mZ, vérifier que Z/pr Z × {0} est le seul sous-groupe à pr éléments et que les seules parties à pr éléments
qu’il laisse stable sont les Z/pr Z × {x}; toutes ces parties forment une orbite unique de cardinal m, les autres
pr
parties vérifient (G : GA ) ≡ 0 mod p et donc on a bien Cmp r = |Ppr (G)| ≡ m mod p.

(ii) Soit P un p-sous-groupe de Sylow (dont l’existence est maintenant garantie) et H un p-sous-groupe de
G. Nous faisons agir H sur G/P par la formule (h, gP ) 7→ hgP . Comme le cardinal de G/P n’est
pas divisible par p et que H est un p-groupe, on en déduit l’existence d’un point fixe. Donc il existe
g0 ∈ G tel que pour tout h ∈ H on ait hg0 P = g0 P ou encore hg0 ∈ g0 P ou encore h ∈ g0 P g0−1 . Ainsi
H ⊂ g0 P g0−1 ; si de plus H est un p-sous-groupe de Sylow, on a donc égalité.
(iii) Notons X = Sy`p l’ensemble des p-sous-groupes de Sylow de G et np son cardinal. Si P ∈ X alors
gP g −1 est de nouveau un p-sous-groupe de Sylow de G. On dispose ainsi d’une action par conjugaison
de G sur X qui est transitive d’après le résultat précédent. Si P est un p-sous-groupe de Sylow de G,
on a clairement P ⊂ GP puisque P est un sous-groupe, par conséquent

|G| m
np = (G : GP ) = = .
(GP : P )|P | (GP : P )

Ainsi np divise m. Considérons maintenant l’action de P sur Sy`p , toujours par conjugaison. L’élément
P est visiblement fixe; nous allons montrer qu’il est l’unique point fixe et nous pourrons alors conclure
que
np ≡ |Sy`P | ≡ 1 mod p
Soit donc Q ∈ Sy`P et introduisons G0 = hP, Qi le sous-groupe engendré par P et Q (argument dit “de
Frattini”). On constate que P et Q sont encore deux p-sous-groupes de Sylow de G0 et par conséquent

8
sont conjugués dans G0 : il existe y ∈ G0 tel que P = yQy −1 mais Q est fixé par P (par hypothèse) et,
bien sûr, est fixé par Q donc par G0 et on peut conclure que P = Q.

Corollaire. Soit G un groupe fini. Il existe un élément d’ordre p dans G si et seulement si p divise card(G).
Preuve. La nécessité provient du théorème de Lagrange. Supposons que p divise card(G), alors il existe un
p-sous-groupe non trivial H (par exemple un p-sous-groupe de Sylow) et y ∈ H \ {e}. L’élément y est d’ordre
r−1
une puissance de p, disons pr avec r ≥ 1. On voit immédiatement que l’élément x = y p est d’ordre p.

9
A.5. Produit semi-direct.
Nous voulons expliciter un peu et illustrer par des exemples la notion de produit semi-direct. Il s’agit
d’étudier la situation suivante où l’on a un groupe G et deux sous-groupes K et H tels que :
(i) H ∩ K = {e}
(ii) Tout élément g de G s’écrit g = kh avec k ∈ K et h ∈ H (ou encore K.H = G).
Par exemple, si (i) est réalisée et si, de plus, G est fini et card(G) = card(K) card(H) alors la condition (ii)
est aussi vérifiée.
Ces hypothèses entraı̂nent que l’application
f
K ×H −→ G
(k, h) 7−→ kh

est une bijection. Si on suppose de plus que les éléments de H et K commutent, alors f est un isomorphisme
de groupe : on a G ∼ = K × H. C’est évidemment faux en général et l’objet de ce paragraphe est d’étudier
le groupe G dans l’hypothèse où l’un des sous-groupes, disons K est distingué dans G. On verra qu’alors G
est isomorphe à un groupe que l’on peut fabriquer à partir de K et H, l’ensemble sous-jacent étant K × H
mais la loi de groupe étant différente de la loi de groupe produit. On dira que G est un produit semi-direct.
Exercice. Vérifier les assertions suivantes concernant l’application f : K × H → G donnée par (k, h) 7→ kh.
a) l’application est injective si et seulement si H ∩ K = {e}. b) le sous-ensemble K.H n’est pas toujours un
sous-groupe (donner un contre-exemple). c) Si K est distingué (ou H) alors K.H est un sous-groupe. d) f
est un isomorphisme entre K × H et K · H si et seulement si les éléments de K commutent avec ceux de H
et H ∩ K = {e}. e) si H ∩ K = {e} et les deux sous-groupes sont distingués, alors f est un isomorphisme.
Exemples.
1. Considérons dans le groupe S3 les sous-groupes K = A3 et H = {id, (1, 2)} alors on a bien K / G et
H ∩ K = {e} ainsi que S3 = K.H mais S3 n’est pas isomorphe à K × H (qui est commutatif).
2. Soit Dn le groupe (de cardinal 2n) des isométries d’un polygone régulier à n côtés. La rotation ρ de
centre O le centre du polygone et d’angle 2π/n engendre un sous-groupe K distingué dans Dn et d’ordre n.
Une symétrie s par rapport à une droite passant par O et un sommet engendre un sous-groupe H d’ordre 2
et on a Dn = K.H et H ∩ K = {e}. Cependant Dn n’est pas isomorphe à K × H (qui est commutatif).
3. Soit Af f = Af f (Rn ) le groupe des transformations affines, c’est-à-dire:

Af f := {f : Rn → Rn | f (X) = AX + b , A ∈ GL(n, R) , b ∈ Rn }

Rappelons que GL(n, R) désigne le groupe des matrices n × n inversibles à coefficient dans le corps R. Le
sous-groupe des translations K = {f ∈ Af f | f (X) = X + b} est distingué dans Af f et le sous-groupe des
applications linéaires H = {f ∈ Af f | f (0) = 0} est tel que Af f = K.H et H ∩ K = {id} ; cependant Af f
n’est pas isomorphe à K × H.
Nous allons maintenant construire et définir le produit semi-direct et voir que ces trois exemples sont des
produits semi-directs.

Premier point de vue (description). On suppose K / G et les conditions (i) et (ii) vérifiées. Pour décrire le
groupe G, on utilise la bijection f : K ×H → G pour définir une nouvelle loi de groupe sur l’ensemble K ×H ;
on pose (k, h) ∗ (k 0 , h0 ) = f −1 (f (k, h).f (k 0 , h0 )). On vérifie alors immédiatement que f ((k, h) ∗ (k 0 , h0 )) =
f (k, h).f (k 0 , h0 ). On peut calculer ∗ en observant que (kh).(k 0 h0 ) = k(hk 0 h−1 )hh0 et que hk 0 h−1 ∈ K puisque
K est distingué dans G. Si l’on note φh (x) = hxh−1 on obtient :

(k, h) ∗ (k 0 , h0 ) = (kφh (k 0 ), hh0 ) (1)

Ceci suggère que, inversement, on puisse reconstruire le groupe G comme l’ensemble K × H muni de la loi
définie par (1) ; nous allons voir qu’il en est bien ainsi.

10
Deuxième point de vue (construction). On considère deux groupes K et H avec un homomorphisme φ :
H → Aut(K) (ainsi H agit sur K) ; on définit sur l’ensemble K × H la loi de composition :

(k, h) ∗ (k 0 , h0 ) = (kφ(h)(k 0 ), hh0 ) (2)

Remarquons que cette loi est la loi de groupe produit “ordinaire” si et seulement si φ est l’homomorphisme
“trivial” : ∀h ∈ H, φ(h) = id.

Théorème : Soient K, H deux groupes et φ : H → Aut(K) un homomorphisme de groupes.

1) L’ensemble K × H muni de la loi ∗ = ∗φ définie par

(k, h) ∗ (k 0 , h0 ) = (kφh (k 0 ), hh0 )

est un groupe, appelé produit semi-direct de K et H relativement à φ ; il se note

K ×φ H ou K >/φ H.

2) Un groupe G est isomorphe à K >/φ H si et seulement si il contient deux sous-groupes K 0 et H 0 avec

K ∼= K 0 / G et H ∼
= H 0 de sorte que l’action de H 0 sur K 0 par automorphismes intérieurs corresponde à
l’homomorphisme φ : H → Aut(K).
(Remarque : la notation est faite pour rappeler que K est distingué dans le grand groupe).

Preuve. 1) L’élément neutre est (e, e0 ) (où e est l’élément neutre de K et e0 celui de H); l’inverse de (h, k)
est (φ(h−1 )(k −1 ), h−1 ). On vérifie enfin l’associativité :

((k, h) ∗ (k 0 , h0 )) ∗ (k 00 , h00 ) = (kφ(h)(k 0 ), hh0 ) ∗ (k 00 , h00 ) = (kφ(h)(k 0 )φ(hh0 )(k 00 ), hh0 h00 )

alors que

(k, h) ∗ ((k 0 , h0 ) ∗ (k 00 , h00 )) = (kφ(h)(k 0 φ(h0 )(k 00 )), hh0 h00 ) = (kφ(h)(k 0 )φ(hh0 )(k 00 ), hh0 h00 )

2) La discussion précédant le théorème montre que si G contient K 0 , H 0 comme indiqués alors G ∼

= K 0 >/φ H 0 .
Inversement le sous-groupe K := K × {e } est distingué dans K >/φ H et l’action de H = {e} × H sur K 0
0 0 0

par automorphismes intérieurs est donnée par φ puisque:

(e, h) ∗ (k, e0 ) ∗ (e, h)−1 = (φ(h)(k), h) ∗ (e, h−1 ) = (φ(h)(k), e0 ).

Exercices.
a) Montrer que K >/φ H est commutatif si et seulement si K et H sont commutatifs et φ trivial (produit
“direct”).
b) Plus généralement, décrire le centre de K >/φ H en terme de φ et des centres de K et H.
c) Soient H, K deux sous-groupes distingués de G avec K ∩ H = {e}, montrer que les éléments de K et et
H commutent et en déduire que le groupe engendré par H et K est isomorphe à K × H.

Illustrations. Reprenons les trois exemples du début et explicitons φ sur chacun de ces exemples.
1. Notons τ = (1, 2) et ρ = (1, 2, 3) ∈ S3 alors τ ρτ −1 = (2, 1, 3) = (1, 3, 2) = ρ−1 donc la conjugaison par τ
agit sur A3 = {id, (1, 2, 3), (1, 3, 2)} = {id, ρ, ρ−1 } comme j : x 7→ x−1 . Si l’on pose φ(τ ) = j, φ(id) = id on
obtient un homomorphisme φ : H → Aut(A3 ) tel que

S3 ∼
= A3 >/φ Z/2Z

11
Exercice. Décrire un homomorphisme φ : Z/2Z → Aut(An ) tel que Sn ∼
= An >/φ Z/2Z.
2. Si ρ est la rotation plane d’angle 2π/n, de centre l’origine, et s une symétrie (par rapport à la bissectrice
d’un des angles formés par les côtés d’un polygone régulier à n côtés), un calcul laissé en exercice montre
que sρs−1 = sρs = ρ−1 . Si l’on désigne par φ l’homomorphisme (de Z/2Z dans Aut(Z/nZ)) qui associe à 1
l’automorphisme φ(1) : x 7→ −x on obtient :

Dn ∼
= Z/nZ >/φ Z/2Z.

3. Considérons l’action de GL(2, R) sur R2 donnée par (A, X) 7→ AX (où A est une matrice inversible et X
un vecteur de R2 ) ; cette action induit un homomorphisme φ : GL(2, R) → Aut(R2 ) et on obtient ainsi :

Af f ∼
= R2 >/φ GL(2, R)

On voit qu’il est important en général de déterminer le groupe d’automorphisme d’un groupe K pour étudier
ensuite les homomorphismes H → Aut(K) et les produits semi-directs associés ; c’est en général assez difficile
et nous le ferons ici seulement dans le cas des groupes finis abéliens de la forme K = (Z/nZ)r .

Proposition L’application f 7→ f (1) induit un isomorphisme de groupes Aut(Z/nZ) ∼

= (Z/nZ)∗ .

En effet soit f ∈ Aut(Z/nZ) alors x = f (1) doit être un générateur de Z/nZ et f est entièrement déterminé
par f (1) (puisque f (n) = nx). Inversement si x ∈ (Z/nZ)∗ alors f (n) = nx définit bien un automorphisme
de Z/nZ. Enfin on vérifie sans difficulté que si f et g sont des automorphismes de Z/nZ alors (g ◦ f )(1) =
g(1)f (1).

Proposition. Le groupe Aut ((Z/pZ)r ) est isomorphe au groupe GL(r, Z/pZ) des matrices inversibles de
taille r × r à coefficients dans Z/pZ.
Preuve. En effet un homomorphisme de groupe f de (Z/pZ)r vers (Z/pZ)r est forcément Z/pZ-linéaire
puisque f (nx) = nf (x). Dire que f est bijectif équivaut à dire que la matrice associée est inversible.

Exercice. Montrer que Aut ((Z/nZ)r ) est isomorphe au groupe GL(r, Z/nZ) des matrices inversibles de taille
r × r à coefficients dans Z/nZ. Plus généralement, pouvez-vous décrire le groupe Aut (Z/pZ)r × (Z/p2 Z)s
ou encore Aut ((Z/pZ)r1 × . . . × (Z/pm Z)rm ) ?

Application. Nous allons déterminer les classes d’isomorphismes de groupes de cardinal pq où p et q sont
des nombres premier distincts.

Supposons p < q, alors les théorèmes de Sylow nous indique qu’il existe un unique q-Sylow (on ne peut avoir
p ≡ 1 mod q) que l’on désignera par K ; appelons H un p-Sylow et φ : H → Aut(K) l’action par conjugaison
de H sur K. Comme K est isomorphe à Z/qZ et H est isomorphe à Z/pZ, on a H ∩ K = {e} et ensuite
G = K.H et G ∼ = K >/φ H. On doit donc étudier les homomorphismes de Z/pZ dans Aut(Z/qZ) = (Z/qZ)∗ .
On doit alors distinguer deux cas.
1er cas : q 6≡ 1 mod p. Dans ce cas le seul homomorphisme φ : Z/pZ → Aut(Z/qZ) = (Z/qZ)∗ est trivial
donc G ∼= Z/qZ × Z/pZ ∼ = Z/pqZ
2ème cas : q ≡ 1 mod p. Dans ce cas, le groupe Aut(Z/qZ) = (Z/qZ)∗ contient des éléments d’ordre p et
il y a donc un homomorphisme non trivial φ : Z/pZ → Aut(Z/qZ) = (Z/qZ)∗ et l’on peut donc fabriquer
le produit semi-direct G ∼= Z/qZ >/φ Z/pZ. On obtient ainsi deux groupes de cardinal pq non isomorphes
(on laisse en exercice, voir lemme à la fin, la vérification du fait que deux homomorphismes non triviaux
φ : Z/pZ → Aut(Z/qZ) = (Z/qZ)∗ induisent des groupes isomorphes).
Remarque : Lorsque p = 2, on a toujours q ≡ 1 mod 2 et on retrouve les deux groupes Z/2qZ et Dq . Lorsque
p = 3 on s’aperçoit par exemple qu’il n’y a qu’un groupe de cardinal 15 (c’est Z/15Z) alors qu’il y en a deux
de cardinal 21 (ce sont Z/21Z et le produit semi-direct Z/7Z >/φ Z/3Z).

12
Exercices. Soit p un nombre premier impair, on se propose de décrire les groupes de cardinal p2 et p3 .
A1) Soit G un groupe de cardinal p2 , montrer que, ou bien G est cyclique (et isomorphe à Z/p2 Z), ou bien
tous les éléments différents de l’élément neutre sont d’ordre p.
A2) Soit G un groupe non cyclique d’ordre p2 , soit K un sous-groupe d’ordre p, montrer que K / G et qu’il
existe H sous-groupe d’ordre p tel que K ∩ H = {e}. En déduire que G est un produit semi-direct de Z/pZ
par Z/pZ.
A3) Montrer que tout groupe de cardinal p2 est commutatif et isomorphe à Z/p2 Z ou Z/pZ × Z/pZ.

1 1
B1) Montrer que la matrice T = est un élément d’ordre p de GL(2, Z/pZ). En déduire que
0 1
l’application φ de Z/pZ dans GL(2, Z/pZ) définie par m 7→ T m est un homomorphisme de groupes.
B2) Vérifier que le groupe G1 = (Z/pZ)2 >/φ Z/pZ (où φ est défini comme en B1) est de cardinal p3 , n’est
pas commutatif bien que tous ses éléments distincts de e soient d’ordre p.
∗
C1) Montrer que la classe de p + 1 modulo p2 est d’ordre p dans le groupe Z/p2 Z et en déduire que
l’application φ de Z/pZ dans (Z/p2 Z)∗ définie par m 7→ (1 + p)m est un homomorphisme de groupes.
C2) Montrer que le groupe G2 = Z/p2 Z >/φ Z/pZ (où φ est défini comme en C1) n’est ni commutatif ni
isomorphe à G1 .
D) On donne des indications pour montrer qu’un groupe de cardinal p3 est isomorphe à l’un des cinq groupes
suivants (N.B. p est supposé impair) :

G1 = (Z/pZ)2 >/φ Z/pZ, G2 = Z/p2 Z >/φ Z/pZ, G3 = (Z/pZ)3 , G4 = Z/p2 Z × Z/pZ

ou G5 = Z/p3 Z
Si G non cyclique, montrer que ou bien il existe K sous-groupe cyclique de cardinal p2 ou bien tous les
éléments (6= e) sont d’ordre p et alors il existe K sous-groupe isomorphe à (Z/pZ)2 ; dans les deux cas K / G
avec G/K ∼ = Z/pZ. Montrer (c’est la partie difficile) qu’il existe un sous-groupe H de cardinal p tel que
K ∩ H = {e} et en déduire que G ∼ = K >/φ Z/pZ et conclure en étudiant les homomorphismes de Z/pZ
vers Aut(K) = (Z/p2 Z)∗ ou GL(2, Z/pZ). Si tous les éléments sont d’ordre p il n’y a pas de difficulté (et
le fait que p est impair n’intervient pas) sinon choisir x générateur de K ∼ = Z/p2 Z et y ∈ / K. On montre
qu’il existe c tel que y = x y soit d’ordre p et alors le sous-groupe engendré par y 0 fournit le sous-groupe H
0 c

cherché. Pour cela on observe qu’il existe a, b tels que

yxy −1 = xa et y p = xb
2
parce que < x >= K est distingué et parce que G/K est d’ordre p. On observe que b = pb0 car e = y p = xpb
m
et a ≡ 1 mod p car ap ≡ 1 mod p2 . On en tire d’abord que xc y m = y m xa c puis enfin que
p−1
(xc y)p = xb+c(a +...+a+1)
.

On doit alors résoudre l’équation b + c(ap−1 + . . . + a + 1) = 0 dans Z/p2 Z sachant que p ne divise pas a
mais divise b. Il suffit que ap−1 + . . . + a + 1 6≡ 0 mod p2 . On a a = 1 + pr et donc ap−1 + . . . + a + 1 ≡
p + p2 r(p − 1)/2 ≡ p 6≡ 0 mod p2 (ceci est vrai car p est impair !).
Pour la vérification que tous les produits semi-directs non triviaux sont isomorphes à G1 ou G2 voir
l’application du lemme plus loin.
E) Le groupe des matrices 3 × 3 triangulaires supérieures avec des 1 sur la diagonale à coefficients dans
Z/pZ est non commutatif de cardinal p3 . Si p est impair, est-il isomorphe à “G1 ” ou “G2 ” (Cf. exercice
précédent); si p = 2, est-il isomorphe à “D4 ” ou “H” (Cf. exercice suivant).

Attention : Si K est un sous-groupe distingué de G, il n’est pas toujours vrai que G soit isomorphe à
K >/φ G/K ; pour cela il faut qu’il existe un sous-groupe H tel que la surjection canonique s : G → G/K
donne un isomorphisme H → G/K.

13
Exemple. Soit K l’unique sous-groupe de cardinal p dans G = Z/p2 Z. On a G/H isomorphe à Z/pZ mais
G n’est pas isomorphe à un produit demi-direct H >/φ Z/pZ. Comme autre exemple moins trivial on peut
considérer le groupe quaternionique

H := {+1, −1, +i, −i, +j, −j, +k, −k}.

On vérifie que tous les sous-groupes sont distingués mais si on prend un des sous-groupes d’ordre 4 (engendré
par ±i, ±j ou ±k) le quotient de H par ce sous-groupe est Z/2Z sans que l’on puisse écrire H comme produit
semi-direct.
Exercice. Montrer qu’il y a 5 groupes d’ordre 8 (à isomorphisme près): Z/8Z, Z/4Z × Z/2Z, (Z/2Z)3 , D4
(le groupe des isométries du carré) et H (le groupe quaternionique précédent).

Supplément : isomorphismes entre produits semi-directs.

Lemme. Soit K, H deux groupes, α ∈ Aut(K) et β ∈ Aut(H); soient φ, ψ : H → Aut(K) tels que
φ(h) = α−1 ◦ ψ(β(h)) ◦ α alors l’application (α, β) induit un isomorphisme de groupe de K >/φ H vers
K >/ψ H.
Preuve. On calcule, en notant F = (α, β) pour alléger

F ((k, h) ∗φ (k 0 , h0 )) = (α(kφ(h)(k 0 )), β(hh0 ))

= (α(k)α ◦ (α−1 ◦ ψ(β(h)) ◦ α)(k 0 ), β(h)β(h0 ))
= (α(k)ψ(β(h))(α(k 0 )), β(h)β(h0 ))
= (α(k), β(h)) ∗ψ (α(k 0 ), β(h0 ))
= F (k, h) ∗ψ F (k 0 , h0 )

Applications. 1) Soit
M une matrice d’ordre p dans GL(2, Z/pZ) alors il existe une matrice inversible P telle
1 1
que M = P P −1 donc le produit semi-direct non trivial (Z/pZ)2 >/φ Z/pZ associé à φ(m) = M m
0 1
1 1
est isomorphe à celui obtenu en prenant M0 = . 2) Soit y un élément d’ordre p dans (Z/p2 Z)∗
0 1
alors y = (p + 1)a avec a premier avec p donc le produit semi-direct non trivial Z/p2 Z >/φ Z/pZ associé à
φ(m) = y m ∈ (Z/p2 Z)∗ est isomorphe à celui obtenu en choisissant y = p + 1; en effet β(m) = am définit un
automorphisme de Z/pZ puisque a est premier avec p.
Attention. L’énoncé du lemme ne dit pas que ce sont les seuls isomorphismes entre produits semi-directs. Par
exemple considérons φ : Z/2Z → Int(S3 ) l’homorphisme qui associe à 1 la conjugaison par une transposition,
alors φ est non trivial mais pourtant Sn >/φ Z/2Z est isomorphe à Sn × Z/2Z (vérification “à la main” ou
voir l’exercice suivant).
Exercice. Soit x un élément d’ordre r dans un groupe G. On note φ : Z/rZ → Aut(G) l’homomorphisme
qui à 1 associe l’automorphisme intérieur associé à x (i.e. φ(1)(g) = xgx−1 ). Le produit semi-direct
G >/φ Z/rZ n’est pas trivial, montrer néanmoins que l’application f : G >/φ Z/rZ → G × Z/rZ définie par
f (g, m) = (gxm , m) est un isomorphisme de groupes
Exercice. Soit N = pm ms
1 . . . ps
1
un entier impair avec sa décomposition en facteurs premiers. Montrer que
le sous-groupe U := {a ∈ (Z/N Z)∗ | a2 = 1} est isomorphe à (Z/2Z)s . En déduire une description des
différents produits semi-directs Z/nZ >/φ Z/2Z. (Indication : il y a, à isomorphisme près, 2s tels groupes,
dont Z/N Z et DN ). Comment doit-on modifier l’énoncé si N = 2m0 pm ms
1 . . . ps
1
?

14
A.6. Groupes abéliens.

Remarquons tout de suite qu’un groupe abélien est la même chose qu’un Z-module (i.e. un “espace vectoriel”
sur l’anneau Z). Comme exemples de groupes abéliens nous citerons au départ Z, Z/nZ, (Z/nZ)∗ , Q, Q/Z.
Un groupe abélien est de type fini s’il possède un nombre fini de générateurs; il est dit libre s’il possède
une base sur Z, libre de rang fini s’il possède une base finie (et est donc isomorphe à Zr ). Les groupes
abéliens en général ne sont pas libres, en effet Z/nZ, par exemple, ne peut pas être libre. Dans le groupe
Q deux éléments sont toujours liés mais le groupe n’est pas isomorphe à Z. Un élément x ∈ G est dit de
torsion s’il existe m ≥ 1 tel que xm = e. Tous les éléments de Q/Z sont de torsion sans que le groupe
soit fini, donc il ne peut pas être de type fini. L’ensemble des éléments de torsion dans G abélien forme
un sous-groupe Gtorsion := {g ∈ G | ∃m ≥ 1, g m = e}; en effet si x est d’ordre m et y d’ordre n alors
(xy)mn = (xm )n (y n )m = e. Observons d’ailleurs que, si de plus m et n sont premiers entre eux, alors l’ordre
de xy est exactement mn; en effet si (xy)k = e, alors xkn = e (resp. y km = e) donc m divise kn (resp. n
divise km) donc m divise k (resp. n divise k) et enfin mn divise k.
Notation. Dans ce chapitre nous noterons (sauf mention contraire) additivement les groupes abéliens;
l’élément neutre de (G, +) sera noté 0.
Les groupes Z et Z/nZ (rappels).
Le groupe Z est l’unique groupe (à isomorphisme près) qui est cyclique (engendré par un élément) et infini.
Tous ses sous-groupes sont du type mZ pour m ≥ 0. L’ensemble Z est également muni d’une multiplication
qui en fait un anneau commutatif. Dans cet anneau on a la notion de divisibilité et l’on suppose connue la
notion de PGCD et PPCM (que l’on révisera dans le cadre plus général des anneaux). Dans le cas de Z on
voit que la notion d’idéal (voir le chapitre sur les anneaux) coı̈ncide avec celle de sous-groupe. On peut en
déduire facilement le théorème suivant
Théorème. (Bézout) Soit m, n ∈ Z et soit d leur PGCD, alors il existe a, b ∈ Z tels que

d = am + bn.

Preuve. L’ensemble H := mZ + nZ = {am + bn | a, b ∈ Z} est clairement un sous-groupe; il est donc de la

forme d0 Z et il existe a, b tels que d0 = am + bn. Comme d divise a et b, on voit que d divise am + bn = d0
mais a, b appartiennent à H donc d0 divise a et b donc d0 divise également d et on conclut que d = d0 (si l’on
a pris soin de les prendre tous les deux positifs).

Le groupe Z/nZ est l’unique groupe cyclique à n éléments (à isomorphisme près) i.e. engendré par un
élément d’ordre n. On peut déjà étudier ses générateurs
Proposition. Soit m ∈ Z et m̄ sa classe dans Z/nZ, les trois propriétés suivantes sont équivalentes
(i) L’élément m̄ est un générateur de Z/nZ.
(ii) Les éléments m et n sont premiers entre eux.
(iii) L’élément m̄ est inversible modulo n, c’est-à-dire qu’il existe m0 ∈ Z tel que mm0 ≡ 1 mod n ou encore
m̄m̄0 = 1 ∈ Z/nZ.
Preuve. Supposons que m̄ engendre Z/nZ alors il existe m0 ∈ Z tel que m0 m̄ = 1 ∈ Z/nZ; ainsi mm0 ≡
1 mod n ce qui signifie que m est inversible modulo n. Si mm0 ≡ 1 mod n alors mm0 = 1 + an et donc m
est premier avec n. Si m est premier avec n alors, d’après le théorème de Bézout, il existe a, b tels que
am + bn = 1 donc am̄ = 1 ∈ Z/nZ et donc m̄ engendre Z/nZ.

En particulier on voit que l’ensemble des éléments inversibles de Z/nZ, qui forment automatiquement un
groupe, est égal à
(Z/nZ)∗ = {m̄ ∈ Z/nZ | m est premier avec n}.
On note φ(n) := card ((Z/nZ)∗ ) l’indicatrice d’Euler. On en déduit facilement que, si p est premier, φ(pr ) =
pr − pr−1 = (p − 1)pr−1 . Le calcul en général de φ(n) se fait grâce au lemme classique suivant.

15
Proposition. (Lemme chinois) Soit m, n ∈ Z, supposons m et n premiers entre eux, alors les groupes Z/mnZ
et Z/mZ × Z/nZ sont naturellement isomorphes. De plus cet isomorphisme est aussi un isomorphisme
d’anneaux et, par conséquent induit un isomorphisme entre (Z/mnZ)∗ et (Z/mZ)∗ × (Z/nZ)∗ .
Preuve. Considérons l’application f : Z → Z/mZ × Z/nZ donnée par x 7→ (x mod m, x mod n). C’est un
homomorphisme de groupe de noyau PPCM(m, n)Z, d’où une injection

fˆ : Z/ PPCM(m, n)Z ,→ Z/mZ × Z/nZ.

Comme m et n sont supposés premiers entre eux, on a PPCM(m, n) = mn et, pour des raisons de cardinalité,
l’homomorphisme fˆ doit être un isomorphisme. De manière générale, si A et B sont des anneaux, on a
(A × B)∗ = A∗ × B ∗ d’où la deuxième assertion.

La description des sous-groupes de Z/nZ est assez simple.

Proposition. Pour chaque entier d ≥ 1 divisant n, il existe un unique sous-groupe de Z/nZ d’ordre d, c’est
le sous-groupe cyclique engendré par la classe de n/d dans Z/nZ.
Preuve. Supposons n = dd0 alors l’élément x = d¯0 ∈ Z/nZ est d’ordre d car clairement dx = 0 et, si
cx = 0 alors n divise cd0 donc d divise c. Soit maintenant H un sous-groupe de Z/nZ d’ordre d. Notons
s : Z → Z/nZ la surjection canonique. On sait que s−1 (H) = mZ est engendré par m donc H est engendré
par m̄ ∈ Z/nZ. On a dm̄ = 0 donc n divise dm donc d0 divise m donc le sous-groupe H est contenu dans le
sous-groupe engendré par d¯0 et donc égal à ce sous-groupe.

Comme application, on peut en tirer la formule (que nous utiliserons plus bas)
X
n= φ(d).
d|n

En effet on écrit Z/nZ comme union (disjointe) des ensembles d’éléments d’ordre d pour d divisant n. Le
nombre de ces éléments est le nombre de générateurs de l’unique sous-groupe de cardinal d, et comme ce
dernier est isomorphe à Z/dZ, le nombre de générateurs est φ(d).
Les groupes (Z/nZ)∗ .
On notera (à titre d’exception dans ce chapitre) multiplicativement la loi du groupe (Z/nZ)∗ . D’après ce
que nous avons vu, si n = pα αs
1 . . . ps alors
1

(Z/nZ)∗ ∼
= (Z/pα ∗ αs
1 Z) × . . . × (Z/ps Z)
1 ∗

et en particulier
s s
Y
αi −1
Y 1
φ(n) = φ(pα αs
pα

1 ) . . . φ(ps ) =
1
i
i
− p i = n 1 −
i=1 i=1
pi

Il reste à décrire la structure des groupes (Z/p Z)∗ .

Proposition. Soit p premier et α ≥ 1 alors

(i) Si p est impair (Z/pα Z)∗ est cyclique.
(ii) Si p = 2 et α ≥ 3 alors (Z/2α−2 Z)∗ ∼= Z/2α Z × Z/2Z n’est pas cylique. Par contre (Z/2Z)∗ = {1} et
∗ ∼
(Z/4Z) = Z/2Z sont cycliques.
Preuve. Commençons par montrer que (Z/pZ)∗ est cyclique, en fait plus généralement on a le résultat
suivant.
Lemme. Soit k un corps commutatif et G un sous-groupe fini de k ∗ , alors G est cyclique. En particulier
(Z/pZ)∗ est cyclique.
Preuve
P du lemme. Notons n := card(G) et ψ(d) le nombre d’éléments d’ordre d dans G. On a clairement
n = d | n ψ(d). Soit d divisant n, ou bien il n’y a pas d’élément d’ordre d dans G auquel cas ψ(d) = 0, ou

16
bien il en existe un qui engendre alors un sous-groupe cyclique H d’ordre d. Tous les éléments de H sont
solutions de l’équation X d = 1, mais, comme k est un corps commutatif, une telle équation possède au plus
d racines dans k; tous les éléments d’ordre ∼
P d sont donc
P dans H et il en a φ(d) puisque H = Z/dZ. Ainsi ψ(d)
vaut zéro ou φ(d), mais comme n = d | n ψ(d) = d | n φ(d), on voit que ψ(d) = φ(d) pour tout d divisant
n. En particulier ψ(n) = φ(n) ≥ 1, ce qui implique bien que G est cyclique.

Lemme. Soit p premier impair, la classe de p + 1 dans (Z/pα Z)∗ est d’ordre pα−1 .
Preuve du lemme. Montrons d’abord par récurrence la congruence
k
(p + 1)p ≡ 1 + pk+1 mod pk+2 .
k−1 k
Pour k = 0, la congruence est triviale. Supposons donc (p + 1)p = 1 + pk + apk+1 alors (p + 1)p =
k k+1 p k k+1 k+1 k+2
1 + p + ap ≡ 1 + p(p + ap )≡1+p mod p . Pour l’avant-dernière congruence, on a besoin
de p 6= 2; en effet la formule du binôme de Newton fait apparaı̂tre des termes multiples de pkr donc nuls
modulo pk+2 sauf peut-être si r = 2 et k = 1 mais le terme s’écrit alors Cp2 p2 qui est bien nul modulo p3 si
α−1 α−2
p est impair. En particulier, on voit que (p + 1)p ≡ 1 mod pα mais (p + 1)p ≡ 1 + pα−1 6≡ 1 mod pα , ce
α−1 α ∗
qui implique bien que p + 1 est d’ordre p dans (Z/p Z) .
On peut maintenant terminer la preuve de la proposition pour p impair. Soit x ∈ Z tel que x modulo p
engendre (Z/pZ)∗ i.e. est d’ordre p − 1 dans (Z/pZ)∗ ; alors x̄ est d’ordre m(p − 1) dans (Z/pα Z)∗ et donc
y = x̄m est d’ordre exactement p − 1 dans (Z/pα Z)∗ . L’élément y(p + 1) est donc d’ordre pα−1 (p − 1) donc
est un générateur de (Z/pα Z)∗ (car pα−1 et p − 1 sont premiers entre eux).
Lemme. La classe de 5 dans (Z/2α Z)∗ est d’ordre 2α−2 . De plus la classe de −1 n’appartient pas au
sous-groupe engendré par la classe de 5.
Preuve du lemme. On montre d’abord par récurrence que
k
52 ≡ 1 + 2k+2 mod 2k+3 .
k−1 k
La congruence est triviale pour k = 0, supposons donc que 52 = 1 + 2k+1 + a2k+2 alors 52 = (1 + 2k+1 +
α−2
a2k+2 )2 = 1 + 2(2k+1 + a2k+2 ) + 22(k+1) (1 + 2a)2 ≡ 1 + 2k+2 mod 2k+3 . En particulier 52 ≡ 1 mod 2α
α−3
2 α−1 α α−2
mais 5 ≡ 1+2 6≡ 1 mod 2 donc 5 est bien d’ordre 2 . Supposons que 5 ≡ −1 mod 2α alors
β
2β α α−2 α−3
5 ≡ 1 mod 2 donc 2 divise 2β donc 2 divise β ou encore β = γ2α−3 . Comme 5 est d’ordre 2α−2 , on
α−2
peut considérer β comme un entier modulo 2 et donc γ modulo 2. L’entier γ doit être impair donc on peut
α−3 α−3
le supposer égal à 1, c’est-à-dire 52 ≡ 1 mod 2α , mais 52 ≡ 1 + 2α−1 mod 2α donc −1 ≡ 1 + 2α−1 mod 2α
α−1 α α−2 α−1
ou encore 2 + 2 ≡ mod 2 soit 1 + 2 ≡ mod 2 , ce qui n’est pas possible.

Pour la démonstration de la deuxième partie de la proposition, on peut supposer α ≥ 3 (en effet le calcul
de (Z/2Z)∗ et (Z/4Z)∗ est immédiat). La classe de 5 engendre donc un sous-groupe isomorphe à Z/2α−2 Z
et −1 engendre un sous-groupe d’ordre 2 non contenu dans le précédent donc (Z/2α Z)∗ = h5i ⊕ h−1i ∼ =
Z/2α−2 Z × Z/2Z.

Exercice. Montrer que si la classe de x ∈ Z engendre (Z/p2 Z)∗ alors elle engendre aussi (Z/pα Z)∗ (pour p
impair).
Remarque. Le sous-groupe quaternionique H8 = {±1, ±i, ±j, ±k} est un sous-groupe fini du groupe multi-
plicatif du corps H mais n’est pas cyclique (cela ne contredit pas le lemme vu car H n’est pas commutatif).
Théorèmes de structure.
Les produits finis de groupes cycliques sont évidemment abéliens de type fini. Nous allons voir réciproquement
que tout groupe abélien de type fini est en fait isomorphe à un groupe de la forme Zr ×Z/m1 Z×. . .×Z/ms Z.
Toutefois le lemme chinois indique qu’une telle décomposition n’est pas a priori unique. On peut néanmoins
en extraire des éléments invariants ou canoniques.

17
Théorème. Tout groupe abélien G de type fini est produit de groupes cycliques. Plus précisément il existe
r ≥ 0 et a1 , . . . as avec ai ≥ 2 et ai divise ai+1 tels que
G∼ = Zr × Z/a1 Z × . . . × Z/as Z.
De plus les entiers r, s, a1 , a2 , . . . as sont uniques.
Nous allons utiliser dans la preuve un autre théorème de structure, décrivant les sous-groupes de Zr , qui est
démontré au chapitre sur les modules sur les anneaux principaux.
Théorème. Soit H un sous-groupe de Zr alors
(i) Le groupe H est libre de rang s ≤ r.
(ii) Il existe e1 , . . . , er base de Zr et a1 , . . . as ≥ 1 tels que ai divise ai+1 et a1 e1 , . . . as es forment une base
de H.
Preuve (du théorème antérieur). Supposons que G possède n générateurs, alors on en déduit un homomor-
phisme surjectif f : Zn → G et un isomorphisme Zn / Ker(f ) ∼ = G. On applique le théorème précédent à
Ker(f ) et on obtient des ei et ai tels que Zn = Ze1 ⊕ . . . Zen et tels que Ker(f ) = Za1 e1 ⊕ . . . Zam em . D’où
l’on tire aisément
G∼ = Zn / Ker(f ) ∼
= Z/a1 Z × . . . × Z/am Z × (Z)n−m
avec ai divisant ai+1 et ai ≥ 1. En éliminant les facteurs correspondant à ai = 1, on obtient l’existence de
la décomposition annoncée. Montrons maintenant l’unicité. Nous allons utiliser le
Lemme. Soit M ≥ 1 alors le sous-groupe M Z/nZ est cyclique de cardinal n/ PGCD(n, M ); le quotient
(Z/nZ)/M (Z/nZ) est cyclique de cardinal PGCD(n, M ).
×M
Preuve. Notons d = P GCD(n, M ) et n = n0 d, M = M 0 d. Considérons la composée Z −→ Z → Z/nZ.
Son noyau est le sous-groupe des x ∈ Z tels que n divise M x ou encore tels que n0 divise x d’où un
isomorphisme entre Z/n0 Z et l’image, c’est-à-dire M Z/nZ. Enfin (Z/nZ)/M (Z/nZ) est cyclique de cardinal
d donc isomorphe à Z/dZ.

Supposons maintenant
0
G∼
= Zr × Z/a1 Z × . . . × Z/as Z ∼
= Zr × Z/b1 Z × . . . × Z/bt Z
avec ai , bi ≥ 2 et ai divise ai+1 , resp. bi divise bi+1 . On commence par choisir un entier M multiple de as et
0
bt alors M G ∼ = Zr ∼
= Zr donc r = r0 . En remplaçant G par Gtorsion on peut maintenant supposer G fini (i.e.
r = r0 = 0). Choisissons p divisant a1 (noter que a1 ≥ 2) alors P GCD(p, ai ) = p et P GCD(p, bi ) = p ou 1
suivant que p divise bi ou non. Donc d’après le lemme G/pG ∼ = (Z/pZ)s ∼ = (Z/pZ)t−card{i | p ne divise pas bi } .
Ainsi s ≤ t et, par symétrie t = s et donc p divise b1 . Ecrivons donc ai = pa0i et bi = pb0i , alors pG ∼ =
Z/a01 Z × . . . × Z/a0s Z ∼
= Z/b01 Z × . . . × Z/b0s Z. par récurrence sur card(G) on en tire que a0i = b0i et donc
ai = bi .

Revenons aux groupes abéliens finis et montrons qu’on peut écrire une autre décomposition canonique.
Théorème. Un groupe abélien fini G est somme directe de ses p-sous-groupes de Sylow. Un p-groupe
abélien est isomorphe à un produit (Z/pZ)m1 × (Z/p2 Z)m2 × . . . × (Z/pr Z)mr avec mi ≥ 0. De plus les mi
sont uniques.
Le groupe G est abélien donc possède un unique p-sous-groupe de Sylow. On voit aisément que celui-ci est
égal à Gp := {x ∈ G | ∃m ≥ 0, pm x = 0}. La première partie du théorème est alors une conséquence du
lemme ci-dessous; la deuxième partie découle directement du théorème de structure précédent.
Lemme. Soit G un groupe de cardinal M N avec M et N premiers entre eux. Soit G1 = {x ∈ G | M x = 0}
et G2 = {x ∈ G | N x = 0}, alors G = G1 ⊕ G2 .
Preuve. D’après le théorème de Bézout, il existe a, b ∈ Z tels que aM + bN = 1. Si x ∈ G1 ∩ G2 alors
x = (aM + bN )x = 0. Si maintenant x ∈ G alors x = bN x + aM x et, comme M N est un exposant pour G,
on a bN x ∈ G1 et aM x ∈ G2 .

Exercice. Soit une décomposition G ∼ = Z/a1 Z × . . . × Z/as Z avec ai ≥ 2 et ai divise ai+1 . Montrer que
l’exposant de G est égal à as et que le nombre minimal de générateurs de G est s.

18
A.7. Le groupe Sn .

Le groupe Sn est le groupe des bijections de l’ensemble [1, n] = {1, 2, . . . , n}, il est isomorphe au groupe des
bijections d’un ensemble fini de cardinal n. Il intervient donc chaque fois qu’un groupe agit sur un ensemble
fini, en particulier dans les questions de combinatoire. D’un autre côté, le groupe Sn est “trop” riche pour
pouvoir être entièrement décrit; par exemple tout groupe fini est sous-groupe d’un Sn : en effet, l’action de
G par translation sur lui-même est fidèle et induit donc une injection de G dans les bijections de G.
Le support d’une permutation σ ∈ Sn est le sous-ensemble {i ∈ [1, n] | σ(i) 6= i}. Le groupe Sn agit
transitivement sur [1, n] et le stabilisateur de n est naturellement isomorphe à Sn−1 donc la formule des
classes nous dit que card(Sn /Sn−1 ) = n d’où l’on tire aisément par récurrence

card(Sn ) = n!

Une première façon de noter les éléments de Sn est simplement d’écrire la liste des images, par exemple
la permutation σ définie par σ(1) = 2, σ(2) = 6, σ(3) = 3, σ(4) = 5, σ(5) = 8, σ(6)= 4, σ(7) = 10,
1 2 3 4 5 6 7 8 9 10
σ(8) = 9, σ(9) = 1, σ(10) = 7, peut être notée σ = . Cette notation
2 6 3 5 8 4 10 9 1 7
est toutefois lourde et ne reflète pas vraiment les propriétés de σ (par exemple : quel est son ordre?). La
situation est un peu similaire à l’écriture d’un nombre entier : l’écriture de la décomposition en facteurs
premiers contient beaucoup plus d’information arithmétique que la donnée du nombre en base 10. Il est
donc utile d’introduire une telle notion pour les permutations.
Définition. Un cycle de longueur m (ou m-cycle) est associé à un sous-ensemble ordonné I = {i1 . . . , im }
et est donné par σ(i1 ) = i2 , . . . , σ(im−1 ) = im , σ(im ) = i1 et, pour tout j ∈
/ I, σ(j) = j. L’ensemble I
s’appelle le support du cycle. On note une telle permutation σ = (i1 . . . , im ). Un cycle de longueur 2 est une
transposition.
Remarquons que, avec la notation introduite (i1 . . . , im ) = (i2 . . . , im , i1 ), etc. Un cycle de longueur m a
clairement pour ordre m. L’intérêt de cette notion provient en bonne partie du résultat suivant.
Théorème. (Décomposition en cycles) Soit σ ∈ Sn \ {id} il existe σ1 , . . . , σr , cycles de longueurs m1 , . . . , mr
ayant des supports disjoints, tels que
σ = σ1 · · · σr .
De plus, l’union des supports des σi est le support de σ, les σi commutent entre eux et sont uniques (à l’ordre
près).
Preuve. On décompose l’ensemble X = [1, n] sous l’action du groupe engendré par σ en orbites. Sur chaque
orbite Xi de cardinal m ≥ 2, la permutation σ agit comme un cycle σi de support Xi . Il est alors immédiat
que σ est égale au produit des σi et celles-ci sont uniquement déterminées par σ. Deux permutations dont
les supports sont disjoints commutent; le reste est clair.

Si σ s’écrit σ1 · · · σr comme dans l’énoncé du théorème, i.e. est produit de cycles à supports disjoints de
longueur m1 , . . . , mr , on dira que σ est de type (m1 , . . . , mr ).
Corollaire. Soit σ une permutation de type (m1 , . . . , mr ), alors son ordre est égal au PPCM de m1 , . . . , mr .
Preuve. Notons M := PPCM(m1 , . . . , mr ). Comme σ = σ1 . . . σr on a σ M = σ1M . . . σrM = id et d’autre part
si σ N = σ1N . . . σrN = id, alors σ N agit sur le support de σi comme σiN et comme l’identité donc σiN = id et
mi divise N donc M divise N .

Exemple. La décomposition de la permutation donnée ci-dessus s’écrit σ = (1, 2, 6, 4, 5, 8, 9)(7, 10). Elle a
donc pour ordre 14.
Corollaire. La classe de conjugaison d’une permutation de type (m1 , . . . , mr ) est l’ensemble des permuta-
tions de même type.

19
Preuve. Commençons par vérifier la “formule-clef” suivante où ρ désigne une permutation quelconque :

ρ(i1 , . . . , im )ρ−1 = (ρ(i1 ), . . . , ρ(im )).

/ {ρ(i1 ), . . . , ρ(im )} alors ρ−1 (j) ∈

Notons σ = (i1 , . . . , im ). Si j ∈ / {i1 , . . . , im } donc ρσρ−1 (j) = j. Si j = ρ(ik )
alors ρ (j) = ik donc σρ (j) = ik+1 (avec la convention que m + 1 = 1) et ρσρ−1 (j) = ρ(ik+1 ) comme
−1 −1

annoncé. Ainsi le conjugué d’un m-cycle est un m-cycle; de plus si σ 0 = (j1 , . . . , jm ) est un autre m-cycle
on peut choisir ρ ∈ Sn telle que ρ(ik ) = jk et donc σ 0 = ρσρ−1 . Ainsi la classe de conjugaison d’un m-cycle
est l’ensemble des m-cycles. Dans le cas général, si σ = σ1 . . . σr , alors ρσρ−1 = (ρσ1 ρ−1 ) . . . (ρσr ρ−1 ) donc
le conjugué d’une permutation de type m1 , . . . , mr est encore du même type et réciproquement.

La signature d’une permutation σ ∈ Sn peut être définie par la formule

Y (σ(i) − σ(j))
(σ) := . .
(i − j)
1≤i<j≤n

Proposition. L’application : Sn → {±1} est un homomorphisme de groupes. La signature d’une trans-

position est égale à −1. Son noyau est noté An et s’appelle le groupe alterné.
Preuve. Observons que ησ (i, j) = (σ(i) − σ(j))/(i − j) ne dépend que de la paire {i, j}. On peut écrire
 
Y στ (i)) − στ (j) τ (i) − τ (j) Y
(στ ) = . = ησ (τ (i), τ (j)) (τ ) = (σ)(τ ).
τ (i) − τ (j) i−j
{i,j} {i,j}

Pour la deuxième affirmation, il suffit de vérifier que ((1, 2)) = −1 ce qui est élémentaire.

Remarques. On sait (Cf plus loin) que toute permutation peut s’écrire comme le produit d’un certain
nombre de transpositions, disons σ = τ1 . . . τs ; on en déduit que (σ) = (−1)s . Un m-cycle est le produit de
m − 1 transpositions donc la signature d’un m-cycle est (−1)m−1 , la signature d’une permutation de type
(m1 , . . . , mr ) est (−1)m1 +...+mr −r .
Corollaire. Le sous-groupe An est distingué dans Sn et card(An ) = n!/2.
Preuve. Immédiat.

Générateurs de Sn et An .
Tout d’abord l’ensemble des cycles est un ensemble de générateurs de Sn d’après le théorème de décomposition
en cycles. Ensuite tout cycle peut s’écrire comme produit de transpositions car

(i1 , . . . , im ) = (i1 , i2 )(i2 , i3 ) · · · (im−1 , im )

donc l’ensemble des transpositions est un ensemble de générateurs de Sn . On peut même se restreindre
au sous-ensemble des transpositions de la forme (i, i + 1) pour 1 ≤ i ≤ m − 1. En effet si i < j et
ρ = (i + 1, i + 2) . . . (j − 1, j) alors ρ(i) = i et ρ(j) = i + 1 donc ρ(i, j)ρ−1 = (i, i + 1). A titre d’exercice on
pourra montrer qu’une transposition et un cycle de longueur n forme un système minimal de générateurs.
Montrons que les cycles de longueur 3 engendrent An . Un élément σ ∈ An s’écrit comme un produit d’un
nombre pair de transpositions (puisque (σ) = +1) donc An est engendré par les éléments de la forme
(i, j)(k, `), où l’on peut supposer (i, j) 6= (k, `). Si card ({i, j}{k, `}) = 1 alors (i, j)(k, `) est un 3-cyle, sinon
on peut écrire (i, j)(k, `) = (i, j)(j, k)(j, k)(k, `) et chacune des permutations (i, j)(j, k) et (j, k)(k, `) est un
3-cycle.
Exemple de sous-groupes de Sn (resp. de An ).
(a) Si n ≤ 2, le groupe Sn est commutatif, cependant si n ≥ 3, le centre de Sn est trivial. En effet si
ρ ∈ Z(Sn ) alors (i, j) = (ρ(i), ρ(j)) donc {ρ(i), ρ(j)} = {i, j}; supposons qu’il existe i avec ρ(i) 6= i,
alors pour tout j 6= i on a ρ(i) = j, ce qui est aburde dès que n ≥ 3.

20
n

(b) Soit m ≤ n, un cycle de longueur m dans Sn est déterminé par son support (il y a Cnm = m possibilités)
et l’ordre donné à ce support (à permutation cyclique près, soit (m − 1)! possibilités). Ainsi Sn contient
(m − 1)!Cnm cycles de longueur m et le nombre de sous-groupes cycliques que ceux-ci engendrent est
(m − 1)!Cnm /φ(m). Attention : ce n’est pas, en général, le nombre de sous-groupes cycliques de cardinal
m, néanmoins, si p est premier et p ≤ n < 2p, un sous-groupe de cardinal p est engendré par un p-cycle
et il y a donc (p − 2)!Cnp tels sous-groupes. (Exercice : vérifier dans ce cas un des théorèmes de Sylow
qui affirme que (p − 2)!Cnp ≡ 1 mod p et en déduire le théorème de Wilson (p − 2)! ≡ 1 mod p).
(c) Soit n = n1 + n2 + . . . + nr une partition de n, alors on dispose d’une injection Sn1 × . . . × Snr ,→ Sn
en associant à (σ1 , . . . , σr ∈ Sn1 × . . . × Snr la permutation définie, pour 1 ≤ i ≤ r et 1 ≤ j ≤ ni , par
σ(n1 + . . . + ni−1 + j) = n1 + . . . + ni−1 + σi (j).
(d) Il existe néanmoins d’autres façons de plonger Sm dans Sn . Ainsi le groupe S5 possède six 5-sous-groupes
de Sylow d’où une injection S5 ,→ S6 . Notons que l’image de S5 ne stabilise aucun élément puisqu’il
agit transitivement.
(e) (centralisateur d’un élément) Soit σ ∈ Sn , on veut déterminer le sous-groupe

C(σ) := {ρ ∈ Sn | ρσ = σρ}.

Si σ = (i1 , . . . , im ) un m-cycle, un élément ρ commute avec σ si l’on a l’égalité de cycles (ρ(i1 ), . . . , ρ(im ))
donc si et seulement si le sous-ensemble {i1 , . . . , im } est une orbite (sous l’action du sous-groupe engendré
par σ) sur lequel σ agit par permutation circulaire. Si l’on identifie le sous-groupe des permutations de
support {i1 , . . . , im } (resp. fixant le sous-ensemble {i1 , . . . , im })avec Sm (resp. Sn−m ) alors Sn−m ,→
C(σ); de plus le sous-groupe Sn−m est distingué dans C(σ) et le quotient est isomorphe au sous-groupe
engendré par σ (i.e. à Z/mZ); en particulier card(C(σ)) = (n−m)!m. Montrer plus généralement que si
σ est le produits de r2 transpositions, r3 cycles de longueur 3 etc (avec disons n = r1 +2r2 +3r3 +. . .+srs )
alors
card(C(σ)) = r1 !r2 ! . . . rs !2r1 . . . srs .

Le groupe S1 est trivial, le groupe S2 est commutatif. Le groupe S3 possède trois sous-groupes de cardinal 2
(autant que de transpositions), un unique sous-groupe de cardinal 3 : le sous-groupe A3 (puisque A3 /S3 ) qui
est cyclique. En particulier S3 est résoluble. Le groupe S4 contient quatre sous-groupes isomorphes à S3 qui
sont tous conjugués (les stabilisateurs de 1, 2, 3, 4) et donc quatre sous-groupes de cardinal 3 (qui sont tous
conjugués). Les 2-sous-groupes de Sylow de S4 sont au nombre de 3 et sont isomorphes au groupe dièdral
D4 . En effet l’action de D4 sur les sommets d’un carré induit un isomorphisme de D4 sur un sous-groupe
de S4 ; ce sous-groupe ne peut être distingué car sinon il contiendrait tous les éléments d’ordre 2 ou 4 de S4
donc il y a 3 tels sous-groupes (qui sont tous conjugués). On peut en déduire un sous-groupe particulier
Le sous-groupe de Klein de S4 est l’intersection de ses 2-sous-groupes de Sylow, ou encore le sous-groupe
constitué de l’élément neutre et des doubles transpositions

K := {id, (1, 2)(34), (1, 3)(2, 4), (1, 4)(2, 3)} .

Ce sous-groupe est donc distingué dans S4 et isomorphe à Z/2Z × Z/2Z. En particulier la suite S4 ⊃ A4 ⊃
K ⊃ {id, (1, 2)(34)} ⊃ {id} est une suite de composition avec quotients successifs Z/2Z, Z/3Z, Z/2Z et
Z/2Z donc S4 est résoluble. Le groupe quotient S4 /K est isomorphe S3 ; en effet, si l’on fait agir S4 sur ses
2-sous-groupes de Sylow, le stabilisateur (normalisateur) de chacun de ces sous-groupes de Sylow est égal
à lui-même, donc leur intersection est K; l’homomorphime ρ : S4 → S3 associé à cette action a donc pour
noyau K et est donc surjectif.
Théorème. Soit H un sous-groupe distingué non trivial de Sn , alors ou bien H = An ou bien n = 4 et H
est le sous-groupe de Klein. Le groupe Sn est résoluble si et seulement si n ≤ 4, le groupe An est simple si
et seulement si n ≥ 5.
Preuve. Montrons d’abord que, si n ≥ 5 tous les 3-cycles sont conjugés dans An et donc un sous-groupe
distingué qui contient un 3-cycle les contient tous et est donc égal à An . Soit σ = (i, j, k), dès que ρ(1) =
i, ρ(2) = j et ρ(3) = k, on a ρ(1, 2, 3)ρ−1 = (i, j, k). A priori ρ ∈ Sn mais, si n ≥ 5 on peut s’arranger pour
que ρ ∈ An , quitte à remplacer éventuellement ρ par ρ(4, 5).

21
Montrons que A5 est simple. Soit H 6= {id} sous-groupe distingué de A5 . Si H contient un 3-cycle alors
H = A5 . Si H contient une double transposition σ = (i, j)(k, `), alors, en posant ρ = (k, `, m) avec m le
cinquième élément, on a σρσρ−1 = (k, `, m) ∈ H donc H = A5 . Si H contient un 5-cycle alors il contient un
5-Sylow de A5 et donc tous et donc les 24 cycles de longueur 5; mais 25 ne divise pas card(A5 ) = 60 donc
H contient d’autres éléments donc un 3-cycle ou une double transposition.
Montrons que An−1 simple entraı̂ne An simple (pour n ≥ 6). Soit H / An un sous-groupe non trivial.
Considérons Gi = {σ ∈ An | σ(i) = i} ∼ = An−1 , on a H ∩ Gi / Gi donc H ∩ Gi = Gi ou {id}. Si Gi ⊂ H alors
H contient un 3-cycle et H = An . Il nous reste à montrer qu’on ne peut avoir H ∩ Gi = {id}. Soit donc
σ ∈ H \ {id}. On a σ(1) = i 6= 1, choisissons j 6= 1, i alors σ(j) = k et on peut choisir `, m ∈
/ {1, i, j, k}. Soit
ρ = (j, `, m) ∈ An alors τ := ρ−1 σ −1 ρσ est dans H et τ (1) = 1 alors que τ (j) = ` onc τ ∈ H ∩ G1 \ {id}, ce
qui est une contradiction.
Enfin montrons que H / Sn et H 6= {id}, Sn entraı̂ne H = An pour n ≥ 5 (les cas n ≤ 4 sont laissés en
exercice). On a ou bien H ∩ An = An mais alors H = An ou bien H ∩ An = {id} mais alors card(H) = 2
ce qui est impossible car les conjugués d’un produit de transposition ne lui sont pas tous égaux. L’analyse
des cas où n ≤ 4 est laissée au lecteur.

Remarques. Le groupe A5 a pour cardinal 60, c’est le plus petit groupe simple (non commutatif); Le groupe
A5 contient 5 “copies” de A4 (les stabilisateurs de 1, 2, 3, 4, 5) qui contiennent chacun une copie du groupe
de Klein, ce qui fournit les cinq 2-sous-groupes de Sylow. En effet si on écrit K ⊂ A4 ⊂ A5 on sait que A4
normalise K et en fait doit être égal au normalisateur de K dans A5 car K ne peut pas être distingué; il y
a donc bien 5 = (A5 : A4 ) sous-groupes de Sylow.
Montrons qu’un groupe simple G de cardinal 60 est isomorphe à A5 . Un tel groupe n’admet pas d’homomor-
phisme non trivial vers S4 (sinon le noyau contredirait la simplicité de G) donc pas d’action non triviale
sur des ensembles de cardinal ≤ 4. D’après les théorèmes de Sylow, le nombre de 2-sous-groupes de Sylow
est donc a priori 5 ou 15, Le nombre de 5-sous-groupes de Sylow est 6 (donc il y a 24 éléments d’ordre 5)
et le nombre de 3-sous-groupes de Sylow est 10 (donc il y a 20 éléments d’ordre 3). Supposons n2 = 5,
alors l’action de G sur les 2-sous-groupes de Sylow donne une injection G ,→ S5 . L’image est d’indice deux
donc distinguée donc c’est A5 . Supposons n2 = 15, alors un décompte des éléments montre qu’il existe
deux 2-sous-groupes de Sylow tels que card(P1 ∩ P2 ) > 1 (sinon l’union des 2-sous-groupes de Sylow aurait
pour cardinal (15 × 3) + 1 = 46). Soit x ∈ P1 ∩ P2 \ {e}, alors P1 et P2 , étant commutatifs, sont dans le
commutateur C(σ) qui est donc de cardinal 4m avec m > 1. Le groupe G agit transitivement sur G/C(σ)
qui est de cardinal 15/m. mais on a vu que m > 1 et que 15/m ≥ 5 donc G/C(σ) a pour cardinal 5 et on
en tire un homorphisme ρ : G → S5 qui, comme précédemment doit être un isomorphisme avec A5 . (Bien
entendu la possibilité n2 = 15 est impossible a posteriori).
Exercices (illustrations géométriques). 1) Soit K un corps commutatif, montrer que l’action naturelle de
SL(2, K) sur K 2 induit une action transitive sur P1 (K) (l’ensemble des droites de K 2 passant par l’origine)
et que son noyau est {±Id}. On note PSL(2, K) le quotient de SL(2, K) par {±Id}. En déduire les
isomorphismes suivants :
(i) PSL(2, Z/2Z) ∼= S3
(ii) PSL(2, Z/3Z) ∼= A 4 ⊂ S4
(iii) PSL(2, Z/5Z) ∼= A5 ⊂ A 6
2) Considérons G le groupe du cube (qu’on peut supposer centré en l’origine) et faisons-le agir sur les quatre
“grandes” diagonales. Montrer que cette action induit un homomorphisme ρ : G → S4 dont le noyau est
{±Id} et en déduire que
G∼ = S4 × {±Id}.
Décrire les isométries correspondant aux transpositions, cycles, etc.

22
A.8. Le b-a-ba de la classification des groupes finis.

On donne quelques compléments “culturels” sur les groupes, leurs descriptions, pour la plupart sans preuves.

A.8.1. Théorème de Jordan-Holder.

Si un groupe G possède un sous-groupe distingué H non trivial (distinct de G et {e}), on peut écrire une
suite exacte 1 → H → G → G/H → 1 et considérer qu’on a ramené l’étude de G à l’étude de deux groupes
plus petits : H et G/H. Toutefois il est inexact de penser que l’on sait tout sur G si l’on ne connait que H
et G/H : par exemple si Z/3Z ∼= H / G et G/H ∼ = Z/2Z alors G ∼ = Z/6Z ou S3 . Ces considérations nous
amènent naturellement aux deux définitions suivantes.
Définition. Un groupe est simple s’il n’admet aucun sous-groupe distingué non trivial.
L’exemple de groupe simple le plus facile à décrire est Z/pZ, ce sont d’ailleurs les seuls groupes simples
abéliens; on les exclut parfois par convention (parce qu’ils sont trop simples!). On a vu que les groupes An
étaient simples lorsque n ≥ 5.
Définition. Une suite de composition d’un groupe G est la donnée d’une suite de sous-groupes emboités i.e.
G = G0 ⊃ G1 ⊃ . . . ⊃ Gn = {e} telle que Gi+1 / Gi et Gi /Gi+1 est simple. Une autre suite de composition
G = G00 ⊃ G01 ⊃ . . . ⊃ G0m = {e} est dite équivalente à la première si m = n et il existe une permutation
σ : [1, n] → [1, n] telle que Gσ(i) /Gσ(i)+1 ∼
= G0i /G0i+1 .
Remarquons que demander que Gi /Gi+1 soit simple équivaut à demander que la suite Gi soit maximale au
sens que si Gi ⊃ H ⊃ Gi+1 avec H / Gi alors H = Gi ou Gi+1 .
Théorème. (Jordan-Holder) Soit G un groupe fini, alors G admet une suite de composition qui est unique
à équivalence près.
Preuve. La première partie est claire, démontrons donc la deuxième. Supposons données deux suites de
composition G = H0 ⊃ H1 ⊃ . . . ⊃ Hm et G = K0 ⊃ K1 ⊃ . . . ⊃ Kn et supposons (raisonnement
par induction) que le théorème est déjà démontré pour les groupes admettant une suite de composition
de longueur ≤ m − 1. Si H1 = K1 alors on peut appliquer l’hypothèse de récurrence à H1 et conclure.
Dans le cas contraire on introduit une suite de composition de H1 ∩ K1 notée (attention à la numérotation)
H1 ∩ K1 = L2 ⊃ L3 ⊃ . . . ⊃ Lr de sorte que l’on a le diagramme suivant où les flèches indiquent que le
groupe en bas de la flèche est un sous-groupe distingué du groupe au-dessus.

G
. &
H1 K1
↓ & . ↓
H2 H1 ∩ K 1 K2
↓ ↓ ↓
H3 L3 K3
.. .. ..
. . .
↓ ↓ ↓
{e} = Hm Lr Kn = {e}

De plus tous les quotients sont simples; c’est clair par construction, sauf pour les inclusions de H1 ∩ K1 dans
K1 et H1 où cela résulte du lemme suivant
Lemme. Dans la situation ci-dessus, si H1 6= K1 alors G/H1 ∼
= K1 /H1 ∩ K1 et G/K1 ∼
= H1 /H1 ∩ K1 . En
particulier K1 /H1 ∩ K1 et H1 /H1 ∩ K1 sont simples.
Preuve. L’application K1 ,→ K1 H1 → K1 H1 /H1 a pour noyau H1 ∩ K1 d’où l’isomorphisme classique
K1 /H1 ∩ K1 ∼
= K1 H1 /H1 . Par ailleurs on a K1 / K1 H1 / G, mais, vues les hypothèses, K1 6= K1 H1 donc
H1 K1 = G.

23
Suite de la preuve. On dispose donc de deux suites de composition de H1 de longueur m − 1 et r − 1; on peut
donc apppliquer l’hypothèse de récurrence et conclure que m = r et les quotients {H1 /H2 , . . . , Hm−1 /Hm }
et {H1 /H1 ∩ K1 , H1 ∩ K1 /L3 , . . . , Lr−1 /Lr } sont isomorphes deux à deux. Le même raisonnement appliqué
aux deux suites de composition de K1 montre que n = r et que les quotients {K1 /K2 , . . . , Kn−1 /Kn }
et {K1 /H1 ∩ K1 , H1 ∩ K1 /L3 , . . . , Lr−1 /Lr } sont isomorphes deux à deux. On en tire, en se souvenant
du lemme précédent, que les quotients {G/H1 , H1 /H2 , . . . , Hm−1 /Hm } sont isomorphes (à permutation
près) aux quotients {K1 /H1 ∩ K1 , H1 /H1 ∩ K1 , H1 ∩ K1 /L3 , . . . , Lr−1 /Lr } donc également aux quotients
{K1 /K2 , H1 /H1 ∩ K1 , K2 /K3 , . . . , Kn−1 /Kn } et enfin aux quotients {K1 /K2 , G/K1 , K2 /K3 , . . . , Kn−1 /Kn }
comme annoncé.

Il est naturel d’introduire la définition suivante qui a par ailleurs une grande importance historique : d’après
Galois, les équations polynomiales P (x) = 0 dont on peut exprimer les racines à l’aides des opérations de
√
corps et de radicaux n sont celles qui ont un groupe résoluble.
Définition. Un groupe G est résoluble s’il existe une suite G = G0 ⊃ G1 ⊃ . . . ⊃ Gn = {e} telle que
Gi+1 / Gi et Gi /Gi+1 est abélien.
Si le groupe G est fini, il revient au même de demander que ses facteurs de Jordan-Holder soient isomorphes
à Z/pZ. Un des théorèmes les plus difficiles de la théorie des groupes finis (Feit-Thomson) dit qu’un groupe
de cardinal impair est toujours résoluble.
Exercices. Montrer que, si H / G alors G est résoluble si et seulement si H et G/H sont résolubles. Montrer
qu’un groupe de cardinal ≤ 100 et 6= 60 est résoluble. Montrer qu’un groupe G de cardinal 2n avec n impair
contient un sous-groupe distingué d’indice 2 et en particulier n’est pas simple (Indication : l’action par
translation induit ρ : G → S2n , montrer que Ker( ◦ ρ) est d’indice 2 dans G). En admettant le théorème de
Feit-Thomson, montrer que G est résoluble.
A.8.2. Classification des petits groupes (début).
On peut chercher à classer les “petits” groupes à isomorphisme près. Si l’on note γ(n) le nombre de classes
d’isomorphisme de groupes de cardinal n, on a déjà vu que γ(p) = 1, γ(p2 ) = 2 γ(p3 ) = 5 et γ(pq) = 2 ou
1 suivant que q ≡ 1 mod p ou non. Si on poursuit les calculs, on peut obtenir par exemple la table suivante
pour n ≤ 34 :

n 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

γ(n) 1 1 2 1 2 1 5 2 2 1 5 1 2 1 14 1

18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

5 1 5 2 2 1 15 2 2 5 4 1 4 1 51 1 2

Pour n = 24 les calculs sont plus longs (voir exercice ci-dessous), pour n = 16 ou 32, ils deviennent plus
délicats, pour les autres valeurs, donnons sans preuve une description des classes d’isomorphismes.
(a) Pour n = 8 les cinq groupes sont les trois groupes abéliens (Z/2Z)3 , Z/4Z × Z/2Z et Z/8Z et les deux
non commutatifs D4 et H8 = {±1, ±i, ±j, ±k}.
(b) Pour n = 12 les cinq groupes sont Z/12Z, Z/6Z × Z/2Z, D3 × Z/2Z, A4 et le produit semidirect
Z/3Z >/φ Z/4Z où φ : Z/4Z → Z/2Z ∼ = (Z/3Z)∗ est l’homomorphisme surjectif qui associe à x mod 4
l’élément x mod 2 (remarquer que D6 est isomorphe à D3 × Z/2Z).
(c) Pour n = 18 les cinq groupes sont Z/18Z, Z/6Z × Z/3Z, D9 , D3 ×Z/3Z et un produit semi-direct
2 0 1
(Z/3Z) >/φ Z/2Z où φ : Z/2Z → GL(2, Z/3Z) est donné par φ(1) = .
1 0
(d) Pour n = 20 les cinq groupes sont Z/20Z, Z/10Z × Z/2Z, D10 , D5 × Z/2Z et un produit semi-direct
Z/5Z >/φ Z/4Z où φ : Z/4Z → (Z/5Z)∗ est un isomorphisme.

24
(e) Pour n = 28 les quatre groupes sont Z/28Z, Z/14Z × Z/2Z, D14 , D7 × Z/2Z.
(f) Pour n = 30 les quatre groupes sont Z/30Z, D3 × Z/5Z, D15 , D5 × Z/3Z.
Exercices. Démontrer les affirmations (a) . . . (f ). Classifier les groupes de cardinal 24 ainsi:
(i) On appelle P (resp. Q) un 2-sous-groupe de Sylow (resp. un 3-sous-groupe de Sylow) et n2 (resp. n3 )
le nombre de 2-sous-groupes de Sylow (resp. de 3-sous-groupes de Sylow). Montrer que n2 = 1 ou 3
(resp. n3 = 1 ou 4). En déduire que soit G = Q >/φ P soit G = P >/φ Q soit n2 = 3 et n3 = 4 et alors
G∼ = S4 .
(ii) Si n2 = 1, montrer qu’il y a 8 groupes possibles. Si P ∼ = (Z/2Z)3 les groupes possibles sont Z/6Z ×
(Z/2Z) , Z/2Z × A4 ou un produit semi-direct (Z/2Z)3 >/φ Z/3Z où φ : Z/3Z → GL(3, Z/2Z) est
2

donné par la permutation circulaire des coordonnées; si P ∼ = Z/4Z × Z/2Z alors G ∼ = Z/12Z × Z/2Z; si
P ∼= Z/8Z alors G ∼= Z/24Z; si P ∼ = D4 alors G ∼ = D4 × Z/3Z; si P ∼ = H8 alors ou bien G ∼
= H8 × Z/3Z
ou bien
±1 + ±i + ±j + ±k
G = H8 >/φ Z/3Z ∼ = ±1, ±i, ±j, ±k, .
2
(iii) Si n3 = 1 et n2 = 3 il ya 6 groupes possibles : D3 × (Z/2Z)2 , D6 × Z/2Z, D3 Z/4Z, D12 et des produits
semidirects Z/3Z >/φ P (avec φ : P → Z/2Z = Aut(Z/3Z) surjective et P = Z/8Z, D4 ou H8 ).

A.8.3. Classification des groupes simples finis (aperçu).

La classification exhaustive des groupes simples finis (non abéliens) a été achevé au début des années 80.
Le plus petit groupe simple est A5 , il a cardinal 60; le suivant est PSL(2, Z/7Z), il a cardinal 168. On
peut répartir les groupes simples non abéliens en 17 familles (infinies) auxquelles il faut ajouter 26 groupes
exceptionnels appelés groupes sporadiques. Je ne dirai presque rien sur les groupes sporadiques sinon écrire
dans un tableau leurs cardinaux et donner les noms de leurs découvreurs : Mathieu, Held, Janko, Conway,
Lyons, O’Nan, Fischer, Fischer-Griess, Higman-Sims, Suzuki, McLaughlin, Rudvalis. Je ne vais pas décrire
toutes les familles mais les principales.
Le groupe alterné. Lorsque n ≥ 5 on a vu que le groupe An est simple.
Les autres familles sont des groupes de type de Lie, c’est-à-dire qu’ils correspondent à des groupes de Lie
comme SL(n, R) sauf qu’au lieu de considérer des coefficients dans R ou C, on choisit les coefficients dans
un corps fini Fq où q = pr désigne le cardinal du corps.
Le groupe spécial linéaire. Le groupe PSL(n, Fq ) := SL(n, Fq )/Z est simple pour n ≥ 2 où Z désigne le
centre, c’est-à-dire le sous-groupe {aI | a ∈ Fq , an = 1}. [Exceptions : n = 2 et q = 2 ou 3]
Le groupe symplectique. Le groupe PSp(2n, Fq ) := Sp(2n, Fq )/Z est simple pour n ≥ 2 où Z désigne le
centre, c’est-à-dire le sous-groupe {±I}. Rappelons que le groupe symplectiqueest le groupe
des matrices
0 In
préservant une forme bilinéaire alternée non dégénérée; explicitement, si J = on peut écrire
−In 0
Sp(2n, K) = {A ∈ GL(2n, K) | t AJA = J}. [Exceptions : n = 1 et q = 2 ou 3; n = 2 et q = 2]
Le groupe orthogonal (on suppose ici que la caractéristique est 6= 2). Le commutateur du groupe orthogonal
(groupe des isométries) d’une forme quadratique se note Ω. Sur un espace de dimension n sur Fq on
distingue trois cas. Si n impair on choisit Q(x) = x1 x2 + . . . + xn−2 xn−1 + x2n , on note SO(n, Fq ) le
groupe des rotations, Ωn (Fq ) le sous-groupe des commutateurs et PΩn (Fq ) le quotient par le centre. Alors
PΩn (Fq ) est simple pour n ≥ 5 (impair). Si n = 2m est pair on distingue deux formes quadratiques
Q+ (x) = x1 x2 +. . .+xn−3 xn−2 +xn−1 xn et Q− (x) = x1 x2 +. . .+xn−3 xn−2 +x2n−1 −ax2n (avec a ∈ F∗q \F∗2 q ),
on note SO+ (n, Fq ) (resp. SO− (n, Fq )) le groupe des rotations, Ω+ n (F q ) (resp. Ω −
n (F q )) le sous-groupe des
−
commutateurs et PΩ+ n (Fq ) (resp. PΩ +
n (Fq )) le quotient par le centre. Alors PΩ +
n (F q ) (resp. PΩ n (F q )) est
simple pour n ≥ 6 (pair). Pour les petites dimensions, SO(2) est commutatif, PΩ(3, Fq ) ∼ = PSL(2, Fq ) alors
= PSL(2, Fq ) × PSL(2, Fq ) et PΩ− (4, Fq ) ∼
que PΩ+ (4, Fq ) ∼ = PSL(2, Fq2 ). On a également PΩ+ (6, Fq ) ∼ =
PSL(4, Fq ) et PΩ− (6, Fq ) ∼
= PSU(4, Fq2 ). Plus curieusement card(PΩ(2m + 1, Fq )) = card(PSp(2m, Fq )) et
on a PΩ(5, Fq ) ∼
= PSp(4, Fq )) mais l’égalité de cardinaux ne correspond pas à un isomorphisme pour m ≥ 3.
Le groupe unitaire. On note xσ := xq l’automorphisme involutif de Fq2 . On note Un (Fq2 ) le groupe des
isométries de la forme hermitienne H(x) = x1 xσ1 + . . . + xn xσn , puis SUn (Fq2 ) = Un (Fq2 ) ∩ SLn (Fq2 ) et enfin

25
PSUn (Fq2 ) le quotient par le centre Z = {aI | aq+1 = 1}. Le groupe PSUn (Fq2 ) est simple pour n ≥ 2.
[Exceptions : n = 2 et q 2 = 4 ou 9; n = 3 et q 2 = 4]
Il existe en plus des groupes de type de Lie exceptionnels G2 , F4 , E6 , E7 et E8 de dimension 14, 52, 78, 133
et 248 qui conduisent aussi à des groupes simples finis. Enfin il existe des formes “tordues” de certains de
ces groupes que je ne décrirai pas. (Voir les deux tableaux).

A.8.4. Groupes définis par générateurs et relations.

La manière la plus commode de “décrire un groupe” à un ordinateur est de lui donner des générateurs avec
les relations vérifiées par ceux-ci. Pour décrire cela plus précisément, commençons par construire le groupe
“engendré par m éléments sans relations”. Soit S un ensemble (qui sera fini dans nos applications), on
définit l’ensemble des mots sur S comme l’ensemble des suites x1 x2 . . . xn avec n ≥ 1 et xi ∈ S × {±1} [pour
simplifier la notation on pourra écrire x pour (x, +1) et x−1 pour (x, −1)] auquel on ajoute le “mot vide” que
l’on note e. On notera M (S) l’ensemble des mots. On peut définir une multiplication des mots par la formule
(x1 x2 . . . xn ) ∗ (y1 y2 . . . ys ) = x1 x2 . . . xn y1 y2 . . . ys ; cette multiplication est clairement associative. On définit
ensuite une relation d’équivalence R sur M (S) comme celle engendrée par les relations xx−1 Re (c’est-à-dire
que pour tout mot m, n on impose mxx−1 nRmn et on étend la relation par transitivité). Remarquons
qu’on peut introduire des représentants canoniques des classes en choisissant le mot le plus court ou mot
réduit (pourquoi est-il unique?). L’ensemble S est naturellement inclus dans M (S) (resp. dans M (S)/R)
si l’on identifie un élément x ∈ S et le mot à une lettre. On notera i : S ,→ M (S)/R cette inclusion. La
multiplication sur M (S) induit une multiplication sur M (S)/R (elle “passe au quotient”). On peut aussi
définir le produit de deux mots réduits comme le mot réduit obtenu à partir du produit des deux mots.
Théorème. L’ensemble M (S)/R muni de la loi ∗ est un groupe, appelé groupe libre sur S et noté L(S). Il
vérifie la propriété universelle suivante : pour tout groupe G et toute application f : S → G, il existe une
unique homomorphisme φ : L(S) → G tel que φ ◦ i = f .
Preuve. La loi est automatiquement associative et a pour élément neutre le mot vide (sa classe). L’inverse
de la classe d’un mot u1 u2 . . . um (avec ui ou u−1 i ∈ S) est la classe de u−1 −1 −1
m . . . u2 u1 . Pour la deuxième
1 m 1 m
partie, posons φ(x1 . . . xm ) = f (x1 ) . . . f (xm ) . On vérifie aisément que φ : L(S) → G est bien défini et
a les propriétés voulues.

Corollaire. Tout groupe peut s’écrire comme quotient d’un groupe libre. Plus précisément si G admet
admet pour générateur un sous-ensemble S, alors G est un quotient de L(S).
Preuve. Il suffit de considérer l’application φ : L(S) → G associée par la propriété universelle à l’injection
S ,→ G et de remarquer que φ(L(S)) est un sous-groupe contenant S donc égal à G tout entier. On a donc
bien G ∼
= L(S)/ Ker(φ).

Si on écrit G = L(S)/N et si R est un ensemble de générateurs de N on dit qu’on a une présentation de G

par générateurs et relations. Précisons qu’il y deux notions de “générateurs” : le sous-groupe engendré par
R n’est pas forcément distingué, ici on doit prendre pour N le plus petit sous-groupe distingué contenant R.
Exemples. Une présentation de Z/n1 Z × . . . Z/ns Z est donnée par s générateurs x1 , . . . , xs et les relations
xni i = e et xi yi x−1
i yi
−1
= e. Une présentation du groupe dièdral Dn est donnée par deux générateurs ρ et
σ avec les relations ρn = e et σ 2 = (σρ)2 = e. Une présentation possible de Sn (penser à xi comme la
transposition (i, i + 1)) est

générateurs : xi pour 1 ≤ i ≤ n − 1
relations : x2i pour 1 ≤ i ≤ n − 1, (xi xi+1 )3 pour 1 ≤ i ≤ n − 1 et xi xj x−1 −1
i xj pour |i − j| ≥ 2

Les groupes libres présentent des analogies avec les espaces vectoriels (ou les groupes abéliens libres) mais
réservent aussi quelques surprises. Par exemple deux groupes libres L(X) et L(Y ) sont isomorphes si et
seulement si card(X) = card(Y ) et un sous-groupe d’un groupe libre est encore libre (théorème de Nielsen-
Schreier). Cependant un sous-groupe même de Ln (le groupe libre à n générateurs) peut être de n’importe
quel rang : ainsi si (Ln : H) = m alors H est un groupe libre à (n − 1)m + 1 générateurs; pire, si n > 1

26
alors Ln contient des sous-groupes qui ne sont pas de type fini! Le sous-groupe des commutateurs est un tel
exemple.
Le groupe libre à n générateurs est important en topologie puisque c’est le groupe fondamental du plan
privé de n points. Le groupe fondamental d’une variété s’écrit souvent naturellement commme quotient
d’un groupe libre. Par exemple le groupe fondamental d’une surface compacte à g trous est le quotient du
groupe libre à 2g générateurs x1 , y1 , x2 , y2 , . . . , xg , yg par le sous-groupe distingué engendré par la relation
x1 y1 x−1 −1 −1 −1
1 y1 . . . xg yg xg yg .

A.8.5. Problèmes de Burnside.

Au début du siècle, Burnside a posé la question de savoir si un groupe de type fini et d’exposant fini est
nécessairement fini; à défaut il a également demandé si le nombre de classes d’isomorphisme de groupes finis
d’exposant n, possédant m générateurs est fini. On peut formaliser cela à l’aide de la notion de groupe libre
à m générateurs.
Considérons Lm le groupe libre à m générateurs et N = Nn le sous-groupe engendré par les éléments
{g n | g ∈ Lm } (i.e. le plus petit sous-groupe n
de Lm contenant tous les g ); remarquons que Nn / Lm puisque
n n −1 −1 n −1 n
x(g1 . . . gr )x = xg1 x . . . xgr x .
(1) Première question : pour quelles valeurs de m et n le groupe B(m, n) := Lm /Nn est-il fini?
(2) Deuxième question : les quotients finis de B(m, n) sont-ils en nombre fini (à isomorphisme près)?
La première question s’appelle traditionnellement problème de Burnside et la deuxième problème restreint de
Burnside. Il est clair que si B(m, n) est fini, alors ses quotients sont tous finis et qu’il n’y en a qu’un nombre
fini. Cependant justement la réponse à la première question est négative en général. Plus précisément il est
facile de voir que B(1, n) = Z/nZ et B(m, 2) = (Z/2Z)m . On sait (Burnside, Sarov et Hall) que B(m, 3),
B(m, 4) et B(m, 6) sont finis; mais dans l’autre sens on sait que B(m, n) est infini lorsque m > 1 et n est
impair > 665 (Novikov et Adjan) ou n pair > 8000. Par contre le problème restreint de Burnside admet une
réponse positive. Hall et Higman on montré en 1956 que, modulo des résultats de classification des groupes
simples finis (qui ont été démontrés dans les années 80) le cas n = pr11 . . . prss découlait du cas pri i . A la fin
des années 80, Zelmanov a ensuite prouvé que les quotients finis de B(m, pr ) étaient, à isomorphisme près,
en nombre fini.

Exercice. Montrer que les groupes de cardinal de la forme N = pa , pq, pqr, 4pq (sauf 60) ou 2(2m + 1)
ne sont pas simples. Indications : les deux premiers cas a été traités en cours, pour les deux suivants
utiliser les théorèmes de Sylow, dans le dernier cas considérer l’action de G sur lui-même par translation et
le morphisme ρ : G → S2(2m+1) correspondant, montrer que l’image d’un élément d’ordre 2 a pour signature
−1 et conclure. On montrera plus tard (chapitre F) qu’un groupe de cardinal pa q b est résoluble. Montrer
qu’un groupe de cardinal N ≤ 200 n’est pas simple sauf si N ∈ {60, 168}.

27
APPENDICE : LA LISTE DES GROUPES SIMPLES FINIS

I. Les 17 familles infinies de groupes simples finis non abéliens et leurs cardinaux

Groupe Autre nom cardinal

n!
An 2

n(n+1) Qn+1
(1) 1
An (q) P SLn+1 (q) (n+1,q−1) q
2
i=2 (q i − 1)
n(n+1) Qn+1
2 (1) 1
An (q) P SUn+1 (q) (n+1,q+1) q
2
i=2 (q i − (−1)i )

n2
(2) 1
Qn 2i
Bn (q) P Ω2n+1 (q) (2,q−1) q i=1 (q − 1)

2 (3)
Bn (q) Sz(q) q 2 (q − 1)(q 2 + 1)

n2
1
Qn 2i
Cn (q) P Sp2n (q) (2,q−1) q i=1 (q − 1)
Qn−1
Dn (q) P Ω+
2n (q)
1
(4,q n −1) q
n(n−1) n
(q − 1) i=1 (q 2i − 1)
Qn−1
2
Dn (q) P Ω−
2n (q)
1
(4,q n +1) q
n(n−1) n
(q + 1) i=1 (q 2i − 1)

3
D4 (q) q 12 (q 2 − 1)(q 8 + q 4 + 1)(q 6 − 1)

G2 (q) q 6 (q 2 − 1)(q 6 − 1)

2 (4)
G2 (q) q 3 (q − 1)(q 3 + 1)

F4 (q) q 24 (q 2 − 1)(q 6 − 1)(q 8 − 1)(q 12 − 1)

2 (5)
F4 (q) q 12 (q − 1)(q 3 + 1)(q 4 − 1)(q 6 + 1)

1 36 2
E6 (q) (3,q−1) q (q − 1)(q 5 − 1)(q 6 − 1)(q 8 − 1)(q 9 − 1)(q 12 − 1)

2 1 36 2
E6 (q) (3,q+1) q (q − 1)(q 5 + 1)(q 6 − 1)(q 8 − 1)(q 9 + 1)(q 12 − 1)

1 63 2
E7 (q) (2,q−1) q (q − 1)(q 6 − 1)(q 8 − 1)(q 10 − 1)(q 12 − 1)(q 14 − 1)(q 18 − 1)

E8 (q) q 120 (q 2 − 1)(q 8 − 1)(q 12 − 1)(q 14 − 1)(q 18 − 1)(q 20 − 1)(q 24 − 1)(q 30 − 1)

(1)
A1 (2), A1 (3) et 2 A2 (2) sont résolubles.
(2)
B2 (2) = C2 (2) et G2 (2) ont un sous-groupe des commutateurs d’indice 2 qui est simple.
(3)
définis seulement pour q = 22n+1 ; 2 B2 (2) est résoluble
(4)
définis seulement pour q = 32n+1 ; 2 G2 (3) a un sous-groupe des commutateurs d’indice 3 qui est simple.
(5)
définis seulement pour q = 22n+1 ; 2 F4 (2) a un sous-groupe des commutateurs d’indice 2 qui est simple.
Les notations de la colonne de gauche proviennent de la classification des algèbres de Lie simples. Les nota-
tions de la page suivante correspondent le plus souvent aux initiales des découvreurs des groupes sporadiques.

28
II. Les 26 groupes simples finis sporadiques et leurs cardinaux

groupe cardinal du groupe et sa factorisation

M11 24 .32 .5.11 = 7920

M12 26 .33 .5.11 = 95 040

M22 27 .32 .5.7.11 = 443 520

M23 27 .32 .5.7.11.23 = 10 200 960

M24 210 .33 .5.7.11.23 = 244 823 040

J1 23 .3.5.7.11.19 = 175 560

J2 27 .33 .52 .7 = 604 800

J3 27 .35 .5.17.19 = 50 232 960

J4 221 .33 .5.7.113 .23.29.31.37.43 = 86 775 571 046 077 562 880

HS 29 .32 .53 .7.11 = 44 352 000

He 210 .33 .52 .73 .17 = 4 030 387 200

Mc 27 .36 .53 .7.11 = 898 128 000

Suz 213 .37 .52 .7.11.13 = 448 345 497 600

Ly 28 .37 .56 .7.11.31.37.67 = 51 765 179 004 000 000

Ru 214 .33 .53 .7.13.29 = 36 481 536 000

O0 N 29 .34 .5.73 .11.19.31 = 460 815 505 920

Co1 221 .39 .54 .72 .11.13.23 = 4 157 776 806 543 360 000

Co2 218 .36 .53 .7. 11.23 = 42 305 421 312 000

Co3 210 .37 .53 .7.11.23 = 495 766 656 000

F i22 217 .39 .52 .7.11.13 = 64 561 751 654 400

F i23 218 .313 .52 .7.11.13.17.23 = 4 089 460 473 293 004 800

F i024 221 .316 .52 .73 .11.13.17.23.29 = 1 255 205 709 190 661 721 292 800

F5 214 .36 .56 .7.11.19 = 273 030 912 000 000

F3 215 .310 .53 .72 .13.19.31 = 998 205 382 766 592 000

F2 241 .313 .56 .72 .11.13.17.19.23.31.47 = 4 154 781 581 226 426 191 177 580 544 000 000

F1 246 .320 .59 .76 .112 .133 .17.19.23.29.31.41.47.59.71

= 808 017 424 794 512 875 886 459 904 961 710 757 005 754 368 000 000 000

29
B. ANNEAUX.

B.1. Généralités et exemples.

Définition. Un anneau est la donnée d’un ensemble A et de deux lois internes + et × telles que
(i) L’ensemble A muni de la loi + est un groupe abélien d’élément neutre 0 = 0A .
(ii) La loi × est associative et possède un élément neutre 1 = 1A .
(ii) La loi × est distributive par rapport à l’addition, c’est-à-dire

∀a, b, c ∈ A, a(b + c) = ab + ac et (a + b)c = ac + bc.

Si, de plus, la loi × est commutative, on dit que l’anneau est commutatif. L’anneau est un corps si tout
élément distinct de 0A est inversible (pour la loi ×).
L’exemple type d’anneau est Z muni de l’addition et de la multiplication usuelles, de même Z/nZ est un
anneau. Les ensembles Q, R et C sont des corps. Nous traiterons surtout des anneaux commutatifs mais
donnons néanmoins deux exemples d’anneaux non commutatifs. Si A est un anneau, Mat(n × n, A) muni de
l’addition et de la multiplication de matrices, est un anneau qui n’est pas commutatif dès que n ≥ 2. Il est
plus difficile de construire un corps non commutatif, voici l’exemple classique des quaternions, dû à Hamilton.
L’ensemble sous-jacent est un R-espace vectoriel de dimension 4 possédant une base qu’il est classique de
noter {1, i, j, k}, l’addition est simplement l’addition de deux vecteurs, la multiplication est R-bilinéaire et
définie sur les éléments de la base par le fait que 1 est élément neutre et

ij = −ji = k, jk = −kj = i et ki = −ik = j.

L’arithmétique (les nombres) fournit un grand nombre d’exemples d’anneaux, mais ces derniers sont présents
aussi en théorie des ensembles, en analyse, etc. Si on note P(X) l’ensemble des parties d’un ensemble X et
∆ la différence symétrique A ∆ B := (A ∪ B) \ (A ∩ B) alors (P(X), ∆, ∩) est un anneau commutatif qui
a la particularité que pour tout x, on a x + x = 0 et x · x = x. Si K = R ou C (ou plus généralement
un anneau commutatif), l’ensemble F(X, K) des fonctions de X vers K est un anneau; si X est un espace
topologique, l’ensemble C 0 (X, R) des fonctions continues est également un anneau, idem avec les fonctions
de classe C k (si X est un ouvert de Rn ou plus généralement une variété différentielle); l’ensemble des
fonctions de R dans R développables en série entière forme aussi un anneau. Si l’on considère l’espace
vectoriel L1 (Rn ) des fonctions intégrables
R (modulo les fonctions nulles presque partout) on peut le munir du
produit de convolution (f ∗ g)(x) = Rn f (x − y)g(y)dm(y) et ce produit vérifie tous les axiomes de structure
d’anneau commutatif sauf l’existence d’un élément neutre. Un analogue purement algébrique du produit de
convolution est fourni par l’algèbre de groupe A[G] (où A est un anneau commutatif et G un groupe) dont
l’ensemble sous-jacent est l’ensemble des fonctions presque nulles de G vers A, la somme est la somme de
fonctions et le produit est défini par la formule :
X X
f ∗ g(x) = f (y)g(z) = f (y)g(y −1 x).
yz=x y∈G

Un élément a est inversible dans a s’il existe a0 ∈ A tel que aa0 = a0 a = 1.

Remarques. L’ensemble des éléments inversibles forme un groupe, pour la multiplication, noté A∗ . Il faut
distinguer A∗ et A \ {0}; en effet ces deux ensembles ne sont égaux que lorsque A est un corps. Par exemple
Mat(n × n, A)∗ = GL(n, A) = {U ∈ Mat(n × n, A) | det(U ) ∈ A∗ } et (Z/6Z)∗ = {1̄, 5̄} est un groupe à deux
éléments.
Un sous-anneau B de A est un sous-ensemble tel que addition et multiplication de A induisent une structure
d’anneau sur
√ B avec même √ élément
√ neutre 1A . Par exemple Z[i] := {a + bi | a, b ∈ Z} est un sous-anneau
de C et Z[ 3 2] := {a + b 3 2 + c 3 4 | a, b, c ∈ Z} est un sous-anneau de R.
Soient A, B deux anneaux, on peut définir leur produit comme l’ensemble A × B muni de l’addition (a, b) +
(a0 , b0 ) = (a + a0 , b + b0 ) et de la multiplication (a, b) · (a0 , b0 ) = (aa0 , bb0 ). Il est immédiat de vérifier

30
qu’on obtient bien une structure d’anneau qui est commutatif si et seulement si A et B sont commutatifs.
Remarquons que A × {0B } est un sous-ensemble de A × B stable par addition et multiplication et possédant
un élément neutre (1A , 0B ); c’est donc un anneau mais ce n’est pas un sous-anneau de A × B puisque son
élément neutre n’est pas celui de A × B. Observons qu’on a facilement l’égalité (A × B)∗ = A∗ × B ∗ .
Soient A, B deux anneaux, une application f : A → B est un homomorphisme d’anneaux si f (x + y) =
f (x) + f (y), f (xy) = f (x)f (y) et f (1A ) = 1B . C’est un isomorphisme d’anneaux si c’est de plus une
bijection (en effet la bijection réciproque est automatiquement un homomorphisme).
On suppose désormais que les anneaux considérés sont commutatifs.
On a vu la construction du quotient d’un groupe par un sous-groupe; on peut se demander quelle propriété
doit avoir un sous-groupe (additif) d’un anneau A pour que le quotient garde une structure d’anneau, la
réponse est précisément la notion d’idéal.
Définition. Un idéal d’un anneau A est un sous-ensemble qui est un sous-groupe pour l’addition et vérifie

∀a ∈ A, ∀j ∈ I, aj ∈ I.

Remarques et exemples. Si on ne supposait pas l’anneau A commutatif, il faudrait distinguer les idéaux à
gauche (tels que AI ⊂ I) ou à droite (tels que IA ⊂ I) ou bilatère. Soit a ∈ A, l’ensemble aA = {ab | b ∈ A}
est un idéal de A appelé idéal principal. Tous les idéaux de l’anneau Z sont de la forme aZ puisque cela
est déjà vrai pour les sous-groupes. Il est souvent intéressant de traduire les propriétés des éléments en des
propriétés d’idéaux, par exemple:
Définition. Un idéal I distinct de A est premier si ab ∈ I entraı̂ne a ou b est dans I. Un élément a ∈ A est
premier si l’idéal aA est premier.
On voit facilement que, dans le cas A = Z les élément premiers sont les nombres ±p avec p nombre naturel
premier (au sens usuel).
Il est immédiat de voir que le noyau d’un homomorphisme est un idéal, que l’intersection d’idéaux est un
idéal, que l’image réciproque d’un idéal par un homomorphisme f : A → B est encore un idéal; par contre
l’image d’un idéal n’est a priori un idéal que dans f (A) et pas dans B. L’image réciproque d’un idéal
premier par un homomorphisme d’anneaux est un idéal premier. Enfin les idéaux permettent de construire
les anneaux quotient.
Théorème. Soit A un anneau et I un idéal, il existe une unique structure d’anneau sur A/I telle que
la surjection canonique s : A → A/I soit un homomorphisme d’anneaux. Ce quotient vérifie la propriété
universelle suivante:
Soit f : A → B un homomorphisme d’anneaux, l’application f se factorise en f = fˆ ◦ s si et seulement si
I ⊂ Ker(f ). Si cette condition est vérifiée, l’application fˆ : A/I → B est un homomorphisme d’anneaux et
l’on a
(i) L’image fˆ(A/I) est égale à l’image f (A).
(ii) Le noyau Ker(fˆ) est égal à Ker(f )/I.
Preuve. Le théorème a déjà été prouvé en termes de groupes, il suffit donc de vérifier que fˆ, quand elle existe,
est un homomorphisme d’anneaux, étant entendu que la multiplication est définie sur A/I par (a+I)·(b+I) =
ab + I et que cette définition est indépendante du choix des représentants des classes précisément parce que
I est un idéal. Soit donc ā = a + I et b̄ = b + I deux éléments de A/I; on a fˆ(ā · b̄) = fˆ(ab) = fˆ ◦ s(ab) =
f (ab) = f (a)f (b) = fˆ(ā)fˆ(b̄).

Remarquons que, si l’on avait pas supposé l’anneau commutatif, il aurait fallu considérer un idéal bilatère
pour avoir (a + i)(b + j) = ab + ib + aj + ij ∈ ab + I.
On pourra vérifier à titre d’exercice que l’application I 7→ s−1 (I) fournit une correspondance bijective entre
les idéaux de A/I et les idéaux de A contenant I. Comme pour les groupes, on peut en déduire de nombreux
isomorphismes dont le plus fondamental est f (A) ∼ = A/ Ker(f ).

31
Pour n’importe quel anneau, on dispose d’un homomorphisme canonique d’anneaux iA : Z → A défini par
m 7→ m1A . Le noyau est de la forme Ker(iA ) = mA Z avec mA entier ≥ 0. D’après ce qui précède, iA (Z) est
un sous-anneau de A isomorphe à l’anneau Z/mA Z. L’entier mA s’appelle la caractéristique de l’anneau A.
On a déjà observé que l’intersection d’idéaux est encore un idéal; on peut définir d’autres opérations sur les
idéaux, notamment la somme de deux idéaux I, J est définie comme I + J := {i + j | i ∈ I et j ∈ J} alors
que le produit de deux idéaux I, J est défini comme IJ := {i1 j1 + . . . + im jm | ih ∈ I et jh ∈ J}. On peut
définir d’ailleurs la somme d’idéaux indexés par un ensemble quelconque et le produit d’idéaux indexés par
un ensemble fini. On remarque que l’on a toujours IJ ⊂ I ∩ J mais en général on n’a pas égalité; en effet
si I = J = 2Z dans A = Z alors IJ = 4Z 6= 2Z = I ∩ J. Voici un énoncé classique d’isomorphisme qui est
souvent utile.
Proposition. (Lemme chinois généralisé) Soient I, J deux idéaux de A tels que I + J = A alors IJ = I ∩ J
et, de plus,
A/IJ ∼= A/I × A/J.

Preuve. Considérons l’homomorphisme f : A → A/I × A/J produit des deux surjections canoniques. Son
noyau est clairement I ∩ J. Montrons que f est surjective. Pour cela observons que, par hypothèse, il existe
i ∈ I et j ∈ J tels que i + j = 1. Si a, b ∈ A, considérons c := aj + bi on a c = a(j + i) + i(b − a) ∈ a + I et
de même c = b(i + j) + j(a − b) ∈ b + J donc f (c) = (sI (a), sJ (b)), ce qui prouve bien que f est surjective.
On a donc A/I ∩ J ∼ = A/I × A/J et il reste à voir que IJ = I ∩ J. On a toujours IJ ⊂ I ∩ J; soit donc
a ∈ I ∩ J, on peut écrire a = ai + aj mais a ∈ J donc ai ∈ IJ et a ∈ I donc aj ∈ IJ donc a ∈ IJ.

Remarque. Si a, b ∈ Z sont premiers entre eux, on remarque que aZ + bZ = Z et la proposition précédente

est bien une généralisation du “lemme chinois” classique.
Terminons ce paragraphe en donnant deux constructions importantes d’anneaux.
(i) Si A est un anneau, on définit l’anneau des polynômes (à une variable) comme l’anneau des suites P =
(an )n∈N presque nulles (i.e. telles que an = 0 pour n assez grand) muni de l’addition et multiplication
définies par
n
X
(an )n∈N + (bn )n∈N = (an + bn )n∈N et (an )n∈N (bn )n∈N = (cn )n∈N avec cn = ak bn−k
k=0

On vérifie directement qu’on a bien défini un anneau. Posons X := (0, 1A , 0, . . . , 0, . . .), on montre
aisément par récurrence que X i est la suite dont le seul terme non nul est situé au cran i et vaut 1A et
on récupère ainsi la notation usuelle P = (an )n∈N = a0 +a1 X +. . .+ad X d . On note classiquement A[X]
l’anneau des polynômes à coefficients dans A. On peut définir le degré d’un polynôme par la formule

deg(P ) = max{d ∈ N |ad 6= 0}

avec la convention que deg(0) = −∞ (ou n’est pas défini). On a immédiatement les deux formules:
deg(P + Q) ≤ max{deg(P ), deg(Q)} et deg(P Q) ≤ deg(P ) + deg(Q) avec égalité dans la deuxième
formule dès que l’anneau A est intègre (ou plus généralement si le coefficient dominant de P n’est pas un
diviseur de zéro). Il n’y a pas de difficulté (sauf peut-être l’empilement de notations) à généraliser cette
construction aux polynômes en n variables ou même à une infinité de variables. L’ensemble A[Xi | i ∈ I]
est défini comme les “suites” presque nulles d’éléments de A indexées par N(I) = {(ni )i∈I ∈ NI | ni =
0 pour presque tout i} et l’addition et la multiplication de manière analogue. On montre aisément qu’on
a des isomorphismes canoniques comme (A[X])[Y ] = (A[Y ])[X] = A[X, Y ], c’est-à-dire que l’on peut
voir un polynôme en X, Y à coefficients dans A comme un polynôme en X (resp. en Y ) à coefficients
dans A[Y ] (resp. dans A[X]).
(ii) Si S est une partie multiplicative de A (i.e. 1 ∈ S et S est stable par multiplication) on définit l’anneau
des fractions S −1 A ainsi : on définit une relation d’équivalence sur A × S par

(a, s)R(a0 , s0 ) ⇔ ∃s00 ∈ S, s00 (as0 − a0 s) = 0.

32
On note [(a, s)] ∈ A × S/R la classe d’un couple (a, s) ∈ A × S. On définit deux lois sur l’ensemble
S −1 A := A × S/R par

[(a, s)] + [(a0 , s0 )] = [(as0 + a0 s, ss0 )] et [(a, s)] · [(a0 , s0 )] = [(aa0 , ss0 )]

Remarquons que l’introduction de s00 dans la définition de R est inutile si l’anneau A est intègre (et
0∈/ S) mais est nécessaire en général pour que R soit transitive. Par ailleurs, on dispose d’une application
naturelle i : A → S −1 A donnée par a 7→ [(a, 1A )], c’est un homomorphisme d’anneaux qui permet
d’établir une bijection entre d’une part les idéaux propres de S −1 et d’autre part les idéaux de A ne
rencontrant pas S (un sens de la bijection est donnée par J 7→ i−1 (J)).
Une application classique de cette construction est la construction du corps des fractions d’un anneau intègre
(i.e sans diviseur de zéro). En effet, si A est intègre, on peut choisir S = A \ {0} comme partie multiplicative
et on constate alors que l’anneau S −1 A est un corps et que i : A → S −1 A est injective. En effet [(a, 1A )] =
[(0A , s)] équivaut à sa = 0A et donc a = 0A ; par ailleurs si a ∈ A et b ∈ A \ {0}, alors l’élément [(b, a)] est
inverse de [(a, b)]. Cette construction est l’analogue de la construction de Q à partir de Z. On note souvent
Frac(A) le corps ainsi construit. Comme autre exemple citons K(X1 , . . . , Xn ) = Frac (K[X1 , . . . , Xn ]) le
corps des fractions rationnelles en n indéterminées.
L’exemple suivant est important en algèbre commutative. On prend pour S le complémentaire d’un idéal
premier P , i.e. S := A \ P (la définition d’un idéal premier dit précisément que S est multiplicative).
L’anneau S −1 A se note alors AP et jouit une propriété remarquable : il possède un unique idéal maximal,
l’idéal formé des éléments [(a, s)] avec a ∈ P (et s ∈ S); on dit que AP est un anneau local.
Exercice. (Fonction polynôme) Soit P ∈ A[X1 , . . . , Xn ], on lui associe une fonction fP : An → A définie
par fP (x) = P (x). L’application P 7→ fP est un homomorphisme d’anneaux. Montrer sur un exemple
que cette application n’est pas nécessairement injective. Si A est intègre et infini, montrer que l’application
P 7→ fP est injective (indication : si n = 1 montrer qu’un polynôme non nul n’a qu’un nombre fini de racine
et procéder par induction sur le nombre de variables). Si A = Z/pZ et n = 1, montrer que le noyau est
engendré par X p − X.

B.2. Divisibilité et idéaux.

On dit que a divise b dans l’anneau A s’il existe c ∈ A tel que b = ac; il revient au même de dire que b
est un multiple de a ou encore que b ∈ aA ou encore que bA ⊂ aA. Le fait qu’une relation de divisibilité
corresponde à une inclusion d’idéaux (principaux) est fondamental dans la suite. Si l’on se place dans un
anneau intègre on voit facilement que

a divise b et b divise a ⇔ aA = bA ⇔ ∃u ∈ A∗ , b = au.

En effet (⇐) est trivial et, si b = ca et a = c0 b alors b = (cc0 )b ou encore b(1 − cc0 ) = 0 mais on peut supposer
b 6= 0 (sinon on a b = a = 0 et l’énoncé est banal) et donc, comme A est intègre cc0 = 1, ce qui signifie bien
que c, c0 ∈ A∗ . On dira que a et b sont associés si b = ua avec u ∈ A∗ ; cette relation est visiblement une
relation d’équivalence.
Un élément a ∈ A est irréductible s’il est non nul, non inversible et vérifie la propriété suivante : si a = bc
alors b ou c est inversible. On a vu qu’un élément a est premier si l’idéal aA est premier, ou encore si
on a l’implication a divise bc entraı̂ne a divise b ou c. Il est clair qu’un élément premier est irréductible
(prouvez-le!) mais la réciproque est fausse en général.
On a vu au paragraphe précédent la définition d’un idéal premier; un idéal I ⊂ A est maximal si I 6= A et
I ⊂ J ⊂ A entraı̂ne J = I ou J = A.
Proposition. Un idéal I est premier si et seulement si A/I est intègre. Un idéal est maximal si et seulement
si A/I est un corps.
Preuve. L’anneau A/I est intègre si et seulement si le produit de deux classes ā et b̄ est nul (i.e. ab ∈ I)
dans le seul cas où ā = 0 (i.e. a ∈ I) ou b̄ = 0 (i.e. b ∈ I), ce qui signifie bien que I est premier. Si A/I

33
est un corps, ses seuls idéaux sont {0} et A/I donc les seuls idéaux de A contenant I sont I et A, ce qui
montre bien que I est maximal. Si I est maximal, soit ā ∈ A/I \ {0}, alors a ∈ / I donc I 6= I + aA ⊂ A donc
A = I + aA et il existe b ∈ A et i ∈ I tels que 1 = i + ab donc āb̄ = 1 ∈ A/I. Ainsi A/I est bien un corps.

Par analogie avec les propriétés déjà connues de l’anneau Z on définit les propriétés suivantes pour un anneau
commutatif intègre A.
Définition. Un anneau A est euclidien s’il existe une application φ : A \ {0} → N telle que pour tout a ∈ A,
b ∈ A \ {0}, il existe q, r ∈ A tels que a = bq + r et ou bien r = 0 ou bien φ(r) < φ(b).
Définition. Un anneau A est principal si tout idéal de A est principal i.e. de la forme aA.
Définition. Un anneau A est noethérien si tout idéal est engendré par un nombre fini d’éléments.
Remarque. Cette propriété est équivalente à la propriété souvent donnée comme définition qui dit qu’une
suite croissante d’idéaux de A doit être stationnaire. En effet si I1 ⊂ . . . ⊂ In ⊂ In+1 ⊂ . . . est une suite
croissante d’idéaux de A noethérien, considérons I = ∪n≥1 In , c’est un idéal engendré par disons a1 , . . . , ar
mais il existe n0 tel que a1 , . . . , ar ∈ In0 donc pour tout n ≥ n0 , on a In = In0 . Inversement si toute suite
croissante d’idéaux de A est stationnaire et si I est un idéal de A, effectuons la construction suivante. Soit
a1 ∈ I et I1 = a1 A, si I = I1 alors I est de type fini, sinon soit a2 ∈ I \ I1 . Posons alors I2 = a1 A + a2 A, ou
bien I = I2 ou bien il existe a3 ∈ I \ I2 etc. La construction doit d’arrêter au bout d’un nombre fini d’étapes
car I1 ⊂ I2 . . . est stationnaire.
Définition. Un anneau A est factoriel si tout élément non nul et non inversible peut s’écrire comme produit
(fini) d’éléments irréductibles et d’une unité et que cette décomposition est unique au sens suivant : si
a = upm mr
1 . . . pr
1
= u0 q1n1 . . . qsns avec u, u0 ∈ A∗ et les pi (resp. les qj ) sont irréductibles non associés deux
à deux et mi , nj ≥ 1 alors r = s et il existe une permutation σ ∈ Sr telle que pi est associé avec qσ(i) et
mi = nσ(i) .
On peut écrire cette définition de manière un peu plus concrète en introduisant P un ensemble de repré-
sentants des éléments irréductibles modulo la relation d’équivalence “être associé”. L’anneau A est alors
factoriel si pour tout élément non nul, il existe une unité u ∈ A∗ et une unique suite presque nulle d’entier
positifs (mp (a))p∈P telles que
Y
a=u pmp (a) .
p∈P

En général on n’a pas de manière simple de choisir les éléments de P toutefois dans le cas de Z on choisit
bien sûr l’élément irréductible positif et dans le cas de K[X] on choisit le polynôme irréductible unitaire.
Définition. Un anneau A est intégralement clos si pour tout élément x ∈ Frac(A) le fait d’être racine d’une
équation du type xd + ad−1 xd−1 + . . . + a0 = 0 avec ai ∈ A entraı̂ne x ∈ A.
Nous allons étudier les propriétés des anneaux de ce type et en particulier prouver les implications suivantes.

Euclidien =⇒ Principal =⇒ Factoriel =⇒ Intégralement clos

⇓
Noethérien

La notion de divisibilité introduit une notion d’ordre (partiel) sur les idéaux d’un anneau A; il est naturel
d’examiner l’existence de majorant, borne supérieure, etc. au sens de cette relation d’ordre. Cette notion
est traditionnellement formulée en termes des éléments, bien que, pour être précis il faudrait considérer les
classes d’équivalence d’éléments associés.
Définition. Un élément d ∈ A est un PGCD de a et b s’il vérifie les deux propriétés suivantes:
(i) L’élément d divise a et b,
(ii) Si un élément d0 divise a et b, alors d0 divise d.
Un élément m ∈ A est un PPCM de a et b s’il vérifie les deux propriétés suivantes:
(i) L’élément m est un multiple de a et b,
(ii) Si un élément m0 est un multiple de a et b, alors m0 est un multiple de m.

34
Il est clair qu’un PGCD (resp. un PPCM), s’il existe est unique à un élément inversible près, i.e. l’idéal
engendré est unique. Les premières propriétés du PGCD et PPCM, quand ils existent sont les suivantes.
Lemme. Soit A un anneau dans lequel P GCD et P P CM existent, soient a1 , . . . , am , a, b, c ∈ A, alors
(i) PGCD(aa1 , . . . , aam ) = a PGCD(a1 , . . . , am ),
(ii) PGCD(a + bc, b) = PGCD(a, b),
(iii) PPCM(aa1 , . . . , aam ) = a PPCM(a1 , . . . , am ).
Preuve. Laissée en exercice.

On peut traduire ces définitions en terme d’idéaux. En effet a divise b si et seulement si bA ⊂ aA; ainsi d
est un diviseur de a et b si et seulement si a, b ∈ dA ou encore si et seulement si aA + bA ⊂ dA, et m est un
multiple de a et b si et seulement si m ∈ aA ∩ bA ou encore si et seulement si mA ⊂ aA ∩ bA. On a ainsi
prouvé :
Proposition. Un PGCD de a et b existe dans A si et seulement si il existe un plus petit idéal principal
contenant aA + bA et dans ce cas PGCD(a, b)A est cet idéal. Un PPCM de a et b existe dans A si et
seulement si il existe un plus grand idéal principal contenu dans aA ∩ bA et dans ce cas PPCM(a, b)A est
cet idéal.
Cette proposition rend transparent le prochain théorème.
Théorème. Soit A un anneau principal, alors le PGCD et PPCM existent toujours et vérifient
(i) PGCD(a, b)A = aA + bA.
(ii) P P CM (a, b) = aA ∩ bA.
De plus PGCD(a, b) PPCM(a, b)A = abA et la propriété de Bézout est vérifiée : si d est un PGCD de a et b
alors
∃u, v ∈ A, au + bv = d.

Preuve. Le seul point qui reste à prouver est que ab et dm sont associés (où d est un PGCD et m un PPCM).
Ecrivons a = da0 et b = db0 alors a0 et b0 sont premiers entre eux et il existe u, v tels que a0 u + b0 v = 1.
L’élément da0 b0 est un multiple de a et b; inversement si m0 = ac = bc0 est un multiple de a et b alors
m0 = m0 (a0 u + b0 v) = bc0 a0 u + acb0 v = da0 b0 (c0 u + cv) est un multiple de da0 b0 ce qui prouve que ce dernier
est un PPCM de a et b.

Lemme. Soit A un anneau principal et a irréductible. Si a divise bc alors a divise b ou c. Si a et b sont

premiers entre eux et a divise bc alors a divise c.
Remarque. Le premier énoncé s’appelle le lemme d’Euclide, le second le lemme de Gauss. Le lemme d’Euclide
dit qu’un élément irréductible est premier (dans un anneau principal).
Preuve. Si a irréductible divise bc et ne divise pas b, considérons d = PGCD(a, b). Comme a est irréductible,
on a d = 1 ou d = a (à un élément inversible près) donc d = 1 donc il existe u, v tels que 1 = au + bv donc
c = auc + bcv est bien divisible par a. Si a et b sont premiers entre eux, alors il existe u, v tels que 1 = au + bv
et de même c = auc + bcv est bien divisible par a.

Théorème. Un anneau principal est noethérien et factoriel.

Preuve. Tout idéal est de type fini (même engendré par un élément) donc A est noethérien. Montrons
maintenant l’existence d’une décomposition en éléments irréductibles dans un anneau noethérien. Supposons
qu’il existe a ∈ A sans décomposition en produit d’éléments irréductibles; comme toute suite croissante
d’idéaux est finie, on peut supposer que l’idéal aA est maximal parmi les bA avec b sans décomposition en
/ A∗ .
produit d’éléments irréductibles. L’élément a n’est pas irréductible donc il s’écrit a = bc avec b, c ∈
Ainsi aA ⊂ bA et aA ⊂ cA (inclusion sans égalité) donc b et c admettent une décomposition en produit
d’éléments irréductibles et par conséquent a = bc également. La démonstration du théorème est achevée par
la preuve du lemme suivant.
Lemme. Soit A un anneau tel que tout élément non inversible, non nul, puisse s’écrire comme produit
d’irréductibles. Supposons que tout élément irréductible soit premier dans A alors A est factoriel.

35
Preuve (du lemme). L’existence d’une Qrdécomposition Qs en nirréductibles étant acquise, il s’agit d’en prouver
l’unicité. Supposons donc que a = u i=1 pm i
i
= v q
j=1 j
j
avec p i irréductibles non associés deux à deux,
mi ≥ 1 (idem pour qj et nj ) et u, v ∈ A∗ . Raisonnons par récurrence sur la longueur d’une décomposition
de a. Si a admet une décomposition de longueur 1, i.e. a irréductible, alors p1 divise a donc a et p1 sont
(m −1) Qr mi
associés et a = u0 p1 avec u0 ∈ A∗ donc p1 1 i=2 pi = u0 , ce qui n’est possible que si r = 1 et m1 = 1.
En général, p1 divise a donc l’un des qj ; quitte à les renuméroter, Qron peut supposer que p1 divise q1 donc
1 −1 n1 −1 Qs nj
q1 = wp1 avec w ∈ A∗ . En divisant par p1 on obtient upm 1 i=2 ip mi
= vwq 1 j=2 qj et on peut
appliquer l’hypothèse de récurrence pour conclure.
Remarques. On peut observer que si a est irréductible dans A principal alors A/aA est un corps; en effet
l’idéal aA est maximal car si aA ⊂ I ⊂ A alors I = bA et donc b divise a donc est soit inversible (auquel cas
I = bA = A) soit associé à a (auquel cas I = bA = aA). Cette propriété n’est plus vraie en général dans les
anneaux factoriels. Par exemple dans K[X, Y ] qui est factoriel (voir plus loin) l’élément X est irréductible
(et premier) mais K[X, Y ]/XK[X, Y ] ∼ = K[Y ] n’est pas un corps; de même le théorème de Bézout n’est plus
vérifié dans cet anneau. Cependant un grand nombre des propriétés des anneaux principaux sont préservées
dans le cadre des anneaux factoriels, en particulier:
Proposition. Dans un anneau factoriel A, le PGCD et PPCM existe toujours et le produit ab est associé au
produit PGCD(a, b) PPCM(a, b)A. Un élément irréductible est premier et les lemmes d’Euclide et de Gauss
restent vrais.
Preuve. Ecrivons chaque élément a ∈ A sous la forme a = u p∈P pmp (a) , où u ∈ A∗ et P désigne un
Q
ensemble de représentants des éléments irréductibles modulo les éléments inversibles. Il est alors clair que
Y Y
PGCD(a, b) = pmin{mp (a),mp (b)} et PPCM(a, b) = pmax{mp (a),mp (b)} .
p∈P p∈P

De plus ces formules montrent que le produit du PGCD par le PPCM est associé à ab. Si p irréductible
divise ab, on a ab = pc et en écrivant la décomposition en éléments irréductibles de a, b et c et en utilisant
l’unicité, on voit que (un élément associé à) p apparaı̂t dans la décomposition de ab donc dans celle de a ou
b. Le même raisonnement permet de vérifier le lemme de Gauss.

Proposition. Un anneau factoriel est intégralement clos.

Preuve. Soit x ∈ Frac(A) racine d’un polynôme unitaire P (X) = X d + ad−1 X d−1 + . . . + a0 ∈ A[X]. On
peut écrire x = a/b avec a, b ∈ A, de plus, quitte à diviser a et b par leur PGCD, on peut supposer que a
et b sont premiers entre eux. Mais alors l’équation P (x) = 0 s’écrit aussi ad + ad−1 bad−1 + . . . + a0 bd = 0
ce qui entraı̂ne b divise ad . Comme ad et b sont premiers entre eux, on conclut que b est inversible, ce qui
signifie bien que x ∈ A.

Venons-en a des exemples concrets d’anneaux non factoriels que nous choisirons √ d’abord dans
√ le cadre de
l’arithmétique. Tout d’abord notons que les anneaux du type A1 = Z 5 ou A2 = Z i 3 ne sont pas
√ √
intégralement clos car (1 + 5)/2 ∈ / A1 (bien qu’étant racine de X 2 − X − 1 = 0) et (1 + i 3)/2 ∈ /A√2 (bien

qu’étant racine de X 2 − X + 1 = 0) donc A1 et A2 ne sont pas factoriels. Cependant l’anneau Z i 5 est
intégralement clos (voir ci-dessous) mais n’est pas factoriel, en effet
√ √
6 = 2 · 3 = (1 + i 5)(1 − i 5)
√ √
or chacun des éléments 2, 3, 1 + i 5, 1 − i √5 est irréductible.
√ Pour voir cela regardons leurs modules au carré
que nous appellerons norme; si 2 = (a+bi 5)(a0 +b0 i 5) alors 4 = (a2 +5b2 )(a02√+5b02 ) mais a2 +5b√2 = 2 est
impossible donc on doit avoir a2 + 5b2 = 1 ou a02 + 5b02 = 1 e qui entraı̂ne a + bi 5 = ±1 ou a0 + b0 i 5 = ±1.
On remarquera que ces éléments sont irréductibles mais ne sont pas premiers.
Il est donc intéressant de regarder les anneaux les plus “complets” possible. Nous ne donnerons pas de
définition générale mais observerons simplement que si d ∈ Z \ {0, 1} est sans facteurs carrés, et si nous
introduisons
√ √
Ad := {α = x + y d ∈ Q( d) | α est racine d’une équation aα2 + bα + c = 0 avec a, b, a ∈ Z}

36
alors Ad est forcément intégralement clos si c’est bienun anneau. On peut montrer que c’est bien le cas et
√ √
que Ad = Z[ω] = {a + bω | a, b ∈ Z} où ω = 1 + d /2 si d ≡ 1 mod 4 et ω = d sinon. Pour étudier ces
anneaux les propriétés suivantes (laissées en exercice) seront utiles:
√
Lemme. La norme est multiplicative : N (αβ) = N (α)N (β). Les unités de Z[i d] (ou Z[ω]) sont les
éléments de norme 1. Enfin pour α 6= 0 on a N (α) = card(Z[ω]/αZ[ω].
Exercice. Soit K un corps de nombres, c’est-à-dire un sous-corps de C qui est de dimension finie sur Q
(comme espace vectoriel). Si α ∈ K alors la multiplication par α définit un endomorphisme Q-linéaire
de K, on définit N (α) comme le déterminant de cet endomorphisme (resp. T r(α) comme la trace de
l’endomorphisme). Montrer√que N (αβ) = N (α)N (β) et que N coı̈ncide avec la norme précédemment
définie. Montrer que α ∈ Q( d) est racine d’une équation X 2 + aX + b = 0 avec a, b ∈ Z si et seulement si
N (α) et T r(α) sont entiers.
√ √
Théorème. Soit d ≥ 1, sans facteur carré et ω = 1 + i d /2 si d ≡ 3 mod 4 et ω = i d sinon. L’anneau
Z[ω] est eucliden si et seulement si d ∈ {1, 2, 3, 7, 11}.
Preuve. Pour prouver
√ que les anneaux
√ cités sont euclidiens, on prouve qu’ils sont euclidiens pour la norme
définie sur Q(i d) par N (u + vi d) = u2 + dv 2 . Pour cela on établit le lemme suivant où l’on suppose que
d ∈ {1, 2, 3, 7, 11}.
√ √ √
Lemme. Soit u + vi d ∈ Q(i d), il existe α ∈ Z[ω] tel que N (u + vi d − α) < 1.
Preuve (du lemme). On utilise qu’un rationnel x (ou même un réel) possède un entier m (resp. un demi-entier
√
m/2) tel que |x − m| ≤ 1/2 (resp. |x − m/2| ≤ 1/4). Donc, pour m, n ∈ Z bien choisis, N (u + vi d − (m +
√ √ √
ni d)) = (u − m)2 + d(v − n)2 ≤ (d + 1)/4 < 1 si d = 1 ou 2 et par ailleurs N (u + vi d − (m + n 1+i2 d )) =
(u − m − n/2)2 + d(v − n/2)2 ≤ 1/4 + d/16 < 1 si d = 3, 7 ou 11.
On en déduit aisément que ces anneaux sont euclidiens : si z, z 0 ∈ Z[ω] \ {0} et si α ∈ Z[ω] est tel
que N (zz 0−1 − α) < 1 alors N (z − αz 0 ) < N (z 0 ) donc en posant r = z − αz 0 on obtient bien une division
euclidienne. Inversement, si Z[ω] est euclidien, choisissons α ∈ Z[ω] non inversible et tel que N (α) soit
minimale. La division par α donne toujours un reste nul ou inversible et on a donc

N (α) = card(Z[ω]/αZ[ω]) ≤ card (Z[ω]∗ ∪ {0})

mais on voit aisément que (sauf pour d = 1 et 3) Z[ω]∗ = {±1} donc N (α) ≤ 2, 3. Mais l’équation a2 +db2 = 2
ou 3 (avec a, b ∈ Z) n’a pas de solution pour d > 3 et l’équation (a + b/2)2 + d4 b2 = a2 + ab + d+1 2
4 b = 2 ou
3 (avec a, b ∈ Z) n’a pas de solution pour d > 12 d’où le résultat.

Citons sans démonstration le théorème suivant (dont la preuve dépasse le niveau de ce cours) :
√ √
Théorème. Soit d ≥ 1, sans facteur carré et ω = 1 + i d /2 si d ≡ 3 mod 4 et ω = i d sinon. L’anneau
Z[ω] est principal si et seulement si d ∈ {1, 2, 3, 7, 11, 19, 43, 67, 163}.
Il est très difficile de démontrer que ce sont les seuls anneaux principaux; démontrer que ces anneaux sont
principaux est plus élémentaire. Nous le ferons pour le premier non euclidien.
h √ i
Proposition. L’anneau Z 1+i2 19 est principal et non euclidien.
h √ i
Preuve. Notons A = Z 1+i2 19 . Commençons par montrer que 2A est un idéal maximal dans A. Le
√
polynôme minimal de ω = 1+i2 19 est P = X 2 − X + 5 donc A = ∼ Z[X]/P Z[X] (considérer l’évaluation
Z[X] → A donnée par Q 7→ Q(ω)) et A/2A ∼ = Z/2Z[X]/P̄ Z/2Z[X]. Le polynôme P̄ ∈ Z/2Z[X] est
irréductible (car de degré 2 et sans racine dans Z/2Z) donc A/2A est un corps et 2A est maximal. Ensuite
montrons que l’on peut toujours √effectuer une √ division euclidienne (au sens de la norme) soit de a par
b, soit de 2a par b. Soit x + iy 19 ∈ Q(i 19), il suffit de voir qu’il existe m, n ∈ Z tels que N1 =
√ √
1+i 19
√ √
1+i 19
N (x + iy 19 − m − n 2 ) < 1 ou N2 = N (2(x + iy 19) − m − n 2 ) < 1. Or ou bien il existe n ∈ Z

37
tel que |y − n/2| ≤ 1/6 et alors on peut choisir m ∈ Z tel que N1 ≤ (1/4) + (19/36) < 1 ou bien il existe
n ∈ Z tel que (n/2) + 1/6 < y < (n + 1)/2 − 1/6 et alors |2y − (n + 1/2)| ≤ 1/6 et alors on peut choisir
m ∈ Z tel que N2 ≤ (1/4) + (19/36) < 1. Soit maintenant I un idéal non nul de A et b un élément non
nul de I de norme minimale, nous allons montrer que I = bA. On a clairement bA ⊂ I. Inversement soit
a ∈ I, si l’on peut effectuer la division euclidienne a = bq + r alors r ∈ I et N (r) < N (b) entraı̂ne r = 0
et a = bq ∈ bA; on peut donc supposer 2a = bq + r et donc, pour la même raison 2a = bq. Comme 2 est
premier, ou bien 2 divise q et alors a ∈ bA, ou bien 2 ne divise pas q et donc 2 divise b, i.e. b = 2b0 . Mais
alors comme 2A est maximal et q ∈ / 2A on a 2A + qA = A ou encore il existe u, v ∈ A tels que 2u + qv = 1.
On en tire b0 = 2ub0 + qvb0 = ub + va ∈ I, mais N (b0 ) = N (b)/4 < N (b) ce qui contredit l’hypothèse que
N (b) est minimale et achève la démonstration.
√
Exercice. Soit d > 1 Montrer que l’anneau Z[ω] = {a + bω | a, b ∈ Z} où ω = 1 + d /2 si d ≡ 1 mod 4
√
et ω = d sinon, est euclidien, donc principal pour les valeurs d ∈ {2, 3, 5, 6, 7, 11, 13, 14}. Montrer que
l’anneau Z[ω] n’est pas factoriel pour d = 10 ou 15.
On ignore si il existe une infinité de valeur d > 1 sans facteur carré tels que Z[ω] soit principal (on sait que,
pour ces anneaux, principal équivaut à factoriel).
Un autre exemple classique d’anneau principal est l’anneau des polynômes à une variable et à coefficients
dans un corps. En fait cet anneau est euclidien, ce qui est un corollaire de l’énoncé classique suivant.
Proposition. (division euclidienne de polynômes) Soit A un anneau et soient P, B deux polynômes de A[X]
tels que le coefficient dominant de B soit inversible dans A, alors il existe Q, R ∈ A[X] tels que
(i) P = QB + R
(ii) deg(R) < deg(B).
Preuve. Ecrivons B = bd X d +. . .+b0 avec bd ∈ A∗ donc b−1 n
d ∈ A, et notons P = an X +. . .+a0 . Raisonnons
par récurrence sur le degré n de P . Si n < d alors on peut choisir Q = 0 et R = P . Si n ≥ d considérons
P1 := P − an b−1d X
n−d
B, on a clairement deg(P1 ) < deg(P ) donc, par hypothèse de récurrence, il existe
Q1 , R1 tels que P1 = Q1 B + R1 et deg(R1 ) < deg(B). On constate alors que Q = Q1 + an b−1 d X
n−d
et
R = R1 conviennent.

Remarque. La démonstration fournit un algorithme qui est d’ailleurs l’algorithme usuel de calcul de la
division de polynômes.
En particulier si A est un corps, la seule condition pour avoir une division euclidienne est que B soit non nul
et l’anneau A[X] est donc euclidien et principal. On peut aisément voir que A[X] est principal seulement
lorsque A est un corps. Si A n’est pas intègre, alors A[X] non plus et n’est donc pas principal. Si maintenant
A est intègre mais n’est pas un corps, il existe un élément a non nul et non inversible, montrons alors que
l’idéal engendré par a et X dans A[X] n’est pas principal. Si P était un générateur, on aurait X = P Q et
a = P Q0 donc P devrait être une constante inversible et donc A[X] = aA[X] + XA[X]. Mais une égalité
1 = aS + XR est impossible car, en regardant les coefficients constants, on en déduirait que a est inversible.
Application. L’idéal des polynômes de K[X1 , . . . , Xn ] nuls en x = (x1 , . . . , xn ) ∈ K n est engendré par
X1 − x1 , . . . , Xn − xn . En effet le résultat est connu pour n = 1 et on peut procéder par récurrence : si
P (x) = 0, on effectue la division de P par Xn − xn dans l’anneau A[Xn ] = K[X1 , . . . , Xn−1 ][Xn ], soit
P = (Xn − xn )Q + R avec R ∈ K[X1 , . . . , Xn−1 ]. On constate que R(x1 , . . . , xn−1 ) = 0 donc, d’après
l’hypothèse de récurrence, R est dans l’idéal engendré par X1 − x1 , . . . , Xn−1 − xn−1 .

B.3. Anneaux de polynômes.

L’objet de ce paragraphe est d’étudier les propriétés de l’anneau des polynômes à plusieurs variables et de
voir quelles propriétés des anneaux principaux sont conservées.
Théorème. Soit A un anneau noethérien, alors A[X1 , . . . , Xn ] est encore noethérien.

38
Preuve. Il suffit bien sûr de prouver que A[X] est noethérien. Soit I un idéal de A[X], nous allons chercher
un ensemble fini de générateurs. Introduisons les ensembles

In := {a ∈ A | ∃P ∈ I, P = aX n + termes de degré < n},

on voit facilement que ce sont des idéaux de A et que In ⊂ In+1 . Comme A est noethérien, il existe n0 tel
(n) (n)
que, pour n ≥ n0 on ait In = In0 et, par ailleurs, il existe un nombre fini d’éléments a1 , . . . , amn ∈ In
qui engendrent In . Pour simplifier les notations, on peut supposer que mn = m pour n ≤ n0 . Considérons
(n) (n) (n)
également, pour n ≤ n0 des polynômes Pj = aj X n + . . . ∈ I et montrons que l’ensemble fini {Pj | n ≤
n0 , j ≤ m} engendre l’idéal I. Notons J l’idéal engendré par ces polynômes, on a J ⊂ I. Considérons donc
P ∈ I et raisonnons par récurrence sur d = deg(P ). Si d ≤ n0 alors P = aX d + . . . et a ∈ Id et donc il
(d) (d) (d) (d)
existe bj ∈ A tels que a = b1 a1 + . . . + bm am . Le polynôme P 0 := P − (b1 P1 + . . . + bm Pm ) est donc
0
dans I et a un degré < d, on peut donc supposer par récurrence qu’on sait déjà que P est dans J et donc
(d) (d)
P = P 0 + b1 P1 + . . . + bm Pm est également dans J. Si maintenant d > n0 , on sait que a ∈ In0 , on écrit
(n ) (n ) (n ) (n )
a = b1 a1 0 + . . . + bm am 0 et on raisonne de même avec P 0 := P − X d−n0 (b1 P1 0 + . . . + bm Pm 0 ).

Lorsque A est factoriel (plus généralement si un PGCD existe toujours dans A) on peut introduire le contenu
d’un polynôme P ∈ A[X] qui est, par définition, un PGCD de ses coefficients :

si P = a0 + a1 X + . . . + ad X d , alors c(P ) := PGCD(a0 , . . . , ad )

Un polynôme P est dit primitif si c(P ) = 1. On peut toujours factoriser un polynôme comme P = c(P )P 0
avec P 0 polynôme primitif du même degré que P .
Lemme. (lemme de Gauss) Soit A un anneau factoriel, soient P , Q deux polynômes de A[X], alors c(P Q) =
c(P )c(Q).
Preuve. Ecrivons P = c(P )P 0 et Q = c(Q)Q0 avec P 0 , Q0 primitifs, alors P Q = c(P )c(Q)P 0 Q0 et donc
c(P Q) = c(P )c(Q)c(P 0 Q0 ) et on voit qu’il suffit de montrer que le produit de deux polynômes primitifs
est primitif. Soit donc P, Q primitifs et supposons c(P Q) 6= 1 alors il existe p irréductible dans A qui
divise c(P Q). Comme A est factoriel, p est premier et B = A/pA est intègre. Considérons l’application
A[X] → B[X] qui, à un polynôme P , associe le polynôme P̄ avec les coefficients réduits modulo pA; c’est un
homomorphisme d’anneaux. On constate que P̄ 6= 0 et Q̄ 6= 0 alors que P Q = 0 ce qui contredit le fait que
B[X] est intègre.

Lemme. Soit A un anneau factoriel, soit K := Frac(A), les éléments irréductibles de A[X] sont, d’une part,
les polynômes constants qui sont irréductibles dans A, d’autre part les polynômes de A[X] qui sont primitifs
et irréductibles dans K[X].
Preuve. Il est facile de vérifier que ces éléments sont irréductibles. En effet un polynôme constant ne peut
se factoriser qu’en produit de deux polynômes constants, donc un élément a est irréductible dans A si et
seulement si il est irréductible dans A[X]; si P est primitif et irréductible dans K[X] et si P = QR avec
Q, R ∈ A[X] alors Q ou R est inversible dans K[X] donc constant donc inversible sinon il ne serait pas
primitif. Inversement soit P un polynôme non constant. S’il n’est pas primitif, il n’est pas irréductible
puisqu’on peut le factoriser P = c(P )P 0 avec c(P ) et P 0 non inversibles. Si P est primitif et non irréductible
dans K[X], montrons qu’il n’est pas irréductible dans A[X]. En effet si P = QR avec Q, R ∈ K[X] et
deg(Q), deg(R) ≥ 1, on peut écrire Q = (a/b)Q0 et R = (c/d)R0 avec a, b, c, d ∈ A et Q0 , R0 ∈ A[X] primitifs.
On a donc bdP = acQ0 R0 donc bd et ac diffèrent d’un élément inversible, disons u, donc P = uQ0 R0 avec
u ∈ A∗ .

Théorème. Soit A un anneau factoriel, alors A[X1 , . . . , Xn ] est encore factoriel.

Remarque. L’énoncé reste vrai avec une infinité d’indéterminées indépendantes. En effet si I est un ensem-
ble quelconque indexant des indéterminées Xi indépendantes, l’anneau B := A [Xi | i ∈ I] est réunion des
anneaux BJ := A [Xi | i ∈ J] où J parcourt les sous-ensembles finis de I. Chacun des BJ est factoriel et

39
donc B aussi. On remarquera que, si I est infini, l’anneau B n’est pas noethérien, même si A est noethérien
ou même est un corps.
Preuve. Il suffit de prouver que si A est factoriel, alors A[X] est factoriel. Introduisons K := Frac(A) le
corps des fractions de A. Montrons d’abord l’existence d’une décomposition en éléments irréductibles. Tout
polynôme P ∈ A[X], se factorise sous la forme P = Qm 1 . . . Qr
1 mr
avec Qi irréductibles dans K[X]. Ecrivons
comme précédemment Qi = (ai /bi )Q0i avec ai , bi ∈ A et Q0i ∈ A[X] primitifs. On obtient bm mr
1 . . . br P =
1

mr 0m1
am
1
1
. . . ar Q 1 . . . Q 0mr
r et, en observant qu’il existe c ∈ A tel que a m1
1 . . . a mr
r = cbm1
1 . . . b mr
r on conclut que
P = cQ0m 1
1
. . . Q0mr
r . En écrivant c comme produit d’irréductibles de A on obtient la décomposition cherchée.
Montrons maintenant l’unicité de la décomposition en éléments irréductibles. Soit donc P se décomposant
en
P = a`11 . . . a`t t Qm
1 . . . Qr
1 mr
= bh1 1 . . . bhuu R1n1 . . . Rsns
avec ai , bj irréductibles dans A et Qi , Rj non constants et irréductibles dans A[X], donc primitifs et
irréductibles dans K[X]. En utilisant l’unicité de la décomposition dans K[X], on voit que r = s et que,
quitte à permuter les indices, Qi = λi Ri avec λi ∈ K ∗ et mi = ni . Mais si l’on écrit λi = αi /βi avec
αi , βi ∈ A on voit que βi Qi = αi Ri ∈ A[X] donc, comme Qi et Ri sont primitifs, βi et αi sont associés et
λ est une unité de A. On en déduit que Qi et Ri sont associés et que λa`11 . . . a`t t = bh1 1 . . . bhuu avec λ ∈ A∗ .
L’unicité de la décomposition dans A permet alors de conclure.

40
B.4. Ensembles algébriques et idéaux de K[X1 , . . . , Xn ]
On désigne par K un corps quelconque. A un moment donné on supposera K algébriquement clos i.e. que tout
polynôme non constant à coefficients dans K possède une racine dans K (par exemple C est algébriquement
clos). Le point de départ de la géométrie algébrique est l’étude des ensembles de zéros communs d’une famille
de polynômes.
Définition. Un sous-ensemble algébrique de K n est un ensemble du type

Z = {x ∈ K n | ∀P ∈ S, P (x) = 0}

où S est un sous-ensemble de K[X1 , . . . , Xn ].

Il convient de remarquer tout de suite que si I est l’idéal engendré par S dans K[X1 , . . . , Xn ] alors les zéros
communs des polynômes de S sont les mêmes que les zéros communs des polynômes de I ou encore que
les zéros communs de générateurs de I. On voit en particulier qu’un ensemble algébrique peut toujours
être défini par un nombre fini de polynômes (théorème de Hilbert). On peut donc associer à un idéal I un
ensemble algébrique que l’on notera V(I) = {x ∈ K n | ∀P ∈ I, P (x) = 0}.
Lemme. On a les propriétés suivantes
(i) Si I ⊂ J, alors V(I) ⊃ V(J)
(ii) V(I) ∪ V(J) = V(IJ)
P
(iii) ∩t∈T V(It ) = V t∈T It
(iv) V ({0}) = K n et V (K[X1 , . . . , Xn ]) = ∅.
La preuve est laissée en exercice.
Remarque. Les propriétés (ii), (iii) et (iv) peuvent être interprétées comme le fait que les sous-ensembles
algébriques sont les fermés d’une topologie qu’on appelle topologie de Zariski.
Inversement, on peut associer à tout sous-ensemble Z de K n un idéal I(Z) défini par :

I(Z) := {P ∈ K[X1 , . . . , Xn ] | ∀x ∈ Z, P (x)}.

On a alors les propriétés suivantes.

Lemme. Soient Z, Z 0 des sous-ensembles de K n , soient I, J des idéaux de K[X1 , . . . , Xn ].
(i) Si Z ⊂ Z 0 , alors I(Z) ⊃ I(Z 0 )
(ii) Z ⊂ V (I(Z)) avec égalité si et seulement si Z est un sous-ensemble algébrique.
(iii) I ⊂ I (V(I)).
Preuve. Le point (i) est facile. Si P ∈ I alors pour tout x ∈ V(I) on a P (x) = 0 donc P ∈ I(V(I)) et (iii)
est établi. Soit z ∈ Z alors pour tout P ∈ I(Z) on a P (x) = 0 donc z ∈ V(I(Z) et on a bien Z ⊂ V (I(Z)).
Supposons de plus que Z = V(I) alors I(Z) = I(V(I)) ⊃ I donc V(I(Z)) ⊂ V(I) = Z.

Remarque. Il y a deux raisons simples qui font qu’en général l’inclusion I ⊂ I (V(I)) n’est pas une égalité.
(a) Si le corps K n’est pas algébriquement clos, il existe P ∈ K[X], polynôme non constant et sans racine
dans K; considérons donc I = P K[X]. Par hypothèse V(I) = ∅ et donc I (V(I)) = K[X] 6= I.
(b) Même si K est algébriquement clos il y un obstacle dû au fait que “P = 0” et “P m = 0” définissent les
mêmes ensembles algébriques. Concrètement si P est un polynôme irréductible de K[X1 , . . . , Xn ] tel
que, si I1 = P K[X1 , . . . , Xn ], on a I (V(I1 )) = I1 , posons Im = P m K[X1 , . . . , Xn ]. On constate alors
que I (V(Im )) = I1 6= Im .
On peut remédier à l’obstacle (a) en remplaçant K par sa clôture algébrique. On peut remédier à l’obstacle
(b) en remplaçant I par son radical :
Définition. Le radical d’un idéal
√ I dans un anneau (commutatif) A est l’ensemble des éléments dont une
puissance est dans I; on le note I. En symbole :
√
I := {a ∈ A | ∃m ≥ 1, am ∈ I}.

41
√ √
Remarque. On a clairement,
p√ pour tout idéal I légalité V(I) = V( I) et les inclusions I ⊂ I ⊂ I (V(I)).
√ √
On a visiblement I = I; cela suggère de considérer les idéaux I réduits, i.e. tels que I = I. On va
montrer que, lorsque K est algébriquement clos, les correspondances I 7→ V(I) et Z 7→ I(Z) induisent deux
bijections réciproques l’une de l’autre entre idéaux réduits de K[X1 , . . . , Xn ] d’une part et sous-ensembles
algébriques de K n d’autre part. Le point clef est le célèbre résultat:
Théorème. (Nullstellensatz ou Théorème des zéros de Hilbert) Soit K un corps algébriquement clos.
Soient P1 , . . . , Pm , Q ∈ K[X1 , . . . , Xn ] tels que, pour tout x ∈ K n , on ait P1 (x) = . . . = Pm (x) = 0 implique
Q(x) = 0, alors il existe t ≥ 1 et A1 , . . . , Am ∈ K[X1 , . . . , Xn ] tels que

Qt = A1 P1 + . . . + Am Pm .

√
Ce résultat peut se traduire en le fait que, pour tout idéal I, on a I(V(I)) = I et en particulier, si I est
réduit, I(V(I)) = I.
Preuve. Nous allons donner la preuve pour K = C en indiquant ce qui resterait à démontrer dans le cas
général. Tout d’abord nous allons déduire le théorème du résultat apparemment plus faible.
Proposition. (Nullstellensatz “faible”) Soit K un corps algébriquement clos. Soient P1 , . . . , Pm des
polynômes de K[X1 , . . . , Xn ] sans zéros communs dans K n , alors il existe A1 , . . . , Am ∈ K[X1 , . . . , Xn ]
tels que
1 = A1 P1 + . . . + Am Pm .

Preuve (que la version “faible” entraı̂ne le théorème). On introduit pour la preuve une indéterminée
supplémentaire T et on observe que les polynômes P1 , . . . , Pm , 1 − T Q n’ont aucun zéro commun dans
K n+1 et donc il existe A1 , . . . , Am , B ∈ K[X1 , . . . , Xn , T ] tels que

1 = A1 (X, T )P1 (X) + . . . + Am (X, T )Pm (X) + B(X, T )(1 − T Q(X).

On note L := K(X1 , . . . , Xn ) le corps des fractions de K[X1 , . . . , Xn ] et on regarde l’identité précédente

comme une égalité de polynômes dans L[T ]. On peut “bien entendu” remplacer T par 1/Q ∈ L et conserver
l’égalité. Si t = maxi degT Ai (X, T ) on voit que Q(X)t Ai (X, 1/Q(X)) = A0i (X) ∈ K[X1 , . . . , Xn ] et on
obtient
Qt = A01 P1 + . . . + A0m Pm .

Montrons maintenant que la version “faible” se déduit de l’énoncé suivant

Proposition. Soit K un corps et L une K-algèbre de type fini (i.e. il existe x1 , . . . xn ∈ L tels que
L = K[x1 , . . . , xn ]) qui est également un corps, alors L est une extension algébrique finie de K. En particulier,
si K est algébriquement clos, L = K.
Preuve (que la proposition entraı̂ne le Nullstellensatz faible). Supposons donc qu’il existe I un idéal non
trivial tel que V(I) = ∅. Quitte à remplacer I par un idéal maximal le contenant, on peut supposer I
maximal. Mais alors L = K[X1 , . . . , Xn ]/I est un corps et est une K-algèbre de type fini donc d’après
la proposition c’est K. Ainsi on peut considérer les éléments xi := la classe de Xi modulo I comme des
éléments de K. Soit P ∈ I, on calcule P (x1 , . . . , xn ) = P (X̄1 , . . . , X̄n ) = P̄ = 0. Le point x = (x1 , . . . , xn )
est donc un zéro commun, ce qui contredit V(I) = ∅. Remarquons au passage que l’on a prouvé :
Corollaire. Soit K algébriquement clos, les idéaux maximaux de A = K[X1 , . . . , Xn ] sont les idéaux de la
forme
Ix = (X1 − x1 )A + . . . + (Xn − xn )A = {P ∈ K[X1 , . . . , Xn ] | P (x) = 0}.
En effet on a clairement K[X1 , . . . , Xn ]/Ix ∼
= K donc Ix est maximal et on a montré précédemment que tout
idéal non trivial était contenu dans un Ix .
Terminons par une preuve de la proposition dans le cas où K = C (ou plus généralement le cas où K n’est
pas dénombrable). Les monômes xi11 . . . xinn forme une partie génératrice dénombrable de L comme K-espace

42
vectoriel. Pour chaque xi , ou bien xi est algébrique sur K ou bien il est transcendant sur K. Mais, dans
le cas où l’un des xi serait transcendant, on aurait K[T ] ∼= K[xi ] ⊂ L donc K(T ) ∼ = K(xi ) ⊂ L (puisque L
est un corps). Or la théorie de la décomposition en éléments simples des fractions rationnelles nous apprend
que les fractions
1
|a∈K
T −a
sont K-linéairement indépendantes. Si card(K) > card(N) ceci entraı̂ne une contradiction et termine la
preuve.

Terminons par quelques remarques concernant la topologie de Zariski. Tout d’abord chaque sous-ensemble
algébrique de K n est muni d’une topologie induite par celle de Zariski. La correspondance entre idéaux et
sous-ensembles algébriques, plus le fait que K[X1 , . . . , Xn ] est noethérien entraı̂ne l’assertion suivante.
Proposition. Soit . . . ⊂ Zn+1 ⊂ Zn ⊂ . . . ⊂ Z1 ⊂ K n une suite décroissante de sous-ensemble algébriques,
alors cette suite est stationnaire.
Preuve. En effet Zi = V(I(Zi )) et I(Zn ) ⊂ I(Zn+1 ) donc la suite des I(Zn ) est stationnaire.

Remarquons que cette propriété peut s’interpréter comme une propriété de compacité (sans la propriété
d’être séparé) : d’une intersection vide de fermés, on peut extraire une intersection finie qui est encore vide.
Par ailleurs, si K est fini, la topologie de Zariski est la topologie discrète sur K n . On supposera donc K
infini pour la suite. On peut étudier les notions classiques (connexité, compacité, etc.); en fait la notion
suivante est plus naturelle dans ce contexte:
Définition. Un espace topologique Z est irréductible s’il n’est pas réunion de deux fermés non triviaux,
c’est-à-dire que Z = F1 ∪ F2 avec F1 , F2 fermés entraı̂ne F1 = Z ou F2 = Z.
Remarque. Il revient au même de demander que tous les ouverts non vides soient denses dans Z (considérer
Oi = Z \ Fi ). On voit donc qu’un espace irréductible n’est jamais séparé (sauf s’il est réduit à un point).
Exemple. Lorsque K est infini, l’espace K n , muni de la topologie de Zariski est irréductible. Il suffit, pour
vérifier cela, de montrer qu’un polynôme P ∈ K[X1 , . . . , Xn ] s’annulant sur le complémentaire des zéros
d’un polynôme Q non nul est en fait identiquement nul. Mais, dans ce cas, le polynôme P Q s’annule sur
K n tout entier et est donc nul (ici l’on utilise l’hypothèse K infini) donc, comme Q n’est pas nul, on en tire
bien P = 0.
Proposition. Un ensemble algébrique Z ⊂ K n est irréductible si et seulement si l’idéal I(Z) est premier.
Preuve. Supposons Z = Z1 ∪ Z2 avec Z1 6⊂ Z2 et Z2 6⊂ Z1 et posons Ii = I(Zi ) pour i = 1, 2. On a donc
I2 6⊂ I1 et I1 6⊂ I2 et on peut choisir P1 ∈ I1 \ I2 et P2 ∈ I2 \ I1 de sorte que P1 P2 s’annule sur Z donc
P1 P2 ∈ I(Z) mais P1 (resp. P2 ) ne s’annule pas sur tout Z2 (resp. sur tout Z1 ) et donc P1 ∈ / I(Z) (resp.
P2 ∈/ I(Z)), ce qui montre que I(Z) n’est pas premier. Supposons maintenant que I(Z) ne soit pas premier
et soit P1 , P2 ∈
/ I(Z) tels que P1 P2 ∈ I(Z). Posons Zi := {x ∈ Z | Pi (x) = 0} pour i = 1, 2. On a clairement
Zi fermé et Z = Z1 ∪ Z2 . Si on avait disons Z1 ⊂ Z2 alors P2 s’annulant sur Z2 s’annulerait sur Z et on
aurait P2 ∈ I(Z), ce qui est une contradiction.

Tous les ensembles algébriques ne sont pas irréductibles. Par exemple si Z ⊂ K 2 est défini par xy = 0 on
voit immédiatement que Z est réunion de deux fermés – les droites définies par x = 0 et y = 0 – qui sont
irréductibles. Ce phénomène est général.
Proposition. Soit Z un sous-ensemble algébrique de K n , alors Z est réunion finie de sous-ensembles
algébriques irréductibles Z = Z1 ∪ . . . ∪ Zm . Si de plus on impose que Zi 6⊂ Zj pour i 6= j, alors les Zi sont
uniques.
Preuve. Le fait que Z soit réunion finie de sous-ensembles irréductibles est immédiat à partir du caractère
noethérien : si ce n’était pas le cas on pourrait écrire une suite infinie strictement décroissante de sous-
ensembles algébriques. En effet si Z n’est pas irréductible Z = Z1 ∪ Z2 et si, disons, Z2 n’est pas irréductible
on continue la décomposition. Il est clair que l’on peut construire (en éliminant les composantes “inutiles”)

43
une décomposition Z = Z1 ∪. . .∪Zm avec Zi 6⊂ Zj pour i 6= j. Si Z = Y1 ∪. . .∪Yn est une autre décomposition
en irréductibles, Observons que Y1 = (Z1 ∩ Y1 ) ∪ . . . ∪ (Zm ∩ Y1 ) donc, comme Y1 est irréductible il existe i
tel que Zi ∪ Y1 = Y1 c’est-à-dire Y1 ⊂ Zi . Par symétrie Zi doit être contenu dans un des Yj donc dans Y1
(sinon on aurait Y1 ⊂ Yj ). On conclut que Y1 est égal à Zi .

Les sous-ensembles irréductibles de la proposition s’appelle les composantes irréductibles de Z.

44
C. CORPS.

C.1. Généralités et exemples.

On supposera ici les corps commutatifs. Pour les corps finis, cette hypothèse n’est pas nécessaire (voir
appendice à ce chapitre). Il existe des corps non commutatifs, le plus célèbre est le corps des quaternions, il
est étudié dans un chapitre spécial. Nous connaissons déjà un certain nombre de corps commutatif : Z/pZ,
Q, R, C, si K est un de ces corps K(X1 , . . . , Xn ) est encore un corps. Nous allons en construire d’autres.
Commençons par déterminer la caractéristique d’un corps K. L’homomorphisme iA : Z → K a une image
qui est un sous-anneau intègre de K donc Ker(iA ) est un idéal premier. Ainsi soit Ker(iA ) = {0} et iA
est injectif et car(K) = 0, soit il existe un nombre premier p tel que Ker(iA ) = pZ et alors car(K) = p.
Dans le premier cas K contient un sous-anneau isomorphe à Z donc contient un sous-corps isomorphe à Q,
dans le second cas K contient un sous-corps isomorphe à Z/pZ. En caractéristique p le phénomène le plus
remarquable est le suivant:
Lemme. Soit K un corps de caractéristique p, alors l’application φ : K → K définie par φ(x) = xp est un
homomorphisme de corps.
Preuve. On a toujours (xy)p = xp y p (puisque l’on ne considère que les corps commutatifs); il suffit donc
de prouver que, lorsque car(K) = p, on a (x + y)p = xp + y p . Ceci est en fait immédiat si l’on utilise la
formule du binôme de Newton et l’observation que les coefficients binomiaux Cpr sont divisibles par p pour
1 ≤ r ≤ p − 1.

Remarque. Le lemme ne dit pas que φ est un isomorphisme, et d’ailleurs il n’est pas en général surjectif
(prendre par exemple K = (Z/pZ)(X)); par contre φ est toujours injectif, comme le montre un lemme
ci-dessous, et définit donc un isomorphisme avec un sous-corps de K que l’on note souvent K p . Dans le cas
K = (Z/pZ)(X) on voit aisément que K p = (Z/pZ)(X p ) 6= (Z/pZ)(X).
Un autre phénomène spécifique à la caractéristique p est la possibilité pour un polynôme d’avoir une dérivée
identiquement nulle sans être constant. En effet si car(K) = p et si P ∈ K[X] est non constant, posons
Q(X) := P (X p ) alors Q0 (X) ≡ 0. On définit ici bien sûr formellement la dérivée de P = an X n + . . . + a0 par
P 0 = nan X n−1 + (n − 1)an−1 X n−2 + . . . + a1 . Montrons que la dérivée permet néanmoins de caractériser
les racines simples d’un polynôme même en caractéristique p.
Lemme. Soit K un corps, α ∈ K et P ∈ K[X]. Alors (X − α) divise P si et seulement si P (α) = 0; de plus
(X − α)2 divise P si et seulement si P (α) = P 0 (α) = 0.
Preuve. On écrit d’abord la division euclidienne P = (X − α)Q + R avec deg(R) < 1 donc R est constant
et P (α) = R d’où le premier énoncé. On écrit ensuite la division euclidienne P = (X − α)2 Q + R avec
deg(R) ≤ 1 donc R(X) = aX + b. On a donc P 0 (α) = R0 (α) = a donc P 0 (α) = 0 entraı̂ne a = 0 et alors
P (α) = b = 0.

Lemme. Soit f : K → L un homomorphisme de corps, alors f est injectif.

Preuve. Par définition f (1K ) = 1L et par conséquent, si x ∈ K \ {0} on en tire 1L = f (xx−1 ) = f (x)f (x−1 )
donc f (x) 6= 0.

Lorsque f : K → L est un homomorphisme de corps, on peut identifier K avec un sous-corps de L; on peut

aussi considérer L comme un K-espace vectoriel en introduisant l’application:

K ×L → L
(x, y) 7→ f (x)y

Dans ce contexte on notera [L : K] = dimK L la dimension de L vu comme K-espace vectoriel. La notation

est en bonne partie motivée par la propriété importante suivante.
Proposition. Soit K ⊂ L ⊂ F une tour de corps, alors [F : K] = [F : L][L : K].

45
Preuve. Nous donnons la preuve lorsque ces dimensions sont finies, en fait l’énoncé et même la preuve restent
valables avec des cardinaux quelconques. Considérons e1 , . . . , em une base de L sur K et f1 , . . . , fn une base
de F sur L, nous allons montrer que {ei fj | 0 ≤ i ≤ m, 0 ≤ j ≤ n} fournit une base de LP sur K. Montrons
n
d’abord que c’est une partie génératrice. Soit x ∈ F , alors il existe λi ∈ L tels Pm que x = i=1 λi fi (car les
fj forment une L-base de F ). Par P ailleurs il existe αij ∈ K tels que λ i = j=1 αij e j (car les ej forment
une K-base de L) et donc x = i,j α ij ej f i . Montrons maintenant l’indépendance linéaire. Si αij ∈ K
P P P P
et i,j αij ej fi = 0 alors i j αij ej fi = 0 donc j αij ej = 0 (puisque les fi sont L-linéairement
indépendants) et donc les αij sont nuls (puisque les ej sont K-linéairement indépendants).

Un corollaire “évident” est que, si K ⊂ L ⊂ F alors [L : K] ≤ [F : K]; de plus, si ces dimensions sont finies,
on a [L : K] = [F : K] si et seulement si F = L.
Terminons ce paragraphe en citant sans détail d’autres exemples de corps.
(i) Soit p premier, considérons
 
 Y 
Zp := (an )n≥1 ∈ Z/pn Z | an+1 ≡ an mod pn .
 
n≥1

C’est un anneau intègre, appelé l’anneau des entiers p-adiques, son corps des fractions Qp appelé le corps
des nombres p-adiques. On peut montrer que Qp est un analogue de R au sens qu’il est la complétion
de Q pour la valeur absolue |x|p := p−ordp (x) .
(ii) Soit U un ouvert connexe du plan complexe, alors l’ensemble M(U ) des fonctions méromorphes sur U
est un corps.
P∞
(i) Soit K un corps, l’ensemble des séries formelles n=0 an X n peut être muni d’une structure d’anneau
noté K[[X]]. En rendant inversible X, on obtient un corpsPappelé corps des séries formelles et noté
∞
K((X)). On peut aussi le voir comme l’ensemble des séries n≥−n0 an X n .

C.2. Eléments algébriques et transcendants.

Soit K ⊂ L une extension de corps et α ∈ L. Considérons l’homomorphisme d’anneaux “évaluation en α”
définie de la manière suivante:
evα : K[X] → L
P 7→ P (α)
Lorsque Ker(evα ) = {0}, on dit que α est transcendant sur K. Lorsque Ker(evα ) 6= {0}, on dit que α est
algébrique sur K. Si Ker(evα ) = P K[X], on appellera P le polynôme minimal de α sur K (il n’est tout-à-fait
unique que si on lui impose d’être unitaire).
Notons K[α] le plus petit sous-anneau de L contenant K et α et K(α) le plus petit sous-corps de L contenant
K et α. Par construction K[α] est l’image de evα donc est isomorphe à K[X]/ Ker(evα ). Si α est trancendant,
on voit que K[α] ∼ = K[X] et K(α) ∼ = K(X); en particulier K(α) est de dimension infinie sur K. Si α est
algébrique et P son polynôme minimal sur K, alors P est irréductible dans K[X] donc l’idéal engendré par
P est maximal et K[α] = K(α) ∼ = K[X]/P K[X]. De plus dans ce cas on a [K(α) : K] = deg(P ). En effet
une base de K[α] = K(α) sur K est donnée par 1, α, α2 , . . . , αdeg(P )−1 . On a en particulier prouvé:
Proposition. Soit α ∈ L ⊃ K alors α est algébrique sur K si et seulement si [K(α) : K] < ∞. Dans ce cas
[K(α) : K] est le degré du polynôme minimal de α sur K.
Remarque. On peut en déduire que si K ⊂ F ⊂ L alors [F (α) : F ] ≤ [K(α) : K]. En effet le membre de
gauche est le degré du polynôme minimal de α sur F qui divise le polynôme minimal de α sur K dont le
degré est le membre de droite.
Corollaire. Soit α, β ∈ L ⊃ K et supposons α, β algébriques sur K alors α + β, αβ et α/β sont algébriques
sur K.

46
Preuve. Il suffit de montrer que [K(α, β) : K] < ∞. En effet on aura alors, pour tout élément x ∈ K(α, β)
l’inégalité [K(x) : K] ≤ [K(α, β) : K] < ∞ et donc x algébrique sur K. Mais par ailleurs on a

[K(α, β) : K] = [K(α, β) : K(α)][K(α) : K] ≤ [K(β) : K][K(α) : K] < ∞

ce qui achève la démonstration.

√ √ √
Exemple. Soit δ = 5 2 + 7 3 + 2 5 alors δ est algébrique sur Q. Illustrons les méthodes précédentes en
montrant que [Q(δ) : Q] √ = 70 donc
√ son polynôme
√ minimal est de degré 70 et serait fastidieux à écrire.
Notons pour abréger α = 5 2, β = 7 3 et γ = 2 5. Alors le polynôme minimal sur Q de α (resp. β, resp. γ)
est X 5 − 2 (resp. X 7 − 3, resp. X 2 − 5) donc [Q(α) : Q] = 5 (resp. [Q(β) : Q] = 7, resp. [Q(γ) : Q] = 2).
On a
[Q(δ) : Q] ≤ [Q(α, β, γ) : Q] ≤ [Q(α) : Q][Q(β) : Q][Q(γ) : Q] = 5 · 7 · 2 = 70.
Mais [Q(α, β, γ) : Q] = [Q(α, β, γ) : Q(α)][Q(α) : Q] donc 5 (resp. 7, resp. 2) divise [Q(α, β, γ) : Q], donc
70 également d’où [Q(α, β, γ) : Q] = 70. Enfin on laisse en exercice de vérifier que Q(δ) = Q(α, β, γ) et donc
le polynome minimal de δ est de degré 70. On pourra procéder ainsi: a) Vérifier que Q(α + β) = Q(α, β)
etc. b) Montrer que Q(δ, γ) = Q(α, β, γ). c) Montrer que γ ne peut être de degré 2 sur Q(δ) car sinon α
serait aussi de degré 2 et conclure.
Corollaire. Soit K ⊂ L une extension de corps. Le sous-ensemble

F := {α ∈ L | α est algébrique sur K}

est un sous-corps de L.
Preuve. L’ensemble F est stable par toutes les opérations de corps donc est un sous-corps de L.

Exemple. Considérons Q̄ := {x ∈ C | est algébrique sur Q}, c’est un sous-corps de C. De plus Q̄ est
algébriquement clos. En effet soit P = X n + an−1 X n−1 + . . . + a0 ∈ Q̄[X], montrons qu’il possède une racine
dans Q̄. Introduisons K = Q(a0 , . . . , an−1 ) alors [K : Q] < ∞. En effet

[Q(a0 , . . . , an−1 ) : Q] = [Q(a0 , . . . , an−1 ) : Q(a0 , . . . , an−2 )] . . . [Q(a0 ) : Q]

et [Q(a0 , . . . , ai ) : Q(a0 , . . . , ai−1 )] ≤ [Q(ai ) : Q] < ∞. Soit maintenant x ∈ C une racine de P (il en existe
puisque C est algébriquement clos) alors, comme P ∈ K[X] on a [K(x) : K] < ∞ donc [Q(x) : Q] ≤ [K(x) :
Q] = [K(x) : K][K : Q] < ∞. Donc x est algébrique sur Q et appartient donc bien à Q̄.
Nous disposons maintenant de tous les outils nécessaires pour construire des extensions de corps. Nous
savons déjà construire, à partir de K le corps K(X) = Frac(K[X]). Soit P = a0 + a1 X + . . . + an X n un
polynôme irréductible de K[X] alors L := K[X]/P K[X] est un corps qui contient de manière naturelle un
sous-corps isomorphe à K. En effet considérons
j s
i = s ◦ j : K ,→ K[X] → K[X]/P K[X]

on obtient K 0 := i(K) ∼ = K. Montrons que l’élément α ∈ L égal à la classe de X dans K[X]/P K[X] est
racine de P 0 = i(a0 ) + i(a1 )X + . . . + i(an )X n ∈ K 0 . En effet

P 0 (α) = i(a0 ) + i(a1 )α + . . . + i(an )αn

= s ◦ j(a0 ) + s ◦ j(a1 )s(X) + . . . + s ◦ j(an )s(X)n
= s (j(a0 ) + j(a1 )X + . . . + j(an )X n ))
= s(P )
=0

On voit qu’ainsi on peut fabriquer des extensions L d’un corps K quelconque, telles que des polynômes
donnés à coefficients dans K admettent des racines dans L. On peut se demander si de telles constructions
sont uniques en un certain sens. Voici la réponse.

47
Théorème. Soit K un corps et P ∈ K[X] non constant.
(i) Il existe L ⊃ K telle que L contienne une racine de P . De plus, si P est irréductible dans K[X] et si L
est minimale (i.e. si K ⊂ L0 ⊂ L et P possède une racine dans L0 alors L = L0 ) alors L est unique à
isomorphisme près et s’appelle un corps de rupture de P (en fait L ∼ = K[X]/P K[X]).
(ii) Il existe une extension L ⊃ K telle que P soit scindé sur L c’est-à-dire P = a(X − α1 ) . . . (X − αn ) avec
a, α1 , . . . , αn ∈ L et minimale; une telle extension est unique à isomorphisme près et s’appelle le corps de
décomposition de P sur K.
Preuve. (i) Soit L un corps contenant une racine α de P , alors K(α) ⊂ L donc L est minimal si et seulement
si L = K(α); dans ce cas l’évaluation en α induit un isomorphisme K[X]/P K[X] ∼ = K(α) = L. Prouvons
maintenant, par récurrence sur n = deg(P ), l’existence d’un corps de décomposition. Soit P1 un facteur
irréductible de P et K1 un corps de rupture minimal de P1 dans lequel il acquiert une racine α1 . Alors, dans
K1 [X] on peut factoriser P = (X −α1 )Q. On dispose, par hypothèse de récurrence, d’une extension L1 ⊃ K1
sur laquelle Q, et par conséquent P est scindé, i.e. P = a(X − α1 ) . . . (X − αn ) avec a, α1 , . . . , αn ∈ L1 .
On pose L := K(α1 , . . . , αn ) et alors P est encore scindé sur L et L est minimal puisque si K ⊂ L0 ⊂ L et
P scindé sur L0 alors L0 contient K et les racines de P , c’est-à-dire α1 , . . . , αn donc contient L. Prouvons
maintenant, par récurrence sur n = deg(P ), l’unicité (à isomorphisme près) d’un corps de décomposition.
Pour faciliter l’induction, on va démontrer un résultat un tout petit plus général (qui achèvera la preuve du
théorème) :
Lemme. Soit i : K → K 0 un isomorphisme de corps. Soit P un polynôme de K[X] et L un corps de
décomposition de P sur K et soit L0 un corps de décomposition de i(P ) sur K 0 alors il existe un isomorphisme
φ : L → L0 qui prolonge i.
Preuve. Tout d’abord on étend i en un isomorphisme K[X] → K 0 [X] que l’on note encore i. Soit α1 ∈ L
une racine de P et P1 son polynôme minimal alors P = P1 Q et i(P ) = i(P1 )i(Q). Soit α10 ∈ L0 une racine
de i(P1 ). Alors L1 = K(α1 ) est un corps de rupture de P1 et L01 = K(α10 ) est un corps de rupture de
i(P1 ) donc on peut prolonger i en un isomorphisme φ1 : L1 :→ L01 qui envoie α1 sur α10 . La factorisation
P = (X − α1 )R dans L1 [X] se traduit par la factorisation i(P ) = (X − α10 )φ1 (R) dans L01 [X]. Mais L est
un corps de décomposition de R sur L1 et L0 est un corps de décomposition de φ1 (R) sur L01 donc, par
hypothèse de récurrence, l’isomorphisme φ1 se prolonge en un isomorphisme φ : L → L0 .
√
Exemple de corps de décomposition. Soit K =√Q et P = X n − 2, alors un corps
√ de rupture est Q( n 2) et
un corps de décomposition L = Q exp(2iπ/n) n 2, k = 0, 1, . . . , n − 1 = Q n 2, exp(2iπ/n) .
Ces théorèmes généraux montrent l’importance des polynômes irréductibles dans K[X]. Il est clair que les
polynômes de degré 1 sont toujours irréductibles. De même un polynôme de degré 2 ou 3 est irréductible
si et seulement si il ne possède pas de racine dans K. Déterminer les autres polynômes irréductibles est
nettement plus délicat en général. Nous rappelons seulement ici que les seuls polynômes irréductibles de
R[X] sont les polynômes de degré 1 et les polynômes du second degré sans racines réelles; nous donnons
aussi deux critères d’irréductibilité et l’exemple des polynômes cyclotomiques.
Proposition. Soit A un anneau factoriel et K := Frac(A), soit P = an X n + . . . + a0 ∈ A[X] et soit p ∈ A
un élément irréductible.
(i) (Critère d’Eisenstein) Supposons que p ne divise pas an , que p divise an−1 , . . . , a0 , mais que p2 ne divise
pas a0 , alors P est irréductible dans K[X].
(ii) (Critère de réduction) Supposons que p ne divise an , et que P̄ ∈ (A/pA)[X] soit irréductible, alors P
est irréductible dans K[X].
Preuve. Pour les deux critères, on considère l’homomorphisme de réduction des coefficients d’un polynôme
P 7→ P̄ de A[X] dans (A/pA)[X]. Supposons donc que P = QR avec Q, R ∈ A[X], on en déduit P̄ = Q̄R̄.
L’hypothèse de (i) indique que P̄ = uX n avec u 6= 0. Ainsi uX n = Q̄R̄ entraı̂ne Q̄ = vX d et R̄ = wX n−d , si
d 6= 0, n on en tirerait que Q = qd X d + . . . + q0 avec p divisant q0 et R = rn−d X n−d + . . . + r0 avec p divisant
r0 ; d’où p2 divise q0 r0 , ce qui contredirait les hypothèses. On conclut que Q̄ ou R̄ est constant et donc Q ou
R est constant. L’hypothèse de (ii) indique que Q̄ ou R̄ est inversible donc constant dans (A/pA)[X]. Mais
l’hypothèse an ∈ / pA entraı̂ne que les coefficients dominants de Q et R ne sont pas non plus divisibles par p
et donc que deg(Q) = deg(Q̄) et deg(R) = deg(R̄) donc l’un des deux est constant.

48
Remarques et exemples. Si l’on sait de plus que c(P ) = 1 alors, sous les hypothèses de l’un des deux critères,
on a P irréductible dans A[X]. En utilisant le critère d’Eisenstein pour A = Z et p = 2, on voit que X n −2 est
irréductible dans Q[X] (ou Z[X]). En utilisant le critère d’Eisenstein pour A = Z[Y ] et p = Y , on voit que
P = (Y − 1)X n − Y 2 X + Y est irréductible dans A[Y ] = Z[X, Y ]. Le polynôme P̄ = X 4 + X + 1 ∈ Z/2Z[X]
est irréductible, en effet il n’a pas de racine dans Z/2Z et le seul polynôme irréductible sur Z/2Z de degré
deux est X 2 + X + 1 qui ne divise pas P̄ . Par conséquent le polynôme P = 11X 4 − 6X 3 + 4X 2 + 7X − 5 est
irréductible dans Q[X] (ou Z[X]).
Les polynômes cyclotomiques sont les facteurs irréductibles de X n − 1 dans Q[X] (ou Z[X]); on peut les
définir ainsi:
Définition. Soit n ≥ 1, le n-ème polynôme cyclotomique est défini par
Y
Φn (X) = (X − ζ)
ζ∈µ∗
n

où µ∗n est l’ensemble des racines n-èmes primitives de l’unité (dans C).
Avec la définition donnée Φn ∈ C[X] et il est clair que deg(Φn ) = φ(n) et que
Y
Xn − 1 = Φd (X) (∗)
d|n

Cependant il est moins évident qu’en fait Φn ∈ Z[X] et que Φn est irréductible dans Q[X] (ou Z[X]).
Commençons par voir que les coefficients de Φn sont entiers. Il est clair que Φ1 (X) = X − 1 ∈ Z[X]. On
peut alors
Q démontrer ce que l’on veut par induction sur n en utilisant la formule (∗). En effet le polynôme
B := d | n,d6=n Φd (X) est unitaire et, par hypothèse de récurrence, à coefficients entiers; on peut donc
effectuer dans Z[X] la division euclidienne X n = BQ + R. La formule (∗) garantit alors que R = 0 et
Q = Φn . Nous concluons avec le résultat suivant:
Théorème. Le polynôme Φn est irréductible dans Z[X].
Preuve. Soit ζ une racine primitive n-ème de l’unité et P son polynôme minimal sur Q, on veut montrer
que P = Φn . Observons d’abord que P ∈ Z[X]. Choisissons ensuite p un nombre premier ne divisant pas n
alors ζ p est encore une racine primitive n-ème de l’unité. Soit Q son polynôme minimal qui est également
dans Z[X]. Si P et Q étaient distincts, le produit P Q diviserait Φn . Mais comme Q(ζ p ) = 0 on voit que ζ
est racine de Q(X p ) et donc Q(X p ) = P (X)R(X) pour un certain R ∈ Z[X]. En réduisant les coefficients
modulo p on obtient:
Q̄(X p ) = Q̄(X)p = P̄ (X)R̄(X).
ou encore P̄ (X) divise Q̄(X)p dans (Z/pZ)[X] mais les facteurs de X n − 1 et donc de P̄ (X) sont simples
dans (Z/pZ)[X] (la dérivée de X n − 1 est nX n−1 et on a pris soin de choisir p ne divisant pas n) donc en fait
P̄ (X) divise Q̄(X). Mais alors P̄ (X)2 divise Φ̄n (X) dans (Z/pZ)[X], ce qui contredit le fait que les facteurs
de Φ̄n (X) sont simples. En résumé on a prouvé que, pour p premier ne divisant pas n, le polynôme minimal
de ζ annulait ζ p . On en tire aisément que, si m est premier avec n alors P (ζ m ) = 0. Ainsi deg(P ) ≥ φ(n)
et comme P divise Φn , on a donc P = Φn et ce dernier est irréductible.

Corollaire. Soit ζ une racine primitive m-ème, alors [Q(ζ) : Q] = φ(m).

Preuve. Le polynôme minimal sur Q de ζ est Φm qui est de degré φ(m).

Exercices. Montrer les formule suivantes

(a) Si p est premier, Φp (X) = X p−1 + X p−2 + . . . + X + 1.
(b) Si p premier divise n, alors Φnp (X) = Φn (X p ).
(c) Si p premier ne divise pas n, alors Φnp (X)Φn (X) = Φn (X p ).
Montrer que, si n ≥ 3, on a [Q(cos(2π/n)) : Q] = φ(n)/2. Pouvez-vous déterminer [Q(sin(2π/n)) : Q]?

49
C.3. Corps finis.
Nous verrons en appendice qu’un corps fini est nécessairement commutatif. Si K est fini, sa caractéristique
est un nombre premier p et K est un espace vectoriel de dimension finie (disons n) sur Z/pZ. On en tire en
particulier que card(K) = card ((Z/pZ)n ) = pn . Nous allons démontrer
Théorème. Soit p un nombre premier et un entier n ≥ 1, alors il existe un corps de cardinal pn , unique à
isomorphisme près. On le note Fpn .
Remarque. Si n = 1 on connait déjà ce résultat et en fait Fp = Z/pZ. Cependant, si n ≥ 2, on a
Fpn ∼= (Z/pZ)n en tant que Z/pZ-espaces vectoriels ou en tant que groupes additifs mais pas en tant
qu’anneaux. On a ainsi trois anneaux à ne pas confondre : Z/pn Z, (Z/pZ)n et Fpn .
Exemple. Le polynôme X 2 + X + 1 ∈ F2 [X] est irréductible donc F2 [X]/(X 2 + X + 1)F2 [X] est un corps
de dimension 2 sur F2 donc de cardinal 4 donc isomorphe à F4 .
Revenons à un corps fini K de cardinal q = pn . On sait donc que card(K ∗ ) = q − 1 et donc que pour tout
x ∈ K ∗ on a xq−1 = 1 et donc pour tout x ∈ K on a xq − x = 0. Remarquons que Q si X q − X est considéré
q
comme un polynôme à coefficients dans Fp on obtient la factorisation X − X = α∈K (X − α) ∈ K[X].
Ceci suggère l’énoncé suivant:
Théorème. Soit q = pn et K le corps de décomposition de X q − X sur Fp = Z/pZ. C’est un corps de
cardinal q = pn et tout corps de cardinal q lui est isomorphe.
q
Qq de décomposition de X − X sur Fq p = Z/pZ, c’est un corps
Preuve. Il suffit de prouver que si K est le corps
q
de cardinal q. Dans K[X] on a X − X = i=1 (X − αi ). Posons S := {α ∈ K | α − α = 0}. L’ensemble S
des racines de X q − X dans K a pour cardinal q car X q − X est scindé sur K et les racines sont simples car
la dérivée est le polynôme constant −1. Montrons que S est un sous-corps de K et donc K = S. En effet si
αq − α = 0 et β q − β = 0 alors (α + β)q − (α + β) = αq + β q − α − β = 0 et donc α + β ∈ S; par ailleurs si
p 6= 2, on a (−α)q − (−α) = −αq + α = 0 donc −α ∈ S; enfin (αβ)q = αq β q = αβ donc αβ ∈ S et (si α est
non nul) (α−1 )q = α−q = α−1 donc α−1 ∈ S.

Remarques. Il est clair que l’homomorphisme φ : Fpn → Fpn défini par φ(x) = xp est un isomorphisme car
une application injective entre deux ensembles finis de même cardinal est une bijection. On a clairement
n
φn = idFpn puisque xp = x pour tout x ∈ Fpn . Par ailleurs, nous avons vu qu’un sous-groupe fini de K ∗
(avec K corps commutatif) est cyclique, donc F∗pn est isomorphe (comme groupe) à Z/(pn − 1)Z. On voit
donc que l’application x 7→ xm définit une bijection de F∗pn (ou Fpn ) si et seulement si PGCD(m, pn − 1) = 1;
c’est un homomorphisme de groupe sur F∗pn mais bien sûr pas un homomrphisme d’anneaux sur Fpn . Lorsque
d := PGCD(m, pn − 1) est différent de 1, le noyau est cyclique de cardinal d et on a (F∗pn : F∗m
pn ) = d.

Exercices. Montrer que Fq est (isomorphe à) un sous-corps de Fq0 si et seulement si q = pm et q 0 = pn avec
m divisant n.
Appendice : le théorème de Wedderburn.
Il s’agit du résultat suivant:
Théorème. (théorème de Wedderburn) Soit K un corps fini, alors K est commutatif.
Preuve. Soit Z = {x ∈ K | ∀y ∈ K, xy = yx} alors Z est clairement un sous-corps commutatif de K; notons
q = card(Z) et n = dimZ K. On va montrer par l’absurde qu’on ne peut avoir n ≥ 2. Considérons le groupe
K ∗ et son action sur lui-même par conjugaison. Soit y ∈ K ∗ , si on pose C(y) = {x ∈ K | xy = yx} alors
C(y) est un sous-corps de K qui contient Z; notons ny = dimZ C(y). On a C(y) = K si et seulement si
y ∈ Z et le stabilisateur de y sous l’action de K ∗ est C(y)∗ = C(y) \ {0}, ainsi la formule des classes s’écrit:
X card(K ∗ ) X qn − 1
q n − 1 = card(K ∗ ) = card(Z ∗ ) + ∗
=q−1+
card(C(y) ) q ny − 1
y∈R y∈R

où R désigne un ensemble de représentants des classes de conjugaison non

Q réduites à un élément, ou encore
telles que 1 ≤ ny < n. On fait maintenant l’observation que X n − 1 = d | n Φd (X) où Φd ∈ Z[X] désigne

50
le polynôme cyclotomique. On voit donc que q n − 1 = d | n Φd (q) et donc que Φn (q) divise q n − 1 et même
Q

(q n − 1)/(q ny − 1) lorsque ny < n. En revenantQ à l’équation des classes, on voit donc que Φn (q) divise q − 1.
En particulier |Φn (q)| ≤ q − 1. Mais |Φn (q)| = ζ |q − ζ| où ζ parcourt les racines n-èmes primitives et l’on
a |q − ζ| ≥ q − 1, d’où une contradiction si n ≥ 2.

Exercice (Théorème de Chevalley-Waring). Soit k = Fq un corps fini de caractéristique p. On veut montrer

que si P ∈ k[x1 , . . . , xn ] avec deg(P ) < n alors

card{x ∈ k n | P (x) = 0} ≡ 0 mod p.

En particulier, si P est homogène de degré d < n alors P possède un zéro non trivial (i;e. distinct de 0). On
pourra procéder ainsi P :
(a) Montrer que x∈k xm est nul si m = 0 ou si q − 1 ne divise pas m mais vaut −1 dans les autres cas.
[Comme le polynôme ”X 0 ” est le polynôme constant, il est naturel 0
P de prendre ici la convention 0 = 1].
(b) Soit P ∈ k[x1 , . . . , xn ] avec deg(P ) < (q − 1)n, en déduire que x∈kn P (x) = 0.
(c) Appliquer le résultat précédent à P (x)q−1 et conclure.
(d) Démontrer par une méthode analogue la généralisation suivante. Soient P1 , . . . , Ps des polynômes de
degrés d1 , . . . , ds avec d1 + . . . + ds < n, montrer que

card{x ∈ k n | P1 (x) = . . . = Ps (x) = 0} ≡ 0 mod p.

En particulier, si les polynômes sont homogènes, ils ont un zéro commun non trivial.
Exercice. Montrer que Fpm ⊂ Fpn si et seulement si m divise n.

51
D. MODULES.

On donne une brève présentation de la théorie des modules sur un anneau commutatif avec comme objectif
et motivation la description de la décomposition d’un endomorphisme d’espace vectoriel et la détermination
de sa classe de similitude.

D.1. Modules : généralités et exemples.

Soit A un anneau commutatif, un A-module est un ensemble M muni d’une addition M × M → M et d’une
multiplication par les scalaires A × M → M vérifiant les mêmes axiomes qu’un espace vectoriel, c’est-à-dire :
(i) (M, +) est un groupe abélien
(ii) ∀a, b ∈ A, ∀x ∈ M on a a · (b · x) = (ab) · x
(ii) ∀a ∈ A, ∀x, y ∈ M on a a · (x + y) = a · x + a · y
(iv) ∀a, b ∈ A, ∀x ∈ M on a (a + b) · x = a · x + b · x
(v) ∀x ∈ M on a 1 · x = x
Remarque. Si A n’est pas commutatif on peut néanmoins définir des modules à droite ou à gauche.
Exemples. Si A est un corps, un A-module n’est rien d’autre qu’un A-espace vectoriel. Un groupe abélien est,
de manière “évidente”, un Z-module si l’on pose n · x = x + · · · + x (n fois) pour n > 0 et n · x = −x − · · · − x
(|n| fois) pour n < 0. Si A est un anneau commutatif et si I est un idéal, alors A/I est naturellement un
A-module en posant a · (x + I) = ax + I. En particulier A peut être vu comme un A-module.
Opérations sur les modules.
Un sous-module N d’un module M est un sous-ensemble tel que les opérations sur M induisent une structure
de A-module sur N . C’est-à-dire :
(i) N est un sous-groupe de M
(ii) N est stable par multiplication par un scalaire
ou encore
(i’) ∀x, y ∈ N, ∀a, b ∈ A, ax + by ∈ N .
Exemples. Les sous-modules de A sont les idéaux de A. Si a ∈ A, l’ensemble aM := {ax | x ∈ M }
est un sous-module de M ; plus généralement, si I est un idéal de l’anneau A, l’ensemble I · M := {x =
a1 x1 + . . . ar xr | r ≥ 0, ai ∈ I et xi ∈ M } est un sous-module.
Si N1 et N2 sont des sous-modules de M , l’intersection N1 ∩ N2 est un sous-module, la somme est le sous-
module N1 + N2 = {x1 + x2 | x1 ∈ N1 et x2 ∈ N2 }. Si de plus N1 ∩ N2 = {0} on dit que la somme est
directe et on la note N1 ⊕ N2 . La notion de somme (directe ou non) se généralise à une famille quelconque
de sous-modules {Ni }i∈I .

Une application f : M → N est un homomorphisme de modules, si elle vérifie f (x + y) = f (x) + f (y) et

f (a · x) = a · f (x). Si de plus f est bijective, on dit que c’est un isomorphisme de modules.
Remarques. La dernière appellation est justifiée car on vérifie immédiatement que la bijection réciproque
f −1 est encore un homomorphisme de modules. Le composé de deux homomorphismes est encore un ho-
momorphisme. L’image directe ou réciproque par un homomorphisme d’un sous-module est encore un
sous-module. En particulier le noyau Ker(f ) est un sous-module de M et l’image Im(f ) est un sous-module
de N . L’ensemble des endomorphismes f : M → M forme un anneau (non commutatif en général) en posant
(f + g)(x) = f (x) + g(x) et (f g)(x) = f (g(x)). Si M = Ar , alors End(M ) est isomorphe à l’anneau des
matrices r × r à coefficients dans A.
Si N1 et N2 sont des sous-modules de M , le produit de modules est définit comme l’ensemble N1 × N2 muni
des lois (x1 , x2 ) + (x01 , x02 ) = (x1 + x01 , x2 + x02 ) et a · (x1 , x2 ) = (a · x1 , a · x2 ).
Remarque. La notion de produit se généralise àQune famille quelconque de modules {Ni }i∈I . Lorsque les Ni
sont des sous-modules en somme directe, on a i∈I Ni ∼ = ⊕i∈I Ni seulement lorsque I est fini.

52
Soit N un sous-module de M , on peut construire le module quotient M/N comme le groupe abélien M/N
(déjà construit) muni de la multiplication par un scalaire a · (x + N ) = (a · x) + N . On a alors la propriété
universelle du quotient
Théorème Soit f : M → M 0 un homomorphisme de A-modules et soit N un sous-module et s : M → M/N
la surjection canonique.
(i) Il existe une application fˆ : M/N → M 0 telle que f = fˆ ◦ s si et seulement si N ⊂ Ker(f ).
(ii) Dans ce cas l’application fˆ est un homomorphisme de modules, son image est égale à celle de f (i. e.
fˆ(M/N ) = f (M )) et son noyau est Ker(f )/N .
Preuve. En terme de groupe quotient “tout” a déjà été prouvé; il reste seulement à vérifier que l’application
fˆ, quand elle existe, est bien un homomorphisme de modules, ce qui est immédiat.

Par exemple on en déduit que M/ Ker(f ) = ∼ Im(f ). Si N1 et N2 sont deux sous modules de M , l’application
x 7→ (x, −x) identifie N1 ∩ N2 à un sous-module de N1 × N2 et l’on voit que N1 + N2 ∼
= (N1 × N2 )/(N1 ∩ N2 ).
Les notions de combinaison linéaire, partie libre, de partie génératrice ou de base se définissent comme en
algèbre linéaire sur un corps. Néanmoins une différence notable est la non-existence de base d’un module
en général. En fait on peut introduire la notion suivante (qui n’a d’intérêt que si M n’est pas un espace
vectoriel ou encore si A n’est pas un corps).
Définition. Soit x élément d’un A-module M , on appelle annulateur de x l’idéal

Ann(x) = {a ∈ A | a · x = 0}.

Si N est un sous-module, son annulateur est

\
Ann(N ) = Ann(x) = {a ∈ A | ∀x ∈ N, a · x = 0}.
x∈N

Remarquons qu’un A-module M est automatiquement un A/ Ann(M )-module en posant ā · x = ax (ce qui
est loisible puisque ax ne dépend que de la classe ā de a modulo l’idéal Ann(M )).
Exemple. Soit M = A/I vu comme A-module (avec I idéal de A), on a clairement Ann(M ) = I. Considérons
M = Q/Z vu comme Z-module, pour tout élément x égal à la classe de a/b avec a et b premiers entre eux
on a Ann(x) = bZ, néanmoins Ann(M ) = {0}. Remarquons que l’ensemble

Mtorsion := {x ∈ M | ∃a ∈ A \ {0}, a · x = 0} = {x ∈ M | Ann(x) 6= 0}

est un sous-module de M .
Supposons A intègre, lorsque l’annulateur d’un élémént non nul de M n’est pas réduit à {0} on voit tout de
suite qu’il ne peut pas exister de base sur A. On donne donc un statut spécial aux modules possédant une
base. On définit de même l’analogue de la dimension finie dans les espaces vectoriels.
Définition. Un A-module M est libre s’il possède une base (i. e. une partie libre et génératrice sur A). Il
est de type fini s’il possède une partie génératrice finie.
Ainsi un module libre de type fini est isomorphe à An . Il n’est pas évident que l’entier n soit unique, même si
cela est vrai ; au paragraphe suivant on vérifie que si A est principal et An ∼= Am alors m = n. Remarquons
aussi que A, considéré comme A-module, est libre de rang 1 et que ses sous-modules non nuls (c’est-à-dire
ses idéaux non nuls) sont libres de rang 1 si et seulement si A est principal.

D.2. Modules de type fini sur les anneaux principaux.

Rappelons qu’un anneau commutatif unitaire A est principal s’il est intègre et tout idéal est de la forme aA.
Nous commençons par montrer qu’on a bien une notion de “dimension”, qu’on appellera plutôt rang, et on
donne ensuite la description des sous-modules d’un module libre de type fini sur un tel anneau.

53
Proposition. Soit A un anneau principal, M un A-module admettant deux bases B et B 0 alors card(B) =
card(B 0 ). Si M = N ⊕ N 0 et si B et B 0 sont des bases de N et N 0 respectivement, alors B ∪ B0 est une base
de M .
Preuve. Si A est un corps, le résultat est la base de l’algèbre linéaire. Sinon, soit a un élément irréductible
de A, alors k = A/aA est un corps et le module quotient M/aM est annulé par aA donc peut être vu comme
un k-module c’est-à-dire un k-espace vectoriel. Mais si e1 , . . . , er forment une base de M sur A et si l’on
désigne par ēi la classe de ei modulo aM , il est immédiat que ē1 , . . . , ēr forment une base de M/aM sur k.
L’entier r est donc la dimension du k-espace vectoriel M/aM et ne dépend donc pas de la base choisie. La
deuxième affirmation est immédiate.

Définition. Si M est un A-module libre de type fini, on appelle rang de M le cardinal d’une base.
Théorème Soit A un anneau principal, M un A-module libre de rang r, et N un sous-module alors
(i) Le module N est libre de rang s ≤ r.
(ii) Il existe e1 , . . . , er base de M sur A et a1 , . . . , as ∈ A tels que ai divise ai+1 et

N = Aa1 e1 ⊕ . . . ⊕ Aas es .

Preuve. La preuve se fait par récurrence sur l’entier r, le cas r = 1 étant vérifié précisément parce que
l’anneau A est supposé principal. Commençons par la preuve de (i). Si l’on note e1 , . . . , er une base de M
on peut écrire M = Ae1 ⊕ . . . ⊕ Aer et considérer l’homomorphisme de A-modules e∗r : M → A défini par
e∗r (a1 e1 + . . . + ar er ) = ar . L’ensemble e∗r (N ) est un sous-module, c’est-à-dire un idéal de A. Choisissons
x0 ∈ N tel que e∗r (x0 ) = a avec e∗r (N ) = aA. On va appliquer le lemme suivant
Lemme. Soit f : M → A un homomorphisme non nul de modules et x tel que f (x)A = f (M ) alors
M = Ker(f ) ⊕ Ax.
Preuve du lemme. Soit y ∈ Ker(f ) ∩ Ax alors y = ax et f (y) = af (x) = 0, mais f (x) 6= 0 car sinon
l’homomorphisme f serait nul, donc a = 0 (l’anneau A est intègre) et y = 0. Soit maintenant y ∈ M , on sait
qu’il existe b ∈ A tel que f (y) = bf (x) = f (bx), donc f (y − bx) = 0 et y − bx ∈ Ker(f ). On peut donc écrire
y = (y − bx) + (bx) ∈ Ker(f ) + Ax.

Si N ⊂ Ker(e∗r ) alors, comme Ker(e∗r ) = Ae1 ⊕ . . . ⊕ Aer−1 , on peut appliquer l’hypothèse de récurrence
et conclure que N est libre de rang ≤ r − 1. Sinon, en appliquant le lemme à e∗r : N → A on obtient que
N = (Ker(e∗r ) ∩ N ) ⊕ Ax0 . En appliquant l’hypothèse de récurrence au sous-module Ker(e∗r ) ∩ N ⊂ Ker(e∗r ),
on obtient que Ker(e∗r ) ∩ N est libre de rang ≤ r − 1. Donc N est libre de rang ≤ r.
Montrons maintenant (ii), toujours par récurrence sur r. Pour chaque homomorphisme de modules f : M →
A tel que f (N ) 6= 0, on choisit af ∈ A tel que f (N ) = af A et uf ∈ N tel que f (uf ) = af . On choisit ensuite
f1 tel que af1 A soit maximal parmi les af A. Remarque : cela signifie que si af1 A ⊂ af A alors af1 A = af A
mais on ne peut pas, à ce stade de la preuve, affirmer que af1 divise tous les af . Pour alléger les notations
on écrira a1 = af1 ; on choisit aussi u1 ∈ N tel que f1 (u1 ) = a1 . Montrons d’abord que pour tout f on a a1
divise f (u1 ). Appelons d = PGCD(a1 , f (u1 )), alors, d’après le théorème de Bézout, il existe b, c ∈ A tels que
d = ba1 + cf (u1 ). Considérons alors l’homomorphisme f 0 = bf1 + cf , on a f 0 (u1 ) = d donc af 0 divise d qui
divise a1 ou encore a1 A ⊂ af 0 A d’où a1 A = dA = af 0 A. Mais a1 = PGCD(a1 , f (u1 )) signifie exactement que
a1 divise f (u1 ). On en tire l’existence de e1 ∈ M telP que u1 = a1 e1 etP donc f (e1 ) = 1; en effet si y1 , . . . , yr
est une base de M alors yi∗ (u1 ) = a1 bi et donc u1 = i yi∗ (u1 )yi = a1 ( i bi yi ). On applique alors le lemme
précédent à f1 : M → A avec l’élément e1 puis à f1 : N → A avec l’élément u1 , ce qui donne

M = Ae1 ⊕ Ker(f1 ) et N = Aa1 e1 ⊕ (N ∩ Ker(f1 )) .

Comme, d’après (i), Ker(f1 ) est libre de rang r − 1, on peut lui appliquer l’hypothèse de récurrence et
conclure qu’il existe une base e2 , . . . , er de Ker(f1 ) et des éléments ar , . . . , ar ∈ A tels que ai divise ai+1 et

N ∩ Ker(f1 ) = Aa2 e2 ⊕ . . . ⊕ Aar er .

54
Il reste donc seulement à vérifier que a1 divise a2 . Pour cela considérons f = e∗1 + e∗2 ; on a f (a2 e2 ) = a2
donc af divise a2 et par ailleurs f (u1 ) = f (a1 e1 ) = a1 donc af divise a1 mais on a vu que cela entraı̂nait
a1 A = af A donc on a bien a1 qui divise a2 .

Théorème Soit A un anneau principal, M un A-module de type fini, il existe r, m ∈ N et a1 , . . . , am ∈ A

éléments non nuls et non inversibles tels que ai divise ai+1 et

M∼
= Ar × A/a1 A × . . . × A/am A,

De plus, les entiers r, s et la suite d’idéaux am A ⊂ . . . ⊂ a1 A sont uniques.

Preuve. Soient x1 , . . . , xn des générateurs de M (comme A-module), on a donc un homomorphisme surjectif
Φ : An → M défini par Φ(b1 , . . . , bn ) = b1 x1 + . . . + bn xn . Soit N = Ker(Φ), on a M ∼ = An /N et, d’après
le théorème précédent il existe une base e1 , . . . , en de M sur A et a1 , . . . , an ∈ A que ai divise ai+1 et
N = Aa1 e1 ⊕ . . . ⊕ Aan en . On montre aisément que

M∼
= An /N = (Ae1 ⊕ . . . ⊕ Aen ) / (Aa1 e1 ⊕ . . . ⊕ Aan en ) ∼
= A/a1 A × . . . × A/an A.
∼A
On peut omettre dans cette décomposition les facteurs avec ai inversible et si ai = 0 on peut écrire A/ai A =
d’où le résultat annoncé. L’unicité se démontre aisément à partir de l’observation que, d’une part M/bM ∼=
(A/bA)r × A/ PGCD(a1 , b)A × . . . × A/ PGCD(an , b)A et d’autre part bM ∼ = Ar × A/(a1 / PGCD(a1 , b))A ×
. . . × A/(an / PGCD(an , b))A.

Pour accentuer le parallèle avec les groupes abéliens, définissons un A-module cyclique comme un A-module
isomorphe à A/aA. Le théorème précédent affirme qu’un module de torsion et de type fini est isomorphe à
un produit ou somme fini de modules cycliques. Ceci est bien une généralisation du théorème décrivant les
groupes finis abéliens comme produit de groupes cycliques.
Terminons ce paragraphe en donnant une version utile du théorème de structure des sous-modules de An .
Lemme. Soit M ∈ Mat(n × m, A) avec A principal, il existe U ∈ GLn (A) et V ∈ GLm (A) et a1 , . . . , as ∈
A \ {0} avec s = rang(M ) ≤ min(m, n) et ai divisant ai+1 tels que

a1 O
 
 0 a2 
M =U ... 0  V.
 
as 0
 
0
Variante. Soit un homomorphisme f : An → Am , il existe e1 , . . . , en base de An et f1 , . . . , fm base de Am
et a1 , . . . , as ∈ A \ {0} avec s = rang(f ) ≤ min(m, n) et ai divisant ai+1 tels que

ai fi si 1 ≤ i ≤ s
f (ei ) =
0 sinon

Preuve. Prouvons par exemple la variante. Il existe ai et fi tels que le sous-module f (An ) ⊂ Am soit
égal à a1 Af1 ⊕ . . . ⊕ as Afs . Choisissons ei ∈ An tel que f (ei ) = ai fi (pour 1 ≤ i ≤ s); on a alors
An = Ae1 ⊕ . . . ⊕ Aes ⊕ Ker(f ). En choisissant es+1 , . . . , en une base de Ker(f ) on obtient l’énoncé.

D.3. Facteurs invariants de matrices.

D.3.1. Le K[X]-module associé à un endomorphisme sur un espace vectoriel.
Définition. Soit E un K-espace vectoriel de dimension finie n et u ∈ EndK (E). On définit une structure
de K[X]-module sur l’ensemble E de la façon suivante : l’addition est l’addition dans l’espace vectoriel et la
multiplication par un polynôme P = a0 + a1 X + . . . + ad X d est définie par

P · x = P (u)(x) = (a0 I + a1 u + . . . + ad ud )(x) = a0 x + a1 u(x) + . . . + ad ud (x).

55
On notera Eu le K[X]-module ainsi obtenu. On remarque tout de suite qu’il s’agit d’un module de type
fini. De plus, Ann(Eu ) est non trivial puisqu’il contient le polynôme caractéristique (théorème de Cayley-
Hamilton) donc le module Eu est de torsion (on peut aussi utiliser le fait que, pour x ∈ E, les vecteurs
x, u(x), u2 (x), . . . , un (x) sont liés).
Proposition. Soit u, v ∈ Endk (E), alors les K[X]-modules Eu et Ev sont isomorphes si et seulement si les
endomorphismes u et v sont semblables, c’est-à-dire qu’il existe une application K-linéaire inversible h telle
que v = h ◦ u ◦ h−1 .
Preuve. Pour distinguer les structures de K[X]-modules Eu et Ev dans cette preuve nous noterons P ·u x =
P (u)(x) et P ·v x = P (v)(x). Supposons qu’il existe h linéaire inversible telle que v = h ◦ u ◦ h−1 , alors
v m = h ◦ um ◦ h−1 et plus généralement P (v) = h ◦ P (u) ◦ h−1 donc

h(P ·u x) = h(P (u)(x)) = (h ◦ P (u))(x) = (P (v) ◦ h)(x) = P ·v h(x).

Ainsi h est en fait un isomorphisme de K[X]-modules h : Eu → Ev . Supposons inversement qu’il existe un

tel isomorphisme de K[X]-modules h : Eu → Ev . L’application h est en particulier K-linéaire et bijective et
de plus
h(u(x)) = h(X ·u x) = X ·v h(x) = v(h(x))

donc on a h ◦ u = v ◦ h et u et v sont semblables.

Par ailleurs, avant d’appliquer à notre situation les théorèmes de structure du paragraphe précédent, ob-
servons qu’un K[X]-sous-module de Eu n’est rien d’autre qu’un sous-espace vectoriel stable par u. Ainsi
une décomposition en somme de sous-modules correspond à une décomposition en somme de sous-espaces
vectoriels stables par u. De même un sous-module cyclique correspond à un sous-espace vectoriel engendré
par un vecteur x et ses images successives u(x), u2 (x), . . . par l’endomorphisme u.
D.3.2. Facteurs invariants d’un endomorphisme.
Le module Eu est isomorphe à K[X]/P1 K[X] × . . . × K[X]/Pr K[X] avec Pi non constants et Pi divise Pi+1 ,
de plus les Pi sont uniques (à un scalaire près), ce qui justifie la
Définition. Les polynômes Pi s’appellent les facteurs invariants de u.
Remarquons qu’il est assez facile de voir (démontrez-le!) que Pr est le polynôme minimal de u, tandis que le
polynôme caractéristique est égal au produit P1 . . . Pr . Nous allons généraliser cette observation ci-dessous.
D’après ce qui précède, u et v sont semblables si et seulement si ils ont mêmes facteurs invariants. Donnons
maintenant une interprétation de ces invariants et une méthode de calcul (théorique). Le module Eu se
décompose en E1 ⊕ . . . ⊕ Er avec Ei module cyclique de la forme K[X]/P K[X]. Ces sous-modules corre-
spondent à des sous-espaces vectoriels stables par u sur lequel u agit comme la multiplication par X sur
K[X]/P K[X]. Soit P = X d + pd−1 X d−1 + . . . + p0 , prenons comme K-base de K[X]/P K[X] les éléments
1, X, . . . , X d−1 et soit e1 , . . . , ed la K-base correspondante de Ei , la matrice de u dans cette base est une
matrice dite compagnon :
0 −p0
 
.. 
1 . 

Mat(u; e1 , . . . , ed ) =  . . . 0 −p

 
d−2
1 −pd−1
On obtient en particulier que toute matrice est semblable à une matrice dont les blocs diagonaux sont les
matrices compagnon associées à ses facteurs invariants.
Soit A la matrice de u dans une base. Définissons Di = Di (A) comme le PGCD des mineurs d’ordre i de la
matrice A − XId. En particulier Dn est le polynôme caractéristique de u ou A.
Théorème Les matrices A et B sont semblables si et seulement si Di (A) = Di (B) pour 1 ≤ i ≤ n.

56
Preuve. Posons A = Mat(u; (e1 , . . . , en ). La matrice A−Xid définit un endomorphisme Φ : K[X]n → K[X]n ;
définissons également µ : K[X]n → Eu par

µ(P1 , . . . , Pn ) = P1 · e1 + . . . + Pn · en = P1 (u)(e1 ) + . . . + Pn (u)(en ).

L’homomorphisme µ est clairement surjectif et Φ(K[X]n ) ⊂ Ker µ; en effet

µ(Φ(0, . . . , Pi , . . . , 0) = µ(a1i Pi , . . . , aii Pi − XPi , . . . , ani Pi )

= a1i Pi (e1 ) + . . . + ani Pi (en ) − uPi (u)(ei )
= Pi (u) (a1i e1 + . . . + ani en − u(ei )) = 0

Par ailleurs on a vu que le théorème de structure des sous-modules de modules libres peut s’interpréter
comme l’existence de deux matrices de changement de base U et V (à coefficient dans K[X]) et de polynômes
Q1 , . . . , Qn avec Qi divise Qi+1 et A − Xid = U diag(Q1 , . . . , Qn )V . On voit, d’une part, que le PGCD
des mineurs d’ordre i est Di = Q1 . . . Qi et d’autre part que K[X]n /Φ(K[X]n ) ∼ P × ... ×
= K[X]/Q1 K[X]
K[X]/Qn K[X] d’où l’on tire que K[X]n /Φ(K[X]n ) est un K-espace vectoriel de dimension deg(Qi ) =
deg det(A − Xid) = n. Comme K[X]n / Ker(µ) est de même dimension, on en tire Φ(K[X]n ) ⊂ Ker µ
et Eu ∼ = K[X]n /Φ(K[X]n ). L’unicité des facteurs invariants de u, disons, P1 , . . . , Pr , implique donc que
(Q1 , . . . , Qn ) = (1, . . . , 1, P1 , . . . , Pr ). Ainsi la donnée des facteurs invariants Pi équivaut à celle des Di , ce
qui achève la preuve.

Commentaire. La théorie des K[X]-modules nous donne que deux matrices (ou endomorphismes) sont
semblables si elles ont les mêmes polynômes “Pi ” et le raisonnement précédent montre que la donnée des
“Pi ” équivaut à celle des “Di ”. En fait explicitement Dn−i = P1 . . . Pr−i et Dn−r = . . . = D1 = 1.
Corollaire. Les matrices A et t A sont semblables.
Preuve du corollaire. En effet on a clairement Di (t A) = Di (A).

Exercice. Fabriquer deux matrices 4 × 4 non semblables ayant les mêmes polynômes caractéristiques et
minimaux (indication : choisir le polynôme minimal (X − λ)2 et le polynôme caractéristique (X − λ)4 ).
Peut-on fabriquer de tels exemples en dimension 2 ou 3 ?
Exercice. Démontrer de deux façons (en utilisant les résultats précédents et directement) l’énoncé suivant :
deux matrices A, B ∈ Mat(n × n, R) sont semblables sur C (i. e. il existe U ∈ GL(n, C) telle que B =
U AU −1 ) si et seulement si elles sont semblables sur R (i. e. il existe U ∈ GL(n, R) telle que B = U AU −1 ).
D.3.3. Classes de conjugaison de matrices sur un corps algébriquement clos.
On suppose dans ce paragraphe que le corps K est algébriquement clos et donc tout polynôme est scindé
sur K.
Définition. On appelle bloc de Jordan de taille d et valeur propre λ la matrice carrée
 
λ 0 ...
1 λ 
 .. 
0

1 . 
J(d; λ) := 

.. .. 

 . . 

 1 λ 0
0 1 λ

Si λ = 0 on note simplement J(d) = J(d, 0). Remarquons que certains auteurs appellent bloc de Jordan
la transposée de J(d, λ) ; le principal intérêt de ces matrices est de fournir des représentants explicites des
classes de conjugaison de matrices et d’après le corollaire précédent J et t J sont semblables donc choisir
l’une ou l’autre a peu d’influence sur le résultat fondamental suivant

57
Théorème (Décomposition de Jordan) Toute matrice carrée est semblable à une matrice composée de blocs
de Jordan sur la diagonale et de zéros ailleurs, i.e. du type
 
J(d1 , λ1 )
J =
 .. 
. 
J(dr , λr )

De plus les blocs sont uniques, à l’ordre près.

Nous donnons une preuve en terme de K[X]-modules, pour une preuve uniquement en terme de K-espace
vectoriel, voir le paragraphe suivant.
Preuve. Q Le K[X]-module peut être décomposé en produit de modules cycliques K[X]/P K[X] et comme
P = λ (X − λ)mλ , on peut, en utilisant le lemme chinois généralisé le décomposer en produit de modules
cycliques de la forme K[X]/(X −λ)m K[X]. Pour analyser ce dernier, quitte à faire le changement de variable
Y = X − λ (ce qui revient aussi à remplacer u par u − λid) on peut supposer λ = 0. Si l’on note x la classe de
X dans K[X]/X m K[X], une K-base de K[X]/X m K[X] est fournie par e1 = 1, e2 = x, . . . , em = xm−1 et
dans cette base l’action de u, qui correspond à la multiplication par x est donnée par u(e1 ) = e2 , u(e2 ) = e3 ,
. . . , u(em−1 ) = em et enfin u(em ) = xm = 0. La matrice de u − λid dans cette base est donc bien un bloc de
Jordan J(m). L’unicité des blocs (à l’ordre près) est clair si l’on observe que les dimensions des Ker(u − λ)j
sont déterminées par les (di , λi ) et vice versa.

D.3.4. Supplément : les tableaux de Young

Reprenons l’étude d’un endomorphisme u de E et démontrons directement (i. e. en utilisant uniquement
l’algèbre K-linéaire)
Q que u possède une décomposition de Jordan. Si le polynôme caractéristique s’écrit
det(u − Xid) = λ (X − λ)mλ alors E = ⊕ Ker(u − λ)mλ donc on se ramène au cas d’un endomorphisme
nilpotent. On peut donc supposer un = 0.
Posons Ki = Ker(ui ) et soit r le plus petit entier tel que Kr = E alors

{0} ⊂ K1 ⊂ . . . ⊂ Kr .

Choisissons Hi un supplémentaire de Kr−i dans Kr−i+1 c’est-à-dire tel que Kr−i+1 = Kr−i ⊕ Hi . Observons
que la restriction de u à Hi est injective (en effet Ker(u) = K1 ⊂ Kr−i donc Ker(u) ∩ Hi = {0}) et montrons
qu’on peut de plus imposer u(Hi−1 ) ⊂ Hi (ce qui montrera également que hi−1 ≤ hi ). En effet, une fois
choisi Hi , on remarque que si x ∈ Hi ⊂ Kr−i+1 est non nul, alors u(x) ∈ Kr−i mais u(x) ∈ / Kr−i−1 (sinon
x ∈ Kr−i ); on a donc u(Hi ) ∩ Kr−i−1 = {0} et u(Hi ) ⊂ Kr−i et l’on peut construire un supplémentaire
Hi+1 de Kr−i−1 dans Kr−i qui contienne u(Hi ). Le choix de H1 est arbitraire.
On peut maintenant choisir une base de E = ⊕i Hi ainsi (où l’on note hi = dim(Hi )
• On choisit B1 = (e1,j )1≤j≤h1 base de H1 .
• On choisit B2 = (e2,j )1≤j≤h2 base de H2 en imposant e2,j = u(e1,j ) pour j ≤ h1 .
• Ayant construit Bi = (ei,j )1≤j≤hi base de Hi , on choisit Bi+1 = (ei+1,j )1≤j≤hi+1 base de Hi+1 en
imposant ei+1,j = u(ei,j ) pour j ≤ hi .
On regroupe maintenant E = ⊕hj=1 r
Ej avec Ej le sous-espace vectoriel ayant pour base Bj0 = (ei,j )i∈Ij (où
Ij = {i | 1 ≤ i ≤ r et j ≤ hi }). On voit facilement que les Ej sont stables par u et que la matrice de u|Ej
dans la base Bj0 est une matrice de Jordan de taille dj = card(Ij ); en effet par construction u(ei,j ) = ei+1,j
sauf le dernier qui est nul. On obtient donc la matrice de u dans la base B 0 = B10 ∪ . . . Bh0 r

 J(d ) 0 ... 
1
 0 J(d2 )
Mat(u, B 0 ) = 

.. 
 . 0

0 J(dhr )

58
La combinatoire un peu embrouillée peut être clarifiée par l’introduction des tableaux de Young. On calcule
hi = dim(Kr−i+1 ) − dim(Kr−i ). On dessine un premier tableau en rangeant hr carrés sur la première
ligne, puis hr−1 carrés sur la seconde et ainsi de suite (sur le dessin h7 = 6, h6 = h5 = 5, h4 = 2 et
h3 = h2 = h1 = 1), le tableau dual s’obtient en inversant ligne et colonnes. On obtient alors d1 carrés sur
la première ligne, d2 sur la deuxième etc. (sur l’exemple d1 = 7, d2 = 4, d3 = d4 = d5 = 3 et d6 = 1), ce
qui donne la taille des blocs de Jordan. Ce procédé permet, inversement, de calculer dim(Ki ) à partir de la
taille des blocs de Jordan.

Premier tableau Tableau dual

59
E. GROUPES CLASSIQUES.

La géométrie “classique” ne considère souvent que la norme euclidienne sur Rn donnée par ||x||2 = x21 +
. . . + x2n et le produit scalaire associé hx|yi = x1 y1 + . . . + xn yn ainsi que la norme sur Cn donnée par
||z||2 = z1 z̄1 + . . . + zn z̄n et le produit hermitien associé hz|wi = z1 w̄1 + . . . + zn w̄n ainsi bien sûr que les
isométries associées. Plusieurs théories amènent néanmoins à considérer des formes plus générales :
• La relativité (ou l’équation des ondes) conduit à considérer la forme quadratique de Minkowski qui, en
notant (x1 , x2 , x3 , t) un vecteur de R4 , s’écrit ||x||2 = x21 + x22 + x23 − c2 t2 .
• Les équations de la mécanique de Lagrange (ou Hamilton) amène à introduire pour x, y ∈ R2n le produit
B(x, y) = (x1 y2 − x2 y1 ) + . . . + (x2n−1 y2n − x2n y2n−1 ). La parité de la dimension de l’espace s’explique par
le fait qu’on considère ensemble la “position” et la “vitesse” d’une particule (espace des phases).
• L’arithmétique oblige à considérer d’autres corps que R ou C, par exemple le problème de savoir si, pour
n et D donnés, on peut trouver des solutions entières de x2 + Dy 2 = n ou x21 + . . . + x2r = n.
• Les géométries finies (utiles en théorie des groupes, en combinatoire et bien sûr en informatique) requièrent
de travailler sur des corps finis Z/pZ ou plus généralement Fq .
Le paysage usuel se trouve ainsi démultiplié : si le corps K possède une topologie (par exemple, si K = R ou
C) on peut se demander si le groupe est compact, connexe, etc ; si le corps K est fini, on peut se demander
quel est le cardinal de ces groupes, etc. Néanmoins, une “surprise” est que cette diversification n’entraı̂ne
pas la multiplication des groupes associés. En fait à tous les étages, ce sont les groupes dit classiques,
c’est-à-dire le groupe des matrices carrés inversibles, le groupe des matrices de déterminant 1, le groupe des
matrices respectant une forme quadratique (groupe orthogonal), le groupe des matrices respectant une forme
alternée (groupe symplectique), le groupe des matrices respectant une forme hermitienne (groupe unitaire)
qui fournissent, à quelques exceptions près, les groupes “intéressants”. Nous ne montrerons pas cela (voir
l’article de Tits cité en bibliographie) mais incluons néanmoins cette affirmation pour motiver l’étude des
groupes classiques.
E.1. Formes sesqui-linéaires.
Définition. Soit E, F des K-espaces vectoriels, σ un automorphisme de K, une application f : E → F
est σ-linéaire si f (x + y) = f (x) + f (y) et f (ax) = σ(a)f (x). Une forme B : E × F → K est σ-sesqui-
linéaire si, pour y ∈ F , l’application B(., y) : E → K est une forme linéaire et, pour x ∈ E, l’application
B(x, .) : F → K est une forme σ-linéaire.
On appelle noyau à gauche de B (resp. à droite) l’ensemble

Kerg (B) = {x ∈ E |∀y ∈ F, B(x, y) = 0} (resp. Kerd (B) = {y ∈ F |∀x ∈ E, B(x, y) = 0})

Il est immédiat de voir que ce sont des sous-espaces vectoriels. On dit que B est non dégénérée si ses
noyaux à gauche et à droite sont nuls. La forme B induit une forme B̄ : E/ Kerg (B) × F/ Kerd (B) → K
définie par B̄(x + Kerg (B), y + Kerd (B)) := B(x, y). La forme B̄ est non dégénérée. Ces considérations
permettent en général de se ramener au cas des formes non dégénérées. Dans le cas d’une forme non
dégénérée B : E × F → K, on voit que l’application y → B(., y) induit une injection de F vers E ∗
donc dim(F ) ≤ dim(E ∗ ) ; l’application x → σ −1 ◦ B(x, .) induit une injection de E vers F ∗ et donc
dim(E) ≤ dim(F ∗ ). Dans le cas où E (ou F ) est de dimension finie, on en tire donc que dim(E) = dim(F )
et que B permet d’identifier E et F ∗ (ou F et E ∗ ). Les espaces E et F étant donc isomorphes, on voit que
le cas essentiel à considérer est celui d’une forme non dégénérée B : E × E → K, cas que nous considérons
donc désormais.
Il est naturel de considérer la relation d’orthogonalité x ⊥ y si B(x, y) = 0. Une condition naturelle à
imposer est que cette relation soit symétrique (i. e. x ⊥ y ⇔ y ⊥ x) ; une telle relation est décrite par la
proposition suivante
Proposition. Soit B : E × E → K une forme σ-sesqui-linéaire non dégénérée et vérifiant

x⊥y⇔y⊥x (∗)

60
alors on est dans un des trois cas suivant :
(i) (Forme symétrique) On a σ = id et ∀x, y ∈ E, B(x, y) = B(y, x).
(ii) (Forme anti-symétrique) On a σ = id et ∀x, y ∈ E, B(x, y) = −B(y, x).
(iii) (Forme σ-hermitienne) On a σ 6= id mais σ 2 = id et il existe α ∈ K ∗ tel que, si B 0 (x, y) = αB(x, y),
alors on a ∀x, y ∈ E, B 0 (x, y) = σ ◦ B 0 (y, x).
Preuve. Si dim(E) = 1, l’énoncé est trivial (et sans intérêt) ; on peut donc supposer dim(E) ≥ 2. Soit
x ∈ E \ {0}, considérons les formes linéaires fx (y) = B(y, x) et gx (y) = σ −1 ◦ B(x, y) ; elles ont, par
hypothèse, même noyau donc sont proportionnelles, c’est-à-dire qu’il existe α(x) ∈ K ∗ tel que fx = α(x)gx
ou encore B(y, x) = α(x)σ −1 ◦ B(x, y). Montrons d’abord que α ne dépend pas de x. Considérons pour cela
l’application i : E → E ∗ donnée par x 7→ fx qui est σ-linéaire et bijective et l’application j : E → E ∗ donnée
par x 7→ gx qui est σ −1 -linéaire et bijective. Introduisons h = j −1 ◦i : E → E, alors comme i(x) = α(x)j(x) on
a h(x) = j −1 (α(x)j(x)) = σ(α(x))j −1 ◦j(x) = σ(α(x))x. Ainsi h(x) = λ(x)x (en posant λ(x) = σ(α(x))) ; de
plus l’application h est σ 2 -linéaire. Si x, y sont non colinéaires, on a d’une part h(x+y) = λ(x+y)y+λ(x+y)x
d’autre part h(x + y) = h(x) + h(y) = λ(x)x + λ(y)y donc λ(x) = λ(x + y) = λ(y). Si enfin x et y sont
colinéaires, on peut choisir z non colinéaire avec x, y (car dim(E) ≥ 2) donc λ(x) = λ(z) = λ(y) et ainsi
α(x) = α(y) = α. On voit ainsi que h est linéaire (donc σ 2 = id) et que B(y, x) = ασ −1 ◦ B(x, y). Supposons
d’abord σ = id alors B(y, x) = αB(x, y) = α2 B(y, x) donc α2 = 1 ou encore α = ±1, ce qui donne les
deux premiers cas (i) et (ii). Supposons maintenant σ 6= id et commençons par montrer qu’il existe x0 ∈ E
tel que B(x0 , x0 ) = β 6= 0. En effet sinon on aurait pour tout x, y ∈ E l’égalité 0 = B(x + y, x + y) =
B(x, x) + B(x, y) + B(y, x) + B(y, y) = B(x, y) + B(y, x) donc B antisymétrique et bilinéaire contredisant
σ 6= id. Posons alors B 0 = β −1 B, remarquons que β = B(x0 , x0 ) = ασ −1 ◦ B(x0 , x0 ) = ασ −1 (β) et calculons

B 0 (y, x) = β −1 (B(y, x) = β −1 ασ −1 ◦ B(x, y) = β −1 ασ −1 (βB 0 (x, y)) = σ −1 (B 0 (x, y)),

ce qui prouve bien que B 0 est σ-hermitienne.

Si la caractéristique de K est deux, alors +1 = −1 et, par convention, on considèrera que si B(x, y) = B(y, x)
la forme est anti-symétrique (on exclut donc le cas (i)) en caractéristique 2). Dans le cas (i), la forme B
est associée à une forme quadratique Q(x) := B(x, x) et on parle de géométrie orthogonale ; le groupe
{f ∈ GL(E) | ∀x, y ∈ E, B(f (x), f (y)) = B(x, y)} s’appelle le groupe orthogonal de la forme Q (ou B) et se
note O(E, Q) ou O(Q). Le sous-groupe O(E, Q) ∩ SL(E) se note SO(Q) ; il est d’indice deux dans O(Q).
Dans le cas (iii), la forme B est associée à une forme hermitienne H(x) := B(x, x) et on parle de géométrie
unitaire ; le groupe {f ∈ GL(E) | ∀x, y ∈ E, B(f (x), f (y)) = B(x, y)} s’appelle le groupe unitaire de la forme
H (ou B) et se note U(E, H) ou U(H). Le sous-groupe U(E, H) ∩ SL(E) se note SU(H). Dans le cas (ii),
on parle de géométrie symplectique ; le groupe {f ∈ GL(E) | ∀x, y ∈ E, B(f (x), f (y)) = B(x, y)} s’appelle
le groupe symplectique de la forme B et se note Sp(E, B) ou Sp(B). On verra que Sp(B) ⊂ SL(E).
Remarque. Si B est symétrique et on pose Q(x) = B(x, x) on voit facilement que

1
B(x, y) = (Q(x + y) − Q(x) − Q(y))
2
et donc la donnée de la forme bilinéaire équivaut à la donnée de la forme quadratique Q. La même remarque
vaut en fait quand on compare une forme σ-hermitienne B et H(x) := B(x, x).
On peut classifier les involutions non triviales d’un corps K à l’aide de ses sous-extensions quadratiques. Si
la caractéristique de K n’est pas 2, cette classification est donnée ci-dessous, voir les exercices pour le cas de
caractéristique 2.
Proposition. Soit K un corps de caractéristique 6= 2 et σ une involution non triviale de K, alors K0 :=
{x ∈ K | σ(x) = x} est un sous-corps avec [K : K0 ] = 2 et il existe α ∈ K \ K0 tel que α2 = d ∈ K0 et alors
σ est donnée par σ(a + bα) = a − bα (lorsque a, b ∈ K0 ). Inversement, toute extension K/K0 de degré 2
correspond à une telle involution.
Preuve. Soit σ 6= id une involution de K, il est immédiat de vérifier que K0 := {x ∈ K | σ(x) = x} est un
sous-corps. Si x ∈ K \ K0 alors σ(x) + x et σ(x)x sont dans K0 donc le polynôme X 2 − (σ(x) + x)X + σ(x)x

61
est dans K0 [X] et annule x et [K0 (x) : K0 ] = 2. L’élément α := x − σ(x) vérifie σ(α) = −α donc α ∈
/ K0
et K0 (α) = K0 (x). Par ailleurs si y ∈ K \ K0 et β = y − σ(y) alors σ(β) = −β et K0 (β) = K0 (y), donc
σ(α/β) = α/β donc α/β ∈ K0 donc β ∈ K0 (α) et ainsi K = K0 (α). Inversement si [K : K0 ] = 2, soit
x ∈ K \ K0 , alors K = K0 (x) et x est racine de X 2 + aX + b ∈ K0 [X]. Posons α = x + a/2 (c’est ici que
l’on doit supposer car(K) 6= 2) alors α est racine de X 2 − d = 0 avec d = (a2 − 4b)/4. On vérifie alors
directement que la formule σ(a + bα) = a − bα définit un automorphisme involutif de K tel que K0 soit le
sous-corps fixé.

Exercice. Montrer qu’on peut reconstruire un produit hermitien à partir de la forme hermitienne en montrant
que, si σ(α) = −α alors

1 1 1
B(x, y) = H(x + y) − H(x − y) − H(x + αy) + H(x − αy) .
4 α α

Si F ⊂ E on définit l’orthogonal de F comme F ⊥ = {x ∈ E | ∀y ∈ F, B(x, y) = 0} (noter que cette définition

n’est vraiment raisonnable que si B est symétrique, anti-symétrique ou hermitienne).
Lemme. dim(F ) + dim(F ⊥ ) = dim(E) et par conséquent, si F ∩ F ⊥ = {0} alors E = F ⊕ F ⊥ .
Preuve. Soit e1 , . . . , er une base de F et Φ : E → K r définie par Φ(x) = (B(x, e1 ), . . . , B(x, er )). On a
Ker(Φ) = F ⊥ et Φ est surjective Pr car sinon l’image serait Pr contenue dans un hyperplan et P l’on aurait une
0 r 0
équation du type ∀x ∈ E, i=1 λi B(x, ei ) = B (x, i=1 λi ei ) = 0 ce qui entraı̂nerait i=1 λi ei = 0,
contredisant l’indépendance linéaire des ei . On obtient bien dim(E) = dim Im(Φ) + dim Ker(Φ) = dim(F ) +
dim(F ⊥ ).

Application. (Décomposition en somme orthogonale.)

1er exemple. Supposons B symétrique ou σ-hermitienne. On dit que x est isotrope si B(x, x) = 0. Si x
non isotrope, alors E = hxi ⊕ hxi⊥ . De plus il est clair que si B est non dégénérée, il existe un vecteur
non isotrope; on voit donc, par récurrence sur la dimension, qu’il existe une base orthogonale ou encore une
base e1 , . . . , en telle que E = he1 i ⊕ . . . ⊕ hen i soit une décomposition orthogonale (i.e. avec B(ei , ej ) = 0
pour i 6= j). Dans une base convenable, la forme quadratique Q(x) := B(x, x) (resp. la forme hermitienne
H(x) = B(x, x)) s’écrit donc Q(x) = a1 x21 + . . . + an x2n avec ai ∈ K (resp. H(x) = a1 x1 xσ1 + . . . + an xn xσn
avec ai ∈ K0 ).
Si K = C (ou plus généralement K est algébriquement clos) on peut écrire ai = b2i et choisir une base
où Q(x) = x21 + . . . + x2n . Si K = R on peut écrire ai = ±b2i et choisir une base où Q(x) = x21 + . . . +
x2r − x2r+1 − . . . − x2n . Si K = C et σ est la conjugaison complexe on peut trouver une base telle que
H(x) = x1 xσ1 + . . . + xr xσr − xr+1 xσr+1 − . . . − xn xσn .
2ème exemple. Définissons un plan hyperbolique comme un espace P de dimension 2 possédant une base
e1 , e2 avec B(e1 , e2 ) = 1 et B(e1 , e1 ) = B(e2 , e2 ) = 0. Remarquons que si x ∈ E est isotrope, on peut
trouver un deuxième vecteur y tel que hx, yi soit un plan hyperbolique. En effet, on commence par prendre
x0 tel que B(x, x0 ) 6= 0, en remplaçant x0 par un multiple, on se ramène à B(x, x0 ) = 1; on calcule alors
B(x, ax + x0 ) = B(x, x0 ) = 1 et on vérifie que B(ax + x0 , ax + x0 ) = 2a + B(x0 , x0 ) donc y = − 21 B(x0 , x0 )x + x0
convient (si la caractéristique est 2, on a B(x0 , x0 ) = 0 et y = x0 ). De plus on a clairement P ∩ P ⊥ = {0} et
donc en itérant le procédé, on voit que tout espace E muni d’une forme non dégénérée peut se décomposer
sous la forme :
E = P1 ⊥ . . . ⊥ Pm ⊥ F
avec Pi plan hyperbolique et F sous-espace sur lequel la forme n’a aucun vecteur isotrope non nul. On
remarquera que m est un invariant de la forme quadratique (i. e. une autre décomposition fera apparaı̂tre
le même nombre de plans hyperboliques).
3ème exemple. Si B(x, x) = B(y, y) = 0 et B(x, y) 6= 0 alors x, y engendre un plan hyperbolique Π et
E = Π ⊕ Π⊥ . Si maintenant B est antisymétrique non dégénérée, alors E contient nécessairement un tel plan
hyperbolique et en répétant le procédé, on voit que E sera somme orthogonale de plans hyperboliques. En

62
particulier la dimension de E est paire et il existe une base dite symplectique e1 , . . . , e2n telle que B(ei , ej ) = 0
sauf B(ei , ei+n ) = −B(ei+n , ei ) = 1 pour 1 ≤ i ≤ n.
Si l’on identifie K n et E, via une base e1 , . . . , en de E, puis GL(E) et GL(n, K) l’interprétation matricielle
d’une forme σ-sesquilinéaire est donnée par une matrice carrée A dont les coefficients sont les B(ei , ej ) :

∀X, Y ∈ K n , B(X, Y ) = t XAσ(Y ).

On vérifie aisément que B est symétrique si et seulement si tA = A, anti-symétrique si et seulement si

t
A = −A, et σ-hermitienne si et seulement si t A = σ(A). Enfin si A est la matrice associée à la forme B le
groupe orthogonal, symplectique ou unitaire s’écrit comme le groupe

G = {M ∈ Mat(n × n; K) | t M Aσ(M ) = A}.

Dans le cas où la forme est symétrique ou hermitienne, on peut se ramener à une matrice A diagonale à
coefficients dans K si la forme est bilinéaire, à coefficients dans K0 = {x ∈ K | σ(x) =
x} si la forme est
0 I
σ-hermitienne. Enfin si la forme est antisymétrique, on peut se ramener à A = et écrire le groupe
−I 0
symplectique

A B t t t t
Sp(2n, K) = M = | AC et BD sont symétriques et AD − CB = I .
C D

D’un point de vue géométrique, d’autres groupes sont naturels à considérer, notamment celui des simili-
tudes et isométries affines, ainsi que les groupes résultant de l’action sur l’espace projectif; définissons-les
brièvement.
Définition Soit B : E × E → K une forme sesqui-linéaire, on appelle similitude un automorphisme f de E
tel qu’il existe µ ∈ K ∗ tel que

∀x, y ∈ E, B(f (x), f (y)) = µB(x, y),

l’élément µ s’appelle le multiplicateur de f .

Remarque. Le groupe des multiplicateurs contient les carrés (resp. les éléments “normes” de la forme aσ(a))
si B est symétrique ou antisymétrique (resp. hermitienne). Le groupe des similitudes contient évidemment
les homothéties et les isométries. En fait, le groupe des multiplicateurs est exactement celui des carrés
(resp. des normes) si et seulement si les similitudes sont les produits d’une isométrie par une homothétie.
Si n est impair on vérifie facilement que le sous-groupe des multiplicateurs est égal au groupe des carrés
(cas orthogonal) ou au groupe des normes xσ(x) (cas hermitien) et donc une similitude est produit d’une
isométrie par une homothétie. Quand la dimension est paire, ce n’est pas toujours le cas comme on peut le
vérifier élémentairement dans le cas d’un plan hyperbolique.
Exercice. Les similitudes sont les seules applications linéaires f : E → E préservant la relation d’orthogonalité
(i. e. telle que x ⊥ y ⇔ f (x) ⊥ f (y)).
Rappelons que si E est un K-espace vectoriel (de dimension n + 1), l’espace projectif P(E) correspondant
est défini comme l’ensemble des droites vectorielles de E ou encore comme le quotient de E \ {0} par la
relation de colinéarité. Si E = K n+1 on peut noter P(E) = Pn (K). Le groupe GL(E) = GLn+1 (K) possède
une action naturelle sur l’espace projectif P(E) = Pn (K) définie par (f, D) 7→ f (D). Le noyau de cette
action est aussi le centre de GLn+1 (K), i.e. l’ensemble des homothéties. Ceci justifie les notations/définitions
suivantes.
Définition Le quotient du groupe GL(E) par les homothéties de rapport α ∈ K ∗ s’appelle le groupe projectif
linéaire ; il se note PGL(E). De manière générale, on note PSL(E) (resp. PSO(E, B), PSp(E, B), PSU(E, B),
etc.) l’image dans PGL(E) de SL(E) (resp. SO(E, B), Sp(E, B), SU(E, B), etc.)

63
Remarque On peut aussi introduire l’espace des sous-espaces vectoriels de dimension r dans E (un K-espace
vectoriel de dimension n + 1). Celui-ci s’appelle Grasmannienne et est muni d’une action transitive de
GLn+1 (K) ou encore de PGLn+1 (K), définie par (σ, F ) 7→ σ(F ).

Nous allons maintenant étudier brièvement les groupes orthogonaux, symplectiques et unitaires. Mais avant
d’étudier ces groupes classiques donnons quelques raisonnements généraux concernant les groupes. En partic-
ulier, nous allons introduire un argument assez général dû essentiellement à Iwasawa qui permet de démontrer
la simplicité de quelques groupes.

Rappelons tout d’abord deux notions.

(i) Une action ρ : G → Bij(X) d’un groupe G sur X est doublement transitive si pour tout x1 6= x2 ,
y1 6= y2 il existe g ∈ G tel que g · x1 = y1 et g · x2 = y2 (on pourrait définir de même la notion d’action
n-transitive).
(ii) Le sous-groupe des commutateurs D(G) d’un groupe G est le sous-groupe engendré par les commutateurs
[x, y] = xyx−1 y −1 . C’est un sous-groupe distingué et c’est le plus petit sous-groupe distingué de G tel
que le quotient soit abélien.

Proposition Soit ρ : G → Bij(X) une action doublement transitive; supposons qu’il existe des sous-groupes
abéliens {Ax }x∈X dont la réunion engendre G et tels que gAx g −1 = Ag·x . Si N est un sous-groupe distingué
de G alors ou bien N ⊂ Ker(ρ), i.e. N agit trivialement, ou bien N agit transitivement et contient D(G).
En particulier, si de plus G = D(G) alors le groupe G/ Ker(ρ) est simple.

Preuve. Soit x ∈ X et H := Gx , la double transitivité se traduit par le fait que bien sûr G agit transitivement
sur X mais aussi que H agit transitivement sur X \ {x}. On en tire en particulier que, dès que g ∈ / H, on a
G = H ∪ HgH et en particulier que H est un sous-groupe (propre) maximal. Si maintenant N / G alors N 0 =
N H est un sous-groupe donc est égal soit à G (si N 6⊂ H) soit à H (si N ⊂ H). Dans le premier cas, d’après
ce qui précède, l’action de N est transitive, dans le second cas on a N = gN g −1 ⊂ gHg −1 = Gg·x donc N agit
trivialement. Si N agit transitivement, il suffit de voir que N Ax = G car alors G/N = N Ax /N ∼ = Ax /Ax ∩ N
est abélien et donc D(G) ⊂ N ; il suffit donc de montrer que tous les sous-groupes Ay sont contenus dans
N Ax . Mais N Ax est aussi le sous-groupe engendré par N et Ax ; soit y ∈ X alors il existe n ∈ N tel que
n · x = y donc Ay = nAx n−1 est contenu dans N Ax . Si de plus G = D(G), soit s : G → G/ Ker(ρ) la
surjection canonique et {e} = 6 M / G/ Ker(ρ); considérons N := s−1 (M ), il n’agit pas trivialement sur X et
il est distingué dans G donc la démonstration précédente montre que D(G) est contenu dans N et donc que
N = G et finalement que M = G/ Ker(ρ).

La proposition suivante peut être utile pour calculer le groupe D(G).

Proposition. Soit G un groupe, notons G2 le sous-groupe engendré par les carrés d’éléments de G.
(i) Le sous-groupe G2 est distingué et contient D(G).
(ii) Si G est engendré par des éléments d’ordre 2, alors G2 = D(G).
(iii) Si G est engendré par des éléments d’ordre 2 tous conjugués, alors (G : D(G)) ≤ 2.

Preuve. Comme yx2 y −1 = (yxy −1 )2 , on voit que G2 est bien distingué dans G; de plus le quotient G/G2
est d’exposant 2 donc abélien [en effet (ab)2 = abab = e entraı̂ne ab = ba] et donc D(G) ⊂ G2 . Si x1 , . . . , xm
sont des éléments d’ordre 2 alors (x1 . . . xm )2 = x1 . . . xm x−1 −1
1 . . . xm est un produit de commutateurs donc
2
si tout élément de G est de la forme x1 . . . xm , on a bien G = D(G). Enfin si on note x̄ l’image de x dans
G/D(G), on a yxy −1 = x̄ et donc, sous les hypothèses de (iii), l’image d’un des éléments d’ordre 2 engendre
G/D(G).

E.2. Les groupes GL(n, K) et SL(n, K).

Les relations entre les groupes GLn (k), SLn (k), PGLn (k) et PSLn (k) peuvent être décrites par le diagramme
suivant où les lignes et colonnes sont exactes et où la flèche GLn (k) → k ∗ dans la ligne centrale est le

64
déterminant et où on note µn (k) := {x ∈ k ∗ | xn = 1} et k ∗n := {xn | x ∈ k ∗ }.

0 0 0
↓ ↓ ↓
0 → µn (k) → k∗ → k ∗n → 0
↓ ↓ ↓
0 → SLn (k) → GLn (k) → k∗ → 0
↓ ↓ ↓
0 → PSLn (k) → PGLn (k) → k ∗ /k ∗n → 0
↓ ↓ ↓
0 0 0

Si k = Fq on obtient aisément, en comptant les bases de E = Fnq :

card (GLn (Fq )) = (q n − 1) (q n − q) . . . q n − q n−1

et on peut en déduire le cardinal des autres groupes SLn (k), PGLn (k) et PSLn (k).
On va maintenant décrire des transformations donnant un ensemble très utile de générateurs de SLn (k).
Définition. Une transvection est un élément de SLn (k) \ {Id} laissant fixe un hyperplan.
On voit aisément qu’une telle application est nécessairement de la forme u(x) = x + f (x)a avec a vecteur non
nul et f forme linéaire non nulle contenant a dans son noyau. La droite engendré par a est caractérisée par
u et on dira que u est une transvection de droite hai. L’ensemble des transvections de direction une droite
forment un sous-groupe isomorphe à k n−1 . Si σ = t(a, f ) désigne la transvection telle que σ(x) = x + f (x)a
alors, pour ρ ∈ GL(E), on a : ρ ◦ t(a, f ) ◦ ρ−1 = t(ρ(a), f ◦ ρ−1 ). Enfin, dans une base convenable la matrice
d’une transvection est une matrice avec des 1 sur la diagonale et un unique coefficient non nul au dessus de
la diagonale et que l’on peut prendre égal à 1. En particulier toutes les transvections sont conjuguées dans
GLn (k); on voit aisément que cela reste vrai dans SLn (k) lorsque n ≥ 3 (ce dernier point n’est plus vrai dans
SL2 (k)).
Thorme. Le centre de GLn (k) est le sous-groupe des homothéties que l’on peut identifier à k ∗ ; Le centre
de SLn (k) est le sous-groupe des homothéties de rapport une racine n-ième, que l’on peut identifier à µn (k).
Preuve. Une matrice commutant avec la transvection t(a, f ) doit laisser stable la droite engendrée par a.
On a vu qu’une telle application doit être une homothétie. Enfin l’homothétie de rapport λ est dans SLn (k)
si et seulement si λn = 1.

Thorme. Les transvections engendrent SLn (k).

Preuve. On prouve d’abord que si x, y ∈ E non nuls, il existe un produit de transvections u tel que
u(x) = y. Si x et y ne sont pas colinéaires, on choisi a = y − x et f forme linéaire nulle sur a mais pas
sur x (ni sur y donc); quitte à multiplier f par un scalaire on peut s’assurer que f (x) = 1. On a alors
t(a, f )(x) = x + f (x)(y − x) = y. Si x et y sont colinéaires, on passe par un troisième vecteur z non colinéaire
et deux transvections telles que u2 (x) = z et u1 (z) = y.
Si maintenant v ∈ SLn (k) et x ∈ E non nul, il existe u produit de transvections tel que v ◦ u(x) = x. Si la
dimension est 2, on en déduit que v ◦u est une transvection, sinon on procède par récurrence sur la dimension.
L’application v ◦ u induit une application sur Ē = E/hxi qui est encore de déterminant 1 et peut donc, par
hypothèse de récurrence, s’écrire comme produit de transvections de Ē. En relevant les transvections de Ē
en des transvections de E on conclut (les détails sont laissés au lecteur).

Thorme. Le groupe des commutateurs de GLn (k) est D(GLn (k)) = SLn (k) sauf pour n = 2 et k = F2 . Le
groupe des commutateurs de SLn (k) est D(SLn (k)) = SLn (k) sauf pour n = 2 et k = F2 ou F3 .
Preuve. On a clairement D(SLn (k)) ⊂ D(GLn (k)) ⊂ SLn (k). Soit σ une transvection. Si car(k) 6= 2, alors
σ 2 est encore une transvection (de même droite) donc s’écrit σ 2 = ρσρ−1 (si n ≥ 3 on peut même choisir

65
ρ ∈ SLn (k)). Ainsi σ = σ 2 σ −1 = ρσρ−1 σ −1 est un commutateur de GLn (k) (et même un commutateur
de SLn (k) si n ≥ 3). Pour examiner les cas n = 2 ou car(k) = 2, il suffit essentiellement d’observer
que si k 6= F2 ou F3 il y a des matrices
diagonales dans SL2 (k) qui ne sont pas des homothéties,
tout
a 0 1 1
simplement les matrices ρ = avec a ∈ k \ {0, 1, −1}. Si l’on choisit σ = et on observe
0 a−1 0 1
1 a2 − 1
que ρσρ−1 σ −1 = on voit que D(SL2 (k)) contient une et donc toutes les transvections et donc
0 1
tout SL2 (k)).

Thorme. Soit k un corps (commutatif) et n ≥ 2 alors le groupe PSLn (k) est simple sauf pour n = 2 et
k = F2 ou F3 .
Preuve. On va utiliser, pour varier, la méthode d’Iwasawa cité en introduction à ce chapitre. Soit E un
k-espace vectoriel de dimension n ≥ 2. Considérons l’action de G = SL(E) sur X = P(E), un élément x ∈ X
peut être vu comme une droite vectorielle de E; considérons Ax le sous-groupe des transvections de droite
x. Il est immédiat de vérifier que Ax ∼
= k n−1 est commutatif et on vérifie bien gAx g −1 = Ag·x : en effet si
a est un vecteur non nul de direction x, tout élément u ∈ Ax s’écrit u(y) = y + f (y)a avec f forme linéaire
nulle en a. Appelons donc Ex∗ = {f ∈ E ∗ | f (a) = 0} alors f 7→ u : y → y + f (y)a définit un isomorphisme
de groupes de Ex∗ vers Ax et comme vuv −1 (y) = y + f (v −1 (y))v(a), on a bien vAx v −1 = Av(x) . Par ailleurs,
on sait que les transvections engendrent SL(E). On a vu que D(SL(E)) = SL(E) sauf si n = 2 et k = F2 ou
F3 ; on en déduit donc le théorème.

Remarque. Si k = Fq , n = dim(E), notons d = PGCD(n, q − 1), alors

Qn
(q n − q n−i )
card PSLn (Fq ) = i=1
d(q − 1)

Remarque. Comme PSL2 (F2 ) ∼ = S3 et PSL2 (F3 ) ∼= A4 ne sont pas égaux à leurs sous-groupes de commu-
tateurs, ils ne sont pas simples. En considérant l’action de PSL2 (F4 ) sur P1 (F4 ) de cardinal 5, on voit que
ρ : PSL2 (F4 ) → S5 induit un isomorphisme ρ0 : PSL2 (F4 ) → A5 .

E.3. Groupe orthogonal.

Commençons par décrire entièrement le cas de la dimension 2 qui est particulier.
Proposition. Soit Q(x1 , x2 ) = x21 + Dx22 avec D ∈ K ∗ , alors le groupe des isométries directes s’écrit

a −cD 2 2
SO(Q) = a + Dc = 1
c a

Si −D est un carré
√
dans K alors SO(Q) ∼ = K ∗ ; si −D n’est pas un carré dans K alors SO(Q) ∼ = {x ∈
√ ∗ K( −D) −
K( −D) | NK (x) = 1}; en particulier le groupe SO(Q) est abélien. Les éléments de O (Q) sont des
symétries par rapport à une droite et, si s ∈ O− (Q) et r ∈ SO(Q), alors srs−1 = r−1 .

a b
Preuve. Un calcul direct montre que M = est dans O(Q) si et seulement si a2 + Dc2 = 1,
c d
b2 + Dd2 = D et ab + Dcd = 0. Si c = 0 on voit que b = 0 et donc a2 = d2 = 1. Si c 6= 0 , on en
tire d = −ab/cD puis b2 = c2 D2 ou encore b = cD (avec = ±1), puis d = −a et det(M ) = −. Si
0 1
la forme est isotrope, on peut en fait se ramener à une matrice et on voit alors aisément que
1 0
√

a 1
SO(Q) = | a ∈ k ∗ est isomorphe à k ∗ . Si la forme est anisotrope, posons ω = −D , on a
0 a−1
a −cD
un homomorphisme k(ω)∗ → GL2 (k) défini par a + cω 7→ qui induit l’isomorphisme annoncé
c a
entre {a + cω | a2 + Dc2 = 1} et SO(Q). Les dernières affirmations se vérifient directement.

66
Remarque. Le groupe SO(Q) est donc commutatif si E est un plan (dim(E) = 2). On obtient ainsi une
généralisation de la notion d’angle : si le plan contient un vecteur isotrope (i. e. si −D est un carré) alors un
“angle” est donné par un élément α ∈ K ∗ ; si le plan ne contient pas de vecteur isotrope (i. √e. si −D n’est
√ K( −D)
pas un carré) alors un “angle” est donné par un élément α ∈ K1 = {x ∈ K( −D)∗ | NK (x) = 1}.
Par exemple, si K = R on retrouve que dans le cas de la géométrie hyperbolique, un angle est donné par
un réel non nul et dans le cas de la géométrie euclidienne un angle est donné par un complexe α de module
1. Dans le dernier cas on a un homomorphisme surjectif de K = R vers K1 donné par t 7→ exp(2πit). On
retrouve donc l’expression des rotations sous la forme

cos(θ) − sin(θ)
R(θ) = .
sin(θ) cos(θ)

Cherchons maintenant les isométries orthogonales qui fixent un hyperplan.

Lemme. Soit H = hxi⊥ un hyperplan de E et supposons que σ est une isométrie fixant H point par point,
alors
(i) Si Q(x) = 0 alors σ = idE .
(ii) Si Q(x) 6= 0 alors ou bien σ = idE ou bien σ est la symétrie hyperplane définie par

B(x, y)
σ(y) = y − 2 x.
B(x, x)

Preuve. Dans le cas (ii) on a E = hxi ⊥ H et comme σ(H) = H on en tire que σ(x) ∈ hxi donc il existe
λ ∈ K tel que σ(x) = λx. Comme σ est une isométrie, on a λ = ±1. Si λ = 1 alors σ = id et si λ = −1 alors
σ est la symétrie par rapport à l’hyperplan H donné par la formule annoncée. En effet tout vecteur y ∈ E
se décompose en y = (y − (B(y, x)/B(x, x))x) + (B(y, x)/B(x, x))x avec y − (B(y, x)/B(x, x))x ∈ hxi⊥ = H
donc
σ(y) = (y − (B(y, x)/B(x, x))x) − (B(y, x)/B(x, x))x = y − 2(B(x, y)/B(x, x))x.
Dans le cas (i), on a x ∈ H et il existe z ∈ E tel que B(x, z) = 1. On a alors hx, zi⊥ = H0 ⊂ H et
E = hx, zi ⊥ H0 . On sait que σ(H0 ) = H0 donc σ(z) = λx + µz ; on sait aussi que σ(x) = x. On a donc
1 = B(z, x) = B(σ(z), σ(x)) = λB(x, x) + µB(z, x) = µ d’où µ = 1, ainsi que B(z, z) = B(σ(z), σ(z)) =
λ2 B(x, x) + 2λµB(z, x) + µ2 B(z, z) = 2λ + B(z, z) d’où λ = 0 et σ(z) = z donc σ = id.

Si Q(x) 6= 0, on notera sx la symétrie hyperplane caractérisée par ∀y ∈ hxi⊥ , sx (y) = y et sx (x) = −x.
Remarquons que sax = sx pour a ∈ K ∗ ; en fait sx = sy équivaut à x, y colinéaires. Par ailleurs, si ρ est une
isométrie, ρsx ρ−1 = sρ(x) .
Thorme. Les symétries hyperplanes sx avec Q(x) 6= 0 engendrent O(Q).
Preuve. On raisonne par récurrence, le résultat étant facile si n = 1 ou 2. Soit donc σ ∈ O(Q), si il existe
x ∈ E tel que Q(x) 6= 0 et σ(x) = x alors on décompose E = hxi ⊕ hxi⊥ = hxi ⊕ H (disons). Alors
σ 0 := σ|H s’écrit comme produit de symétries hyperplanes s0xi dans H, c’est-à-dire σ 0 = s0x1 . . . s0xm . Notons
donc sxi la symétrie dans E associée à xi ∈ H on a alors σ = sx1 . . . sxm puisque les deux applications sont
des isométries et coı̈ncident sur x et sur H. Soit maintenant x1 non isotrope et x2 = σ(x1 ), si x1 − x2
est non isotrope, alors sx1 −x2 (x1 ) = x2 donc sx1 −x2 ◦ σ fixe x1 et s’écrit donc comme produit de symétries
hyperplanes, donc σ également. Observons que Q(x1 + x2 ) + Q(x1 − x2 ) = 2Q(x1 ) + 2Q(x2 ) = 4Q(x1 ), donc,
si x1 − x2 est isotrope, alors x1 + x2 n’est pas isotrope, et on a sx1 +x2 (x1 ) = −x2 donc sx2 ◦ sx1 +x2 (x1 ) = x2
et sx1 +x2 ◦ sx2 ◦ σ fixe x1 donc est produit de symétries hyperplanes, donc σ également.

Remarque. On peut raffiner l’énoncé précédent en montrant que σ s’écrit comme le produit d’au plus
n = dim(E) symétries hyperplanes (théorème de Cartan-Dieudonné).
Les symétries hyperplanes sont en quelque sorte les involutions les plus simples de O(Q) (sous-espace propre
pour la valeur propre 1 de codimension 1) ; l’analogue pour SO(Q) est constitué par les renversements,

67
c’est-à-dire les isométries directes fixant un sous-espace F de codimension 2 non isotrope (i.e. F ∩ F ⊥ = {0})
et agissant par −1 sur son supplémentaire orthogonal ; ce sont bien sûr également des involutions.
Thorme. Supposons dim(E) ≥ 3, alors les renversements engendrent SO(Q).
Preuve. Remarquons que la conclusion de l’énoncé est fausse en général si dim(E) = 2. Prouvons d’abord
l’énoncé pour n = 3. D’après le théorème précédent, ρ ∈ SO(Q) peut s’écrire comme produit d’un nombre
pair de symétries hyperplanes, il suffit donc de montrer que le produit sx1 sx2 de deux symétries hyperplanes
peut s’écrire comme le produit de deux renversements. Mais en dimension 3, −sx est un renversement et
sx1 sx2 = (−sx1 )(−sx2 ), ce qui achève ce cas. Reprenons le cas général, on peut supposer x1 et x2 non
colinéaires (sinon sx1 sx2 = id) et donc L = hx1 , x2 i⊥ est de codimension 2 et, comme Q(x1 ) et Q(x2 ) 6= 0, on
a dim(L ∩ L⊥ ) ≤ 1 donc on peut choisir L1 hyperplan de L tel que, si on note L2 = L⊥ 1 , on ait E = L1 ⊥ L2 .
Or sx1 sx2 fixe L1 point par point et agit sur L2 comme s0x1 s0x2 (où s0xi désigne la restriction de sxi à L2 ). Mais
L2 est un espace de dimension 3 donc s0x1 s0x2 = ρ01 ρ02 avec ρ0i renversement de L2 . Désignons par ρi l’isométrie
agissant comme l’identité sur L1 et comme ρ0i sur L2 , alors ρi est un renversement et sx1 sx2 = ρ1 ρ2 .

Connaissant comme générateurs de O(Q) les symétries hyperplanes et comme générateurs de SO(Q) les
renversements (lorsque n ≥ 3), on en tire aisément que les éléments du centre sont des homothéties.
Proposition. Le centre de O(Q) est le sous-groupe à deux éléments {±I}; le centre de SO(Q) est réduit au
sous-groupe trivial si n ≥ 3 est impair et égal à {±I} si n ≥ 4 est pair.
Regardons maintenant deux cas particulièrement intéressants : celui des groupes orthogonaux réels usuels
(i. e. pour la forme euclidienne) et celui des corps finis.
Thorme. Le groupe SO(3, R) est simple. Plus généralement le groupe SO(2n + 1, R) est simple alors que,
pour n ≥ 3 le groupe SO(2n, R) contient comme unique sous-groupe normal non trivial {+1, −1} et donc
PSO(2n, R) est simple.
Preuve. On suppose d’abord n = 3 et on commence par un lemme géométriquement évident dont on laisse
le lecteur formaliser la démonstration :
Lemme. Soit x1 , x2 , y1 , y2 des vecteurs de la sphère de R3 tels que ||x1 − x2 || = ||y1 − y2 ||, alors il existe
une rotation ρ ∈ SO3 (R) telle que ρ(x1 ) = y1 et ρ(x2 ) = y2 .
Soit maintenant H un sous-groupe distingué de SO3 (R) possédant un élément σ distinct de l’identité. Soit
∆ l’axe de σ et e1 un point de la sphère hors de l’axe. Posons 0 < δ0 = ||e1 − σ(e1 )||, lorsque x parcourt
l’arc du méridien passant par e1 et rejoignant l’axe ∆, la distance ||x − σ(x)|| décroit continûment de δ0 à
0. En particulier, si δ est assez petit (δ ≤ δ0 suffit), il existe x1 sur la sphère tel que ||x1 − σ(x1 )|| = δ. Soit
maintenant y1 , y2 deux points de la sphère tels que ||y1 − y2 || = δ; d’après le lemme, il existe ρ ∈ SO3 (R)
telle que ρ(x1 ) = y1 et ρ(σ(x1 )) = y2 . Ainsi σ 0 = ρσρ−1 ∈ H et σ 0 (y1 ) = y2 . En itérant ce procédé, on voit
que H opère transitivement sur la sphère. En particulier, il existe σ 00 ∈ H telle que σ 00 (e1 ) = −e1 , mais alors
σ 00 est un renversement et donc H contient tous les renversements et est donc égal à SO3 (R).
Dans le cas n ≥ 5, on se ramène au cas de dimension 3 ainsi : chaque sous-espace F de dimension 3 induit
une décomposition Rn = F ⊕ F ⊥ et une injection SO3 (R) ,→ SOn (R); si H est un sous-groupe distingué
contenant σ 6= ±I, il suffit de voir que H rencontre l’un des SO3 (R) non trivialement car alors il le contiendra
en entier et contiendra donc un renversement et donc tous et sera donc égal à SOn (R) entier.
Comme σ 6= ±I, σ doit bouger un plan, disons F . Notons ρ le renversement de plan F , alors σ 0 = ρσρ−1 σ −1
est dans H \ {±I} et peut s’écrire comme le produit des deux renversements de plan F et σ(F ) donc possède
un sous-espace de points fixes de dimension ≥ n − 4. Il y a donc un point fixe disons x1 non nul (puisque
n ≥ 5!). Soit maintenant x2 tel que x2 et σ(x2 ) ne soient pas colinéaires, posons r = sx2 sx1 (produit de deux
symétries hyperplanes). On a alors

σ 00 := σ 0 rσ −1 r−1 = σ 0 sx2 σ 0−1 σ 0 sx1 σ 0−1 sx1 sx2 = (σ 0 sx2 σ 0−1 )sx2

est dans H \ {I} et est un produit de deux symétries hyperplanes. Ainsi σ 00 possède un sous-espace de points
fixes de dimension n − 2 donc est contenu dans un SO3 (R), ce qui achève la preuve.

68
Remarque. Le groupe PSO4 (R) n’est pas simple, voir le chapitre sur les quaternions (E.6) pour une preuve
de ce fait et une description. De manière générale l’étude des quaternions et de leurs généralisations (algèbres
de Clifford) permet d’approfondir l’étude des groupes orthogonaux (Cf ibidem); en particulier on peut ainsi
élucider la structure de SO(Q) lorsqu’il existe au moins un vecteur isotrope non nul. Cette dernière condition
est automatiquement vérifiée lorsque k est un corps fini et n ≥ 3 comme l’indique le lemme suivant.
Lemme. Une forme quadratique sur un espace de dimension n ≥ 3 sur Fq possède un vecteur non nul
isotrope.
Preuve. On se ramène à trouver un zéro non trivial au polynôme x2 + ay 2 + bz 2 avec ab 6= 0. Le nombre de
carrés dans Fq est (q + 1)/2 donc les fonctions x2 + a et −bz 2 ont une valeur commune au moins.

Ainsi on voit que l’on peut toujours écrire une décomposition

E = P1 ⊥ . . . ⊥ Pm ⊥ F

avec Pi plan hyperbolique et F soit nul, soit de dimension 1, soit de dimension 2 sans vecteur isotrope non
nul.
Si n est pair on note = +1 si la forme quadratique est équivalente à x1 x2 + x3 x4 + . . . + xn−1 xn et = −1
/ F∗2
si la forme quadratique est équivalente à x1 x2 + x3 x4 + . . . + xn−3 xn−2 + x2n−1 − ax2n avec a ∈ q .

Thorme. Soit G le groupe orthogonal d’une forme quadratique non dégénérée sur un espace de dimension
n sur Fq alors
(n−1)2 Q n−1
(
2i
q 4 i=1 (q − 1) si n est impair
2
card(G) = n(n−2) n Q n−2 2i
q 4 (q 2 − ) i=1 (q − 1) si n est impair
2

On donne la preuve sous forme d’exercice (ref. Artin, chapitre III, p 145-147).
Exercice. 1) Montrer que φn (Q) := card{x ∈ Fnq | Q(x) = 0} vaut q n−1 si n impair et (q n/2 −)(q n/2−1 +)+1
si n pair. 2) Montrer que le nombre de paires hyperboliques (i. e. de paires (e1 , e2 ) telles que Q(e1 ) = Q(e2 ) =
0 et B(e1 , e2 ) = 1) est λn = q n−2 (φn − 1). 3) Montrer que si E = P ⊥ F avec P plan hyperbolique et si on
note Q0 = Q|F alors card SO(Q) = λn card SO(Q0 ).

E.4. Groupe symplectique.

Démontrons d’abord que si B : E × E → K est anti-symétrique, non dégénérée, alors dim(E) = 2m et on
peut choisir une base (e1 , . . . , em , f1 , . . . , fm ) telle que B(ei , ej ) = B(fi , fj ) = 0 etB(ei , fj ) = δij , c’est-à-dire
0 1
que E = he1 , f1 i ⊥ . . . ⊥ hem , fm i et la matrice de B sur hei , fi i est . En particulier, tous les
−1 0
formes antisymétriques non dégénérées sur E sont semblables.
En effet, soit e1 6= 0, alors B(e1 , e1 ) = 0 et il existe f1 ∈ E tel que B(e1 , f1 ) = 1 (il existe un vecteur
f tel que B(e1 , f ) 6= 0 et en le multipliant par un scalaire adéquat on obtient f1 ). Le plan he1 , f1 i est
donc hyperbolique et he1 , f1 i ∩ he1 , f1 i⊥ = {0} donc E = he1 , f1 i ⊥ he1 , f1 i⊥ = {0}. On peut appliquer une
induction au sous-espace F = he1 , f1 i⊥ = {0} et l’écrire comme somme orthogonale de plans hyperboliques.

Proposition. (Pfaffien) Il existe un polynôme Pf à coefficients entiers (appelé Pfaffien) tel que si les
coefficients xij d’une matrice A sont des variables telles que xij = −xji alors

det(A) = Pf(xij )2 .

Si l’on impose Pf(J) = 1, le polynôme Pf est unique et vérifie de plus :

si ((yij )) = t C((xij ))C, alors Pf(yij ) = det(C) Pf(xij )

0 I t
Preuve. En travaillant avec des coefficients dans le corps Q(. . . , xij , . . .), on voit que A = P P
−I 0
donc det(A) = (det(P ))2 . A priori det(P ) = Q/R avec Q, R ∈ Z[. . . , xij , . . .] mais comme ce dernier

69
anneau est factoriel et que Q2 /R2 ∈ Z[. . . , xij , . . .], on en déduit que R divise Q dans Z[. . . , xij , . . .] et
donc que det(P ) ∈ Z[. . . , xij , . . .]. On pose alors Pf(. . . , xij , . . .) = ± det(P ) en choisissant le signe de
sorte que Pf(J) = +1. Pour la deuxième formule on voit que det(yij ) = det(xij ) det(C)2 donc Pf(yij ) =
± det(C) Pf(xij ). On détermine le signe en choisissant C = I.

Corollaire. On a Sp(E) ⊂ SL(E), c’est-à-dire que pour toute matrice M ∈ Sp(n, K) on a det(M ) = +1.
Preuve. Une matrice M est dans Sp(E) si J =t M JM donc Pf(J) = det(M ) Pf(J) et det(M ) = 1.

Etudions maintenant les transformation symplectiques qui fixent un hyperplan. On sait déjà que se sont
des transvections de la forme σ(x) = x + f (x)a avec f forme linéaire vérifiant f (a) = 0. Calculons donc
B(f (x), f (y))−B(x, y) = B(f (x)a, y)+B(x, f (y)a) = B(f (y)x−f (x)y, a) ; en remarquant que l’ensemble des
f (y)x − f (x)y est Ker(f ), on voit que la transvection σ est symplectique si et seulement si B(Ker(f ), a) ≡ 0,
c’est-à-dire si a ∈ Ker(f ) ∩ Ker(f )⊥ . Ceci justifie la définition suivante
Définition. Une transvection symplectique est une application de la forme σ(x) = x + f (x)a avec 0 6= a ∈
Ker(f ) ∩ Ker(f )⊥ . On peut aussi l’écrire σ(x) = x + λB(x, a)a.
Thorme. Les transvections symplectiques engendrent le groupe Sp(E).
Remarque. Comme une transvection est clairement une matrice de SL2n (k), on obtient ainsi une nouvelle
preuve que Sp2n (k) ⊂ SL2n (k).
Preuve. Le lemme suivant permet de démontrer le théorème par récurrence (passant d’un espace de dimension
2n à un espace de dimension 2n − 2).
Lemme. Soit P = hx1 , x2 i et P 0 = hy1 , y2 i deux plan hyperboliques (i.e. B(x1 , x2 ) = B(y1 , y2 ) = 1) alors il
existe ρ un produit de transvections symplectiques tel que ρ(x1 ) = y1 et ρ(x2 ) = y2 .
Preuve du lemme. Commençons par envoyer x1 sur y1 . Si B(x1 , y1 ) 6= 0 alors une transvection suffit :
on choisit t(x) = x + λB(x, a)a avec λ = B(x1 , y1 )−1 et a = y1 − x1 de sorte que t(x1 ) = y1 . Si jamais
B(x1 , y1 ) = 0, on prend un vecteur z tel que B(x1 , z) = 1 mais tel que B(x2 , z) et B(y1 , z) sont non nuls et
on passera de x1 à z puis à y1 avec deux transvections. Envoyons maintenant x2 sur y2 en laissant fixe x1 .
De nouveau, si B(x2 , y2 ) 6= 0, une transvection suffit : on choisit t(x) = x + λB(x, a)a avec λ = B(x2 , y2 )−1
et a = y2 − x2 de sorte que B(x1 , a) = B(x1 , y2 ) − B(x1 , x2 ) = 1 − 1 = 0 donc t(x1 ) = x1 et t(x2 ) = y2 .
Si jamais B(x2 , y2 ) = 0 on va choisir z tel que B(x1 , z) = 1 mais B(x2 , z) et B(y2 , z) non nuls car alors on
pourra passer de x2 à z puis à y2 en laissant fixe x1 par deux transvections. On vérifie immédiatement que
z = x1 + y2 convient.

Thorme. Le groupe PSpn (k) est simple sauf pour n = 2 et k = F2 , F3 ou n = 4 et k = F2 .

Remarque. On a clairement Sp2 (k) = SL2 (k) donc le théorème est en fait déjà démontré dans le cas n = 2.
Soit H un sous-groupe normal de Sp2n (k) contenant σ 6= ±Id. Remarquons tout d’abord que si H contient
toutes les transvections de direction a, il contiendra toutes les conjuguées et donc toutes les transvections et
donc H = Sp2n (k) (en particulier, si k = F2 ou F3 , il suffit que H contienne une transvection). Choisissons a
un vecteur tel que b := σ(a) ne soit pas colinéaire avec a. Montrons d’abord qu’on peut supposer B(a, b) 6= 0.
En effet si B(a, b) = 0, on peut choisir c ∈ hbi⊥ avec disons B(c, a) = 1; on choisit ensuite une transvection
t(x) = x + B(c − a, x)(c − a) qui vérifie t(a) = c et t(b) = b donc, si ρ := tσ −1 t−1 σ, on a ρ ∈ H et ρ(a) = c.
On suppose donc σ(a) = b et B(a, b) 6= 0. On choisit t(x) = x + B(a, x)a et ρ := tσ −1 t−1 σ, on a ρ ∈ H et
ρ(b) = b + B(b, a)a non colinéaire à b. Mais ρ est le produit de t qui laisse fixe hai⊥ et de σ −1 t−1 σ qui laisse
fixe hbi⊥ donc ρ fixe l’orthogonal du plan hyperbolique P engendré par a et b. Si on décompose E = P ⊕ P ⊥ ,
on a donc ρ = (ρ1 , IP ⊥ ) ∈ Sp2 (k) × {IP ⊥ } et comme PSp2 (k) = PSL2 (k) est simple (sauf si k = F2 ou
F3 ), on conclut que H contient Sp2 (k) × {IP ⊥ } et donc toutes les transvections de direction disons a et
donc H = Sp2n (k). Supposons que l’on ait montré que PSp4 (F3 ) et PSp6 (F2 ) sont simples, alors on peut
appliquer le raisonnement précédent lorsque k = F2 et n ≥ 6 (resp. k = F3 et n ≥ 4) en incluant P dans
une somme de trois plans hyperboliques (resp. de 2 plans hyperboliques). Nous renvoyons au livre de Artin
pour la preuve concernant ces deux groupes particuliers (qui sont de cardinal 1 451 520 et 25 920).

70
Exercice. Montrer, par une méthode similaire à celle suggérée pour les groupes orthogonaux, que :
n
2 Y
card(Sp2n (Fq )) = q n (q 2i − 1)
i=1

Exercice.Montrer que la réunion des matrices suivantes fournit un ensemble

de générateurs
de Sp2n (k) : les
I S A 0
matrices (où S est une matrice n×n symétrique), les matrices (où A une matrice n×n
0 I 0 tA−1 t
0 I A B D −tB
inversible) et J := . Montrer que si M = est symplectique, alors M −1 = .
−I 0 C D −tC tA

E.5. Groupe unitaire.

On examine maintenant le cas d’une forme σ-hermitienne H : E × E → k avec E un k-espace vectoriel qu’on
supposera souvent de dimension ≥ 2. On note k0 le sous-corps fixé par l’involution σ. Les deux cas que nous
traiterons comme exemple sont k = C (avec σ(z) = z̄ et k0 = R) et k = Fq2 (avec σ(x) = xq et k0 = Fq ).
Dans le premier cas on a vu qu’on peut se ramener à une forme du type B(x, x) = x1 x̄1 + . . . + xp x̄p −
xp+1 x̄p+1 − . . . − xn x̄n et on notera le groupe correspondant Up,n−p (C) ou encore Un (C) si p = n; il existe
des vecteurs isotropes non nuls si et seulement si 1 ≤ p ≤ n − 1. Dans le second cas il faut observer que
l’application de F∗q2 vers F∗q donnée par x 7→ xσ(x) = xq+1 est surjective (son noyau est de cardinal q + 1)
et donc on peut se ramener à la forme B(x, x) = x1 σ(x1 ) + . . . + xn σ(xn ). On notera Un (Fq2 ) le groupe
correspondant. Observons enfin que, dans ce cas, il existe des vecteurs isotropes dès que n ≥ 2.
Notons S := {x ∈ k ∗ | xσ(x) = 1} le “cercle unité ”. Le déterminant d’un élément unitaire est dans S.
Inversement soit λ ∈ S, si on a mis la forme bilinéaire sous forme diagonale, la matrice diag(1, . . . , 1, λ) est
unitaire de déterminant λ. On a donc la suite exacte :

0 → SU(B) → U(B) → S → 0.

Supposons car(k) 6= 2 et k = k0 (ω) avec ω 2 = δ ∈ k0 et σ(ω) = −ω. On peut décomposer B(x, y) =

R(x, y) + ωI(x, y) en partie “réelle” et “imaginaire” à valeur dans k0 . On s’aperçoit facilement que R
est k0 -bilinéaire symétrique et I est k0 -bilinéaire antisymétrique. De plus elles sont liés par la relation
I(x, ωx) = −R(x, x). Ainsi la donnée de B équivaut à celle de R ou celle de I.
On peut définir l’analogue des symétries hyperplanes comme les transformations laissant fixes les points d’un
hyperplan non isotrope. Ce sont les quasi-symétries; elles sont de la forme

B(x, e)
uλ,e (x) = x + (λ − 1) e avec λ ∈ S et e non isotrope.
B(e, e)

On a bien sûr uλ,e (x) = x si x ∈ hei⊥ et uλ,e (e) = λe; ainsi det(uλ,e ) = λ. On peut calquer la démonstration
faite pour le groupe orthogonal et montrer que les quasi-symétries engendrent le groupe unitaire (au moins
en caractéristique différente de 2). On omet également la démonstration du théorème suivant, qui utilise des
techniques assez similaires à celles utilisées dans les paragraphes précédents.
Thorme. Supposons qu’il existe un vecteur isotrope non nul et que l’on est pas dans le cas n = 2 et q = 2
ou 3, ou n = 3 et q = 2. Alors le groupe PSU(B) est simple. Si k = Fq2 et dim E = n on a

card(SUn (Fq2 )) = q n(n−1)/2 (q 2 − 1)(q 3 + 1) . . . (q n − (−1)n ).

Il est également vrai que PSUn (C) est simple pour n ≥ 2.

Pour les deux dernières affirmations, on peut dénombrer dans le cas fini comme on l’a indiqué pour le groupe
orthogonal et ramener la preuve de la simplicité de PSUn (C) à celle de PSU2 (C). Or ce dernier groupe est
isomorphe à SO3 (R) comme on le verra au paragraphe suivant en utilisant les quaternions.

71
Il existe bien sûr de nombreux liens entre les groupes que nous avons brièvement étudié. Par exemple,
définissons, pour n ≥ 1 l’espace de Siegel

Hn = {τ ∈ Mat(n × n, C | τ est symétrique et Im(τ ) > 0} .

La notation Im(τ ) > 0 signifie ici que la matrice

Im(τ ) est définie positive. On définit alors une action de
A B
G = Sp2n (R) par la formule, où γ = :
C D

γ · τ = (Aτ + B)(Cτ + D)−1 .

Lorsque n = 1, on retrouve le demi-plan de Poincaré et l’action classique de SL2 (R). L’action de G sur Hn
est transitive et le stabilisateur de iI est un sous-groupe compact isomorphe à Un (C) par l’application

Un (C) → Sp2n (R)

A B
A + iB 7→
−B A

Avec cette identification, on vérifie facilement que Un (C) = O2n (R) ∩ Sp2n (R).

Exercices de topologie. On termine en proposant un certain nombre de propriétés des groupes classiques
sur R ou C dont on pourra trouver une preuve (et beaucoup plus!) dans le livre de Mneimné et Testard cité
ci-dessous.
(a) Les groupes On (R), SOn (R), Un (C) et SUn (C) sont compacts; les trois derniers sont connexes alors
que le premier a deux composantes connexes.
(b) (décomposition polaire sur R) Tout élément M de GLn (R) se décompose de manière unique en produit
M = OS avec O ∈ On (R) et S symétrique définie positive. En déduire que GLn (R) est homéomorphe
à On (R) × Rn(n+1)/2 et possède donc deux composantes connexes.
(c) (décomposition polaire sur C) Tout élément M de GLn (C) se décompose de manière unique en produit
M = U H avec U ∈ Un (C) et H hermitienne définie positive. En déduire que GLn (C) est homéomorphe
2
à Un (C) × Rn et connexe.
(d) (Décomposition d’Iwasawa). Soit Q K = SOn (R), notons A le sous-groupe des matrices diagonales
diag(λ1 , . . . , λn ) avec λi > 0 et i λi = 1 et N le sous-groupe des matrices triangulaires possédant
des 1 sur la diagonale. L’application de K × A × N vers SLn (R) définie par (k, a, n) → kan définit un
homéomorphisme.
(e) Les groupes SLn (R), SLn (C), Sp2n (R) et Sp2n (C) sont connexes de même que SOn (C) et SOn (R).
(f) Par contre SOp,q (R) possède deux composantes connexes si p, q ≥ 1 (et le groupe n’est pas compact).
(g) Le groupe fondamental de SOn (R) ou de SLn (R) est Z/2Z si n ≥ 3 et Z si n = 2.
(h) Les groupes SUn (C), SLn (C) sont simplement connexes. Les groupes Un (C), GLn (C) et Sp2n (R) ont
pour groupe fondamental Z. Le groupe SUp,q (C) est connexe et son groupe fondamental est isomorphe
à Z.
On termine par quelques références spécifiques à ce chapitre (l’article de Tits contient notamment la classi-
fication des groupes simples avec les groupes exceptionnels E6 , E7 , E8 , F4 et G2 ).
Artin, E., Geometric Algebra, Interscience, 1957.
Dieudonné, J., La géométrie des groupes classiques, Ergebnisse d. Math. Springer, 1955.
Mneimné, R. et Testard, F., Introduction à la théorie des groupes de Lie classiques. Hermann, 1986.
Tits, J., Groupes simples et géométries associées, Actes du congrès international des mathématiciens de
Stockholm (1962), pages 197-221.

72
E.6. Quaternions, arithmétique et groupe orthogonal.

Nous allons construire l’exemple classique de corps non commutatif : le corps des quaternions découvert
par Hamilton, et développer deux applications, l’une arithmétique (le théorème des quatre carrés), l’autre
géométrique (l’étude des groupes d’isométries SO(3, R), SO(4, R) et SU(2, C)). Nous montrerons aussi que
le corps des quaternions est le “seul” corps non commutatif de dimension fini sur R.
E.6.1. Le corps des quaternions.
La façon la plus concrète de construire le corps des quaternions est comme un espace vectoriel réel de
dimension 4 muni d’une base 1, I, J, K et d’une multiplication R-bilinéaire définie par le fait que 1 est
élément neutre et les formules

I 2 = J 2 = K 2 = −1, IJ = −JI = K, JK = −KJ = I et KI = −IK = J (∗)

Il faut alors vérifier “à la main” l’associativité : par exemple (IJ)K = K 2 = −1 et I(JK) = I 2 = −1. Pour
s’épargner cette vérification on peut aussi définir H comme sous-algèbre des matrices 2 × 2 complexes ou
4 × 4 réelles (l’associativité est alors immédiate mais il faut vérifier que les matrices introduites vérifient les
formules (∗)). On peut ainsi définir

α −β
H= α, β ∈ C
β̄ ᾱ

1 1 i 0 0 1 0 i
avec 1 = ,I= ,J= et K = ou encore
0 1 0 −i −1 0 i 0

a −b −c −d
  
 
 b a −d c 
 
H=   a, b, c, d ∈ R
 c d
 a −b 

d −c b a
avec
1 0 0 0 0 −1 0 0 0 0 −1 0 0 0 0 −1
       
0 1 0 0 1 0 0 0  0 0 0 1  0 0 −1 0 
1=  , I =  , J =  , K =
0 0 1 0 0 0 0 −1 1 0 0 0 0 1 0 0

0 0 0 1 0 0 1 0 0 −1 0 0 1 0 0 0

Remarque. Une fois construit H, on peut remarquer que c’est une R-algèbre engendrée par deux éléments
i, j avec les relations i2 = j 2 = −1 et ij = −ji. En effet en posant k := ij on en déduit la table de
multiplication puisque k 2 = ijij = −iijj = −1 et ik = iij = −j = (ii)j = −iji = −ki etc. Le fait que H
ne soit pas commutatif se lit déjà sur la table de multiplication, mais plus précisément nous avons le lemme
suivant
Lemme. Le centre de H est R1 (que l’on identifiera, le cas échéant, à R). Si z ∈ H \ R1 alors

C(z) := {z 0 ∈ H | zz 0 = z 0 z} = R1 + Rz

Preuve. Si q = a1 + bI + cJ + dK et q 0 = a0 1 + b0 I + c0 J + d0 K sont deux quaternions, leur multiplication

s’écrit

qq 0 = (aa0 − bb0 − cc0 − dd0 )1 + (ab0 + ba0 + cd0 − dc0 )I + (ac0 − bd0 + ca0 + db0 )J + (ad0 + bc0 − cb0 + da0 )K

donc les deux éléments commutent si et seulement si

  0   
0 −d c b 0
 d 0 −b   c0  =  0 
−c b 0 d0 0

73
On voit donc que tous les éléments commutent avec a1 + bI + cJ + dK si b = c = d = 0 mais, si z ∈ H \ R1,
alors un calcul simple montre que le rang du système est égal à deux donc dimR C(z) = 2, or clairement
R(z) ⊂ C(z) et [R(z) : R] = 2 donc R(z) = C(z).

On introduit le conjugué d’un quaternion z = a1 + bI + cJ + dK comme z̄ = a1 − bI − cJ − dK ainsi que

sa trace Tr(z) = z + z̄ et sa norme N(z) = z z̄. On vérifie alors
Lemme. Soient z, w ∈ H, z + w = z̄ + w̄, zw = w̄ · z̄ et si z = a1 + bI + cJ + dK, alors N(z) = z z̄ = z̄z =
(a2 + b2 + c2 + d2 )1 et Tr(z) = 2a1 ; de plus Tr(z + z 0 ) = Tr(z) + Tr(z 0 ), N(zz 0 ) = N(z) N(z 0 ) et z est racine
du polynôme X 2 − Tr(z)X + N(z) ∈ R[X].
Preuve. Des calculs directs (laissés au lecteur) permettent de vérifier ces formules. Noter que la conjugaison
est un anti-isomorphisme de corps, i.e. qu’elle renverse l’ordre de la multiplication.

On voit immédiatement comme corollaire que H est un corps puisque, si z = a1 + bI + cJ + dK est un

quaternion non nul, alors N(z) := a2 + b2 + c2 + d2 ∈ R∗ et z z̄/ N(z) = 1 donc z −1 = z̄/ N(z).
Remarque. On dispose donc d’une sorte de décomposition polaire des quaternions en notant G le groupe
(multiplicatif) des quaternions de norme 1.

H∗ ∼
= R∗+ × G (isomorphisme de groupes)
p p
donnée par z 7→ ( N(z), z/ N(z)). Toutefois on prendra garde que le groupe G (analogue du cercle unité
pour les complexes) n’est pas un groupe commutatif, en fait il est isomorphe au groupe SU(2, C) (alors que
le cercle unité peut être vu comme SU(1, C)). Ce dernier point peut se montrer facilement à partir de la
représentation
H = C ⊕ Cj
dans laquelle il faut faire attention que, si z = a + bi ∈ C, alors

jz = z̄j (en général 6= zj)

Exercice. Montrer que l’équation X 2 − 1 = 0 possède exactement deux solutions dans H mais que l’équation
X 2 + 1 = 0 possède une infinité de solutions dans H (indication : on montrera que la sphère a = b2 + c2 +
d2 − 1 = 0 décrit l’ensemble des solutions).
Exercice. Montrer que H∗ contient un sous-groupe fini non-cyclique (rappel : ceci est impossible dans le
groupe multiplicatif d’un corps commutatif).

E.6.2 Sommes de carrés d’entiers.

L’énoncé du théorème suivant se situe entièrement dans N, pourtant il sera commode, pour le démontrer,
de travailler dans l’anneau des entiers de Gauss Z[i].
Thorme. Un entier n ∈ N peut s’écrire comme somme de deux carrés d’entiers si et seulement si chaque
nombre premier p congru à 3 modulo 4 apparaı̂t avec un exposant pair dans la décomposition en facteurs
premiers de n.
L’énoncé du théorème suivant n’a rien à voir avec les quaternions mais nous allons le démontrer en étudiant
l’arithmétique de sous-anneaux du corps H.
Thorme. (Lagrange) Soit n ∈ N alors il existe des entiers x, y, z, t tels que n = x2 + y 2 + z 2 + t2 .
Remarque. On voit facilement qu’un carré est congru à +1, 0 ou 4 modulo 8 donc si n est congru à 7
modulo 8, il n’est pas somme de trois carrés. Le même raisonnement montre que si n = 4m = x2 + y 2 + z 2
alors chacun des entiers x, y, z est divisible par 2 et donc m est également somme de trois carrés. On peut
donc conclure que les entiers de la forme n = 4r (8m + 7) ne sont pas somme de trois carrés. Il est vrai, mais

74
nous ne le démontrerons pas ici, que tous les autres entiers peuvent s’écrire comme somme de trois carrés
d’entiers (par exemple 2.7 = 14 = 32 + 22 + 12 , 23 .7 = 62 + 42 + 22 et 30 = 52 + 22 + 12 ).
Remarque. L’ensemble des sommes de deux carrés (resp. de quatre carrés) est stable par produit mais pas
l’ensemble des sommes de trois carrés. En effet 18 = 2.32 = 42 + 12 + 12 et 14 = 2.7 = 32 + 22 + 12 mais
18.14 = 4.9.7 n’est pas somme de trois carrés.
Si on pose

C2 := {n ∈ N | ∃x, y ∈ N, n = x2 + y 2 } et C4 := {n ∈ N | ∃x, y, z, t ∈ N, n = x2 + y 2 + z 2 + t2 }

on veut donc montrer que n ∈ C2 si et seulement si tout nombre premier congru à 3 modulo 4 apparaı̂t avec
un exposant pair et que C4 = N. On va introduire l’anneau Z[i] et les deux anneaux

1+I +J +K
A0 = Z1 + ZI + ZJ + ZK et A = A0 + Z .
2

Il est clair que C2 = {N(z) | z ∈ B} et C4 = {N(z) | z ∈ A0 }, en fait on a aussi C4 = {N(z) | z ∈ A} car

N (A0 ) = N (A). En effet d’une part, si x, y, z, t ∈ Z + 1/2 alors N(x1 + yI + zJ + tK) ∈ Z, d’autre part si
α ∈ A \ A0 , on peut écrire α = 2α0 + avec α0 ∈ A0 et = (±1 ± I ± J ± K)/2 et alors α = α0 (2) + 1 ∈ A0 .
De plus, la norme étant multiplicative, il suffit de montrer que tout nombre premier p est une norme. Comme
2 = 12 + 12 il suffit d’ailleurs de le faire pour p premier impair. Pour cela nous allons montrer d’abord que
Z[i] est principal et A est principal à gauche (ou à droite).
Proposition. L’anneau Z[i] est euclidien donc principal. L’anneau A est euclidien à gauche, donc principal
à gauche (idem à droite).
Preuve. Notons B l’anneau A ou Z[i], l’énoncé signifie que pour α ∈ B et β ∈ B \ {0}, il existe q, r ∈ B tel
que α = qβ + r avec N(r) < N(β) (lorsque l’anneau est A, il faut faire attention au sens des multiplications).
Supposons ceci démontré, on en tire aussitôt que Z[i] est principal, en fait la “même” démonstration montre
que A est principal (à gauche). Soit donc I un idéal à gauche non nul de A (i.e. A.I ⊂ I), il contient un
élément β 6= 0 de norme minimale et on a clairement Aβ ⊂ I. Inversement, soit α ∈ I, écrivons α = qβ + r
avec N(r) < N(β), on a alors r = α − qβ ∈ I donc r est nul et on a bien I = Aβ. Montrons maintenant que
A et Z[i] sont euclidiens. La preuve est basée sur le lemme élémentaire suivant dont la preuve est laissée au
lecteur.
Lemme. Soit x ∈ R, il existe m ∈ Z tel que |x − m| ≤ 1/2 et il existe n ∈ Z tel que |x − n/2| ≤ 1/4.
Soit donc α ∈ Z[i] et β ∈ Z[i] \ {0}, alors α/β = x + iy ∈ Q[i] et il existe m, n ∈ Z tels que |x − m| ≤ 1/2 et
|y − n| ≤ 1/2 donc
2 2 1 1 1
N ((x + iy) − (m + in)) = (x − m) + (y − n) ≤ + =
4 4 2
d’où, si l’on note q := m + ni l’inégalité cherchée

N(β)
N(α − qβ) ≤ < N(β).
2

Soit maintenant α ∈ A et β ∈ A \ {0}, alors αβ −1 = x + yI + zJ + tK ∈ H et il existe m ∈ Z tel que

|x − m/2| ≤ 1/4. On choisit alors q = (m + nI + hJ + `K)/2 avec m, n, h, ` entiers de même parité (de sorte
que q ∈ A) et tel que |y − n/2|, |z − h/2| et |t − `/2| soient ≤ 1/2. On obtient alors
2 2
−1
m 2 n 2 h ` 1 1 1 1
N(αβ − q) = x − + y− + z− + t− ≤ + + + <1
2 2 2 2 16 4 4 4

d’où l’inégalité cherchée

N(α − qβ) < N(β).

75
(Somme de deux carrés). L’anneau Z[i] est principal donc factoriel et on voit facilement que Z[i]∗ = {±1, ±i}
(voir exercice) ; déterminons maintenant les éléments irréductibles. Tout d’abord 2 = −i(1 + i)2 et 1 + i est
irréductible car sa norme est 2. Un nombre premier p congru à 3 modulo 4 est irréductible dans Z[i] car si
p = αβ alors N(α) N(β) = p2 mais l’égalité N(α) = p est impossible donc N(α) ou N(β) vaut 1 et donc α ou
β est inversible. Enfin, soit p un nombre premier congru à 1 modulo 4, on sait que le groupe (Z/pZ)∗ est
cyclique d’ordre p − 1 donc contient un élément ā d’ordre 4 donc tel que a2 ≡ −1 mod p. En particulier on
a donc (a + i)(a − i) = a2 + 1 ∈ pZ[i] mais ni a + i ni a − i ne peuvent appartenir à pZ[i] qui n’est donc pas
un idéal premier. Comme Z[i] est principal l’élément p n’est pas irréductible et on peut donc écrire p = αβ
avec N(α) = N(β) = p (on a en fait forcément β = ᾱ). On peut résumer cela en
Lemme. Les éléments irréductibles de Z[i] (non associés deux à deux) sont : 1 + i, les premiers p congrus
à 3 modulo 4, les deux facteurs αp , βp de p congrus à 1 modulo 4 décomposant p = αp βp .
La norme d’un entier de Gauss dont la factorisation s’écrit
Y Y
q = ir (1 + i)s αpmp βpnp p` p
p≡1 mod 4 p≡3 mod 4

est donc égale à Y Y

s
N(q) = 2 pmp +np p2`p
p≡1 mod 4 p≡3 mod 4

ce qui démontre le théorème des deux carrés.

(Somme des quatres carrés). Il suffit de montrer que si p est un nombre premier impair, il est la norme d’un
élément de A. Le nombre de carrés dans Z/pZ est (p + 1)/2 donc le polynôme −1 − X 2 prend au moins une
fois pour valeur un carré ; en d’autre termes, il existe a, b ∈ Z tels que a2 + b2 + 1 ∈ pZ. On en tire que
(1 + aI + bJ)(1 − aI − bJ) ∈ pA. Considérons donc l’idéal (à gauche) I engendré par p et 1 + aI + bJ, on a
I = Aβ puisque A est principal (à gauche) et d’autre part des inclusions strictes pA ⊂ I ⊂ A. Ainsi p = αβ
et N(p) = N(α) N(β) = p2 (avec β et α non inversibles) donc N(α) et N(β) différents de 1 donc égaux à p.

Exercice. Montrer qu’un élément de Z[i], A ou A0 est inversible si et seulement si sa norme vaut 1. En
déduire que

∗ ∗ ∗ ∗ ±1 ± I ± J ± K
Z[i] = {±1, ±i}, A0 = {±1, ±I, ±J, ±K} et A = A0 ∪
2

(A∗0 et A∗ sont les groupes quaternioniques d’ordre 8 et 24 respectivement). Le groupe A∗ est-il isomorphe
à S4 ? Montrer que A0 n’est pas principal (à gauche). En déduire également qu’un élément de norme égale
à un nombre premier est irréductible.

E.6.3. Quaternions et isométries.

Nous allons voir que le groupe des quaternions de norme 1, noté G, est isomorphe à SU(2, C), que SO(3, R) ∼
=
G/{±1} et SO(4, R) ∼ = G × G/{±(1, 1)}, ce qui permettra de décrire les rotations de l’espace de dimension
3 ou 4.
Dans toute la suite on identifiera librement H avec R4 (via la base 1, I, J, K) et E := RI + RJ + RK
avec R3 (via la base I, J, K). Le premier lien entre quaternions et isométries est l’observation simple que, si
x, y ∈ R4 = H, on a
1
||x||2 = xx̄ = N(x) et x · y = Tr(xȳ)
2

Remarquons en particulier que R1 est l’orthogonal de E dans H. On étudie maintenant l’action par
conjugaison Φ(q)(x) = qxq −1 . Cette action fournit un homomorphisme Φ : H∗ → GLR (H). En fait
N(Φ(q)(x)) = N(qxq −1 ) = N(x) donc Φ(q) est une isométrie et de plus Φ(q)(1) = 1 donc Φ(q) laisse stable
E∼= R3 d’où en fait un homomorphisme de H∗ vers O(3, R) qu’on note encore Φ. Comme H∗ est connexe,

76
l’image de Φ est en fait dans SO(3, R). Par ailleurs on a R∗ ⊂ Ker(Φ) (en fait on a égalité puisque R est
le centre de H) donc on peut restreindre Φ à G (le groupe des quaternions de norme 1) sans changer son
image. On a donc défini un homomorphisme

Φ : G → SO(3, R) (∗)

dont le noyau est R∗ ∩ G = {+1, −1} ; pour voir que Φ est surjectif on démontre le lemme suivant qui a son
propre intérêt :
Lemme. Soit x un quaternion de E de norme 1 (i.e. une solution de x2 + 1 = 0), considérons q =
cos(θ) + sin(θ)x, alors Φ(q) est la rotation d’angle 2θ et d’axe (orienté) x.
Preuve. On a qxq −1 = x puisque q commute avec x. Déterminons maintenant l’action de Φ(q) sur le plan P
orthogonal à x (dans E). L’équation 2x · y = Tr(xȳ) = xȳ + yx̄ = 0 équivaut, puisque dans E on a ȳ = −y, à
l’équation xy + yx = 0. Choisissons donc y de norme 1 tel que xy = −yx, alors z = xy permet de compléter
la famille libre {x, y} en une base orthonormé {x, y, z}. On calcule alors (en remarquant que xyx = y et
x2 = y 2 = −1)
Φ(q)(y) = (cos(θ) + sin(θ)x)y(cos(θ) − sin(θ)x)
= cos2 (θ) − sin2 (θ) y + 2 cos(θ) sin(θ)xy

= cos(2θ)x + sin(2θ)xy
et
Φ(q)(xy) = (cos(θ) + sin(θ)x)xy(cos(θ) − sin(θ)x)
= cos2 (θ) − sin2 (θ) xy − 2 cos(θ) sin(θ)y

= cos(2θ)xy − sin(2θ)y
ainsi Φ(q) est bien la rotation d’angle 2θ et d’axe x.

Remarque. On voit en particulier que les renversements, i.e. les rotations d’angle π, correspondent à des
quaternions imaginaires purs. Il n’est pas très difficile de voir que tout quaternion non nul peut s’écrire
comme produit de quaternions imaginaires purs (exercice : le démontrer) et on en tire que les renversements
sont des générateurs de SO(3, R) (Cf le paragraphe E.3). Remarquons enfin que, si on se restreint à q ∈ G
alors Φ(q)(x) = qxq̄ puisque q −1 = q̄.
Pour étudier SO(4, R), on considère l’action de H∗ ×H∗ sur H donnée par Ψ(q, r)(x) = qxr−1 . Il s’agit d’une
similitude directe de rapport N(qr−1 ) puisque N(Ψ(q, r)(x)) = N(qxr−1 ) = N(qr−1 ) N(x) ; en particulier, si
on se restreint à G × G, on obtient un homomorphisme de groupes

Ψ : G × G → SO(4, R)

dont on démontre de manière similaire qu’il est surjectif. Par ailleurs, il a pour noyau le sous-groupe
Ker(Ψ) = {(+1, +1), (−1, −1)}. En effet, si u ∈ SO(4, R) et u(1) = z, posons v(x) = z −1 u(x), alors
v(1) = 1 donc v est une rotation de E et on a vu qu’une telle rotation s’écrivait v(x) = yxy −1 pour un
certain y ∈ G. On a donc u(x) = (zy)xy −1 = Ψ(zy, y)(x). Par ailleurs, si ∀x ∈ H, Ψ(q, r)(x) = x alors, en
prenant x = 1 on obtient q = r et donc q, de norme 1, est dans le centre de H donc vaut ±1. On a donc
bien démontré
Thorme. Le groupe G est isomorphe à SU(2, C) ; l’homorphisme Φ induit un isomorphisme G/{+1, −1} ∼ =
SO(3, R) ; l’homorphisme Ψ induit un isomorphisme G × G/{(1, 1), (−1, −1)} ∼= SO(4, R). En particulier
SO(4, R)/{±id} n’est pas simple.
Exercices. a) Vérifier
par un calcul
direct que SU(2, C) est l’ensemble des matrices 2 × 2 à coefficients
α −β
complexes de la forme telles que |α|2 + |β|2 = 1. Redémontrer ainsi que G ∼
= SU(2, C).
β̄ ᾱ
b) Donner, à l’aide des quaternions, une (“deuxième”) preuve que le groupe SO(3, R) est simple. (indications :
on pourra considérer H sous-groupe distingué de G, montrer que si H contient un quaternion pur imaginaire

77
de norme un, il les contient tous et que si H n’est pas contenu dans le centre {±1} il contient un tel
quaternion).

E.6.4. Caractérisation et généralisation des quaternions.

On peut se demander si le corps des quaternions est un exemple unique, la réponse est oui si l’on souhaite
conserver les propriétés d’associativité et d’existence d’un inverse. Cependant il existe d’autres algèbres de
dimension finie sur R intéressantes ; nous citons les octaves de Cayley (un “faux corps” au sens où tout
élément non nul est inversible mais la multiplication n’est pas associative) et développons un peu les algèbres
de Clifford associées à une forme quadratique (associatives mais en général non intègres).
Thorme. (Frobenius) Soit K un corps contenant dans son centre un sous-corps isomorphe à R et supposons
K de dimension finie sur ce sous-corps, alors K est isomorphe à R, C ou H.
Remarque. Si K est une R-algèbre de dimension finie, c’est un corps si et seulement si elle est intègre (la
multiplication par a ∈ K est R-linéaire donc injective si et seulement si elle est surjective). Si l’on enlève
l’hypothèse de dimension finie on trouve d’autres corps comme K = R(X) le corps des fractions rationnelles.
Preuve. On identifie R et le sous-corps de Z(K) isomorphe à R. Commençons par quelques remarques
préliminaires. Si a est un élément de K alors R(a) est un sous-corps commutatif de K et [R(a) : R] = 1 ou
2 avec ou bien R(a) = R (si a ∈ R) ou bien R(a) ∼ = C. De plus si b ∈ C(a) := {z ∈ K | za = az} alors
R(a, b) est un sous-corps commutatif et [R(a, b) : R] = 1 ou 2. Ainsi si a ∈
/ R, on a C(a) = R(a).
Si K 6= R, alors K contient un sous-corps isomorphe à C et en particulier un élément i tel que i2 = −1. Si
K 6= R(i) ∼
= C nous allons utiliser le
Lemme. Soit b ∈ K \ R(i) alors l’élément c := bi − ib est non nul et vérifie ic = −ci et ∃r ∈ R, c2 = −r2 1 ;
en particulier l’élément c̃ = cr−1 vérifie ic̃ = −c̃i et c̃2 = −1.
Preuve du lemme. Comme b ∈ / C(i), d’après les préliminaires, on a bien c 6= 0. Maintenant ic = ibi + b alors
que ci = −b − ibi donc ic = −ci et c2 i = ic2 donc c2 ∈ R(i) ∩ R(c) = R. S’il existait r ∈ R tel que c2 = r2
(i.e. si c2 ∈ R+ ) alors l’équation X 2 − r2 = 0 possèderait au moins quatre racines (±r, ±c) dans R(c) corps
commutatif, ce qui est impossible. Donc c2 < 0 et le reste suit.

Revenons à la démonstration du théorème. Si K n’est isomorphe ni à R ni à C alors il existe b ∈ K \ R(i)

et le lemme construit un élément que nous notons j tel que ij = −ji et j 2 = −1. Notons donc k := ij alors
K 0 := R1 + Ri + Rj + Rk est un sous-corps de K isomorphe à H. Montrons qu’en fait K 0 = K et donc
K∼ = H. Soit b ∈ K, si b ∈ R(i) alors b ∈ K 0 et si b ∈
/ R(i) le lemme permet de construire c = bi − ib 6= 0 tel
que ci = −ic. Mais alors (jc)i = j(−ic) = i(jc) donc jc ∈ R(i) et donc c est dans K 0 . Par ailleurs l’élément
d := bi + ib commute avec i donc est dans R(i) donc dans K 0 donc 2bi = c + d est dans K 0 et b également,
ce qui achève la démonstration.

Algèbre des octaves de Cayley.

Un présentation commode et rapide des octaves de Cayley est comme un espace vectoriel (disons à gauche)
Ca = H + HL de dimension 2 sur H (de dimension 8 sur R) muni d’une base 1, L et d’une multiplication
(non associative)
(p1 + p2 L)(q1 + q2 L) = p1 q1 − q̄2 p2 + (q2 p1 + p2 q̄1 )L

On définit la conjugaison comme (p1 + p2 L) = p̄1 − p2 L et la norme d’un octave de Cayley par la formule
N(p1 + p2 L) = (p1 + p2 L)(p1 + p2 L) = N(p1 ) + N(p2 ). On voit donc que l’inverse de p1 + p2 L est N(p1 +
p2 L)−1 (p1 + p2 L). La multiplication n’est pas associative : par exemple ((jL)i) L = −k 6= k = (jL) (iL),
mais vérifie une propriété un peu plus faible (qu’on laisse vérifier en exercice) :

∀q, r ∈ Ca, q(qr) = (qq)r, (qr)q = q(rr) et q(rq) = (qr)q.

78
Exercice. Démontrer que la norme est multiplicative sur Ca (i. e. N(qq 0 ) = N(q) N(q 0 )) et en déduire une
identité du type ! 8 !
X 8 X X8
2 2
xi yi = Bi (x, y)2
i=1 i=1 i=1

avec Bi (x, y) formes bilinéaires en x, y.

Algèbres de Clifford.
Soit Q une forme quadratique sur un espace vectoriel E de dimension n sur un corps commutatif K de
caractéristique 6= 2 ; on notera B la forme bilinéaire associée. On définit “à la main” l’algèbre de Clifford
C(Q) = C(E, Q) ainsi : on note x◦y le produit dans cette algèbre et on choisit e1 , . . . , en une base orthogonale
(i.e. Q(ei + ej ) = Q(ei ) + Q(ej ) si i 6= j) et on prend comme générateurs de C(Q) les éléments ei avec les
relations ei ◦ ej = −ej ◦ ei (si i 6= j) et ei ◦ ei = Q(ei )1. Pour chaque sous-ensemble I de l’intervalle [1, . . . , n]
on ordonne les éléments i1 < i2 < . . . < ir et on pose eI = ei1 ◦ ei2 . . . ◦ eir et e∅ = 1. On peut alors décrire
C(Q) comme un espace vectoriel de dimension 2n avec une base donnée par {eI | I ⊂ [1, . . . , n]} et la règle
de multiplication s’écrit Y
eI ◦ eJ = (−1)s(I,J) Q(ei )eI∆J
i∈I∩J

avec I ∆ J := (I ∪ J) \ (I ∩ J) et s(I, J) = card{(i, j) ∈ I × J | i > j}.

Remarque. En supposant connu le produit tensoriel, une définition plus intrinsèque (qui donne automa-
tiquement l’associativité et l’indépendance par rapport au choix d’une base orthogonale) est la suivante. On
définit T 0 (E) = K, T n (E) = E ⊗K E ⊗K . . . ⊗K E (produit de n copies de E) et T (E) = ⊕n≥0 T n (E) ; ce
dernier espace est une K-algèbre non commutative, le produit envoyant T m (E) × T n (E) dans T m+n (E) et
en notant que, en général e1 ⊗ e2 6= e2 ⊗ e1 . On définit ensuite I(Q) comme l’idéal bilatère engendré par les
éléments x ⊗ x − Q(x)1 et C(Q) = T (E)/I(Q).
Remarques. Dès qu’il existe x ∈ E \ {0} tel que Q(x) = 0, l’algèbre C(Q) n’est pas intègre ; en effet on a
alors x ◦ x = Q(x)1 = 0 alors que x 6= 0. Sur l’une ou l’autre des définitions, on voit qu’on a une injection
i : E ,→ C(Q). On peut montrer que C(Q) est l’algèbre solution d’un problème universel : pour toute
K-algèbre A munie d’un homomorphisme d’espace vectoriel j : E → A tel que j(x)j(x) = Q(x)1A , il existe
un homomorphisme d’algèbre φ : C(Q) → A tel que j = φ ◦ i. En particulier on peut identifier E à un
K-sous-espace vectoriel de C(Q). L’espace vectoriel engendré par les produits d’un nombre pair de vecteurs
e1 ◦ . . . ◦ e2m est une sous-algèbre qu’on note C + (Q).
Soit alors G1 = {α ∈ C(E, Q)∗ | αEα−1 ⊂ E} et G = G1 ∩ C + (Q). Les ensembles G1 et G forment
des groupes et de plus on a un homomorphisme évident Φ : G1 → GL(E). En fait on va voir que cette
homomorphisme est à valeur dans O(E, Q). Pour cela on va utiliser deux résultats classiques vus au chapitre
E.3 : soit x ∈ E avec Q(x) 6= 0 alors il existe une isométrie notée sx laissant fixe (Kx)⊥ et changeant x en
−x ; elle est donnée par la formule sx (y) = y − 2 B(x,y)
Q(x) x (vérification directe) et, de plus, ces isométries,
appelées symétries hyperplanes engendrent O(Q) (théorème de Cartan-Dieudonné).
Soit x, y ∈ E et α ∈ G1 , on a x ◦ y + y ◦ x = 2B(x, y) donc α ◦ (x ◦ y + y ◦ x) ◦ α−1 = 2B(x, y) ou encore

2B(α ◦ x ◦ α−1 , α ◦ y ◦ α−1 ) = (α ◦ x ◦ α−1 ) ◦ (α ◦ y ◦ α−1 ) + (α ◦ y ◦ α−1 ) ◦ (α ◦ x ◦ α−1 ) = 2B(x, y)

ce qui montre bien que Φ(α) est une isométrie. L’analogue du lemme décrivant une rotation de R3 comme
“Φ(q)” est le suivant
Lemme. Soit x ∈ E non isotrope (i.e. Q(x) 6= 0) et sx la symétrie hyperplane associée, alors Φ(x) = −sx .
En particulier SO(Q) est contenu dans l’image Φ(G).
Observons que x ◦ x = Q(x)1 donc x−1 = Q(x)−1 x et comme x ◦ y + y ◦ x = 2B(x, y), on en tire

B(x, y)
x ◦ y ◦ x−1 = −y + 2B(x, y)x−1 = −y + 2 x = −sx (y).
Q(x)

79
Soit r ∈ SO(Q), alors r = sx1 . . . sx2m donc r = Φ(x1 ◦ . . . ◦ x2m ).

Pour calculer le noyau de Φ : G → SO(Q), il faut trouver les éléments inversibles commutant avec tout
x ∈ E. Ce calcul est basé sur la formule suivante qui se vérifie directement à partir de la définition du
produit de l’algèbre C(Q) :
eI ◦ eJ ◦ e−1
I = (−1)
|I||J|−|I∩J|
eJ
et on en tire
{x ∈ C + (Q) | ∀y ∈ E, x ◦ y = y ◦ x} = K.
On obtient donc que Φ : G → SO(Q) est surjective de noyau K ∗ . Comme tout élément de SO(Q) est produit
(d’un nombre pair de) symétries hyperplanes, on voit aussi que tout élément de G s’écrit ax1 ◦ . . . ◦ xr avec
a ∈ K ∗ et xi ∈ E.
L’analogue de la norme est le suivant : on définit une involution x 7→ x̄, de C(Q) dans C(Q) par la formule
(pour i1 < . . . < ir )
ei1 ◦ . . . eir = eir ◦ . . . ei1 = (−1)r(r−1)/2 ei1 ◦ . . . eir
puis la norme spinorielle
Nsp (α) = α ◦ ᾱ
et on peut alors montrer
Lemme. L’involution x 7→ x̄ est un anti-isomorphisme de C(Q), pour les éléments de G (ou G1 ) on a
Nsp (α ◦ β) = Nsp (α) Nsp (β).
Preuve. La première affirmation est claire, la deuxième est un peu plus subtile (d’ailleurs l’énoncé n’est pas
vrai pour tous les éléments de C(Q)). En fait un élément de G (ou G1 ) s’écrit α = ax1 ◦ . . . ◦ xr (resp. β =
by1 ◦ . . . ◦ yr ) avec a, b ∈ K et xi , yi ∈ E donc Nsp (α) = a2 Q(x1 ) . . . Q(xr ) (resp. Nsp (β) = b2 Q(y1 ) . . . Q(yr )),
or Nsp (α ◦ β) = α ◦ β ◦ β̄ ◦ ᾱ = Nsp (β)α ◦ ᾱ = Nsp (α) Nsp (β).
Ceci permet de montrer que, si x1 , . . . , xr sont des vecteurs non isotropes de E et si sx1 . . . sxr = idE
alors Q(x1 ) . . . Q(xr ) ∈ K ∗2 . En effet r doit être pair et donc Φ(x1 ◦. . .◦xr ) = id et donc x1 ◦. . .◦xr = a ∈ K ∗ .
Mais alors a2 = Nsp (x1 ◦ . . . ◦ xr ) = Q(x1 ) . . . Q(xr ).
Introduisons maintenant Ω(Q) = Ω(E, Q) le sous-groupe des commutateurs de SO(Q). On a démontré les
parties a) et b) de l’énoncé suivant
Thorme. a) L’application Φ induit un isomorphisme G/K ∗ → SO(Q).
b) Soit ρ ∈ SO(Q) décomposée en produit de symétries hyperplanes ρ = sx1 . . . sxm , alors l’élément M (ρ) :=
Q(x1 ) . . . Q(xm ) ∈ K ∗ /K ∗2 ne dépend pas de la décomposition et l’application M : SO(Q) → K ∗ /K ∗2
est un homomorphisme de groupes dont le noyau contient Ω(E, Q).
c) Supposons de plus qu’il existe x ∈ E \ {0} tel que Q(x) = 0 (on dit que la forme est isotrope) alors
la norme spinorielle induit un isomorphisme SO(E, Q)/Ω(E, Q) ∼ = K ∗ /K ∗2 . Si, de plus n ≥ 5, alors
PΩ(E, Q) := Ω(E, Q)/Z(Ω(E, Q)) est simple.
Plus exactement, on a démontré la première affirmation et la deuxième découle des remarques précédentes.
Il est clair, puisque K ∗ /K ∗2 est commutatif que Ω(Q) ⊂ Ker(M ). Pour le point c) on renvoie aux livres
d’Artin (Algèbre géométrique) et Dieudonné (Géométrie des groupes classiques). On notera qu’en général,
l’hypothèse de l’existence d’un vecteur isotrope (i.e. d’un x 6= 0 tel que Q(x) = 0) est indispensable aux
conclusions de c) (Cf ibidem), néanmoins dans le cas où K = R et Q est la forme quadratique définie positive,
on a vu que le groupe PO(E, Q) = PO(n, R) est simple dès que n = dim(E) = 3 ou ≥ 5.

80
F. REPRÉSENTATIONS DES GROUPES FINIS.

Une représentation d’un groupe G est un homomorphisme ρ de G vers GL(E) où E est un K-espace vectoriel;
par abus on parlera de la représentation E si le contexte est sans ambigüité. On peut voir ρ comme une action
linéaire de G sur E. On s’intéressera exclusivement au cas où E est de dimension finie et principalement au
cas où G est fini et K est de caractéristique zéro (voir ci-dessous pourquoi).
Une variante consiste à introduire l’algèbre de groupe K[G] qui est l’algèbre ayant pour ensemble sous-jacent
l’ensemble des fonctions de G dans K muni de la somme (f +g)(x) = f (x)+g(x) et du produit de convolution :
X
(f ∗ g)(x) = f (y)g(y −1 x).
y∈G

En notant eg (x) = 1 si x = g et 0 sinon, on a K[G] = ⊕g∈G Keg et le produit d’algèbre s’écrit eg · eg0 = egg0 .
L’algèbre K[G] est commutative si et seulement si G est commutatif, en fait plus précisément on vérifie
aisément que f est dans le centre de K[G] si et seulement si f (hgh−1 ) = f (g) c’est-à-dire f est constante sur
les classes de conjugaison (on dit que f est centrale). Une représentation est simplement un K[G]-module!
F.1. Généralités.
Donnons deux exemples pour commencer. Un homomorphisme φ : G → C∗ est une représentation de
dimension 1, son image est un groupe fini cyclique. Ensuite on peut définir ρ : Sn → GL(n, K) par
ρ(σ)(ei ) = eσ(i) .
Une représentation est dite fidèle si Ker(ρ) = {e}; remarquons que ρ induit toujours une représentation fidèle
de G/ Ker(ρ).
Un homomorphisme f : E1 → E2 entre deux représentations ρi : G → GL(Ei ) est un homomorphisme de
K[G]-module, ou, en d’autres termes une application K-linéaire telle que pour tout g ∈ G on ait ρ2 (g) ◦ f =
f ◦ ρ1 (g). L’ensemble des homomorphismes forment un groupe noté HomG (E1 , E2 ); l’ensemble des endomor-
phismes d’une représentation E forme un anneau noté EndG (E). Un isomorphisme de représentations est
un homomorphisme bijectif.
La somme de deux représentations ρi : G → GL(Ei ) est la représentation ρ : G → GL(E1 ⊕ E2 ) définie par
ρ(g)(x1 + x2 ) = ρ1 (g)(x1 ) + ρ2 (g)(x2 ). Si Ai est la matrice de ρi (g) dans unebase de Ei , la matrice de ρ(g)
A1 0
dans la base de E obtenu en réunissant les vecteurs des bases de E1 , E2 est .
0 A2
On note Ě le dual de E. La représentation duale ou contragrédiente d’une représentation ρ : G → GL(E)
est la représentation ρ̌ : G → GL(Ě) définie par

∀x ∈ E, ∀x̌ ∈ Ě, (ρ̌(g)(x̌)) (ρ(g)(x)) = x̌(x) ou encore ρ̌(g)(x̌) = x̌ ◦ ρ(g)−1 .

Si A est la matrice de ρ(g) dans une base de E, la matrice de ρ̌(g) dans la base duale est tA−1 .
La représentation régulière de G est définie ainsi : on prend comme espace E := K[G] = ⊕g∈G Keg et comme
action ρ(g)(eh ) = egh . Dans la base des eg les matrices des ρ(g) sont des matrices de permutation.
Une sous-représentation est un sous-espace F de E stable sous l’action de G (c’est un K[G]-sous-module).
La représentation quotient notée ρ̄ ou ρ̄E/F est la représentation qu’on obtient par action sur E/F (c’est le
K[G]-module quotient). Si on choisit F 0 un supplémentaire (non nécessairement G-invariant) et une base de
E respectant la décomposition E = F ⊕ F 0 , si A est la matrice de ρF (g) dans la base de F et B la matrice
0 A ∗
de ρ̄E/F (g) dans la base de E/F déduite de celle de F alors la matrice de ρ(g) est de la forme .
0 B
Par exemple E G := {x ∈ E | ∀g ∈ G, ρ(g)(x) = x} est une sous-représentation.
Remarque. Il n’est pas vrai en général que E soit isomorphe à F ⊕ E/F comme le montre l’exemple du
groupe T des matrices triangulaires de GL(2, K) agissant sur E = K 2 . Il y a un sous-espace stable (une
droite) mais aucun supplémentaire n’est stable.

81
Une représentation est irréductible si elle n’admet aucune sous-représentation autre qu’elle-même et la
représentation nulle. Une représentation de dimension 1 est clairement irréductible, nous verrons plus loin
que tout groupe non abélien admet au moins une représentation irréductible de dimension ≥ 2. Les deux
énoncés suivants expliquent en grande partie l’importance de cette notion.
Lemme. (Lemme de Schur) Soit f : E1 → E2 un homomorphisme entre deux représentations irréductibles
ρi : G → GL(Ei ), alors
(i) Si les deux représentations ne sont pas isomorphes, alors f = 0.
(ii) Si E1 = E2 et ρ1 = ρ2 , alors f est une homothétie.
Preuve. On observe que Ker(f ) est une sous-représentation de E1 , et Im(f ) une sous-représentation de E2
donc ou bien Ker(f ) = E1 et f est nulle, ou bien Ker(f ) = {0} et f est injective. Dans le deuxième cas,
Im(f ) est non nul donc égal à E2 . Pour prouver le point (ii) on remplace f par f − λid avec λ valeur propre
de f ; comme Ker(f − λid) 6= {0} on conclut que Ker(f − λid) = E1 et donc f = λid.

Théorème. Toute représentation d’un groupe fini G sur un corps de caractéristique première à card(G) se
décompose en somme de représentations irréductibles.
Preuve. On a recours au procédé de la moyenne dû à Weyl. Une première méthode, lorsque K = R ou C
est d’introduire sur E un produit scalaire invariant par G. Précisément, si (., .) est un produit scalaire ou
hermitien sur E, on pose X
(x, y)G := (ρ(g)(x), ρ(g)(y)).
g∈G

On voit immédiatement que c’est de nouveau un produit scalaire ou hermitien et que ρ(g) est une isométrie
pour ce produit scalaire. Si F est une sous-représentation de E, on constate que F 0 := F ⊥ est invariant
par ρ(G) et E = F ⊕ F 0 ; bien entendu l’orthogonal est pris au sens du produit scalaire (., .)G . Une variante
p : E → F est un projecteur
de ce procédé consiste à construire un projecteur G-invariant de E sur F . Si P
1 −1
quelconque de E sur F (i.e. pour x ∈ F on a p(x) = x), posons pG = card(G) g∈G ρ(g)pρ(g) , on vérifie
que, si x ∈ F alors pG (x) = x puisque ρ(g)(x) ∈ F pour tout g ∈ G. Le noyau du projecteur pG fournit
alors le supplémentaire cherché. On remarquera que cette variante nécessite uniquement comme hypothèse
que card(G) soit inversible dans K.

Remarques. a) L’exemple où G est le groupe des matrices 2 × 2 triangulaires supérieures à coefficients dans
Fp agissant sur V = F2p montre que l’hypothèse du théorème n’est pas superflue. En effet, il y a bien dans
ce cas une sous-représentation de dimension 1 mais pas de supplémentaire stable.
b) On peut traduire cet énoncé en disant que les K[G]-modules de type fini sont semi-simples. Soit ρ : G →
GL(E) une représentation, il existe des entiers mi ≥ 1 et des représentations irréductibles E1 , . . . , Er deux
à deux non isomorphes telles que E ∼ = E1m1 ⊕ . . . ⊕ Ermr . On dit que mi est la multiplicité de Ei dans la
représentation E (on verra plus loin que cette multiplicité est intrinsèque) et, dans ce cas, le lemme de Schur
se traduit en le fait que

EndG (E) ∼
= End(E1m1 ) × . . . × End(Ermr ) ∼
= Mat(m1 × m1 , K) × . . . × Mat(mr × mr , K).

On peut par exemple se demander quelle est la décomposition de la représentation régulière. Cette question
est résolue plus loin à l’aide de la théorie des caractères mais notonsP
tout de suite que la représentation
régulière n’est jamais irréductible (sauf si G = {e}) puisque, si eG = g∈G eg , la droite F = KeG définit
une sous-représentation triviale.
Le produit tensoriel de deux représentations ρi : G → GL(Ei ) est la représentation ρ : G → GL(E1 ⊗ E2 )
définie par
ρ(g)(x1 ⊗ x2 ) := (ρ1 (g)(x1 )) ⊗ (ρ2 (g)(x2 )) .
Si A = (aij ) (resp. B = (bij )) est la matrice de ρ1 (g) dans une base ei (resp. de ρ2 (g) dans une base fj ) alors
la matrice de ρ dans la base ei ⊗fj est le produit tensoriel des matrices A et B i.e. ci1 ,j1 ;i2 ,j2 = ai1 j1 bi2 j2 . En se
rappelant que Hom(E, F ) = Ě ⊗ F on voit que si ρ : G → GL(E) et ρ0 : G → GL(F ) sont des représentations

82
de G on obtient une représentation de G dans Hom(E, F ) en tensorisant la représentation contragrédiente
de ρ par ρ0 . On peut l’écrire explicitement : si f ∈ Hom(E, F ), on a (ρ̌ ⊗ ρ0 )(g)(f ) = ρ0 (g) ◦ f ◦ ρ(g −1 ). En
particulier les éléments invariants de cette représentation sont les homomorphismes de représentation (i.e.
les f ∈ Hom(E, F ) tels que ρ0 (h) ◦ f = f ◦ ρ(h)), en d’autres termes Hom(E, F )G = HomG (E, F ).
Exercice. Soit ρ : G → GL(E) une représentation de dimension n en caractéristique 6= 2 et ρ(2) : G →
GL(E ⊗ E) la représentation produit tensoriel de deux copies de ρ. Soit δ : E ⊗ E → E ⊗ E linéaire telle
que δ(x1 ⊗ x2 ) = x2 ⊗ x1 et F + (resp; F − ) le sous-espace des éléments invariants (resp. anti-invariants)
de l’involution δ. Montrer que F + et F − sont des sous-représentations de E de dimensions respectivement
n(n+1)/2 et n(n−1)/2 et que E = F + ⊕F − . La représentation F + (resp. F − ) s’appelle le carré symétrique
(resp. le carré alterné) et se note souvent Sym2 (E) (resp. Λ2 (E)).
On peut décrire les représentations irréductibles (et donc les autres) de G1 ×G2 à partir de celles de G1 et G2 .
Tout d’abord si ρi : Gi → GL(Ei ) sont des représentations de G, on définit ρ1 ⊗ ρ2 : G1 × G2 → GL(E1 ⊗ E2 )
par la formule (ρ1 ⊗ ρ2 )(g1 , g2 ) = ρ1 (g1 ) ⊗ ρ2 (g2 ). On peut remarquer que l’application de K[G1 ] ⊗ K[G2 ]
vers K[G1 × G2 ] définie par eg1 ⊗ eg2 7→ e(g1 ,g2 ) est un isomorphisme. On a alors
Proposition. La représentation ρ1 ⊗ ρ2 est une représentation irréductible si et seulement si ρ1 et ρ2 sont
irréductibles. De plus toute représentation irréductible de G1 × G2 est de cette forme.
La preuve est plus facile une fois qu’on a développé la théorie des caractères et est donc renvoyée au para-
graphe suivant.

Décrivons toutes les représentations d’un groupe abélien fini, en supposant pour simplifier que le corps de
base est C. D’après ce qui précède, il suffit de considérer les représentations de Z/mZ. Les matrices ρ(g) sont
toutes diagonalisables car leurs polynômes minimaux divisent X card(G) − 1 et possèdent donc des racines
simples; elles sont mêmes simultanément diagonalisables. Ainsi, à changement de base près, il existe n
homomorphismes φi : G → C∗ tels que
 φ (g) 0 
1
 0 φ2 (g) 
ρ(g) =  .. .
 . 
φn (g)

En particulier les représentations irréductibles sont celles de dimension 1 et la représentation régulière de G

est la somme directe de toutes les représentations irréductibles de G (avec multiplicité 1).
F.2. Caractère d’une représentation.
On suppose dans tout ce paragraphe que K = C.
Définition. Le caractère d’une représentation est l’application χρ : G → C donnée par χρ (g) = Tr ρ(g).

On note tout de suite quelques propriétés évidentes : χρ (e) = dim(ρ), χρ (g −1 ) = χρ (g) et χρ est constant
sur les classes de conjugaison. De plus on a les formules :
(i) χρ1 ⊕ρ2 (g) = χρ1 (g) + χρ2 (g).
(ii) χρ1 ⊗ρ2 (g) = χρ1 (g)χρ2 (g).
(iii) χρ̌ (g) = χρ (g −1 ).
(iv) Si ρ est isomorphe à ρ0 alors χρ = χρ0 .
Preuve. On a χρ (e) = Tr idE = dim(E). Ensuite les matrices ρ(g) sont diagonalisables avec pour valeurs
propres des racines de l’unité donc les valeurs propres de ρ(g −1 ) sont les conjuguées d’icelles et l’on en
déduit bien χρ (g −1 ) = χρ (g). Par ailleurs χ −1 −1
ρ (hgh ) = Tr(ρ(h)ρ(g)ρ(h) ) = Tr ρ(g) = χρ (g). Les formules
A 0
(i), (ii) et (iii) découlent du fait que Tr = Tr A + Tr B, que Tr A ⊗ B = (Tr A)(Tr B) et que
0 B
Tr(tA) = Tr A. Enfin si ρ0 (g) = f ◦ ρ(g) ◦ f −1 on a χρ0 (g) = Tr ρ0 (g) = Tr(f ◦ ρ(g) ◦ f −1 ) = Tr ρ(g) = χρ (g).

83
On introduit maintenant un produit scalaire sur les fonctions de G dans C :
1 X
(f, f 0 ) := f (g)f 0 (g).
card(G)
g∈G

Une des propriétés essentielles de ce produit scalaire est la suivante :

Proposition. Soit χ1 , χ2 les caractères de deux représentations irréductibles de G. On a (χ1 , χ2 ) = 0 si les
deux représentations ne sont pas isomorphes et (χ1 , χ2 ) = 1 si les deux représentations sont isomorphes.
1 G
P
Preuve. Considérons π := card(G) g∈G ρ(g), on voit que π est un projecteur de E sur E (en effet pour tout
x ∈ E on a que π(x) est invariant par G et si x ∈ E alors π(x) = x) et donc que sa trace vaut dim(E G ).
G

On a donc montré que

1 X
χρ (g) = dim(E G ).
card(G)
g∈G

On applique alors cela à ρ = ρˇ1 ⊗ ρ2 et on en tire

1 X 1 X
(χ2 , χ1 ) = χ1 (g −1 )χ2 (g) = χρ (g) = dim(Hom(E1 , E2 )G ) = dim(HomG (E1 , E2 )).
card(G) card(G)
g∈G g∈G

Mais le lemme de Schur indique que la dernière dimension est nulle si χ1 6= χ2 et vaut un si E1 ∼
= E2 .

Corollaire. Soit ρ : G → GL(E) une représentation de caractère χρ et soit χψ le caractère d’une

représentation irréductible ψ : G → GL(F ). La multiplicité de la représentation F dans E est égale à
(χρ , χψ ).
Preuve. En effet écrivons une décomposition de E en somme d’irréductibles E = E1m1 ⊕ . . . ⊕ Ermr et notons
χi le caractère de Ei . On a donc χρ = m1 χ1 + . . . + mr χr . D’après la proposition précédente, on a

0 si χψ 6= χ1 , . . . , χr
(χρ , χψ ) = m1 (χ1 , χψ ) + . . . + mr (χr , χψ ) =
mi si χψ = χi

d’où le résultat.

Remarque. En particulier cet énoncé permet de vérifier que la multiplicité ne dépend pas de la décomposition
de la représentation E.
On en déduit facilement l’important résultat suivant :
Théorème. Deux représentations sont isomorphes si et seulement si elles ont mêmes caractères.
Preuve. En effet si χρ = χρ0 alors les deux représentations contiennent une représentation irréductible de
caractère χ avec la même multiplicité (χρ , χ) = (χρ0 , χ) et sont donc isomorphes à la même somme de
représentations irréductibles.

On peut aussi observer que si E = E1m1 ⊕ . . . ⊕ Ermr est une décomposition de la représentation ρ en
irréductibles deux à deux non isomorphes alors (χρ , χρ ) = m21 + . . . m2r et en déduire l’énoncé suivant :
Proposition. Soit ρ : G → GL(E) une représentation, alors (χρ , χρ ) est un entier strictement positif qui
est égal à 1 si et seulement si ρ est irréductible.
Nous sommes maintenant en mesure de calculer la décomposition de la représentation régulière.
Théorème. Soit Irr(G) l’ensemble des représentations irréductibles de G (à isomorphismes près), si χ est
le caractère d’une de ces représentations, on note χ(e) = mχ sa dimension. On a lors
X
χreg = mχ χ
χ∈Irr(G)

84
ou encore
RegG = ⊕E∈Irr(G) E mE
et en particulier X
|G| = m2χ .
χ∈Irr(G)

Preuve. On voit directement que χreg (g) = 0 si g ∈ G \ {e} (resp. χreg (e) = card(G)). En effet pour g 6= e
la matrice de ρ(g) est une matrice de permutation sans point fixe. On en tire

1 X 1
(χreg , χ) = χreg (g −1 )χ(g) = (card(G)χ(e)) = χ(e) = mχ
card(G) card(G)
g∈G

et on applique les résultats précédents.

Exemple. Le nombre de représentation de G de dimension 1 est (G : D(G)) (où D(G) désigne le sous-groupe
des commutateurs). En effet GL(1) est commutatif et donc une telle représentation se factorise par G/D(G).
Application. Nous sommes en mesure de démontrer les résultats annoncés au paragraphe précédent sur les
représentations de G1 × G2 . Soient ρi : Gi → GL(Ei ) deux représentations des groupes Gi de cardinal Ni et
χi leurs caractères respectifs, le caractère de ρ = ρ1 ⊗ ρ2 est donné par χ(g1 , g2 ) = χ1 (g1 )χ2 (g2 ) donc

1 X
(χ, χ) = χ(g1 , g2 )χ(g1 , g2 )
N1 N2
(g1 ,g2 )∈G1 ×G2
  
1 X 1 X
= χ1 (g1 )χ1 (g1 )  χ2 (g2 )χ2 (g2 )
N1 N2
g1 ∈G1 g2 ∈G2

= (χ1 , χ1 )(χ2 , χ2 ).

On en déduit que ρ est irréductible si et seulement si (χ, χ) = 1 donc si et seulement si (χ1 , χ1 ) = (χ2 , χ2 ) = 1
donc si et seulement si ρ1 et ρ2 sont irréductibles. Remarquons que l’application de Irr(G1 ) × Irr(G2 ) vers
Irr(G1 × G2 ) définie par (ρ1 , ρ2 ) 7→ ρ1 ⊗ ρ2 est injective car le caractère χ1 (resp. χ2 ) se récupère à partir de
χ par la formule χ1 (g1 ) = χ(g1 , 1) (resp. χ2 (g2 ) = χ(1, g2 )). Enfin on vérifie que l’application est également
surjective car
X X X X
m2ρ1 ⊗ρ2 = m2ρ1 m2ρ2 = |G1 | · |G2 | = m2ρ .
ρ1 ∈Irr(G1 ),ρ2 ∈Irr(G2 ) ρ1 ∈Irr(G1 ) ρ2 ∈Irr(G2 ) ρ∈Irr(G1 ×G2 )

Nous allons montrer deux autres résultats sur les représentations irréductibles.
Théorème. Les représentations irréductibles sont en bijection avec les classes de conjugaison.
Preuve. Considérons la sous-algèbre A de C[G] consituée des fonctions centrales i.e. constantes sur les classes
de conjugaison, sa dimension sur C est égale au nombre de classes de conjugaison (c’est aussi le centre de
l’algèbre C[G]). Les caractères χ1 , . . . , χr des représentations irréductibles de G sont dans A et forment une
famille orthonormale. Montrons qu’ils fournissent une base de A, ce qui achèvera la preuve. Il suffit de
montrer que si f : G → C est une fonction dans A orthogonale P aux χi alors f est nulle. Introduisons, pour
toute représentation ρ : G → GL(E) l’application linéaire ρf = g∈G f (g)ρ(g). On peut calculer ρf à l’aide
du lemme suivant
Lemme. Si ρ est de dimension n, irréductible de caractère χ alors ρf est une homothétie de rapport

1 X card(G)
f (g)χ(g) = (f, χ̄).
n n
g∈G

85
Preuve du lemme. On commence par montrer que ρf est un endomorphisme de la représentation, en effet :
X X X
ρ(h)−1 ρf ρ(h) = f (g)ρ(h)−1 ρ(g)ρ(h) = f (g)ρ(h−1 gh) = f (hkh−1 )ρ(k) = ρf .
g∈G g∈G k∈G

Le lemme de Schur garantit donc que ρf est une homothétie et sa trace vaut
X X
Tr ρf = f (g) Tr ρ(g) = f (g)χ(g)
g∈G g∈G

d’où le résultat.

La preuve montre que card(Irr(G)) est égal au nombre de classes de conjugaison de G car chacun des deux
ensembles est en bijection naturelle avec les éléments d’une base d’un même espace vectoriel, mais ne fournit
pas de bijection naturelle entre ces classes et les représentations irréductibles; en fait on ne connait de telle
bijection que pour certains groupes particuliers (par exemple les groupes Sn ). Revenons au cas où f est
orthogonale aux caractères des représentations irréductibles donc à tous les caractères; on voit donc que
ρf = 0 pour toutes les représentations et en particulier pour la représentation régulière. Ceci entraı̂ne que,
si ρ est la représentation régulière, on a
X X
0 = ρf (eh ) = f (g)ρ(g)(eh ) = f (g)egh .
g∈G g∈G

Puisque les eg sont linéairement indépendants, on en déduit bien que f (g) = 0 pour tout g ∈ G.

Corollaire. Un groupe G est abélien si et seulement si toutes ses représentations irréductibles sont de
dimension 1.
Preuve. On a déjà vu que si G est abélien, alors ses représentations irréductibles sont de dimension 1.
Inversement si ses représentations irréductibles sont de dimension 1, on a card(G) = 12 + . . . + 12 donc il
y a card(G) représentations irréductibles, donc autant de classes de conjugaison, ce qui signifie que G est
abélien.

Théorème. Soit m la dimension d’une représentation irréductible de G, alors

(i) L’entier m divise card(G).
(ii) Soit A un sous-groupe abélien de G, alors m ≤ (G : A).
Preuve. Le point (i) est prouvé plus loin à l’aide de considérations d’intégralité. Pour le point (ii) considérons
la restriction ρA : A → GL(E); c’est une représentation de groupe abélien donc elle contient une sous-
représentation F de dimension 1. Soit maintenant g1 , . . . , gs des représentants de G/A (en particulier s =
(G : A)) alors E 0 = ρ(g1 )(F ) + . . . + ρ(gs )(F ) est stable par ρ(G) car ggi s’écrit aussi gj h avec h ∈ A donc
ρ(g)ρ(gi )(F ) = ρ(gj h)(F ) = ρ(gj )(F ). On a donc E = E 0 et comme la dimension de E 0 est ≤ s on a bien
démontré l’énoncé.

Exemples. Donnons maintenant pour quelques “petits” groupes finis G une description des représentations
irréductibles et de leurs caractères.
(a) Si G est abélien de cardinal n, il existe n homomorphismes différents G → C∗ = GL(1, C) et ainsi
n = 12 + . . . + 12 . Si G = Z/nZ, ces homomorphismes s’écrivent φk (m) = exp(2iπkm/n). Plus
généralement, si G = Z/a1 Z × . . . × Z/ar Z, ces homomorphismes s’écrivent

k1 m1 kr mr
φk (m1 , . . . , mr ) = exp 2iπ + ... + pour 0 ≤ ki ≤ ai − 1.
a1 ar

(b) Si G = S3 , on a deux représentations de dimension 1, la représentation triviale et la signature. Il

y a trois classes de conjugaison donc une autre représentation qui doit être de dimension 2 (puisque

86
6 = 12 +12 +22 ). On peut décrire cette représentation comme la sous-représentation de la représentation
de permutation ρ : S3 → GL(3, C) définie par le plan d’équation x1 + x2 + x3 = 0.
(c) Si G = Dn , alors G contient un sous-groupe abélien (cyclique) d’indice 2 donc les représentations
irréductibles sont de dimension 1 ou 2. On a G/D(G) ∼ = Z/2Z si n est impair (resp. ∼= (Z/2Z)2 ) si n
est pair). Ainsi le nombre de représentations irréductibles de dimension 2 est (2n − 2)/4 = (n − 1)/2 si
n est impair et (2n − 4)/4 = n/2 − 1 si n est pair. Notons x ∈ G une rotation d’ordre n et y ∈ G une
symétrie (donc xn = y 2 = e et yxy = yxy −1 = x−1 ), on peut décrire les représentations de dimension 2
par les formules

exp(2kπi/n) 0 0 1
ρk (x) = et ρk (y) = .
0 exp(−2kπi/n) 1 0

Si n est impair on choisit k = 1, . . . , (n − 1)/2; si n est pair on choisit k = 1, . . . , (n − 2)/2. Remarquons

que les valeurs des caractères s’écrivent

χk (xa ) = 2 cos(2kaπ/n) et χk (yxa ) = 0.

(d) Plus généralement si p, q sont premiers tels que q = mp + 1, soit G = Z/qZ >/φ Z/pZ le groupe non
commutatif de cardinal pq. Les représentations de G ont une dimension inférieure à p et qui divise pq
donc égale à 1 ou p. Par ailleurs G/D(G) ∼ = Z/pZ donc il y a p représentations de dimension 1 et m
représentations de dimension p. On a bien pq = p12 + mp2 . On peut vérifier qu’il y a bien m + p classes
de conjugaison : la classe du neutre, les éléments d’ordre p se répartissent en p − 1 classes de cardinal q,
les éléments d’ordre q se répartissent en m classes de cardinal p. Pour construire les représentations de
dimension p on peut procéder comme suit. On note x ∈ G un générateur du sous-groupe d’ordre q et y
un élément d’ordre p de sorte que yxy −1 = xu où u entier qui est d’ordre p dans (Z/qZ)∗ ; on choisit α
racine q-ième de l’unité et on pose :

α 0 1
   
0 αu  1 0 

ρα (x) =  .. 
et

ρα (y) =  .. 
.
 . 
  . 
p−2
 αu   0 
p−1
αu 0 1 0

Les caractères de ces représentations s’écrivent, en notant α = exp(2kπi/q),

p−1
X
χk (xa ) = exp(2kauj πi/q) et χk (y b xa ) = 0.
j=0

On obtient un ensemble non redondant en choisissant k1 , . . . , km tels que l’ensemble des ki uj (pour
i = 1, . . . , m et j = 0, . . . , p − 1) décrive tout (Z/qZ)∗ .
(e) Si G = H8 . Il y a 5 classes de conjugaison. Le quotient de G par son centre {±1} est isomorphe à
(Z/2Z)2 donc il y a quatre représentations de dimension 1 et une représentation de dimension 2 puisque
8 = 12 + 12 + 12 + 12 + 22 . La représentation de dimension 2 est la représentation “standard” donnée
par :
i 0 0 1 0 i
ρ(±1) = ±Id, ρ(i) = , ρ(j) = et ρ(k) = ,
0 −i −1 0 i 0
le caractère s’écrivant χ(±1) = ±2 et χ(x) = 0 si x 6= ±1.
(f) Si G = A4 , il y a 4 classes de conjugaison et le quotient de G par le groupe de Klein est isomorphe à Z/3Z
et c’est G/D(G), donc il y a exactement trois représentations de dimension 1 et donc une quatrième
représentation irréductible qui doit être de dimension 3 puisque 12 = 12 + 12 + 12 + 32 . Considérons la
représentation de permutation sur C4 et E le sous-espace x1 + x2 + x3 + x4 = 0, on vérifie facilement
que c’est la représentation cherchée.

87
(g) Si G = A5 , il y a 5 classes de conjugaison : la classe de l’élément neutre, la classe C2,2 des doubles
transpositions (15 éléments), la classe C3 des 3-cycles (20 éléments) et deux classes C5 et C50 décrivant
les 5-cycles (12 éléments chacune). Comme G est simple, la seule représentation de dimension 1 est la
représentation triviale. La représentation de permutation sur C5 contient une sous-représentation E :
le sous-espace x1 + x2 + x3 + x4 + x5 = 0, on vérifie facilement que c’est une représentation irréductible,
on la note ρ4 . Le groupe A5 contient six sous-groupes de Sylow de cardinal 5 et on a donc une injection
“exotique” A5 ,→ S6 ; on obtient une sous-représentation F de dimension 5 donnée par l’hyperplan
somme des coordonnées égale zéro dans la représentation de permutation ; on vérifie également que
c’est une représentation irréductible de A5 , on la note ρ5 . Les deux autres représentations irréductibles
sont de dimension 3 puisque 60 = 12 + 32 + 32 + 42 + 52 . On sait que A5 est le groupe d’isométrie
de l’icosaèdre, d’où une première représentation ρ2 de dimension 3, la deuxième s’obtient en modifiant
celle-ci par l’automorphisme φ “conjugaison par une transposition” (qui n’est pas intérieur dans A5 ),
c’est-à-dire ρ3 := ρ2 ◦ φ. Comme φ échange C5 et C50 et comme χ2 (C5 ) 6= χ2 (C50 ) on voit que ρ2 et ρ3 ne
sont pas isomorphes.
On peut vérifier que le tableau des valeurs des 5 caractères χi := χρi est le suivant :

1 C2,2 C3 C5 C50

χ1 1 1 1 1 1
√ √
1+ 5 1− 5
χ2 3 -1 0 2 2
√ √
1− 5 1+ 5
χ3 3 -1 0 2 2

χ4 4 0 1 -1 -1

χ5 5 1 -1 0 0

Passons maintenant à des considérations d’intégralité. La première remarque est que les valeurs propres d’un
ρ(g) étant des racines de l’unité, les valeurs prises par un caractère sont des entiers algébriques. On peut
être plus précis et montrer
Proposition. Soit f : G → C une fonction centrale dont les valeursPsont des entiers algébriques, et soit χ le
caractère d’une représentation irréductible de dimension n alors n1 g∈G f (g)χ(g) est un entier algébrique.
P
Preuve. Soit C1 , . . . , Ch les classes de conjugaison de G et eCi = g∈Ci g ∈ Z[G]. Alors B = ZeC1 +. . .+ZeCh
est un sous-anneau commutatif de Z[G] (ou C[G]) dont tous les éléments sont entiers sur Z (i.e. racine d’un
polynôme
P unitaire à coefficients dans Z). On en déduit que le polynôme caractéristique (ou minimal) de
ρf = g∈G f (g)ρ(g) est à coefficients entiers et donc que sa valeur propre n1 g∈G f (g)χ(g) est un entier
P
algébrique.

Corollaire. La dimension n d’une représentation irréductible de G divise le cardinal de G.

Preuve. On applique l’énoncé précédent à la fonction f (g) = χ(g −1 ) et on obtient que n1 g∈G χ(g −1 )χ(g) =
P
|G| |G|
n (χ, χ) = n est un entier algébrique donc un entier.

Application. Montrons qu’un groupe G de cardinal pa q b est résoluble (résultat dû à Burnside). Il suffit en
fait de montrer qu’il n’est pas simple.
Lemme. Soit ρ une représentation irréductible de G de dimension n, soit χ son caractère et soit C une
classe de conjugaison de cardinal h avec PGCD(h, n) = 1, alors ou bien χ(C) = 0 ou bien χ(C) = nζ avec ζ
racine de l’unité et ρ(C) est dans le centre de la représentation.

88
Preuve du lemme. Choisissons x ∈ C, ou bien toutes les valeurs propres de ρ(x) sont égales et alors ρ(x) = ζid
et bien sûr χ(x) = nζ, ou bien les valeurs propres ζ1 , . . . , ζn ne sont pas toutes égales. Dans le dernier cas
on a donc |χ(x)| = |ζ1 + . . . + ζn | < n. Par ailleurs nous avons vu que hχ(x)/n est un entier algébrique, or
l’hypothèse entraı̂ne par le théorème de Bézout l’existence de u, v ∈ Z tels que uh + vn = 1 donc

χ(x) hχ(x)
=u + vχ(x)
n n

est encore un entier algébrique. Etant de module < 1 dans tout plongement, il est donc nul (car sa norme
est un entier < 1).
Soit maintenant G de cardinal pa q b , choisissons x 6= e dans le centre d’un q-sous-groupe de Sylow, alors
ou bien x est dans le centre de G qui n’est donc pas simple, ou bien la classe de conjugaison de x a pour
cardinal une puissance positive de p. Soit χ le caractère de ρ une des représentations irréductibles de G,
d’après le lemme, ou bien p divise la dimension mχ de la représentation, ou bien χ(x) = 0, ou bien ρ(x) est
dans le centre de ρ(G). Mais, en écrivant
X X
0 = χreg (x) = mχ χ(x) = 1 + mχ χ(x)
χ∈Irr(G) χ6=1

on voit qu’on ne peut avoir χ(x) = 0 pour tous les χ tels que p ne divise pas mχ , sinon on obtiendrait une
égalité du type 0 = 1 + p(entier). Par conséquent pour une de ces représentations, ρ(x) est dans le centre de
ρ(G) et donc G n’est pas simple.

Vous aimerez peut-être aussi

Groupes et Actions de Groupes en Mathématiques
Pas encore d'évaluation
Groupes et Actions de Groupes en Mathématiques
41 pages
Structures Algebriques I
Pas encore d'évaluation
Structures Algebriques I
50 pages
Algebre 2
Pas encore d'évaluation
Algebre 2
45 pages
Cours Algèbre Et Géométrie PDF
Pas encore d'évaluation
Cours Algèbre Et Géométrie PDF
117 pages
Chap 123 Algèbre VI
Pas encore d'évaluation
Chap 123 Algèbre VI
116 pages
Cours1 Groupes
Pas encore d'évaluation
Cours1 Groupes
15 pages
Groupagreg
Pas encore d'évaluation
Groupagreg
38 pages
L3M1
Pas encore d'évaluation
L3M1
23 pages
3M270 Poly
Pas encore d'évaluation
3M270 Poly
43 pages
Agreg Interne Cours Groupes
Pas encore d'évaluation
Agreg Interne Cours Groupes
18 pages
06 - Compléments D'algèbre - 08-21
Pas encore d'évaluation
06 - Compléments D'algèbre - 08-21
12 pages
Groupes et Sous-groupes en Algèbre
Pas encore d'évaluation
Groupes et Sous-groupes en Algèbre
13 pages
Morphismes et Groupes en Mathématiques
Pas encore d'évaluation
Morphismes et Groupes en Mathématiques
57 pages
Cours Structure
Pas encore d'évaluation
Cours Structure
13 pages
Theorie Des Groupes 22 23 Version Etudiants
Pas encore d'évaluation
Theorie Des Groupes 22 23 Version Etudiants
24 pages
Cours - Groupes
Pas encore d'évaluation
Cours - Groupes
26 pages
Emily Clement-Theorie Des Groupes 2014-2015
Pas encore d'évaluation
Emily Clement-Theorie Des Groupes 2014-2015
135 pages
Cours d'Algèbre pour Étudiants Avancés
Pas encore d'évaluation
Cours d'Algèbre pour Étudiants Avancés
217 pages
Structures algébriques : groupes et anneaux
Pas encore d'évaluation
Structures algébriques : groupes et anneaux
22 pages
Algebre 2 Structures Polynomes Et Fractions Rationnelles Compressed
Pas encore d'évaluation
Algebre 2 Structures Polynomes Et Fractions Rationnelles Compressed
52 pages
LM325
Pas encore d'évaluation
LM325
16 pages
Chapitre3 - Structures - Slides BENTALEB PDF
100% (1)
Chapitre3 - Structures - Slides BENTALEB PDF
17 pages
Introduction à la Théorie des Groupes
Pas encore d'évaluation
Introduction à la Théorie des Groupes
69 pages
Alg 3 VF
Pas encore d'évaluation
Alg 3 VF
29 pages
Groupes et Sous-groupes en Mathématiques
Pas encore d'évaluation
Groupes et Sous-groupes en Mathématiques
25 pages
M31 Cours
Pas encore d'évaluation
M31 Cours
48 pages
Comp Il Groupes 2012
Pas encore d'évaluation
Comp Il Groupes 2012
55 pages
Algèbre 1 V. Def 2017-2018 PDF
Pas encore d'évaluation
Algèbre 1 V. Def 2017-2018 PDF
141 pages
Introduction aux Groupes Algébriques
100% (1)
Introduction aux Groupes Algébriques
141 pages
Strictures Algébrique Prof Harzelah
Pas encore d'évaluation
Strictures Algébrique Prof Harzelah
9 pages
Cours Alg-Geom
Pas encore d'évaluation
Cours Alg-Geom
30 pages
Structures Algébriques
Pas encore d'évaluation
Structures Algébriques
8 pages
Gruppi
Pas encore d'évaluation
Gruppi
36 pages
‎⁨تقرير مفصل حول التقويم التشخيصي (1) ⁩
Pas encore d'évaluation
‎⁨تقرير مفصل حول التقويم التشخيصي (1) ⁩
33 pages
Cours Chapitre 001
Pas encore d'évaluation
Cours Chapitre 001
24 pages
Structures Polynomes Et Fractions Rationnelles
Pas encore d'évaluation
Structures Polynomes Et Fractions Rationnelles
17 pages
oupesSymétriques-Determinant Lic 2 Maths Info
Pas encore d'évaluation
oupesSymétriques-Determinant Lic 2 Maths Info
41 pages
Qalam Gpes
Pas encore d'évaluation
Qalam Gpes
21 pages
Algebre Cours
Pas encore d'évaluation
Algebre Cours
277 pages
Introduction aux groupes et sous-groupes
Pas encore d'évaluation
Introduction aux groupes et sous-groupes
8 pages
Cours L3 Algèbre
Pas encore d'évaluation
Cours L3 Algèbre
250 pages
Relations Structures III
Pas encore d'évaluation
Relations Structures III
5 pages
Chap 0
Pas encore d'évaluation
Chap 0
18 pages
Arithmétique et Groupes en Algèbre
Pas encore d'évaluation
Arithmétique et Groupes en Algèbre
46 pages
Théorie Des Groupes DR ABALO CM L3
Pas encore d'évaluation
Théorie Des Groupes DR ABALO CM L3
59 pages
Cours d'Algèbre II : Groupes et Espaces Vectoriels
Pas encore d'évaluation
Cours d'Algèbre II : Groupes et Espaces Vectoriels
52 pages
Cour Algebre 2
Pas encore d'évaluation
Cour Algebre 2
29 pages
Groupm 1
Pas encore d'évaluation
Groupm 1
34 pages
Concepts fondamentaux des groupes
100% (1)
Concepts fondamentaux des groupes
19 pages
Cours de Théorie Des Groupes
Pas encore d'évaluation
Cours de Théorie Des Groupes
23 pages
Poly 20
Pas encore d'évaluation
Poly 20
23 pages
Groupe
Pas encore d'évaluation
Groupe
32 pages
Introduction aux Groupes en Algèbre
Pas encore d'évaluation
Introduction aux Groupes en Algèbre
149 pages
Introduction aux Groupes Mathématiques
Pas encore d'évaluation
Introduction aux Groupes Mathématiques
4 pages
Cours d'Algèbre : Groupes et Applications
Pas encore d'évaluation
Cours d'Algèbre : Groupes et Applications
202 pages
Cours Algèbre M. Kachkachi
100% (1)
Cours Algèbre M. Kachkachi
140 pages
Propriétés des groupes et sous-groupes
Pas encore d'évaluation
Propriétés des groupes et sous-groupes
7 pages
Grammaire 1: La Formation Du Passé Grammaire 2: Le Verbe Être Grammaire 3: Les Verbes Pronominaux
Pas encore d'évaluation
Grammaire 1: La Formation Du Passé Grammaire 2: Le Verbe Être Grammaire 3: Les Verbes Pronominaux
3 pages
Verbes Pronominaux Russes
Pas encore d'évaluation
Verbes Pronominaux Russes
2 pages
Sécurité Des Communications 5G Véhiculaires (5G-V2X) Dans Un Contexte Transfrontalier
Pas encore d'évaluation
Sécurité Des Communications 5G Véhiculaires (5G-V2X) Dans Un Contexte Transfrontalier
10 pages
CorPartielMA3 2011
Pas encore d'évaluation
CorPartielMA3 2011
4 pages
Topographie Et Cartog
Pas encore d'évaluation
Topographie Et Cartog
14 pages
Constructeur de copie en Java
Pas encore d'évaluation
Constructeur de copie en Java
45 pages
TP1 Ajustage
Pas encore d'évaluation
TP1 Ajustage
28 pages
TD Biochimie Des Macromolecules - 2023-2024
Pas encore d'évaluation
TD Biochimie Des Macromolecules - 2023-2024
10 pages
Serie 2 TG PDF
Pas encore d'évaluation
Serie 2 TG PDF
2 pages
Rapport Cta
Pas encore d'évaluation
Rapport Cta
4 pages
Code - Aster: SNNP106 - Calcul Du Ferraillage D'une Poutre-Voile Avec Trémie Par La Méthode Bielles-Tirants
Pas encore d'évaluation
Code - Aster: SNNP106 - Calcul Du Ferraillage D'une Poutre-Voile Avec Trémie Par La Méthode Bielles-Tirants
14 pages
Isoméries : Types et Représentations
Pas encore d'évaluation
Isoméries : Types et Représentations
11 pages
Bio Méta
Pas encore d'évaluation
Bio Méta
2 pages
Genie Logiciel
Pas encore d'évaluation
Genie Logiciel
22 pages
Déverrouiller un RAR avec cRARk
Pas encore d'évaluation
Déverrouiller un RAR avec cRARk
1 page
Chap 4 2021
Pas encore d'évaluation
Chap 4 2021
20 pages
Cours Energie Et Rendement 3eme
Pas encore d'évaluation
Cours Energie Et Rendement 3eme
3 pages
Rapport D'épidémiologie
Pas encore d'évaluation
Rapport D'épidémiologie
21 pages
Contrôle Continu Technologie Brasserie Bloc Froid
Pas encore d'évaluation
Contrôle Continu Technologie Brasserie Bloc Froid
13 pages
Caissier Bancaire Module Iii Mathématique de Base
Pas encore d'évaluation
Caissier Bancaire Module Iii Mathématique de Base
4 pages
Introduction à PowerShell
Pas encore d'évaluation
Introduction à PowerShell
13 pages
Programmation Linéaire : Optimisation et Résolution Graphique
100% (1)
Programmation Linéaire : Optimisation et Résolution Graphique
5 pages
Introduction à la Thermodynamique
Pas encore d'évaluation
Introduction à la Thermodynamique
38 pages
Propagation rectiligne de la lumière
100% (2)
Propagation rectiligne de la lumière
45 pages
Moteurs Le Guide Du Hors Bord
100% (1)
Moteurs Le Guide Du Hors Bord
12 pages
Courant Alternatif Monophasé
Pas encore d'évaluation
Courant Alternatif Monophasé
1 page
Capteurs Et Actionneurs
Pas encore d'évaluation
Capteurs Et Actionneurs
39 pages
Baltur TBG 260MC
Pas encore d'évaluation
Baltur TBG 260MC
34 pages
Techniques Protéiques pour M1 Biochimie
Pas encore d'évaluation
Techniques Protéiques pour M1 Biochimie
37 pages
Nombres Complexes et Suites
Pas encore d'évaluation
Nombres Complexes et Suites
9 pages
5 Iemee
Pas encore d'évaluation
5 Iemee
2 pages
Capteurs et Actionneurs : Fonctions et Applications
Pas encore d'évaluation
Capteurs et Actionneurs : Fonctions et Applications
16 pages
Concours Mathématiques II PSI 2005 Maroc
Pas encore d'évaluation
Concours Mathématiques II PSI 2005 Maroc
4 pages
TD1 Effets de La Précontrainte Sur Une Structure
Pas encore d'évaluation
TD1 Effets de La Précontrainte Sur Une Structure
2 pages

Cours Alg

Transféré par

Cours Alg

Transféré par

COURS D’ALGÈBRE AU MAGISTÈRE DE CACHAN

Marc HINDRY, Université Paris 7.

A. GROUPES ET ACTIONS DE GROUPES.

En un semestre A, B, C et D ont été traitées et il a été fait allusion aux parties E et F.

A.1. Généralités sur les groupes.

y = ey = (x−1 x)y = x−1 (xy) = x−1 (xz) = (x−1 x)z = ez = z.

L’inverse de x−1 est x et l’inverse de xy est y −1 x−1 , en effet :

(xy)(y −1 x−1 ) = x(yy −1 )x−1 = xex−1 = xx−1 = e.

On a xm .xn = xm+n et (xm )n = xmn . Si y = gxg −1 alors y n = gxn g −1 .

∀x, y ∈ G1 , f (xy) = f (x)f (y);

c’est un isomorphisme si elle est bijective, un automorphisme si de plus G1 = G2 . On appelle noyau le

A.2. Quotient d’un groupe par un sous-groupe.

card(G) = card(H) card(G/H).

Théorème. (Propriété universelle du quotient) Soit f : G → G0 un homomorphisme de groupes. Soit H

Corollaire. Soit f : G → G0 un homomorphisme de groupe, alors f (G) ∼

A.3. Action de groupe.

On abrègera en général Φ(g, x) en g.x.

Une action définit une relation d’équivalence

Formule des classes (2ème forme).

On note X G l’ensemble des points fixes, c’est-à-dire

En particulier, si |X| n’est pas divisible par p, il existe un point fixe.

Corollaire. Le centre d’un p-groupe est non trivial.

A.4. Théorèmes de Sylow.

On peut démontrer cela directement, en effet

(k, h) ∗ (k 0 , h0 ) = (kφh (k 0 ), hh0 ) (1)

(k, h) ∗ (k 0 , h0 ) = (kφ(h)(k 0 ), hh0 ) (2)

Théorème : Soient K, H deux groupes et φ : H → Aut(K) un homomorphisme de groupes.

(k, h) ∗ (k 0 , h0 ) = (kφh (k 0 ), hh0 )

est un groupe, appelé produit semi-direct de K et H relativement à φ ; il se note

2) Un groupe G est isomorphe à K >/φ H si et seulement si il contient deux sous-groupes K 0 et H 0 avec

2) La discussion précédant le théorème montre que si G contient K 0 , H 0 comme indiqués alors G ∼

par automorphismes intérieurs est donnée par φ puisque:

(e, h) ∗ (k, e0 ) ∗ (e, h)−1 = (φ(h)(k), h) ∗ (e, h−1 ) = (φ(h)(k), e0 ).

Proposition L’application f 7→ f (1) induit un isomorphisme de groupes Aut(Z/nZ) ∼

G1 = (Z/pZ)2 >/φ Z/pZ, G2 = Z/p2 Z >/φ Z/pZ, G3 = (Z/pZ)3 , G4 = Z/p2 Z × Z/pZ

cherché. Pour cela on observe qu’il existe a, b tels que

H := {+1, −1, +i, −i, +j, −j, +k, −k}.

Supplément : isomorphismes entre produits semi-directs.

F ((k, h) ∗φ (k 0 , h0 )) = (α(kφ(h)(k 0 )), β(hh0 ))

Preuve. L’ensemble H := mZ + nZ = {am + bn | a, b ∈ Z} est clairement un sous-groupe; il est donc de la

fˆ : Z/ PPCM(m, n)Z ,→ Z/mZ × Z/nZ.

La description des sous-groupes de Z/nZ est assez simple.

Il reste à décrire la structure des groupes (Z/p Z)∗ .

Proposition. Soit p premier et α ≥ 1 alors

ρ(i1 , . . . , im )ρ−1 = (ρ(i1 ), . . . , ρ(im )).

/ {ρ(i1 ), . . . , ρ(im )} alors ρ−1 (j) ∈

La signature d’une permutation σ ∈ Sn peut être définie par la formule

Proposition. L’application  : Sn → {±1} est un homomorphisme de groupes. La signature d’une trans-

(i1 , . . . , im ) = (i1 , i2 )(i2 , i3 ) · · · (im−1 , im )

K := {id, (1, 2)(34), (1, 3)(2, 4), (1, 4)(2, 3)} .

A.8.1. Théorème de Jordan-Holder.

A.8.3. Classification des groupes simples finis (aperçu).

A.8.4. Groupes définis par générateurs et relations.

Si on écrit G = L(S)/N et si R est un ensemble de générateurs de N on dit qu’on a une présentation de G

A.8.5. Problèmes de Burnside.

Groupe Autre nom cardinal

F4 (q) q 24 (q 2 − 1)(q 6 − 1)(q 8 − 1)(q 12 − 1)

E8 (q) q 120 (q 2 − 1)(q 8 − 1)(q 12 − 1)(q 14 − 1)(q 18 − 1)(q 20 − 1)(q 24 − 1)(q 30 − 1)

groupe cardinal du groupe et sa factorisation

M11 24 .32 .5.11 = 7920

M12 26 .33 .5.11 = 95 040

M22 27 .32 .5.7.11 = 443 520

M23 27 .32 .5.7.11.23 = 10 200 960

M24 210 .33 .5.7.11.23 = 244 823 040

J1 23 .3.5.7.11.19 = 175 560

J2 27 .33 .52 .7 = 604 800

J3 27 .35 .5.17.19 = 50 232 960

HS 29 .32 .53 .7.11 = 44 352 000

He 210 .33 .52 .73 .17 = 4 030 387 200

Mc 27 .36 .53 .7.11 = 898 128 000

Suz 213 .37 .52 .7.11.13 = 448 345 497 600

Ly 28 .37 .56 .7.11.31.37.67 = 51 765 179 004 000 000

Ru 214 .33 .53 .7.13.29 = 36 481 536 000

O0 N 29 .34 .5.73 .11.19.31 = 460 815 505 920

Co3 210 .37 .53 .7.11.23 = 495 766 656 000

F i22 217 .39 .52 .7.11.13 = 64 561 751 654 400

Proposition. L’application : Sn → {±1} est un homomorphisme de groupes. La signature d’une trans-