0% ont trouvé ce document utile (0 vote)
47 vues277 pages

Algebre Cours

Le document traite des groupes en algèbre, en commençant par les définitions fondamentales et les propriétés des groupes, y compris les groupes abéliens et les sous-groupes. Il présente également des exemples de groupes, tels que les groupes linéaires et les groupes symétriques, ainsi que des exercices pour approfondir la compréhension. La structure est organisée en plusieurs sections, abordant des concepts variés comme les groupes classiques et les représentations des groupes finis.

Transféré par

adil.bahri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
47 vues277 pages

Algebre Cours

Le document traite des groupes en algèbre, en commençant par les définitions fondamentales et les propriétés des groupes, y compris les groupes abéliens et les sous-groupes. Il présente également des exemples de groupes, tels que les groupes linéaires et les groupes symétriques, ainsi que des exercices pour approfondir la compréhension. La structure est organisée en plusieurs sections, abordant des concepts variés comme les groupes classiques et les représentations des groupes finis.

Transféré par

adil.bahri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

ALGÈBRE 1

11 septembre 2014
ALGÈBRE 1
TABLE DES MATIÈRES

I. Groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1. Généralités sur les groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2. Groupes opérant sur un ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3. Groupes abéliens de type fini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4. Le groupe GL(n, Z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5. Groupes simples et suites de composition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

II. Groupes classiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39


1. Préliminaires sur les corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2. Le groupe linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3. Formes bilinéaires et quadratiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4. Orthogonalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5. Théorème de Witt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6. Groupe de Witt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7. Groupe symplectique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
8. Groupe orthogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
9. Formes sesquilinéaires et hermitiennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
10. Groupe unitaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
11. Quaternions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

III. Algèbre tensorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81


1. Produit tensoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2. Algèbre tensorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3. Algèbre extérieure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4. Pfaffien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5. Algèbre symétrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
6. Algèbre de Clifford et groupe spinoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .101

IV. Représentations des groupes finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .107


1. Représentations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .107
6 TABLE DES MATIÈRES

2. Caractères . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .113
3. Propriétés d’intégralité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .126
CHAPITRE I

GROUPES

1. Généralités sur les groupes


1.1. Définition. — Un groupe est la donnée d’un ensemble G muni d’une loi de compo-
sition
G×G → G
(g 1 , g 2 ) 7→ g1g2
et d’un élément neutre e ∈ G satisfaisant les propriétés suivantes
1° associativité : pour tous g 1 , g 2 , g 3 dans G, on a
(g 1 g 2 )g 3 = g 1 (g 2 g 3 ) ;
2° élément neutre (nécessairement unique)
∀g ∈ G g e = eg = g ;
3° inverse : chaque élément g de G admet un inverse (nécessairement unique), c’est-
à-dire un élément g −1 de G tel que
g g −1 = g −1 g = e.
On note aussi souvent 1 l’élément neutre. Pour tout élément g d’un groupe G, et tout
n ∈ Z, on note 
 n fois
 z }| {
g ···g si n > 0 ;




n e si n = 0 ;
g =

 −n fois

 z }| {
 −1
g · · · g −1 si n < 0.

Si m, n ∈ Z, on a alors la formule habituelle


g m+n = g m g n .
On dit que G est abélien (ou commutatif ) si, pour tous g 1 , g 2 ∈ G, on a g 1 g 2 = g 2 g 1 .
Dans ce cas, on note généralement la loi de composition additivement (g 1 + g 2 ), l’élément
neutre 0, et l’inverse de g est appelé l’opposé, noté −g .
8 CHAPITRE I. GROUPES

On dit que le groupe G est fini si c’est un ensemble fini. On appelle alors son cardinal
son ordre, noté |G|.
Si G et G0 sont des groupes, on peut former un groupe G × G0 appelé produit direct en
munissant l’ensemble produit de la loi de composition (g 1 , g 10 )(g 2 , g 20 ) = (g 1 g 2 , g 10 g 20 ).

Exemples 1.1. — 1° La paire (Z, +) est un groupe abélien.


2° Si K est un corps (1) (comme Q, R ou C), (K, +) et (K× , ×) sont des groupes abéliens ;
plus généralement, pour un anneau A, on a le groupe abélien (A, +) et le groupe multipli-
catif (A× , ×) des unités de A (les éléments de A inversibles dans A).
3° Pour tout entier n ∈ N∗ , la paire (Z/nZ, +) est un groupe fini d’ordre n. Ces groupes
sont dits cycliques.
4° Si X est un ensemble, l’ensemble Bij(X) des bijections de X dans X, muni de la com-
position des applications, est un groupe. En particulier, le groupe symétrique Sn des bi-
jections de l’ensemble {1, . . . , n} est un groupe fini d’ordre n!, non abélien pour n Ê 3.
5° Si K est un corps, les matrices n×n inversibles à coefficients dans K forment le groupe
général linéaire GL(n, K). Si E est un K-espace vectoriel, les applications linéaires bijectives
de E dans E forment un groupe GL(E) ; si E est de dimension finie n, le choix d’une base de
E fournit un isomorphisme entre GL(E) et GL(n, K). Les applications affines bijectives de E
dans E (c’est-à-dire les applications du type x 7→ u(x) + b, avec u ∈ GL(E) et b ∈ E) forment
aussi un groupe (dont GL(E) est un sous-groupe), le groupe général affine, noté GA(E).
6° Plus généralement, si A est un anneau commutatif, on peut former le groupe GL(n, A)
des matrices inversibles d’ordre n à coefficients dans A : il s’agit exactement des matrices
M dont le déterminant est dans A× . Par exemple, le groupe GL(n, Z) est constitué des ma-
trices n × n à coefficients entiers de déterminant ±1.

Exercice 1.2. — Soit G un groupe tel que g 2 = e pour tout g ∈ G. Montrer que G est abélien.

Exercice 1.3. — Montrer que GL(n, Q) est dense dans GL(n, R).

1.2. Sous-groupes, générateurs. — Une partie H d’un groupe G est appelée un sous-
groupe (on note H ≤ G, et H < G si de plus H 6= G) si la loi de composition de G se restreint
à H et en fait un groupe, ce qui est équivalent aux propriétés suivantes :
1° e ∈ H ;
2° pour tous h 1 , h 2 ∈ H, on a h 1 h 2 ∈ H ;
3° pour tout h ∈ H, on a h −1 ∈ H.

Exemples 1.4. — 1° L’intersection d’une famille quelconque de sous-groupes d’un


groupe G est un sous-groupe de G.
2° Les sous-groupes de Z sont les nZ pour n ∈ N.
3° Le groupe O(n, R) des matrices M de taille n ×n réelles orthogonales (c’est-à-dire qui
satisfont t MM = In ) est un sous-groupe du groupe GL(n, R).
4° Soit n un entier Ê 2. Le groupe diédral Dn des transformations orthogonales de R2
préservant un polygone régulier à n côtés centré à l’origine est un sous-groupe d’ordre 2n

1. Dans ces notes, un corps est toujours commutatif, sauf mention expresse du contraire.
1. GÉNÉRALITÉS SUR LES GROUPES 9


de O(2, R) : si r est la rotation d’angle n et s la symétrie par rapport à une droite passant
par l’un des sommets, on a

Dn = {Id, r, . . . , r n−1 , s, r s, . . . , r n−1 s}.

5° Le centre
Z(G) = {h ∈ G | ∀g ∈ G g h = hg }

d’un groupe G est un sous-groupe de G. Le groupe G est abélien si et seulement si Z(G) = G.


Par exemple, le centre de GL(n, K) est constitué des homothéties.

Exercice 1.5. — Quel est le centre du groupe Dn ?

Exercice 1.6. — Quel est le centre du groupe Sn ?

Proposition 1.7. — Soit A une partie d’un groupe G. Il existe un plus petit sous-groupe de
G contenant A. On l’appelle sous-groupe engendré par A et on le note 〈A〉.

Démonstration. — Il y a deux constructions équivalentes. La première consiste à définir


〈A〉 comme l’intersection de tous les sous-groupes de G contenant A. La seconde construc-
tion consiste en la description explicite :
ε ε ε
〈A〉 = {x 11 x 22 · · · x nn | n ∈ N, x i ∈ A, εi ∈ {1, −1}}.

Une partie A de G est une partie génératrice de G, ou engendre G, ou est un ensemble de


générateurs de G, si 〈A〉 = G. On dit que G est de type fini s’il admet une partie génératrice
finie. Tout groupe fini est bien sûr de type fini.
Attention : un sous-groupe d’un groupe de type fini n’est pas nécessairement de type
fini !

Exemples 1.8. — 1° Soit n ∈ N∗ . Le groupe Z/nZ est engendré par la classe de tout entier
premier à n.
2° Voici trois ensembles de générateurs pour le groupe symétrique Sn :
– toutes les transpositions ;
– les transpositions (12), (23), . . . , ((n − 1) n) ;
– la transposition (12) et le cycle (12 · · · n).
3° Avec les notations précédentes, le groupe diédral Dn est engendré par la rotation r et
la symétrie s.

Exercice 1.9. — Montrer qu’un groupe de type fini est dénombrable.

Exercice 1.10. — Montrer que le groupe (Q, +) n’est pas de type fini.
10 CHAPITRE I. GROUPES

1.3. Morphismes (de groupes). — Un morphisme de groupes est la donnée d’une appli-
cation f : G → G0 entre groupes, satisfaisant
∀g 1 , g 2 ∈ G f (g 1 g 2 ) = f (g 1 ) f (g 2 ).
Si f est bijective, son inverse f −1 est aussi un morphisme (de groupes) et on dit que f est
un isomorphisme. Si en outre G = G0 , on dit que f est un automorphisme de G.
Si f : G → G0 est un morphisme de groupes, le noyau et l’image de f ,
ker( f ) = {g ∈ G | f (g ) = e} , im( f ) = { f (g ) | g ∈ G}
sont des sous-groupes de G et G0 respectivement. Le morphisme f est injectif si et seule-
ment si ker( f ) = {e} ; il est surjectif si et seulement si im( f ) = G0 .

Exemples 1.11. — 1° Soit n ∈ N. La projection canonique Z → Z/nZ est un morphisme


surjectif. Son noyau est le sous-groupe nZ de Z.
2° La signature ε : Sn → {±1} est un morphisme de groupes, dont le noyau est le groupe
alterné An .
Ce groupe est engendré par les 3-cycles (abc), car (ab)(ac) = (acb) et (ab)(cd ) =
(acb)(acd ).
3° L’application exponentielle exp : (C, +) → (C× , ×) est un morphisme surjectif. Son
noyau est le sous-groupe 2i πZ de C.
4° Soit K un corps. Le déterminant dét : GL(n, K) → K× est un morphisme surjectif. Son
noyau est le groupe spécial linéaire des matrices de déterminant 1 ; il est noté SL(n, K).
5° L’ensemble des automorphismes d’un groupe G, muni de la loi de composition des
applications, est un groupe noté Aut(G).

Si g ∈ G, l’application
ιg : G −→ G
x 7−→ g xg −1
est un automorphisme de G. Un tel automorphisme de G est appelé automorphisme inté-
rieur de G et
ι : G −→ Aut(G)
est un morphisme de groupes dont le noyau est le centre Z(G).

Exercice 1.12. — Soit Fq un corps fini à q éléments. Montrer

|GL(n, Fq )| = (q n − 1)(q n − q) · · · (q n − q n−1 ),


|SL(n, Fq )| = (q n − 1)(q n − q) · · · (q n − q n−2 )q n−1 .

1.4. Classes à gauche. — Soit H un sous-groupe d’un groupe G. On définit sur G une
relation d’équivalence R par
x R y ⇐⇒ ∃h ∈ H y = xh.
Les trois propriétés caractéristiques des relations d’équivalence (réflexivité, symétrie,
transitivité) se vérifient facilement. La classe d’équivalence d’un élément x ∈ G est
xH = {xh | h ∈ H}. Les xH pour x ∈ G sont appelées classes à gauche de G, et l’ensemble
1. GÉNÉRALITÉS SUR LES GROUPES 11

quotient de G par R , c’est-à-dire l’ensemble des classes à gauche, est noté G/H. Si cet
ensemble est fini, son cardinal, noté [G : H], est appelé l’indice de H dans G.
On peut définir aussi les classes à droite comme les ensembles Hx = {hx | h ∈ H}, et
l’ensemble des classes à droite est noté H\G. Heureusement, il est à peu près indifférent
d’utiliser des classes à droite ou à gauche, car l’application inverse φ : G → G, x 7→ x −1 ,
envoie xH sur Hx −1 , donc envoie classes à gauche sur classes à droite, induisant ainsi une
bijection
G/H −→ H\G.
Soit x ∈ G. L’application H → G, h 7→ xh, induit une bijection
H −→ xH.
En particulier, si H est fini, le cardinal d’une classe à gauche xH est égal à l’ordre de H. Les
classes à gauche forment donc une partition de G par des classes de même cardinal. On
en déduit le résultat suivant.

Théorème de Lagrange 1.13. — Soit H un sous-groupe d’un groupe fini G. On a


|G| = |H|[G : H].
En particulier, l’ordre d’un sous-groupe de G divise l’ordre de G.

1.5. Sous-groupes distingués. — On dit qu’un sous-groupe H d’un groupe G est un sous-
groupe distingué, ou sous-groupe normal, et on note H E G (et H C G si de plus H 6= G), s’il
est stable par tout automorphisme intérieur, c’est-à-dire si
∀g ∈ G ∀h ∈ H g hg −1 ∈ H.
Si f : G → G0 est un morphisme de groupes, ker( f ) E G (attention, il est faux en général
que l’image soit un sous-groupe distingué) ; plus généralement, si H0 EG0 , on a f −1 (H0 )EG.

Exemples 1.14. — 1° Pour tout groupe G, les sous-groupes {e} et G de G sont distingués.
Le groupe G est dit simple si G 6= {e} et s’il n’a pas d’autres sous-groupes distingués.
2° Dans un groupe abélien, tous les sous-groupes sont distingués.
3° Le groupe alterné An est distingué dans le groupe symétrique Sn , car c’est le noyau
du morphisme signature. Si n Ê 2, ce dernier n’est donc pas simple.
4° Si K est un corps, le sous-groupe SL(n, K) de GL(n, K) est distingué, car c’est le noyau
du morphisme déterminant.
Exercice 1.15. — Soit G un groupe et soit H un sous-groupe de G d’indice 2. Montrer que H
est distingué dans G.

1.6. Quotients. — Soit H un sous-groupe d’un groupe G. On souhaite munir G/H d’une
structure de groupe telle que la projection
p :G −→ G/H
x 7−→ xH
d’un élément sur sa classe à gauche soit un morphisme de groupes. L’élément neutre de
G/H doit nécessairement être eH, donc le noyau de p doit être la classe de e, c’est-à-dire
H. Il faut donc que H soit distingué dans G. Montrons que cette condition est suffisante.
12 CHAPITRE I. GROUPES

Théorème 1.16. — Si H est un sous-groupe distingué de G, il existe sur G/H une unique
structure de groupe, telle que la projection p : G → G/H soit un morphisme de groupes.

Il est important de noter que si H est distingué, les classes à droite sont égales aux
classes à gauche : xH = Hx pour tout x ∈ G, puisque xHx −1 = H. Ainsi G/H = H\G et on
obtient le même groupe quotient en considérant les classes à droite ou à gauche.

Démonstration. — Pour que p soit un morphisme de groupes, il faut que la loi de com-
position sur G/H vérifie
(xH)(yH) = x yH. (1)
La première chose à faire est de vérifier que cette formule ne dépend pas des choix de x et
y dans leurs classes : si x = x 0 h et y = y 0 h 0 , on a

x y = x 0 h y 0 h 0 = x 0 y 0 (y 0−1 h y 0 )h 0 .

Puisque H est distingué, y 0−1 h y 0 ∈ H donc x yH = x 0 y 0 H. La formule (1) définit donc bien
une loi de composition sur G/H. On vérifie qu’il s’agit d’une loi de groupe.

Soit H un sous-groupe distingué d’un groupe G et soit p : G → G/H la projection cano-


nique. On vérifie que les applications

{sous-groupes de G/H} −→ {sous-groupes de G contenant H}


0
K 7−→ p −1 (K 0 )
p(K) →−7 K

sont des bijections inverses l’une de l’autre. De plus, K 0 est distingué dans G/H si et seule-
ment si p −1 (K 0 ) est distingué dans G.

Théorème 1.17 (Propriété universelle du quotient). — Soit G un groupe, soit H un sous-


groupe distingué de G et soit f : G → G0 un morphisme de groupes. Si ker( f ) ⊇ H, il existe un
unique morphisme fˆ : G/H → G0 tel que f = fˆ ◦ p, c’est-à-dire que le diagramme suivant est
commutatif
f
G G0
p

G/H.

En outre, ker( fˆ) = ker( f )/H et im( fˆ) = im( f ).

Démonstration. — On veut poser fˆ(xH) = f (x). Cela a un sens à condition que f (xh) =
f (x) pour tout h ∈ H, c’est-à-dire f (h) = e, ce qui est précisément le cas puisque ker( f ) ⊇
H. L’application fˆ : G/H → G0 ainsi définie est manifestement unique. On vérifie que c’est
un morphisme, avec le noyau et l’image indiqués.

Corollaire 1.18. — Si f : G → G0 est un morphisme de groupes, fˆ : G/ ker( f ) → im( f ) est


un isomorphisme.
1. GÉNÉRALITÉS SUR LES GROUPES 13

Démonstration. — On applique le théorème à f˜ : G → im( f ), coïncidant avec f mais


dont on a restreint le but, et à H = ker( f ). On obtient fˆ : G/ ker( f ) → im( f ), avec ker fˆ =
ker( f )/ ker( f ) = {e} et im fˆ = im f˜ = im( f ).

Corollaire 1.19. — Le sous-groupe 〈g 〉 engendré par un élément g d’un groupe G est iso-
morphe à Z s’il est infini, à Z/nZ s’il est fini, avec n ∈ N∗ . On appelle alors n l’ordre de g .

En particulier, par le théorème de Lagrange, l’ordre d’un élément d’un groupe fini G
divise l’ordre de G, et un groupe d’ordre un nombre premier p est nécessairement iso-
morphe au groupe cyclique Z/pZ.

Démonstration. — Le morphisme

φg : Z −→ G
n 7−→ gn

a pour image 〈g 〉. Soit φg est injectif, auquel cas il induit un isomorphisme Z −→〈g 〉, soit
son noyau est un sous-groupe nZ de Z, avec n ∈ N∗ , auquel cas φg induit, par le corollaire

précédent, un isomorphisme φ̂g : Z/nZ −→〈g 〉.

Exemples 1.20. — 1° Le groupe Z/nZ est le groupe quotient de Z par nZ. On peut en dé-
duire les sous-groupes de Z/nZ : leur image réciproque par la projection p : Z → Z/nZ est
un sous-groupe de Z contenant nZ, donc de la forme d Z pour d |n, donc les sous-groupes
de Z/nZ sont exactement les sous-groupes cycliques engendrés par les entiers d tels que
d |n.
En particulier, le groupe Z/nZ est simple si et seulement si n est un nombre premier.
2° On a un isomorphisme Sn /An ' Z/2Z provenant du morphisme signature (on peut
aussi dire que ce groupe quotient a deux éléments, donc il est nécessairement isomorphe
à Z/2Z).
3° La restriction du déterminant au groupe diédral Dn < O(2, R) induit une surjection
Dn → {±1}. Son noyau est le sous-groupe de Dn engendré par la rotation r . Il est d’indice 2
et est isomorphe à Z/nZ.
4° Le morphisme ι : G → Aut(G), défini par ι(g )(x) = g xg −1 , a pour noyau le centre Z(G)
et image le sous-groupe Int(G) des automorphismes intérieurs de G, donc Int(G) ' G/Z(G).
5° Le groupe Int(G) des automorphismes intérieurs de G est distingué dans Aut(G). On
appelle le quotient Out(G) := G/ Int(G) le groupe des automorphismes extérieurs de G.

Exercice 1.21. — Soient K et H des sous-groupes distingués d’un groupe G avec K ≤ H. Mon-
trer que le sous-groupe H/K de G/K est distingué et que (G/K)/(H/K) ' G/H.

Exercice 1.22. — Soient H et K des sous-groupes d’un groupe G, avec H E G. Montrer que
HK := {hk | h ∈ H, k ∈ K} est un sous-groupe de G, que HK = KH = HKH, que H∩K est distingué
dans K et que les groupes HK/H et K/(H ∩ K) sont isomorphes.

Exercice 1.23. — Soit K un corps et soit E un K-espace vectoriel. Montrer que le groupe des
translations de E est un sous-groupe distingué du groupe affine GA(E) (cf. ex. 1.1.5°) iso-
morphe au groupe additif (abélien) (E, +) et que le groupe quotient est isomorphe à GL(E).
14 CHAPITRE I. GROUPES

Exercice 1.24. — Le but de cet exercice est de montrer que tout sous-groupe fini G du groupe
multiplicatif d’un corps K est cyclique. En particulier, le groupe multiplicatif d’un corps fini
est cyclique.
La seule propriété qu’on utilisera est que l’équation x n = 1K a au plus n solutions dans K.
Soit g un élément de G d’ordre maximal d et soit h un autre élément de G, d’ordre e.
a) Supposons que e ne divise pas d . Il existe alors q, puissance de nombre premier, qui
divise e mais pas d . Soit r l’ordre de g h e/q . Montrer que q divise ppcm(d , r ), puis que r
est divisible par ppcm(d , q), et aboutir à une contradiction (Indication : on pourra calculer
(h er /q )d / pgcd(d ,r ) ).
b) On a donc e | d . En déduire que g engendre G.

Exercice 1.25. — Soit Fq un corps fini à q éléments. Le but de cet exercice est de montrer que
l’ordre maximal d’un élément de GL(n, Fq ) est exactement q n − 1 .
a) Soit M ∈ GL(n, Fq ). Montrer que l’ensemble {P(M) | P ∈ Fq [X]} contient au plus q n éléments
(Indication : on pourra utiliser le théorème de Cayley-Hamilton). En déduire que l’ordre de
M dans le groupe que GL(n, Fq ) est au plus q n − 1. Montrer par un exemple que cet ordre ne
divise pas nécessairement q n − 1.
b) Inversement, montrer qu’il existe un élément de GL(n, Fq ) d’ordre q n − 1 (Indication : on
admettra qu’il existe un corps Fq n de cardinal q n contenant Fq comme sous-corps (cf. § [Link]) ;
si x engendre le groupe multiplicatif (Fq n , ×) (exerc. 1.24), on considérera une matrice de po-
lynôme caractéristique le polynôme minimal de x sur Fq ).

1.7. Quotients d’espaces vectoriels. — Si V est un K-espace vectoriel et W ⊆ V un sous-


espace vectoriel, alors en particulier, pour la structure de groupe abélien, W est un sous-
groupe de V donc on peut former le quotient V/W. Dans ce cas, la structure de K-espace
vectoriel passe aussi au quotient, en définissant pour x ∈ V la multiplication par le scalaire
λ ∈ K dans V/W par λ(x + W) = (λx) + W : en effet, si on prend un autre représentant y =
x + f ( f ∈ W) de la classe de x dans V/W, alors λy = λx + λ f représente bien la classe
λx + W ∈ V/W puisque λ f ∈ W. La projection

p : V −→ V/W

est alors aussi une application linéaire de noyau W et la propriété de factorisation (théo-
rème 1.17) reste valable en remplaçant les morphismes de groupes par des applications
linéaires : si φ : V → V 0 est une application linéaire telle que ker φ ⊇ W, elle se factorise, de
manière unique, par une application linéaire φ̂ : V/W → V 0 telle que φ = φ̂ ◦ p. À nouveau,
cette propriété caractérise le quotient.
Si on choisit dans V un supplémentaire W 0 de W, de sorte que V = W ⊕W 0 , la projection
restreinte p|W 0 : W 0 → V/W est un isomorphisme linéaire. Via cet isomorphisme, l’applica-
tion linéaire induite au quotient, φ̂, peut s’identifier à la restriction φ|W 0 , mais ce n’est pas
intrinsèque, car le supplémentaire W 0 n’est pas unique.
Attention, cette propriété est particulière aux espaces vectoriels : dans le cas des
groupes, si H E G, en général G n’est pas isomorphe au produit H × G/H (cf. ex. 1.20.3°).

2. Groupes opérant sur un ensemble


2. GROUPES OPÉRANT SUR UN ENSEMBLE 15

2.1. Actions de groupe. — Une action (à gauche (2) ) d’un groupe G sur un ensemble X est
la donnée d’une application
Φ : G×X −→ X
(g , x) 7−→ g ·x
telle que
1° pour tout x ∈ X, on a e · x = x ;
2° pour tout x ∈ X et tous g , g 0 ∈ G, on a g · (g 0 · x) = (g g 0 ) · x.
Il résulte de cette définition que, si on pose Φg (x) = g · x, on a
Φe = IdX , Φ g ◦ Φh = Φ g h .
Une action du groupe G sur l’ensemble X est donc la même chose qu’un morphisme de
groupes
G −→ Bij(X)
g 7−→ Φg ,
où Bij(X) est le groupe des bijections de X.
Exemples 2.1. — 1° Le groupe symétrique Sn agit sur l’ensemble {1, . . . , n}.
2° Soit K un corps. Le groupe GL(n, K) opère sur Kn .
3 ° Le groupe SL(2, R) opère sur le demi-plan de Poincaré H = {z ∈ C | Im(z) > 0} par
az + b
µ ¶
a b
·z = .
c d cz + d
4° Si H ≤ G, alors G opère sur l’ensemble G/H des classes à gauche par g · (xH) = (g x)H.

2.2. Orbites. — Soit G un groupe opérant sur X et soit x ∈ X. Le stabilisateur, ou groupe


d’isotropie, de x est le sous-groupe de G défini par
Gx := {g ∈ G | g · x = x}.
L’orbite de x sous G est
G · x := {g · x | g ∈ G}.
L’application
G −→ G·x
g 7−→ g ·x
se factorise en une bijection

G/Gx −→ G · x (2)
entre l’espace des classes à gauche de Gx et l’orbite de x.
Les stabilisateurs des points d’une même orbite sont tous conjugués : pour tout x ∈ X
et tout g ∈ G, on a
Gg ·x = g Gx g −1 .

2. On utilise parfois les actions à droite, notées (g , x) 7→ x · g , et satisfaisant la relation (x · g ) · g 0 = x · (g g 0 ). Ce


n’est pas une action à gauche, mais une action à droite, notée ·d , se ramène à une action à gauche, notée ·, en
considérant g · x = x ·d g −1 .
16 CHAPITRE I. GROUPES

L’ensemble des orbites de X sous G est le quotient de X par G, noté G\X (3) .
L’action de G est transitive si G n’a qu’une seule orbite dans X. Dans ce cas, par (2),
l’action de G induit une bijection de G/Gx avec X, pour tout x ∈ X. En particulier, si G est
fini, X l’est aussi et son cardinal divise |G|.
L’action de G est fidèle si Φ est injective. Dans le cas général, l’action Φ se factorise en
Φ
G Bij(X)

Φ̂

G/ ker Φ.

On obtient donc une action fidèle du quotient G/ ker Φ sur X : toute action se factorise
ainsi en une action fidèle.

Exemples 2.2. — 1° Soit K un corps. L’action de GL(n, K) sur Kn est fidèle et les orbites
sont Kn {0} et {0}. L’action du groupe affine GA(Kn ) (cf. ex. 1.1.5°) sur Kn est fidèle et tran-
sitive.
2° Pour l’action (fidèle) du groupe orthogonal O(n) sur Rn (cf. ex. II.4.3.2°), les orbites
sont les sphères de rayon > 0, ainsi que {0}. Le stabilisateur d’un point non nul est (iso-
morphe à) O(n − 1), donc, par (2), on a une bijection O(n − 1)\O(n) ' Sn−1 .
3° L’action décrite plus haut du groupe SL(2, R) sur le demi-plan de Poincaré est transi-
tive. Elle n’est pas fidèle (le noyau de l’action est {±I2 }).
4° Soit K un corps. Le groupe K× agit sur Kn {0} et le quotient est
K× \(Kn − {0}) = {droites vectorielles de Kn },
appelé l’espace projectif (sur K) et noté Pn−1 (K).
5° Si σ ∈ Sn , on considère l’action du groupe 〈σ〉 sur {1, . . . , n}. Alors {1, . . . , n} est la
réunion disjointe des orbites :
r
G
{1, . . . , n} = Oi .
1
On peut poser
(
σ(x) si x ∈ Oi ,
σi (x) =
x si x ∉ Oi .
Alors σi est un cycle de support Oi , on a σi σ j = σ j σi et
σ = σ1 · · · σ r .
On démontre ainsi que toute permutation se décompose (de manière unique) comme
produit de cycles à supports disjoints (qui commutent donc deux à deux).

Exemple 2.3 (Théorème de Cayley). — L’action de G sur lui-même par translation à


gauche, définie par g · x = g x, est fidèle. Si G est fini, on en déduit un morphisme injectif
G ,→ S|G| (qui dépend de la façon dont on numérote les éléments de G).

3. Dans cette notation, le groupe est placé à gauche pour une action à gauche. Pour une action à droite, l’or-
bite de x est en bijection avec Gx \G et le quotient est noté X/G.
2. GROUPES OPÉRANT SUR UN ENSEMBLE 17

Exercice 2.4. — Soit G un groupe fini d’ordre n.


a) Montrer que G est isomorphe à un sous-groupe de A2n , et même de An+2 .
b) Soit K un corps. Montrer que G est isomorphe à un sous-groupe de GL(n, K) et à un sous-
groupe de SL(n + 1, K).
c) Montrer que G est isomorphe à un sous-groupe de O(n − 1, R).

Exercice 2.5. — Soit G un groupe fini d’ordre 2n, avec n impair.


a) Montrer que G contient un élément d’ordre 2 (Indication : on pourra compter le nombre de
paires (g , g −1 )).
b) Montrer que l’image du morphisme injectif G ,→ S2n donné par le théorème de Cayley (ex.
2.3) n’est pas contenue dans A2n .
c) En déduire que G contient un sous-groupe distingué d’indice 2.

Exercice 2.6. — Soit G un groupe opérant fidèlement et transitivement sur un ensemble X


de cardinal p premier et soit H E G un sous-groupe distingué, H 6= {e}. Montrer que H opère
transitivement sur X.

Exercice 2.7. — Soit G un sous-groupe de Sn opérant transitivement sur l’ensemble {1, . . . , n}


et contenant une transposition et un p-cycle, où p est un nombre premier > n/2. Le but de
l’exercice est de montrer G = Sn .
Si a, b ∈ {1, . . . , n}, on écrit a ∼ b si a = b, ou si a 6= b et que la transposition (ab) est dans G.
a) Montrer que ∼ est une relation d’équivalence sur l’ensemble {1, . . . , n}.
b) Si a ∼ b et g ∈ G, montrer g (a) ∼ g (b).
c) Montrer que toutes les classes d’équivalence pour ∼ ont le même cardinal r et que r Ê 2.
d) Soit s le nombre de classes d’équivalence pour ∼. Montrer n = r s et r Ê p. Conclure.

2.3. Conjugaison. — Il y a une autre action de G sur lui-même, donnée par le morphisme
G → Aut(G) défini par g · x = g xg −1 (action par conjugaison). Dans ce cas, le stabilisateur
d’un élément x ∈ G est appelé le centralisateur de x, noté C(x). Les orbites sont appelées
classes de conjugaison de G.
Explicitons cette action dans le cas du groupe symétrique.

Proposition 2.8. — Si σ = (a 1 · · · a k ) ∈ Sn est un k-cycle et τ ∈ Sn , on a

τστ−1 = (τ(a 1 ) · · · τ(a k )). (3)

Tous les k-cycles sont conjugués dans Sn .


Les classes de conjugaison de Sn sont en bijection avec les partitions de n :

n = k1 + · · · + kr , r ∈ N, 1 É k 1 É · · · É k r .

Démonstration. — Si x ∉ {τ(a 1 ), . . . , τ(a k )}, alors τ−1 (x) ∉ {a 1 , . . . , a k } donc τστ−1 (x) = x. Si
en revanche x = τ(a i ), alors τστ−1 (x) = τσ(a i ) = τ(a i +1 ). Cela prouve la première partie
de la proposition.
Pour la seconde, écrivons σ = σ1 · · · σr comme produit de cycles à supports disjoints de
longueurs k 1 , . . . , k r , qu’on peut ordonner de sorte que 1 É k 1 É · · · É k r . Alors

τστ−1 = (τσ1 τ−1 ) · · · (τσr τ−1 ) (4)


18 CHAPITRE I. GROUPES

est encore un produit de cycles disjoints de mêmes longueurs k 1 , . . . , k r que ceux de σ,


donc une classe de conjugaison détermine bien une partition de n = k 1 + · · · + k r . Récipro-
quement, compte tenu des formules (3) et (4), on voit que des permutations correspon-
dant à la même partition sont conjuguées.

De manière générale, la conjugaison préserve les propriétés d’une transformation. Par


exemple, si σ ∈ O(3, R) est une rotation autour d’une droite D et τ ∈ O(3, R), alors τστ−1 est
une rotation de même angle autour de la droite τ(D).

2.4. Formule des classes et p-groupes. — La formule des classes n’est que la reformula-
tion du fait qu’un ensemble sur lequel un groupe G agit est réunion disjointe des orbites.
Son intérêt provient du fait que lorsque G est fini, le cardinal de chaque orbite divise |G|.

Proposition 2.9 (Formule des classes). — Soit G un groupe fini agissant sur un ensemble
fini X. On a
X
card(X) = [G : Gx ],
x∈R
où R ⊆ X est un ensemble contenant exactement un point de chaque orbite.

Démonstration. — La démonstration est facile : X est la réunion disjointe des orbites et


par (2), chaque orbite est en bijection avec G/Gx pour un élément x de l’orbite.

Un point x ∈ X est un point fixe de l’action de G si g · x = x pour tout g ∈ G. On note X G


l’ensemble des points fixes de X sous G.

Exemple 2.10. — Soit K un corps. Le groupe K× agit sur Kn par multiplication. L’origine
0 est le seul point fixe ; les autres points ont un stabilisateur trivial. Si K est un corps fini
Fq avec q éléments, le cardinal de Kn est q n et la formule des classes s’écrit donc (cf. ex.
2.2.4°)
q n = 1 + (q − 1) card(Pn−1 (Fq )).

Proposition 2.11. — 1° Si un p-groupe G (c’est-à-dire un groupe fini non trivial d’ordre


une puissance du nombre premier p) agit sur X, alors
|X G | ≡ |X| (mod p).
En particulier, si p - |X|, l’action de G sur X a au moins un point fixe.
2° Si G est un p-groupe, le centre de G n’est pas réduit à {e}.

Démonstration. — Par la formule des classes, on a


|X| = |X G | +
X
[G : Gx ].
x∈R−X G

Si x n’est pas un point fixe, Gx < G, donc [G : Gx ] > 1 et divise |G| qui est une puissance de
p, donc p|[G : Gx ]. La première partie de la proposition en résulte.
La seconde partie s’obtient en appliquant le résultat à l’action de G sur lui-même par
conjugaison : dans ce cas GG = Z(G) donc |Z(G)| ≡ |G| (mod p), ce qui impose |Z(G)| >
1.
2. GROUPES OPÉRANT SUR UN ENSEMBLE 19

Exercice 2.12 (Lemme de Cauchy). — Soit G un groupe fini et soit p un nombre premier di-
visant |G|. En utilisant une action convenable de Z/pZ sur l’ensemble
X = {(g 1 , . . . , g p ) ∈ Gp | g 1 · · · g p = e},
prouver que G admet un élément d’ordre p (cf. cor. 2.21 pour une généralisation).

Corollaire 2.13. — 1° Si G est un groupe d’ordre p 2 avec p premier, G est abélien.


2° Un p-groupe simple est isomorphe à Z/pZ.

On a déjà vu que tout groupe d’ordre p est isomorphe à Z/pZ.


Comme on le verra plus loin, il n’y a à isomorphisme près que deux groupes (abéliens)
d’ordre p 2 , à savoir Z/p 2 Z et Z/pZ × Z/pZ.

Démonstration. — 1° D’après la proposition, on a |Z(G)| = p ou p 2 . Si x ∈ G, le centralisa-


teur C(x) de x contient à la fois Z(G) et x. Si x ∉ Z(G), on déduit que |C(x)| Ê |Z(G)|+1 Ê p+1,
donc |C(x)| = p 2 et C(x) = G, c’est-à-dire x ∈ Z(G) : contradiction. Donc il faut toujours que
x ∈ Z(G), donc Z(G) = G et G est abélien.
2° Si G est un p-groupe simple, son centre Z(G), qui est un sous-groupe distingué de G
non trivial, est égal à G. Le groupe G est donc abélien et, étant simple, il est isomorphe à
Z/pZ.

Exercice 2.14. — Soit p un nombre premier. Montrer qu’il existe un groupe non abélien de
cardinal p 3 (Indication : utiliser l’ex. 2.17).

Exercice 2.15 (Lemme d’Ore). — Soit G un groupe fini, soit p le plus petit facteur premier de
|G| et soit H un sous-groupe de G d’indice p. Montrer que H est distingué dans G (Indication :
on pourra s’intéresser au noyau de l’action de l’ex. 2.1.4°).

Exercice 2.16 (Formule de Burnside). — Soit G un groupe fini opérant sur un ensemble fini
X. Le fixateur d’un élément g ∈ G est par définition l’ensemble Fix(g ) := {x ∈ X | g · x = x}.
Montrer que le nombre d’orbites pour l’action de G sur X est donné par la formule
1 X
|Fix(g )|
|G| g ∈G

(Indication : on pourra calculer de plusieurs façons le cardinal de l’ensemble {(g , x) ∈ G × X |


g · x = x}).

2.5. Théorèmes de Sylow. — Soit G un groupe fini et soit p un facteur premier de |G|.
Écrivons |G| = p α m, avec p - m. Un p-sous-groupe de Sylow de G (ou, plus brièvement, un
p-Sylow) est un sous-groupe d’ordre p α de G.

Exemple 2.17. — Dans G = GL(n, Fp ), considérons le sous-groupe H des matrices trian-


gulaires supérieures, avec des 1 sur la diagonale (matrices unipotentes) :
 
1 ∗ ··· ∗
.. .
. .. 

0 1

.

.
. .. ..
. . ∗

.
0 ··· 0 1
20 CHAPITRE I. GROUPES

n(n−1)
Alors H est un p-Sylow de G. En effet, |H| = p 2 , alors que d’après l’exerc. 1.12, on a
α = n(n−1)
2 .

Pour montrer l’existence d’un p-Sylow dans tout groupe fini, nous avons besoin
d’abord de passer d’un groupe à ses sous-groupes.

Lemme 2.18. — Si S est un p-Sylow de G et H ≤ G, il existe g ∈ G tel que g Sg −1 ∩ H soit un


p-Sylow de H.

Démonstration. — Le groupe H agit à gauche sur l’ensemble G/S des classes à gauche par
h·(g S) = (hg )S. Le stabilisateur d’une classe g S est Hg S = g Sg −1 ∩H. Puisque p - m = |G/S|,
la formule des classes (prop. 2.9) assure qu’il existe au moins une classe g S telle que
p - [H : Hg S ].
Mais puisque Hg S est contenu dans g Sg −1 , qui est un p-groupe, Hg S est lui-même un
p-groupe, et donc un p-Sylow de H.

Théorème de Sylow 2.19. — Soit G un groupe fini et soit p un facteur premier de |G|. Écri-
vons |G| = p α m, avec p - m. Alors :
1° G contient un p-Sylow ;
2° tout p-sous-groupe de G est contenu dans un p-Sylow ;
3° tous les p-Sylow sont conjugués dans G ;
4° le nombre de p-Sylow divise m et est congru à 1 modulo p.

Corollaire 2.20. — Sous les mêmes hypothèses, un p-Sylow de G est distingué dans G si et
seulement si c’est l’unique p-Sylow de G.

Démonstration du théorème. — 1° Si N := |G|, le groupe G s’injecte dans un groupe symé-


trique SN (ex. 2.3), lequel s’injecte dans GL(N, Fp ), en envoyant une permutation σ ∈ SN
sur l’application linéaire u σ permutant les éléments de base (e 1 , . . . , e N ) par σ, donc défi-
nie par u σ (e i ) = e σ(i ) . On peut ainsi considérer G comme un sous-groupe de GL(N, Fp ), qui
admet un p-Sylow par l’exemple ci-dessus. Par le lemme 2.18, G admet un p-Sylow.
2-3° Si H ≤ G est un p-groupe et S ≤ G un p-Sylow, toujours par le lemme 2.18, il existe
g ∈ G tel que g Sg −1 ∩H est un p-Sylow de H, donc est égal à H puisque H est un p-groupe.
Donc H ≤ g Sg −1 qui est un p-Sylow. Si en outre H était déjà un p-Sylow, il a le même ordre
que g Sg −1 , donc H = g Sg −1 .
4° Soit X l’ensemble des p-Sylow de G. On a donc une action transitive de G sur X par
conjugaison, ce qui implique que |X| divise |G|. Restreignons en outre l’action de G à un p-
Sylow particulier S. Pour montrer |X| ≡ 1 (mod p), d’après la prop. 2.11, il suffit de montrer
que |X S | = 1. En réalité, on va montrer que S est le seul point fixe de l’action de S sur X.
Pour cela, introduisons pour un sous-groupe quelconque H ≤ G son normalisateur
(dans G) défini par
NG (H) = {g ∈ G | g Hg −1 = H}. (5)
Il s’agit, pour l’action de G sur l’ensemble de ses sous-groupes par conjugaison, du stabi-
lisateur de H. Une propriété évidente, mais importante, est
H E NG (H).
2. GROUPES OPÉRANT SUR UN ENSEMBLE 21

Revenons maintenant à la démonstration : supposons que S 0 ∈ X S , donc sS 0 s −1 = S 0


pour tout s ∈ S. Il en résulte que S ≤ NG (S 0 ). Ainsi S et S 0 sont des p-Sylow de NG (S 0 ) donc
sont conjugués dans NG (S 0 ) par le 3°. Comme S 0 E NG (S 0 ), on en déduit S = S 0 .

Le théorème de Sylow a de nombreuses conséquences ; en voici une.

Corollaire 2.21. — Si le groupe G satisfait |G| = p α m avec p - m, alors pour tout β É α, il


existe un sous-groupe de G d’ordre p β . En particulier, si p | |G], il existe dans G un élément
d’ordre p.

Démonstration. — En regardant un p-Sylow, il suffit de le montrer pour un p-groupe S


non trivial.
On a vu (prop. 2.11.2°) que son centre Z(S) est un p-groupe non trivial. Si g ∈ Z(S) est
non trivial, il engendre un groupe du type Z/p γ Z, avec γ ∈ N∗ , et le sous-groupe H engen-
γ−1
dré par g p est d’ordre p. Il est aussi distingué dans S.
On peut raisonner par récurrence sur |S| : il existe alors un sous-groupe de G/H d’ordre
p β−1 , dont l’image inverse dans G est un sous-groupe de G d’ordre p β .
Exercice 2.22. — Soit G un groupe fini d’ordre n, vu comme sous-groupe de Sn (ex. 2.3). Le
but de cet exercice est de déterminer à quelle condition nécessaire et suffisante sur G celui-ci
n’est pas contenu dans le groupe alterné An (auquel cas G contient un sous-groupe d’indice
2, donc distingué, et G n’est pas simple).
a) Soit g un élément de G d’ordre m. Montrer que la permutation de G associée se décompose
en produit de n/m m-cycles à supports disjoints.
b) Si G  An , en déduire que G est d’ordre pair et que les 2-Sylow de G sont cycliques.
c) Inversement, on suppose que G est d’ordre pair et que les 2-Sylow de G sont cycliques.
Montrer que G  An (on généralise ainsi le résultat de l’exerc. 2.5).

Exercice 2.23. — Soit q un nombre premier et soit Fq un corps de cardinal une puissance q
de p.
a) Décrire un p-Sylow S du groupe G := GL(n, Fq ) ainsi que son normalisateur NG (S).
b) En déduire le nombre de p-Sylows de G.

Exercice 2.24. — Soient p et q des nombres premiers et soit G un groupe d’ordre pq.
a) Montrer que G n’est pas simple (Indication : on pourra compter les p- ou q-Sylow de G).
b) Si p < q et que p ne divise pas q − 1, montrer que G est cyclique (Indication : on pourra
montrer que G contient un unique p-Sylow et un unique q-Sylow).
c) Généraliser au cas d’un groupe d’ordre p 1 · · · p r , où les p i sont des nombres premiers dis-
Q
tincts ne divisant pas j (p j − 1).

Exercice 2.25. — Soient p et q des nombres premiers et soit G un groupe d’ordre p 2 q. Le but
de cet exercice est de montrer que G contient un sous-groupe distingué qui est un p-Sylow ou
un q-Sylow (G n’est en particulier pas simple).
a) Montrer la conclusion si p = q ou si le nombre de q-Sylow de G n’est pas p 2 .
b) Supposons que le nombre de q-Sylow de G est p 2 , et p 6= q. Montrer que G contient au
moins p 2 (q −1) éléments d’ordre q. En déduire que G contient un unique p-Sylow et conclure.

Exercice 2.26. — Soient p et q des nombres premiers et soit G un groupe d’ordre p 3 q autre
que 24. Montrer que G contient un sous-groupe distingué qui est un p-Sylow ou un q-Sylow
(Indication : suivre le même plan de preuve que dans l’exercice précédent).
22 CHAPITRE I. GROUPES

Exercice 2.27. — a) Soit G un groupe fini simple. Écrivons |G| = p α m, avec p - m, m Ê 2 et


α Ê 1, et notons s le nombre de ses p-Sylow. Montrer que |G| divise s!.
b) Montrer qu’il n’existe pas de groupe simple de cardinal 1 000 000.

Exercice 2.28. — Montrer qu’un groupe fini simple non abélien d’ordre < 168 est d’ordre 60
(Indication : on pourra utiliser les résultats des exercices précédents).

Exercice 2.29. — Le but de cet exercice est de montrer que tout groupe simple G d’ordre 60
est isomorphe à A5 .
a) Montrer que le nombre de 2-Sylow de G est soit 5, soit 15. Conclure dans le premier cas. On
suppose donc dans la suite que G a 15 2-Sylow.
b) Montrer qu’il existe deux 2-Sylow S 1 et S 2 de G dont l’intersection a 2 éléments.
c) Montrer que le normalisateur N := NG (S 1 ∩ S 2 ) est d’ordre 12.
d) Montrer que l’action de G par translation sur G/H fournit un morphisme injectif G → S5 .
e) Conclure.

Exercice 2.30. — Soit p un nombre premier. Montrer que tout groupe d’ordre 2p est soit cy-
clique, soit isomorphe au groupe diédral Dp .

Exercice 2.31 (Méthode de Frattini). — Soit G un groupe fini.


a) Soit H E G un sous-groupe distingué et soit S 0 un p-Sylow de H. Montrer l’égalité
G = HNG (S 0 ) := {hk | h ∈ H, k ∈ NG (S 0 )}
(Indication : si g ∈ G, on pourra utiliser le fait que g S 0 g −1 ≤ H est conjugué dans H à S 0 ).
b) Soit maintenant S ≤ G un p-Sylow de G et soit M ≤ G un sous-groupe contenant NG (S). Mon-
trer M = NG (M) (Indication : on pourra appliquer a) à M E NG (M) et à son p-Sylow S).

Exercice 2.32 (Automorphismes de Sn ). — Soit n ∈ N∗ .


a) Soit φ un automorphisme de Sn qui transforme toute transposition en une transposition.
Montrer que φ est un automorphisme intérieur.
b) Soit σ ∈ Sn . Déterminer le cardinal du centralisateur C(σ) := {τ ∈ Sn | τστ−1 = σ} de σ.
c) En déduire que si n 6= 6, alors Int(Sn ) = Aut(Sn ).
d) On suppose n Ê 5 et Int(Sn ) = Aut(Sn ). Montrer que tous les sous-groupes d’indice n de
Sn sont conjugués.
e) En utilisant les 5-Sylow de S5 , montrer qu’il existe un sous-groupe d’indice 6 de S6 opérant
transitivement sur {1, . . . , 6}.
f) En déduire Aut(S6 ) 6= Int(S6 ).

3. Groupes abéliens de type fini


Le but de cette section est de démontrer le th. 3.6 de structure des groupes abéliens de
type fini.

3.1. Structure des groupes cycliques. — On rappelle que les groupes cycliques sont les
Z/nZ, pour n ∈ N∗ .

Proposition 3.1 (Lemme chinois). — Si on décompose un entier positif n en facteurs pre-


Q α
miers, n = p i i , on a un isomorphisme
Y α
Z/nZ ' Z/p i i Z.
3. GROUPES ABÉLIENS DE TYPE FINI 23

Notre démonstration montre en fait que c’est un isomorphisme d’anneaux. C’est im-
portant, car cela entraîne un isomorphisme
α
(Z/nZ)× ' (Z/p i i Z)× .
Y

entre groupes multiplicatifs des unités.

Démonstration. — En procédant par récurrence sur le nombre de facteurs dans la dé-


composition de n, on voit qu’il suffit de montrer l’énoncé suivant : si m et n sont premiers
entre eux,
Z/mnZ ' Z/mZ × Z/nZ.
Le morphisme f : Z → Z/mZ × Z/nZ donné par f (x) = (x̄, x̄) a pour noyau mnZ. Il se fac-
torise donc par un morphisme injectif fˆ : Z/mnZ → Z/mZ × Z/nZ, qui est un isomor-
phisme puisque les deux membres ont même cardinal. Cela démontre l’isomorphisme
cherché.

3.2. Engendrement fini. — Rappelons qu’un groupe est de type fini s’il possède une par-
tie génératrice finie. Si G est abélien, cela signifie qu’il existe des éléments x 1 , . . . , x r de G
tels que le morphisme de groupes
Zr −→ G
r
X
(n 1 , . . . , n r ) 7−→ ni xi (6)
1
est surjectif.

Proposition 3.2. — 1° Si on a un morphisme f : G → H entre groupes abéliens tel que


ker( f ) et im( f ) soient de type fini, G est de type fini.
2° Si G abélien est de type fini, tout sous-groupe de G est de type fini.

Démonstration. — 1° Soient y 1 = f (x 1 ), . . . , y r = f (x r ) des générateurs de im( f ). Soit x ∈


G ; il existe des entiers n i tels que f (x) = r1 n i y i , donc x − r1 n i x i ∈ ker( f ). Fixant des
P P

générateurs z 1 , . . . , z s pour ker( f ), on déduit


r
X s
X
x− ni xi = mj zj ,
1 1
donc G est engendré par x 1 , . . . , x r , z 1 , . . . , z s .
2° On raisonne par récurrence sur le nombre n de générateurs de G. Si G est engendré
par n éléments, on a un morphisme surjectif
p
Zn − G.
Posons K = p(Zn−1 ) (engendré donc par n − 1 éléments) et soit f : G → G/K la projection.
La composée f ◦ p : Zn → G/K se factorise en
fd
◦p
Zn −→ Zn /Zn−1 −− G/K.
Comme Zn /Zn−1 est isomorphe à Z, le groupe G/K est isomorphe à un Z/mZ (cor. 1.18).
Si H est un sous-groupe de G, le sous-groupe f (H) de G/K est alors aussi engendré par
un élément (ex. 1.20.1°) et ker( f |H ) = H ∩ K est de type fini par l’hypothèse de récurrence.
24 CHAPITRE I. GROUPES

On en déduit, par le 1° appliqué au morphisme H  f (H) induit par f , que H est de type
fini.

3.3. Groupes abéliens libres de type fini. — Un groupe abélien est libre de type fini s’il est
isomorphe à un produit Zr (4) . Cela signifie qu’il existe r ∈ N et des éléments x 1 , . . . , x r de G
tels que le morphisme (6) soit un isomorphisme. Une telle famille (x 1 , . . . , x r ) est appelée
une base de G. Plus généralement, on dira qu’une famille (x 1 , . . . , x r ) d’éléments de G est
linéairement indépendante si le morphisme (6) est injectif.
Tout notre traitement dans cette section repose sur le lemme fondamental suivant,
donnant la classification des matrices équivalentes à coefficients entiers.

Lemme 3.3. — Soit A une matrice m × n à coefficients dans Z. Il existe des matrices P ∈
GL(m, Z) et Q ∈ GL(n, Z) telles que
 
d1
 .. 

 . 

dr
 
PAQ =  , (7)
 
 0 
..
 
 
 . 
0 ··· 0
où d 1 , · · · , d r sont des entiers positifs satisfaisant d 1 | · · · | d r , appelés facteurs invariants de
la matrice A. Ils sont entièrement déterminés par A.

Le lemme montre qu’une matrice à coefficients entiers est déterminée, à équivalence


près, non seulement par son rang r (le seul invariant pour les matrices à coefficients dans
un corps), mais aussi par ses facteurs invariants d 1 , . . . , d r .
Admettons pour le moment le lemme 3.3. On en déduit assez rapidement tous les théo-
rèmes importants de la théorie.

Théorème 3.4. — Toutes les bases d’un groupe abélien libre de type fini G ont le même
nombre d’éléments, appelé le rang de G.

Démonstration. — Il suffit de montrer que si un groupe abélien libre G a une base


(x 1 , . . . , x r ), toute famille linéairement indépendante d’éléments de G a au plus r élé-
ments. Soit donc une famille (y 1 , . . . , y n ) d’éléments de G : puisque (x 1 , . . . , x r ) est une base,
on obtient une matrice A = (a i j ) de taille r × n à coefficients entiers définie par
r
X
yj = ai j xi .
i =1

4. Un groupe est abélien libre s’il est isomorphe à une somme directe

Z(I) := {(z i )i ∈I ∈ ZI | ∃J ⊆ I fini ∀i ∈ I J z i = 0},

pour un certain ensemble I. Il est alors de type fini si et seulement si l’ensemble I est fini (pourquoi ?).
Attention à la confusion avec la notion (plus compliquée) de « groupe libre », qui ne sera pas vue dans ce
cours. Le seul groupe libre qui est abélien est Z.
3. GROUPES ABÉLIENS DE TYPE FINI 25

On peut interpréter A comme la matrice du morphisme Zn → G qui envoie ε j sur y j , où


(ε1 , . . . , εn ) est la base standard de Zn . Appliquant le lemme 3.3, on déduit qu’existent des
matrices inversibles P et Q telles que PAQ ait la forme (7). Si n > r , on a PAQεn = 0, donc
AQεn = 0, d’où une relation entre les y j = Aε j donnée par la dernière colonne de Q. Donc
pour que la famille (y 1 , . . . , y n ) soit linéairement indépendante, il faut n É r .

Théorème 3.5. — Un sous-groupe H d’un groupe abélien G libre de rang fini s est libre de
rang r É s. En outre, il existe une base (e 1 , . . . , e s ) de G et des entiers (d 1 , . . . , d r ) tels que
1° (d 1 e 1 , . . . , d r e r ) est une base de H ;
2° on a les divisibilités d 1 | · · · | d r .

Démonstration. — On prend une base (x 1 , . . . , x s ) de G (qui induit un isomorphisme φ :



Zs → G) et des générateurs (y 1 , . . . , y n ) de H ≤ G. Chaque y j se décompose sur la base en
y j = is=1 a i j x i , où la matrice A = (a i j ) est de taille s × n.
P
φ
A ∼
Si (ε1 , . . . , εn ) est la base standard de Zn , le morphisme f : Zn → Zs → G, d’image H,
envoie ε j sur y j .
Appliquons le lemme 3.3 à la matrice A et considérons la factorisation
Q A P P −1 φ
∼ ∼ ∼ ∼
Zn −→ Zn −→ Zs −→ Zs −→ Zs → G

de f ◦ Q. L’isomorphisme φ ◦ P −1 : Zs → G correspond à une nouvelle base (e 1 , . . . , e s ) de G
et H = im( f ◦ Q) est alors engendré par (d 1 e 1 , . . . , d r e r ). Comme ces éléments forment une
famille libre, c’est une base de H. Le théorème est donc démontré.

3.4. Structure des groupes abéliens de type fini. — On déduit du théorème 3.5 le théo-
rème de structure suivant.

Théorème 3.6. — Soit G un groupe abélien de type fini. Il existe des entiers r et s, et des
entiers naturels d 1 | · · · | d s , tous uniquement déterminés par G, tels que
µs ¶
G ' Zr ×
Y
Z/d i Z .
1

Bien entendu, le groupe G est fini si et seulement si r = 0 ; il est libre si et seulement si


s = 0.
Par le lemme chinois (prop. 3.1), le second morceau du produit s’écrit aussi
Y αj
Z/p j Z, (8)
j ∈J

où les p j sont des nombres premiers, éventuellement répétés. Réciproquement, on ré-


αj
cupère, de manière unique, les facteurs invariants d i à partir de la collection des p j : le
αj Q αj0
plus grand facteur d s est le ppcm des p j , et il s’écrit d s = j 0 ∈J0 p j 0 . On obtient alors d s−1
αj
comme le ppcm des p j pour j ∈ J J0 , etc.
αj
Autrement dit, on écrit tous les p j dans un tableau avec une ligne pour chaque nombre
premier, en ordre croissant dans chaque ligne, et en alignant chaque ligne sur la dernière
colonne. On obtient les facteurs invariants en prenant les produits par colonne.
26 CHAPITRE I. GROUPES

Exemple 3.7. — Pour le groupe (Z/2Z)2 ×(Z/22 Z)×(Z/23 Z)×(Z/3Z)3 ×(Z/5Z)×(Z/52 Z), on
obtient le tableau
2 2 22 23
3 3 3
5 52
Les facteurs invariants sont donc 2, 6, 60, 600.
Démonstration du théorème. — Puisque G est de type fini, on dispose d’un morphisme
surjectif
f
Zn −→ G.
On applique le th. 3.5 à H = ker( f ) : il existe donc une base (e 1 , . . . , e n ) de Zn telle que
(d 1 e 1 , . . . , d s e s ) soit une base de H. Cela identifie H au sous-groupe
d 1 Z × · · · × d s Z ⊆ Zn .
D’où G ' Zn /H ' Z/d 1 Z × · · · × Z/d s Z × Zn−s .
Reste à montrer l’unicité de r , s et des d i . Le sous-groupe
T = {x ∈ G | ∃n ∈ N∗
nx = 0}
des éléments de torsion de G est nécessairement le facteur i Z/d i Z, donc G/T ' Zr est un
Q

groupe abélien libre de rang r , qui est ainsi bien déterminé. Il reste donc à montrer que,
pour le groupe fini T, les d i sont uniquement déterminés, ou, ce qui est équivalent, les
αj
facteurs p j figurant dans (8). En se limitant au sous-groupe des éléments dont l’ordre est
une puissance de p (c’est le p-Sylow de T), on est ramené au cas où d j = p α j , donc
T = Z/p α1 Z × · · · × Z/p αs Z, α1 É · · · É α s .
Considérons le sous-groupe T j = {p j x | x ∈ T} de T. Alors |T j | = αi > j p αi − j et en particu-
Q

lier |T j /T j +1 | = p card{i |αi > j } . On récupère ainsi les exposants α j à partir des sous-groupes
T j , complètement déterminés par T.
Exercice 3.8. — Soit G un groupe abélien de type fini et soit f : G → G un morphisme sur-
jectif. Le but de cet exercice est de démontrer que f est un isomorphisme. Soit T ≤ G le sous-
groupe de torsion de G.
a) Montrer que f induit un morphisme surjectif fˆ : G/T → G/T.
b) Montrer que fˆ est un isomorphisme.
c) En déduire que f est un isomorphisme.

3.5. Démonstration du lemme 3.3. — Commençons par l’unicité des entiers d i . On re-
marque que d 1 est le pgcd (positif) de tous les coefficients de A ; en effet, le pgcd des coef-
ficients de A divise tous les coefficients de PAQ et inversement, le pgcd des coefficients de
PAQ divise tous les coefficients de A = P −1 (PAQ)Q−1 .
Étendons cette observation de la manière suivante. Notons
m k (A) = pgcd des mineurs d’ordre k de A.
Pour k = 1, on retrouve le pgcd des coefficients de A. Le point crucial est l’invariance par
équivalence :
∀P ∈ GL(m, Z) ∀Q ∈ GL(n, Z) m k (PAQ) = m k (A). (9)
Il en résulte m k (A) = d 1 · · · d k , et donc les d i sont entièrement déterminés par A.
3. GROUPES ABÉLIENS DE TYPE FINI 27

Démontrons donc (9). Il suffit de montrer que, pour toute matrice P à coefficients en-
tiers,

m k (A) | m k (PA). (10)

En effet, si P est inversible, cela implique m k (A) | m k (PA) | m k (P −1 PA) = m k (A), donc
m k (PA) = m k (A). Par passage à la transposée, cela fournit aussi m k (AQ) = m k (A) et donc
(9).
Finalement, on montre directement (10) en exprimant les mineurs de PA comme com-
binaisons linéaires à coefficients entiers des mineurs de A : les détails sont laissés au lec-
teur.
Passons à présent à l’existence de P et Q. Comme pour la classification à équivalence
près des matrices à coefficients dans un corps, on effectue des opérations élémentaires,
qui peuvent s’interpréter comme la multiplication à droite ou à gauche par certaines ma-
trices, dont des matrices carrées dites élémentaires qui ne diffèrent de la matrice identité
que par un seul coefficient, situé hors de la diagonale. La différence avec le cas d’un corps
est qu’on ne peut pas diviser.
Plus précisément, notons Ei j la matrice dont tous les coefficients sont nuls, sauf celui
situé à la i -ème ligne et la j -ème colonne, qui vaut 1.
Les opérations qu’on s’autorise sont les suivantes :
– la multiplication à gauche par la matrice Id +aEi j , qui permet d’ajouter à la i -ème
ligne la j -ème ligne, multipliée par un entier a ;
– la multiplication à droite par la matrice Id +aEi j , qui permet d’ajouter à la j -ème
colonne la i -ème colonne, multipliée par un entier a ;
– la multiplication à gauche ou à droite par une matrice de transposition, qui permet
d’échanger deux lignes ou deux colonnes.
La méthode utilise une récurrence sur la taille de la matrice.
Soit λ1 le pgcd (positif ) des coefficients de la première colonne. On va appliquer des
opérations élémentaires sur les lignes pour obtenir une première colonne dont tous les
coefficients sont nuls, sauf le coefficient a 11 qui sera égal à λ1 . Faisons-le sur les deux
premiers coefficients a 11 et a 12 . Quitte à échanger les deux premières lignes, on peut sup-
poser |a 11 | Ê |a 12 |. Si a 12 = 0, il n’y a rien à faire ; sinon, effectuons la division euclidienne
a 11 = ba 12 +c avec 0 É c < |a 12 | ; en effectuant la transformation élémentaire dans laquelle
la seconde ligne, multipliée par b, est soustraite de la première, les coefficients (a 11 , a 12 )
sont transformés en (c, a 12 ), avec |a 12 |+|c| < |a 11 |+|a 12 |. En itérant, l’algorithme d’Euclide
nous indique qu’on finit par arriver au couple (pgcd(a 11 , a 12 ), 0). Il est clair qu’en répétant
ce procédé sur chaque ligne, on arrive à la première colonne souhaitée, (λ1 0 · · · 0).
La même méthode peut alors être appliquée à la première ligne, en utilisant des opéra-
tions élémentaires sur les colonnes, pour obtenir une matrice dont la première ligne a la
forme (λ2 0 · · · 0), où λ2 est le pgcd des coefficients de la première ligne. Malheureusement,
on a ainsi modifié la première colonne, donc ses coefficients ne sont peut-être plus nuls.
Néanmoins, on a gagné quelque chose : 0 É λ2 É λ1 , puisque c’est le pgcd de λ1 et des
autres coefficients. On itère alors la construction, en mettant alternativement des 0 sur la
première colonne et la première ligne : les coefficients à la place (1,1), positifs, décroissent :
λ1 Ê λ2 Ê λ3 Ê · · · Ê 0. Cette suite se stabilise donc : à un moment donné, on obtient par
28 CHAPITRE I. GROUPES

exemple une première ligne (δ1 0 · · · 0) où δ1 est aussi le pgcd des coefficients de la pre-
mière colonne, donc divise tous ces coefficients. Il suffit alors de retrancher à chaque ligne
un multiple adéquat de la première pour arriver à une matrice de la forme
δ1 0 · · · 0
 
0 
 
. .
.
. B


0
On applique l’hypothèse de récurrence sur B pour parvenir à la matrice diagonale
δ1
 
 δ2 
 , où δ2 | · · · | δr .
 
..

.
 
 
δr
Dans la construction, il n’y a pas de raison a priori que δ1 | δ2 . Mais on peut remplacer le
couple (δ1 , δ2 ) par (d 1 , m 2 ), où d 1 et m 2 sont les pgcd et ppcm de δ1 et δ2 : en effet, par
l’application d’une transformation élémentaire, puis du procédé précédent, on obtient
successivement (en n’écrivant que les deux premières lignes et colonnes, sur lesquelles les
opérations ont lieu)
δ1 0 δ1 0 d 1 d 10
µ ¶ µ ¶ µ ¶
,
0 δ2 δ2 δ2 0 m 20
où on a en fait m 20 = m 2 , puisque le déterminant de la matrice reste inchangé (au signe
près) : d 1 m 2 = δ1 δ2 = d 1 m 20 . De plus, le pgcd des coefficients, à savoir d 1 , reste aussi in-
changé, donc d 1 | d 10 . Une dernière opération élémentaire nous permet d’arriver à la forme
µ ¶
d1 0
voulue .
0 m2
Appliquant le même procédé au couple (m 2 , δ3 ), on peut le remplacer par le couple
(pgcd(m 2 , δ3 ), ppcm(m 2 , δ3 )). Puisque d 1 = pgcd(δ1 , δ2 ) et δ2 | δ3 , d 1 divise d 2 :=
pgcd(m 2 , δ3 ). En itérant le procédé, on remplace les coefficients (δ1 , . . . , δr ) par (d 1 , . . . , d r )
avec d 1 | · · · | d r .

4. Le groupe GL(n, Z)
Notre démonstration du lemme 3.3 permet d’obtenir des générateurs pour les groupes
GL(n, Z) et SL(n, Z). Partons d’une matrice A ∈ GL(n, Z). Il est clair que ses facteurs inva-
riants sont tous égaux à 1, c’est-à-dire que la réduction finale de A est la matrice In . On
a donc écrit A = PQ, où la matrice P (resp. Q) est produit de matrices correspondant aux
opérations réalisées sur les lignes (resp. colonnes). Ces opérations sont de deux types :
– la multiplication à gauche (ou à droite) par la matrice élémentaire In + aEi j , qui n’est
autre que (In + Ei j )a ;
– l’échange de deux lignes ou colonnes.
On en déduit le résultat suivant.

Théorème 4.1. — Le groupe GL(n, Z) est de type fini : il est engendré par
4. LE GROUPE GL(n, Z) 29

– les matrices élémentaires In + Ei j , pour i , j ∈ {1, . . . , n}, i 6= j ,


– et les matrices de transposition In + Ei j + E j i − Ei i − E j j , pour i , j ∈ {1, . . . , n}, i 6= j .

Les opérations élémentaires du premier type ne changent pas le déterminant. Nous


allons remplacer les secondes par l’échange de deux lignes ou colonnes, suivi du change-
ment de l’une d’elles en son opposé. Notons que cela peut être réalisé par des opérations
élémentaires du premier type :
µ ¶ µ ¶ µ ¶ µ ¶
Li Li −L j −L j
.
Lj Li + L j Li + L j Li

Il n’est pas difficile de voir que la démonstration du lemme 3.3 fonctionne encore avec ces
opérations élémentaires restreintes, la seule différence étant qu’on ne  peut pas assurer
 1
.
que d n soit positif ; lorsque A ∈ GL(n, Z), la matrice finale obtenue est  . . . On a
1
dét(A)
donc montré le résultat suivant.

Théorème 4.2. — 1° Le groupe SL(n, Z) est de type fini : il est engendré par les matrices
élémentaires In + Ei j , pour i , j ∈ {1, . . . , n}, i 6= j .
2° Le groupe GL(n, Z) est de type fini : il est engendré par les matrices précédentes et la
matrice In − 2Enn .

En particulier, le groupe SL(2, Z) est engendré par les deux matrices


µ ¶ µ ¶
1 1 1 0
T= U=
0 1 1 1

(et il ne peut pas être engendré par une seule matrice). Le groupe GL(n, Z) peut aussi être
engendré par seulement trois éléments (cf. exerc. 4.4).

Exercice 4.3. — a) Montrer que le groupe SL(2, Z) est engendré par les deux matrices
µ ¶ µ ¶
0 −1 0 −1
S := = T −1 UT R := ST = .
1 0 1 1

b) Montrer que les matrices S et R sont d’ordre fini.


c) Montrer que l’image de tout morphisme SL(2, Z) → C× est contenue dans le groupe µ12 des
racines 12ème de l’unité (5) .

Exercice 4.4. — Montrer que pour tout n, le groupe GL(n, Z) peut être engendré par trois
éléments (Indication : on pourra montrer qu’il est engendré par la matrice In + E12 et deux
matrices de permutation bien choisies).

5. Ce résultat est optimal : l’application f : SL(2, Z) → µ12 donnée par


µ ¶
a b
f = exp(i π((1 − c 2 )(bd + 3(c − 1)d + c + 3) + c(a + d − 3))/6
c d

est surjective, mais ce n’est pas évident de montrer que c’est un morphisme !
30 CHAPITRE I. GROUPES

Exercice 4.5. — Soit R un anneau euclidien (par exemple Z si vous ne savez pas ce que c’est).
Pour tout A ∈ GL(n, R), montrer qu’il existe une matrice P ∈ GL(n, R) produit de matrices élé-
mentaires In + Ei j (avec i 6= j ) telle que
 
1 0
 .. .. 
. . .
 
PA =  
 1 0 
0 · · · 0 dét(A)

5. Groupes simples et suites de composition


5.1. Groupes simples. — Rappelons qu’un groupe G est simple s’il est non trivial et que
ses seuls sous-groupes distingués sont {e} et G. Un groupe simple est donc un groupe qui
n’a pas de quotient non trivial : on ne peut pas espérer le comprendre à partir de groupes
plus petits. Les groupes simples sont les blocs de base de la théorie des groupes.
Les groupe abéliens simples sont les Z/pZ, avec p premier. Le théorème de Feit et
Thompson (1963) affirme que tout groupe fini simple non abélien est d’ordre pair (son
ordre est même divisible par 4 grâce à l’exerc. 2.5).
Une série infinie de groupes simples non abéliens est donnée par les groupes alternés.

Théorème 5.1. — Pour n = 3 ou n Ê 5, le groupe alterné An est simple.

La conclusion du théorème est fausse pour n = 4. En effet, le groupe A4 contient le


groupe de Klein des doubles transpositions :
K = {Id, (12)(34), (13)(24), (14)(23)},
qui est distingué, puisqu’une conjugaison doit envoyer une double transposition sur une
double transposition.

Corollaire 5.2. — Si n 6= 4, les seuls sous-groupes distingués de Sn sont {e}, An et Sn .

Démonstration. — Si n = 2, le corollaire est trivial. On suppose donc n = 3 ou n Ê 5.


Si H ESn , alors H∩ An EAn , donc H∩ An = An ou {e} par le th. 5.1. Dans le premier cas,
l’indice [H : An ] divise [H : Sn ] = 2 ; s’il vaut 1, on a H = An , s’il vaut 2, on a H = Sn .
Dans le second cas (H ∩ An = {e}), la composée H ,→ Sn → Sn /An ' Z/2Z est injective,
donc soit H est trivial, soit il est de cardinal 2. Si |H| = 2, son élément non trivial σ est
d’ordre 2, donc est le produit (ab)(··) · · · de transpositions à supports disjoints. Comme
n Ê 3, on peut choisir c ∉ {a, b} ; le produit (ac)σ(ac)−1 envoie alors c sur b. Il est donc
distinct de σ et de e mais est dans H, ce qui contredit |H| = 2.

Démonstration du théorème. — Soit H 6= {e} un sous-groupe distingué de An . On utilise


le fait essentiel que si σ ∈ An et τ ∈ H, le conjugué στσ−1 de τ est dans H. La méthode de
preuve consiste alors, à partir d’un élément non trivial τ de H, à en fabriquer suffisamment
pour assurer H = An . On suppose n Ê 5, le case n = 3 étant trivial.
Première étape : tous les 3-cycles sont conjugués dans An , et toutes les doubles trans-
positions sont conjuguées dans An .
En effet, on sait que deux 3-cycles sont toujours conjugués dans Sn ; écrivons alors par
exemple (123) = στσ−1 , avec σ ∈ Sn et τ un 3-cycle. Alors on a aussi (123) = σ0 cσ0−1 , avec
5. GROUPES SIMPLES ET SUITES DE COMPOSITION 31

σ0 = (45)σ, et au moins l’un des deux éléments σ ou σ0 est dans An . On déduit que si H
contient un 3-cycle, il contient tous les 3-cycles, et donc est égal à An (qui est engendré
par les 3-cycles). Le même type de raisonnement s’applique aux doubles transpositions :
si (12)(34) = στσ−1 , alors (123) = ((12)σ)τ((12)σ)−1 .
Seconde étape : si H contient une double transposition (donc toutes les doubles trans-
positions), ou un 5-cycle, il contient un 3-cycle.
En effet, comme n Ê 5, si a, b, c, d , e sont distincts, on a
(abc) = (ae)(cd ) (ad )(ce) (ab)(d e),
| {z } | {z } | {z }
dans H dans H dans H
(abd ) = (abc)(abcd e)(abc)−1 (abcd e)−1 .
| {z } | {z }
dans H dans H
Dans les deux cas, on en déduit H = An . Cela résout complètement le cas n = 5, puisque
A5 ne contient que l’identité, des doubles transpositions, des 3-cycles et des 5-cycles.
Troisième étape : on montre que si An−1 est simple, An est simple. On commence par
montrer que H contient toujours un élément non trivial envoyant 1 sur lui-même. Sup-
posons σ ∈ H, avec σ(1) = i 6= 1 ; on va corriger σ en un élément σ0 ∈ H tel que σ0 (1) =
1. Soit j ∉ {1, i } tel que σ( j ) 6= j (σ n’est pas une transposition) et soient l , m distincts
∉ {1, i , j , σ( j )} (on a n Ê 6) ; alors l’élément
σ0 = ( j l m)σ−1 ( j l m)−1 σ
de H vérifie σ0 (1) = 1 et σ0 ( j ) = l 6= j . Donc σ0 6= e et σ0 ∈ G1 ∩ H, où
G1 = {σ ∈ An | σ(1) = 1} ' An−1 .
Ainsi H ∩ G1 6= {e}. Or H ∩ G1 E G1 donc, par l’hypothèse de récurrence, H ∩ G1 = G1 et H
contient donc un 3-cycle. Donc H = An .

5.2. Théorème de Jordan-Hölder. — La notion de suite de composition exprime l’idée


de « casser en morceaux simples » un groupe : une suite de composition d’un groupe G est
une suite
G = G0 B G1 B · · · B Gr = {e} (11)
de sous-groupes emboîtés où chaque groupe quotient Gi /Gi +1 est simple.

Exemples 5.3. — 1° Le groupe symétrique S4 admet la suite de composition suivante :


S4 B A4 B K B Z/2Z B 1,
avec quotients successifs Z/2Z, Z/3Z, Z/2Z, Z/2Z.
2° Pour n = 3 ou n Ê 5, une suite de composition pour Sn est donnée par
Sn B An B 1,
avec quotients successifs Z/2Z et An .
Q α
3° Soit n = p i i la décomposition en produits de facteurs premiers d’un entier positif.
Il résulte du lemme chinois (prop. 3.1) que le groupe Z/nZ admet une suite de composition
dont les quotients successifs sont les Z/p i Z, chacun répété αi fois.
Plus généralement, il résulte du th. 3.6 que tout groupe abélien fini d’ordre n admet une
suite de composition dont les quotients successifs sont les Z/p i Z, chacun répété αi fois.
32 CHAPITRE I. GROUPES

Une suite de composition G = G00 B G01 B · · · B G0s = {e} est dite équivalente à la suite (11)
si r = s et qu’il existe une permutation σ ∈ Sr telle que Gσ(i ) /Gσ(i )+1 ' G0i /G0i +1 .
Le théorème suivant indique l’existence et l’unicité des suites de composition pour les
groupes finis : il dit ainsi qu’en un certain sens tous les groupes finis sont construits à partir
de ces blocs de base. La classification des groupes finis simples est un énorme travail,
achevé dans les années 80, donc ces blocs de base sont connus, mais cela n’entraîne pas
du tout qu’on connaisse tous les groupes finis en général !

Théorème 5.4 (Jordan-Hölder). — Tout groupe fini admet une suite de composition. Cette
suite est unique à équivalence près.

La collection de groupes simples (comptés avec les répétitions éventuelles) qui appa-
raissent comme quotients successifs d’une suite de composition d’un groupe fini G ne
dépendent donc que de G. On les appelle les facteurs simples de G. Attention : ils ne carac-
térisent pas le groupe G à isomorphisme près : les groupes S4 , (Z/2Z)3 ×Z/3Z et Z/24Z ont
les mêmes facteurs simples mais ne sont pas isomorphes deux à deux.

Démonstration. — L’existence d’une suite de composition est facile : si G 6= {e}, on définit


G1 comme un sous-groupe distingué maximal distinct de G. Alors le groupe non trivial
G/G1 est simple car un sous-groupe distingué de G/G1 remonterait en un sous-groupe
distingué de G contenant G1 , qui ne saurait être que G1 ou G ; dans le premier cas, le sous-
groupe de G/G1 est {e}, dans le second G/G1 entier. On recommence le raisonnement à
partir de G1 pour construire G2 . La construction s’arrête quelque part puisque les cardi-
naux des Gi décroissent strictement.
La démonstration de l’unicité va utiliser le lemme suivant.

Lemme 5.5. — Si H1 C G et K 1 C G sont des sous-groupes distingués distincts tels que G/H1
et G/K 1 sont simples, alors H1 ∩ K 1 est distingué dans H1 et dans K 1 et
G/H1 ' K 1 /H1 ∩ K 1 , G/K 1 ' H1 /H1 ∩ K 1 .

Admettons le lemme pour le moment. On raisonne par récurrence : supposons le ré-


sultat vrai pour les groupes dont une suite de composition a une longueur inférieure ou
égale à r − 1.
Soient (H1 , . . . , Hr ) et (K 1 , . . . , K s ), avec r É s, des suites de composition de G. Si H1 =
K 1 , on applique à ce groupe l’hypothèse de récurrence, et on en déduit que les suites de
composition (H2 , . . . , Hr ) et (K 2 , . . . , K s ) sont équivalentes, d’où la conclusion dans ce cas.
Supposons donc H1 6= K 1 et introduisons une suite de composition (L2 , . . . , L t ) pour H1 ∩
K 1 . On considère le diagramme
H1 B H2 B ··· B Hr = {e}
B

G L2 = H1 ∩ K 1 B ··· B L t = {e}
B
B

K1 B K2 B ··· B K s = {e}
Compte tenu du lemme, tous les quotients apparaissant dans ce diagramme sont simples.
Par conséquent, nous avons deux suites de composition pour H1 , à savoir (H2 , . . . , Hr ) et
5. GROUPES SIMPLES ET SUITES DE COMPOSITION 33

(L2 , . . . , L t ). Par l’hypothèse de récurrence, on a r = t et, à permutation près, les quotients


(H1 /H2 , . . . , Hr −1 /Hr ) sont isomorphes aux quotients
(H1 /H1 ∩ K 1 ' G/K 1 , H1 ∩ K 1 /L3 , . . . , Lr −1 /Lr ). (12)
Puisqu’on dispose maintenant de la suite de composition (Lk ) de K 1 , de longueur r − 1,
on peut aussi appliquer l’hypothèse de récurrence à K 1 pour obtenir s = t , et que les
(K 1 /K 2 , . . . , K r −1 /K r ) sont isomorphes aux
(K 1 /H1 ∩ K 1 ' G/H1 , H1 ∩ K 1 /L3 , . . . , Lr −1 /Lr ). (13)
De la comparaison de (12) et (13) résulte que les suites de composition (Hi ) et (K j ) de G
sont équivalentes.

Démonstration du lemme 5.5. — Le noyau de la projection K 1 → G/H1 étant H1 ∩ K 1 , on


a une injection
K 1 /H1 ∩ K 1 ,→ G/H1 .
Comme K 1 est distingué dans G, on obtient que K 1 /H1 ∩ K 1 est distingué dans G/H1 . Par
simplicité de ce dernier, on obtient soit K 1 /H1 ∩ K 1 ' G/H1 , soit K 1 /H1 ∩ K 1 = {e}.
Dans le second cas (qu’on veut exclure), on a K 1 ⊆ H1 et H1 /K 1 est un sous-groupe
distingué non trivial du groupe simple G/K 1 . Comme H1 6= G (puisque G/H1 , étant simple,
est non trivial), H1 /K 1 est trivial, ce qui contredit l’hypothèse H1 6= K 1 .
On a donc montré le premier isomorphisme du lemme, et le second se montre de façon
analogue.

Exercice 5.6. — Soit H un sous-groupe distingué d’un groupe fini G. Montrer que la collec-
tion de facteurs simples de G est la réunion de la collection des facteurs simples de H et de la
collection des facteurs simples de G/H.

5.3. Groupe dérivé. — Des éléments x et y d’un groupe G commutent si x y x −1 y −1 = e.


On appelle commutateur tout élément de G de la forme x y x −1 y −1 et le groupe engendré
par tous les commutateurs,
D(G) = 〈x y x −1 y −1 | x, y ∈ G〉,
est appelé groupe dérivé de G.
Le groupe dérivé est trivial si et seulement si G est abélien.

Proposition 5.7. — Le groupe dérivé D(G) est un sous-groupe caractéristique de G, c’est-


à-dire qu’il est stable par tout automorphisme de G. En particulier, il est distingué.
Le quotient G/D(G) est abélien et c’est le plus grand quotient abélien de G au sens sui-
vant : on a D(G) ≤ H si et seulement si H E G et G/H est abélien.

On peut dire aussi que tout morphisme de G vers un groupe abélien se factorise à tra-
vers G/D(G). Si par exemple G = D(G), tout morphisme de G vers un groupe abélien est
constant.

Démonstration. — L’image du commutateur x y x −1 y −1 par un automorphisme f de G est


le commutateur f (x) f (y) f (x)−1 f (y)−1 , donc f (D(G)) = D(G).
34 CHAPITRE I. GROUPES

Puisque x y x −1 y −1 ∈ D(G) pour tous x, y ∈ G, tous les commutateurs sont nuls dans le
quotient G/D(G), donc G/D(G) est abélien. Si G/H est abélien, tous ses commutateurs sont
triviaux, donc pour tous x, y ∈ G, il faut x y x −1 y −1 ∈ H, ce qui impose D(G) ≤ H.

Proposition 5.8. — Pour n Ê 5, on a D(An ) = An . Pour n Ê 2, on a D(Sn ) = An .

Démonstration. — Comme D(An ) est distingué dans An , il est, par le th. 5.1, égal, pour
n 6= 4,
– soit à {e}, auquel cas An est abélien, ce qui ne se produit pas pour n Ê 5,
– soit à An .
Ceci montre la première assertion. D’autre part, D(Sn ) ≤ An (car la signature d’un commu-
tateur est toujours 1), et D(Sn ) est distingué dans Sn donc dans An . On conclut comme
ci-dessus pour n 6= 4 ; le cas n = 4 est laissé au lecteur.
Exercice 5.9. — Soit H un sous-groupe d’un groupe G. Montrer que D(H) est un sous-groupe
de D(G) et qu’il est distingué si H est distingué dans G.

Exercice 5.10. — Soit n un entier Ê 2. Décrire tous les morphismes de Sn dans C× .

Exercice 5.11. — Soit G un groupe. Pour tous x, y ∈ G, on pose


[x, y] := x y x −1 y −1 .
et on note S l’ensemble de tous les commutateurs [x, y] de G.
Le but de ce long exercice est de montrer que si S est fini, le groupe qu’il engendre, D(G),
est aussi fini.
a) Montrer que l’inverse d’un élément de S est encore dans S.
b) Pour tout entier m Ê 0, on note S m le sous-ensemble de G formé des produits d’au plus m
S
éléments de S. Montrer D(G) = mÊ0 S m .
c) Pour tout z dans G et tout s dans S, montrer que zsz −1 est dans S.
d) Pour tous x 1 , y 1 , x 2 , y 2 , x 3 , y 3 dans G, montrer la formule
[x 1 , y 1 ][x 2 , y 2 ][x 3 , y 3 ] = [x 1 , y 1 ][x 3 , y 3 ][z −1 x 2 z, z −1 y 2 z],
où z = [x 3 , y 3 ].
e) On suppose dans cette question que l’indice [G : Z(G)] du centre de G (cf. 1.4.5°) est fini et
on le note n.
α) Montrer que S est fini de cardinal r É n 2 . On note S = {s 1 , . . . , s r }.
m m
β) Montrer que tout élément de S m peut s’écrire s 1 1 · · · s r r , avec m 1 , . . . , m r ∈ N et m 1 +
· · · + m r É m (Indication : on pourra utiliser la formule de d)).
γ) Montrer que pour tout s ∈ S, on a s n ∈ Z(G).
δ) Montrer que pour tout entier m Ê 0, on a S m ⊆ S nr (Indication : on pourra pro-
céder par récurrence sur m et démontrer les relations [x, y]n+1 = y −1 [x, y]n y[x, y] =
y −1 [x, y]n−1 [x, y 2 ]y).
3
ε) En déduire que D(G) est fini (de cardinal É n n ).
f) On suppose dans cette question S fini. Par c), le groupe G agit par conjugaison sur S et on
note K le noyau du morphisme composé D(G) ,→ G → Bij(S).
α) Montrer que K est d’indice fini dans D(G) et qu’il est contenu dans Z(D(G)).
β) En déduire que D(D(G)) est fini. Il est distingué dans G par l’exerc. 5.9 ; on pose H :=
G/D(D(G)).
γ) Montrer que D(H) est abélien et en déduire que pour tout x ∈ H et tout d ∈ D(H), on
a [x, d ]2 = [x, d 2 ].
5. GROUPES SIMPLES ET SUITES DE COMPOSITION 35

δ) En déduire que le sous-groupe [H, D(H)] de H engendré par les [x, d ], pour x ∈ H et
d ∈ D(H), est fini et distingué dans H. On pose M := H/[H, D(H)].
ε) En déduire que D(M) est fini, puis que D(G) est fini.

5.4. Groupes résolubles. — Dans l’ex. 5.3.1° du groupe symétrique S4 , tous les facteurs
simples sont abéliens. C’est un exemple de groupe résoluble.
C’est une notion essentielle pour l’application de la théorie de Galois à la résolution
par radicaux des équations polynomiales. Elle admet plusieurs définitions équivalentes
que nous allons expliquer. Étant donné un groupe G, on définit une suite de sous-groupes
G =: D0 (G) D D1 (G) D D2 (G) D · · ·
en posant, pour tout entier n ∈ N,
Dn+1 (G) := D(Dn (G)).
Noter que Dn+1 (G) est distingué dans Dn (G) (et même dans G par l’exerc. 5.9) et que les
groupes quotients Dn (G)/Dn+1 (G) sont abéliens.

Théorème 5.12. — On dit qu’un groupe G est résoluble s’il vérifie l’une des conditions équi-
valentes suivantes :
(i) il existe n ∈ N tel que Dn (G) = {e} ;
(ii) il existe une suite
G = G0 D G1 D · · · D Gr = {e}
de sous-groupes emboîtés où chaque groupe Gi /Gi +1 est abélien.

Démonstration. — Il est clair que (i) entraîne (ii). Supposons donc qu’il existe une suite
comme dans (ii). Puisque G0 /G1 est abélien, on a vu plus haut que G1 contient D(G). On
montre de la même façon, par récurrence sur n, que Gn contient Dn (G) pour tout n ∈
{0, . . . , r }, donc que Dr (G) est trivial.

Exemples 5.13. — 1° Tout groupe abélien est résoluble.


2° Le groupe Sn est résoluble pour n É 4, mais pas pour n Ê 5 puisqu’on a alors
Dm (Sn ) = An pour tout m Ê 1 (prop. 5.8).
L’importance de ce résultat réside dans le fait que, par la théorie de Galois, il implique
que l’équation générale de degré n Ê 5 n’est pas résoluble par radicaux. Cela explique aussi
la terminologie.
3° Un groupe G qui est résoluble et simple est cyclique d’ordre premier : en effet, on a
D(G) 6= G (sinon la condition (i) du théorème ne pourrait être vérifiée) et comme D(G) E G,
on a D(G) = {e} puisque G est simple. Le groupe G est donc abélien ; étant simple, il est
cyclique d’ordre premier.
4° Si K est un corps, le groupe affine GA(K) (cf. ex. 1.1.5°) est résoluble (cf. exerc. 1.23).

La propriété d’être résoluble passe aux sous-groupes et aux groupes quotients.

Proposition 5.14. — Soit G un groupe et soit H un sous-groupe de G.


1° Si G est résoluble, H est résoluble.
2° Si H E G, on a
G résoluble ⇐⇒ H et G/H résolubles.
36 CHAPITRE I. GROUPES

Démonstration. — 1° Pour tout entier n, Dn (H) est contenu dans Dn (G). Le premier point
résulte donc de prop. 5.12.(i).
2° Si G est résoluble, avec Dn (G) = {e}, on vient de voir que H l’est aussi (avec Dn (H) =
{e}). Les commutateurs de G/H sont les images par la projection canonique G → G/H des
commutateurs de G. Le groupe D(G/H) est donc l’image de D(G), puis le groupe Dn (G/H)
est l’image de Dn (G), donc Dn (G/H) = {e} et G/H est résoluble.
Inversement, supposons H et G/H résolubles, avec Dm (H) et Dn (G/H) triviaux. Comme
D (G/H), qui est trivial, est l’image de Dn (G) par la projection canonique, ce dernier est
n

contenu dans H. On a alors


Dm+n (G) = Dm (Dn (G)) ≤ Dm (H) = {e},
donc G est résoluble.

Proposition 5.15. — Soit G un groupe fini. Les conditions suivantes sont équivalentes :
(i) G est résoluble ;
(ii) les facteurs simples de G sont cycliques d’ordre premier.

Démonstration. — Pour montrer que (ii) implique (i), on peut procéder par récurrence
sur la longueur d’une suite de composition G = G0 B G1 B · · · B Gr = {e} (dont les quo-
tients successifs sont donc cycliques d’ordre premier). L’hypothèse de récurrence entraîne
que G1 est résoluble. Comme G/G1 est cyclique, donc abélien, il est aussi résoluble et on
conclut que G est résoluble par prop. 5.14.2°.
Inversement, si G est résoluble, la même proposition dit que tous ses facteurs simples
sont résolubles. Étant simples, il sont cycliques d’ordre premier (ex. 5.13.3°).

Le théorème de Feit et Thompson (1963) affirme que tout groupe fini d’ordre impair est
résoluble. Sa démonstration occupe plusieurs centaines de pages. Il est équivalent à dire
que tout groupe fini simple non abélien est d’ordre pair (pourquoi ?).
Exercice 5.16. — Soit p un nombre premier. Montrer qu’un p-groupe est résoluble.

Exercice 5.17. — Soit K un corps et soit n un entier Ê 1. Montrer que le sous-groupe T de


GL(n, K) formé des matrices triangulaires supérieures est résoluble (Indication : on pourra
étudier la suite des groupes dérivés Dm (T)).

Exercice 5.18. — Soit p un nombre premier. Le groupe affine GA(Fp ) (cf. ex. 1.1.5°) est réso-
luble (cf. ex. 5.13.4°) et il opère transitivement et fidèlement sur l’ensemble Fp = {0, . . . , p − 1}.
On peut le voir comme un sous-groupe de SFp = Sp ; son cardinal est p(p − 1) (exerc. 1.23).
Le but de cet exercice est de montrer que tout sous-groupe résoluble H ≤ Sp qui opère
transitivement est conjugué à un sous-groupe de GA(Fp ) ; en particulier, son ordre divise
p(p − 1) (c’est un résultat dû à Galois).
Soit H = H0 B H1 B · · · B Hr = {e} une suite de sous-groupes emboîtés où chaque groupe
Hi /Hi +1 est abélien d’ordre premier (prop. 5.15).
a) Soit τ la translation x 7→ x + 1. Déterminer les p-Sylow de G. En déduire que si g est un
élément de Sp tel que g τg −1 est dans G, alors g ∈ G.
b) Montrer que le groupe Hr −1 agit transitivement sur Fp (Indication : on pourra utiliser
l’exerc. 2.6), puis qu’il est d’ordre p.
c) Soit τ0 un générateur de Hr −1 . Montrer qu’il existe g ∈ Sp tel que g τ0 g −1 = τ. On pose
H0i := g Hi g −1 .
5. GROUPES SIMPLES ET SUITES DE COMPOSITION 37

d) Conclure H ≤ g −1 Gg (Indication : on pourra montrer H0i ≤ G par récurrence descendante


sur i , en utilisant b)).

Exercice 5.19. — Soit p un nombre premier. Le but de cet exercice est de montrer qu’un
sous-groupe H de Sp qui opère transitivement est résoluble si et seulement si aucun élément
de H autre que l’identité laisse deux éléments de {1, . . . , p} fixes.
a) On suppose que H est résoluble. Montrer que H a cette propriété (Indication : on pourra
utiliser l’exercice précédent).
b) On suppose que H a cette propriété. On note Hx ≤ H le stabilisateur d’un point x de
{1, . . . , p}. Montrer que les (Hx {Id})x∈{1,...,p} forment, avec l’ensemble S des éléments de H
sans aucun point fixe, une partition de H {Id}. Montrer l’égalité |H| = p|Hx | et en déduire le
cardinal de S.
c) Montrer que H contient un p-cycle σ (Indication : on pourra utiliser le lemme de Cauchy
(exerc. 2.12)) et que S = {σ, . . . , σp−1 }.
d) Montrer que S est stable par conjugaison par tout élément de H (Indication : on pourra uti-
liser la question b) de l’exercice précédent). En déduire que H est conjugué à un sous-groupe
du groupe affine GA(Fp ) et conclure.
CHAPITRE II

GROUPES CLASSIQUES

1. Préliminaires sur les corps


Les groupes classiques qu’on étudie dans ce chapitre sont définis sur des corps, et
quelques propriétés de base de la théorie des corps seront utiles. Le but de cette section
préliminaire est de les rappeler.
Soit K un corps. On dispose d’un morphisme d’anneaux

φ : Z −→ K

défini par
n fois
z }| {
φ(n) = n · 1K = 1K + · · · + 1K

si n Ê 0, et φ(n) = −φ(−n) si n < 0. Le noyau de φ est un idéal pZ ⊆ Z et fournit un mor-


phisme injectif

φ̂ : Z/pZ −→ K.

Puisque K est un corps, Z/pZ est intègre et donc p est un nombre premier s’il est non nul.
Le nombre p (un entier premier ou bien 0) est appelé la caractéristique du corps K, notée
car(K).
On a les propriétés suivantes :
– Si car(K) = 0, alors K contient Q comme sous-corps. C’est le plus petit sous-corps de
K ; on l’appelle le sous-corps premier de K.
– Si car(K) = p > 0, on a p · 1K = 0 dans K, donc pour tout x ∈ K on a p · x = p(1K · x) =
(p · 1K )x = 0. L’image de φ est le sous-corps premier de K ; il est isomorphe à Fp (qui
est une autre notation pour le corps Z/pZ).
– Toujours si car(K) = p > 0, l’application

FK : K −→ K
x 7−→ xp
40 CHAPITRE II. GROUPES CLASSIQUES

est un morphisme de corps, appelé morphisme de Frobenius. En effet, la formule du


binôme fournit les égalités
à !
p p p p−1
(x + y) = x + x y + ··· + yp = xp + yp
1
¡p ¢
car p | i pour 1 É i É p −1. Le morphisme FK est injectif (x p = 0 entraîne x = 0) mais
pas nécessairement surjectif (si c’est le cas, on dit que le corps K est parfait).
– Si K est un corps fini, φ ne peut être injectif, donc p = car(K) > 0. Le corps K est
alors un Fp -espace vectoriel, nécessairement de dimension finie d , d’où |K| = p d . Le
morphisme de Frobenius FK , étant une application injective entre ensembles finis de
même cardinal, est bijectif.
Le groupe multiplicatif (K× , ×) étant d’ordre q −1, le théorème de Lagrange fournit
q−1
x = 1 pour tout x ∈ K× , donc x q = x pour tout x ∈ K, c’est-à-dire que FdK est l’iden-
tité de K. En particulier, FFp est l’identité. En d’autres termes, le sous-corps premier
Fp de K est contenu dans l’ensemble

{x ∈ K | F(x) = x}

des racines du polynôme X p − X. Comme cet ensemble a au plus p éléments, ils sont
égaux.
La dernière propriété dont nous aurons besoin est plus difficile et nous ne la démon-
trerons pas ici.

Théorème 1.1. — Si q = p d , où p est un nombre premier et d ∈ N∗ , il existe, à isomor-


phisme près, un et un seul corps de cardinal q. On le note Fq .

On peut soit construire ce corps comme le corps de rupture du polynôme X q − X sur


Fp , c’est-à-dire le plus petit sur-corps de Fp dans lequel le polynôme X q − X est scindé en
produit de facteurs du premier degré, soit, si on admet l’existence d’une clôture algébrique
F̄p de Fp , comme
Fq := {x ∈ F̄p | x q = x}
(c’est bien un sous-corps de F̄p , puisque c’est l’ensemble des points fixes de l’automor-
phisme Fd de F̄p ).
F̄p

Exemple 1.2. — Voici les tables d’addition et de multiplication du corps F4 (on a noté ses
éléments 0, 1, a, b) :

+ 0 1 a b × 0 1 a b
0 0 1 a b 0 0 0 0 0
1 1 0 b a 1 0 1 a b
a a b 0 1 a 0 a b 1
b b a 1 0 b 0 b 1 a

Exercice 1.3. — Montrer que le groupe abélien (Fp d , +) est isomorphe à (Z/pZ)d .
2. LE GROUPE LINÉAIRE 41

2. Le groupe linéaire
Soit K un corps (commutatif). On rappelle que GL(n, K) est le groupe des matrices n ×n
inversibles à coefficients dans K et que SL(n, K) est le sous-groupe distingué des matrices
de déterminant 1.
Pour tous i , j ∈ {1, . . . , n}, on a défini dans le §I.3.5 les matrices Ei j et, pour i 6= j et α ∈ K,
les matrices élémentaires In + αEi j . Ce sont des éléments de SL(n, K).

2.1. Centre. — Rappelons que le centre d’un groupe est le sous-groupe formé des élé-
ments qui commutent avec tous les éléments du groupe. Il est clair que les homothéties
λIn , pour λ ∈ K× , sont dans le centre de GL(n, K).

Proposition 2.1. — Soit K un corps et soit n un entier Ê 2.


1° Le centre de GL(n, K) est réduit aux homothéties, c’est-à-dire Z(GL(n, K)) ' K× .
2° Le centre de SL(n, K) est SL(n, K) ∩ Z(GL(n, K)), qui est isomorphe à µn (K) := {λ ∈ K |
λn = 1}.

Démonstration. — Soit A = (a i j ) une matrice de GL(n, K) qui commute à tous les élé-
ments de SL(n, K). On a alors, pour tous i 6= j ,
A(In + Ei j ) = (In + Ei j )A,
c’est-à-dire AEi j = Ei j A. Or la matrice AEi j est formée de la i -ème colonne de A placée
comme j -ème colonne, avec des 0 ailleurs. De la même façon, la matrice Ei j A est formée
de la j -ème ligne de A placée comme i -ème ligne, avec des 0 ailleurs. On en déduit a i i =
a j j , puis a j k = 0 pour tout k 6= j , et a l i = 0 pour tout l 6= i . La matrice A est donc une
homothétie.
Cela montre à la fois les deux énoncés de la proposition.

2.2. Générateurs. — Nous avons étudié dans le § 4 des générateurs du groupes GL(n, Z)
et SL(n, Z) en utilisant la réduction par opérations élémentaires d’une matrice à coeffi-
cients entiers. La même méthode s’applique aux matrices aux coefficients dans un corps
quelconque (en plus facile, car étant dans un corps, on peut diviser par tout élément non
nul !) pour démontrer le théorème suivant.

Théorème 2.2. — Soit K un corps et soit n un entier Ê 2.


1° Le groupe SL(n, K) est engendré par les matrices élémentaires In + αEi j , pour i , j ∈
{1, . . . , n}, i 6= j et α ∈ K.
2° Le groupe GL(n, K) est engendré par les matrices précédentes et les matrices In + (λ −
1)Enn , pour λ ∈ K× .
Exercice 2.3. — Montrer que SL(n, R) est connexe et que GL(n, R) a deux composantes
connexes.

Exercice 2.4. — Montrer que SL(n, Q) est dense dans SL(n, R).

Exercice 2.5. — a) Soit p un nombre premier. Montrer que la réduction modulo p des coeffi-
cients d’une matrice induit un morphisme de groupes SL(n, Z) → SL(n, Z/pZ) qui est surjectif
(Indication : on pourra utiliser le th. 2.2.1°).
b) Montrer que ce résultat reste vrai en remplaçant p par n’importe quel entier N Ê 2.
42 CHAPITRE II. GROUPES CLASSIQUES

2.3. Conjugaison, commutateurs. — Rappelons que le groupe dérivé d’un groupe est le
sous-groupe engendré par ses commutateurs (§ I.5.3).

Théorème 2.6. — Soit K un corps et soit n un entier Ê 2.


1° On a D(SL(n, K)) = SL(n, K) (et donc D(PSL(n, K)) = PSL(n, K)) sauf si n = 2 et K = F2
ou F3 .
2° On a D(GL(n, K)) = SL(n, K) (et donc D(PGL(n, K)) = PSL(n, K)) sauf si n = 2 et K = F2 .

On verra plus bas que les groupes GL(2, F2 ) = SL(2, F2 ) sont isomorphes au groupe sy-
métrique S3 , dont le groupe dérivé est A3 . D’autre part, on peut montrer que le groupe
D(SL(2, F3 )) est d’indice 3 dans le groupe SL(2, F3 ). Ces cas sont donc bien des exceptions
aux conclusions du théorème.

Démonstration. — Le déterminant d’un commutateur est 1, donc le groupe dérivé de


GL(n, K) est toujours inclus dans SL(n, K). Pour montrer qu’il est égal, on montre que le
groupe dérivé contient toutes les matrices élémentaires, et donc tout le groupe SL(n, K).
En utilisant la formule Ei j Ekl = δ j k Ei l , on obtient facilement les formules suivantes,
pour i , j , k distincts deux à deux :
(In + αEi j )−1 = In − αEi j
−1 −1
(In + αEi j )(In + βE j k )(In + αEi j ) (In + βE j k ) = In + αβEi j .
Cela montre le 1° (donc aussi le 2°) pour n Ê 3 (c’est nécessaire pour pouvoir choisir les
trois indices i , j , k distincts).
Lorsque n = 2, il suffit de montrer que les matrices I2 + αE12 et I2 + αE21 sont des com-
mutateurs.
On écrit les formules suivantes : pour β ∉ {0, 1, −1} (ce qui est possible si |K| > 3), on a
!−1 µ
1 β2α−1 β 1 β2α−1
¶Ã !µ ¶−1 Ã
β 1 α
µ ¶
0 0
= ,
0 β−1 0 1 0 β−1 0 1 0 1

(et une formule analogue pour I + αE21 ), ce qui montre le 1°, et pour β ∉ {0, 1}, (ce qui est
possible si |K| > 2), on a
α ¶µ ¶−1 µ α ¶−1
β 0 1 β−1 β 0 1 β−1 1 α
µ ¶µ µ ¶
= ,
0 1 0 1 0 1 0 1 0 1
ce qui montre le 2°.

Exercice 2.7. — Soit K un corps et soit n un entier Ê 2. Quel est le groupe dérivé du groupe
affine GA(Kn ) (cf. ex. 1.1.5°) ?

Exercice 2.8. — Soit K un corps fini et soit n un entier Ê 1. Décrire tous les morphismes de
GL(n, K) dans K× (Indication : on pourra utiliser l’exerc. I.1.24).

Exercice 2.9. — Montrer que pour n Ê 3, le groupe dérivé D(SL(n, Z)) est SL(n, Z) (comparer
avec l’exerc. 2.14).

Comme annoncé plus haut, nous allons maintenant maintenant montrer que certains
des « petits » groupes linéaires sont des groupes de permutations.
2. LE GROUPE LINÉAIRE 43

On a déjà défini dans l’ex. I. 2.2.4° l’espace projectif Pn−1 (K) = Kn − {0}/K× des droites
vectorielles de Kn . En particulier,
P1 (K) = {K(x, 1) | x ∈ K} ∪ {K(1, 0)} ' K ∪ {∞},
appelé droite projective, est constitué d’une copie de K et d’un « point à l’infini ».
L’action de GL(n, K) sur Kn induit une action sur Pn−1 (K). Le noyau de l’action est
constitué des automorphismes linéaires de Kn qui fixent chaque droite, c’est-à-dire des
homothéties (1) . Par passage au quotient, on obtient ainsi des actions fidèles sur Pn−1 (K)
du groupe projectif linéaire
PGL(n, K) = GL(n, K)/Z(GL(n, K))
et de son sous-groupe
PSL(n, K) = SL(n, K)/Z(SL(n, K)).

Exemple 2.10 (Homographies). — On représente souvent l’élément de Pn−1 (K) corres-


pondant à la droite vectorielle engendrée par le vecteur (non nul) (x 1 , . . . , x n ) de Kn par ses
coordonnées homogènes (x 1 : . . . : x n ) (on a (x 1 : . . . : x n ) = (λx 1 : . . . : λx n ) pour tout λ ∈ K× ).
Lorsque n = 2, la bijection P1 (K) ' K ∪ {∞} construite µ ¶ ci-dessus envoie (x 1 : x 2 ) sur x 1 /x 2
a b
si x 2 6= 0 et sur ∞ si x 2 = 0. Une matrice A = ∈ GL(2, K) agit sur P1 (K) en envoyant
c d
(x 1 : x 2 ) sur (ax 1 + bx 2 : c x 1 + d x 2 ). Via la bijection ci-dessus, elle agit donc sur K ∪ {∞} par
(si par exemple bc 6= 0)
ax + b
x ∈ K {−d /c} 7→
cx + d
−d /c 7→ ∞
∞ 7→ a/b
Plus généralement, on appelle homographie toute bijection de Pn−1 (K) induite par l’action
d’un élément de GL(n, K).

Exemples 2.11. — 1° Le groupe GL(n, R) (resp. SL(n, R)) (resp. PGL(n, R)) (resp. PSL(n, R))
est une variété différentiable de dimension n 2 (resp. n 2 − 1) (resp. n 2 − 1) (resp. n 2 − 1).
2° Le groupe GL(n, C) (resp. SL(n, C)) (resp. PGL(n, C)) (resp. PSL(n, C)) est une variété
complexe de dimension n 2 (resp. n 2 − 1) (resp. n 2 − 1) (resp. n 2 − 1).

Dans le cas d’un corps fini, on a déjà vu dans l’exerc. I.1.12 les cardinaux de certains de
ces groupes :
|GL(n, Fq )| = q n(n−1)/2 (q n − 1)(q n−1 − 1) · · · (q − 1),
|SL(n, Fq )| = |PGL(n, Fq )| = q n(n−1)/2 (q n − 1)(q n−1 − 1) · · · (q 2 − 1),

1. On utilise ici un petit argument : si u est un automorphisme linéaire d’un K-espace vectoriel V qui fixe
chaque droite vectorielle de V, alors, pour tout x ∈ V non nul, il existe λx ∈ K× tel que u(x) = λx x. Si x et y sont
colinéaires, on a λx = λ y ; sinon, on écrit, par linéarité de u,
λx+y (x + y) = u(x + y) = u(x) + u(y) = λx x + λ y y.
On en déduit λx+y = λx = λ y , de sorte que u est une homothétie.
44 CHAPITRE II. GROUPES CLASSIQUES

d’où on déduit, en utilisant la prop. 2.1.2° et le fait que F×


q est cyclique d’ordre q − 1,

|SL(n, Fq )|
|PSL(n, Fq )| = .
pgcd(n, q − 1)
En particulier, |PSL(2, Fq )| = q(q 2 − 1)/ pgcd(2, q − 1). Noter aussi les égalités
GL(n, F2 ) = PGL(n, F2 ) = SL(2, F2 ) = PSL(n, F2 )
pour tout n (il n’y a qu’un seul déterminant non nul possible dans F2 , à savoir 1, et une
seule homothétie, l’identité !).
Nous avons indiqué dans le tableau ci-dessous les cardinaux des premiers de ces
groupes, ainsi que les isomorphismes avec certains groupes de permutations (2) :

q 2 3 4 5 7 8 9
n 2 3 4 2 2 3 2 2 2 2
PSL 6 168 8!/2 12 60 8!/2 60 168 504 6!/2
' S3 ' A8 ' A4 ' A5 6 A8
' ' A5 ' PSL(3, F2 ) ' A6
PGL 24 60 120 6!
' S4 ' A5 ' S5 6 S6
'
SL 24
6 S4
'

Certains de ces isomorphismes sont étonnants et pas faciles du tout à démontrer et


encore moins à construire explicitement. D’autres sont plus simples à voir.
L’isomorphisme PSL(2, F2 ) ' S3 est facile : on a vu que P1 (F2 ) a 3 éléments ; le groupe
PSL(2, F2 ) agit fidèlement sur cet ensemble, ce qui fournit un morphisme injectif
PSL(2, F2 ) −→ Bij(P1 (F2 )) ' S3
qui, comme ces deux groupes ont le même ordre, est un isomorphisme.
De façon analogue, le groupe PGL(2, F3 ) agit fidèlement sur l’ensemble P1 (F3 ), qui a 4
éléments, ce qui fournit un morphisme injectif
PGL(2, F3 ) −→ S4
qui, comme ces deux groupes ont le même ordre, est un isomorphisme.
Le sous-groupe PSL(2, F3 ) < PGL(2, F3 ) est d’indice 2 ; il est donc distingué dans S4
(exerc. I.1.15), et isomorphe à A4 (pourquoi ?).
Exercice 2.12. — Montrer que les groupes SL(2, F3 ) et S4 ne sont pas isomorphes (Indica-
tion : on pourra regarder leur centre).

Exercice 2.13. — Les groupes PSL(3, F4 ) et PSL(4, F2 ) ont même cardinal. Le but de cet exer-
cice est de montrer qu’ils ne sont pas isomorphes.
a) Soit p un nombre premier. Montrer que pour toute puissance q de p, le sous-groupe
TU(n, Fq ) de SL(n, Fq ) formé des matrices triangulaires supérieures unipotentes (cf. ex.

2. On sait que ce sont les seuls tels isomorphismes (cf. E. Artin, The orders of the linear groups, Comm. P. App.
Math 8 (1955), 355–365).
2. LE GROUPE LINÉAIRE 45

I.2.17) est un p-Sylow de SL(n, Fq ) et que son image dans PSL(n, Fq ) est un p-Sylow de
PSL(n, Fq ).
1 0 α
 

b) Montrer que le centre de TU(3, F4 ) est formé des matrices 0 1 0 , pour α ∈ F4 .


0 0 1
c) Montrer que le centre de TU(4, F2 ) est d’ordre 2. Conclure.

Exercice 2.14. — a) Montrer que le groupe dérivé D(SL(2, Z)) est d’indice É 12 dans SL(2, Z)
(Indication : si R et S sont les générateurs de SL(2, Z) définis dans l’exerc. I.4.3.a), on pourra
calculer S 2 , S 4 , R3 et R6 ).
b) Montrer que SL(2, Z) a un quotient d’ordre 2 et un quotient d’ordre 3 (Indication : on pourra
utiliser l’exerc. I.2.5, pour p = 2 et 3).
c) En déduire que l’indice de D(SL(2, Z)) dans SL(2, Z) est 6 ou 12 (on peut montrer que c’est
12 (5) ; comparer avec l’exerc. 2.9).

2.4. Simplicité. — Une des raisons de notre intérêt pour les groupes linéaires est qu’ils
donnent lieu, lorsqu’ils sont finis, à des séries infinies de groupes simples (tout comme les
groupes alternés ; cf. th. I.5.1).
Le but de cette section est de démontrer le résultat suivant.

Théorème 2.15. — Soit K un corps. Le groupe PSL(n, K) est simple sauf si n = 2, et K = F2


ou F3 .

Les exceptions ne sont effectivement pas simples : PSL(2, F2 ) ' S3 admet A3 comme
sous-groupe distingué propre, tandis que PSL(2, F3 ) ' A4 admet un sous-groupe distingué
d’indice 3 (ex. I.5.3.1°).
Ce n’est pas par hasard que les exceptions sont les mêmes dans les th. 2.6 et 2.15. En
effet, on va présenter ici une démonstration où le second théorème est déduit du premier
par la méthode d’Iwasawa, qui s’appuie sur l’action du groupe PSL(n, K) sur l’espace pro-
jectif Pn−1 (K).
Plus généralement, supposons qu’un groupe G agisse sur un ensemble X. On dira que
G agit primitivement sur X si
1° l’action de G sur X est transitive ;
2° le stabilisateur Gx d’un point de X (donc de tout point de X) est un sous-groupe
maximal de G, c’est-à-dire que les seuls sous-groupes de G contenant Gx sont Gx et
G.
Un cas particulier d’action primitive est donnée par une action 2-transitive, c’est-à-dire
telle que
∀x 1 , x 2 , y 1 , y 2 ∈ X (x 1 6= x 2 , y 1 6= y 2 =⇒ ∃g ∈ G g · x 1 = y 1 g · x 2 = y 2 ).
Autrement dit, l’action de G sur X × X ∆, où ∆ = {(x, x) | x ∈ X}, définie par g · (x, y) =
(g · x, g · y) est transitive.
En effet, il suffit de vérifier qu’un stabilisateur Gx est un sous-groupe maximal. Soit
donc H ≤ G un sous-groupe contenant strictement Gx et soit h ∈ H Gx , de sorte que y :=
h·x 6= x. Soit g ∈ G Gx , de sorte que z := g ·x 6= x. Il existe alors k ∈ G tel que k·(x, z) = (x, y),
c’est-à-dire k ∈ Gx et k · z = y. Cette seconde relation s’écrit (kg ) · x = h · x, c’est-à-dire
46 CHAPITRE II. GROUPES CLASSIQUES

h −1 kg ∈ Gx < H. Comme h et k sont dans H, on en déduit que tout élément g de G Gx est


dans H, soit H = G.
Le théorème permettant de montrer la simplicité d’un groupe à partir d’une action pri-
mitive est le suivant.

Théorème 2.16. — Supposons que le groupe G agisse primitivement sur X. Si on se donne,


pour chaque x ∈ X, un sous-groupe Tx ≤ G tel que
1° Tx est abélien ;
2° Tg ·x = g Tx g −1 pour tout g ∈ G et tout x ∈ X ;
S
3° x∈X Tx engendre G,
alors tout sous-groupe distingué de G agissant non trivialement sur X contient D(G).

Démonstration. — Soit H un sous-groupe distingué de G agissant non trivialement sur X


et soit x ∈ X. Puisque Gx est maximal, le sous-groupe HGx ≤ G (cf. exerc. I.1.22) est égal soit
à Gx , soit à G.
Dans le premier cas, on a H ≤ Gx donc, pour tout g ∈ G,
H = g Hg −1 ≤ g Gx g −1 = Gg ·x
ce qui, puisque G agit transitivement sur X, contredit le fait que H n’agit pas trivialement
sur X.
On a donc HGx = G. Comme l’action de G sur X est transitive, on a
X = G · x = HGx · x = H · x,
donc l’action de H sur X reste transitive. Montrons qu’en outre G = HTx . En effet, si h ∈ H,
on a par 2°
Th·x = hTx h −1 ⊆ HTx H = HTx ,
puisque H E G. Puisque H agit transitivement sur X, on a donc T y ≤ HTx pour tout y ∈ X,
donc G = HTx puisque les (T y ) y∈X engendrent G par 3°.
Finalement, puisque Tx est abélien,
G/H = HTx ' Tx /(H ∩ Tx )
(exerc. I.1.22) est abélien, de sorte que H ⊇ D(G).

Nous aurons encore besoin d’une autre définition. Soit a un élément non nul d’un K-
espace vectoriel V de dimension finie n. On appelle transvection de vecteur a tout auto-
morphisme de V de la forme
x 7→ x + `(x)a,
où ` : V → K est une forme linéaire telle que `(a) = 0. On note cet automorphisme τ(`, a).
On vérifie que
τ(0, a) = IdV et τ(`, a) ◦ τ(`0 , a) = τ(` + `0 , a),
de sorte que les transvections de vecteur a forment un sous-groupe abélien de GL(V).
Si u ∈ GL(V), le conjugué
u ◦ τ(`, a) ◦ u −1 = τ(` ◦ u −1 , u(a))
est une transvection de vecteur u(a).
2. LE GROUPE LINÉAIRE 47

Enfin, si ` 6= 0, on choisit une base (a, e 2 , . . . , e n−1 ) de ker(`), que l’on complète en une
base de V par un vecteur e n . La matrice de τ(`, a) dans cette base est la matrice élémentaire
In + `(e n )E1n . Toutes les matrices élémentaires sont en fait des matrices de transvection. Il
résulte du th. 2.2.2° que les transvections engendrent SL(V).
Nous pouvons maintenant démontrer le th. 2.15.

Démonstration du th. 2.15. — L’action de PSL(n, K) sur X = Pn−1 (K) est fidèle et 2-
transitive (il suffit en effet de remarquer qu’étant données des paires de points distincts
de Pn−1 (K), correspondant à des paires (D1 , D2 ) et (D01 , D02 ) de droites distinctes de Kn , il
existe un automorphisme linéaire de Kn qui envoie D1 sur D01 et D2 sur D02 ) donc primitive.
Pour chaque x ∈ Pn−1 (K), correspondant à une droite vectorielle D ⊆ Kn , on prend pour
groupe Tx le groupe des transvections de Kn de vecteur un générateur de D. Comme on
vient de l’expliquer, toutes les hypothèses du th. 2.16 sont vérifiées, donc un sous-groupe
distingué de PSL(n, K), non réduit à {Id}, doit contenir D(PSL(n, K)) = PSL(n, K) (th. 2.6).

En prenant pour K un corps fini Fq , on obtient donc ainsi une troisième série de
groupes finis simples (les deux premières étant formées des groupes d’ordre premier d’un
côté et des groupes alternés de l’autre) (3) . Il y a quelques coïncidences qui sont toutes
indiquées dans le tableau p. 44.
Le premier nouveau groupe simple fini qu’on découvre dans ce tableau est donc le
groupe PSL(3, F2 ), d’ordre 168 (cf. exerc. I.2.28). Le suivant est PSL(2, F8 ), d’ordre 504. Le
plus petit groupe fini simple qui n’est ni cyclique, ni un groupe alterné, ni un groupe spé-
cial linéaire est d’ordre 6048 ; c’est le groupe PSU(3, F9 ) qui sera défini dans le § 10.4 (4) .
L’isomorphisme PSL(2, F7 ) ' PSL(3, F2 ) découle abstraitement du fait que tous les
groupes simples (cf. th.2.15) d’ordre 168 sont isomorphes (de même, tous les groupes
simples d’ordre 60 sont isomorphes (exerc. I.2.29), ce qui montre deux des isomorphismes
du tableau) (5) .

Exercice 2.17. — a) Vérifier que les groupes A3 et A4 sont des quotients de SL(2, F3 ) et le
groupe A5 est un quotient de SL(2, F5 ).
b) Montrer que pour m Ê 6, le groupe Am n’est un quotient d’aucun groupe SL(2, Fp ) (Indica-
tion : on pourra utiliser les exerc. I.5.1 et I.5.6) (6) .

3. Pour des raisons que vous comprendrez plus tard, le groupe PSL(n, Fq ) est aussi noté An−1 (q).
4. Le suivant est le groupe de Mathieu M11 , de cardinal 7920, qui peut être défini comme le sous-groupe de
S11 engendré par le 11-cycle (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11) et la permutation (3, 7, 11, 8)(4, 10, 5, 6). Il a été construit
par Mathieu en 1861 (d’une autre façon !). C’est un des 26 groupes finis simples sporadiques : il ne fait pas partie
d’une série infinie comme les groupes cycliques, alternés, ou projectifs spéciaux linéaires.
5. Dans le même ordre d’idées, on sait que les seuls groupes simples d’ordre 8!/2 sont (à isomorphisme près)
A8 ' PSL(4, F2 ) et PSL(3, F4 ).
6. On peut montrer que pour m Ê 6, le groupe Am n’est un quotient d’aucun groupe SL(2, Z/NZ) pour N Ê 2,
mais que pour m Ê 9, le groupe Am est en revanche quotient de SL(2, Z). Comme l’application de restriction r N :=
SL(2, Z)  SL(2, Z/NZ) est surjective, le noyau de l’application SL(2, Z)  Am est un sous-groupe (distingué) de
SL(2, Z), d’indice fini, qui ne contient aucun ker(r N ) = {M ∈ SL(2, Z) | M ≡ I2 (mod N)}. On dit que ce n’est pas
un sous-groupe de congruence (l’existence de ces sous-groupes a été annoncée par Klein en 1879 et publiée
indépendamment par Fricke et Pick en 1887). En revanche, c’est un théorème difficile de Bass, Lazard et Serre de
1964 que pour n Ê 3, tout sous-groupe de SL(n, Z) d’indice fini est un sous-groupe de congruence.
48 CHAPITRE II. GROUPES CLASSIQUES

3. Formes bilinéaires et quadratiques


Soit V un K-espace vectoriel. Dans cette section, on introduit les types de formes bili-
néaires que l’on va étudier.

3.1. Définitions. — Une forme bilinéaire sur V est une application B : V ×V → K telle que,
pour chaque y ∈ V, les applications partielles x 7→ B(x, y) et x 7→ B(y, x) sont K-linéaires.
Une telle forme est
– symétrique si B(x, y) = B(y, x) pour tous x, y ∈ V ;
– alternée si B(x, x) = 0 pour tout x ∈ V.
Cette dernière condition entraîne (et, si car(K) 6= 2, lui est équivalente) le fait que B est
– antisymétrique, c’est-à-dire qu’elle vérifie B(x, y) = −B(y, x) pour tous x, y ∈ V.
Étant donnée une forme bilinéaire symétrique, on définit la forme quadratique associée
f (x) := B(x, x).
On a alors
f (x + y) = f (x) + 2B(x, y) + f (y).
(7)
Si car(K) 6= 2 , on récupère la forme B à partir de f par la formule
1
B(x, y) = ( f (x + y) − f (x) − f (y)) (14)
2
dite « de polarisation ».
Si V est de dimension finie n, la matrice M de la forme bilinéaire B dans une base
(e 1 , . . . , e n ) de V est la matrice (B(e i , e j ))1Éi , j Én . Si des éléments de V sont représentés par
les vecteurs colonnes X et Y, alors B(X, Y) = t XMY. La forme B est (anti)symétrique si et
seulement si la matrice M est (anti)symétrique. Si P est la matrice de passage de la base
(e i ) à une base (e i0 ), la matrice de B dans la nouvelle base est donnée par

M0 = t PMP.
Supposons B symétrique et notons f la forme quadratique associée. Si dét(M) 6= 0, la
classe de dét(M) dans le groupe multiplicatif quotient K× /K×2 est bien définie et s’appelle
le discriminant de f , noté disc( f ). Quand dét(M) = 0, on convient que le discriminant est
nul aussi (8) .
La forme quadratique f est donnée par la formule
X
f (x 1 e 1 + · · · + x n e n ) = ai j xi x j ,
1Éi É j Én

où a i i = f (e i ) = B(e i , e i ) et a i j = 2B(e i , e j ) si i < j . En d’autres termes, une forme quadra-


tique sur un espace vectoriel de dimension finie est donnée par un polynôme homogène
de degré 2 en les composantes d’un vecteur (9) .

7. Si car(K) = 2, il faut définir une forme quadratique sur V comme une application f : V → K telle que l’appli-
cation (x, y) 7→ f (x + y) − f (x) − f (y) soit bilinéaire.
8. Cette notion n’a pas d’intérêt dans le cas alterné car nous verrons plus tard que dét(M) est toujours un
carré.
9. Cette formulation reste d’ailleurs valable en caractéristique 2.
3. FORMES BILINÉAIRES ET QUADRATIQUES 49

3.2. Quadriques. — Attention de ne pas étendre aux formes bilinéaires symétriques gé-
nérales les propriétés que vous pouvez connaître des produits scalaires. Ceux-ci corres-
pondent au cas particulier des formes bilinéaires symétriques définies positives sur un
espace vectoriel réel, ce qui est un cas très particulier.
Il faut plutôt penser à une forme quadratique en termes géométriques de la façon sui-
vante. Une quadrique affine Q ⊆ Kn est définie par une équation polynomiale de degré
2
f 2 (x 1 , . . . , x n ) + f 1 (x 1 , . . . , x n ) + f 0 = 0,
où f i est un polynôme homogène de de degré i . L’homogénéisé
f (x 0 , x 1 , . . . , x n ) = f 2 (x 1 , . . . , x n ) + f 1 (x 1 , . . . , x n )x 0 + f 0 x 02
est une forme quadratique sur Kn+1 . L’équation f (x 0 , x 1 , . . . , x n ) = 0 définit un cône qua-
dratique C ⊆ Kn+1 (et Q est l’intersection de C avec l’hyperplan affine d’équation x 0 = 1)
mais aussi une quadrique projective
Q̄ := {(x 0 : x 1 : . . . : x n ) ∈ Pn (K) | f (x 0 , x 1 , . . . , x n ) = 0}
(noter que l’annulation de f (x 0 , x 1 , . . . , x n ) ne dépend pas du choix des coordonnées ho-
mogènes (x 0 : x 1 : . . . : x n )). Bien sûr, cette quadrique peut être vide, comme par exemple la
quadrique d’équation x 02 +· · ·+x n2 = 0 dans Pn (R) ou la quadrique d’équation x 02 +x 12 −3x 22 =
0 dans P2 (Q).
L’application injective
Kn −→ Pn (K)
(x 1 , . . . , x n ) 7−→ (1 : x 1 : . . . : x n )
n n
identifie K avec le sous-ensemble de P (K) défini par x 0 6= 0. On retrouve la quadrique
affine Q comme l’intersection de Q̄ avec ce sous-ensemble.
Exemples 3.1. — Considérons dans R2 la conique Q d’équation
x 12 − x 22 + 2x 2 + 1 = 0.
L’homogénéisé est f (x 0 , x 1 , x 2 ) := x 12 − x 22 + 2x 0 x 2 + x 02 et définit une conique projective
Q̄ ⊆ P2 (R). Il y a deux points « à l’infini » (c’est-à-dire avec x 0 = 0), à savoir (0 : 1 : 1) et
(0 : 1 : −1). Ils correspondent aux deux asymptotes de l’hyperbole Q.

3.3. Formes non dégénérées. — Soit B une forme bilinéaire symétrique ou alternée sur
un espace vectoriel V de dimension finie sur un corps K de caractéristique 6= 2.
On note B̂ : V → V ∗ l’application linéaire qui à x ∈ V associe la forme linéaire y 7→ B(x, y).
On définit le noyau de B comme celui de B̂, c’est-à-dire
ker(B) := {y ∈ V | ∀x ∈ V B(x, y) = 0}.
et on dit que B est non dégénérée si ker(B) = 0. On appelle souvent forme symplectique une
forme alternées non dégénérée.
On définit le rang de B comme celui de B̂. La matrice de B̂ dans une base de V et sa base
duale dans V ∗ est la matrice de B comme définie plus haut. En particulier, le rang de B est
le rang de cette matrice.
Proposition 3.2. — Les conditions suivantes sont équivalentes :
50 CHAPITRE II. GROUPES CLASSIQUES

1° B est non dégénérée ;


2° l’application linéaire B̂ : V → V ∗ est bijective ;
3° la matrice de B dans une base de V est inversible, c’est-à-dire que le rang de B est la
dimension de V.

Démonstration. — La première condition est exactement que B̂ soit injective. Comme V


est de dimension finie, c’est équivalent à dire que B̂ est bijective, c’est-à-dire la seconde
condition, ou encore surjective, ce qui donne la troisième condition.

La restriction de B à tout supplémentaire de ker(B) dans V est non dégénérée. Cela per-
met de se ramener à une forme non dégénérée, ce qu’on fera le plus souvent.

3.4. Groupe d’isométries. — Soient V et V 0 des espaces vectoriels sur un corps K de ca-
ractéristique 6= 2 équipés de formes B et B0 de même type. Une application linéaire injective
u : V → V 0 est une isométrie si, pour tous x, y ∈ V, on a

B0 (u(x), u(y)) = B(x, y).

Si B et B0 sont des formes bilinéaires symétriques, de formes quadratiques associées f et


f 0 , il suffit que
f 0 (u(x)) = f (x)
pour tout x ∈ V.
Si B est non dégénérée, l’injectivité découle de la propriété d’isométrie. Si en outre
(V 0 , B0 ) = (V, B), toute isométrie est un isomorphisme et l’ensemble des isométries forme
un groupe pour la composition. L’appellation habituelle de ce groupe est différente sui-
vant les cas :
– pour une forme quadratique, le groupe orthogonal O(V, q) ;
– pour une forme alternée, le groupe symplectique Sp(V, B).
Dans tous les cas, si M est la matrice de la forme B dans une base, une matrice U repré-
sente une isométrie si t UMU = M.
Comme B est non dégénérée, cela implique dét(U)2 = 1 donc dét(U) = ±1. Le groupe
spécial orthogonal est alors défini comme SO(V, q) := O(V, q) ∩ SL(V).
Le groupe symplectique n’a pas de forme « spéciale » car il est déjà inclus dans SL(V),
comme on le verra plus loin (cor. 7.2).

4. Orthogonalité
Dans la suite, B désignera une forme bilinéaire symétrique ou alternée sur un espace
vectoriel V de dimension finie sur un corps K de caractéristique 6= 2.

4.1. Définition. — On dit que des vecteurs x et y sont orthogonaux si B(x, y) = 0 ; vu les
propriétés de B, c’est la même chose que de demander B(y, x) = 0 : c’est donc une relation
symétrique. L’orthogonal d’une partie W de V est le sous-espace vectoriel, noté W ⊥ , des
vecteurs de V orthogonaux à tous les éléments de W. On a par exemple ker(B) = V ⊥ .
4. ORTHOGONALITÉ 51

Proposition 4.1. — Si B est non dégénérée et que W est un sous-espace vectoriel de V, on a


dim(W) + dim(W ⊥ ) = dim(V).
En particulier, si W ∩ W ⊥ = 0 (ce qui est équivalent à B|W non dégénérée), V = W ⊕ W ⊥ .

Démonstration. — L’application linéaire r : V ∗ → W ∗ de restriction des formes linéaires


est surjective, donc la composée
r ◦ B̂ : V → W∗
x 7→ B(x, ·)

est linéaire surjective. Or ker(r ◦ B̂) = W , d’où la formule sur la dimension en écrivant que
la dimension de V est la somme des dimensions du noyau et de l’image de r ◦ B̂.

Voici quelques formules sur l’orthogonal (la seconde est vraie aussi en dimension infi-
nie) :
(W ⊥ )⊥ = W, (W + W 0 )⊥ = W ⊥ ∩ W 0⊥ , (W ∩ W 0 )⊥ = W ⊥ + W 0⊥ .
On dit qu’un vecteur x ∈ V est isotrope si B(x, x) = 0, c’est-à-dire si x ∈ x ⊥ . On dit aussi
que la droite Kx est isotrope.
Un sous-espace vectoriel W ⊆ V est totalement isotrope si B|W = 0, ce qui est équivalent
à W ⊆ W⊥.

Exemple 4.2. — Comme on l’a vu dans le § 3.2, une forme quadratique f sur Kn+1 définit
une quadrique projective Q̄ ⊆ Pn (K). Les points de Q sont en bijection avec les droites
vectorielles D ⊆ Kn+1 isotropes pour f .
L’orthogonal D⊥ correspond à l’espace tangent à Q̄ en ce point ; cela résute de la for-
mule
d f (x)(y) = 2B(x, y)
donnant la différentielle de f en x, obtenue en différentiant la formule de polarisation
(14).
Dans l’ex. 3.1 de la conique Q d’équation x 12 − x 22 + 2x 2 + 1 = 0 dans K2 , si (a 1 , a 2 ) est
un point de Q, la droite K(1, a 1 , a 2 ) est isotrope pour f (elle définit un point de Q̄) et son
orthogonal pour f est défini par
a 1 x 1 − a 2 x 2 + x 2 + a 2 x 0 + x 0 = 0.
La droite tangente à Q en (a 1 , a 2 ) a donc pour équation affine a 1 x 1 − a 2 x 2 + x 2 + a 2 + 1 = 0.

4.2. Décomposition en somme directe orthogonale : cas d’un vecteur non isotrope. —
Si la forme symétrique B n’est pas nulle, il résulte de la formule (14) qu’il existe un vec-
teur non isotrope x. Dans ce cas, on a Kx ∩ x ⊥ = 0 donc V = Kx ⊕ x ⊥ . Par récurrence sur
la dimension, en considérant la restriction de B à x ⊥ , on obtient l’existence d’une base or-
thogonale (e 1 , . . . , e n ), c’est-à-dire satisfaisant B(e i , e j ) = 0 si i 6= j . Posant αi = B(e i , e i ), on
obtient
f (x) = α1 x 12 + · · · + αr x r2 ,
avec 0 É r É n et α1 , . . . , αr non nuls ; c’est la réduction de Gauss de la forme quadratique f .
L’entier r ne dépend que de la forme f car c’est son rang.
52 CHAPITRE II. GROUPES CLASSIQUES

Dans la base (a 1 e 1 , . . . , a n e n ), où a i ∈ K× , les coefficients αi deviennent αi a i2 . Si


α1 , . . . , αn sont des scalaires non nuls, il est d’usage de noter la forme quadratique non
dégénérée (x 1 , . . . , x n ) 7→ α1 x 12 + · · · + αn x n2 sur Kn par le symbole
〈α1 , . . . , αn 〉
et l’isométrie entre deux telles formes par le symbole '. Pour tous scalaires non nuls
a 1 , . . . , a n , on a donc
〈α1 , . . . , αn 〉 ' 〈a 12 α1 , . . . , a n2 αn 〉.
En d’autres termes, on peut considérer que les αi sont dans K× /K×2 . On a disc(〈α1 , . . . , αn 〉) =
α1 · · · αn .
Le problème de la classification des formes quadratiques est de savoir quand des
formes 〈α1 , . . . , αn 〉 et 〈β1 , . . . , βn 〉 sont isométriques, avec α1 , . . . , αn , β1 , . . . , βn ∈ K× /K×2 .
Une condition nécessaire est que les discriminants soient les mêmes, α1 · · · αn = β1 · · · βn
dans K× /K×2 , mais elle n’est en général pas suffisante.

Exemples 4.3. — 1° Si K est un corps algébriquement clos (ou plus généralement si K est
quadratiquement clos, c’est-à-dire K = K2 ), on peut toujours trouver a i tel que a i2 = 1/αi .
Il en résulte qu’étant donnée une forme quadratique non dégénérée f sur Kn , il existe une
base dans laquelle elle s’écrit
f (x) = x 12 + · · · + x n2 .
Son groupe orthogonal (indépendant donc de f ) est noté O(n, K).
2° Si K = R, on peut toujours trouver a i tel que a i2 = ±1/αi . En réarrangeant la base, on
déduit qu’étant donnée une forme quadratique non dégénérée f sur Rn , il existe une base
dans laquelle elle s’écrit
f (x) = x 12 + · · · + x s2 − x s+1
2
− · · · − x n2 .
Le couple (s, n −s) est la signature de f ; on verra plus loin (ex. 5.6.1°) que c’est un invariant
de f . Son groupe orthogonal est noté O(s, n − s, R), ou simplement O(s, n − s), et on note
O(n) au lieu de O(n, 0). Comme les groupes orthogonaux de f et de − f sont les mêmes,
on a O(s, t ) ' O(t , s). Le discriminant est (−1)n−s donc ne suffit pas à distinguer les formes
quadratiques.
×2 2
3° Si K = Fq , alors F× q /Fq est d’ordre 2 (car, q étant impair le noyau de x 7→ x dans Fq
×

est {±1}). Donc on peut ramener chaque αi non nul à être égal à 1 ou à α ∉ Fq . Mais on∗2

peut en fait faire mieux.

Proposition 4.4. — Étant donnée une forme quadratique f non dégénérée sur Fnq , il existe
une base dans laquelle elle s’écrit sous l’une des deux formes suivantes :
f (x) = x 12 + · · · + x n−1
2
+ x n2 ,
f (x) = x 12 + · · · + x n−1
2
+ αx n2 ,
où α est un scalaire non nul fixé qui n’est pas un carré dans Fq .

Notons que les deux formes proposées ne sont pas équivalentes, puisque leurs discri-
×2
minants sont 1 et α, qui sont différents dans F×
q /Fq . On déduit de la proposition que des
formes quadratiques non dégénérées sur Fnq sont équivalentes si et seulement si elles ont
même discriminant.
4. ORTHOGONALITÉ 53

Démonstration. — Par récurrence sur n. Si n Ê 2, on va montrer qu’il existe e 1 tel que


f (e 1 ) = 1. Alors Fnq = Ke 1 ⊕ e 1⊥ et l’hypothèse de récurrence montre le résultat.
q+1
Écrivons f dans une base orthogonale, f (x) = ni=1 αi x i2 . Puisqu’il y a 2 carrés dans
P

Fq (en comptant 0) et que α1 α2 6= 0, les quantités α1 x 12 et 1 − α2 x 22 décrivent toutes deux


q+1 q+1
un ensemble à 2 éléments quand x 1 (resp. x 2 ) décrit Fq . Puisque 2 > q, il existe x 1 , x 2
tels que α1 x 12 et 1 − α2 x 22 coïncident, c’est-à-dire f (x 1 , x 2 , 0, . . . , 0) = 1.
On a donc a priori deux groupes orthogonaux pour chaque dimension, selon que le dis-
criminant de la forme est trivial ou non. Cependant les groupes orthogonaux de 〈1, . . . , 1〉
et de 〈α, . . . , α〉 sont les mêmes et la seconde forme est de discriminant αn .
Si n = 2m + 1 est impair, on a donc un seul groupe orthogonal, noté O(2m + 1, Fq ).
Si n = 2m est pair, on note les deux groupes orthogonaux O+ (2m, Fq ) et O− (2m, Fq ) (10)
(il ressort de (22) que leurs cardinaux sont différents : ils ne sont donc pas isomorphes).
4° Si K = Q, on a une infinité de discriminants possibles, puisque le groupe Q× /Q×2 est
infini. Étant donnée une forme quadratique sur Q, on peut aussi la voir comme une forme
quadratique sur R et considérer sa signature. Mais, même à discriminant et signature fixés,
il existe encore une infinité de classes d’équivalence de formes quadratiques sur Q (11) .
Exercice 4.5. — Soit K un corps. Pour tous α, β dans K× tels que α + β 6= 0, montrer 〈α, β〉 '
〈α + β, αβ(α + β)〉.

Exemple 4.6 (Pinceaux de formes quadratiques). — Soit V un espace vectoriel de di-


mension n sur un corps K algébriquement clos et soient f et f 0 des formes quadratiques
non dégénérées sur V. Le pinceau engendré par f et f 0 est l’ensemble de formes quadra-
tiques
{ f λ := λ f − f 0 | λ ∈ K}.
On choisit une base de V dans laquelle la matrice de f est In (ex. 4.3.1°) ; soit M la matrice
de g dans cette même base. La forme quadratique f λ est dégénérée si et seulement si
dét(λIn − M) = 0, c’est-à-dire si λ est valeur propre de M. Supposons ces valeurs propres
λ1 , . . . , λn toutes distinctes (c’est le cas « général »). La matrice M est alors diagonali-
sable (12) : il existe une base (e 1 , . . . , e n ) de V composée de vecteurs propres de M. Plus
précisément, MEi = λi Ei , où Ei est la matrice (colonne) des composantes de e i dans la
base de départ. On a alors, pour i 6= j ,
B0 (e i , e j ) = t Ei ME j = λ j t Ei E j ,
qui est aussi égal, par symétrie de B0 , à
B0 (e j , e i ) = t E j MEi = λi t E j Ei = λi t Ei E j .

10. Plus précisément, le groupe O+ (2m, Fq ) est le groupe d’isométries de toute forme quadratique de discri-
minant (−1)m .
11. Pour décrire ces classes d’équivalence, il faut voir une forme quadratique sur Q comme une forme quadra-
tique non seulement sur son complété R, mais aussi sur chacun des corps p-adiques Qp , où p est un nombre
premier impair : des formes quadratiques sur Q sont équivalentes si et seulement si elles le sont dans R et dans
chacun des Qp (« Théorème de Hasse-Minkowski » ; Serre, J.-P., Cours d’arithmétique, chap. IV, th. 9 ; cf. aussi
prop. 7). Sur chacun de ces corps, il y a un invariant facile à calculer qui permet de tester l’équivalence (c’est la
signature sur le corps R et un invariant dans {±1} sur les corps Qp ).
12. Attention : la matrice M est symétrique, mais cela n’entraîne pas en général qu’elle est diagonalisable !
54 CHAPITRE II. GROUPES CLASSIQUES

Comme λi 6= λ j , on en déduit 0 = t Ei E j = B(e i , e j ) = B0 (e i , e j ). La base (e 1 , . . . , e n ) est donc


p
orthogonale à la fois pour f et pour f 0 . En remplaçant e i par e i / B(e i , e i ), on obtient une
base de V dans laquelle
f (x) = x 12 + · · · + x n2 ,
f 0 (x) = λ1 x 12 + · · · + λn x n2 .
C’est le cas le plus simple. Dans tous les cas, on peut définir pour tout pinceau de formes
quadratiques une suite de nombres appelée symbole de Segre du pinceau et, pour chaque
symbole, une « forme normale » des quadriques du pinceau.

4.3. Décomposition en somme directe orthogonale : cas d’un vecteur isotrope. — La


forme B est ici symétrique ou alternée, non dégénérée.

Lemme 4.7. — Si x est un vecteur isotrope non nul, il existe un vecteur isotrope y tel que
B(x, y) = 1.
µ ¶
0 1
Dans la base (x, y) du plan P engendré par x et y, la matrice de B est , où ε = 1 ou
ε 0
−1 selon que B est symétrique ou alternée. On dit que P est un plan hyperbolique.

Démonstration. — Comme B est non dégénérée et que x n’est pas nul, on peut toujours
trouver x 0 tel que B(x, x 0 ) = 1, puis on prend y = x 0 − 21 B(x 0 , x 0 )x, qui satisfait les propriétés
voulues.

L’intérêt d’un plan hyperbolique P est que B|P est non dégénérée, ou de manière équi-
valente P ∩ P ⊥ = 0. Il en résulte
V = P ⊕ P⊥ .
La forme B est encore non dégénérée sur P ⊥ et on peut recommencer la même opéra-
tion sur P ⊥ , si celui-ci admet un vecteur isotrope non nul. Finalement, on fabrique une
décomposition en somme directe orthogonale
⊥ ⊥ ⊥
V = P1 ⊕ · · · ⊕ Pν ⊕ W,
où P1 , . . . , Pν sont des plans hyperboliques et où le seul vecteur isotrope de W est 0 ; on dit
que W est un sous-espace anisotrope.
L’entier ν est l’indice de la forme B ; on verra plus loin (cor. 5.5.2°) que c’en est un inva-
⊥ ⊥
riant. Une somme orthogonale de plans hyperboliques comme ci-dessus P1 ⊕ · · · ⊕ Pν est
appelée un espace hyperbolique.
On a obtenu à ce stade deux formes de réduction pour une forme quadratique f :
– une décomposition dite de Gauss en 〈α1 , . . . , αn 〉 ;
– une décomposition en somme directe orthogonale d’un espace hyperbolique et d’un
espace anisotrope.
Remarquons que toute forme 〈α, −α〉 (α ∈ K× ) est un plan hyperbolique, puisqu’elle
contient un vecteur isotrope non nul, (1, 1). Concrètement, cette forme s’écrit f (x 1 , x 2 ) =
αx 12 − αx 22 dans une base (e 1 , e 2 ) et f (y 1 , y 2 ) = 2y 1 y 2 dans la base ( α1 (e 1 + e 2 ), e 1 − e 2 ), qui
est donc hyperbolique.
4. ORTHOGONALITÉ 55

Exemples 4.8. — 1° Si K est quadratiquement clos, toute forme quadratique non dégé-
nérée sur Kn peut s’écrire 〈1, −1, 1, −1, . . . , 〉. C’est donc la somme directe orthogonale de
bn/2c plans hyperboliques et, si n est impair, de la forme anisotrope 〈1〉.
2° Si K = R, on a vu (ex. 4.3.2°) que toute forme quadratique non dégénérée s’écrit

〈1, . . . , 1, −1, . . . , −1〉.


| {z } | {z }
s fois t fois

Si s É t , c’est donc la somme directe orthogonale de s plans hyperboliques et de la forme


définie négative (donc anisotrope) 〈−1, . . . , −1〉.
| {z }
t −s fois

Exercice 4.9. — Soit K un corps de caractéristique différente de 2 et soit f une forme qua-
dratique non dégénérée sur un K-espace vectoriel V de dimension finie non nulle. Soit a ∈ K.
On dit que f représente a s’il existe v ∈ V non nul tel que f (v) = a.
a) La forme quadratique 〈1, 1, 1, −7〉 sur Q4 représente-t-elle 0 ?
b) Si f représente 0, montrer que f représente tout élément de K.
c) Soit g une forme quadratique non dégénérée sur un K-espace vectoriel W de dimension
finie non nulle. Montrer que les propriétés suivantes sont équivalentes :
(i) il existe a ∈ K∗ qui est représenté à la fois par f et par g ;
(ii) la forme quadratique h(v, w) = f (v) − g (w) sur l’espace vectoriel V ⊕ W représente 0.

4.4. Décomposition en somme directe orthogonale : cas alterné. — On suppose B al-


ternée (et non dégénérée). Dans ce cas, tout vecteur est isotrope et on obtient comme ci-
dessus une décomposition en somme directe orthogonale (l’espace W est nécessairement
nul)
⊥ ⊥
V = P1 ⊕ · · · ⊕ Pν .

En particulier, la dimension de V est paire (égale à 2ν) et, à isométrie près, il n’y a qu’une
seule forme alternée non dégénérée sur un K-espace vectoriel de dimension paire 2ν ; on
notera son groupe d’isométries Sp(2ν, K).
Dans une base (e 1 , . . . , e 2ν ) telle que (e i , e i +ν ) est une base standard de Pi , la matrice de
B est
µ ¶
0 Iν
J2ν = . (15)
−Iν 0
On a alors
Sp(2ν, K) = {U ∈ GL(2ν, K) | t UJ2ν U = J2ν }. (16)

Décomposant la matrice par blocs,


µ ¶
A B
U= ,
C D

il vient U ∈ Sp(2ν, K) si et seulement si


t
AC = t CA, t
BD = t DB, t
AD − t CB = Iν . (17)
56 CHAPITRE II. GROUPES CLASSIQUES

5. Théorème de Witt
Le théorème de Witt est un théorème de prolongement des isométries. Il est essentiel
dans la théorie.

Théorème 5.1 (Witt). — Soient (V, B) et (V 0 , B0 ) des espaces isométriques non dégénérés.
Soit W un sous-espace de V et soit u : W → V 0 une isométrie. Il existe une isométrie v : V → V 0
telle que v|W = u.

Commeno̧ns par le cas simple où W est de dimension 1, engendré par un vecteur x.


Le vecteur y := u(x) vérifie B(x, x) = B(y, y) et il s’agit de trouver une isométrie v telle que
v(x) = y. Pour résoudre ce problème, nous aurons besoin de la construction suivante.

Exemple 5.2 (Réflexions). — Si B(x, x) 6= 0 (en particulier, B est symétrique), on a V =


x ⊥ ⊕ Kx et la réflexion (ou symétrie hyperplane) par rapport à x ⊥ est l’endomorphisme
s x de V de valeurs propres 1 et −1 sur cette décomposition. Il s’agit manifestement d’une
isométrie, donnée explicitement par la formule
B(x, y)
s x (y) = y − 2 x.
B(x, x)
Si B(x, x) = B(y, y) 6= 0 et qu’on note la forme quadratique associée f , le théorème de
WItt résulte alors du lemme suivant.

Lemme 5.3. — Si f (x) = f (y) 6= 0, il existe une isométrie v telle que v(x) = y.

Démonstration. — De f (x + y) + f (x − y) = 2( f (x) + f (y)) = 4 f (x), on déduit que l’un au


moins des vecteurs x + y et x − y est non isotrope, disons par exemple x + y. Alors la ré-
flexion par rapport à (x + y)⊥ envoie x sur −y, et on la compose par − Id.

Le deuxième cas qu’on va traiter est celui d’un espace W totalement isotrope (c’est-à-
dire tel que B|W ≡ 0). On construit pour cela un espace hyperbolique contenant W.

Lemme 5.4. — Soit V un espace vectoriel muni d’une forme bilinéaire symétrique ou alter-
née non dégénérée, soit W un sous-espace vectoriel totalement isotrope de V et soit (e 1 , . . . , e r )
une base de W. Il existe (e 10 , . . . , e r0 ) dans V tels que
– chaque Pi := 〈e i , e i0 〉 est un plan hyperbolique ;
– P1 , . . . , Pr sont en somme directe orthogonale.
⊥ ⊥
En outre, toute isométrie W → V 0 se prolonge en une isométrie P1 ⊕ · · · ⊕ Pr → V 0 .

Démonstration. — Le cas r = 1 est le lemme 4.7. On raisonne ensuite par récurrence sur
r . Posons W1 = 〈e 2 , . . . , e r 〉.
L’hyperplan e 1⊥ contient e 1 et W1 ; soit V1 un supplémentaire de e 1 dans e 1⊥ contenant
W1 . La restriction de B à V1 est non dégénérée ; on applique l’hypothèse de récurrence à
son sous-espace totalement isotrope W1 et il existe donc des plans hyperboliques P2 , . . . , Pr
⊥ ⊥
dans V1 avec les propriétés du lemme. La somme directe P2 ⊕ · · · ⊕ Pr est alors orthogonale
à e 1 et la restriction de B y est non dégénérée. Son orthogonal contient donc e 1 et la res-
triction de B y est aussi non dégénérée. On peut y appliquer le lemme 4.7 au vecteur e 1 : il
⊥ ⊥
existe e 10 orthogonal à P2 ⊕ · · · ⊕ Pr et formant avec e 1 un plan hyperbolique.
5. THÉORÈME DE WITT 57

L’extension d’une isométrie u : W → V 0 se montre en étendant im(u) dans V 0 de la même


manière que W : comme B est non dégénérée, u est injective et u(W) = 〈u(e 1 ), . . . , u(e r )〉
est un sous-espace totalement isotrope de V 0 ; on construit alors des plans hyperboliques
〈u(e i ), e i00 〉 et on prolonge u en envoyant chaque e i0 sur e i00 .

Démonstration du th. 5.1. — On commence par étendre u à un sous-espace W̄ de V


contenant W sur laquelle la forme B est non dégénérée.
Soit W 0 un supplémentaire de W ∩ W ⊥ dans W. La restriction de B à W 0 est non dé-
générée, donc aussi la restriction de B à W 0⊥ . Ce dernier espace contient le sous-espace
vectoriel totalement isotrope W ∩ W ⊥ . Par le lemme 5.4, on peut donc étendre u|W 0⊥ à un
sous-espace hyperbolique H de W 0⊥ (sur laquelle B est non dégénérée). On a ainsi étendu

u en ū au sous-espace W̄ := H ⊕ W 0 , sur lequel B est non dégénérée. Remarquons que la
restriction de B0 à u(W̄) est aussi non dégénérée.
Si B est alternée, les restrictions (non dégénérées) de B à W̄ ⊥ et de B0 à ū(W̄)⊥ sont
équivalentes (à isométrie près, il n’y a qu’une seule forme alternée non dégénérée sur un

espace vectoriel de dimension paire). On a ainsi étendu u à W̄ ⊕ W̄ ⊥ = V.
Supposons donc B symétrique. De plus, comme (V, B) et (V 0 , B0 ) sont isométriques, on
peut les supposer égaux. Le cas dim(W̄) = 1 est alors fourni par le lemme 5.3.

On raisonne alors par récurrence sur dim(W̄). Si dim(W̄) Ê 2, on écrit W̄ = W1 ⊕ W2 ,
avec W1 et W2 non nuls, où la restriction de B à W1 et à W2 est non dégénérée (cf. § 4.2).
Par l’hypothèse de récurrence, u|W1 se prolonge en une isométrie v 1 de V, qui induit par

restriction une isométrie v 1 |W ⊥ : W1⊥ → u(W1 )⊥ . On applique alors à nouveau l’hypothèse
1

de récurrence à u|W2 : W2 → u(W1 )⊥ pour le prolonger en une isométrie v 2 : W1⊥ → u(W1 )⊥ .
On prend alors v = u|W1 ⊕ v 2 : W1 ⊕ W1⊥ → u(W1 ) ⊕ u(W1 )⊥ .

Corollaire 5.5. — 1° Si W et W 0 sont des sous-espaces isométriques de V, les sous-espaces


W ⊥ et W 0⊥ sont isométriques.
2° Tous les sous-espaces totalement isotropes maximaux ont même dimension ν, appelée
l’indice de B.
3° Tous les sous-espaces hyperboliques maximaux ont même dimension 2ν.

4° Si H est un sous-espace hyperbolique maximal, on peut écrire V = H ⊕ W, avec W sans
vecteur isotrope non nul (W est anisotrope).

On notera qu’au vu de 3°, on a ν É 21 dim(V).


D’autre part, dans le cas alterné, le corollaire résulte de la classification des formes al-
ternées non dégénéréees ; on a ν = 12 dim(V) et l’espace anisotrope W du 4° est nul.

Démonstration. — Le 1° résulte du théorème de Witt.


On prouve le 2°. Si W et W 0 sont totalement isotropes et dim(W) É dim(W 0 ), n’importe
quelle application linéaire injective u : W → W 0 est une isométrie, donc s’étend en une
isométrie v de V. Alors W est contenu dans v −1 (W 0 ), qui est aussi totalement isotrope. Il en
résulte que tous les sous-espaces totalement isotropes maximaux ont même dimension.
Tout sous-espace hyperbolique contient un sous-espace totalement isotrope de di-
mension moitié, et inversement, comme on l’a vu dans le lemme 5.4, tout sous-espace
58 CHAPITRE II. GROUPES CLASSIQUES

totalement isotrope est contenu dans un sous-espace hyperbolique de dimension double.


Le 3° résulte donc du 2°.
Le 4° a déjà été vu dans le § 4.3.

Exemples 5.6. — 1° Si K est un corps quadratiquement clos, une forme quadratique non
dégénérée de dimension n est d’indice bn/2c (ex. 4.8.1°).
2° Dans le cas d’une forme quadratique non dégénérée sur Rn , de signature (s, t = n−s),
on voit que l’indice est inf(s, t ) (ex. 4.8.2°), donc la signature est bien un invariant de la
forme quadratique.
3° Dans le cas d’un corps fini Fq (de caractéristique différente de 2), rappelons que les
formes quadratiques sont de deux types :
〈1, . . . , 1〉 et 〈1, . . . , 1, α〉,
avec α ∉ F2q . D’autre part, toute forme quadratique sur un espace de dimension Ê 3 admet
un vecteur isotrope non nul (cela résulte de la démonstration de la prop. 4.4). L’espace F
du cor. 5.5 est donc de dimension É 2.
En dimension 2,
– la forme 〈1, −1〉 a un vecteur isotrope non nul, (1, 1) ;
– la forme 〈1, −α〉 n’a pas de vecteur isotrope non nul.
Si la dimension de l’espace est 2m + 1, impaire, W est de dimension 1 et l’indice de la
forme quadratique est m. On rappelle qu’on a un seul groupe orthogonal, noté O(2m +
1, Fq ).
Si la dimension de l’espace est 2m, paire, soit W = 0 et l’indice de la forme quadratique
est m, soit W est de type 〈1, −α〉 et l’indice est m − 1. On a déjà noté les groupes ortho-
gonaux correspondants O+ (2m, Fq ) et O− (2m, Fq ), respectivement (cf. note 10 ; la forme
quadratique 〈1, −1, . . . , 1, −1〉 étant visiblement d’indice m, on voit que le discriminant as-
socié est bien (−1)m ).

Exercice 5.7. — Soit q une puissance de nombre premier impair et soit f une forme quadra-
tique non dégénérée sur Fn
q . Calculer le cardinal de l’ensemble

{x ∈ Fn
q | f (x) = 1}
(Indication : on distinguera plusieurs cas selon le discriminant de f et la parité de n).

6. Groupe de Witt
Soit K un corps. On considère l’ensemble des classes d’équivalence (ou d’isométrie)
de K-espaces vectoriels munis d’une forme quadratique non dégénérée. Cette ensemble
est muni d’une addition (commutative et associative) correspondant à la somme directe
orthogonale et l’élément neutre correspond à la forme quadratique nulle sur l’espace vec-
toriel nul. Le 1° du cor. 5.5 dit exactement que l’addition est simplifiable :
[ f ] + [g ] = [ f 0 ] + [g ] =⇒ [ f ] = [ f 0 ].
C’est un semi-groupe mais ce n’est pas un groupe, puisque dim([ f ] + [g ]) = dim([ f ]) +
dim([g ]), donc [ f ] + [g ] n’est nul que si [ f ] et [g ] le sont. De la même façon qu’on passe
du semi-groupe simplifiant N au groupe Z, on associe à cette situation le groupe de
6. GROUPE DE WITT 59

Grothendieck-Witt GW(K) de K : c’est l’ensemble des couples ([ f 1 ], [ f 2 ]) (auquel il faut


penser comme la différence formelle [ f 1 ] − [ f 2 ]) modulo la relation déquivalence
([ f 1 ], [ f 2 ]) ∼ ([g 1 ], [g 2 ]) =⇒ [ f 1 ] + [g 2 ] = [ f 2 ] + [g 1 ].
On vérifie que GW(K) est bien un groupe, muni de morphismes de groupes surjectifs
dim : GW(K)  Z disc : GW(K)  K× /K×2 .
Notons par ailleurs la relation [ f ] + [− f ] = dim( f )[P], où − f est la forme quadratique op-
posée à f (sur le même espace vectoriel) et P est un plan hyperbolique.
On définit le groupe de Witt W(K) de K comme le quotient de GW(K) par le sous-groupe
Z[P] engendré par [P]. C’est encore un groupe abélien dans lequel l’opposé de [ f ] est [− f ].
En utilisant lécriture diagonale des formes quadratiques, on a les relations suivantes dans
W(K) :
[〈ασ(1) , . . . , ασ(m) 〉] = [〈α1 , . . . , αm 〉] pour tout σ ∈ Sm ,
[〈α1 , . . . , αm 〉] + [〈β1 , . . . , βn 〉] = [〈α1 , . . . , αm , β1 , . . . , βn 〉],
−[〈α1 , . . . , αm 〉] = [〈−α1 , . . . , −αm 〉],
[〈α, −α〉] = 0.
On a un morphisme
dim : W(K)  Z/2Z
mais le discriminant ne passe pas au quotient puisque disc(P) = −1.
Le 1° du cor. 5.5 dit que les éléments de W(K) peuvent être représentés par des formes
quadratiques anisotropes. On a plus précisément
W(K) = {classes d’isométrie de formes quadratiques anisotropes}.
En effet, si des formes quadratiques anisotropes f 1 et f 2 ont même image dans W(K), il
⊥ ⊥
existe des entiers positifs n 1 et n 2 tels que f 1 ⊕ P n1 ∼ f 2 ⊕ P n2 . Le cor. 5.5 entraîne que f 1 et
f 2 sont isométriques.

Exemples 6.1. — 1° Si K est un corps quadratiquement clos, dim : W(K)  Z/2Z est un
isomorphisme (ex. 5.6.1°).
2° Si −1 est un carré dans K, on a [ f ] = [− f ] pour tout forme quadratique f , donc tout
élément de W(K) est d’ordre 2.
3° Toute forme quadratique réelle anisotrope est isométrique à ±〈1, . . . , 1〉. On a donc

W(R) ' Z. On peut en déduire un isomorphisme dim ⊕s : GW(R) → Z ⊕ Z, où s est le mor-
phisme signature, défini par s([〈1〉]) = 1.
4° Dans le cas d’un corps fini Fq (de caractéristique différente de 2), on a
(
Z/2Z ⊕ Z/2Z si − 1 ∈ K2 ,
W(K) '
Z/4Z si − 1 ∉ K2 .

En effet, si on note comme d’habitude α un élément de Fq F2q , il y a 4 (classes d’iso-


métrie de) formes quadratiques anisotropes : 0, 〈1〉, 〈α〉 et 〈1, −α〉. Le groupe W(Fq ) a
donc 4 éléments, et il est isomorphe soit à Z/4Z, soit à (Z/2Z)2 . Si −1 est un carré dans
Fq , on est dans le second cas par 2°. Dans le cas contraire, on peut prendre α = −1 et
60 CHAPITRE II. GROUPES CLASSIQUES

[〈1〉] + [〈1〉] = [〈1, 1〉] = [〈1, −α〉] ; on est donc dans le premier cas : W(Fq ) est isomorphe à
Z/4Z, avec comme générateur [〈1〉].
5° Le groupe W(Q) est connu. Il contient le groupe cyclique Z engendré par 1W(Q) , et le
L
quotient est p premier W(Fp ).
Remarque 6.2 (Idéal fondamental et conjecture de Milnor). — On peut aussi mettre sur
W(K) une structure d’anneau en définissant une forme quadratique sur le produit tenso-
riel (exerc. III.1.8) de deux espaces munis d’une forme quadratique. Cela revient à poser
[〈α1 , . . . , αm 〉] · [〈β1 , . . . , βn 〉] = [〈αi β j , 1 É i É m, 1 É j É n〉].
Le morphisme dim : W(K)  Z/2Z est alors un morphisme d’anneaux et on appelle son
noyau I(K) l’idéal fondamental de W(K). Un élément de I(K) est donc représenté par une
forme quadratique sur un espace vectoriel de dimension paire. Le morphisme discrimi-
nant signé est défini ainsi :
discs : I(K) −→ K× /K×2
[f ] 7−→ (−1)dim( f )/2 disc( f ).

On montre qu’il induit un isomorphisme I(K)/I(K)2 → K× /K×2 .
La conjecture de Milnor, montrée par Voevodsky en 1996 (démonstration pour laquelle
il a obtenu la médaille Fields en 2002) identifie tous les quotients successifs I(K)r /I(K)r +1
en termes de groupes dits de K-théorie de Milnor.

7. Groupe symplectique
Dans cette section, le K-espace vectoriel V, de dimension finie paire 2ν, est muni d’une
forme alternée non dégénérée (on dit aussi forme symplectique) B et on étudie le groupe
symplectique Sp(V, B).
On rappelle que V est somme directe orthogonale de ν plans hyperboliques.

7.1. Générateurs. — Soit une transvection τ(x) = x + `(x)a, où ` ∈ V ∗ et a ∈ ker(`) (cf.


§ 2.4). On a
B(τ(x), τ(y)) = B(x + `(x)a, y + `(y)a)
= B(x, y) + `(y)B(x, a) + `(x)B(a, y).
Si on prend pour ` une forme linéaire λB(a, ·), la transvection τ est symplectique ; toutes
les transvections de la forme
τ(x) = x + λB(a, x)a, a ∈ V, λ ∈ K (18)
sont donc symplectiques.
Remarquons que si dim(V) = 2, dans une base hyperbolique de V, on a B((x 1 , x 2 ), (y 1 , y 2 )) =
x 1 y 2 − x 2 y 1 . Un morphisme u de V multiplie B par dét(u), d’où il résulte (comme on peut
aussi le voir sur les équations (17))
Sp(2, K) = SL(2, K). (19)
En dimension 2, toutes les transvections sont symplectiques.
Théorème 7.1. — Les transvections symplectiques engendrent Sp(V).
7. GROUPE SYMPLECTIQUE 61

Corollaire 7.2. — Le groupe symplectique Sp(V) est un sous-groupe de SL(V).


On verra dans le cor. III.4.8 une autre démonstration de ce corollaire.
Démonstration. — Les transvections ont déterminant 1.
Démonstration du théorème. — La démonstration se fait par récurrence sur la dimen-
sion, en commencant par la dimension 0 ( !).
Si V 6= 0, il contient un plan hyperbolique P = 〈x 1 , x 2 〉. Soit u ∈ Sp(V). Alors Q := u(P) =
〈u(x 1 ), u(x 2 )〉 est aussi un plan hyperbolique. Si on admet (provisoirement) le lemme ci-
dessous, il existe un produit v de transpositions symplectiques tel que v(x 1 ) = u(x 1 ) et
v(x 2 ) = u(x 2 ). La composée v −1 u est alors l’identité sur P, donc laisse stable son ortho-
gonal P ⊥ . Sa restriction à P ⊥ en est un automorphisme symplectique, qui est donc, par
hypothèse de récurrence, produit de transvections symplectiques de P ⊥ . Prolongées par
l’identité sur P, ces transvections symplectiques deviennent des transvections symplec-
tiques de V, dont le produit est v −1 u. Ainsi, u est bien produit de transvections symplec-
tiques de V.
Lemme 7.3. — Si P = 〈x 1 , x 2 〉 et Q = 〈y 1 , y 2 〉 sont des plans hyperboliques (avec B(x 1 , x 2 ) =
B(y 1 , y 2 ) = 1), il existe un produit d’au plus 4 transvections symplectiques envoyant x 1 sur
y 1 et x 2 sur y 2 .
Démonstration. — Observons que si B(x 1 , y 1 ) 6= 0, on peut envoyer x 1 sur y 1 par la trans-
vection symplectique
B(y 1 − x 1 , x)
τ(x) = x − (y 1 − x 1 ).
B(x 1 , y 1 )
Dans le cas général, en passant par un z tel que B(x 1 , z) 6= 0 et B(z, y 1 ) 6= 0 (qui existe parce
que V n’est pas réunion des hyperplans x 1⊥ et y 1⊥ !), on voit qu’un produit de 2 transvections
symplectiques envoie x 1 sur y 1 .
On est ainsi ramené au cas x 1 = y 1 et on veut donc envoyer x 2 sur y 2 en laissant x 1 fixe.
À nouveau, la situation est plus simple si B(x 2 , y 2 ) 6= 0 : la transvection
B(y 2 − x 2 , x)
τ(x) = x − (y 2 − x 2 )
B(x 2 , y 2 )
convient alors, car B(y 2 − x 2 , x 1 ) = B(y 2 , y 1 ) − B(x 2 , x 1 ) = 0. Si B(x 2 , y 2 ) = 0, il faut à nouveau
passer par un intermédiaire z tel que B(x 2 , z) 6= 0, B(z, y 2 ) 6= 0, mais aussi (pour fixer x 1 ),
B(z − x 2 , x 1 ) = 0 et B(y 2 − z, x 1 ) = 0, ce qui revient à B(x 1 , z) = 1. Mais z = x 1 + y 2 satisfait
toutes ces conditions.
On déduit d’ailleurs de ce lemme que toute isométrie d’un espace symplectique de di-
mension 2ν est produit d’au plus 4ν transvections symplectiques.
Remarque 7.4. — On peut montrer (13) que le groupe Sp(2ν, K) est engendré par les ma-
trices par blocs (cf. (17))
Iν α(Ei j + E j i ) Iν + αEi j
µ ¶ µ ¶
0
et , pour 1 É i , j É ν, α ∈ K,
0 Iν 0 Iν − αE j i

13. O’Meara, O. T., Symplectic Groups, Mathematical Surveys 16, American Mathematical Society, Providence,
R.I., 1978.
62 CHAPITRE II. GROUPES CLASSIQUES

et leur transposée (14) .

Exercice 7.5. — Montrer que Sp(2ν, R) est connexe.

Exercice 7.6. — Montrer que Sp(2ν, Q) est dense dans Sp(2ν, R).

7.2. Centre. — Soit u une isométrie commutant avec toute isométrie. Elle commute en
particulier avec toutes les transvections symplectiques, de sorte que, pour tout a ∈ V et
tout x ∈ V, on a
u(x) + B(a, u(x))a = τ(u(x)) = u(τ(x)) = u(x) + B(a, x)u(a).
Étant donné a 6= 0, on peut choisir x de façon que B(a, x) 6= 0 et on en déduit que u(a) est
proportionnel à a pour tout a ∈ V. L’automorphisme u est alors une homothétie (cf. note
1), de rapport λ. Comme il est symplectique, on a λ = ±1.
Le centre de Sp(2ν, K) est donc réduit à {±I2ν }. On considère le groupe projectif associé,
à savoir le quotient
PSp(2ν, K) = Sp(2ν, K)/{±I2ν }.
C’est un sous-groupe de PSL(2ν, K) ; il agit donc fidèlement sur l’espace projectif P2ν−1 (K).

Exemples 7.7. — 1° Les groupes Sp(2ν, R) et PSp(2ν, R)) sont des variétés différentiables
de dimension ν(2ν + 1).
2° Les groupes Sp(2ν, C) et PSp(2ν, C)) sont des variétés complexes de dimension ν(2ν+
1).

7.3. Cardinal des groupes symplectiques finis.— On suppose q impair (cf. rem. 7.11 pour
le cas de la caractéristique 2). Comme pour les groupes linéaires, il est facile de dénombrer
les éléments de Sp(2ν, Fq ) : il suffit de compter le nombre de bases hyperboliques. On
obtient
(q 2ν − q 2ν−1 ) 2ν−2 (q 2ν−2 − q 2ν−3 ) (q 2 − q)
| Sp(2ν, Fq )| = (q 2ν − 1) (q − 1) · · · (q 2 − 1)
q −1 q −1 q −1
= q 2ν−1+2ν−3+···+1 (q 2ν − 1)(q 2ν−2 − 1) · · · (q 2 − 1)
2
= q ν (q 2ν − 1)(q 2ν−2 − 1) · · · (q 2 − 1), (20)
1
| PSp(2ν, Fq )| = | PSp(2ν, Fq )|
2
1 ν2 2ν
= q (q − 1)(q 2ν−2 − 1) · · · (q 2 − 1).
2
On rappelle (cf. (19)) que le groupe Sp(2, Fq ) est le même que le groupe SL(2, Fq ).

Exercice 7.8 (p-sous-groupes de Sylow de Sp(2ν, Fq )). — L’espace vectoriel F2ν


q est muni de
³ ´
0 Iν
la forme symplectique de matrice J2ν = −I 0 dans la base canonique (cf. (15)).
ν

14. Le groupe Sp(2ν, Z), qu’on peut définir comme le sous-groupe de Sp(2ν, Q) formé des matrices à coeffi-
cients entiers, est engendré, pour ν Ê 2, par quatre matrices explicites (Hua, L. K., Reiner, I., On the generators of
the symplectic modular group, Trans. Amer. Math. Soc. 65 (1949), 415–426).
7. GROUPE SYMPLECTIQUE 63

Soit W ⊆ F2ν
q le sous-espace vectoriel engendré par les ν premiers vecteurs de la base ca-
nonique. On considère le sous-groupe
H := {u ∈ Sp(2ν, Fq ) | u(W) = W}.
a) Montrer que la restriction à W induit un morphisme surjectif φ : H  GL(W) = GL(ν, Fq )
(Indication : on pourra utiliser les relations (17)).
b) Montrer que le noyau de φ est isomorphe au groupe additif des matrices symétriques ν × ν
(Indication : on pourra utiliser les relations (17)).
c) En déduire que S := φ−1 (TU(ν, Fq )) est un p-sous-groupe de Sylow de Sp(2ν, Fq ) (cf. exerc.
I.2.13 pour la définition du p-sous-groupe de Sylow TU(ν, Fq ) de GL(ν, Fq )). Donner une des-
cription matricielle de S en utilisant les relations (17).

7.4. Groupe dérivé. — On rappelle que le groupe dérivé D(G) d’un groupe G est le sous-
groupe de G engendré par les commutateurs de G.
Théorème 7.9. — On suppose car(K) 6= 2 et ν Ê 2. On a D(Sp(2ν, K)) = Sp(2ν, K).
Démonstration. — Par le th. 7.1, il suffit de montrer que toute transvection symplectique
peut s’écrire comme un commutateur. Soit τ(x) = x+λB(e, x)e, avec e ∈ V et λ ∈ K, une telle
transvection. Le vecteur e est contenu dans un plan hyperbolique P = 〈e, f 〉 (lemme 4.7) et,
⊥ ⊥
comme ν Ê 2, on peut écrire V = P ⊕ Q ⊕ W, où Q = 〈e 0 , f 0 〉 est aussi un plan hyperbolique.
Dans une base de V obtenue µ en complétant
¶ (e, e 0 , f , f 0 ) par une base de W, la transvection
N(λ) 0
τ a pour matrice par blocs , où
0 I2ν−4
1 0 λ 0
 
0 1 0 0
N(λ) := 0 0 1 0 .

0 0 0 1
Il suffit donc d’exprimer la matrice N(τ) comme commutateurs d’éléments de Sp(4, K).
D’après (17), les matrices
µ ¶ µ ¶
A1 0 I2 A2
U1 = , U2 =
0 t A−1
1 0 I2
sont symplectiques, pourvu que A2 soit symétrique. Si on prend
µ ¶ µ ¶
1 1 1 0 1
A1 = , A2 = λ ,
0 1 2 1 0
on vérifie l’égalité U1 U2 U1−1 U2−1 = N(λ), ce qui termine la démonstration.

Simplicité. — La simplicité des groupes projectifs symplectiques finis fournit une nou-
velle liste infinie de groupes finis simples.
Théorème 7.10. — On suppose car(K) 6= 2 et ν Ê 2. Le groupe PSp(2ν, K) est simple.
Démonstration. — Ce théorème se déduit du th. 7.9, comme dans le cas des groupes PSL,
par la méthode d’Iwasawa, en considérant l’action fidèle et transitive du groupe sur l’es-
pace projectif X := P2ν−1 (K). Nous disposons en effet pour chaque droite x ∈ X du groupe
abélien (isomorphe à K) des transvections symplectiques de droite x, et la seule hypothèse
64 CHAPITRE II. GROUPES CLASSIQUES

restant à vérifier pour appliquer le th. 2.16 est que l’action est primitive, c’est-à-dire que
les stabilisateurs sont des sous-groupes maximaux.
L’action de Sp(2ν, K) sur X est transitive : étant deux droites vectorielles de V, il existe
par le théorème de Witt une isométrie qui envoie l’une sur l’autre (cf. aussi la preuve du
lemme 7.3). Mais cette action n’est pas 2-transitive : l’action diagonale de G := Sp(2ν, K)
sur {(x, y) ∈ X × X | x 6= y} a deux orbites :
– l’orbite O1 des couples de droites (x, y) engendrant un plan hyperbolique ;
– l’orbite O2 des couples de droites (x, y) engendrant un plan totalement isotrope.
En effet, la restriction de la forme symplectique B à un plan est soit hyperbolique, soit
nulle. Par le théorème de Witt, étant donnés deux plans dans V du même type, il existe
une isométrie de V envoyant l’un sur l’autre.
Pour montrer que l’action est primitive, on doit donc revenir à la définition et montrer
que le stabilisateur Gx d’un point x ∈ X est maximal. Supposons donc Gx < H ≤ G. On doit
montrer H = G.
On rappelle que Hx := {hx | h ∈ H} ⊆ X est l’orbite de x sous l’action induite de H ;
comme Gx 6= H, elle n’est pas réduite à {x}. Regardons les sous-ensembles g Hx de X
lorsque g décrit G (parmi eux, on trouve l’orbite Hx).
S S
Tout d’abord, leur réunion g ∈G g Hx contient g ∈G g x, qui n’est autre que l’orbite de
x ; c’est donc bien X tout entier puisque l’action de G sur X est transitive.
Ensuite, si g Hx ∩ g 0 Hx 6= ;, il existe h, h 0 ∈ H tels que g hx = g 0 h 0 x, donc h −1 g −1 g 0 h 0 ∈
Gx donc g −1 g 0 ∈ H, ce qui implique g Hx = g 0 Hx. Ainsi les (g Hx)g ∈G distincts réalisent une
partition de X.
Posons
Γ := {(y, z) ∈ X × X | y 6= z, y et z sont dans le même g Hx}.
Comme Hx 6= {x}, l’ensemble Γ n’est pas vide.
Si (y, z) ∈ Γ, on a y, z ∈ g 0 Hx pour un certain g 0 ∈ G et pour tout g ∈ G, g y et g z sont
dans g g 0 Hx. En d’autres termes, Γ est stable par l’action diagonale de G, donc c’est une
réunion d’orbites. Mais il n’y a que deux orbites.
Si Γ = O1 , on a, pour tout y 6= z,
y et z sont dans le même g Hx ⇐⇒ y et z engendrent un plan hyperbolique
Mais pour toutes droites distinctes y et z, il existe t ∈ X qui n’est orthogonal ni à y ni à z
(tout simplement parce que V ne peut être la réunion des deux hyperplans y ⊥ et z ⊥ ). Les
droites y et t engendrent alors un plan hyperbolique, donc y et t sont dans le même g Hx ;
mais de même, les droites z et t engendrent alors un plan hyperbolique, donc z et t sont
dans le même g Hx. On en déduit que y et z sont dans le même g Hx. Comme y et z sont
quelconques distinctes, cela contredit Γ = O1 .
On écarte de façon similaire le cas Γ = O2 . On a donc Γ = O1 t O2 : toutes droites dis-
tinctes y et z sont dans le même g Hx. En particulier, tout y 6= x est dans Hx. Pour tout
g 0 ∈ G, ou bien g 0 x = x et g ∈ Gx ⊆ H, ou bien y := g 0 x 6= x et il existe h ∈ H tel que g 0 x = hx,
soit h −1 g 0 ∈ Gx ⊆ H. On en déduit g 0 ∈ H et H = G.
On a donc montré que les stabilisateurs sont des sous-groupes maximaux de G. L’action
de G = Sp(2ν, K) sur X = P2ν−1 (K) est primitive. Comme elle est aussi fidèle, le th. 7.9 dit
alors que tout sous-groupe distingué non trivial de Sp(2ν, K) contient D(Sp(2ν, K)). Par le
th. 7.9, il est donc égal à Sp(2ν, K), qui est ainsi un groupe simple.
8. GROUPE ORTHOGONAL 65

Remarque 7.11 (Cas de la caractéristique 2). — Pour tout corps K, on peut toujours dé-
finir un groupe comme en (16) par
Sp(2ν, K) := {U ∈ GL(2ν, K) | t UJ2ν U = J2ν }.
Beaucoup des résultats démontrés plus haut lorsque car(K) 6= 2 restent vrais en caractéris-
tique 2. On en particulier :
• Sp(2, K) ' SL(2, K) ;
• Sp(2ν, K) ≤ SL(2ν, K) ;
• Z(Sp(2ν, K)) = {±I2ν } (le centre est donc trivial en caractéristique 2) ;
• | Sp(2ν, Fq )| est donné par la formule (20) et, en caractéristique 2, PSp(2ν, Fq ) =
Sp(2ν, Fq ) ;
• pour ν Ê 2, on a D(Sp(2ν, K)) = Sp(2ν, K) et PSp(2ν, K) est simple, sauf pour Sp(4, F2 ) =
PSp(4, F2 ) ' S6 , dont le groupe dérivé est A6 (prop. I.5.8).

On obtient donc une quatrième série de groupes finis simples PSp(2ν, Fq ) (15) .

8. Groupe orthogonal
On étudie ici quelques propriétés de base du groupe orthogonal. La situation est beau-
coup plus compliquée que dans le cas symplectique, vu qu’il peut y avoir beaucoup de
formes quadratiques non équivalentes sur un même espace vectoriel.

8.1. La dimension 2. — Si dim(V) = 2, à une constante multiplicative près (ce qui ne


change pas le groupe orthogonal associé), toute forme quadratique s’écrit
f (x) = x 12 + αx 22 .
Il y a deux cas, suivant que −α est un carré ou non dans K.
Cas où −α est un carré. La forme f admet alors des vecteurs isotropes non nuls et V est
un plan hyperbolique pour f : il existe une base (e 1 , e 2 ) de V dans laquelle
f (x 1 , x 2 ) = 2x 1 x 2 .
Les droites engendrées par e 1 et e 2 étant les seules directions isotropes, elles sont ou bien
préservées, ou bien échangées par un élément du groupe orthogonal µ f ). −1
O(V, On¶ en déduit
λ 0 λ
µ ¶
0
que les éléments de O(V, f ) sont de la forme Rλ := ou S λ := , pour λ ∈
0 λ−1 λ 0
K× . On a donc
SO(V, f ) ' {Rλ | λ ∈ K× },
O(V, f ) ' {Rλ , S λ | λ ∈ K× } = SO(V, f ) t S 1 · SO(V, f ).
Les transformations S λ de O(V, f ) SO(V, f ) sont toutes des réflexions (par rapport à la
droite engendrée par e 1 + λe 2 ). Le groupe SO(V, f ) est abélien. Comme
S 1 Rλ S −1
1 = Rλ−1 ,

15. Pour des raisons que vous comprendrez plus tard, ce groupe est aussi noté Cν (q), pour ν Ê 2.
66 CHAPITRE II. GROUPES CLASSIQUES

le groupe O(V, f ) n’est pas abélien, sauf si K = F3 (dans ce cas, c’est {I2 , −I2 , S 1 , −S 1 }, iso-
morphe à (Z/2Z)2 ).

Exemples 8.1. — 1° Lorsque K est quadratiquement clos, on est toujours dans ce cas.
2° Lorsque K = R, on est dans ce cas uniquement lorsque la signature est (1, 1). On a
donc SO(1, 1) ' R× . Dans une base orthogonale, où la forme quadratique est donnée par
x 12 − x 22 , on vérifie que les isométries directes ont pour matrice

p 2 p−β 2
 1 
 1−β 1−β 
.
p−β 2 p 1 2
1−β 1−β

Le facteur p 1 est celui qui intervient dans les formules de Lorentz en relativité (la vi-
1−β2
tesse de la lumière est ici égale à 1 ; voir exerc. 11.7).
3° Lorsque K = Fq , on est dans ce cas pour la forme 〈1, −1〉. Avec les notations de la note
10 et de l’ex. 5.6.3°, on a SO+ (2, Fq ) ' F× +
q , cyclique d’ordre q − 1. On vérifie que O (2, Fq )
est isomorphe au groupe diédral Dq−1 (cf. ex. I.1.4.4°).

Cas où −α n’est pas un carré. La forme f est alors anisotrope et on vérifie par un calcul
direct qu’on a
µ ¶
n a −cα ¯¯ 2 o
SO(V, f ) ' R a,c := a + c 2α = 1 ,
c a
µ ¶
n a cα ¯¯ 2 o
O(V, f ) ' R a,c , S a,c := a + c 2α = 1
c −a
= SO(V, f ) t S 1,0 · SO(V, f ).
À nouveau, le groupe SO(V, f ) est abélien et O(V, f ) SO(V, f ) est constitué de ré-
flexions (16) . On vérifie que le centre de O(V, f ) est {± IdV }.

Exemples 8.2. — 1° Lorsque K = R, on est dans ce cas uniquement lorsque la signature


est (2, 0) (forme définie positive) ou (0, 2) (forme définie négative) ; les deux cas donnent le
même groupe spécial orthogonal SO(2, R), qui est donc isomorphe au groupe multiplicatif
des nombres complexes de module 1 (cf. note 16). On retrouve la description usuelle du
groupe des isométries du plan euclidien.
p
2° Lorsque K = Fq , avec les notations des notes 10 et 16 et de l’ex. 5.6.3°, le corps F[ −α]
est Fq 2 , la conjugaison est x 7→ x q (cf. 9.1), donc N(x) = x q+1 et le groupe SO− (2, Fq ) est
isomorphe au groupe multiplicatif {x ∈ F× q2
| x q+1 = 1}, cyclique d’ordre q + 1 (cf. (22)). De
plus, comme S 1,0 R a,c S −1 −1 −
1,0 = R a,−c = R a,c , on voit que le groupe O (2, Fq ) est isomorphe au
groupe diédral Dq+1 (cf. ex. I.1.4.4°).

p p p
16. Le groupe O(V, f ) s’interprète en terme du corps K[ −α] = {a + c −α | a, c ∈ K}. Si x = a + c −α, son
p p
« conjugué » est x̄ = a − c −α et le morphisme « norme » N : K[ −α] → K défini par N(x) = x x̄ vérifie N(x y) =
p
N(x)N(y). Le groupe SO(V, f ) est alors le groupe des éléments de K[ −α] de norme 1 et O(V, f ) est engendré par
SO(V, f ) et la conjugaison. Dans le cas K = R, ce corps est C, la conjugaison est la conjugaison complexe et le
groupe des éléments de norme 1 est le groupe des complexes de module 1.
8. GROUPE ORTHOGONAL 67

8.2. Centre et générateurs. — Rappelons que si D est une droite non isotrope, on dis-
pose d’une symétrie orthogonale (réflexion) s D (de déterminant −1) par rapport à D⊥ . De
même, si P est un plan sur lequel la forme quadratique est non dégénérée, on a V = P ⊕ P ⊥
et le renversement r P par rapport à P ⊥ , défini par r P = (−1)⊕1, est aussi une transformation
orthogonale, élément de SO(V, f ).
Si u ∈ O(V, f ), on vérifie qu’on a us D u −1 = s u(D) et ur P u −1 = r u(P) .
Proposition 8.3. — Le centre de O(V, f ) est {± IdV }, sauf si K = F3 et V est un plan hyperbo-
lique (17) .
Si dim(V) Ê 3, le centre de SO(V, f ) est trivial si dim(V) est impair, {± IdV } si dim(V) est
pair.
Démonstration. — Si dim(V) = 2, la description explicite de O(V, f ) vue au § 8.1 donne le
résultat. On suppose donc dim(V) Ê 3.
Si u ∈ O(V, f ) commute aux éléments de SO(V, f ), on a r u(P) = ur P u −1 = r P pour tout
plan hyperbolique P, donc u(P) = P et u préserve les plans sur lesquels la forme f est non
dégénérée.
Montrons que toute droite D = Kx est intersection de deux plans P et Q de ce type.

Si D est non isotrope, on a V = D ⊕ D⊥ , donc en prenant deux éléments distincts y et z

d’une base orthogonale de D⊥ (ce qui est possible puisque dim(V) Ê 3), les plans P = D⊕Ky

et Q = D ⊕Kz conviennent. Si D est isotrope, on inclut D dans un plan hyperbolique P (sur

lequel f est non dégénérée) et on complète x en une base (x, y) de P. Puisque V = P ⊕ P ⊥
et que dim(V) Ê 3, on peut choisir z ∈ P ⊥ non nul. Alors on peut prendre Q = D ⊕ K(y + z).
Il s’ensuite que si u ∈ O(V, f ) commute à tous les éléments de SO(V, f ), il préserve toutes
les droites ; c’est donc une homothétie (cf. note 1). Cela termine la preuve.
Le quotient de SO(V, f ) par son centre est le groupe projectif orthogonal
PSO(V, f ) := SO(V, f )/Z(SO(V, f )).
C’est un sous-groupe de PSL(V) ; il opère donc fidèlement sur l’espace projectif P(V). On
définit de la même façon le sous-groupe PO(V, f ) ≤ PGL(V).
Exemples 8.4. — 1° Les groupes O(s, n − s), SO(s, n − s) et PSO(s, n − s) sont des variétés
différentiables de dimension n(n−1)/2. Leur nature topologique est différente : pour n Ê 2,
parmi les groupes SO, seul SO(n) est compact, et seul SO(n) est connexe (cf. ex. 8.10.3°,
exerc. 8.9 ; mais il n’est pas simplement connexe pour n Ê 2 (rem. 11.5)).
2° Les groupes O(n, C), SO(n, C) et PSO(n, C) sont des variétés complexes de dimension
n(n − 1)/2.
Théorème 8.5. — Les réflexions engendrent O(V, f ).
Démonstration. — On raisonne par récurrence sur la dimension. Soit u ∈ O(V, f ) et soit
x 1 ∈ V non isotrope ; on pose x 2 := u(x 1 ). Puisque f (x 1 + x 2 ) + f (x 1 − x 2 ) = 4 f (x 1 ) 6= 0, l’un
au moins des éléments x 1 − x 2 ou x 1 + x 2 est non isotrope :
– si x 1 − x 2 est non isotrope, s x1 −x2 (x 1 ) = x 2 , donc s x1 −x2 u(x 1 ) = x 1 ;

17. On a vu que dans ce cas, O(V, f ) est abélien de cardinal 4.


68 CHAPITRE II. GROUPES CLASSIQUES

– si x 1 + x 2 est non isotrope, s x2 s x1 +x2 (x 1 ) = s x2 (−x 2 ) = x 2 , donc s x1 +x2 s x2 u(x 1 ) = x 1 .


Dans les deux cas, on est ramené au cas où u fixe un vecteur non isotrope x 1 , et on ap-
plique l’hypothèse de récurrence dans x 1⊥ .

Remarque 8.6. — Cette démonstration montre que toute isométrie est produit d’au plus
2n réflexions (n = dim(V)). Le théorème de Cartan-Dieudonné affirme qu’il suffit d’au plus
n réflexions.

Théorème 8.7. — Si dim(V) Ê 3, les renversements engendrent SO(V, f ).

Démonstration. — Par le théorème précédent, tout élément de SO(V, f ) est produit d’un
nombre pair de réflexions. Il suffit donc de montrer qu’un produit s x1 s x2 de deux réflexions
est un produit de renversements.
Si dim(V) = 3, on a s x1 s x2 = (−s x1 )(−s x2 ) et l’opposé d’une réflexion est un renversement
(puisque la dimension de V est impaire), d’où le résultat.
Si dim(V) > 3, on peut supposer x 1 et x 2 non colinéaires (et toujours non isotropes).
Considérons le plan P := 〈x 1 , x 2 〉. On a dim(P ∩P ⊥ ) É 1. Si P ∩P ⊥ = {0}, on prend y ∈ P ⊥ non
isotrope et f est non dégénérée sur l’espace vectoriel W := 〈x 1 , x 2 , y〉. Si dim(P ∩ P ⊥ ) = 1,
on construit encore, comme dans le premier pas de la preuve du théorème de Witt (th.
5.1), un sous-espace W ⊇ P de dimension 3 sur lequel f est non dégénérée. Alors s x1 s x2
agit par l’identité sur W ⊥ . On est ainsi ramené au cas de la dimension 3 : sur W, l’isomé-
trie s x1 |W s x2 |W est le produit des renversements −s x1 |W et −s x2 |W ; on obtient alors s x1 s x2
comme produit de leurs extensions sur V par l’identité sur W ⊥ , qui sont encore des ren-
versements.

Exercice 8.8. — Montrer que O(n, Q) est dense dans O(n, R) et que SO(n, Q) est dense dans
SO(n, R) (Indication : on pourra utiliser le th. 8.5).

Exercice 8.9. — Lorsque n Ê 2, montrer que SO(n) est connexe et que O(n) a deux compo-
santes connexes (Indication : on pourra utiliser le th. 8.7).

8.3. Norme spinorielle et groupe dérivé. — La situation pour le groupe orthogonal est
beaucoup plus compliquée que pour le groupe symplectique et nous ne donnerons pas
toutes les démonstrations ni tous les détails. Une des raisons en est l’existence d’un mor-
phisme
θ : O(V, f ) → K× /K×2
appelé norme spinorielle, qui vérifie la propriété
θ(s x ) = f (x) ∈ K× /K×2 , (21)
pour tout x ∈ V non isotrope. Nous ne démontrerons que plus tard (§ III.6.3, cor. 6.8)
l’existence de ce morphisme (18) . Notons cependant que comme K× /K×2 est abélien, son
noyau, noté O0 (V, f ), contient le groupe dérivé D(O(V, f )), et le noyau SO0 (V, f ) := O0 (V, f )∩
SO(V, f ) de sa restriction à SO(V, f ) contient D(SO(V, f )).

18. Comme les réflexions engendrent O(V, f ), la relation (21) définit uniquement θ ; cependant, il faut vé-
rifier que cette définition a un sens, c’est-à-dire que si u ∈ O(V, f ) se décompose en u = s x1 ◦ · · · ◦ s xr , alors
f (x 1 ) · · · f (x r ) ∈ K× /K×2 est indépendant de la décomposition de u choisie.
8. GROUPE ORTHOGONAL 69

Exemples 8.10. — 1° Lorsque K est quadratiquement clos, K× /K×2 est trivial, donc aussi
θ.
2° Si K = R, le groupe R× /R×2 a deux éléments, à savoir les classes de 1 et de −1.
Si f est définie positive, θ prend ses valeurs dans R×+ /R×2 , donc θ est trivial et
SO0 (n, R) = SO(n, R).
Si f est définie négative, toute réflexion a pour image −1 dans R× /R×2 , donc θ est le
morphisme déterminant et est trivial sur SO(n, R).
Pour avoir un morphisme θ intéressant, il faut donc regarder les groupes O(s, t ) avec s
et t non nuls (c’est-à-dire les cas où l’indice est Ê 1). Dans le cas de O(1, m), la forme f est
donnée sur Rm+1 par
f (x 0 , . . . , x m ) = x 02 − x 12 − · · · − x m
2
.
Ce groupe agit sur la quadrique affine Q := {x ∈ Rm+1 | f (x) = 1}. Or celle-ci a deux com-
posantes connexes Q+ et Q− selon que x 0 est positif ou négatif. On peut donc définir un
morphisme de groupes
θ0 : O(1, m) −→ S{Q+ ,Q− } ' Z/2Z.
Si x n’est pas isotrope, on vérifie que θ0 (s x ) = Id si et seulement si f (x) < 0 (on voit bien ce
qui se passe sur un dessin en dimension 2). Cela signifie que le morphisme θ0 n’est autre
que le produit dét ·θ, donc que (19)
SO0 (1, m) = {u ∈ SO(1, m) | u(Q+ ) = Q+ },
d’indice 2 dans SO(1, m).
En relativité, on travaille dans l’espace de Minkowski, qui correspond au cas m = 3. Le
groupe SO(1, 3) s’appelle le groupe de Lorentz et le groupe SO0 (1, 3) des transformations
qui préservent le sens du temps, le groupe de Lorentz restreint (cf. exerc. 11.7).
La situation est analogue si s, t Ê 2, mais la quadrique Q définie ci-dessus est mainte-
nant connexe. Il faut regarder à la place les sous-espaces vectoriels maximaux W ⊆ Rs+t
sur lesquels la forme f est définie positive, comme par exemple 〈e 1 , . . . , e s 〉. On voit facile-
ment qu’ils sont tous de dimension s et on vérifie qu’ils forment une « famille connexe »
(dans le cas s = 1, ce sont les droites engendrées par les points de Q, qui sont paramé-
trées par une de ses composantes connexes). On peut alors définir de manière continue
une orientation o W sur chacun de ces sous-espaces vectoriels W. L’image de W par une
isométrie u est encore un sous-espace du même type et on obtient
SO0 (s, t ) = {u ∈ SO(s, t ) | u(o W ) = o u(W) }.
De façon plus « concrète », dans une base où la forme quadratique s’écrit
2
f (x 1 , . . . , x s+t ) = x 12 + · · · + x s2 − x s+1 2
− · · · − x s+t ,
la matrice M d’un élément de SO(s, t ) s’écrit sous forme de blocs
µ ¶
A B
M= ,
C D

19. Le groupe SO0 (1, m) est le groupe de la géométrie hyperbolique, il agit sur Q+ , qui est un modèle de l’espace
hyperbolique de dimension m.
70 CHAPITRE II. GROUPES CLASSIQUES

où la matrice A est carrée d’ordre s. On voit que la matrice A est inversible (20) . On a alors
SO0 (s, t ) = {M ∈ SO(s, t ) | dét(A) > 0}.
On peut montrer que ce groupe est connexe.
3° Lorsque (V, f ) est un plan hyperbolique, on note r λ la « rotation » de matrice Rλ dans
une base hyperbolique (e 1 , e 2 ) de V (cf. § 8.1). On a
r λ = s λe 1 −e 2 s e 1 −e 2 ,
donc θ(r λ ) = f (λe 1 − e 2 ) f (e 1 − e 2 ) = 4λ ≡ λ dans K× /K×2 et le morphisme θ|SO(V, f ) :
SO(V, f ) → K× /K×2 est surjectif.

Si l’indice ν de f est Ê 1, c’est-à-dire qu’il existe un vecteur isotrope non nul, V contient
un plan hyperbolique. L’exemple 3° ci-dessus montre que le morphisme
θ|SO(V, f ) : SO(V, f ) → K× /K×2

est alors surjectif. En particulier, si ν Ê 1 et que K n’est pas quadratiquement clos (K×2 6=
K× ), on a D(O(V, f )) ⊆ SO0 (V, f ) Ú SO(V, f ).
On a en fait un résultat plus précis (21) .

Théorème 8.11 (Eichler). — Soit f une forme quadratique non dégénérée sur un espace
vectoriel V de dimension Ê 3. Si l’indice ν de f est Ê 1, on a
SO0 (V, f ) = D(O(V, f )) = D(SO(V, f ))
et SO(V, f )/D(SO(V, f )) ' K× /K×2 .

Exemples 8.12. — 1° Si K = R et que f est définie positive ou négative, on peut montrer


qu’on a encore D(O(n, R)) = D(SO(n, R)) = SO(n, R).
Si st > 0 et s +t Ê 3 (de sorte que f est d’indice Ê 1), le théorème montre que D(SO(s, t ))
est d’indice 2 dans SO(s, t ).
×2
3° Lorsque K = Fq , le groupe F× q /Fq est isomorphe à Z/2Z et l’indice est toujours Ê 1
dès que n Ê 3 (ex. 5.6.3°) ; le groupe D(SO(Fnq , f )) est alors d’indice 2 dans SO(Fnq , f ).
4° Supposons K = Q. Si ν( f ) Ê 1 et n Ê 3, le th. 8.11 donne SO(Qn , f )/D(O(Qn , f )) '
Q /Q×2 qui est un groupe infini (dans lequel tout élément est d’ordre 2).
×

Le cas où l’indice est nul est beaucoup moins bien connu. Lorsque K = Q, Meyer a mon-
tré qu’une forme quadratique f d’indice nul sur Qn , avec n Ê 5, est nécessairement définie
négative ou définie positive vue comme forme quadratique sur Rn . Dans ce cas, Kneser
a montré que l’image de θ|SO(Qn , f ) est Q×+ /Q×2 et que son noyau SO0 (Qn , f ) est encore
D(SO(Qn , f )). On n’est donc pas très loin du cas ν Ê 1 : le groupe dérivé D(SO(Qn , f )) est
encore d’indice infini dans SO(Qn , f ).

µ ¶ µ ¶
Is 0 Is 0
20. En effet, en développant la relation t M M= , on obtient entre autres t AA = Is + t CC, ce
0 −It 0 −It
qui entraîne que la matrice t AA est définie positive, donc que A est inversible (on obtient en fait même | dét(A)| Ê
1). Il en est de même pour D, bien sûr.
21. Cf. Dieudonné, J., La géométrie des groupes classiques, Springer Verlag, 1955, chap. II, § 6.5). Ce n’est plus
vrai pour dim(V) = 2, puisque SO(V, f ) est alors abélien (§ 8.1), mais on a encore SO0 (V, f ) = D(O(V, f )).
8. GROUPE ORTHOGONAL 71

La structure des groupes O(Q3 , f ) et O(Q4 , f ) est beaucoup moins bien connue dans ce
cas.

8.4. Centre. — On peut montrer que pour dim(V) Ê 3, le centre du groupe D(SO(V, f ))
consiste en les homothéties de ce groupe, c’est-à-dire IdV et, éventuellement, − IdV .
On a d’autre part la formule
θ(− IdV ) = disc( f ).
En effet, dans une base (e 1 , . . . , e n ) de V où f (x) = ni=1 αi x i2 , on écrit − IdV = s e 1 · · · s e n , d’où
P
Qn
θ(− IdV ) = f (e 1 ) · · · f (e n ) = i =1 αi = disc( f ).
On en déduit que pour dim(V) Ê 3 et ν Ê 1, le centre de D(SO(V, f )) = SO0 (V, f ) est
d’ordre 2 si disc( f ) = 1 et dim(V) pair, trivial sinon.

8.5. Simplicité. — Vu les résultats de la section précédente, le seul groupe qui a des
chances d’être simple est le quotient P(D(SO(V, f ))) du groupe dérivé D(SO(V, f )) par son
centre.
Nous nous contenterons de passer en revue quelques résultats connus, en renvoyant
au livre de Dieudonné, J., La géométrie des groupes classiques, pour les preuves et des dis-
cussions plus approfondies.

Cas ν( f ) = 0 (forme anisotrope).— Il n’y a pas de résultat général, mais certains cas par-
ticuliers sont complètement décrits.
Lorsque K = R (où D(SO(n, R)) = SO(n, R)), on a
– le groupe PSO(4, R) n’est pas simple (22) (th. 11.4) ;
– le groupe PSO(n, R) est simple pour n = 3 ou n Ê 5.
Lorsque K = Q, on a :
– le groupe O(Q3 , f ) admet une suite décroissante de sous-groupes distingués dont
l’intersection est {Id} ;
– pour n Ê 5, le groupe P(D(SO(Qn , f ))) = PSO0 (Qn , f ) est simple.

Cas ν( f ) Ê 1.— La situation est plus claire : lorsque n Ê 3, le groupe P(D(SO(Kn , f ))) =
PSO0 (Kn , f ) est simple, avec deux exceptions (23) .
Ce cas inclut celui des corps finis Fq dès que n Ê 3. Rappelons qu’en dimension impaire,
on a un seul groupe orthogonal, noté O(2m + 1, Fq ) alors qu’en dimension paire, on en
a deux, notés O+ (2m, Fq ) (discriminant (−1)m , indice m) et O− (2m, Fq ) (discriminant 6=
(−1)m , indice m − 1) (ex. 5.6.3°).

22. Ce fait fondamental est à l’origine de propriétés spéciales importantes de la topologie et de la géométrie de
dimension 4.
23. On a plus précisément :
– si n = 3, le groupe D(SO(K3 , f )) est isomorphe à PSL(2, K), donc il est simple pour K 6= F3 (th. 2.15) ;
– si n = 4 p et disc( f ) 6= 1 dans K× /K×2 , le groupe D(SO(K4 , f )) = P(D(SO(K4 , f ))) est isomorphe à
PGL(2, K[ disc( f )]) (cf. note 16) et il est donc simple (th. 2.15) ;
– si n = 4 et disc( f ) = 1 dans K× /K×2 , le groupe P(D(SO(K4 , f ))) est isomorphe à PSL(2, K) × PSL(2, K) et il
est donc simple pour K 6= F3 (th. 2.15) ;
– le groupe P(D(SO(Kn , f ))) est simple pour n Ê 5.
72 CHAPITRE II. GROUPES CLASSIQUES

Donnons les cardinaux. On a tout d’abord :


2
|SO(2m + 1, Fq )| = q m (q 2m − 1)(q 2m−2 − 1) · · · (q 2 − 1),
(22)
|SO(F2m
q , f )| = (q m − ε)q m(m−1) (q 2m−2 − 1) · · · (q 2 − 1).
où ε = 1 si (−1)m disc( f ) est un carré dans Fq (c’est-à-dire pour O+ ), et −1 sinon (c’est-à-
dire pour O− ).
Par le th. 8.11, le groupe dérivé est d’indice 2 dans tous les cas. Dans le cas de la dimen-
sion impaire, son centre est trivial et
1 2
|P(D(SO(2m + 1, Fq )))| = q m (q 2m − 1)(q 2m−2 − 1) · · · (q 2 − 1).
2
Dans le cas de la dimension paire, le centre est trivial si et seulement si disc( f ) 6= 1. Tous
calculs faits, on arrive à
qm − 1
|P(D(SO+ (2m, Fq )))| = q m(m−1) (q 2m−2 − 1) · · · (q 2 − 1)
pgcd(4, q m − 1)
qm + 1
|P(D(SO− (2m, Fq )))| = q m(m−1) (q 2m−2 − 1) · · · (q 2 − 1)
pgcd(4, q m + 1)
On peut définir aussi ces groupes en caractéristique 2. On obtient ainsi trois autres
séries de groupes finis simples, à savoir P(D(SO(2m + 1, Fq ))), P(D(SO+ (2m, Fq ))) et
P(D(SO− (2m, Fq ))) (24) .

9. Formes sesquilinéaires et hermitiennes


9.1. Formes sesquilinéaires. — Il y a une variante des formes bilinéaires quand le corps
K (qu’on supposera toujours de caractéristique 6= 2) est équipé d’une involution de corps
σ. L’exemple principal sera K = C avec σ(z) = z̄ et, pour simplifier les notations, on notera
toujours l’involution σ de K sous la forme σ(λ) = λ̄, quel que soit le corps.
La décomposition C = R ⊕ i R s’étend de la manière suivante à tout corps muni d’une
involution : comme car(K) 6= 2, on a une décomposition K = K0 ⊕ K1 , où K0 et K1 sont les
espaces propres de σ pour les valeurs propres 1 et −1, et K0 est un sous-corps de K. Si
σ 6= IdK , on peut choisir I ∈ K1 − {0} ; on a alors
K = K0 ⊕ IK0 avec I2 ∈ K×
0.

Exemple 9.1. — Si q est une puissance de nombre premier impair, le morphisme σ : x 7→


x q est une involution du corps K = Fq 2 . Le corps fixe K0 est le sous-corps Fq ⊆ Fq 2 .

On dit qu’un morphisme de groupes additifs u entre K-espaces vectoriels est σ-linéaire
si u(λx) = λ̄u(x) pour tout vecteur x et tout λ ∈ K. Une forme σ-sesquilinéaire est une
application B : V × V → K telle que pour tout y ∈ V, l’application x 7→ B(x, y) soit σ-linéaire
et l’application y 7→ B(x, y) soit linéaire. Pour tous x et y dans V et tout λ ∈ K, on a donc
B(x, λy) = λB(x, y) et B(λx, y) = λ̄B(x, y).

24. Pour des raisons que vous comprendrez plus tard, ces groupes sont aussi notés Bm (q), Dm (q) et 2 Dm (q),
respectivement.
10. GROUPE UNITAIRE 73

La forme sesquilinéaire B est hermitienne si en outre


B(y, x) = B(x, y)
pour tous x, y ∈ V.
Dans une base (e i ) de V, la matrice M de B est donnée par Mi j = B(e i , e j ). Sur des vec-
teurs colonnes, on a alors B(X, Y) = t X̄MY et la matrice de B dans une autre base est t P̄MP,
où P est la matrice de passage. Le déterminant de M définit donc un discriminant qui est
ou bien nul, ou bien un élément du groupe multiplicatif quotient
K× /{k̄k | k ∈ K× }.
Pour une forme sesquilinéaire hermitienne, la matrice satisfait M∗ = M, où M∗ := t M̄ (on
dit aussi que M est une matrice hermitienne hermitienne) et le discriminant est dans
K× ×
0 /{k̄k | k ∈ K } ∪ {0}.
Associée à une forme sesquilinéaire hermitienne est la forme hermitienne
h(x) = B(x, x).
On récupère, si car(K) 6= 2, la forme sesquilinéaire à partir de h par la formule
1¡ 1 ¢
B(x, y) = h(x + y) − h(x − y) + (h(x + Iy) − h(x − Iy)) .
4 I
On définit comme dans les cas symétriques ou antisymétriques la notion de forme ses-
quilinéaire hermitienne non dégénérée, d’isométrie, de vecteurs orthogonaux, de sous-
espace totalement isotrope, de plan hyperbolique.
La réduction de Gauss (cf. § 4.2) décompose une forme hermitienne sous la forme
h(x) = α1 x̄ 1 x 1 + · · · + αr x̄ r x r .
avec α1 , . . . , αr ∈ K×
0.
Le théorème de Witt reste valable (avec des modifications dans la démonstration, en
particulier dans celle du lemme 5.3) et on peut définir de la même façon l’indice d’une
forme hermitienne.

10. Groupe unitaire


10.1. Définition. — On définit le groupe unitaire U(V, h) d’une forme hermitienne h non
dégénérée sur un espace vectoriel V comme le groupe des isométries de (V, h). Si M est la
matrice (inversible) dans une base de V de la forme sesquilinéaire hermitienne B associée,
ce groupe est isomorphe au groupe
{U ∈ GL(V) | U ∗ MU = M}.
Le groupe spécial unitaire est défini comme d’habitude par
SU(V, h) := U(V, h) ∩ SL(V).

Exemple 10.1. — 1° Si K = C et σ est la conjugaison complexe, on peut trouver a i ∈ C tel


que ā i a i = ±αi . Ainsi, pour toute forme hermitienne h non dégénérée sur Cn , il existe une
base dans laquelle elle s’écrit
h(x) = x̄ 1 x 1 + · · · + x̄ s x s − x̄ s+1 x s+1 − · · · − x̄ n x n .
74 CHAPITRE II. GROUPES CLASSIQUES

L’indice est inf(s, n − s). Le groupe unitaire associé est noté U(s, n − s, C), ou le plus souvent
U(s, n − s). Il est isomorphe à
½ µ ¶ µ ¶¾
Is 0 Is 0
¯
U ∈ GL(n, C) ¯ U ∗ U= .
¯
0 −In−s 0 −In−s
On note U(n) lorsque s = n. Les groupes U(s, n − s) (resp. SU(s, n − s)) sont des variétés
différentiables de dimension n 2 (resp. n 2 − 1).
2° Si K = Fq 2 (avec q puissance de nombre premier impair) et σ(λ) = λq , le morphisme

q2
−→ F×
q

λ 7−→ λ̄λ = λq+1


est surjectif. En effet, un générateur du groupe cyclique F×
q2
est d’ordre q 2 − 1 = (q − 1)(q +
1) ; il est donc envoyé sur un élément d’ordre q − 1, c’est-à-dire un générateur de F× q . Il en
résulte que tout élément αi de F× q peut s’écrire ā a
i i , et donc, pour toute forme hermitienne
h non dégénérée sur Fnq 2 , il existe une base dans laquelle elle s’écrit
q+1 q+1
h(x) = x̄ 1 x 1 + · · · + x̄ n x n = x 1 + · · · + xn .
Toutes les formes non dégénérées sur Fnq 2 sont donc équivalentes et iI existe aussi une base
dans laquelle la forme s’écrit h(x) = x̄ 1 x 1 − x̄ 2 x 2 +· · ·+(−1)n+1 x̄ n x n . L’indice est donc bn/2c.
En particulier, tout plan est hyperbolique.
Le groupe unitaire est noté U(n, Fq 2 ). Il est isomorphe au groupe

{U ∈ GL(n, Fq 2 ) | t U (q) U = In }.
où U (q) est la matrice obtenue à partir de U en élevant tous ses coefficients à la puissance
q. On a
|U(n, Fq 2 )| = (q n − (−1)n )q n−1 (q n−1 − (−1)n−1 )q n−2 · · · (q 2 − 1)q(q + 1).

Exercice 10.2. — Soit M ∈ GL(n, Fq 2 ) une matrice telle que t M = M(q) . Montrer qu’il existe
une matrice P ∈ GL(n, Fq 2 ) tel que M = t P (q) P.

10.2. La dimension 2. — Comme dans le cas orthogonal, le cas de la dimension 2 peut


être décrit par calcul direct. Nous envisageons les deux types de formes qui peuvent inter-
venir dans les cas K = C ou Fq 2 .
Cas de la forme hermitienne x̄ 1 x 1 + x̄ 2 x 2 .
Proposition 10.3. — Supposons dim(V) = 2 et h(x 1 , x 2 ) = x̄ 1 x 1 + x̄ 2 x 2 . Alors
α β ¯¯
½µ ¶ ¾
SU(V, h) ' ¯ α, β ∈ K, ᾱα + β̄β = 1 .
−β̄ ᾱ

En particulier, SU(2) est en bijection avec la sphère unité S3 dans l’espace euclidien R4 .
α β
µ ¶
Démonstration. — La matrice U = est dans SU(V, h) si dét(U) = 1 et U ∗ U = I2 , ce
γ δ
qui mène aux équations
αδ − βγ = 1, ᾱα + γ̄γ = β̄β + δ̄δ = 1, ᾱβ + γ̄δ = 0.
10. GROUPE UNITAIRE 75

(
αδ − γβ = 1
Le système d’inconnues δ et β est de déterminant 1 donc a une unique
γ̄δ + ᾱβ = 0
solution, qui est β = −γ̄ et δ = ᾱ.

Cas d’un plan hyperbolique. Dans une base hyperbolique, la forme hermitienne est don-
née par h(x 1 , x 2 ) = x̄ 1 x 2 + x̄ 2 x 1 .

Proposition 10.4. — Supposons dim(V) = 2 et V hyperbolique pour la forme hermitienne


h. Alors SU(V, h) ' SL(2, K0 ).

Exemple 10.5. — On a donc SU(1, 1) ' SL(2, R) et SU(2, Fp 2 ) ' SL(2, Fp ).

Démonstration. — Dans µ une¶ base hyperbolique, la matrice de la forme hermitienne est


α β
µ ¶
0 1
H= . Alors, U = est dans SU(V, h) si dét(U) = 1 et U ∗ HU = H, ce qui mène
1 0 γ δ
aux équations
αδ − βγ = 1, αγ̄ + ᾱγ = 0, βγ̄ + ᾱδ = 1, βδ̄ + β̄δ = 0.
Elles se résolvent en ᾱ = α, δ̄ =µ δ, β̄ = −β,
¶ γ̄ = −γ et αδ − βγ = 1. On obtient α, δ, Iβ, Iγ ∈ K0
α Iβ
et αδ − βγ = 1, soit encore v = −1 ∈ SL(2, K0 ). On vérifie que l’application u 7→ v est
I γ δ
bien un morphisme de groupes (25) .

10.3. Produit scalaire hermitien. — Dans cette section uniquement, on suppose K = C


et on considère une forme hermitienne h définie positive sur un C-espace vectoriel V de
dimension n, c’est-à-dire satisfaisant h(x) Ê 0 pour tout x ∈ V, avec égalité si et seulement
si x = 0. Une telle forme est en particulier non dégénérée ; on l’appelle un produit scalaire
hermitien. On a vu qu’il existe alors une base orthonormale, c’est-à-dire une base dans
laquelle la forme h s’écrit
h(x) = |x 1 |2 + · · · + |x n |2 .
Dans ce cas, les éléments du groupe U(V, h) jouissent d’une réduction particulièrement
simple, similaire à celle des endomorphismes orthogonaux pour un produit scalaire eu-
clidien défini positif.
Un endomorphisme u de V admet toujours un adjoint u ∗ défini par
B(x, u(y)) = B(u ∗ (x), y)

25. On peut décrire plus intrinsèquement le morphisme SL(2, K0 ) → SU(V, h) comme suit. On considère K
comme un K0 -espace vectoriel de dimension 2. L’espace vectoriel V := EndK0 K des endomorphismes K0 -
linéaires de K est naturellement un K-espace vectoriel de dimension 2, puisque (Id, σ) en est une base. Si
α = a + Ia 0 et β = b + Ib 0 sont dans K, la matrice de l’endomorphisme α Id +βσ de K dans la base (1, I) est
(a 0 − b 0 )I2
µ ¶
a +b
0 0 , dont le déterminant est ᾱα − β̄β. C’est donc une forme hermitienne sur V, hyperbolique
a +b a −b
puisque le vecteur (1, 1) est isotrope.
On dispose d’autre part d’une application K-linéaire φ : V = EndK0 K → EndK (V) qui envoie u ∈ V sur l’en-
domorphisme φu de V donné par v 7→ u ◦ v. Comme dét(φu (v)) = dét(u) dét(v), on voit que φu est unitaire pour
la forme hermitienne dét si et seulement si dét(u) = 1. L’application φ induit donc un morphisme de groupes
SL(K) → U(V, dét). On vérifie ensuite que ce morphisme est à valeurs dans SU(V, dét) (c’est-à-dire que dét(φu ) = 1
si dét(u) = 1) et qu’il est surjectif.
76 CHAPITRE II. GROUPES CLASSIQUES

pour tous x, y ∈ V. En particulier, u ∈ U(V, h) si et seulement si u ∗ = u −1 .


Dans une base orthonormale, si u a pour matrice U, alors u ∗ a pour matrice U ∗ .
Plus généralement, on dit qu’un endomorphisme u de V est normal si u ∗ u = uu ∗ . Cette
notion inclut les endomorphismes unitaires (u ∗ = u −1 ), autoadoints (u ∗ = u) et antiau-
toadjoints (u ∗ = −u).

Proposition 10.6. — Tout endomorphisme normal pour un produit scalaire hermitien se


diagonalise dans une base orthonormale.

Les valeurs propres doivent être de module 1 pour les endomorphismes unitaires,
réelles pour les endomorphismes autoadjoints et imaginaires pures pour les endomor-
phismes antiautoadjoints.
En particulier, si l’on dispose d’une seconde forme hermitienne h 0 , on peut lui associer,
puisque h est non dégénérée, un endomorphisme u de V qui vérifie
∀x, y ∈ V B0 (x, y) = B(x, u(y)).
On a aussi
B(u(x), y) = B(y, u(x) = B0 (y, x) = B0 (x, y) = B(x, u(y)),
de sorte que u ∗ = u. D’après la proposition, u se diagonalise dans une base h-
orthonormale, ce qui signifie que dans cette base, la forme B0 a une matrice diagonale
λ1
 
 ..  , λi ∈ R.

 .
λn
La forme h 0 est définie positive si et seulement si les λi sont tous strictement positifs.

Démonstration de la proposition. — Soit u un endomorphisme normal de V. Soit λ une


valeur propre (complexe) de u et soit Vλ l’espace propre associé. Si x ∈ Vλ , on a
u(u ∗ (x)) = u ∗ u(x) = λu ∗ (x),
donc u ∗ (x) ∈ Vλ . Ainsi u ∗ (Vλ ) ⊆ Vλ .
Si y ∈ Vλ⊥ et x ∈ Vλ , on obtient B(x, u(y)) = B(u ∗ (x), y) = 0, donc u(Vλ⊥ ) ⊆ Vλ⊥ . Une récur-
rence montre alors que V est somme directe orthogonale des espaces propres de u.

10.4. Propriétés des groupes unitaires. — Dans cette dernière partie, on revient au cas
général d’un corps général K et on énonce sans démonstration quelques propriétés des
groupes unitaires pour une forme hermitienne h.
Centre : Le centre de U(Kn , h) est constitué des homothéties de rapport λ tel que λ̄λ =
1. Le centre de SU(Kn , h) est constitué des homothéties de rapport satisfaisant en
outre λn = 1. On notera
PSU(Kn , h) := SU(Kn , h)/Z(SU(Kn , h)).

Simplicité : Si la forme hermitienne h est d’indice Ê 1 (ce qui est le cas sur Fnq 2 pour n Ê
2), le groupe PSU(Kn , h) est simple, à l’exception du groupe PSU(2, F9 ) ' PSL(2, F3 )
11. QUATERNIONS 77

(prop. 10.4). Si l’indice est nul, donc la forme anisotrope, il n’y a pas de résultat gé-
néral. Néanmoins PSU(n, C) est simple dès que n Ê 2 : en fait, comme on le verra
dans le § 11, PSU(2, C) ' SO(3, R), qui est simple, et l’énoncé pour n > 2 s’en déduit.
On peut définir aussi ces groupes en caractéristique 2. On obtient ainsi une autre série
de groupes finis simples, à savoir PSU(n, Fq 2 ) pour q puissance de nombre premier et
n Ê 3 (26) .

11. Quaternions
Le corps des quaternions, H, est un corps non commutatif, contenant comme sous-
corps R, et de dimension 4 comme espace vectoriel sur R. On peut le décrire comme une
algèbre de matrices 2 × 2 complexes :
α β ¯¯
½µ ¶ ¾
H := ¯ α, β ∈ C . (23)
−β̄ ᾱ
L’addition et la multiplication dans H sont celles des matrices. Puisque le déterminant est
|α|2 + |β|2 , seule la matrice nulle n’est pas inversible et on obtient un corps.
On distingue les éléments suivants :
µ ¶ µ ¶ µ ¶ µ ¶
1 0 i 0 0 1 0 i
1= , I= , J= , K=
0 1 0 −i −1 0 i 0
de H.
Les multiples réels de 1 fournissent le sous-corps R ⊆ H. La famille (1, I, J, K) est une
base de H vu comme espace vectoriel sur R. On observe que
I2 = J2 = K 2 = −1, IJK = −1,
relations desquelles on déduit aisément les autres multiplications des éléments de la base :
IJ = −JI = K, JK = −KJ = I, KI = −IK = J.
L’ensemble {x 0 + x 1 I | x 0 , x 1 ∈ R} est un sous-corps de H isomorphe à C (ce n’est pas le
seul car les rôles de I, J et K sont interchangeables dans H (27) ). La famille (1, J) est une base
de H vu comme espace vectoriel sur C. Plus précisément, on a
q = x 0 + x 1 I + x 2 J + x 3 K, où x 0 , . . . , x 3 ∈ R
= (x 0 + x 1 I)1 + (x 2 + x 3 I)J.
Dans cette écriture, on fera attention que β = x 2 + x 3 I et J ne commutent pas (en fait, Jβ =
β̄J).
Le centre de H est R : en effet, si q ∈ Z(H), écrivons comme ci-dessus q = α + βJ, avec
α, β ∈ C. De qI = Iq, on déduit β = 0, et de αJ = Jα = ᾱJ, on déduit α ∈ R.
Le conjugué d’un quaternion q = x 0 + x 1 I + x 2 J + x 3 K est
q̄ = x 0 − x 1 I − x 2 J − x 3 K.

26. Ces groupes sont aussi notés 2 An−1 (q 2 ).


27. En faisant agir les automorphismes φq définis plus bas, on voit qu’on peut même changer le triplet (I, J, K)
en son image par n’importe quelle rotation de R3 , donc en particulier I en q 1 I + q 2 J + q 3 K pour q 1 , q 2 , q 3 ∈ R tels
que q 12 + q 22 + q 32 = 1, ce qui donne une famille de sous-corps de H isomorphes à C paramétrée par la sphère S2 .
78 CHAPITRE II. GROUPES CLASSIQUES

La conjugaison a les propriétés suivantes :


1° q 1 q 2 = q̄ 2 q̄ 1 ;

2° N(q) := q q̄ = q̄ q = x 02 + x 12 + x 22 + x 32 ∈ R, en particulier q −1 = N(q) .
Un quaternion est
– réel si q̄ = q ;
– imaginaire pur si q̄ = −q.
L’ensemble des quaternions imaginaires purs est Im(H) = {x 1 I + x 2 J + x 3 K} et on a

H = R ⊕ Im(H).

Lemme 11.1. — La norme N : H× → R×∗ est un morphisme de groupes multiplicatifs. Son


noyau ker(N) = {q ∈ H | N(q) = 1} est un groupe isomorphe à SU(2).

Démonstration. — On a

N(q 1 q 2 ) = q̄ 2 q̄ 1 q 1 q 2 = q̄ 2 N(q 1 )q 2 = N(q 1 )N(q 2 ),

la dernière égalité étant vraie car N(q 1 ) ∈ R = Z(H).


La description matricielle (23) donne l’interprétation du noyau comme le groupe SU(2)
(prop. 10.3).

Bien sûr, N s’identifie à la norme euclidienne usuelle dans H = R4 , donc le groupe SU(2)
est homéomorphe à la sphère de R4 .
Soit q un quaternion tel que N(q) = 1. Considérons la conjugaison (au sens du groupe
multiplicatif (non abélien) (H× , ×))

φq : H −→ H
x 7−→ q xq −1

Puisque q −1 = q̄, on a
φq (x) = q x̄q −1 ,
donc φq agit par l’identité sur R et préserve la décomposition H = R ⊕ Im(H). En outre,

N(φq (x)) = q xq −1 q x̄q −1 = N(x),

donc φq agit par isométries sur R4 . En restreignant φq à Im(H), on obtient ainsi un mor-
phisme de groupes

φ : SU(2) −→ O(3)
q 7−→ φq |Im(H) .

Comme le groupe SU(2), homéomorphe à la sphère de R4 , est connexe, l’image de φ est


connexe donc incluse dans SO(3).

Théorème 11.2. — Le morphisme φ ainsi défini est surjectif, de noyau {±1}. Par consé-
quent,
SO(3) ' SU(2)/{±1} = PSU(2).
11. QUATERNIONS 79

Démonstration. — Le noyau de φ est constitué des quaternions q de norme 1 tels que


q xq −1 = x pour tout x ∈ Im(H), soit q x = xq pour tout x ∈ Im(H). Comme c’est toujours
vrai pour x ∈ R, cela implique q x = xq pour tout x ∈ H, donc q ∈ Z(H) = R et q = ±1.
Soit q ∈ Im(H) tel que q q̄ = 1. Alors q 2 = −q q̄ = −1 et
φq (q) = q,
φ2q (x) = φq 2 (x) = x pour tout x ∈ Im(H),
donc φq |Im(H) , qui est une rotation, est obligatoirement le renversement d’axe Rq ⊆ Im(H).
L’image de φ contient ainsi les renversements et φ est surjective par le th. 8.7.

Exercice 11.3. — On a vu dans la prop. 10.4 l’isomorphisme SL(2, R) ' SU(2). On a donc
aussi un morphisme surjectif SL(2, R) → O(3) de noyau d’ordre 2. Le but de cet exercice est
de construire directement un tel morphisme dans un cadre un peu plus général.
Soit K un corps de caractéristique différente de 2 et soit V l’espace vectoriel (de dimension
4) des matrices 2 × 2 à coefficients dans K.
a) Montrer que f : M 7→ tr(M2 ) est une forme quadratique sur V.
b) Montrer que SL(2, C) agit par isométries sur V par P · M := PMP −1 et que ces isométries
laissent toutes stable l’espace vectoriel W := I⊥
2 (de dimension 3).
c) Montrer que la restriction de f à W est de type 〈1, 1, −2〉.
d) On en déduit un morphisme SL(2, K) → O(W, f |W ). Montrer qu’il est surjectif et déterminer
son noyau.

L’isomorphisme entre PSU(2) et SO(3) a été montré en trouvant, grâce aux quaternions,
une action de SU(2), identifié au groupe des quaternions de norme 1, sur R3 . On peut
aussi regarder l’action de SU(2) × SU(2) sur R4 = H, définie en associant à un couple de
quaternions (q 1 , q 2 ), chacun de norme 1, l’endomorphisme
ψq1 ,q2 (x) = q 1 x q̄ 2 = q 1 xq 2−1
de H.

Théorème 11.4. — 1° On définit ainsi un morphisme


ψ : SU(2) × SU(2) → SO(4)
qui est surjectif, de noyau {±(1, 1)}.
2° On a un isomorphisme PSO(4) ' SO(3) × SO(3).

En particulier, le groupe PSO(4) n’est pas simple.

Démonstration. — 1° À nouveau, on a N(φq1 ,q2 (x)) = q 1 xq 2−1 q 2 x̄q 1−1 = N(x) donc l’image
de ψ est bien contenue dans O(4, R) et même, par connexité de l’image, dans SO(4, R).
Le noyau de ψ est constitué des (q 1 , q 2 ) tels que q 1 xq 2−1 = x pour tout x ∈ H donc q 1 x =
xq 2 . Faisant x = 1 on déduit q 1 = q 2 , forcément élément de Z(H), donc q 1 = q 2 = ±1.
Pour montrer que ψ est surjective, on prend u ∈ SO(4, R). Le quaternion q := u(1) vérifie
N(q) = 1. On a ψq̄,1 ◦u(1) = q̄ q = 1, donc ψq̄,1 ◦u laisse R, donc aussi R⊥ = Im(H), stable. Par
le théorème précédent, il existe q 0 tel que ψq̄,1 ◦u = ψq 0 ,q 0 . Ceci montre que ψ est surjectif.
2° En composant ψ par la projection sur PSO(4), on obtient un morphisme surjectif
ψ̃ : SU(2) × SU(2) −→ PSO(4).
80 CHAPITRE II. GROUPES CLASSIQUES

Son noyau est constitué des (q 1 , q 2 ) tels que q 1 x = εxq 2 pour tout x ∈ H, où ε = ±1. Pour
ε = 1, on récupère le noyau de ψ ; pour ε = −1, on obtient (en faisant x = −1) q 2 = −q 1
puis q 1 x = xq 1 pour tout x ∈ H, donc q 1 = ±1, ce qui rajoute au noyau les éléments
(1, −1) et (−1, 1). Finalement le noyau de ψ̃ est constitué des quatre éléments (±1, ±1),
donc PSO(4) ' PSU(2) × PSU(2).
Remarque 11.5. — Pour tout n, on peut construire (cf. § III.6.4) un groupe Spin(n)
connexe, muni d’un morphisme de groupes surjectif Spin(n) → SO(n) dont le noyau a
deux éléments (28) . Il est unique à isomorphisme (de groupes) près.
On a vu SO(2) ' U(1) (ex. 8.2.1°). Le groupe Spin(2) est le groupe U(1) des nombres
complexes de module 1, mais le morphisme Spin(2) → SO(2) est l’élévation au carré.
Le th. 11.2 entraîne Spin(3) ' SU(2), et le th. 11.4 entraîne Spin(4) ' SU(2) × SU(2).
On peut montrer Spin(6) ' SU(4), c’est-à-dire qu’on a un morphisme surjectif SU(4) →
SO(6) dont le noyau est d’ordre 2 (exerc. III.3.9).
Cette construction peut aussi être effectuée dans le cas d’une forme quadratique (non
dégénérée) quelconque sur Rn (rem. III.6.11). On obtient alors un groupe Spin0 (s, t ) qui est
un revêtement (connexe) de degré 2 du groupe connexe SO0 (s, t ) (d’indice 2 dans SO(s, t ))
défini dans l’ex. 8.10.3° (cf. exerc. III.3.10).
Exercice 11.6. — Déduire de la construction de l’exerc. 11.3 que le groupe Spin0 (2, 1) est iso-
morphe à SL(2, R).

Exercice 11.7. — Le but de cet exercice est de montrer que le groupe SO0 (1, 3) est isomorphe
à PSL(2, C). En particulier, Spin0 (1, 3) ' SL(2, C).
Soit V l’espace vectoriel réel (de dimension 4) des matrices hermitiennes du type
µ ¶
x + x1 x2 + i x3
M(x 0 , x 1 , x 2 , x 3 ) := 0 ,
x2 − i x3 x0 − x1
avec x 0 , x 1 , x 2 , x 3 ∈ R.
a) Montrer que GL(2, C) agit linéairement sur V par la relation P · M = PMP ∗ .
b) Montrer que SL(2, C) agit par isométries sur V pour la forme quadratique de Lorentz de
signature (1, 3). On en déduit un morphisme φ : SL(2, C) → O(1, 3).
c) Déterminer le noyau de φ.
d) Montrer que l’image de φ est exactement le sous-groupe SO0 (1, 3) défini dans l’ex. 8.10.3°
et conclure.

28. On dit que c’est un revêtement de degré 2 de SO(n) et c’est en fait, pour n Ê 3, le revêtement universel de
l’espace topologique SO(n).
CHAPITRE III

ALGÈBRE TENSORIELLE

1. Produit tensoriel
Soit K un corps et soient V et W des K-espaces vectoriels. Un produit tensoriel de V
et W est la donnée d’un K-espace vectoriel T et d’une application bilinéaire t : V × W → T,
satisfaisant la propriété universelle suivante : si b : V×W → E est une application bilinéaire,
il existe une unique application linéaire b̂ : T → E telle que b = b̂ ◦ t . Cela se traduit par le
fait que le diagramme suivant est commutatif :
b
V ×W E

t

Une telle paire (T, t ) est nécessairement unique, à unique isomorphisme près, au sens sui-
vant.

Théorème 1.1 (Existence et unicité). — Étant donné des K-espaces vectoriels V et W, il


existe un produit tensoriel (T, t ) de V et W, unique au sens suivant : si (T, t ) et (T 0 , t 0 ) sont des
produits tensoriels de V et W, ils sont isomorphes, c’est-à-dire qu’il existe un isomorphisme
φ : T → T 0 , unique, tel que le diagramme suivant soit commutatif

V ×W
t t0

φ
T T0 .

On parle ainsi du produit tensoriel de V et W, noté V ⊗K W. L’application bilinéaire t : V ×


W → V ⊗K W est notée (v, w) 7→ v ⊗w. Un élément de V ⊗K W du type v ⊗w est appelé tenseur
décomposable ; les tenseurs décomposables engendrent V ⊗K W.

On notera la plupart du temps V ⊗ W au lieu de V ⊗K W.


82 CHAPITRE III. ALGÈBRE TENSORIELLE

Démonstration. — Commençons par l’unicité. On applique la propriété universelle pour


T à t 0 : V × W → T 0 , pour déduire l’existence de φ : T → T 0 unique telle que t 0 = φ ◦ t . La
propriété universelle pour T 0 fabrique aussi ψ : T 0 → T tel que t = ψ ◦ t 0 . Appliquant l’uni-
cité dans la propriété universelle à l’application bilinéaire t : V × W → T, on déduit que
ψ ◦ φ = IdT . De manière analogue, on a φ ◦ ψ = IdT0 .
Reste l’existence du produit tensoriel. Compte tenu de l’unicité, n’importe quelle
construction fait l’affaire ; en voici une. Soit K[V × W] le K-espace vectoriel de base les
symboles (v, w) pour v ∈ V et w ∈ W. Un élément de K[V × W] est donc une somme (finie)
λv,w (v, w) pour des scalaires λv,w presque tous nuls. L’application linéaire tautologique
P

V × W → K[V × W] donnée par (v, w) 7→ (v, w) n’est pas bilinéaire, mais elle va le devenir si
on compose par la projection sur un certain quotient K[V ×W]/S. Pour trouver S, écrivons
les relations dont nous avons besoin : pour v, v 0 ∈ V, w, w 0 ∈ W, λ, λ0 ∈ K, les quantités
suivantes doivent êtres nulles
(λv + λ0 v 0 , w) − λ(v, w) − λ0 (v 0 , w), (24)
0 0 0 0
(v, λw + λ w ) − λ(v, w) − λ (v, w ). (25)
Il est donc naturel de définir S comme le sous-espace vectoriel de K[V × W] engendré par
toutes les expressions (24) et (25) et de poser
T := K[V × W]/S.
On définit maintenant l’application bilinéaire t : V × W → T comme la composée
V × W −→ K[V × W]  K[V × W]/S = T.
Elle associe à (v, w) la classe de (v, w) dans le quotient T. Puisque K[V×W] est engendré par
les éléments de type (v, w), son quotient T est engendré par les éléments de type t ((v, w)),
c’est-à-dire par les tenseurs décomposables.
Pour montrer qu’on a ainsi obtenu le produit tensoriel de V et W, il reste à montrer
la propriété universelle : si on a une application bilinéaire b : V × W → E, on peut définir
une application linéaire g : K[V × W] → E par g ((v, w)) = b(v, w). Puisque b est bilinéaire,
g s’annule sur le sous-espace S et passe donc au quotient pour donner une application
linéaire b̂ : T → E. L’identité b = b̂ ◦ t est claire et l’unicité de b̂ provient du fait que T est
engendré par les t ((v, w)) ; or l’image de t ((v, w)) par b̂ est déterminée, puisque ce doit être
b(v, w).

Corollaire 1.2. — Soient V, W et E des K-espaces vectoriels. L’espace vectoriel des appli-
cations bilinéaires V × W → E est isomorphe à Hom(V ⊗ W, E). En particulier, l’espace des
formes bilinéaires sur V × W est isomorphe à (V ⊗ W)∗ .

On remarquera que l’espace vectoriel des applications bilinéaires V × W → E est aussi


isomorphe à Hom(V, Hom(W, E)). Le corollaire s’écrit donc aussi
Hom(V, Hom(W, E)) ' Hom(V ⊗ W, E). (26)

Démonstration. — L’isomorphisme est obtenu en passant d’une application bilinéaire


b : V × W → E à b̂ ∈ Hom(V ⊗ W, E) par la propriété universelle. Dans l’autre direction, on
obtient b à partir de b̂ par restriction aux tenseurs décomposables.
1. PRODUIT TENSORIEL 83

Proposition 1.3 (Fonctorialité). — Si on a des applications linéaires f : V1 → V2 et g :


W1 → W2 , il existe une et une seule application linéaire f ⊗ g : V1 ⊗ W1 → V2 ⊗ W2 telle
que ( f ⊗ g )(v ⊗ w) = f (v) ⊗ g (w) pour tous v, w.
En outre, ( f 1 ⊗ g 1 ) ◦ ( f 2 ⊗ g 2 ) = ( f 1 ◦ f 2 ) ⊗ (g 1 ◦ g 2 ).

Démonstration. — Il s’agit de compléter le diagramme commutatif :

f ×g
V1 × W1 V2 × W2

t t0

f ⊗g
V1 ⊗ W1 V2 ⊗ W2

Il suffit d’appliquer la propriété universelle à t 0 ◦ ( f × g ).


La seconde assertion résulte de l’unicité de ( f 1 ◦ f 2 ) ⊗ (g 1 ◦ g 2 ) quand on applique la
propriété universelle. Les détails sont laissés au lecteur.

Propriétés du produit tensoriel 1.4. — Soient U, V et W des K-espaces vectoriels. On a



K ⊗ V −→ V k ⊗ v 7−→ kv,

(U ⊕ V) ⊗ W −→(U ⊗ W) ⊕ (V ⊗ W) (u + v) ⊗ w 7−→ u ⊗ w + v ⊗ w, (27)

U ⊗ V −→ V ⊗ U u ⊗ v 7−→ v ⊗ u,

U ⊗ (V ⊗ W) −→(U ⊗ V) ⊗ W u ⊗ (v ⊗ w) 7−→ (u ⊗ v) ⊗ w.

Attention : la colonne de droite ne définit les isomorphismes que sur les tenseurs dé-
composables, alors que tous les tenseurs ne le sont pas. Mais ces applications sont li-
néaires, donc elles sont uniquement déterminées par leur valeur sur ces tenseurs parti-
culiers.

Démonstration. — Dans le premier cas, l’application K × V → V donnée par (k, v) 7→ kv


est bilinéaire, donc il y a une application linéaire induite K ⊗ V → V, qui envoie k ⊗ v sur
kv. L’inverse est v 7→ 1 ⊗ v, d’où l’isomorphisme. Les autres cas sont similaires.

On vérifie que si (v i )i ∈I et (w j ) j ∈J sont des bases respectives de V et W, alors (v i ⊗


w j )(i , j )∈I×J est une base de V ⊗ W (on peut par exemple utiliser (27)). En particulier, on
a en dimension finie
dim(V ⊗ W) = dim(V) dim(W).
Si V1 a pour base (v 1, j ) j ∈I1 , V2 a pour base (v 2,i )i ∈I2 , W1 a pour base (w 1,l )l ∈J1 et W2 a pour
base (w 2,k )k∈J2 et qu’on a des applications linéaires f : V1 → V2 et g : W1 → W2 de matrices
respectives A = (a i j )i ∈I2 , j ∈I1 et B = (b kl )k∈J2 , l ∈J1 dans ces bases, alors
X
( f ⊗ g )(v 1, j ⊗ w 1,l ) = a i j b kl v 2,i ⊗ w 2,k ,
i ∈I2 , k∈J2

de sorte que la matrice de f ⊗ g dans les bases (v 1, j ⊗ w 1,l )( j ,l )∈I1 ×J1 de V1 ⊗ W1 et (v 2,i ⊗
w 2,k )(i ,k)∈I2 ×J2 de V2 ⊗ W2 est
A ⊗ B := (a i j b kl )(i ,k)∈I2 ×J2 , ( j ,l )∈I1 ×J1 .
84 CHAPITRE III. ALGÈBRE TENSORIELLE

Par exemple, si V1 , V2 , W1 , W2 sont tous de dimension 2 et qu’on choisit sur {1, 2} × {1, 2}
l’ordre (1, 1), (1, 2), (2, 1), (2, 2), la matrice est
a 11 b 11 a 11 b 12 a 12 b 11 a 12 b 12
 
µ ¶ µ ¶ µ ¶
a 11 a 12 b 11 b 12 a 11 B a 12 B a 11 b 21 a 11 b 22 a 12 b 21 a 12 b 22 
A⊗B = ⊗ = a 12 b 11 a 12 b 12 a 22 b 11 a 22 b 12  .
= 
a 21 a 22 b 21 b 22 a 21 B a 22 B
a 12 b 21 a 12 b 22 a 22 b 21 a 22 b 22
On appelle aussi cette matrice le produit de Kronecker des matrices A et B (on le définit de
façon analogue pour des matrices de taille quelconque). Noter qu’il n’est pas commutatif
(parce que l’ordre sur {1, 2} × {1, 2} n’est pas invariant par permutation des deux facteurs),
mais que la matrice B ⊗ A est simplement obtenue à partir de A ⊗ B en faisant des permu-
tations de lignes et de colonnes.

Exercice 1.5. — Montrer les relations


rg(A ⊗ B) = rg(A) rg(B) , tr(A ⊗ B) = tr(A) tr(B) , dét(A ⊗ B) = dét(A)b dét(B)a
où, dans les deux dernières égalités, A est carrée d’ordre a et B carrée d’ordre b.

Exemples 1.6. — 1° L’application


ψ : V∗ ⊗ W −→ Hom(V, W) (28)
α⊗w 7−→ (v 7→ α(v)w)
est linéaire, injective, donc un isomorphisme si dim(V) < ∞, puisque les dimensions des
espaces source et but sont les mêmes. Concrètement, si (e i )1Éi Én est une base de V et que
(e i )1Éi Én est sa base duale, on a pour f ∈ Hom(V, W) la formule
n
ψ−1 ( f ) = e i ⊗ f (e i ).
X
i =1

2° Le produit tensoriel K[X] ⊗ K[Y] est isomorphe à K[X, Y], par l’application X i ⊗ Y j 7→
X i Y j (1) .
3° On peut définir plus généralement le produit tensoriel de modules sur un anneau
commutatif A. La construction est la même que sur un corps, mais son comportement
est plus compliqué. Si A = Z, les A-modules sont les groupes abéliens et on a par exemple
Zk ⊗Z Zl = Zkl , mais aussi (Z/nZ) ⊗Z Q = 0, (Z/3Z) ⊗Z (Z/2Z) = 0 et (Z/3Z) ⊗Z (Z/3Z) = Z/3Z
(pourquoi ?).
4° Extension des scalaires. Si on a un corps L ⊇ K et que V est un K-espace vectoriel,
puisque L est un K-espace vectoriel, on peut former le K-espace vectoriel
V L = V ⊗K L.
On peut donner à V L une structure de L-espace vectoriel de la manière suivante : si ` ∈ L,
la multiplication m ` par ` est un endomorphisme K-linéaire de L, donc on peut définir la
multiplication par ` sur V L comme l’endomorphisme 1 ⊗ m ` . Les propriétés de L-espace
vectoriel sont faciles à vérifier. On dit que V L est obtenu à partir de V par extension des
scalaires de K à L.

1. Mais attention : K(X) ⊗ K(Y) n’est pas isomorphe à K(X, Y) (pourquoi ?) !


2. ALGÈBRE TENSORIELLE 85

Un endomorphisme u ∈ EndK (V) s’étend en u L = u ⊗ 1 ∈ EndL (V L ). Si u a comme ma-


trice A dans une K-base (e i ) de V, alors u L a la même matrice A dans la L-base (e i ⊗ 1) de
VL.
Par exemple, si K = R et L = C, alors V C = V ⊗R C est la complexification de l’espace
vectoriel réel V.
Exercice 1.7. — Soient V et W des espaces vectoriels de dimension finie.
a) Quelle est l’image de l’ensemble des tenseurs décomposables par l’application (28) de l’ex.
1.6 ?
b) On sait que tout élément de V⊗W peut s’écrire comme somme de tenseurs décomposables.
Quel est le nombre maximal de tenseurs décomposables dont on a besoin ?

Exercice 1.8. — Soit f i une forme quadratique sur un K-espace vectoriel de dimension finie
Vi , pour i ∈ {1, 2}.
a) Montrer qu’il existe une unique forme quadratique f 1 ⊗ f 2 sur V1 ⊗ V2 qui vérifie
∀v 1 , v 2 ∈ V ( f 1 ⊗ f 2 )(v 1 ⊗ v 2 ) = f 1 (v 1 ) f 2 (v 2 ).
b) Montrer que si f 1 et f 2 sont non dégénérées, il en est de même de f 1 ⊗ f 2 .
c) Avec les notations de § II.4.2, montrer que
〈α1 , . . . , αm 〉 ⊗ 〈β1 , . . . , βn 〉 = 〈αi β j , 1 É i É m, 1 É j É n〉.
d) Si (V2 , f 2 ) est somme de plans hyperboliques, montrer qu’il en est de même pour (V1 ⊗
V2 , f 1 ⊗ f 2 ).
e) En déduire que le produit tensoriel des formes quadratiques définit une structure d’anneau
sur le groupe de Witt W(K) (§ II.6).

Exercice 1.9. — a) Rappeler la structure de R-algèbre de C ⊗R C.


b) Montrer qu’il y a deux structures de C-algèbre distinctes sur C ⊗R C.
c) Montrer que les C-algèbres M(2, C) et H ⊗R C sont isomorphes (H est le corps des quater-
nions, cf. § II.11).
d) Montrer que les R-algèbres H ⊗R H et M(4, R) sont isomorphes.

2. Algèbre tensorielle
2.1. Applications n-linéaires. — On a vu dans la section précédente que (V1 ⊗ V2 ) ⊗ V3
et V1 ⊗ (V2 ⊗ V3 ) sont canoniquement isomorphes. Aussi notera-t-on généralement sans
parenthèse V1 ⊗ V2 ⊗ V3 . Par récurrence, sont canoniquement équivalents tous les choix
pour étendre cette définition à un produit tensoriel
V1 ⊗ · · · ⊗ Vd
de d espaces vectoriels.
Une autre manière de voir l’unicité est d’exprimer V1 ⊗ · · · ⊗ Vd et l’application
(v 1 , . . . , v d ) 7→ v 1 ⊗ · · · ⊗ v d (29)
comme solution d’un problème universel. Une application d -linéaire V1 × · · · × Vd → E est
une application qui est linéaire par rapport à chacun des facteurs Vi .

Lemme 2.1. — L’application V1 × · · · × Vd → V1 ⊗ · · · ⊗ Vd définie par (29) est d -linéaire et


elle est universelle pour cette propriété.
86 CHAPITRE III. ALGÈBRE TENSORIELLE

L’image de cette application est à nouveau constituée des tenseurs décomposables.

Démonstration. — Notons Multd (V1 × · · · × Vd , E) l’espace vectoriel des applications n-


linéaires de V1 × · · · × Vn vers E. On a clairement
Multn (V1 × · · · × Vd , E) = Hom(V1 , Multd −1 (V2 × · · · × Vd , E)).
Il s’agit de montrer que Hom(V1 ⊗ · · · ⊗ Vd , E) = Multd (V1 × · · · × Vd , E), où l’isomorphisme
est donné par la composition avec (29). On raisonne par récurrence sur d . En appliquant
(26), on obtient
Hom(V1 ⊗ · · · ⊗ Vd , E) = Hom(V1 , Hom(V2 ⊗ · · · ⊗ Vd , E))
= Hom(V1 , Multd −1 (V2 × · · · × Vd ), E)
= Multd (V1 × · · · × Vd , E).

De la même manière que pour le produit tensoriel, si on a des applications linéaires


f i : Vi → Wi , on obtient une application linéaire unique
f 1 ⊗ · · · ⊗ f d : V1 ⊗ · · · ⊗ Vd −→ W1 ⊗ · · · ⊗ Wd
qui vérifie sur les tenseurs décomposables la relation
( f 1 ⊗ · · · ⊗ f d )(v 1 ⊗ · · · ⊗ v d ) = f 1 (v 1 ) ⊗ · · · ⊗ f d (v d ).

Remarque 2.2. — Soient V1 , . . . , Vd des espaces vectoriels de dimension finie. Tout élé-
ment de V1 ⊗ · · · ⊗ Vd peut donc s’écrire comme somme de tenseurs décomposables. On
peut se poser la question de savoir le nombre maximal de tenseurs décomposables dont
on a besoin. Lorsque d = 2, c’est l’objet de l’exerc. 1.7. En général, on ne connaît la réponse
à cette importante question que dans certains cas.

2.2. Algèbres graduées. — Rappelons qu’une K-algèbre est un K-espace vectoriel A muni
d’un produit A × A → A qui est une application bilinéaire et qui fait de A un anneau. Elle
est donc associative, mais pas nécessairement commutative. Toutes les algèbres que nous
considérerons seront munies d’une unité, c’est-à-dire d’un élément 1 tel que a ·1 = 1·a = a
pour tout a ∈ A. On a 1 = 0 si et seulement si A = 0.
L’algèbre A est graduée si elle est munie d’une décomposition
M
A= Ad
d ∈N
en somme directe d’espaces vectoriels telle que
∀d , e ∈ N Ad · Ae ⊆ Ad +e .
Si A a une unité, on a 1 ∈ A0 .
Par exemple, l’algèbre K[X] des polynômes à une indéterminée est graduée par K[X] =
L d
KX . L’algèbre (commutative) A = K[X 1 , . . . , X r ] des polynômes à plusieurs indéterminés
est également graduée si on définit Ad comme le sous-espace vectoriel des polynômes
i i
nuls ou homogènes de degré total d , donc engendré par les X 11 · · · X rr pour i 1 + · · · + i r = d .
Un élément non nul x ∈ A est dit homogène s’il existe d tel que x ∈ Ad ; on dit alors que
x est de degré d .
2. ALGÈBRE TENSORIELLE 87

Un morphisme d’algèbres graduées est un morphisme d’algèbres f : A → B qui préserve


la graduation : f (Ad ) ⊆ Bd pour tout d ∈ N.

2.3. Algèbre tensorielle. — On définit les puissances tensorielles d’un espace vectoriel V
par T 0 V = K et, pour n Ê 1,
T d V := V · · ⊗ V} =: V ⊗d .
| ⊗ ·{z
d fois

On peut voir aussi (canoniquement) T d V comme le dual de Multd (V d , K), l’espace vecto-
riel des formes d -linéaires sur V.
L’algèbre tensorielle de V est définie par
M d
TV = T V. (30)
n∈N

Pour en faire une algèbre, nous devons définir un produit sur TV. C’est

Td V × Te V −→ T d +e V
(v 1 ⊗ · · · ⊗ v d , w 1 ⊗ · · · ⊗ w e ) 7−→ v1 ⊗ · · · ⊗ vd ⊗ w1 ⊗ · · · ⊗ we .

Compte tenu des propriétés du produit tensoriel vues plus haut, ce produit est associatif et
fait de TV une algèbre, munie de l’unité 1 ∈ K = T 0 V. Cette algèbre n’est pas commutative
dès que dim(V) Ê 2 : on a v 1 ⊗ v 2 6= v 2 ⊗ v 1 dès que v 1 et v 2 ne sont pas proportionnels.
La décomposition (30) en fait une algèbre graduée. Noter la présence d’une injection
canonique ι : V ,→ TV puisque T 1 V s’identifie à V.
Si V a pour base (e i )i ∈I , alors TV a pour base les e i 1 ⊗ · · · ⊗ e i d pour d ∈ N et i 1 , . . . , i d ∈ I.
Même si l’espace vectoriel V est de dimension finie, l’espace vectoriel TV est toujours de
dimension infinie dès que V 6= 0.

Proposition 2.3 (Propriété universelle). — L’algèbre tensorielle TV satisfait la propriété


universelle suivante : si f : V → A est une application linéaire vers une algèbre avec unité
A, il existe un morphisme d’algèbres, fˆ : TV → A, unique, tel que f = fˆ ◦ ι, c’est-à-dire le
diagramme suivant est commutatif
f
V A

ι

TV

Démonstration. — Comme l’application

Vd −→ A
(v 1 , . . . , v d ) 7−→ f (v 1 ) · · · f (v d )

est d -linéaire, la propriété universelle de T d V permet de définir l’application linéaire fˆ :


T d V → A. Reste à montrer que c’est bien un morphisme d’algèbres. Il suffit de le vérifier
88 CHAPITRE III. ALGÈBRE TENSORIELLE

sur les tenseurs décomposables, qui engendrent TV ; or on a


fˆ((v 1 ⊗ · · · ⊗ v d ) ⊗ (w 1 ⊗ · · · ⊗ w e )) = f (v 1 ) · · · f (v d ) f (w 1 ) · · · f (w e )
= fˆ(v 1 ⊗ · · · ⊗ v d ) fˆ(w 1 ⊗ · · · ⊗ w e ),
ce qui montre ce qu’on veut.

Comme dans tous les cas précédents, la propriété universelle implique la fonctorialité
de la construction : si on a une application linéaire f : V → W, il y a un morphisme d’al-
gèbres, unique, T f : TV → TW, tel que le diagramme suivant soit commutatif :
f
V W
ιV ιW

Tf
TV TW

T d f . En outre, on a la propriété
L
Le morphisme T f n’est autre que
T( f ◦ g ) = T f ◦ Tg .

2.4. Tenseurs covariants et contravariants. — Ce paragraphe une tentative pour expli-


quer le language et les notations utilisés en physique (et parfois aussi en géométrie dif-
férentielle). Soit V un espace vectoriel et soit V ∗ son espace vectoriel dual, c’est-à-dire
Hom(V, K). Les « tenseurs » considérés par les physiciens sont en général des éléments d’un
produit tensoriel

· · ⊗ V ∗} ⊗ V
|V ⊗ ·{z · · ⊗ V} = T p V ∗ ⊗ T q V.
| ⊗ ·{z
p fois q fois
Un tel tenseur T est dit « p fois covariant et q fois contravariant ». Si on choisit une base
(e 1 , . . . , e d ) de V, de base duale (e 1 , . . . , e d ) de V ∗ , on écrit les coordonnées de T comme
i 1 ...i q
Tj . Dans notre language, cela signifie
1 ... j p

i 1 ...i q j 1
⊗ · · · ⊗ e jp ⊗ ei1 ⊗ · · · ⊗ eiq
X
T= Tj e
1 ... j p
i 1 ,...,i q , j 1 ,..., j p

(on remarque que la famille des e j 1 ⊗ · · · ⊗ e j p ⊗ e i 1 ⊗ · · · ⊗ e i q est une base de T p V ∗ ⊗ T q V).


En physique, on utilise la convention de sommation d’Einstein et on écrit simplement
i 1 ...i q j 1
T = Tj e ⊗ · · · ⊗ e jp ⊗ ei1 ⊗ · · · ⊗ eiq
1 ... j p

i 1 ...i q
(il est entendu qu’on somme sur les indices répétés en haut et en bas). On dit que les T j
1 ... j p
sont les coordonnées du tenseur T.
Soit v = v j e j un élément de V. Dans une autre base (e 10 , . . . , e d0 ), définie par la matrice
j j
de passage P = (Pi ) et e i0 = Pi e j , on a v = v 0i e i0 , avec
j
v = v 0i e i0 = v 0i Pi e j ,
j
d’où v j = Pi v 0i , ou encore
v 0i = (P −1 )ij v j .
3. ALGÈBRE EXTÉRIEURE 89

On dit que les coordonnées de v se transforment en sens inverse des vecteurs de base (d’où
la terminologie « contravariant »). Inversement, pour une forme linéaire α = α j e j = α0i e 0i ,
on a
j j
α0i = α(e i0 ) = α(Pi e j ) = Pi α j .
Les composantes de α se transforment donc dans le même sens que les vecteurs de base
i 1 ...i q
(d’où la terminologie « covariant »). Pour un tenseur général T = (T j ) qui est p fois
1 ... j p
covariant et q fois contravariant, on vérifie que ses coordonnées dans la base (e 10 , . . . , e d0 )
sont
0i 0 ...i q0 i0 j j i 1 ...i q
T j 01... j 0 = (P −1 ) j1 · · · (P −1 )ij Pi · · · Pi T j .
1 p 1 ... j p

Tout cela a en général lieu en présence d’une « métrique », c’est-à-dire d’une forme bili-
néaire B non dégénérée sur V (produit scalaire ou forme de Lorentz ; cf. exerc. II.11.7).
On appelle B le tenseur métrique (par le cor. 1.2, on peut voir B comme un élément de
(V ⊗ V)∗ ' V ∗ ⊗ V ∗ , donc comme un tenseur 2 fois covariant) et on le note par sa matrice
g i j = B(e i , e j ) dans la base (e 1 , . . . , e d ) de V. Comme la forme B est non dégénérée, elle

induit un isomorphisme B̂ : V → V ∗ (prop. II.3.2) qui identifie les vecteurs (contravariants)
aux formes linéaires (covariantes). En coordonnées, on a B̂(e j )(e i ) = B(e j , e i ) = g j i , d’où

B̂(v j e j ) = v j g j i e i .

On passe donc des coordonnées contravariantes (v j ) aux coordonnées covariantes (v i )


par la formule v i = v j g j i . On peut faire le même genre de manipulations avec les tenseurs.
L’exercice est laissé au lecteur.
L’isomorphisme B̂ permet aussi de transporter la métrique B en une métrique B∗ sur
V ∗ . On vérifie que la matrice g i j := B∗ (e i , e j ) de B∗ dans la base duale (e 1 , . . . , e d ) de V ∗
est la matrice inverse de la matrice (g i j ), c’est-à-dire g i j g j k = δki . Ce « tenseur métrique
dual » permet de passer des coordonnées covariantes aux coordonnées contravariantes
par la formule v j = v i g i j . Finalement, le produit scalaire s’écrit

B(u, v) = u i v i = u i v i = g i j u i v j = g i j u i v j .

3. Algèbre extérieure
On a introduit dans la section précédente l’algèbre tensorielle TV = T d V, où T d V est
L

canoniquement le dual de Multd (V d , K) (les formes d -linéaires sur V). Dans cette section,
nous faisons une construction analogue pour l’espace Altd (V) des formes d -linéaires al-
ternées sur V, c’est-à-dire satisfaisant α(v 1 , . . . , v d ) = 0 dès que deux des vecteurs v 1 , . . . , v d
sont égaux.
L’algèbre extérieure V, avec une inclusion ι : V ,→ V, sera la solution du problème
V V

universel pour les applications linéaires f : V → A de V vers une algèbre avec unité A,
satisfaisant l’identité
f (v)2 = 0. (31)
Compte tenu de la propriété universelle de l’algèbre TV, l’injection ι doit se factoriser via
V
TV ; en même temps, comme dans les cas précédents, V sera engendrée par les images
90 CHAPITRE III. ALGÈBRE TENSORIELLE

V
des tenseurs décomposables. Il est donc légitime de chercher V comme quotient de TV,
sous la forme (2)
^
V = TV/I.
Il faut mettre dans l’idéal I tout ce dont on a besoin pour factoriser les applications
satisfaisant (31). Les éléments de la forme v ⊗ v, pour v ∈ V sont de ce type, puisqu’ils sont
envoyés sur 0. Il est alors naturel de définir I ⊆ TV comme l’idéal bilatère engendré par les
éléments de type v ⊗ v, pour v ∈ V, c’est-à-dire l’ensemble des sommes finies d’éléments
de TV du type
a ⊗ v ⊗ v ⊗ b,
pour v ∈ V et a, b ∈ TV, et l’algèbre extérieure par
^
V = TV/I.
La composition V ,→ TV → TV/I fournit l’application ι : V →
V
V.

Proposition 3.1. — L’algèbre extérieure satisfait la propriété universelle suivante : si f :


V → A est une applciation linéaire vers une algèbre avec unité, telle que f (v)2 = 0 pour
tout v, alors f se factorise de manière unique en f = fˆ ◦ ι, où fˆ : V → A est un morphisme
V

d’algèbres :
f
V A

ι

V
V

Démonstration. — Par la propriété universelle de TV (prop. 2.3), on a une factorisation


de f par une application linéaire g : TV → A. Puisque g (v ⊗ v) = f (v)2 = 0, l’application g
s’annule sur l’idéal I donc g passe au quotient pour fournir un morphisme d’algèbres fˆ :
V V
V = TV/I → A. Il est manifestement unique puisque V est engendrée par les tenseurs
décomposables. La démonstration se résume ainsi par le diagramme

f
V A

ι TV

V
V

2. Comme pour les anneaux, on peut définir le quotient d’une algèbre A par un idéal bilatère I, c’est-à-dire un
sous-espace vectoriel I ⊆ A satisfaisant AI ⊆ I et IA ⊆ I. On forme alors le quotient comme espace vectoriel A/I et
les propriétés AI ⊆ I et IA ⊆ A sont exactement ce qu’il faut pour que la multiplication passe au quotient.
3. ALGÈBRE EXTÉRIEURE 91

Comme conséquence de la prop. 3.1 ou du même énoncé pour le produit tensoriel, on


obtient le résultat suivant.

Proposition 3.2. — Si f : V → W est une application linéaire, elle induit un morphisme


d’algèbres f : V → W tel que ιW ◦ f = f ◦ ιV . En outre, ( f ◦ g ) = f ◦ g .
V V V V V V V

V
Décrivons maintenant de manière plus concrète l’algèbre V. Pour cela, remarquons
que I est un idéal homogène de TV, c’est-à-dire qu’on a

(I ∩ T d V).
M
I=
d

En effet, un élément de I est une somme finie d’éléments de type a⊗v ⊗v ⊗b, pour a, b ∈ TV
et v ∈ V. En écrivant a et b comme somme d’éléments homogènes, on voit que chaque
a ⊗ v ⊗ v ⊗ b est somme d’éléments homogènes qui sont dans I (3) .
V
Il en résulte que le quotient V = TV/I est encore une algèbre graduée :
d
T d V/(T d V ∩ I) =:
^ M M^
V= V,
d d
Vd
où V est appelée la puissance extérieure d -ième de V.
Puisque l’idéal I est engendré par les éléments v ⊗ v, il ne rencontre T 0 V et T 1 V = V
qu’en 0, donc
^0 ^ 1
V = K, V=V
et le morphisme ι : V → V est une injection.
V
V V
Le produit dans V est appelé produit extérieur et noté ∧. Le K-espace vectoriel V
V
est engendré par les v 1 ∧ · · · ∧ v d pour d ∈ N et v 1 , . . . , v d ∈ V. Le fait que l’algèbre V soit
graduée s’écrit
d
^ e
^ d^
+e
V∧ V⊆ V.
Si f : V → W est une application linéaire, il s’ensuit qu’on a
^ d
M^ d
^ d
^ d
^
f = f, avec f : V −→ W.
d

Proposition 3.3. — L’application d -linéaire


d
Vd
^
−→ V
(v 1 , . . . , v d ) 7−→ v1 ∧ · · · ∧ vd

est alternée. En particulier, pour tout σ ∈ Sd et v 1 , . . . , v d ∈ V, on a

v σ(1) ∧ · · · ∧ v σ(n) = ε(σ)v 1 ∧ · · · ∧ v d . (32)

3. Plus généralement, un idéal d’une algèbre graduée qui est engendré par des éléments homogènes (comme
c’est le cas pour I) est homogène.
92 CHAPITRE III. ALGÈBRE TENSORIELLE

V
Démonstration. — Par définition de I et de V, l’expression v 1 ∧ · · · ∧ v d est nulle dès
que deux consécutifs des vecteurs v 1 , . . . , v d sont égaux. De v ∧ v = w ∧ w = (v + w) ∧ (v +
w) = 0, on déduit l’identité w ∧ v = −v ∧ w. Cela entraîne que la relation (32) est vérifiée
lorsque σ est une transposition du type (i i + 1). Or, si cette relation est vérifiée pour des
transpositions σ et τ et tous v 1 , . . . , v d ∈ V, on a

v τσ(1) ∧ · · · ∧ v τσ(n) = ε(τ)v σ(1) ∧ · · · ∧ v σ(n)


= ε(τ)ε(σ)v 1 ∧ · · · ∧ v d ,

c’est-à-dire qu’elle est vérifiée pour le produit τσ. Comme les transpositions (12), (23), . . . ,
((n − 1) n) engendrent Sd (ex. I.1.8.2°), cela démontre (32).
Si deux des vecteurs v 1 , . . . , v d sont égaux, on se ramène par une permutation adéquate
au cas où ils sont consécutifs, d’où on déduit (en utilisant (32)) v 1 ∧ · · · ∧ v d = 0 ; l’applica-
tion (v 1 , . . . , v d ) 7→ v 1 ∧ · · · ∧ v d est donc bien alternée.
Vd
Proposition 3.4. — L’algèbre graduée V est anticommutative, c’est-à-dire que si α ∈
V
V
et β ∈ e V, on a β ∧ α = (−1)d e α ∧ β.
V

Démonstration. — Il suffit de le montrer lorsque α et β sont des produits extérieurs d’élé-


ments de V. Cela se déduit de l’identité w ∧ v = −v ∧ w.
Vd
Proposition 3.5 (Propriétés de V). — 1° L’application d -linéaire alternée
d
Vd
^
−→ V
(v 1 , . . . , v d ) 7−→ v1 ∧ · · · ∧ vd

satisfait la propriété universelle suivante : si on a une application d -linéaire alternée a :


V d → E, il existe une unique application linéaire â : d V → E telle que le diagramme sui-
V

vant soit commutatif


a
Vd E


Vd
V.

En particulier, Altd (V) ' ( d V)∗ .


V

2° Si (e 1 , . . . , e n ) est une base de V, alors (e i 1 ∧ · · · ∧ e i d )1Éi 1 <···<i d Én est une base de d V.


V
Vd
En particulier, on a V = 0 pour d > n, et
à !
^d n
dim( V) = .
d

3° Si V est de dimension finie n et 0 É d É n, la forme bilinéaire


d
^ n−d
^ n
^
V× V −→ V'K
(α, β) 7−→ α∧β
3. ALGÈBRE EXTÉRIEURE 93

est non dégénérée. En particulier, on a un isomorphisme non canonique (4)


d n−d
V)∗ '
^ ^
( V.
4° Il existe une application bilinéaire
d d
(V ∗ ) × V
^ ^
−→ K
(α1 ∧ · · · ∧ αn , v 1 ∧ · · · ∧ v n ) 7−→ dét(αi (v j ))1Éi , j Én
et elle est est non dégénérée. Si V est de dimension finie, on en déduit un isomorphisme
canonique
d d ¢

(V ∗ ) '
^ ¡^
V .
Vd
5° Si V est de dimension finie d , on a dim( V) = 1 par le point 2°. Si f ∈ End(V), l’endo-
morphisme d f de d V est donc la multiplication par un scalaire, qui est dét( f ).
V V

Le point 4° est utile notamment en géométrie différentielle : les applications de Rn dans


Vd
(Rn )∗ sont en effet les formes différentielles sur Rn .

Démonstration. — 1° Par la propriété universelle de T d V, l’application d -linéaire a se fac-


torise en a = g ◦i , où g ∈ Hom(T d V, E) et i est l’application d -linéaire canonique V d → T d V.
Mais, parce que a est alternée, g s’annule sur I∩T d V, donc se factorise à travers le quotient
Vd
V en une application linéaire â ∈ Hom( d V, E). L’unicité de â provient du fait que d V
V V

est engendré par les v 1 ∧ · · · ∧ v n .


2° et 3° Par (32), les (e i 1 ∧ · · · ∧ e i d )1Éi 1 <···<i d Én engendrent d V et il reste à voir qu’ils
V

sont linéairement indépendants. C’est le cas lorsque d = n : il existe en effet une forme
n-linéaire alternée non nulle, à savoir le déterminant (dans une base donnée), donc n V
V

n’est pas nul. Comme il est engendré par e 1 ∧ · · · ∧ e n , il est de dimension 1 et ce vecteur
n’est pas nul.
Fixons 1 É j 1 < · · · < j n−d É n ; le seul cas où le produit extérieur de e i 1 ∧ · · · ∧ e i d avec
e j 1 ∧· · ·∧e j n−d est non nul est lorsque { j 1 , . . . , j n−d } est le complémentaire de {i 1 , . . . , i d } dans
{1, . . . , n}. On en déduit que les (e i 1 ∧ · · · ∧ e i d )1Éi 1 <···<i d Én sont linéairement indépendants,
ainsi que le point 3°.
4° Compte tenu des propriétés d’antisymétrie du déterminant, la formule proposée est
alternée en les αi et en les v j et fournit donc bien une application bilinéaire b : d (V ∗ ) ×
V
Vd
V → K. Si (e i ) est une base de V et (e i ) la base duale, b(e i 1 ∧· · ·∧e i n , e j 1 ∧· · ·∧e j n ) = 1 ou
0 suivant que i k = j k pour tout k ou non. Ainsi la forme b est non dégénérée et on obtient
une dualité dans laquelle (e i 1 ∧ · · · ∧ e i n ) est la base duale de (e j 1 ∧ · · · ∧ e j n ).
4° On a d f (e 1 ∧· · ·∧e d ) = f (e 1 )∧· · ·∧ f (e d ) = ( f i 1 e i )∧· · ·∧( f i d e i ) = dét( f )e 1 ∧· · ·∧e d
V P P

après développement.

Remarque 3.6 (Produit vectoriel). — Vous avez peut-être déjà rencontré le produit vec-
toriel de deux vecteurs dans l’espace vectoriel euclidien orienté R3 , ou plus généralement
le produit vectoriel de n − 1 vecteurs dans l’espace vectoriel euclidien orienté Rd , qu’on

4. Il dépend du choix d’un isomorphisme n V ' K. L’isomorphisme n V ⊗ ( d V)∗ ' n−d V est lui cano-
V V V V

nique (l’espace vectoriel n V est de dimension 1, mais n’est pas canoniquement isomorphe à K).
V
94 CHAPITRE III. ALGÈBRE TENSORIELLE

note v 1 ∧ · · · ∧ v n−1 en France, mais v 1 × · · · × v n−1 dans le monde anglo-saxon ; adoptons


cette dernière notation pour faire la différence avec le produit extérieur. Ce vecteur est
défini par la propriété
∀v ∈ V 〈v 1 × · · · × v n−1 , v〉 = dét(v 1 , . . . , v n−1 , v),
le déterminant étant pris dans une base orthonormale directe (il ne dépend alors pas du
choix de cette base).
D’autre part, le produit extérieur des n vecteurs d’une telle base fournissent un généra-
teur canonique de n V donc, par prop. 3.5.4°, un isomorphisme canonique n−1 V ' V ∗ .
V V

Si on le compose avec l’isomorphisme V ∗ ' V donné par le produit scalaire, on peut voir
l’élément v 1 ∧· · ·∧v n−1 de n−1 V comme un élément de V. Le lecteur vérifiera que ce n’est
V

autre que le produit vectoriel v 1 × · · · × v n−1 .

Exemple 3.7 (Grassmanniennes). — Soit V un espace vectoriel de dimension n. Pour


tout sous-espace vectoriel W ⊆ V de dimension d , la droite vectorielle d W est un
V
Vd
sous-espace vectoriel de V engendré par un tenseur décomposable. On peut donc
la considérer comme un point de l’espace projectif P( d V). Inversement, tout point de
V
Vd
P( V) qui correspond à une droite engendrée par un tenseur décomposable (non nul)
v 1 ∧ · · · ∧ v d définit un sous-espace vectoriel W ⊆ V de dimension d , à savoir 〈v 1 , . . . , v d 〉.
On a ainsi identifié l’ensemble des sous-espaces vectoriels de V de dimension fixée
d à un sous-ensemble (dit « grassmannienne ») de l’espace projectif P( d V) ; on le note
V

G(d , V) (lorsque d = 1, ce n’est autre que l’espace projectif P(V) !).


Lorsque K = R, c’est une variété différentiable de dimension d (n − d ).

Exercice 3.8. — a) Montrer que dans P( 2 K4 ), la grassmannienne G(2, K4 ) est une qua-
V

drique projective définie par l’« équation » ω ∧ ω = 0.


b) Montrer que toute grassmannienne G(d , V) ⊆ P( d V) est intersection de quadriques pro-
V

jectives.

Exercice 3.9. — Le but de cet exercice est de montrer que le groupe Spin(6) mentionné dans
la rem. II.11.5 est isomorphe à SU(4).
Soit b une forme sesquilinéaire hermitienne définie positive sur C4 et soit h la forme her-
mitienne associée.
a) Montrer que la formule
B(v 1 ∧ v 2 , w 1 ∧ w 2 ) := b(v 1 , w 1 )b(v 2 , w 2 ) − b(v 1 , w 2 )b(v 2 , w 1 )
définit une forme sesquilinéaire hermitienne définie positive sur ∧2 C4 .
b) Le groupe SU(C4 , h) ' SU(4) agit sur l’espace vectoriel C4 , donc aussi sur ∧2 C4 . Montrer
qu’il agit sur ce dernier espace par isométries directes pour la forme B. On en déduit un mor-
phisme de groupes φ : SU(4) → SU(∧2 C4 , B) ' SU(6).
c) Montrer que le produit
2 2 4
C4 × C 4 → C 4 ' C
^ ^ ^

est une forme bilinéaire symétrique non dégénérée sur 2 C4 . On note f la forme quadratique
V

associée.
d) Montrer que, pour l’action décrite en b), SU(4) agit sur 2 C4 par isométries pour f , c’est-
V
V2 4
à-dire im(φ) ⊆ O( C , f ).
e) Montrer que le noyau de φ est {± Id}.
3. ALGÈBRE EXTÉRIEURE 95

f) Montrer que l’image de φ est O( 2 C4 , f ) ∩ SU( 2 C4 , B) ' SO(6) et conclure (5) .


V V

Exercice 3.10. — Le but de cet exercice est de montrer que le groupe Spin0 (3, 3) mentionné
dans la rem. II.11.5 est isomorphe à SL(4, R) et que Spin0 (3, 2) est isomorphe à Sp(4, R). Soit V
l’espace vectoriel réel des matrices 4 × 4 antisymétriques réelles.
a) Montrer que le pfaffien définit une forme quadratique f sur V dont on déterminera la si-
gnature.
b) Montrer que l’action de GL(4, R) sur E définie par P · M = P M t P induit un morphisme de
groupes φ : SL(4, R) → O(V, f ).
c) Déterminer le noyau de φ.
d) Montrer que l’image de φ est isomorphe à SO0 (3, 3) (Indication : voir la note 5).
µ ¶
0 I2
e) On pose J := et on note H ⊆ V l’hyperplan orthogonal à J pour la forme quadra-
−I2 0
tique f . Quelle est la signature de la restriction de la forme quadratique f à H ?
f) Montrer que le groupe φ(Sp(4, R)) est isomorphe à SO0 (2, 3) et conclure (Indication : voir la
note 5).

3.1. Tenseurs antisymétriques. — Supposons car(K) = 0. Dans ce cas, on peut réaliser


Vd
V comme sous-espace vectoriel de T d V de la manière suivante. Chaque σ ∈ Sd induit
un endomorphisme K-linéaire σ̄ de T d V défini sur les tenseurs décomposables par
σ̄(v 1 ⊗ · · · ⊗ v d ) = v σ(1) ⊗ · · · ⊗ v σ(d ) .
d
Un tenseur t ∈ T V est dit antisymétrique si σ̄(t ) = ε(σ)t pour toute permutation σ ∈ Sd .
On notera a d V ⊆ T d V le sous-espace vectoriel des tenseurs antisymétriques.
Considérons l’application linéaire d’antisymétrisation
p : Td V −→ Td V
1 X
t 7−→ ε(σ)σ̄(t ).
d ! σ∈Sd

On a par exemple p(v 1 ⊗ v 2 ) = 21 (v 1 ⊗ v 2 − v 2 ⊗ v 1 ).

Proposition 3.11. — L’application linéaire p est un projecteur (p 2 = p), de noyau I ∩ T d V


et d’image a d V. Elle induit donc un isomorphisme a d V ' d V.
V

On prendra garde que d a d V n’est pas une sous-algèbre de TV, donc on ne peut pas
L
V
décrire la structure d’algèbre de V ainsi.
Démonstration. — Pour tout τ ∈ Sd , on a
1 X 1 X
τ̄(p(t )) = ε(σ)τ̄σ̄(t ) = ε(τ−1 σ0 )σ̄0 (t ) = ε(τ)p(t ).
d ! σ∈Sd d ! σ0 ∈Sd

L’image de p est donc contenue dans a d V.


Si t ∈ a d V, on a p(t ) = d1! σ∈d ε(σ)ε(σ)t = t . Donc p est l’identité sur a d V et p 2 = p :
P

c’est un projecteur d’image a d V.

5. Une inclusion résulte de b) et e). Il existe peut-être un argument élémentaire direct et purement algébrique
pour montrer l’autre inclusion mais je n’en connais pas. On utilise plutôt dans ce genre de situation un résultat
de géométrie différentielle qui dit qu’un morphisme à noyau fini entre groupes de Lie réels (ce que sont tous les
groupes qui interviennent dans cet exercice) connexes de même dimension (voir ex. 8.4.1° et 10.1.1°) est surjectif.
96 CHAPITRE III. ALGÈBRE TENSORIELLE

Montrons maintenant que I ∩ T d V est contenu dans le noyau de p. Remarquons qu’on


a, avec un calcul analogue à celui déjà fait, p(τ̄(t )) = ε(τ)p(t ) pour tout t ∈ T d V et tout
τ ∈ Sd .
L’espace vectoriel I ∩ T d V est engendré par les t = v 1 ⊗ · · · ⊗ v d , où v i = v i +1 pour un
i ∈ {1, . . . , d − 1}. Prenons pour τ la transposition (i i + 1). On a alors τ̄(t ) = t , donc p(t ) =
p(τ̄(t )) = ε(τ)p(t ) = −p(t ). Comme on est en caractéristique nulle, on a bien p(t ) = 0.
L’application p se factorise ainsi en une application linéaire surjective p̂ : d V  a d V.
V

Si π est la projection T d V  d V, on a
V

π ◦ p̂(v 1 ∧ · · · ∧ v d ) = π ◦ p(v 1 ⊗ · · · ⊗ v d )
à !
1 X
= π ε(σ)v σ(1) ⊗ · · · ⊗ v σ(d )
d ! σ∈Sd
1 X
= ε(σ)v σ(1) ∧ · · · ∧ v σ(d )
d ! σ∈Sd
1 X
= ε(σ)2 v 1 ∧ · · · ∧ v d
d ! σ∈Sd
= v1 ∧ · · · ∧ vd .

On a donc π ◦ p̂ = IdVd V . Donc p̂ est injective et I ∩ T d V = ker(p).

4. Pfaffien
Soit A = (a i j ) une matrice 2n × 2n alternée à coefficients dans un corps K de caractéris-
tique quelconque (6) . On lui associe
2
ρ(A) = K2n .
X ^
ai j e i ∧ e j ∈
1Éi < j É2n

Alors ρ(A)n ∈ 2n K2n . Soit (e 1 , . . . , e 2n ) la base standard de K2n ; on définit le pfaffien de A


V

par la formule :
ρ(A)n = n! Pf(A)e 1 ∧ · · · ∧ e 2n . (33)

A priori, cette formule ne définit Pf(A) que si car(K) = 0. Néanmoins, en développant ρ(A)n ,
on s’aperçoit que, pour car(K) = 0, le pfaffien Pf(A) est un polynôme en les coefficients de
la matrice A, indépendant de K, à coefficients entiers :

Pf ∈ Z[a i j ]. (34)

Pour un corps K quelconque, on utilise le morphisme d’anneaux canonique φ : Z → K pour


définir à partir de (34) le pfaffien Pf ∈ K[a i j ].

6. Cela signifie a j i = −a i j pour tous i , j ; en caractéristique 2, il faut ajouter la condition a i i = 0.


4. PFAFFIEN 97

Exemple 4.1. — Considérons la matrice

λ1
 
0
 1 0
−λ 

A=
 .. 
. (35)
 . 
λn 
 
 0
−λn 0
Pn
Alors ρ(A) = i =1
λi e 2i −1 ∧ e 2i et Pf(A) = λ1 · · · λn .

Exemple 4.2. — Considérons la matrice alternée

0 a 12 a 13 a 14
 
−a 12 0 a 23 a 24 
A= .
−a 13 −a 23 0 a 34 
−a 14 −a 24 −a 34 0

Alors

ρ(A)2 = (a 12 e 1 ∧ e 2 + a 13 e 1 ∧ e 3 + a 14 e 1 ∧ e 4 + a 23 e 2 ∧ e 3 + a 24 e 2 ∧ e 4 + a 34 e 3 ∧ e 4 )2
= (a 12 a 34 − a 13 a 24 + a 14 a 23 )e 1 ∧ e 2 ∧ e 3 ∧ e 4

donc Pf(A) = a 12 a 34 − a 13 a 24 + a 14 a 23 .

Exercice 4.3. — Montrer la formule suivante, pour toute matrice A = (a i j ) 2n × 2n alternée :

1
ε(σ)a σ(1),σ(3) · · · a σ(2n−1),σ(2n)
X
Pf(A) =
2n n! σ∈S
2n

ε(σ)a σ(1),σ(3) · · · a σ(2n−1),σ(2n) .


X
=
σ∈S2n , σ(1)<σ(3)<···<σ(2n−1)
σ(1)<σ(2),...,σ(2n−1)<σ(2n)

Lemme 4.4. — Si car(K) 6= 2, pour toute matrice P, on a ρ(t PAP) = (


V2
P)(ρ(A)) dans
V2 2n
K .

Démonstration. — Par calcul direct : si P = (p i j ) et A = (a kl ), on a t PAP = ( k, l p ki a kl p l j )i , j


P

et
1 X
ρ(t PAP) =
XX
p ki a kl p l j e i ∧ e j = p ki a kl p l j e i ∧ e j
i < j k, l 2 i , j , k, l
1X X
= a kl P(e k ) ∧ P(e l ) = a kl P(e k ) ∧ P(e l )
2 k, l k<l
2
^
= ( P)(ρ(A)).

Lemme 4.5. — Pour toute matrice P, on a l’identité Pf(t PAP) = dét(P) Pf(A).
98 CHAPITRE III. ALGÈBRE TENSORIELLE

Démonstration. — Il s’agit d’une identité entre polynômes à coefficients entiers en les


coefficients de A et P, qu’il suffit de tester pour K = Q. Mettant l’égalité du lemme 4.4 à la
puissance extérieure n-ième, on obtient
2 ¢n ¡ ^ ¢n
n! Pf(t PAP)e 1 ∧ · · · ∧ e 2n
¡^
= ( P)(ρ(A)) = ( P)(ρ(A))
2n
P)(ρ(A)n ) = ( P)(ρ(A)n )
^ ^
= (
= dét(P)n! Pf(A)e 1 ∧ · · · ∧ e 2n ,
V
où la troisième égalité utilise que P est un morphisme d’algèbres.

Théorème 4.6. — On a l’identité Pf(A)2 = dét(A).

Démonstration. — De nouveau, il s’agit d’une identité entre polynômes à coefficients en-


tiers en les coefficients de A, donc il suffit de la tester pour K = Q. Le théorème est vrai sur
les matrices de type (35), puisque le pfaffien est i λi et le déterminant i λ2i . Or, par la
Q Q

théorie des formes alternées (sur un corps de caractéristique 6= 2), toute matrice antisy-
métrique s’écrit sous la forme t PAP, où P est inversible et A de la forme (35), avec λi = 1
ou 0 (il suffit de décomposer K2n = ker(A)⊕E et de choisir une base hyperbolique de E). Le
théorème découle alors du lemme 4.5.

Exercice 4.7. — Vérifier directement avec l’exerc. 4.2 la conclusion du théorème pour les ma-
trices alternées d’ordre 4.

Comme conséquence, on obtient une seconde démonstration (valable aussi en carac-


téristique 2 !) du fait que les transformations symplectiques sont de déterminant 1.

Corollaire 4.8. — Pour tout corps K, on a l’inclusion Sp(2n, K) ⊆ SL(2n, K).

Démonstration. — On a
Sp(2n, K) = {P ∈ GL(2n, K) | t PJ2n P = J2n },
où J2n est la matrice alternée définie en (15). Par le lemme 4.5, un élément P de Sp(2n, K)
satisfait dét(P) Pf(J2n ) = Pf(J2n ), ce qui implique dét(P) = 1 puisque J2n est inversible.

5. Algèbre symétrique
On sera ici très bref car la construction est entièrement parallèle à celle de l’algèbre
extérieure. Le problème universel à résoudre ici est celui pour les morphismes V → A où
A est une algèbre commutative avec unité. L’algèbre solution de ce problème est l’algèbre
symétrique SV, obtenue comme le quotient
SV := TV/J,
où J est l’idéal de TV dans lequel on a mis exactement ce qu’il faut pour que le quotient
soit commutatif. Donc J est l’idéal engendré par les éléments du type
v ⊗ w − w ⊗ v.
5. ALGÈBRE SYMÉTRIQUE 99

L’idéal J est à nouveau homogène, donc se décompose en J = d J ∩ T d V, et on a une dé-


L

composition
M d
SV = S V, S d V = T d V/(J ∩ T d V).
En particulier, S 0 V = K et S 1 V = V, d’où l’injection canonique V ,→ SV. Le produit dans
l’algèbre symétrique est noté sans signe particulier : par exemple v 1 v 2 = v 2 v 1 .
Une application linéaire f : V → W donne une application linéaire S f : SV → SW, avec
S f = d S d f . On a bien sûr la propriété S( f ◦ g ) = S f ◦ Sg .
L

Les propriétés de S d V sont les suivantes.


1° L’application d -linéaire
Vd −→ Sd V
(v 1 , . . . , v d ) 7−→ v1 · · · vd
est symétrique et elle est universelle pour cette propriété ; en particulier (S d V)∗
(7)

est l’espace vectoriel des formes d -linéaires symétriques sur V.


k k
2° Si (e 1 , . . . , e n ) est une base de V, une base de S d V est donnée par les (e i 1 · · · e i r ) pour
1 r
tout r -uplet 1 É i 1 < · · · < i r É n et entiers k i tels que k 1 + · · · + k r = d ; on a donc
à !
d n +d −1
dim(S V) = .
n −1
En particulier, si V 6= 0, l’espace vectoriel SV est toujours de dimension infinie,
V
contrairement à V.
3° Si V est de dimension n, l’algèbre SV est isomorphe à l’algèbre de polynômes
K[X 1 , . . . , X n ] : si (e 1 , . . . , e n ) est une base de V, un isomorphisme est obtenu en
envoyant e i sur X i .
4° Si car(K) = 0, on peut réaliser S d V à l’intérieur de T d V comme le sous-espace s d V
des tenseurs symétriques, c’est-à-dire des tenseurs t satisfaisant σ̄(t ) = t pour tout
σ ∈ Sn ; en effet, on dispose alors d’une symétrisation
q : Td V −→ Td V
1 X
v1 ⊗ · · · ⊗ vd 7−→ v σ(1) ⊗ · · · ⊗ v σ(d )
d ! σ∈Sd

qui est une projection d’image s d V et de noyau J ∩ T d V. Elle induit ainsi s d V ' S d V.
5° Pour d = 2, si car(K) 6= 2, on peut toujours écrire
1 1
v ⊗ w = (v ⊗ w − w ⊗ v) + (v ⊗ w + w ⊗ v) = p(v ⊗ w) + q(v ⊗ w),
2 2
donc on obtient une décomposition de tout 2-tenseur en somme d’un tenseur anti-
symétrique et d’un tenseur symétrique :
T 2 V = a 2 V ⊕ s 2 V. (36)

7. Une application d -linéaire f est symétrique si f (v σ(1) , . . . , v σ(d ) ) = f (v 1 , . . . , v d ) pour tout σ ∈ Sd . De nou-
veau, on sait par définition de J que cette propriété est vraie lorsque σ est une transposition (i i + 1) et il faut un
petit argument pour l’étendre à toutes les permutations.
100 CHAPITRE III. ALGÈBRE TENSORIELLE

Remarque 5.1 (Foncteurs de Schur). — Supposons car(K) = 0. La décomposition (36)


n’est plus valable pour T d V lorsque d Ê 3 ; on a bien une inclusion (8)
Td V ⊇ a d V ⊕ s d V
mais elle est stricte pour d Ê 3. Il suffit pour s’en convaincre de calculer les dimensions
pour d = 3 :
à ! à !
3 3 3 3 n n +2 n(n − 1)(n − 2) n(n + 1)(n + 2)
dim(T V) = n > dim(a V) + dim(s V) = + = + .
3 3 6 6
2
Le bout manquant est un sous-espace vectoriel de T 3 V de dimension 2 n(n3−1) . Il est
somme directe de deux copies d’un espace vectoriel canonique noté S(2,1) V (voir exerc.
5.2).
En général, on a une décomposition canonique
¢m
V ⊗d = S(λ1 ,...,λn ) V λ
M ¡
λ1 Ê···Êλn Ê0
λ1 +···+λn =d

où les m λ sont des entiers strictement positifs et les S(λ1 ,...,λn ) sont les foncteurs (9) de Schur,
avec (on ne note pas les λi nuls)
– S(1,...,1) V ' a d V ;
|{z}
d fois
– S(d ) V ' s d V ;
– S(λ1 ,...,λn ) V est une représentation irréductible de GL(V) (cf. déf. IV.1.3) de dimension
Y λi − λ j + j − i
.
1Éi < j Én j −i

Exercice 5.2. — Soit K corps de caractéristique nulle et soit V un K-espace vectoriel.


a) Montrer que le sous-espace vectoriel S de V ⊗3 engendré par les v 1 ⊗ v 2 ⊗ v 3 + v 2 ⊗ v 1 ⊗ v 3 −
v 1 ⊗ v 3 ⊗ v 2 − v 2 ⊗ v 3 ⊗ v 1 est à la fois dans le noyau de l’antisymétrisation p et dans celui de
la symétrisation q.
b) En déduire V ⊗3 ⊇ a 3 V ⊕ s 3 V ⊕ S.
c) Montrer que S est dans l’image de l’application linéaire injective f : V ⊗ 2 V → V ⊗3 donnée
V

par v 1 ⊗ (v 2 ∧ v 3 ) 7→ v 1 ⊗ v 2 ⊗ v 3 − v 1 ⊗ v 3 ⊗ v 2 .
d) On considère l’application linéaire g : V ⊗ 2 V → 3 V donnée par la structure d’algèbre de
V V
V V1
V (avec le fait que V = V). Montrer que g est surjective et que S = f (ker(g )). En déduire la
dimension de S.
e) Soit S 0 le sous-espace vectoriel de V ⊗3 engendré par les v 1 ⊗ v 2 ⊗ v 3 + v 2 ⊗ v 1 ⊗ v 3 − v 3 ⊗ v 2 ⊗
v 1 − v 3 ⊗ v 1 ⊗ v 2 . Montrer que S 0 est isomorphe à S et que
3
V ⊗3 = a 3 V ⊕ s 3 V ⊕ S ⊕ S 0 ' V ⊕ S3V ⊕ S2.
^

Les espaces S et S 0 sont des copies de S(2,1) V, qui est donc isomorphe au noyau de g : V ⊗
V2
V → 3 V.
V

8. La somme est bien directe puisque le projecteur p est l’identité sur a d V mais est nulle sur s d V.
9. La fonctorialité signifie que pour tout λ := (λ1 , . . . , λn ) et toute application linéaire f : V → W, il existe une
application linéaire canoniquement définie Sλ ( f ) : Sλ (V) → Sλ (W), avec Sλ (Id) = Id et Sλ ( f ◦ g ) = Sλ ( f ) ◦ Sλ (g )
(cf. prop. 3.2 et § 5).
6. ALGÈBRE DE CLIFFORD ET GROUPE SPINORIEL 101

Remarque 5.3. — Soit V un C-espace vectoriel de dimension finie n. Tout élément de S d V


peut s’écrire comme somme de tenseurs décomposables du type v · · · v (cf. rem. 2.2). On
peut se poser la question de savoir le nombre maximal de tenseurs décomposables dont
on a besoin (« problème de Waring »).
Lorsque d = 2, on peut interpréter un élément de S 2 V comme une forme bilinéaire
symétrique sur V ∗ ; une telle décomposition consiste alors à écrire la forme quadratique
associée comme somme de carrés de formes linéaires. La réduction de Gauss nous dit
qu’une forme quadratique est somme d’au plus d tels carrés. Dans ce cas, la réponse à la
question est donc n.
Pour d et n quelconques, on connaît la réponse à cette importante question lorsque le
tenseur à décomposer est « général » (travaux de Alexander et Hirschowitz dans les années
90) mais pas pour tous les tenseurs.

6. Algèbre de Clifford et groupe spinoriel


Dans le § II.11, on avait utilisé H, le corps des quaternions (une R-algèbre de dimension
4) et le groupe de ses éléments de norme 1 (isomorphe à SU(2)) agissant par conjugaison,
pour construire un morphisme de groupes surjectif de SU(2) vers le groupe orthogonal
O(3) pour la forme quadratique définie positive standard sur R3 .
Cette construction est un cas particulier d’une construction très générale, celle de l’al-
gèbre de Clifford d’un espace vectoriel muni d’une forme quadratique, qui nous permettra
de définir le groupe et la norme spinoriels déjà mentionnés dans la rem. II.11.5 et le § II.8.3.

6.1. Algèbre de Clifford d’une forme quadratique. — On part maintenant d’un espace
vectoriel V sur un corps K de caractéristique différente de 2, muni d’une forme quadra-
tique f . On cherche à résoudre le problème universel pour les morphismes g : V → A,
où A est une K-algèbre avec unité, qui vérifient g (v)2 = f (v)1A pour tout v ∈ V. L’algèbre
solution de ce problème est l’algèbre de Clifford C(V, f ) (notée parfois simplement C( f )),
obtenue comme le quotient
C(V, f ) = TV/I( f ),
où I( f ) est l’idéal bilatère de TV engendré par les éléments du type v ⊗ v − f (v). Contraire-
ment aux cas des algèbres extérieure et symétrique, l’idéal I( f ) n’est pas engendré par des
éléments homogènes (v ⊗ v est de degré 2 et f (v) est de degré 0), donc I( f ) n’est pas une
algèbre graduée au sens précédent (10) . On peut néanmoins la décomposer en
C( f ) = C( f )+ ⊕ C( f )− ,
où C( f )+ est l’ensemble des images des éléments de TV de degré pair et C( f )− l’ensemble
des images des éléments de TV de degré impair. La multiplication par un élément de C( f )+
laisse stable ces deux morceaux, tandis que la multiplication par un élément de C( f )− les
échange. En particulier, C( f )+ est une sous-algèbre de C( f ).
On a dans C( f ), pour tous v, w ∈ V, les égalités
v ·v = f (v) (37)
v ·w +w ·v = 2B(v, w), (38)
V
10. Sauf si f = 0, auquel cas C( f ) est simplement V.
102 CHAPITRE III. ALGÈBRE TENSORIELLE

où B est la forme bilinéaire associée à f .


Si (e 1 , . . . , e n ) est une base de V, on peut montrer que les produits e i 1 · . . . · e i k , avec k Ê
0 et 1 É i 1 < · · · < i k É n forment une base du K-espace vectoriel C( f ), qui est donc de
dimension 2d . Un tel produit est dans C( f )+ ou C( f )− selon que k est pair ou impair, donc
chacun des morceaux est de dimension 2n−1 . En particulier, s’il est de dimension finie, V
s’injecte canoniquement dans C( f )− .

Exemples 6.1. — 1° Considérons l’espace vectoriel V = R et sa base canonique (e 1 = 1),


muni de la forme quadratique f (x) = −x 2 . Une base de C( f ) est alors (1, e 1 ) avec les re-
lations e 12 = f (e 1 ) = −1. L’algèbre C( f ) est donc isomorphe au corps C des nombres com-
plexes.
2° Considérons l’espace vectoriel V = R2 et sa base canonique (e 1 , e 2 ), muni de la forme
quadratique f (x 1 , x 2 ) = −x 12 − x 22 . Une base de C( f ) est alors (1, e 1 , e 2 , e 1 e 2 ) avec les rela-
tions
e 12 = f (e 1 ) = −1 , e 22 = f (e 2 ) = −1 , e 1 · e 2 = −e 2 · e 1 .
Si on pose I := e 1 , J := e 2 et K := e 1 · e 2 = IJ, on vérifie les relations des quaternions (§ II.11)

IJK = K 2 = e 1 · e 2 · e 1 · e 2 = −e 12 · e 22 = −1.

L’algèbre C( f ) est donc isomorphe au corps non commutatif H des quaternions.

Exercice 6.2. — Déterminer la R-algèbre C(V, f ) dans les cas suivants :


– V = R et f (x) = x 2 ;
– V = R2 et f (x 1 , x 2 ) = x 12 + x 22 ;
– V = R2 et f (x 1 , x 2 ) = x 12 − x 22 .

Exercice 6.3. — Pour tous s, t Ê 0, on note C(s, t ) l’algèbre de Clifford de la forme quadratique
de signature (s, t ) sur V = Rs+t .
a) Pour tout n Ê 0, montrer qu’on a un isomorphisme de R-algèbres

C(0, n + 2) ' C(n, 0) ⊗R C(0, 2)

(Indication : si (e 1 , . . . , e n+2 ) est une base orthonormale de Rn+2 , (e 10 , . . . , e n


0 ) une base ortho-
n 00 00 2
normale de R et (e 1 , e 2 ) une base orthonormale de R , on pourra considérer l’application
linéaire Rn+2 → C(n, 0) ⊗R C(0, 2) qui envoie e i sur e i0 ⊗ e 100 · e 200 si i ∈ {1, . . . , n} et sur 1 ⊗ e i00−n si
i ∈ {n + 1, n + 2}).
b) Pour tous s, t Ê 0, montrer qu’on a un isomorphisme de R-algèbres

C(s + 1, t + 1) ' C(s, t ) ⊗R C(1, 1).

c) Pour tout n Ê 0, montrer qu’on a des isomorphismes de R-algèbres

C(0, n + 8) ' C(0, n) ⊗R C(0, 8)


C(n + 8, 0) ' C(n, 0) ⊗R C(8, 0)

et
C(0, 8) ' C(8, 0) ' M(16, R)
(Indication : on pourra utiliser les exerc. 6.2 et 1.9).
6. ALGÈBRE DE CLIFFORD ET GROUPE SPINORIEL 103

6.2. Groupe de Clifford. — On note α : C( f ) → C( f ) l’involution qui vaut Id sur C( f )+ et


− Id sur C( f )− . Elle vérifie α(x · y) = α(x) · α(y), pour tous x, y ∈ C( f ).
Pour tout x dans le groupe des unités C( f )× , on considère l’endomorphisme
ρx : z 7→ α(x) · z · x −1
de C( f ). On a ρ1 = IdC( f ) et, pour tous x, y ∈ C( f )× ,
ρx·y (z) = α(x · y) · z · (x · y)−1 = α(x) · α(y) · z · y −1 x −1 = ρx ◦ ρ y (z).
L’endomorphisme ρx est donc inversible (d’inverse ρx −1 ) et
Γ( f ) := {x ∈ C( f )× | ∀v ∈ V α(x) · v · x −1 ∈ V}.
est un sous-groupe de C( f )× stable par α appelé groupe de Clifford de f . On a par construc-
tion un morphisme de groupes
ρ : Γ( f ) −→ GL(V)
x 7−→ ρx .
Remarquons que tout élément non isotrope v de V (c’est-à-dire qui vérifie f (v) 6= 0) est
1
inversible dans C( f ), avec v −1 = f (v) v.

Proposition 6.4. — Tout v ∈ V non isotrope est dans Γ( f ) et ρv est la réflexion par rapport
à l’hyperplan v ⊥ (ex. III.5.2).

Démonstration. — Si B est la forme bilinéaire associée à f et que s v est la réflexion en


question, on a (ex. III.5.2)
B(v, w)
∀w ∈ V s v (w) = w − 2 v.
B(v, v)
Comme V est un sous-espace vectoriel de C( f ), on peut voir cette égalité entre éléments
de V comme une égalité dans C( f ). Elle s’écrit alors, en utilisant (37) et (38),
∀w ∈ V s v (w) = w − (v · w + w · v) · v −2 · v = −v · w · v −1 = α(v) · w · v −1 ,
puisque α est − Id sur V.

Lemme 6.5. — Si f est non dégénérée et V de dimension finie, le noyau de ρ est K× .

Démonstration. — Soit x un élément du noyau de ρ, qu’on écrit x = x + + x − , avec x ± ∈


C( f )± . On a alors α(x) · v = v · x pour tout v ∈ V, d’où ±x ± · v = v · x ± . Choisissons une base
orthogonale (e 1 , . . . , e n ) de V. On a alors, par (38),
e i · e j = −e j · e i si i 6= j.
On rappelle que les e i 1 · . . . · e i k , avec 1 É i 1 < · · · < i k É n forment une base du K-espace
vectoriel C( f ). On peut donc écrire x + = x 0+ + e 1 · x 1+ , où ni x 0+ ∈ C( f )+ , ni x 1+ ∈ C( f )− , ne
contient de facteur e 1 dans sa décomposition sur cette base. On a alors
e 1 · x 0+ + f (e 1 )x 1+ = e 1 · x + = x + · e 1 = x 0+ · e 1 + e 1 · x 1+ · e 1 = e 1 · x 0+ − f (e 1 )x 1+ .
Puisque f est non dégénérée, on a f (e 1 ) 6= 0, d’où on déduit x 1+ = 0, c’est-à-dire que x + ne
contient aucun facteur e 1 . On appliquant ce raisonnement avec les autres e i , on voit que
x + ne contient aucun facteur e i , c’est-à-dire x + ∈ K.
104 CHAPITRE III. ALGÈBRE TENSORIELLE

Si on écrit de la même façon x − = x 0− + e 1 · x 1− , on obtient x 1− = 0, c’est-à-dire x − ∈ K.


Mais on a alors x − ∈ K ∩ C( f )− = {0}.
Tout cela montre x = x + ∈ K ∩ C( f )× = K× .

6.3. Norme et groupe spinoriels. — On définit une deuxième involution t : C( f ) → C( f )


de la façon suivante. Soit C( f )0 l’algèbre opposée à C( f ), c’est-à-dire le même espace vec-
0
toriel, mais où la multiplication x · y est donnée par y · x. Comme le problème universel
dont l’application linéaire V → C( f ) est la solution a une unique solution à isomorphisme
près, il existe un isomorphisme d’algèbres t : C( f ) → C( f )0 . Cet isomorphisme vérifie donc
t (x · y) = t (y) · t (x), pour tous x, y ∈ C( f ). De nouveau, par unicité, t est une involution.
Lorsque V est de dimension finie, de base (e 1 , . . . , e n ), on peut décrire l’action de t sur
une base de C( f ) :
t (e i 1 · . . . · e i k ) = e i k · . . . · e i 1 .
On remarque que t ◦ α = α ◦ t . Il s’ensuite que l’application
x 7→ x̄ := t ◦ α(x) = α ◦ t (x)
est une involution de C( f ) qui commute avec α et t et vérifie x · y = ȳ · x̄. On définit enfin
la norme spinorielle
N : C( f ) −→ C( f )
x 7−→ x · x̄.
On a en particulier
∀v ∈ V N(v) = − f (v). (39)

Proposition 6.6. — Supposons f non dégénérée et V de dimension finie. Par restriction, la


norme spinorielle définit un morphisme de groupes N : Γ( f ) → K× .

Démonstration. — Si x ∈ Γ( f ), nous allons montrer que N(x) est dans le noyau de ρ.


Appliquons t , qui renverse l’ordre des produits et qui est l’identité sur V, à la relation
α(x) · v · x −1 ∈ V ; on obtient
α(x) · v · x −1 = t (x −1 ) · v · t (α(x)),
d’où
v = t (x) · α(x) · v · x −1 · x̄ −1 = α(x̄ · x) · v · (x̄ · x)−1 .
Puisque x̄ ∈ C( f )× , cela signifie x̄ · x ∈ Γ( f ) et x̄ · x ∈ ker(ρ), c’est-à-dire x̄ · x ∈ K× par le
lemme 6.5. De plus, on a x̄ ∈ Γ( f ) puisque Γ( f ) est un groupe. Appliquant ce résultat à x̄,
on obtient que x̄¯ · x̄ = N(x) est dans K× .
Si x, y ∈ Γ( f ), on a
N(x y) = x · y · ȳ · x̄ = x · N(y) · x̄ = x · x̄N(y) = N(x)N(y),
où la troisième égalité a lieu puisque N(y) est dans K× , donc commute avec tous les élé-
ments de C( f ). On a donc bien un morphisme de groupes.

Proposition 6.7. — Supposons f non dégénérée et V de dimension finie. L’image du mor-


phisme de groupes ρ : Γ( f ) → GL(V) est le groupe orthogonal O(V, f ).
6. ALGÈBRE DE CLIFFORD ET GROUPE SPINORIEL 105

Démonstration. — Soit x ∈ Γ( f ). Montrons tout d’abord que ρx est bien une isométrie,
c’est-à-dire qu’on a f (ρx (v)) = f (v) pour tout v ∈ V. On a, avec la prop. 6.6 et (39),
f (ρx (v)) = −N(ρx (v)) = −α(x) · v · x −1 · x̄ −1 · (−v) · α(x̄) = −α(x) · v · N(x −1 ) · v · α(x̄)
= f (v)N(x −1 )α(N(x)) = f (v)N(x −1 )N(x) = f (v).
L’image de ρ : Γ( f ) → GL(V) est donc contenue dans le groupe orthogonal O(V, f ).
Mais d’autre part, par la prop. 6.4, cette image contient toutes les réflexions. Comme
celles-ci engendrent O(V, f ) (th. II.8.5), on a ρ(Γ( f )) = O(V, f ).

Corollaire 6.8. — Sous les mêmes hypothèses, on a un isomorphisme de groupes ρ̂ :



Γ( f )/K× → O(V, f ) et la norme spinorielle induit un morphisme de groupes
θ : O(V, f ) → K× /K×2
qui vérifie, pour tout v ∈ V non isotrope, θ(s v ) = f (v).

Démonstration. — Le morphisme ρ̂ est fourni par la factorisation canonique de ρ.


L’image de K× ⊆ Γ( f ) par la norme spinorielle N : Γ( f ) → K× est le sous-groupe K×2 des
carrés non nuls. On a donc un morphisme induit N̂ : Γ( f )/K× → K× /K×2 . Il suffit de poser
θ := N̂ ◦ ρ̂−1 .

6.4. Groupe Spin(n). — On se place ici dans le cas où K = R, V = Rn et f est (le carré de)
la norme euclidienne usuelle :
f (x 1 , . . . , x n ) = x 12 + · · · + x n2 .
On pose alors
Spin(n) := ker(N) ∩ Γ( f ) ∩ C( f )+ = {x ∈ C( f )+ | x · x̄ = 1, x · V · x −1 ⊆ V}
puisque α est l’identité sur C( f )+ . C’est un sous-groupe de Γ( f ).

Théorème 6.9. — L’image du morphisme de groupes ρ|Spin(n) : Spin(n) → O(V, f ) est le


groupe SO(V, f ) et son noyau est {±1}.

Démonstration. — Vu le lemme 6.5, le noyau de la restriction de ρ à Spin(n) est l’intersec-


tion de R× avec ker(N). Mais sur R× , la norme spinorielle est juste le carré, donc le noyau
est {±1}.
Soit x ∈ Spin(n). On décompose l’isométrie ρx en produit de réflexions s v 1 ◦ · · · ◦ s v r ,
où on peut supposer les vecteurs v 1 , . . . , v r de V unitaires. On a alors (prop. 6.4) s v i = ρv i ,
donc ρ(x) = ρ(v 1 · . . . · v r ). Comme le noyau de ρ est R× (lemme 6.5), il existe λ ∈ R× tel que
x = λv 1 · . . . · v r dans Γ( f ). En prenant les normes spinorielles, on obtient (en utilisant la
prop. 6.6 et (39))
1 = N(x) = λ2 N(v 1 · . . . · v r ) = λ2 N(v 1 ) · · · N(v r ) = λ2 (−1)r f (v 1 ) · · · f (v r ) = λ2 (−1)r .
Ceci n’est possible que si r est pair, ce qui entraîne
dét(ρx ) = dét(s v 1 ) · · · dét(s v r ) = (−1)r = 1.
Le groupe ρ(Spin(n)) est donc bien contenu dans SO(V, f ).
Inversement, tout élément u de SO(V, f ) se décompose en un produit de réflexions s v 1 ◦
· · · ◦ s v r , avec v 1 , . . . , v r dans V de norme 1 et r pair. Comme s v i = ρ(v i ), on a u = ρ(v 1 · . . . ·
106 CHAPITRE III. ALGÈBRE TENSORIELLE

v r ) avec v 1 · . . . · v r ∈ ker(N) ∩ Γ( f ) ∩ C( f )+ = Spin(n). L’image ρ(Spin(n)) est donc égale à


SO(V, f ).
Les groupes Spin(n) ont déjà été identifiés pour n petit (rem. II.11.5) : on a Spin(2) '
U(1), Spin(3) ' SU(2), Spin(4) ' SU(2) × SU(2) et Spin(6) ' SU(4).
Exercice 6.10. — Montrer que Spin(n) est connexe pour n Ê 2 (Indication : on pourra
utiliser le th. 8.5 et, pour tous v, w ∈ V unitaires et orthogonaux, le chemin t →
7 (v cos t −
w sin t )(v sin t + w cos t ), pour t ∈ [0, π/2], dans Spin(n)).

Remarque 6.11. — Si f est une forme quadratique de signature (s, t ) sur Rs+t , on pose de
la même façon
Spin(s, t ) := ker(N) ∩ Γ( f ) ∩ C( f )+ .
Une preuve analogue à celle du th. 6.9 montre que le morphisme ρ induit par restriction
un morphisme surjectif Spin(s, t ) → SO(s, t ) de noyau {±1}. Lorsque st > 0, ces groupes ne
sont pas connexes (ex. II.8.10.2°) et on définit Spin0 (s, t ) comme l’image inverse du groupe
connexe SO0 (s, t ).
CHAPITRE IV

REPRÉSENTATIONS DES GROUPES FINIS

1. Représentations
Soit G un groupe et soit V un K-espace vectoriel. Une représentation linéaire de G dans
V est un morphisme de groupes
ρ : G −→ GL(V).
En d’autres termes, on représente les éléments de G comme des automorphismes de V
ou plus simplement, si V est de dimension finie et qu’on en choisit une base, comme des
matrices (inversibles).
On notera la représentation (V, ρ), ou simplement, en l’absence d’ambiguïté, ρ ou V.
L’action d’un élément g ∈ G sur V sera souvent notée g · v (= ρ(g )(v)). C’est une action du
groupe G sur V au sens de la déf. du § I.2.1.

Exemples 1.1. — 1° Une représentation de G dans un espace vectoriel de dimension 1 est


un morphisme ρ : G → K× . Si G est fini, l’image est un groupe cyclique (exerc. I.1.24).
2° Si G est défini comme un sous-groupe de GL(V) (ce qui est le cas de tous les groupes
classiques), l’inclusion G ,→ GL(V) est appelée la représentation standard.
3° Si (e 1 , . . . , e n ) est une base de Kn , on obtient une représentation de Sn dans Kn en po-
sant ρ(σ)(e i ) = e σ(i ) . Une telle représentation est appelée représentation de permutation.
Les ρ(σ) sont des matrices de permutation.
4° Si G est un groupe fini, on peut composer le morphisme de groupes de Cayley
(ex. I.2.3)
G ,→ Bij(G)
g 7→ (x 7→ g x)
avec la construction du 3° ci-dessus pour obtenir une représentation
ρR : G → Bij(G) → GL(KG ),
où KG est l’espace vectoriel des fonctions de G dans K. Un élément g de G est envoyé sur
la fonction εg : G → K caractéristique de cet élément et si u ∈ KG et g ∈ G, on a ρR (g )(u) :
g 0 7→ u(g −1 g 0 ) pour tout g 0 ∈ G, donc ρR (g )(εh ) = εg h .
Cette représentation s’appelle la représentation régulière de G.
108 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

1.1. Vocabulaire et propriétés. — Soit (V, ρ) une représentation de G.


La dimension (on dit aussi le degré) de la représentation est dim(V).
Une sous-représentation est un sous-espace vectoriel W ⊆ V stable sous l’action de G ;
on parle de sous-espace G-invariant. Dans ce cas, on a des représentations induites sur W
et sur le quotient V/W.

Exemples 1.2. — 1° Le sous-espace vectoriel

V G = {v ∈ V | ∀g ∈ G g · v = v}

des vecteurs fixes sous G est un sous-espace G-invariant.


2° Si V = Kn , est la représentation de permutation du groupe Sn , l’hyperplan
n
X
V0 = {(x 1 , . . . , x n ) ∈ V | x i = 0}
i =1

est une sous-représentation de V, ainsi que la droite supplémentaire

V1 = K(1, . . . , 1).

Un morphisme entre des représentations V1 et V2 est une application linéaire f : V1 →


V2 telle que
∀g ∈ G f ◦ ρ1 (g ) = ρ2 (g ) ◦ f .

Dans ce cas, ker f et im( f ) sont des sous-représentations de V1 et V2 et f induit un iso-


morphisme de représentations

f : V1 / ker( f ) → im( f ).

L’espace des morphismes entre les représentations V1 et V2 est noté HomG (V1 , V2 ), ou
Hom(ρ1 , ρ2 ). Deux représentations ρ1 et ρ2 de dimension finie d’un groupe G sont iso-
morphes si et seulement s’il existe une base de V et une base de W dans lesquelles, pour
tout g ∈ G, les matrices de ρ1 (g ) et de ρ2 (g ) sont les mêmes.

Si V et W sont des représentations de G, on peut former les représentations suivantes :


– V ⊕ W pour ρ(g ) = (ρV (g ), ρW (g )) ;
– V ⊗ W pour ρ(g ) = ρV (g ) ⊗ ρW (g ) ;
– V ∗ pour ρ∗ (g ) = t ρ(g −1 ) ;
– HomK (V, W) = V ∗ ⊗ W pour ρ(g )( f ) = ρW (g ) ◦ f ◦ ρV (g )−1 ; en particulier l’espace des
morphismes de représentations de V vers W est

HomG (V, W) = HomK (V, W)G ;

– T k V, k V, S k V sont aussi des représentations de G. Si car(K) 6= 2, on a par (36) un


V

isomorphisme de représentations
2
V ⊕ S 2 V.
^
V ⊗V '
1. REPRÉSENTATIONS 109

1.2. Représentations irréductibles. —

Définition 1.3. — Une représentation V est irréductible si elle est non nulle et que ses
seules sous-représentations sont 0 et V.

Toute représentation de dimension 1 est bien sûr irréductible.

Exemples 1.4. — 1° Si G est abélien, que K est algébriquement clos, les seules représen-
tations irréductibles V de dimension finie de G sont de dimension 1. En effet, si g ∈ G, tout
espace propre (non nul) de ρ(g ) est, puisque G est abélien, une sous-représentation de
V donc est égale à V ; comme V est irréductible, ceci entraîne que tous les ρ(g ) sont des
homothéties. Toute droite D ⊆ V est alors une sous-représentation, donc D = V.
Ainsi les représentations irréductibles de Z/nZ dans C sont données par l’image d’un
générateur, qui doit être une racine n-ième de l’unité dans C. On obtient ainsi les n repré-
sentations irréductibles ρ0 , . . . , ρn−1 , données par
2k j πi
µ ¶
∀k ∈ Z/nZ ρ j (k) = exp .
n
2° Pour n Ê 3, la représentation standard du groupe diédral Dn dans R2 (ou dans C2 ) est
irréductible, puisqu’aucune droite n’est laissée stable par tous les éléments de Dn .
3° Si dim(V) Ê 2, les représentations standard de SL(V), GL(V) et Sp(V) sont irréducti-
bles puisque ces groupes opèrent transitivement sur V {0}. C’est aussi le cas pour O(n),
qui opère transitivement sur la sphère unité Sn−1 , qui engendre l’espace vectoriel Rn .

Exercice 1.5. — Soit G un groupe fini.


a) Montrer que toute représentation irréductible de G est de dimension finie É |G|.
b) Supposons K algébriquement clos. Soit A ≤ G un sous-groupe abélien. Montrer que toute
représentation irréductible de G est de dimension É |G|
|A| .

Exercice 1.6. — Soit V un espace vectoriel réel de dimension finie n > 0 et soit d un entier
positif.
a) Soit B = (e 1 , . . . , e n ) une base de V. Donner une base naturelle Bd de l’espace vectoriel
S d V.
b) Montrer qu’il existe des réels λ1 , . . . , λn tels que, si P et Q sont des monômes unitaires de
degré d en n variables, alors P(λ1 , . . . , λn ) = Q(λ1 , . . . , λn ) si et seulement si P = Q.
c) Montrer que GL(V) agit naturellement sur l’espace vectoriel S d V. On en déduit une repré-
sentation ρd de GL(V) dans S d V.
d) Soit W un sous-espace vectoriel non nul de S d V stable par l’action de GL(V). Montrer qu’il
existe un sous-ensemble de la base Bd qui engendre W (Indication : on pourra considérer
l’automorphisme g de V qui envoie e i sur λi e i ).
e) En déduire que la représentation ρd est irréductible.
f) Montrer qu’il existe, pour tout entier d ∈ {1, . . . , n}, une représentation irréductible de GL(V)
dans d V.
V

g) Que se passe-t-il si on remplace le corps R par un corps quelconque ?

1.3. Supplémentaire G-invariant. — Si W est une sous-représentation de V, il n’existe


pas en général de supplémentaire G-invariant de W dans V.
110 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

Exemple 1.7. — Le groupe G ≤ GL(2, K) des matrices triangulaires supérieures se re-


présente dans V = K2 par la représentation standard. La droite W = Ke 1 est une sous-
représentation dépourvue de supplémentaire T-invariant.
Si K est le corps Fp , on a ainsi un exemple avec un groupe G fini de cardinal p(p − 1)2 .

Néanmoins, il y a quand même un résultat général d’existence de supplémentaire G-


invariant pour certains groupes finis.

Théorème 1.8. — Si G est un groupe fini tel que car(K) - |G| et que V est une représentation
de G, tout sous-espace G-invariant W ⊆ V admet un supplémentaire G-invariant.

Corollaire 1.9. — Si car(K) - |G|, toute représentation de G de dimension finie est somme
directe de représentations irréductibles.

On va donner deux démonstrations du théorème, une première particulière à K = R ou


C, mais qui est valable aussi pour certains groupes infinis ; une seconde traitant tous les
corps.

Première démonstration. — Supposons K = R ou C. On choisit un produit scalaire ou un


produit scalaire hermitien sur V, noté 〈 , 〉0 . Puis on définit un autre produit scalaire par
1 X
〈v, w〉 = 〈g · v, g · w〉0 . (40)
|G| g ∈G

Ce nouveau produit scalaire est G-invariant : pour tout g ∈ G, on a

〈g · v, g · w〉 = 〈v, w〉,

si bien que ρ est à valeurs dans O(V) ou U(V). En particulier, si W est G-invariant, W ⊥ est
aussi G-invariant et fournit le supplémentaire voulu.

L’ingrédient essentiel de cette démonstration consiste à fabriquer un produit scalaire


G-invariant par moyennisation d’un produit scalaire quelconque donné. Si G est un
groupe topologique compact, il est muni d’une mesure de probabilité G-invariante, la
mesure de Haar : en remplaçant (40) par l’intégration sur le groupe, la démonstration
s’étend à ce cas.

Seconde démonstration. — On applique encore un procédé de moyennisation. Choisis-


sons un projecteur quelconque p 0 : V → V d’image W. On pose

1 X
p= ρ(g ) ◦ p 0 ◦ ρ(g )−1 ∈ End(V). (41)
|G| g ∈G

Comme ρ(g ) préserve W, l’image de cet endomorphisme est contenue dans W. Si v ∈ W,


on a ρ(g )−1 (v) ∈ W, donc p 0 ◦ ρ(g )−1 (v) = ρ(g )−1 (v) et p(v) = v. Ceci montre que p est un
projecteur d’image W.
1. REPRÉSENTATIONS 111

Montrons que son noyau W 0 (supplémentaire de W) est invariant par G. Commençons


par noter que, pour tout h ∈ G, on a
1 X
ρ(h) ◦ p ◦ ρ(h)−1 = ρ(h) ◦ ρ(g ) ◦ p 0 ◦ ρ(g )−1 ◦ ρ(h)−1
|G| g ∈G
1 X
= ρ(hg ) ◦ p 0 ◦ ρ(hg )−1 = p,
|G| g ∈G

c’est-à-dire ρ(h) ◦ p = p ◦ ρ(h). Si p(x) = 0, alors p ◦ ρ(h)(x) = ρ(h) ◦ p(x) = 0, donc ρ(h)(x) ∈
W 0 . On a donc bien trouvé un supplémentaire G-invariant de W dans V.

Lemme de Schur 1.10. — Soit G un groupe fini tel que car(K) - |G|, soient (V1 , ρ1 ) et (V2 , ρ2 )
des représentations irréductibles (1) de G et soit f : V1 → V2 un morphisme de représenta-
tions.
1° Soit f est nul, soit c’est un isomorphisme.
2° Si ρ1 = ρ2 et que K est algébriquement clos, l’application f est une homothétie.

Démonstration. — 1° Les sous-espaces ker( f ) et im( f ) sont G-invariants, donc triviaux.


2° Si λ est une valeur propre de f , alors ker( f −λ IdV ) est G-invariant, donc égal à V tout
entier, et f est une homothétie.

Par le cor. 1.9, on peut décomposer la représentation régulière KG (ex. 1.1.4°) en somme

KG =
M
Ri

de représentations irréductibles. Soit (V, ρ) une représentation de G et soit v 0 ∈ V. L’appli-


cation linéaire

f : KG −→ V
u(g ) ρ(g )(v 0 )
X
(u : G → K) 7−→
g ∈G

est un morphisme de représentations. En effet, pour tout h ∈ G et tout u ∈ KG , on a (cf. ex.


1.1.4°)

ρR (h)(u)(g ) ρ(g )(v 0 )


X
f (ρR (h)(u)) =
g ∈G

u(h −1 g ) ρ(g )(v 0 )


X
=
g ∈G

u(g 0 ) ρ(hg 0 )(v 0 )


X
=
g 0 ∈G
= ρ(h)( f (u)).

Si v 0 6= 0, l’application f n’est pas nulle, et si de plus V est irréductible, f est surjective,


donc il y a au moins un i tel que f |Ri soit non nul ; par le lemme de Schur, c’est un isomor-
phisme et V est isomorphe à la représentation Ri .

1. Donc de dimension finie par l’exerc. 1.5.


112 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

On en déduit le résultat suivant (2) .

Proposition 1.11. — Si car(K) - |G|, à isomorphisme près, il n’y a qu’un nombre fini de re-
présentations irréductibles de G et chacune est de dimension É |G|.

Lorsque K est algébriquement clos, ces résultats seront précisés dans le cor. 2.6.1° et, si
de plus car(K) = 0, dans la prop. 2.8, où on montre que la dimension d’une représentation
p
irréductible est É |G|.

Exercice 1.12. — Si car(K) - |G|, montrer que l’intersection des noyaux des représentations
irréductibles de G est {e}.

Proposition 1.13. — Sous la même hypothèse, soient ρ1 , . . . , ρ` les représentations irréduc-


L n
tibles de G. Toute représentation de G de dimension finie se décompose en V ' ρi i , où les
entiers naturels n i sont uniquement déterminés par la représentation.

Démonstration. — Par récurrence sur la dimension de la représentation. Supposons V :=


L L
Vi isomorphe à W := W j , où les Vi et les W j sont des représentations irréductibles,
éventuellement répétées. On va montrer qu’à permutation près, les (Vi ) et les (W j ) sont la
même collection de représentations. On dispose donc d’un automorphisme de représen-
tations
M ∼M
f : Vi → Wj
i j
dont on notera l’inverse g . Notons p i : V → Vi et q j : V → W j les projections et considérons
le morphisme
f |V1 qj g |W j p1
u j := V1 −→ V −→ W j −→ V −→ V1 .
On a
X X ³X ´
uj = p 1 ◦ g |W j ◦ q j ◦ f |V1 = p 1 ◦ g |W j ◦ q j ◦ f |V1 = p 1 ◦ g ◦ f |V1 = IdV1 .
j j j

Au moins un des u j est donc non nul et, quitte à rénuméroter les W j , on peut supposer
que c’est u 1 . Le morphisme q 1 ◦ f |V1 : V1 → W1 et p 1 ◦ g |W1 : W1 → V1 sont alors non nuls.
Par le lemme de Schur, ce sont des isomorphismes.
Pour appliquer l’hypothèse de récurrence, il suffit de montrer que le morphisme de
représentations
M M
(1 − q 1 ) f |Li Ê2 Vi : Vi −→ Wj
i Ê2 j Ê2
entre représentations de même dimension est encore un isomorphisme. C’est en effet le
L
cas : si x ∈ i Ê2 Vi est dans le noyau, f (x) ∈ W1 et p 1 g ( f (x)) = p 1 (x) = 0, donc, p 1 ◦ g |W1
étant un isomorphisme, f (x) = 0 et x = 0.

2. Comme on l’a vu dans l’exerc. 1.5, la seconde partie est valable sans hypothèse sur la caractéristique du
corps. Il en est de même de la première partie, mais il faut prendre garde que lorsque car(K) | |G|, il existe des
représentations (de dimension finie) qui ne sont pas somme de représentations irréductibles, donc il y a des
représentations indécomposables qui ne sont pas irréductibles. Et malheureusement, pour certains groupes fi-
nis, le nombre de classes d’isomorphisme de représentations indécomposables est infini (en caractéristique p,
Higman a démontré que c’est le cas si les p-Sylow ne sont pas cycliques).
2. CARACTÈRES 113

Sous les hypothèses de la proposition, on peut donc décomposer une représentation


(V, ρ) de dimension finie du groupe G en somme directe V = i Vi de représentations ir-
L

réductibles. Cette décomposition n’est en général pas unique ! Dans le cas par exemple où
tous les ρ(g ) sont l’identité (donc la seule représentation irréductible qui intervient est la
représentation triviale, de dimension 1) , il s’agit simplement de décomposer V en somme
directe de droites, ce qu’on peut faire de bien des façons.

2. Caractères
Dans cette section, on suppose G fini, K algébriquement clos et car(K) - |G|.
Si (V, ρ) est une représentation de dimension finie de G, on appelle caractère de ρ la
fonction
χρ : G −→ K
g 7−→ tr(ρ(g )).
On a χρ (e) = dim(V), donc le caractère détermine la dimension de la représentation (on
verra dans la prop. 2.8 que si K est algébriquement clos, le caractère détermine ρ complè-
tement).
On calcule
χρ (hg h −1 ) = tr ρ(h)ρ(g )ρ(h)−1 = tr ρ(g ) = χρ (g ).
¡ ¢ ¡ ¢
∀g , h ∈ G
On dit que χρ est une fonction centrale, ou encore invariante par conjugaison. Elle est
constante sur chaque classe de conjugaison de G. Le K-espace vectoriel de toutes les fonc-
tions centrales sur le groupe G sera noté C (G).
Rappelons (§ I.2.3) que les classes de conjugaisons de G sont les orbites sous l’action dé-
finie par g · x = g xg −1 . Lorsque G est abélien, ces classes sont des singletons. Une fonction
f : G → K est centrale si et seulement si elle est constante sur chaque classe de conjugaison
C de G ; on notera alors f (C) sa valeur sur la classe C. La dimension du K-espace vectoriel
C (G) est donc le nombre de classes de conjugaison.
Exemples 2.1. — 1° Le caractère de la représentation régulière est
(
|G| si g = e,
χR (g ) =
0 si g 6= e.
C’est donc |G| fois la fonction caractéristique 1Ce de la classe de conjugaison Ce = {e}.
2° Le caractère de la représentation standard de Dn dans C2 est donné par
2kπ
χ(r k ) = 2 cos , χ(r k s) = 0.
n
Il vaut donc 0 sur {s, r s, . . . , r n−1 s} (qui est la réunion de 1 ou 2 classes de conjugaison selon
que n est impair ou non) et 2 cos 2kπ n sur chaque classe de conjugaison {r , r
k −k
}.
3° Le groupe S3 possède trois classes de conjugaison, celle de l’élément neutre e, celle
à 3 éléments d’une transposition τ, et celle à 2 éléments d’un 3-cycle σ. Le caractère de
la représentation standard de S3 dans C3 vaut 3 sur e, 1 sur les transpositions et 0 sur les
3-cycles.
114 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

Plus généralement, on a vu dans la prop. I.2.8 que les classes de conjugaison de Sn sont
en bijection avec les partitions de n :

n = k1 + · · · + kr , r ∈ N, 1 É k 1 É · · · É k r ,

une telle partition correspondant aux produits de cycles à supports disjoints d’ordre
k 1 , . . . , k r . Sur la classe de conjugaison correspondante, le caractère de la représenta-
tion standard de Sn dans Cn vaut max{i | k i = 1} (c’est le nombre de points fixes de la
permutation).

Propriétés 2.2. — 1° Des représentations de dimension finie isomorphes ont même carac-
tère.
2° On a χV ∗ (g ) = χV (g −1 ).
3° On a χV⊕W = χV + χW .
4° Si W ⊆ V est une sous-représentation, χV = χW + χV/W .
5° On a χV⊗W = χV χW .

Démonstration. — Tout est évident, sauf la quatrième propriété qui découle de l’identité
tr(u ⊗ v) = tr(u) tr(v), qu’on peut vérifier dans une base (exerc. III.1.5).

On introduit sur KG = { f : G → K} la forme bilinéaire symétrique

1 X
〈 f , f 0〉 = f (g −1 ) f 0 (g ).
|G| g ∈G

1
En particulier, 〈 f , εg 〉 = |G| f (g −1 ), donc cette forme est non dégénérée.

Théorème 2.3. — Les caractères des représentations irréductibles de dimension finie


forment une base orthonormale du K-espace vectoriel C (G) des fonctions centrales sur G.

Démonstration. — La démonstration du théorème va utiliser deux lemmes. Soient (V, ρV )


et (W, ρW ) des représentations de G et soit u ∈ Hom(V, W). Comme dans (41), on pose

1 X
π(u) = ρW (g ) ◦ u ◦ ρV (g )−1 ∈ Hom(V, W).
|G| g ∈G

Lemme 2.4. — L’endomorphisme π de Hom(V, W) ainsi défini est un projecteur d’image


HomG (V, W) et

tr(π) = 〈χV , χW 〉.

Démonstration. — On rappelle que

HomG (V, W) := {u ∈ Hom(V, W) | ∀h ∈ G u ◦ ρV (h) = ρW (h) ◦ u}.


2. CARACTÈRES 115

Pour tout h ∈ G, on a bien


1 X
ρW (h) ◦ π(u) ◦ ρV (h)−1 = ρW (h) ◦ ρW (g ) ◦ u ◦ ρV (g )−1 ◦ ρV (h)−1
|G| g ∈G
1 X
= ρW (hg ) ◦ u ◦ ρV (g −1 h −1 )
|G| g ∈G
1 X
= ρW (g 0 ) ◦ u ◦ ρV (g 0−1 )
|G| g 0 ∈G
= π(u).
De plus, si u ∈ HomG (V, W), on a π(u) = u, de sorte que π est bien un projecteur d’image
HomG (V, W).
Choisissons des bases de V et W et notons e i j l’élément de Hom(V, W) dont la matrice
dans ces bases a tous ses coefficients sont nuls, sauf celui situé à la i -ème ligne et la j -ème
colonne, qui vaut 1. Les (e i j ) forment une base de Hom(V, W). On a

ρW (g ) ◦ e i j ◦ ρV (g )−1 kl = ρW (g )ki ρV (g −1 ) j l .
¡ ¢

Appliquant ceci au cas particulier i = k et j = l , on calcule


X 1 X
π(e i j )i j ρW (g )i i ρV (g −1 ) j j
X
tr(π) = =
i,j i , j |G| g ∈G
1 X ¡X
ρW (g )i i ρV (g −1 ) j j
¢¡ X ¢
=
|G| g ∈G i j
1 X
= χW (g )χV (g −1 ).
|G| g ∈G

Ceci démontre le lemme.

Si V et W sont irréductibles, on a par le lemme de Schur


(
0 si V et W ne sont pas isomorphes,
HomG (V, W) =
K si V et W sont isomorphes.
Comme le rang d’un projecteur est sa trace, le lemme 2.4 entraîne que 〈χV , χW 〉 = tr(π) vaut
0 dans le premier cas, 1 dans le second. Donc la famille des (χV ), pour V irréductible (ou
plus exactement, pour V décrivant l’ensemble des classes d’isomorphisme de représenta-
tions irréductibles de G), est orthonormale ; il reste à voir qu’elle engendre tout C (G).

Lemme 2.5. — Soit (V, ρ) une représentation de G. Si f : G → K est une fonction centrale,
posons
1 X
fρ = f (g )ρ(g −1 ) ∈ End(V).
|G| g ∈G
1° On a f ρ ∈ EndG (V) et tr( f ρ ) = 〈 f , χρ 〉.
2° Si (V, ρ) est irréductible, dim(V) · 1K est inversible dans K et f ρ est l’homothétie de V
〈 f ,χρ 〉
rapport dim(V) .
116 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

Démonstration. — On calcule, puisque f est centrale,


1 X
∀h ∈ G ρ(h) ◦ f ρ ◦ ρ(h)−1 = f (g )ρ(hg −1 h −1 )
|G| g ∈G
1 X 1 X
= f (h −1 g 0 h)ρ(g 0−1 ) = f (g 0 )ρ(g 0−1 ) = f ρ .
|G| g 0 ∈G |G| g 0 ∈G
Donc f ρ ∈ EndG (V) et sa trace est
1 X
tr( f ρ ) = f (g )χρ (g −1 ) = 〈 f , χρ 〉.
|G| g ∈G
Ceci montre le premier point.
Si ρ est irréductible, on déduit du lemme de Schur 1.10 et du premier point appliqué à la
fonction centrale f = χρ que (χρ )ρ est une homothétie. Si λ est son rapport, on a tr((χρ )ρ ) =
dim(V)λ = 〈χρ , χρ 〉 = 1K . En particulier, dim(V) · 1K est inversible dans K.
Pour f fonction centrale quelconque, f ρ est de nouveau une homothétie par le lemme
〈 f ,χρ 〉
de Schur 1.10. Comme sa trace est 〈 f , χρ 〉, son rapport est dim(V) . Cela montre le second
point.
Si une fonction centrale f ∈ C (G) est orthogonale à tous les caractères χρ , on a, par le
lemme, f ρ = 0 pour toute représentation ρ irréductible, et donc pour toute représentation
puisque f ρ⊕ρ0 = f ρ ⊕ f ρ0 . Appliquant cela à la représentation régulière, on obtient f ρR = 0
donc
1 X 1 X
0 = f ρR (εe ) = f (g )ρR (g −1 )(εe ) = f (g )εg −1
|G| g ∈G |G| g ∈G
dans KG , ce qui entraîne f = 0, puisque les εg −1 forment une base de KG .
Cela termine la preuve du th. 2.3 : tout f ∈ C (G) s’écrit f = ρ irr 〈 f , χρ 〉χρ .
P

Corollaire 2.6. — 1° Le nombre de représentations irréductibles de G est égal au nombre


de classes de conjugaison de G.
2° Soient χ1 , . . . , χ` les caractères des représentations irréductibles de G. Soient C et C0 des
classes de conjugaison dans G. On a
( |G|
−1 0 · 1K si C = C0 ,
χi (C )χi (C ) = |C|

i =1 0 sinon.

Démonstration. — La dimension de C (G) est égale au nombre de classes de conjugaison


dans G, d’où le premier énoncé. Pour le second, soit 1C la fonction caractéristique de C.
Alors f = 1C est une fonction centrale qui se décompose sur la base orthonormale des
caractères χi des représentations irréductibles :
1
〈1C , χi 〉χi , avec 〈1C , χi 〉 = |C|χi (C−1 ).

1C =
i =1 |G|
Il en résulte
|C| X̀
1C = χi (C−1 )χi ,
|G| i =1
ce qui est exactement le résultat voulu.
2. CARACTÈRES 117

L
On a déjà remarqué que la décomposition V = i Vi d’une représentation en somme
directe de représentations irréductibles n’est pas unique. En revanche, si on regroupe tous
les Vi isomorphes à la même représentation irréductible, on obtient une décomposition
L
V = j W j en composantes isotypiques indépendante des choix.

Théorème 2.7. — Soit (V, ρ) une représentation de dimension finie du groupe fini G. La
projection de V sur la composante isotypique correspondant à une représentation irréduc-
tible (U, ψ) est donnée par
dim(U) X
pU = χψ (g )ρ(g −1 ).
|G| g ∈G

En particulier, la décomposition en composantes isotypiques ne dépend que de la représen-


tation (V, ρ).

Démonstration. — Soit f une fonction centrale sur G. Par le lemme 2.5.2°, la restriction
de l’endomorphisme f ρ de V à une sous-représentation irréductible Vi de V de caractère
〈 f ,χi 〉
χi est l’homothétie de Vi de rapport dim(Vi ) . Par le th. 2.3, si f est le caractère d’une re-
1
présentation irréductible U, c’est donc dim(V IdVi si Vi est isomorphe à U et 0
sinon. La
i)
restriction de p U à Vi est donc l’identité de Vi si Vi est isomorphe à U et 0 sinon. Ceci
démontre le théorème.

On peut maintenant montrer qu’en caractéristique 0, une représentation est détermi-


née par son caractère. On identifie aussi les représentations irréductibles comme étant
celles dont le caractère est de norme 1.

Proposition 2.8. — Notons ρ1 , . . . , ρ` les représentations irréductibles du groupe fini G.


Soit ρ ' `i =1 ρi i une représentation de G. On a
L n

³ X̀ ´
〈χρ , χρi 〉 = n i · 1K , 〈χρ , χρ 〉 = n i2 · 1K .
i =1
Si car(K) = 0,
– des représentations ρ et ρ0 de G sont isomorphes si et seulement si χρ = χρ0 ;
– ρ est irréductible si et seulement si 〈χρ , χρ 〉 = 1K ;
L` dim(ρi )
– la représentation régulière se décompose en KG = i =1 ρi ; en particulier,
P` 2
i =1
dim(ρ i ) = |G|.

Si car(K) = p 6= 0, il est faux que le caractère détermine la représentation ; par exemple,


pour toute représentation V, le caractère de V p est nul.
Une autre contrainte importante sur les dimensions des représentations irréductibles
est qu’elles divisent l’ordre du groupe. Ce théorème plus difficile (3.6) sera vu dans le § 3.2
en caractéristique nulle.

Démonstration. — Si ρ = `i =1 ρi i (ce qu’on peut toujours faire par la prop. 1.13), on a


L n

χρ = i =1 n i χρi donc 〈χρ , χρi 〉 = n i · 1K et 〈χρ , χρ 〉 = ( `i =1 n i2 ) · 1K .


P` P

Ainsi, en caractéristique nulle, χρ détermine les entiers n i et donc toute la représenta-


tion ρ, et ρ est irréductible si et seulement si 〈χρ , χρ 〉 = 1K .
118 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

Appliquons cela à la représentation régulière : puisque χR = |G|1{e} , on obtient


〈χR , χρi 〉 = χρi (e) = dim(ρi ), d’où il résulte que la représentation régulière est isomorphe à
L` dim(ρi )
i =1 ρi .

Proposition 2.9. — Supposons car(K) = 0. Le groupe G est abélien si et seulement si toutes


ses représentations irréductibles sont de dimension 1.

Démonstration. — Un groupe G est abélien si et seulement s’il a exactement |G| classes de


conjugaison, donc |G| représentations irréductibles. Or |G| = `i =1 dim(ρi )2 , donc ` É |G|
P

avec égalité si et seulement si toutes les représentations irréductibles sont de dimension


1.
Exercice 2.10. — Soit p un nombre premier, soit G un p-groupe (c’est-à-dire un groupe fini
de cardinal une puissance de p ; cf. prop. I.2.11) et soit K un corps de caractéristique p. Mon-
trer que la seule représentation irréductible ρ de G dans un K-espace vectoriel est la représen-
tation triviale (Indication : si V est une telle représentation et v ∈ V {0}, on pourra considérer
le sous-groupe additif de V engendré par les ρ(g )(v), pour g décrivant G, montrer que c’est un
p-groupe, et appliquer la prop. I.2.11).

2.1. Table des caractères. — On fixe K = C. Dans ce cas, pour toute représentation (V, ρ)
d’un groupe fini G, on a construit avec (40) un produit scalaire hermitien pour lequel tous
les ρ(g ) sont unitaires. En particulier, ρ(g −1 ) = ρ(g )∗ et
χρ (g −1 ) = tr(ρ(g −1 )) = tr(ρ(g )∗ ) = tr(ρ(g )) = χρ (g ).
On a ainsi
1 X
〈χρ , χρ0 〉 = χρ (g ) χρ0 (g ) (42)
|G| g ∈G
et, si χ1 , . . . , χ` sont les caractères des représentations irréductibles de G, le cor. 2.6.2° donne
( |G|
0 si C = C0 ,
χi (C)χi (C ) = |C|

(43)
i =1 0 sinon.

On remarque aussi que ρ(g )|G| = IdV , donc les valeurs propres de ρ(g ) sont des racines de
l’unité. Comme χρ (g ) est leur somme, on a
∀g ∈ G |χρ (g )| É χρ (e) = dim(V).
De plus, χρ (g ) = χρ (e) si et seulement si ρ(g ) = IdV . On a donc
{g ∈ G | χρ (g ) = χρ (e)} = ker(ρ) E G.
La table des caractères de G donne la valeur de chaque caractère sur chaque classe de
conjugaison ; les lignes correspondent aux caractères et les colonnes aux classes de conju-
gaison. C’est une table carrée (cor. 2.6.1°). Les relations obtenues se traduisent par le fait
que
– les colonnes sont orthogonales (pour le produit scalaire hermitien) ;
– la colonne correspondant à la classe de conjugaison C est de norme hermitienne (au
carré) |G|/|C| (cf. (43)) ;
– les lignes sont orthogonales et de norme (au carré) |G| pour le produit scalaire her-
mitien pondéré par le cardinal des classes de conjugaison (cf. (42)).
2. CARACTÈRES 119

Exercice 2.11. — Montrer qu’une table des caractères est une matrice inversible.

On peut utiliser cette table pour obtenir des informations sur les sous-groupes distin-
gués de G. Un tel sous-groupe est réunion de classes de conjugaisons. Pour chaque ca-
ractère χ, la réunion des classes sur lesquelles χ prend la valeur χ(e) est un sous-groupe
Gχ E G et tout sous-groupe distingué de G est obtenu comme intersection de Gχ (utiliser
l’exerc. 1.12). En particulier, G est simple si et seulement si dans chaque ligne excepté celle
correspondant à la représentation triviale (qui est la seule composée uniquement de 1), la
valeur χ(e) n’apparaît qu’une seule fois (dans la colonne correspondant à la classe {e}).
Les représentations de dimension 1 sont des morphismes G → C∗ donc elles se facto-
risent par G/D(G). Le groupe dérivé D(G) est l’intersection des Gχ pour tous les caractères
χ de représentations de dimension 1.

Les contraintes obtenues sur les caractères sont déjà suffisantes pour obtenir une
description complète des représentation irréductibles du groupe G dans certains cas. On
traite ici quelques exemples.
Le groupe S3 = D3 . — On a vu qu’il y a trois classes de conjugaison : celle de l’élément
neutre e, celle des transpositions τ, et celles des 3-cycles σ. Il y a donc trois représentations
irréductibles de S3 .
Les représentations de dimension 1 sont les morphismes G → G/D(G) → C∗ . Dans notre
cas, le groupe dérivé est A3 et S3 /A3 ' Z/2Z. Il y a donc deux représentations de dimen-
sion 1, facilement identifiées : la représentation triviale Ctriv (de caractère χtriv ) et la signa-
ture Csign (de caractère χsign ). Par la prop. 2.8, la somme des carrés des dimensions des
représentations est |S3 | = 6, soit 1 + 1 + 4 = 6 donc la dimension de la dernière représenta-
tion irréductible est 2. On peut alors dresser la table des caractères, en indiquant au-dessus
de chaque classe de conjugaison son cardinal :

S3 1 3 2
e τ σ
χtriv 1 1 1
χsign 1 −1 1
χ 2 0 −1

La première colonne donne la dimension des représentations. La troisième ligne, a priori


inconnue, est obtenue en utilisant le fait que les colonnes sont orthogonales ; une autre
méthode est d’écrire (prop. 2.8) χtriv + χsign + 2χ = χR = 6 · 1{e} d’où on déduit également le
dernier caractère χ.
On a ainsi déterminé le caractère de la troisième représentation sans la connaître, mais
on peut aussi la décrire explicitement : d’après l’ex. 1.2.2°, S3 a une représentation ρ dans
le plan complexe V0 = {(x 1 , x 2 , x 3 ) ∈ C3 | x 1 + x 2 + x 3 = 0} dont la somme directe avec la
représentation triviale de dimension 1 est la représentation de permutation, de caractère
(ex. 2.1.3°) de valeurs 3,1 et 0, qui est bien la somme χtriv + χ.
On reconnaît les sous-groupes distingués de S3 : ce sont S3 (noyau de χtriv ), A3 = {e} ∪
{σ} (noyau de χsign ) et {e} (noyau de χ). Le groupe dérivé est A3 (noyau de χsign ).
120 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

La table des caractères peut aussi être utilisée pour calculer la décomposition en com-
posantes irréductibles d’une représentation donnée, grâce à la prop. 2.8. Par exemple, dé-
composons le produit tensoriel V0 ⊗ V0 , où V0 est la représentation irréductible d’ordre 2.
Son caractère est χ2 , de valeurs 4, 0, 1 ; c’est donc χtriv + χsign + χ. On a ainsi

V0 ⊗ V0 ' Ctriv ⊕ Csign ⊕ V0 .

Remarquons qu’on connaissait déjà, par (36), la décomposition V0 ⊗ V0 = S 2 V0 ⊕ 2 V0 .


V
V2
Le morceau V0 , de dimension 1, est Csign (c’est le déterminant), tandis que le morceau
S 2 V0 se décompose en deux.

Exercice 2.12. — Soit V une représentation réelle d’un groupe fini G. Montrer que la repré-
sentation S 2 V contient une sous-représentation de dimension 1 (Indication : on pourra utili-
ser la construction de la première démonstration du th. 1.8).

Le groupe D4 . — Le groupe de symétrie du carré est engendré par une rotation r d’angle π2
et une symétrie s. On a sr k s = r −k et r sr −1 = sr 2 , ce qui donne 5 classes de conjugaison :
{Id}, {r 2 }, {r, r 3 }, {s, r 2 s} et {r s, r 3 s}. Le sous-groupe Z/2Z = {Id, − Id = r 2 } est distingué et
dans le quotient les trois éléments distincts r , s et r s sont d’ordre 2, donc

D4 /(Z/2Z) ' Z/2Z × Z/2Z.

Cela nous donne donc quatre représentations de dimension 1 correspondant aux quatre
morphismes Z/2Z × Z/2Z → C∗ ; la cinquième doit donc être de dimension 2. Appliquant
la même méthode que précédemment, on obtient la table des caractères :

D4 1 1 2 2 2
e r2 {r, r 3 } {s, r 2 s} {r s, r 3 s}
χtriv 1 1 1 1 1
χ1 1 1 −1 1 −1
χ2 1 1 1 −1 −1
χ1 χ2 1 1 −1 −1 1
C2 2 −2 0 0 0

La représentation de dimension 2 ici n’est autre que la représentation standard dans C2


(ex. 2.1.3°).
Les sous-groupes distingués de D4 sont D4 , {e, r 2 , s, r 2 s} (noyau de χ1 ), {e, r, r 2 , r 3 }
(noyau de χ2 ), {e, r 2 , r s, r 3 s} (noyau de χ1 χ2 ), {e} et leurs intersections. Le groupe dérivé
est {e, r 2 } (ker(χ1 ) ∩ ker(χ2 )).
Le groupe S4 . — On a (prop. I.2.8) 5 classes de conjugaison, correspondant aux partitions
(1111) (classe de Id), (112) (classe d’une transposition, de cardinal 6), (13) (classe d’un 3-
cycle, de cardinal 8), (4) (classe d’un 4-cycle, de cardinal 6) et (22) (classe d’une double
transposition, de cardinal 3) de 4, donc 5 représentations irréductibles. D’autre part, on
a D(S4 ) = A4 (prop. I.5.8), donc deux représentations irréductibles de dimension 1, la re-
présentation triviale Ctriv et la signature Csign .
On a aussi la représentation de dimension 3 de S4 dans V0 = {(x 1 , x 2 , x 3 , x 4 ) ∈ C4 | x 1 +
x 2 + x 3 + x 4 = 0}. Le caractère de V0 ⊕ Ctriv a été calculé dans l’ex. 2.1.3° : il prend les valeurs
2. CARACTÈRES 121

4, 2, 1, 0, 0. Le caractère de V0 prend donc les valeurs 3, 1, 0, −1, −1. On a


1 X 1
〈χV0 , χV0 〉 = χρ (g )2 = (9 × 1 + 1 × 6 + 1 × 6 + 1 × 3) = 1,
|G| g ∈G 24

de sorte que V0 est irréductible (prop. 2.8).


Il nous reste deux représentations irréductibles à trouver, dont la somme des carrés des
dimensions est 24 − 1 − 1 − 9 = 13. Elles sont donc de dimension 2 et 3. L’une d’elles est
V0 ⊗ Csign , dont le caractère prend les valeurs 3, −1, 0, 1, −1. Elle est irréductible (on peut
voir ça soit en calculant 〈χV0 ⊗Csign , χV0 ⊗Csign 〉, soit en remarquant que le produit tensoriel
d’une représentation irréductible et d’une représentation de dimension 1 est encore irré-
ductible).
On a donc déjà la table de caractères partielle

S4 1 6 8 6 3
Id (12) (123) (1234) (12)(34)
χtriv 1 1 1 1 1
χsign 1 −1 1 −1 1
χV0 3 1 0 −1 −1
χV0 χsign 3 −1 0 1 −1
χV 2 ? ? ? ?

dont on peut compléter la dernière ligne en utilisant le fait que les colonnes sont orthogo-
nales :
S4 1 6 8 6 3
Id (12) (123) (1234) (12)(34)
χtriv 1 1 1 1 1
χsign 1 −1 1 −1 1
χV0 3 1 0 −1 −1
χV0 χsign 3 −1 0 1 −1
χV 2 0 −1 0 2

Comment déterminer cette dernière représentation irréductible (V, ρ) ? L’astuce est de re-
marquer que ρ((12)(34)) est une involution de V de trace 2, donc c’est l’identité. La repré-
sentation ρ se factorise donc par la projection S4  S4 /K, où K C S4 est d’ordre 4 (ex.
I.5.3.1°). Le groupe S4 /K est isomorphe à S3 . Il y a donc une représentation irréductible
de degré 2 (comme on l’a vu plus haut).
Les sous-groupes distingués de S4 sont S4 , A4 (noyau de χsign ), K (noyau de χV ) et {e}.
Le groupe dérivé est A4 (noyau de χsign ).

Remarque 2.13. — Cette discussion reste valable sur tout corps de caractéristique autre
que 2 et 3 : S4 a encore, à isomorphisme près, 5 classes de représentations irréductibles.
Sur un corps de caractéristique 2, il n’y en a plus que 2, à savoir Ctriv et V ; en caractéristique
3, il y en a 4, à savoir toutes celles de la table ci-dessus à l’exception de V (qui devient
isomorphe à Ctriv ⊕ Csign ).
122 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

Le groupe S5 . — On a (prop. I.2.8) 7 classes de conjugaison, correspondant aux partitions


(11111) (classe de Id), (1112) (classe d’une transposition, de cardinal 10), (113) (classe d’un
3-cycle, de cardinal 20), (14) (classe d’un 4-cycle, de cardinal 30), (5) (classe d’un 5-cycle,
de cardinal 24), (122) (classe d’une double transposition, de cardinal 15) et (23) (de car-
dinal 20) de 5, donc 7 représentations irréductibles. D’autre part, on a D(S5 ) = A5 (prop.
I.5.8), donc deux représentations irréductibles de dimension 1, la représentation triviale
Ctriv et la signature Csign .
On a aussi la représentation de dimension 4 de S5 dans V0 = {(x 1 , . . . , x 5 ) ∈ C5 | x 1 + · · · +
x 5 = 0} dont le caractère prend les valeurs 4, 2, 1, 0, −1, 0, −1. On calcule 〈χV0 , χV0 〉 = 1, de
sorte que V0 est irréductible (prop. 2.8). La représentation V0 ⊗ Csign est aussi irréductible.
Si V est une représentation de G, on a vu que la représentation V ⊗ V se scinde en S 2 V ⊕
V2
V. Le lemme suivant nous permet de calculer les caractères.

Lemme 2.14. — On a χV2 V (g ) = 12 χV (g )2 − χV (g 2 ) et χS 2 V (g ) = 21 χV (g )2 + χV (g 2 ) .


¡ ¢ ¡ ¢

Démonstration. — Il existe un produit scalaire hermitien pour lequel tous les ρ(g ) sont
unitaires, donc diagonalisables (prop. II.10.6). Soit g ∈ G ; il existe une base (e 1 , . . . , e n ) de
V formée de vecteurs propres de ρ(g ), avec valeurs propres λ1 , . . . , λn . Une base de 2 V est
V
V2
donnée par les (e i ∧ e j )1Éi < j Én et ce sont des vecteurs propres pour ρ(g ), avec valeurs
propres (λi λ j )1Éi < j Én . On a donc
1³ X ´2 1 X
χV2 V (g ) = λi λ j = λi − λ2 .
X
1Éi < j Én 2 1Éi Én 2 1Éi Én i

De même, les valeurs propres de S 2 ρ(g ) sont les (λi λ j )1Éi É j Én et


1³ X ´2 1 X
χS 2 V (g ) = λi λ j = λi + λ2 .
X
1Éi É j Én 2 1Éi Én 2 1Éi Én i
Le lemme en résulte.

On en déduit les valeurs du caractère χV2 V0 et on vérifie que cette représentation est
irréductible.
On a donc déjà la table de caractères partielle (on note l’isomorphisme de représenta-
tions 2 V0 ' 2 V0 ⊗ Csign )
V V

S5 1 10 20 30 24 15 20
Id (12) (123) (1234) (12345) (12)(34) (12)(345)
χtriv 1 1 1 1 1 1 1
χsign 1 −1 1 −1 1 1 −1
χV0 4 2 1 0 −1 0 −1
χV0 χsign 4 −2 1 0 −1 0 1
χV2 V0 6 0 0 0 1 −2 0

Il nous reste deux représentations irréductibles à trouver, dont la somme des carrés des
dimensions est 120 − 1 − 1 − 16 − 16 − 36 = 50. Elles sont de dimension > 1, donc toutes les
deux de dimension 5. Notons l’une d’elles V et soient 5, a 1 , a 2 , a 3 , a 4 , a 5 , a 6 les valeurs de
son caractère. Le caractère de V ⊗ Csign prend alors les valeurs 5, −a 1 , a 2 , −a 3 , a 4 , a 5 , −a 6 .
De deux choses l’une :
2. CARACTÈRES 123

– soit les deux représentations manquantes ont a 1 = a 3 = a 6 = 0 (et chacune est iso-
morphe à son produit tensoriel avec Csign ), mais cela contredit l’orthogonalité des
colonnes 2 et 4 ;
– soit les deux représentations manquantes sont V et V ⊗ Csign .
Dans le premier cas, les colonnes 2 et 4 ne peuvent être orthogonales, donc on est dans
le second cas. Les relations d’orthogonalité permettent alors de compléter la table (les
calculs sont laissés au lecteur) ; on obtient
S5 1 10 20 30 24 15 20
Id (12) (123) (1234) (12345) (12)(34) (12)(345)
χtriv 1 1 1 1 1 1 1
χsign 1 −1 1 −1 1 1 −1
χV0 4 2 1 0 −1 0 −1
χV0 χsign 4 −2 1 0 −1 0 1
χV2 V0 6 0 0 0 1 −2 0
χV 5 1 −1 −1 0 1 1
χV χsign 5 −1 −1 1 0 1 −1

Une autre façon de compléter la table est de s’intéresser au caractère χ de la représen-


tation S 2 V0 . Il prend les valeurs (lemme 2.14) 10, 4, 1, 0, 0, 2, 1 donc
1
〈χ, χ〉 = (100 × 1 + 16 × 10 + 4 × 15 + 1 × 20) = 3.
120
Cette représentation est donc somme de 3 représentations irréductibles. Comme elle est
de dimension 10, ces représentations sont nécessairement de dimension 1, 4 et 5 ; on note
cette dernière V. Sans même calculer 〈χ, χtriv 〉, on voit que c’est strictement positif, donc
Ctriv intervient dans S 2 V0 (cela résulte aussi de l’exerc. 2.12, puisque V0 est en fait une
représentation réelle). On calcule aussi 〈χ, χV0 〉 = 1, donc χ = χtriv +χV0 +χV , d’où on déduit
χV . On voit ensuite χV 6= χV χsign et on complète la table.
Les sous-groupes distingués de S5 sont S5 , A5 (noyau de χsign ) et {e}. Le groupe dérivé
est A5 (noyau de χsign ).

Remarques 2.15. — 1° Il reste vrai que pour tout n Ê 1, la table des caractères du groupe
Sn est à coefficients entiers (mais ce n’est pas le cas pour An ; cf. exerc. 2.17 et 2.18).
2° Dans les exemples précédents, on remarque que la dimension d’une représentation
irréductible divise toujours l’ordre du groupe. C’est un fait général qui sera démontré dans
le th. 3.6. On voit aussi que le caractère d’une représentation irréductible de dimension Ê 2
prend toujours la valeur 0. C’est un fait général qui sera (presque) démontré dans l’exerc.
3.9.
4° On trouve ces tables de caractères dans la littérature scientifique pour les chimistes.
Les notations sont différentes : le groupe Dn est noté Cnv et la table des caractères de
D3 = S3 apparaît ainsi
E 3s v 2C3
A1 1 1 1
A2 1 −1 1
E 2 0 −1
124 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

La notation 3s v indique qu’il y a 3 éléments dans la classe de conjugaison et s v signifie


qu’elle contient des symétries par rapport à un plan vertical (les éléments de D3 = S3 sont
interprétés comme les symétries d’un triangle équilatéral situé dans un plan horizontal).
La notation 2C3 indique qu’il y a 2 éléments dans la classe de conjugaison et Cm corres-
pond à des rotations d’angle 2π/m.
Les lettres A et B indiquent des représentations (irréductibles) de dimension 1, E des
représentations de dimension 2 et T des représentations de dimension 3.

Terminons avec la preuve d’une propriété vue dans des cas particuliers dans les
exemples.

Proposition 2.16. — La représentation de Sn sur l’espace vectoriel

V0 = {(x 1 , . . . , x n ) ∈ Cn | x 1 + · · · + x n = 0}

est irréductible.

Démonstration. — Par la prop. 2.8, cette représentation est irréductible si et seulement


si 〈χV0 , χV0 〉 = 1. Comme la représentation de permutation Cn est somme de V0 et de la
représentation triviale de dimension 1, il suffit de montrer que le caractère χ de la repré-
sentation de permutation vérifie 〈χ, χ〉 = 2.
On a vu dans l’ex. 2.1.3° que χ(g ) est le nombre de points fixes de la permutation g ∈ Sn .
Pour tout a ∈ {1, . . . , n}, posons g a = 0 si g (a) 6= a, et g a = 1 si g (a) = a. On a donc

1 X ³X n ´2
〈χ, χ〉 = ga
n! g ∈Sn a=1
1 X X
= ga gb
n! 1Éa,bÉn g ∈Sn
1 X X 2 X X
= ga + ga gb .
n! 1ÉaÉn g ∈Sn n! 1Éa<bÉn g ∈Sn

1 P 2 P
Le premier terme de la somme vaut n! 1ÉaÉn (n −1)! = 1 et le second vaut n! 1Éa<bÉn (n −
2)! = 1. La proposition en résulte.

Exercice 2.17. — Montrer que la table des caractères du groupe alterné A4 est donnée par

1 4 4 3
Id (123) (132) (12)(34)
χtriv 1 1 1 1
χ 1 ω ω2 1
χ2 1 ω2 ω 1
χV0 3 0 0 −1

où ω := exp(2i π/3).
2. CARACTÈRES 125

Exercice 2.18. — Montrer que la table des caractères du groupe alterné A5 est donnée par

1 20 15 12 12
Id (123) (12)(34) (12345) (21345)
χtriv 1 1 1 1p 1p
1+ 5 1− 5
χ1 3 0 −1 2p 2p
1− 5 1+ 5
χ2 3 0 −1 2 2
χV0 4 0 0 −1 −1
χV 5 −1 1 0 0

Exercice 2.19. — Déterminer la table des caractères du sous-groupe H8 := {±1, ±I, ±J, ±K} du
groupe multiplicatif H× des quaternions (cf. § II.11). Remarquer que c’est la même que celle
du groupe D4 .

Exercice 2.20. — Déterminer la table des caractères du groupe SL(2, F3 ) (cf. exerc. I.2.12) (In-
µ ¶ µ ¶
1 0 −1 0
dication : les 7 classes de conjugaison sont celles de (cardinal 1), de (cardi-
0 1 0 −1
µ ¶ µ ¶ µ ¶ µ ¶
0 1 1 1 1 −1 −1 −1
nal 1), de (cardinal 6), de (cardinal 4), de (cardinal 4), de
−1 0 0 1 0 1 0 −1
µ ¶
−1 1
(cardinal 4) et de (cardinal 4)).
0 −1

Exercice 2.21. — Déterminer la table des caractères du groupe des matrices 3 × 3 triangu-
laires supérieures, avec des 1 sur la diagonale, à coefficients dans Z/3Z (cf. ex. I.2.17).

Exercice 2.22. — Considérons la représentation de permutation de Sn sur l’espace vectoriel


V = Cn et sa sous-représentation irréductible (prop. 2.16)

V0 = {(x 1 , . . . , x n ) ∈ Cn | x 1 + · · · + x n = 0}.

a) Montrer qu’on a un isomorphisme de représentations k V ' k V0 ⊕ k−1 V0 .


V V V
Vk
b) Montrer que chaque représentation V0 , pour 1 É k É n − 1, est irréductible (Indication :
on pourra calculer 〈χVk V , χVk V 〉).

Exercice 2.23. — On fixe un entier n Ê 4. Pour tout g ∈ Sn , on note φ(g ) le nombre de points
fixes de la permutation g et on pose, pour tout entier m Ê 0,

$(n, m) := φ(g )m .
X

g ∈Sn

a) Calculer $(n, 1), $(n, 2), $(n, 3) et $(n, 4) (Indication : on pourra s’inspirer de la preuve de
la prop. 2.16).
b) Le groupe Sn opère sur l’espace vectoriel V = Cn par permutation des coordonnées. Il
opère aussi sur V ⊗ V par

∀g ∈ G ∀v, w ∈ V g · (v ⊗ w) = g (v) ⊗ g (w).

Décomposer cette représentation V ⊗ V de Sn en somme de représentations irréductibles.


c) Montrer que pour tout m, le quotient B(n, m) := $(n,¡mm)/n! est un entier.
d) Pour m < n, montrer la relation B(n, m + 1) := m
P ¢
i =0 i
B(n, i ), avec B(n, 0) := 1. En particu-
lier, B(n, m) est indépendant de n.
126 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

3. Propriétés d’intégralité
Dans cette section, on suppose G fini et K algébriquement clos de caractéristique 0. Il
contient alors Q comme sous-corps.
Dans cette section on démontre que la dimension d’une représentation irréductible
(de dimension finie) divise l’ordre du groupe. La démonstration nécessite de connaître
quelques propriétés des entiers algébriques, que nous allons maintenant définir.

3.1. Entiers algébriques. —

Définition 3.1. — Un élément de K est un entier algébrique s’il est racine d’un polynôme
unitaire à coefficients dans Z.

Par exemple, toute racine de l’unité est un entier algébrique.

r
Remarque 3.2. — Si x ∈ Q ⊆ K est un entier algébrique, x ∈ Z. En effet, si x = s avec
pgcd(r, s) = 1, alors r n + a 1 r n−1 s + · · · + a n s n = 0 qui implique s | r n donc s = ±1.

Si x ∈ K, on note Z[x] le sous-anneau de K engendré par x, c’est-à-dire l’ensemble des


P(x), pour P ∈ Z[X].

Proposition 3.3. — Soit x ∈ K. Les propriétés suivantes sont équivalentes :


(i) x est un entier algébrique ;
(ii) le groupe abélien Z[x] est de type fini ;
(iii) il existe un sous-groupe abélien de type fini de K contenant Z[x].

Démonstration. — L’énoncé (i) implique (ii) : si x n +a 1 x n−1 +· · ·+a n = 0, le groupe abélien


Z[x] est engendré par 1, x, x 2 , . . . , x n−1 .
Le passage de (ii) à (iii) est évident. Montrons que (iii) implique (i). Soit G un sous-
groupe abélien de type fini de K contenant Z[x] et soit Hn le sous-groupe de G engendré
par 1, x, . . . , x n . On a Hn ⊆ Hn+1 , d’où on déduit facilement que H := n∈N Hn est un sous-
S

groupe de G. Par la prop. I.3.2.2°, c’est un groupe de type fini. Étant donné un ensemble
fini de générateurs, il existe alors n ∈ N tel que Hn les contienne tous, de sorte que H =
Hn . Mais alors x n+1 est dans Hn , donc s’écrit comme polynôme à coefficients entiers en
x n , . . . , x, 1, de sorte que x est un entier algébrique.

Corollaire 3.4. — L’ensemble des entiers algébriques de K est un sous-anneau de K.

Démonstration. — Si x et y sont des entiers algébriques, Z[x] est engendré (comme


groupe abélien) par 1, x, . . . , x r , et Z[y] par 1, y, . . . , y s . Alors le groupe (abélien) Z[x, y] est
engendré par les x i y j pour 0 É i É r et 0 É j É s, donc est de type fini. Or il contient
Z[x − y] et Z[x y], donc x − y et x y sont aussi des entiers algébriques par la proposition.

Par exemple, les valeurs des caractères des représentations (de dimension finie) de G
sont des entiers algébriques, puisque ce sont des sommes de racines de l’unité.
3. PROPRIÉTÉS D’INTÉGRALITÉ 127

3.2. Propriété de la dimension des représentations. — On peut maintenant passer à la


démonstration que la dimension d’une représentation irréductible (de dimension finie)
divise l’ordre du groupe.

Lemme 3.5. — Soit C une classe de conjugaison de G et soit (V, ρ) une représentation irré-
|C|χρ (C)
ductible de dimension finie de G. Alors dim(V) est un entier algébrique.

Démonstration. — Le lemme 2.5.2° appliqué à la fonction caractéristique f = 1C−1 de la


classe C−1 := {g −1 | g ∈ C} fournit un endomorphisme v := |G|(1C−1 )ρ = g ∈C ρ(g ) qui est
P

l’homothétie de V de rapport
|G|〈1C−1 , χρ 〉 |C|χρ (C)
λ := = .
dim(V) dim(V)
Considérons maintenant la représentation régulière ρR : G → GL(KG ). Dans la base ca-
nonique (εg )g ∈G de KG , la matrice de chaque endomorphisme ρR (g ) est une matrice de
permutation, donc elle est en particulier à coefficients entiers. Il en est de même pour
l’endomorphisme u = g ∈C ρR (g ) de KG . Mais KG contient comme sous-représentation
P

toutes les représentations irréductibles de G, donc en particulier V.


La restriction de u à V est alors l’endomorphisme v défini plus haut, qui est une ho-
mothétie de rapport λ. On en déduit que λ est valeur propre de u, donc est racine de son
polynôme caractéristique, qui est unitaire à coefficients entiers. C’est donc un entier algé-
brique.

Théorème 3.6. — Si V est une représentation irréductible de dimension finie de G, on a


dim(V) | |G|.
1 P
Démonstration. — Si χ est le caractère de V, on a 1 = 〈χ, χ〉 = |G| g ∈G χ(g )χ(g ) (th. 2.3).
−1

Notons C1 , . . . , Cr les classes de conjugaison de G. On a alors


|G| 1
χ(g −1 )χ(g )
X
=
dim(V) dim(V) g ∈G
1 r
|Ci |χ(Ci−1 )χ(Ci )
X
=
dim(V) i =1
r |C |χ(C )
i i
χ(Ci−1 ).
X
=
i =1 dim(V)

Comme les χ(Ci−1 ) sont des entiers algébriques, on conclut par le lemme 3.5 et le cor. 3.4
|G|
que le rationnel dim(V) est un entier algébrique, donc un entier (rem. 3.2 ; c’est ici que sert
l’hypothèse car(K) = 0).

Remarque 3.7. — La conclusion du théorème n’est plus vraie en général si le corps K n’est
pas algébriquement clos : si K = R, la représentation de Z/3Z comme groupe des rotations
de R2 préservant
p un triangle équilatéral centré à l’origine, donc envoyant 1 sur la matrice
µ ¶
−1/2 − 3/2
p , est irréductible mais sa dimension, 2, ne divise pas l’ordre du groupe, 3.
3/2 −1/2
Sur C, cette représentation se scinde en somme directe de deux représentations de dimen-
sion 1.
128 CHAPITRE IV. REPRÉSENTATIONS DES GROUPES FINIS

En revanche, elle reste vraie en caractéristique p > 0 si p - |G|. Mais il existe une re-
présentation irréductible dans F̄513 (où F̄13 est une clôture algébrique de F13 ) du groupe
SL2 (F13 ), d’ordre 23 · 3 · 7 · 13 = 2184 divisible par la caractéristique, 13, mais pas par la di-
mension, 5.

La contrainte donnée par le théorème est très forte. Par exemple, en combinant avec la
prop. 2.8, on déduit qu’un groupe d’ordre p 2 ne peut avoir que des représentations irré-
ductibles de dimension 1, donc est abélien (prop. 2.9). On retrouve ainsi le cor. I.2.13.1°.
On peut raffiner un peu le théorème.

Théorème 3.8. — Si V est une représentation irréductible de dimension finie de G, on a


dim(V) | [G : Z(G)].

Démonstration (J. Tate). — Le groupe Gm = G × · · · × G a une représentation ρm dans V ⊗m


donnée par
ρm (g 1 , . . . , g m ) = ρ(g 1 ) ⊗ · · · ⊗ ρ(g m ).
Son caractère est (exerc. III.1.5)
χm (g 1 , . . . , g m ) = χ(g 1 ) · · · χ(g m ),
donc 〈χm , χm 〉 = 1 et ρm est irréductible (prop. 2.8).
Si g i ∈ Z(G), alors ρ(g i ) commute à tous les ρ(g ). C’est donc un endomorphisme de
la représentation (V, ρ), c’est-à-dire une homothétie λi IdV (lemme de Schur 1.10). Si en
outre g 1 · · · g m = e, alors IdV = ρ(e) = ρ(g 1 ) · · · ρ(g m ) = λ1 · · · λm IdV et λ1 · · · λm = 1K , d’où
ρm (g 1 , . . . , g m ) = IdV ⊗m . Soit
S = {(g 1 , . . . , g m ) ∈ Z(G)m | g 1 · · · g m = e}.
C’est un sous-groupe distingué de Gm et on peut factoriser la représentation ρm en
ρm
Gm GL(V ⊗m )

ρ̂m
m
G /S,

où ρ̂m est encore irréductible. Par le théorème, dim(V ⊗m ) = (dim(V))m divise |Gm /S| =
|G|m
|Z(G)|m−1
, donc pour tout m Ê 1,
¯µ ¶m ¯
|G| ¯ |G|
|Z(G)|m−1 ¯¯
¯
, qui implique |Z(G)| ¯¯ .
dim(V) dim(V)

On peut généraliser ce résultat en montrant que le degré de toute représentation irré-


ductible divise l’indice de tout sous-groupe abélien distingué dans G.
Exercice 3.9. — Soit G un groupe fini et soit χ le caractère d’une représentation irréductible
complexe ρ de G. On pose
|χ(g )|2 .
Y
N(χ) :=
g ∈G
3. PROPRIÉTÉS D’INTÉGRALITÉ 129

On admettra que N(χ) est un entier (3) .


a) Montrer N(χ) É 1, avec égalité si et seulement si dim(ρ) = 1 (Indication : on pourra comparer
moyenne géométrique et moyenne arithmétique).
b) En déduire que si dim(ρ) Ê 2, il existe g ∈ G tel que χ(g ) = 0.

−1 ) est un entier algébrique. C’est


g ∈G χ(g )χ(g
Q
3. La théorie de Galois nous dit N(χ) ∈ Q. D’autre part, N(χ) :=
donc un entier.
Olivier Debarre

ALGÈBRE 2

ÉCOLE NORMALE SUPÉRIEURE

2011
Olivier Debarre
ALGÈBRE 2

ÉCOLE NORMALE SUPÉRIEURE

2011

Olivier Debarre
TABLE DES MATIÈRES

I. Extensions de corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1. Anneaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Idéaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Divisibilité, éléments irréductibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3. Anneaux principaux, anneaux euclidiens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2. Corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1. Extensions de corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2. Éléments algébriques et transcendants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3. Constructions à la règle et au compas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3. Polynômes et racines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.1. Corps de rupture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.2. Corps de décomposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3. Clôture algébrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4. Extensions normales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5. Séparabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
5.1. Polynômes séparables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
5.2. Corps parfaits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
5.3. Extensions séparables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
5.4. Théorème de l’élément primitif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5.5. Trace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
vi TABLE DES MATIÈRES

6. Théorie de Galois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
6.1. Groupe de Galois d’une extension de corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
6.2. Groupe de Galois de K ,→ K(X) et théorème de Lüroth . . . . . . . . . . . . . . . . 29
6.3. Extensions galoisiennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
6.4. Corps finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6.5. Correspondance de Galois pour les corps finis . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6.6. Correspondance de Galois, lemme d’Artin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
6.7. Clôture galoisienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
7. Applications de la théorie de Galois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
7.1. Constructibilité à la règle et au compas, polynômes cyclotomiques . . . . . . . . 39
7.2. Extensions cycliques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
7.3. Extensions radicales, équations résolubles par radicaux . . . . . . . . . . . . . . . . . . 44

II. Modules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
1. Modules libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2. Modules de torsion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3. Modules de type fini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4. Modules de type fini sur les anneaux principaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.1. Application aux groupes abéliens de type fini . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2. Application à la réduction des endomorphismes . . . . . . . . . . . . . . . . . . . . . . . . 60

III. Anneaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
1. Anneaux factoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2. Anneaux noethériens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3. Radical d’un idéal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4. Décomposition primaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.1. Idéaux primaires, idéaux irréductibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.2. Décomposition primaire dans un anneau noethérien . . . . . . . . . . . . . . . . . . . . . . 81
4.3. Idéaux premiers associés, idéaux premiers immergés . . . . . . . . . . . . . . . . . . . . 83
5. Topologie de Zariski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.1. Spectre d’un anneau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
TABLE DES MATIÈRES vii

5.2. Espaces topologiques irréductibles, composantes irréductibles . . . . . . . . . . . . 91


5.3. Espaces topologiques noethériens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.4. Dimension d’un espace topologique, dimension de Krull d’un anneau . . . . . . 94
6. Localisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7. Hauptidealsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
8. Extensions finies et entières d’anneaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
8.1. Traces d’entiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
8.2. Anneaux intégralement clos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
9. Lemme de normalisation de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
10. Théorème des zéros de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
11. « Going-up » et théorème de Cohen-Seidenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
12. Bases et degré de transcendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
13. « Going-down » . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
14. Dimension des algèbres de type fini sur un corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
15. Anneaux de valuation discrète . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
16. Anneaux de Dedekind . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
CHAPITRE I

EXTENSIONS DE CORPS

1. Anneaux

Nous reviendrons au chapitre III plus longuement sur la théorie des anneaux. Nous nous
contentons ici des quelques préliminaires nécessaires pour aborder la théorie des extensions
de corps.
Tous nos anneaux sont commutatifs unitaires (mais il se peut que 1 = 0 ; cela arrive si et
seulement si l’anneau est nul !). Un morphisme (d’anneaux unitaires) f : A → B doit vérifier
f (1A ) = 1B .
Un élément de A est inversible (on dit aussi que c’est une unité de A) s’il admet un inverse
pour la multiplication. L’ensemble des éléments inversibles, muni de la multiplication, est un
groupe noté habituellement A∗ .
Un anneau A est intègre (« anneau intègre » se dit « integral domain », ou simplement
« domain » en anglais) s’il est non nul et si le produit de deux éléments non nuls de A est
encore non nul. C’est un corps s’il est non nul et si tout élément non nul de A admet un
inverse.
Si un anneau A est intègre, on définit son corps des quotients (ou corps des fractions)
KA comme l’ensemble des « fractions » ab , avec a ∈ A et b ∈ A {0}, modulo la relation
d’équivalence
a a0
∼ 0 ⇐⇒ ab0 = a0 b.
b b
Muni des opérations (addition et multiplication) habituelles sur les fractions, on vérifie que
KA est bien un corps.

Exercice 1.1. — Soit A un anneau.


a) Si A est intègre, montrer que l’anneau A[X] des polynômes à une indéterminée à coeffi-
cients dans A est aussi intègre.
b) Si A est intègre, quelles sont les unités de A[X] ?
b) Si A est quelconque, caractériser les unités de A[X] (c’est difficile à faire directement !
Noter que (2X + 1)2 = 1 dans (Z/4Z)[X], donc 2X + 1 est une unité dans cet anneau).
2 CHAPITRE I. EXTENSIONS DE CORPS

1.1. Idéaux. — Si A est un anneau, une partie I ⊆ A est un idéal si c’est un sous-groupe
additif et si, pour tout a ∈ A et tout b ∈ I, on a ab ∈ I. C’est exactement la propriété
qu’il faut pour pouvoir mettre sur le groupe additif A/I une structure d’anneau qui fait de la
projection canonique A → A/I un morphisme d’anneaux.
Le noyau d’un morphisme d’anneaux f : A → B est un idéal de A noté Ker(f ) (mais
l’image de f n’est en général pas un idéal de B). Plus généralement, l’image réciproque par
f d’un idéal de B est un idéal de A. Si I est un idéal de A, le morphisme f se factorise par la
projection A → A/I si et seulement si I ⊆ Ker(f ).

Exemple 1.2. — L’anneau A est un corps si et seulement si ses seuls idéaux sont {0} et A.

Exemple 1.3. — Les idéaux de l’anneau Z sont les In = nZ, avec n ∈ N.

L’intersection d’une famille quelconque d’idéaux de A est encore un idéal de A. Si S est


une partie de A, l’intersection de tous les idéaux de A contenant S est donc un idéal de A que
Pn
l’on notera (S), ou AS. C’est l’ensemble des sommes finies i=1 ai si , pour n ∈ N, ai ∈ A
et si ∈ S.
Soit I un idéal de l’anneau A. L’anneau A/I est intègre si et seulement si I est un idéal
premier, c’est-à-dire qu’il est distinct de A et qu’il vérifie la propriété :
∀a, b ∈ A ab ∈ I ⇒ (a ∈ I ou b ∈ I).

L’anneau A/I est un corps si et seulement si I est un idéal maximal, c’est-à-dire qu’il est
distinct de A et que l’unique idéal de A contenant strictement I est A (en particulier, tout
idéal maximal est évidemment premier). Il résulte du théorème de Zorn que tout idéal de
A distinct de A est contenu dans un idéal maximal (1) . En particulier, tout anneau non nul
possède un idéal maximal.

Exemple 1.4. — L’anneau A est un corps si et seulement si {0} est un idéal maximal de A.
Exercice 1.5. — Soit A un anneau. Montrer l’égalité
[
m=A A∗ .
m idéal maximal de A

Exercice 1.6. — Soit C l’anneau des fonctions continues de [0, 1] dans R.


a) Montrer que les idéaux maximaux de C sont les
Ix = {f ∈ C | f (x) = 0},
pour chaque x ∈ [0, 1] (pour lesquels C /Ix ' R).

1. Soit I un idéal de A distinct de A. L’ensemble des idéaux de A contenant I et distincts de A est inductif car si
S
(Ij )j∈J est une famille totalement ordonnée d’idéaux de A distincts de A, la réunion j∈J Ij est encore un idéal
(parce que la famille est totalement ordonnée) distinct de A (parce qu’elle ne contient pas 1A ). On applique alors le
lemme de Zorn.
1. ANNEAUX 3

b) Montrer que tout idéal premier de C est contenu dans un unique idéal maximal de C , et
qu’il y est dense (pour la topologie de la convergence uniforme). Tout idéal premier fermé
de C est donc maximal (2) .

1.2. Divisibilité, éléments irréductibles. — Soit A un anneau intègre et soient a et b des


éléments de A. On dit que a divise b, et on écrit a | b, s’il existe q ∈ A tel que b = aq. En
termes d’idéaux, c’est équivalent à (a) ⊇ (b). En particulier, 0 ne divise que lui-même, et une
unité divise tous les éléments de A.
On a (a | b et b | a) si et seulement s’il existe u ∈ A∗ tel que a = ub. On dit alors que a et
b sont associés.
Un élément de A est irréductible si a n’est pas inversible et que si a = xy, alors soit x, soit
y est inversible. La seconde condition signifie que les seuls diviseurs de a sont ses associés et
les unités de A.
Enfin, on dit que des éléments de A sont premiers entre eux si leurs seuls diviseurs com-
muns sont les unités de A. Par exemple, si a est irréductible, tout élément de A est ou bien
premier avec a, ou bien divisible par a.
Exemple 1.7. — Les éléments irréductibles de Z sont les ±p, avec p nombre premier. Ceux
de R[X] sont les polynômes de degré 1 et les polynômes de degré 2 sans racine réelle.

Soit a un élément non nul de A. Si l’idéal (a) est premier, a est irréductible, mais la
réciproque est fausse en général, comme le montre l’ex. 1.9 ci-dessous.
Exemple 1.8. — Si n ≥ 1, l’anneau Z/nZ est intègre si et seulement si n est premier. C’est
alors un corps. On a
n est un nombre premier ⇔ l’idéal (n) est premier ⇔ n est irréductible.

Exemple 1.9. — Dans le sous-anneau Z[i 5] de C, le nombre 3 est√irréductible √ (pour-
quoi ?), mais l’idéal (3) n’est pas premier, car 3 divise le produit (1 + i 5)(1 − i 5) mais
aucun des facteurs.

Noter que la « bonne façon » de voir l’anneau Z[i 5] est de le considérer comme l’anneau
quotient Z[X]/(X 2 + 5) : inutile de construire C pour cela !

1.3. Anneaux principaux, anneaux euclidiens. — Un anneau A est principal (« principal


ideal domain », ou « PID », en anglais) si A est intègre et que tout idéal de A est principal,
c’est-à-dire qu’il peut être engendré par un élément. L’anneau Z est donc principal (ex. 1.3),
mais pas l’anneau C de l’ex. 1.6, ni l’anneau Z[X] des polynômes à coefficients entiers, ni
l’anneau K[X, Y ] des polynômes à deux indéterminées à coefficients dans un corps K.

2. En revanche, la description générale des idéaux premiers de C est un problème très difficile ! Même montrer
qu’il existe des idéaux premiers non maximaux n’est pas évident (cf. exerc. III.3.4).
4 CHAPITRE I. EXTENSIONS DE CORPS

Dans la pratique, on montre souvent qu’un anneau intègre est principal en exhibant une
division euclidienne sur A, c’est-à-dire une fonction ϕ : A {0} → N telle que pour tous
éléments a et b de A, avec b 6= 0, on puisse écrire a = bq + r avec r = 0, ou r 6= 0 et
ϕ(r) < ϕ(b). Les deux exemples fondamentaux sont :
• l’anneau Z est euclidien pour la fonction ϕ(n) = |n| ;
• si K est un corps, l’anneau K[X] est euclidien pour la fonction ϕ(P ) = deg(P ).
Si on a une telle fonction ϕ, on montre qu’un idéal I non nul de A est engendré par tout
élément x non nul de I pour lequel ϕ(x) est minimal.

Exercice 1.10. — Si K est un corps, l’anneau des séries formelles K[[X]] est euclidien. Ses
idéaux sont {0} et les Im = (X m ) pour chaque m ∈ N.

Exercice 1.11. — L’anneau des nombres décimaux (c’est-à-dire les nombres rationnels dont le
développement décimal est fini) est principal.

Exercice 1.12. — Montrer que les idéaux maximaux de l’anneau C des fonctions continues de
[0, 1] dans R ne sont pas principaux (cf. exerc. 1.6 et III.2.17). Que se passe-t-il si l’on remplace
C par l’anneau des fonctions continues de classe C ∞ de [0, 1] dans R ?

Exercice 1.13. — Soit A un anneau intègre dans lequel tout idéal premier est principal. Montrer
que l’anneau A est principal (Indication : on pourra considérer un élément maximal I dans
la famille des idéaux non principaux de A, des éléments x et y de A I tels que xy ∈ I,
et les idéaux (dont on montrera qu’ils sont principaux) J = {a ∈ A | ay ∈ I} = (z) et
J 0 = {a ∈ A | az ∈ I} = (z 0 ), puis aboutir à la contradiction I = (zz 0 )).

Si a et b sont des éléments d’un anneau principal A, l’idéal (a, b) est engendré par un
élément de A, uniquement déterminé à multiplication par un élément inversible de A près. On
l’appelle un pgcd (« plus grand commun diviseur » ; « gcd », ou « greatest common divisor »,
en anglais) de a et b, parfois noté a∧b. De même, l’idéal (a)∩(b) est engendré par un élément
de A, uniquement déterminé à multiplication par un élément inversible de A près, le ppcm
(« plus grand commun multiple » ; « lcm », ou « least common multiple », en anglais) de a
et b, parfois noté a ∨ b. Dans ce contexte, le « théorème de Bézout », qui dit que a et b sont
premiers entre eux si et seulement s’il existe x et y dans A tels que
xa + yb = 1
est une tautologie. Mentionnons comme conséquence un résultat classique (nous reviendrons
sur ces questions dans le § III.1).

Lemme 1.14 (Lemme de Gauss). — Soit A un anneau principal. Si a, b et c sont des élé-
ments de A tels que a divise bc mais est premier avec b, alors a divise c.

Démonstration. — Écrivons bc = ad et xa+yb = 1. On a alors c = (xa+yb)c = xac+yad,


qui est bien divisible par a.
1. ANNEAUX 5

Dans un anneau principal A, les équivalences de l’ex. 1.8 restent vraies.


Proposition 1.15. — Soit A un anneau principal et soit a un élément non nul de A. Les
propriétés suivantes sont équivalentes :
(i) l’idéal (a) est premier, c’est-à-dire que l’anneau quotient A/(a) est intègre ;
(ii) a est irréductible ;
(iii) l’idéal (a) est maximal, c’est-à-dire que l’anneau quotient A/(a) est un corps.

En particulier, l’anneau Z[i 5] de l’ex. 1.9 n’est pas principal.

Démonstration. — On sait qu’en général (iii) ⇒ (i) ⇒ (ii). Supposons a irréductible et soit
I un idéal de A contenant (a). Comme A est principal, on peut écrire I = (x), de sorte qu’il
existe y ∈ A tel que a = xy. Comme a est irréductible, soit x est inversible et I = A, soit
y est inversible et I = (a). Comme a n’est pas inversible, on a (a) 6= A, donc l’idéal (a) est
maximal.

Nous montrerons plus tard (cor. III.2.14) de façon indépendante que tout anneau principal
est factoriel, c’est-à-dire que tout élément non nul s’écrit de façon unique comme produit
d’irréductibles. Comme nous aurons besoin dans le chapitre suivant de ce résultat dans le cas
particulier de l’anneau principal K[X], où K est un corps, nous donnons ici une démonstra-
tion ad hoc.
Théorème 1.16. — Soit K un corps. Tout élément non nul P de K[X] admet une décompo-
sition
m
Y
P =u Piri
i=1
avec u ∈ K ∗ et m ≥ 0, où les polynômes P1 , . . . , Pm sont irréductibles unitaires, distincts
deux à deux.
Qn
Cette décomposition est unique au sens suivant : si P = v i=1 Qsi i est une autre telle
décomposition, on a m = n et il existe une permutation σ ∈ Sm telle que Qi = Pσ(i) et
si = rσ(i) pour tout i ∈ {1, . . . , m}.

Démonstration. — On procède par récurrence sur le degré de P , les assertions étant claires
lorsque celui-ci vaut 0.
Supposons donc P de degré ≥ 1 et montrons d’abord l’existence d’une décomposition.
Si P est irréductible de coefficient directeur u, on écrit simplement P = u(P/u). Sinon, il
existe une décomposition P = QR où Q et R sont non constants et on applique l’hypothèse
de récurrence à Q et R.
C’est l’unicité qui est le point important. Comme Q1 est irréductible, le lemme de Gauss
(lemme 1.14) entraîne que Q1 divise l’un des Pi , que l’on note Pσ(1) . Comme ce dernier
6 CHAPITRE I. EXTENSIONS DE CORPS

est irréductible et que ces deux polynômes sont unitaires, ils sont égaux. Il suffit maintenant
d’appliquer l’hypothèse de récurrence à P/Q1 = P/Pσ(1) .

2. Corps

Si K et L sont des corps, un morphisme (de corps) de K vers L est un morphisme d’an-
neaux unitaires de K vers L ; il est nécessairement injectif et l’on dit que L est une extension
de K. On identifiera souvent une extension K ,→ L avec une inclusion K ⊆ L.
L’intersection d’une famille quelconque de sous-anneaux de L est encore un sous-anneau
de L. Si A est une partie de L, l’intersection de tous les sous-anneaux de L contenant K et
A est donc un sous-anneau de L que l’on notera K[A] ; c’est une K-algèbre intègre appelée
sous-anneau de L engendré par A.
De même, l’intersection d’une famille quelconque de sous-corps de L est encore un sous-
corps de L. Il existe donc un plus petit sous-corps de L contenant K et A, que l’on appelle
le sous-corps de L engendré par A, noté K(A) ; c’est le corps des fractions de K[A]. On
dit qu’une extension K ,→ L est de type fini s’il existe une partie finie A ⊆ L telle que
L = K(A).
Soit K un corps. Il existe un plus petit sous-corps de K, appelé sous-corps premier de K :
c’est le sous-corps engendré par 1K . Il est isomorphe soit à Q, auquel cas on dit que K est de
caractéristique 0, soit à un corps de la forme Z/pZ (que l’on note plus habituellement Fp ) ;
l’entier p est alors premier et l’on dit que K est de caractéristique p. Dans ce dernier cas, on
a p · 1K = 0K et la formule magique (3)
(1) ∀x, y ∈ K (x + y)p = xp + y p .
Autrement dit, l’application de Frobenius
FrK : K −→ K
x 7−→ xp
est un morphisme de corps (injectif). On note K p son image.

2.1. Extensions de corps. — Le degré d’une extension de corps K ,→ L est la dimension


du K-espace vectoriel L, notée [L : K]. L’extension est dite finie si ce degré l’est.

Exemple 2.1. — On a [C : R] = 2, [C : Q] = ∞ et [K(X) : K] = ∞ (4) .

3. On peut l’obtenir en remarquant que la dérivée du polynôme (X + y)p ∈ K[X] est nulle, de sorte que le
coefficient de X i , pour chaque 0 < i < p, est nul (puisque la dérivée de X i ne l’est pas).
4. On ne se préoccupera pas des différentes « sortes » d’infini dans ce cours ; mais ce degré devrait bien sûr être
considéré comme un cardinal.
2. CORPS 7

Théorème 2.2. — Soient K ,→ L et L ,→ M des extensions de corps. On a


[M : K] = [M : L][L : K].
En particulier, l’extension K ,→ M est finie si et seulement si les extensions K ,→ L et
L ,→ M le sont.

Démonstration. — Soit (li )i∈I une base du K-espace vectoriel L et soit (mj )j∈J une base
du L-espace vectoriel M . Nous allons montrer que la famille (li mj )(i,j)∈I×J est une base du
K-espace vectoriel M .
P
Cette famille est libre. Supposons que l’on ait une relation (i,j)∈I×J ki,j li mj = 0, avec
des ki,j ∈ K presque tous nuls. On a
X X X 
0= ki,j li mj = ki,j li mj .
(i,j)∈I×J j∈J i∈I

Comme la famille (mj )j∈J est libre, on en déduit que pour chaque j ∈ J, on a
X
ki,j li = 0.
i∈I

Comme la famille (li )i∈I est libre, on en déduit que pour chaque i ∈ I et chaque j ∈ J, on a
ki,j = 0.
Cette famille est génératrice. Soit y un élément de M . Comme la famille (mj )j∈J est
P
génératrice, il existe des xj ∈ L presque tous nuls tels que y = j∈J xj mj . Comme la
famille (li )i∈I est génératrice, il existe pour chaque j ∈ J des ki,j ∈ K presque tous nuls
P P P
tels que xj = i∈I ki,j li . On a donc y = j∈J i∈I ki,j li .
On en déduit
[M : K] = Card(I × J) = Card(I) Card(J) = [M : L][L : K],
ce qui termine la démonstration du théorème.

2.2. Éléments algébriques et transcendants. —

Définition 2.3. — Soit K ,→ L une extension de corps et soit x un élément de L. On dit que
x est algébrique sur K s’il existe un polynôme non nul P ∈ K[X] tel que P (x) = 0. Dans
le cas contraire, on dit que x est transcendant sur K.
L’extension K ,→ L est dite algébrique si tous les éléments de L sont algébriques sur K.

Exemple 2.4. — Le corps C est une extension algébrique de R. Le réel 2 est algébrique
sur Q. L’ensemble des réels algébriques sur Q est dénombrable : il existe donc des nombres
réels transcendants sur Q (on dit souvent simplement « transcendants »). Le nombre réel
−n!
P
n≥0 10 est transcendant (Liouville, 1844), ainsi que π (Lindemann, 1882).
8 CHAPITRE I. EXTENSIONS DE CORPS

Soit K ,→ L une extension de corps et soit x ∈ L. Le sous-anneau K[x] de L engendré


par x est l’image du morphisme de K-algèbres
ϕx : K[X] −→ L
Q 7−→ Q(x).

Théorème 2.5. — Soit K ,→ L une extension de corps et soit x un élément de L.


a) Si x est transcendant sur K, le morphisme ϕx est injectif, le K-espace vectoriel K[x]
est de dimension infinie et l’extension K ,→ K(x) est infinie.
b) Si x est algébrique sur K, il existe un unique polynôme unitaire P de degré minimal
vérifiant P (x) = 0. Ce polynôme est irréductible, on a K[x] = K(x) et cette extension
de K est finie de degré deg(P ). On appelle P le polynôme minimal de x sur K.

Démonstration. — La transcendance de x est équivalente par définition à l’injectivité de ϕx .


Si ϕx est injectif, le sous-anneau K[x] de L engendré par x est isomorphe à K[X] donc c’est
un K-espace vectoriel de dimension infinie. De même, le sous-corps K(x) de L engendré par
x est isomorphe à l’anneau des fractions rationnelles K(X) (corps des fractions de K[X])
donc c’est un K-espace vectoriel de dimension infinie. Ceci montre a).
Si x est algébrique sur K, le noyau de ϕx est un idéal non nul de K[X], qui est donc princi-
pal (§ 1.3), engendré par un polynôme non nul de degré minimal P qui annule x (c’est-à-dire
P (x) = 0). Il est unique si on le prend unitaire. L’anneau K[x] est alors isomorphe à l’anneau
quotient K[X]/(P ) (§ 1.1). Or l’anneau K[x] est intègre car c’est un sous-anneau de L ; il
s’ensuit que l’idéal (P ) est premier, donc que l’anneau K[X]/(P ) est un corps (prop. 1.15)
et il en est de même pour K[x]. Enfin, les K-espaces vectoriels K[x] et K[X]/(P ) sont aussi
isomorphes, et on vérifie que ce dernier admet comme base les classes de 1, X, . . . , X d−1 ,
où d = deg(P ). Ils sont donc de dimension d.

Exemple 2.6. — Si a + ib est un nombre complexe√avec b 6= 0, son polynôme minimal


2 2 2
sur√R est (X − a)
√ + b . Le polynôme minimal de 2 sur Q est X − 2. Le sous-anneau
Q[ 2] = {x + y 2 | x, y ∈ Q} de R est un corps.

Exercice 2.7. — Soit K ,→ L une extension de corps. Montrer qu’un élément x de L est
algébrique sur K si et seulement si l’anneau K[x] est un corps.

Attention ! La réciproque est fausse (cf. ex. 2.13).

Corollaire 2.8. — Toute extension finie de corps est algébrique.

Démonstration. — Soit K ,→ L une extension finie de corps et soit x ∈ L. Le K-espace


vectoriel K[x] est contenu dans L, donc est de dimension finie. Le th. 2.5 entraîne que x est
algébrique sur K.
2. CORPS 9

Corollaire 2.9. — Toute extension K ,→ L engendrée par un nombre fini d’éléments algé-
briques sur K est finie, donc algébrique. En particulier, toute extension de corps algébrique
et de type fini est finie.

Démonstration. — On procède par récurrence sur le cardinal d’une partie finie A ⊆ L telle
que L = K(A).
Si A est vide, c’est évident. Sinon, on prend x ∈ A et l’on pose L0 = K(A {x}).
L’hypothèse de récurrence entraîne que l’extension K ,→ L0 est finie. Comme x est algébri-
que sur K, il l’est sur L0 , donc L0 ,→ L est finie par le th. 2.5. Le corollaire résulte alors du
th. 2.2 (et du cor. 2.8).

Théorème 2.10. — Soit K ,→ L une extension de corps. L’ensemble des éléments de L


algébriques sur K est un sous-corps de L contenant K appelé clôture algébrique de K dans
L. C’est une extension algébrique de K.

Attention à ne pas confondre cette notion avec celle de clôture algébrique de K, qui sera
définie dans le § 3.3.

Démonstration. — Soient x et y des éléments non nuls de L algébriques sur K. Le cor. 2.9
entraîne que l’extension K ,→ K(x, y) est finie, donc algébrique. Les éléments x − y et x/y
de L sont donc algébriques sur K.

Corollaire 2.11. — Toute extension K ,→ L engendrée par des éléments algébriques sur K
est algébrique.

Démonstration. — Soit A ⊆ L un ensemble d’éléments de L algébriques sur K et en-


gendrant L. La clôture algébrique de K dans L contient A, donc c’est L, qui est donc une
extension algébrique de K par le théorème.
√ √ √
Exemple 2.12.
√ — √ 2 + 3 + 5 est algébrique (sur Q), de même que le nombre
√ Le réel
complexe 2 + 3 + i 5.

Exemple 2.13. — Le corps Q̄ ⊆ C des nombres algébriques (sur Q) est une extension
algébrique de Q. Elle n’est pas finie (parce que, comme on le verra plus tard, par exemple
dans l’exerc. III.1.13, il existe des polynômes irréductibles dans Q[X] de degré arbitrairement
grand).

Théorème 2.14. — Soient K ,→ L et L ,→ M des extensions de corps. Si un élément x de


M est algébrique sur L et que L est une extension algébrique de K, alors x est algébrique
sur K.
En particulier, si L est une extension algébrique de K et que M est une extension algé-
brique de L, alors M est une extension algébrique de K.
10 CHAPITRE I. EXTENSIONS DE CORPS

Démonstration. — Si un élément x de M est algébrique sur L, il est racine d’un polynôme


P ∈ L[X]. Si l’extension K ,→ L est algébrique, l’extension L0 ⊆ L de K engendrée par
les coefficients de P est alors finie (cor. 2.9). Comme x est algébrique sur L0 , l’extension
L0 ,→ L0 (x) est finie (th. 2.5). Le th. 2.2 entraîne que l’extension K ,→ L0 (x) est finie, donc
algébrique (cor. 2.8), et x est algébrique sur K.

Soit K ,→ L une extension de corps et soient x1 , . . . , xn des éléments de L. On montrera


plus tard (th. III.10.2) que l’extension K ,→ K(x1 , . . . , xn ) est algébrique si et seulement
si l’anneau K[x1 , . . . , xn ] est un corps (cela généralise l’exerc. 2.7, mais c’est bien plus
difficile !).

Remarque 2.15. — Si K ,→ L et L ,→ M sont des extensions de corps, on a donc (th. 2.2


et th. 2.14)
K ,→ L et L ,→ M finies ⇐⇒ K ,→ M finie,
K ,→ L et L ,→ M algébriques ⇐⇒ K ,→ M algébrique.
L’équivalence
K ,→ L et L ,→ M de type fini ⇐⇒ K ,→ M de type fini
est aussi vraie, mais plus difficile à montrer (cf. exerc. III.12.3).

2.3. Constructions à la règle et au compas. —

Définition 2.16. — Soit Σ un sous-ensemble de R2 . On dit qu’un point P ∈ R2 est construc-


tible (à la règle et au compas) à partir de Σ si on peut obtenir P à partir des points de Σ par
une suite finie d’opérations de l’un des types suivants :
• prendre l’intersection de deux droites non parallèles passant chacune par deux points
distincts déjà construits ;
• prendre l’un des points d’intersection d’une droite passant par deux points distincts
déjà construits et d’un cercle de rayon joignant deux points distincts déjà construits ;
• prendre l’un des points d’intersection de deux cercles distincts, chacun de rayon joi-
gnant deux points distincts déjà construits.

Exercice 2.17. — On dira qu’une droite est constructible (à partir de Σ) si elle passe par deux
points constructibles distincts, et qu’un cercle est constructible si son centre l’est et qu’il passe
par un point constructible. Montrer que la perpendiculaire et la parallèle à une droite constructible
passant par un point constructible sont constructibles. Montrer que le cercle de centre un point
constructible et de rayon la distance entre deux points constructibles est constructible.

Exercice 2.18. — Soit K un corps de caractéristique 3. Montrer que les médianes de tout tri-
angle dans K 2 sont parallèles.
2. CORPS 11

Si Σ est un sous-ensemble de R contenant 0 et 1, on dit qu’un réel x est constructible à


partir de Σ si c’est l’abcisse d’un point P constructible à partir de Σ × {0} au sens de la
définition ci-dessus. Par l’exerc. 2.17, cela revient au même de dire que le point (x, 0) est
constructible à partir de Σ × {0}.

Théorème 2.19. — Soit Σ un sous-ensemble de R contenant 0 et 1. L’ensemble p CΣ des réels


constructibles à partir de Σ est un sous-corps de R tel que, si x ∈ CΣ , alors |x| ∈ CΣ .

Démonstration. — L’addition et l’opposé sont évidents. La multiplication et l’inverse s’ob-


tiennent à partir du théorème de Thalès et la racine carrée à partir de celui de Pythagore.

En particulier, être constructible à partir de {0, 1} est la même chose qu’être constructible
à partir de Q ; on dit simplement « constructible ».

Théorème 2.20 (Wantzel, 1837). — Soit K un sous-corps de R. Un réel x est constructible


à partir de K si et seulement s’il existe une suite d’extensions
K = K0 ⊆ K1 ⊆ · · · ⊆ Kn ⊆ R
telle que [Ki : Ki−1 ] = 2 et x ∈ Kn .

Avant de démontrer le théorème, on va décrire en général les extensions de degré 2.

Lemme 2.21. — Soit K un corps de caractéristique différente de 2 et soit K ,→ L une


extension de degré 2. Il existe x ∈ L K tel que x2 ∈ K et L = K[x].

On remarquera que l’extension Z/2Z ,→ (Z/2Z)[X]/(X 2 + X + 1), de degré 2 entre


corps de caractéristique 2, ne peut être engendrée par un élément dont le carré est dans Z/2Z.

Démonstration. — Si y ∈ L K, la famille (1, y) est K-libre, donc c’est une base du K-


espace vectoriel L. Il existe donc a et b dans K tels que
y 2 = ay + b.
Comme la caractéristique de K est différente de 2, on peut poser x = y − a2 . On a alors
a2 a2
x2 = y 2 − ay + =b+ ∈ K,
4 4
et L = K[y] = K[x].

Démonstration du théorème. — Soit L un sous-corps de R. On vérifie par des calculs directs


que :
• les coordonnées du point d’intersection de deux droites non parallèles passant chacune
par deux points distincts à coordonnées dans L, sont dans L ;
12 CHAPITRE I. EXTENSIONS DE CORPS

• les coordonnées de l’un des points d’intersection d’une droite passant par deux points
à coordonnées dans L et d’un cercle de rayon joignant deux points distincts à coordon-
nées dans L sont solutions d’une équation de degré 2 à coefficients dans L ;
• les coordonnées des points d’intersection de deux cercles distincts, chacun de rayon
joignant deux points distincts à coordonnées dans L, sont solutions d’une équation de
degré 2 à coefficients dans L.
Par récurrence, on voit que les coordonnées d’un point constructible à partir de K sont dans
un corps du type Kn décrit dans l’énoncé du théorème.
Inversement, pour montrer que tout point dans un corps de type Kn est constructible à
partir de K, il suffit de montrer que tout réel dans une extension quadratique d’un corps L
contenue dans R est constructible à partir de L. Une telle
√ extension est engendrée par un réel
2
x tel que x ∈ L (lemme 2.21 ). Mais alors x = ± x2 est constructible à partir de L (th.
2.19).

Corollaire 2.22. — Soit x un réel constructible sur un sous-corps K de R. Alors x est al-
gébrique sur K de degré une puissance de 2.

Attention, la réciproque est fausse telle quelle (exerc. 2.25) ; cf. th. 7.1 pour une caractéri-
sation des nombres constructibles.

Démonstration. — Si x est un réel constructible, il est dans une extension Kn du type décrit
dans le théorème de Wantzel (th. 2.20), pour laquelle [Kn : K] = 2n (th. 2.2). En considérant
la suite d’extensions K ⊆ K(x) ⊆ Kn , on voit que [K(x) : K] est une puissance de 2 (th.
2.2).

Corollaire 2.23 (Duplication du cube). — Le réel 3 2 n’est pas constructible (sur Q).

Démonstration. — C’est une racine du polynôme X 3 − 2. Si ce dernier est réductible sur Q,


il a un facteur de degré 1, donc une racine rationnelle que l’on écrit sous forme de fraction
3
réduite a/b. On a alors a3 = 2b3 , donc a est pair. On écrit a = 2a0 avec 4a0 = b3 , donc b est
pair, contradiction (voir aussi exerc. 2.24).

Le degré de 3 2 sur Q est donc 3 : il n’est donc pas constructible par cor. 2.22.

Exercice 2.24. — Si le polynôme an X n + · · · + a1 X + a0 ∈ Z[X], avec an 6= 0, a une racine


rationnelle, que l’on écrit sous forme de fraction réduite a/b, alors a | a0 et b | an .

Exercice 2.25. — Considérons le polynôme P (X) = X 4 − X − 1 ∈ Q[X].


a) Montrer que P a exactement deux racines réelles distinctes x1 et x2 .
b) On écrit (X − x1 )(X − x2 ) = X 2 + aX + b avec a, b ∈ R. Montrer [Q(a2 ) : Q] = 3.
c) Montrer que x1 et x2 ne peuvent être tous les deux constructibles (en fait, aucun des deux
ne l’est ; cf. exerc. 7.2).
3. POLYNÔMES ET RACINES 13

On dit qu’un angle α est constructible à partir d’un angle θ si le point (cos α, sin α) est
constructible à partir de {(0, 0), (0, 1), (cos θ, sin θ)}. Comme sin α est constructible à partir
de cos α, c’est équivalent à dire que cos α est constructible à partir de {0, 1, cos θ}.

Corollaire 2.26 (Trisection de l’angle). — L’angle θ/3 est constructible à partir de l’angle
θ si et seulement si le polynôme X 3 − 3X − 2 cos θ a une racine dans Q(cos θ).
En particulier, l’angle π/9 n’est pas constructible à la règle et au compas.

Démonstration. — Comme cos 3u = 4 cos3 u − 3 cos u, le réel cos θ/3 est racine du poly-
nôme
P (X) = 4X 3 − 3X − cos θ.
Si P est irréductible sur Q(cos θ), le réel cos θ/3 est de degré 3 sur ce corps et ne peut y être
constructible par cor. 2.22.
Si P est réductible sur Q(cos θ), étant de degré 3, il doit avoir une racine dans ce corps et
se factorise sur ce corps en le produit d’un polynôme de degré 1 et d’un polynôme de degré 2.
Le réel cos θ/3 est racine de l’un de ces deux polynômes, donc est constructible sur Q(cos θ)
(lemme 2.21 et th. 2.20). Comme 2P (X/2) = X 3 − 3X − 2 cos θ, cela montre la première
partie de l’énoncé.
On a Q(cos π/3) = Q, donc l’angle π/9 est constructible si et seulement si le polynôme
X 3 − 3X − 1 a une racine dans Q, ce qui n’est pas le cas (exerc. 2.24).

Corollaire 2.27 (Quadrature du cercle). — Le réel π n’est pas constructible.

Démonstration. — Ici, on triche : il faut savoir que π est transcendant (Exemple 2.4), donc

aussi π.

3. Polynômes et racines

On prend maintenant le problème dans l’autre sens : au lieu de se donner une extension
d’un corps K et de regarder si les éléments de cette extension sont, ou non, racines de poly-
nômes à coefficients dans K, on part d’un polynôme P ∈ K[X] et l’on cherche à construire
une extension de K dans laquelle P aura une racine, ou même, sera scindé (produit de fac-
teurs du premier degré).

3.1. Corps de rupture. — Les unités de l’anneau K[X] sont les polynômes constants non
nuls (c’est-à-dire les éléments de K ∗ ).
Soit P ∈ K[X] un polynôme irréductible. L’anneau K[X] étant principal, l’anneau quo-
tient KP := K[X]/(P ) est un corps (prop. 1.15). Soit xP ∈ KP l’image de X dans KP . On
14 CHAPITRE I. EXTENSIONS DE CORPS

a alors P (xP ) = 0, de sorte que l’on a construit une extension KP de K dans laquelle P a
une racine, xP ; de plus, KP = K[xP ]. On appelle KP un corps de rupture de P .
Exemple 3.1. — Le corps C est un corps de rupture du polynôme irréductible X 2 + 1 ∈
R[X]. De même, le polynôme X 2 + X + 1 est aussi irréductible sur R et C est encore un
corps de rupture. Plus généralement, C est le corps de rupture de n’importe quel polynôme
de R[X] de degré deux sans racine réelle (cf. ex. 1.7).

Exemple 3.2. — Le √ corps Q( 3 2) est un corps de rupture du polynôme irréductible X 3 −2 ∈
Q[X] ; le corps Q(j 3 2) en est un autre. Remarquons que le polynôme X 3 − 2 n’est pas
scindé dans ces corps.
Proposition 3.3. — Soit P ∈ K[X] un polynôme irréductible. Pour toute extension K ,→ L
et toute racine x de P dans L, il existe un unique K-morphisme KP ,→ L qui envoie xP sur
x.

Démonstration. — Le morphisme K[X] → L qui envoie X sur x s’annule en P , donc


définit par passage au quotient l’unique K-morphisme de KP vers L qui envoie xP sur x.
Corollaire 3.4. — Soit P ∈ K[X] un polynôme irréductible. Deux corps de rupture de P
sont K-isomorphes.

On remarquera que l’isomorphisme entre deux corps de rupture n’est en général pas
unique. Plus précisément, étant donnés des corps de rupture K ,→ L et K ,→ L0 de P ,

et des racines x ∈ L et x0 ∈ L0 de P , il existe un unique K-isomorphisme σ : L → L0 tel que
σ(x) = x0 .

3.2. Corps de décomposition. — Étant donné un polynôme P à coefficients dans K, on


cherche maintenant à construire une extension de K dans laquelle P est scindé, c’est-à-dire
produit de facteurs du premier degré.
Théorème 3.5. — Soit P ∈ K[X].
a) Il existe une extension K ,→ L dans laquelle le polynôme P est scindé, de racines
x1 , . . . , xd , telle que L = K[x1 , . . . , xd ].
b) Deux telles extensions sont isomorphes.

Une telle extension s’appelle un corps de décomposition de P (« splitting field » en an-


glais). C’est une extension algébrique de type fini, donc finie de K (cor. 2.9).

Démonstration. — On procède par récurrence sur le degré d de P . Si d = 1, le corps L = K


est le seul qui convient.
Si d > 1, soit Q un facteur irréductible de P dans K[X] (cf. th. 1.16) et soit KQ le corps
de rupture de Q construit plus haut. Le polynôme P admet la racine xQ dans KQ , donc
3. POLYNÔMES ET RACINES 15

s’écrit P (X) = (X − xQ )R(X) avec R ∈ KQ [X] de degré d − 1. L’hypothèse de récurrence


appliquée à R fournit un corps de décomposition KQ ,→ L de R sur KQ . Alors R est scindé
dans L[X], de racines x1 , . . . , xd−1 , donc aussi P , de racines xQ , x1 , . . . , xd−1 . De plus,
L = KQ [x1 , . . . , xd−1 ] = K[xQ ][x1 , . . . , xd−1 ], donc L est un corps de décomposition de
P , et ceci montre a).
Soient K ,→ L et K ,→ L0 des corps de décomposition de P , et soient x une racine
de Q dans L et x0 une racine de Q dans L0 . Le corps K(x) ⊆ L est un corps de rupture
pour Q sur K, et il en est de même pour le corps K(x0 ) ⊆ L0 . Il existe donc (cor. 3.4) un

K-isomorphisme K(x) → K(x0 ) qui envoie x sur x0 . Il permet de considérer L0 comme une

extension de K(x) via le morphisme composé K(x) → K(x0 ) ,→ L0 .
Écrivons comme plus haut P (X) = (X − x)R(X) avec R ∈ K(x)[X] de degré d − 1.
Les extensions L et L0 de K(x) sont alors des corps de décomposition de R sur K(x).
L’hypothèse de récurrence appliquée à R entraîne que L et L0 sont K(x)-isomorphes, donc
K-isomorphes. Ceci prouve b).

Exemple 3.6. — Pour tout d ≥ 3, le corps C est un corps de décomposition pour le poly-
nôme X d − 1 ∈ R[X].

Exemple 3.7. — Le corps Q( 3 2, j) est un corps de décomposition pour le polynôme X 3 −
2 ∈ Q[X].

3.3. Clôture algébrique. —

Définition 3.8. — On dit qu’un corps Ω est algébriquement clos si tout polynôme non cons-
tant de Ω[X] a une racine dans Ω.
Une clôture algébrique d’un corps K est une extension algébrique K ,→ Ω telle que Ω est
un corps algébriquement clos.

Exemple 3.9. — Le corps C est algébriquement clos. C’est une clôture algébrique de R,
mais pas de Q.

Exercice 3.10. — Montrer que tout corps algébriquement clos est infini.

À partir d’un corps algébriquement clos, il est facile de construire une clôture algébrique
pour n’importe quel sous-corps.

Proposition 3.11. — Soit Ω un corps algébriquement clos et soit K ⊆ Ω un sous-corps.


L’ensemble des éléments de Ω qui sont algébriques sur K est une clôture algébrique de K.

En d’autres termes (cf. th. 2.10), la clôture algébrique d’un corps dans une extension algé-
briquement close est une clôture algébrique (tout court) !
16 CHAPITRE I. EXTENSIONS DE CORPS

Démonstration. — On a déjà vu que l’ensemble K̄ des éléments de Ω qui sont algébriques


sur K est un sous-corps de Ω (th. 2.10), extension algébrique de K. Montrons qu’il est algé-
briquement clos. Soit P ∈ K̄[X] un polynôme non constant et soit x une racine de P dans
Ω. Alors x est algébrique sur K̄, donc aussi sur K (th. 2.14), de sorte que x ∈ K̄.

Exemple 3.12. — Le corps Q̄ ⊆ C des nombres algébriques (cf. ex. 2.13) est une clôture
algébrique de Q. C’est un corps dénombrable (pourquoi ?).

Théorème 3.13 (Steinitz, 1910). — Soit K un corps. Il existe une clôture algébrique de K.
Deux clôtures algébriques de K sont K-isomorphes.

Démonstration. — Nous ne ferons la construction d’une clôture algébrique que dans le cas
où le corps K est (au plus) dénombrable (les idées sont analogues dans le cas général, mais il
faut utiliser le lemme de Zorn, comme dans la preuve du lemme 3.15). L’ensemble K[X] est
alors dénombrable. On peut donc numéroter ses éléments en une suite (Pn )n∈N . On construit
une suite (Kn )n∈N de corps emboîtés en posant K0 = K et en prenant pour Kn+1 un corps
de décomposition du polynôme Pn , vu comme élément de Kn [X]. Posons
[
L= Kn .
n∈N

Il existe sur L une (unique) structure de corps faisant de chaque Kn un sous-corps de L et


K ,→ L est une extension algébrique.
On va montrer que L est algébriquement clos. Soit Q ∈ L[X] un polynôme irréductible et
soit x une racine de Q dans une extension de L. Alors x est algébrique sur L donc sur K (th.
2.14). Soit P ∈ K[X] son polynôme minimal ; puisque Q est irréductible sur L, on a Q | P
dans L[X]. Or le polynôme P est un Pm , donc il est scindé dans Km+1 [X], donc dans L[X].
Il s’ensuit que Q est aussi scindé dans L[X].
Comme tout élément de L[X] est produit de polynômes irréductibles (th. 1.16), on a mon-
tré que L est une clôture algébrique de K.
Pour montrer l’unicité, commençons par montrer deux lemmes qui nous serviront de nou-
veau dans le § 5.3.

Lemme 3.14. — Soit K ,→ L une extension de corps telle que L est engendré par un élé-
ment x algébrique sur K, de polynôme minimal P ∈ K[X]. Toute extension K ,→ Ω, où Ω
est un corps algébriquement clos, s’étend en (5) L ,→ Ω et le nombre de ces extensions est
égal au nombre de racines distinctes de P dans son corps de décomposition.

Démonstration. — On a L ' K[X]/(P ), de sorte que se donner un K-morphisme σ de


L dans Ω est équivalent à se donner un élément σ(x) de Ω qui vérifie P (σ(x)) = 0. Il y a

5. Cela siginifie que si ι : K ,→ Ω et α : K ,→ L sont les extensions données, il existe σ : L ,→ Ω tel que
σ ◦ α = ι.
4. EXTENSIONS NORMALES 17

donc exactement autant de tels morphismes que de racines de P dans Ω, ou encore dans le
sous-corps de Ω que ces racines engendrent ; ce sous-corps est un corps de décomposition de
P , ce qui montre le lemme.

Lemme 3.15. — Soit K ,→ L une extension algébrique de corps. Toute extension K ,→ Ω,


où Ω est un corps algébriquement clos, s’étend en L ,→ Ω.

Démonstration. — Lorsque l’extension K ,→ L est finie, cela résulte immédiatement du


lemme précédent : il suffit de l’écrire comme une suite d’extensions emboîtées
K ,→ K(x1 ) ,→ K(x1 , x2 ) ,→ · · · ,→ K(x1 , . . . , xn ) = L
et d’appliquer le lemme à chaque extension.
Dans le cas général, il faut appliquer le lemme de Zorn : on considère l’ensemble non vide
E des paires (M, σ), où M est un sous-corps de L contenant K et σ : M ,→ Ω une extension
de ι : K ,→ Ω à M . Il est partiellement ordonné par la relation
(M, σ) ≤ (M 0 , σ 0 ) ⇔ (M ⊆ M 0 et σ 0 |M = σ).
Si (Mi , σi )i∈I est un sous-ensemble totalement ordonné de E , la réunion M := i∈I Mi est
S

un sous-corps de L et on définit uniquement σ : M → Ω par σ|Mi = σi . La paire (M, σ)


est alors dans E et c’est un majorant de la famille (Mi , σi )i∈I . Il existe donc un élément
maximal (M0 , σ0 ).
Puisque L est une extension algébrique de K, tout élément x de L est algébrique sur K,
donc a fortiori sur M0 . Le lemme précédent dit que l’on peut alors étendre σ0 en M0 (x) ,→
Ω. Par maximalité de (M0 , σ0 ), cela entraîne M0 (x) = M0 , c’est-à-dire x ∈ M0 . On a donc
L = M0 , ce qui prouve le lemme.

Terminons maintenant la preuve du th. 3.13. Si ι : K ,→ Ω et ι0 : K ,→ Ω0 sont des


clôtures algébriques, ι0 s’étend par le lemme 3.15 en σ : Ω ,→ Ω0 . Comme Ω est algébrique-
ment clos, il en est de même pour σ(Ω). Mais Ω0 est une extension algébrique de σ(Ω), donc
σ(Ω) = Ω0 . Les extensions K ,→ Ω et K ,→ Ω0 sont donc isomorphes.

Exercice 3.16. — Écrire la preuve de la partie existence du th. 3.13 dans le cas général.

4. Extensions normales

Rappelons
√ que le polynôme irréductible X 3 − 2 ∈ Q[X] a une racine dans l’extension
3
Q( 2), mais n’y est pas scindé.

Définition 4.1. — On dit qu’une extension algébrique K ,→ L est normale si tout polynôme
irréductible dans K[X] qui a une racine dans L est scindé dans L.
18 CHAPITRE I. EXTENSIONS DE CORPS


Les
√ extensions Q ,→ Q( n 2) ne sont donc pas normales pour n ≥ 3, mais Q ,→
Q( 3 2, j) l’est (à cause du théorème ci-dessous). L’extension d’un corps dans une clôture
algébrique est toujours normale, puisque tout polynôme y est scindé.
Théorème 4.2. — Soit K ,→ L une extension de corps. Les propriétés suivantes sont équi-
valentes :
(i) l’extension K ,→ L est finie et normale ;
(ii) L est le corps de décomposition d’un polynôme à coefficients dans K.

Démonstration. — Soit K ,→ L une extension finie et normale, soit (x1 , . . . , xd ) une base
du K-espace vectoriel L, et soit Pi ∈ K[X] le polynôme minimal de xi . Comme K ,→ L
est normale, chaque Pi est scindé dans L, donc aussi Q := P1 · · · Pd . Comme L est engendré
sur K par les xi , qui sont des racines de Q, le corps L est un corps de décomposition de
Q ∈ K[X].
Soit maintenant L le corps de décomposition d’un polynôme Q ∈ K[X]. C’est une exten-
sion finie de K. Soit P ∈ K[X] un polynôme irréductible qui a une racine x1 dans L, soit
L ,→ M un corps de décomposition de P , et soit x2 une racine de P dans M . Il suffit de
montrer x2 ∈ L, puisque cela entraînera que toutes les racines de P dans M sont en fait dans
L, donc que P est déjà scindé dans L.
Or, pour chaque i ∈ {1, 2}, L(xi ) est un corps de décomposition de Q sur K(xi ). D’autre
part, chaque K(xi ) est un corps de rupture de P sur K, donc (cor. 3.4) il existe un K-
∼ σ
isomorphisme σ : K(x1 ) → K(x2 ). Les extensions K(x1 ) ,→ L(x1 ) = L et K(x1 ) →
K(x2 ) ,→ L(x2 ) sont alors des corps de décomposition de Q sur K(x1 ). Elles sont donc
K(x1 )-isomorphes (th. 3.5), de sorte que [L : K(x1 )] = [L(x2 ) : K(x1 )], puis [L : K] =
[L(x2 ) : K] (th. 2.2). On en déduit L = L(x2 ), donc x2 ∈ L.
Remarque 4.3. — Si K ,→ M est une extension de corps finie et normale et que L est un
corps intermédiaire entre K et M , le théorème entraîne que l’extension L ,→ M est encore
normale. En revanche, ce n’est√pas nécessairement
√ le cas pour l’extension K ,→ L, comme
le montre l’exemple Q ,→ Q( 3 2) ,→ Q( 3 2, j).
De plus, la composée de deux extensions normales K √
,→ L et L ,→
√ M n’est pas néces-
sairement normale, comme le montre l’exemple Q ,→ Q( 2) ,→ Q( 4 2).
Proposition 4.4. — Soit K ,→ L une extension finie et soit Ω un corps algébriquement clos
contenant L. Il existe une plus petite extension M de L dans Ω telle que l’extension K ,→ M
soit normale.

On appelle cette extension la clôture normale de L dans Ω ; elle est finie sur K.

Démonstration. — Comme dans la preuve précédente, soit (x1 , . . . , xd ) une base du K-


espace vectoriel L, et soit Pi ∈ K[X] le polynôme minimal de xi . Soit M ⊆ Ω le sous-corps
5. SÉPARABILITÉ 19

engendré par les racines de Q := P1 · · · Pd dans Ω. C’est un corps de décomposition du


polynôme Q, donc l’extension K ,→ M est finie et normale.
De plus, pour tout corps L ⊆ M 0 ⊆ Ω tel que l’extension K ,→ M 0 est normale, le
polynôme irréductible Pi a une racine dans M 0 (à savoir xi ), donc y est scindé (déf. 4.1),
donc aussi Q. On en déduit que M , qui est engendré par les racines de Q, est contenu dans
M 0.

Exercice 4.5. — Soient K et K 0 des sous-corps d’un corps L tels que les extensions K ⊆ L et
K 0 ⊆ L soient normales (mais pas nécessairement finies !). Montrer que l’extension K ∩K 0 ⊆ L
est aussi normale.

5. Séparabilité

5.1. Polynômes séparables. —

Définition 5.1. — On dit qu’un polynôme P ∈ K[X] est séparable s’il n’a aucune racine
multiple dans son corps de décomposition. Dans le cas contraire, on dit que P est inséparable.

Lemme 5.2. — Un polynôme P est séparable si et seulement si P et P 0 sont premiers entre


eux.

Démonstration. — Remarquons que le pgcd de P et P 0 est le même dans K ou dans toute


extension de K (utiliser l’algorithme d’Euclide), en particulier dans un corps de décomposi-
tion L de P . Dans L, ce pgcd vaut 1 si et seulement si aucune racine de P n’est multiple.

Lemme 5.3. — Un polynôme irréductible P ∈ K[X] est séparable si et seulement si P 0 6=


0. Il est inséparable si et seulement si la caractéristique p de K est non nulle et P ∈ K[X p ].

Démonstration. — La premier énoncé résulte du lemme précédent : P est inséparable si et


seulement si P ∧ P 0 est un polynôme non constant, qui divise P , ce qui entraîne que c’est P
(puisque P est irréductible) puis que P divise P 0 , puis que P 0 est nul car il est sinon de degré
< deg(P ).
Écrivons
P (X) = an X n + · · · + a0 .
Le polynôme
P 0 (X) = nan X n−1 + · · · + a1
est nul si et seulement si ai = 0 pour chaque i non divisible par p.

Lemme 5.4. — Supposons K de caractéristique p > 0. Si a ∈ K K p , le polynôme X p − a


est irréductible dans K[X] et inséparable.
20 CHAPITRE I. EXTENSIONS DE CORPS

Démonstration. — Soit P un facteur irréductible unitaire de Q(X) = X p − a dans K[X] et


soit x une racine de P dans un corps de rupture L. On a a = xp donc Q(X) = X p − xp =
(X − x)p dans L[X], de sorte que P (X) = (X − x)i dans L[X], avec 1 ≤ i ≤ p. Comme
x ∈/ K, on a i ≥ 2, donc P n’est pas séparable. Par le lemme 5.3, le degré de P est un
multiple de p, donc i = p et P = Q est irréductible. De plus, P est clairement inséparable
puisque P 0 = 0.

Lemme 5.5. — Si un polynôme irréductible unitaire P ∈ K[X] de degré ≥ 2 n’a qu’une


seule racine dans un corps de décomposition, alors la caractéristique de K est p > 0, et il
n
existe n ≥ 1 et a ∈ K K p tels que P (X) = X p − a.

La réciproque est vraie (exerc. 5.8).

Démonstration. — Dans un corps de décomposition de P , on peut écrire P (X) = (X−x)m ,


avec m ≥ 2, de sorte que P est inséparable. Par le lemme 5.3, la caractéristique de K
est un nombre premier p qui divise m. Écrivons m = rpn , avec r ∧ p = 1, de sorte que
n n n n
P (X) = (X p − xp )r , et posons Q(X) = (X − xp )r , de sorte que P (X) = Q(X p ). Le
n
polynôme Q est alors irréductible (car P l’est) et n’a qu’une seule racine, xp , dans un corps
de décomposition. Si r ≥ 2, il est inséparable, donc p | r (lemme 5.3), ce qui est absurde.
n
Donc r = 1, et a := xp ∈ / K p (puisque P est irréductible), ce qui montre le lemme.

5.2. Corps parfaits. —

Définition 5.6. — Le corps K est parfait si tout polynôme irréductible de K[X] est sépa-
rable.

Théorème 5.7. — Le corps K est parfait s’il est soit de caractéristique nulle, soit de carac-
téristique p > 0 et K = K p .

Démonstration. — Si K est de caractéristique nulle, il est parfait par le lemme 5.3. S’il est
de caractéristique p et K p 6= K, il n’est pas parfait par le lemme 5.4.
Si au contraire K = K p , tout polynôme P inséparable s’écrit par le lemme 5.3
P (X) = amp X mp + · · · + ap X p + a0 .
Comme K = K p , on peut écrire aip = bpi et
P (X) = amp X mp + · · · + ap X p + a0
= bpm X mp + · · · + bp1 X p + bp0
= (bm X m + · · · + b1 X + b0 )p ,
ce qui entraîne que P ne peut être irréductible. Donc tout polynôme irréductible de K[X] est
séparable : K est parfait.
5. SÉPARABILITÉ 21

En particulier, tout corps fini est parfait, puisque le morphisme de Frobenius x 7→ xp étant
injectif est automatiquement surjectif. Tout corps algébriquement clos est aussi parfait. En
revanche, le corps Fp (T ) n’est pas parfait (le polynôme X p − T ∈ Fp (T )[X] est irréductible
par le lemme 5.4 mais non séparable).
Dans un corps parfait K, le morphisme de Frobenius FrK est bijectif. Pour tout x ∈ K,
on notera x1/p son image inverse par FrK .
Exercice 5.8. — Soit K un corps de caractéristique p > 0. Si a ∈ K K p , montrer que pour
n
tout n ≥ 1, le polynôme X p − a est irréductible dans K[X]. En déduire que si K ,→ L est
une extension finie et que L est un corps parfait, alors K est un corps parfait. Montrer qu’un
sous-corps d’un corps parfait n’est pas nécessairement parfait.

Exercice 5.9. — Soit K un sous-corps d’un corps parfait L de caractéristique non nulle. Le
morphisme de Frobenius FrL : L → L est alors bijectif (th. 5.7). Montrer que

[
Fr−n
L (K)
n=1

est le plus petit sous-corps parfait de L contenant K.

Exercice 5.10. — Soit K une extension de type fini d’un corps parfait de caractéristique p > 0.
Montrer que K est une extension finie de K p . Donner un exemple de corps K de caractéristique
p > 0 qui n’est pas une extension finie de K p .

5.3. Extensions séparables. —

Définition 5.11. — Soit K ,→ L une extension de corps. On dit qu’un élément de L est
séparable sur K s’il est algébrique sur K et que son polynôme minimal sur K est séparable.
On dit qu’une extension K ,→ L est séparable si tout élément de L est séparable sur K.

Un corps K est parfait si et seulement si toute extension algébrique de K est séparable


(pourquoi ?). En particulier, toute extension algébrique de corps de caractéristique nulle est
séparable.
Soit K ,→ L une extension algébrique de corps et soit K ,→ Ω un morphisme dans un
corps algébriquement clos Ω. On a vu dans le lemme 3.14 qu’il existe une extension de ce
morphisme en σ : L ,→ Ω. L’extension K ,→ σ(L) est alors algébrique, donc contenue dans
la clôture algébrique de K dans Ω, qui est un corps algébriquement clos (prop. 3.11), donc
une clôture algébrique de K. Comme deux clôtures algébriques de K sont K-isomorphes (th.
3.13), le cardinal de l’ensemble des extensions de K ,→ Ω à L est indépendant de l’extension
algébriquement close Ω ; on le note [L : K]s et on l’appelle le degré séparable de l’extension
K ,→ L. Il est toujours ≥ 1 par le lemme 3.14.

Exemple 5.12. — On a [C : R]s = 2, les deux R-morphismes de C dans C étant l’identité


et la conjugaison complexe.
22 CHAPITRE I. EXTENSIONS DE CORPS

Exemple 5.13. — Si K est le corps de rupture sur Q du polynôme irréductible X 3 − 2,


c’est-à-dire K = Q(a) avec a3 √ = 2, on a [K : Q]s = 3, les trois Q-morphismes de K dans
2ikπ/3 3
C étant définis par a 7→ e 2, pour k ∈ {0, 1, 2}.

Exemple 5.14. — Soit p un nombre premier. Posons L = Fp (T ) et K := Lp = Fp (T p ).


L’extension K ,→ L est finie de degré p. Si ι : K ,→ Ω est un morphisme dans un corps
algébriquement clos Ω et σ : L ,→ Ω une extension de f , on a nécessairement σ(T ) =
(ι(T p ))1/p , de sorte que [L : K]s = 1.

Théorème 5.15. — Soit K ,→ L une extension finie de corps. On a


1 ≤ [L : K]s ≤ [L : K]
et il y a égalité à droite si et seulement si l’extension K ,→ L est séparable.

Démonstration. — On commence par montrer la multiplicativité des degrés séparables.

Lemme 5.16. — Soient K ,→ L et L ,→ M des extensions algébriques de corps. On a


[M : K]s = [M : L]s [L : K]s .

Démonstration. — Soit Ω une extension algébriquement close de M et soit (σi )i∈I la fa-
mille des K-morphismes de L dans Ω, avec Card(I) = [L : K]s . Considérons l’exten-
sion σi : L ,→ Ω ; comme on l’a déjà noté, le cardinal de l’ensemble des extensions à
M est indépendant de i et vaut [M : L]s . On peut donc noter (τij )j∈J cet ensemble, avec
Card(J) = [M : L]s . On obtient ainsi une famille de K-morphismes distincts de M dans Ω
indexée par I × J.
Inversement, étant donné un tel morphisme M ,→ Ω, il se restreint à L en un des σi ; c’est
donc l’un des τij . Le lemme est ainsi démontré.

Lorsque l’extension K ,→ L est engendrée par un élément x, de polynôme minimal P , on


a vu dans le lemme 3.14 que [L : K]s est égal au nombre de racines distinctes de P dans son
corps de décomposition. On a donc bien [L : K]s ≤ [L : K] dans ce cas (avec égalité si et
seulement si x est séparable).
Dans le cas général, on écrit l’extension finie K ,→ L comme une suite d’extensions
emboîtées
K ,→ K(x1 ) ,→ K(x1 , x2 ) ,→ · · · ,→ K(x1 , . . . , xn ) = L
et l’on applique le lemme 5.16 à chaque extension pour obtenir l’inégalité [L : K]s ≤ [L :
K].
Si K ,→ L est séparable, ou même plus généralement si L est engendré par des éléments
x1 , . . . , xn séparables sur K, alors chaque xi est a fortiori séparable sur K(x1 , . . . , xi−1 )
(son polynôme minimal sur ce corps divise son polynôme minimal sur K, donc est aussi
5. SÉPARABILITÉ 23

séparable) et on a [K(x1 , . . . , xi−1 )(xi ) : K(x1 , . . . , xi−1 )]s = [K(x1 , . . . , xi−1 )(xi ) :
K(x1 , . . . , xi−1 )], d’où l’égalité [L : K]s = [L : K] par le lemme 5.16.
Inversement, supposons [L : K]s = [L : K]. Pour tout x ∈ L, comme [L : K(x)]s ≤ [L :
K(x)] et [K(x) : K]s ≤ [K(x) : K], le lemme 5.16 entraîne qu’il y a égalité dans ces deux
inégalités. La discussion précédente dit alors que x est séparable sur K. Donc l’extension
K ,→ L est bien séparable.

La preuve montre aussi que si L est engendré par des éléments séparables, l’extension
K ,→ L est séparable.

Théorème 5.17. — Soient K ,→ L et L ,→ M des extensions de corps. Si un élément x de


M est séparable sur L et que L est une extension séparable de K, alors x est séparable sur
K.
En particulier, M est une extension séparable de K si et seulement si les extensions L de
K et M de L le sont.

Démonstration. — Si un élément x de M est séparable sur L, il est algébrique sur L, donc


racine d’un polynôme P ∈ L[X]. Si l’extension K ,→ L est séparable, l’extension (finie)
L0 ⊆ L de K engendrée par les coefficients de P est alors finie séparable, donc [L0 : K]s =
[L0 : K] (th. 5.15). Comme x est séparable sur L0 , l’extension L0 ,→ L0 (x) est séparable,
donc [L0 (x) : L0 ]s = [L0 (x) : L0 ]. Le lemme 5.16 entraîne alors [L0 (x) : K]s = [L0 (x) : K].
L’extension finie K ,→ L0 (x) est alors séparable (th. 5.15), donc x est séparable sur K.
Si l’extension K ,→ M est séparable, il est clair que l’extension K ,→ L l’est aussi,
ainsi que l’extension L ,→ M , puisque le polynôme minimal de x sur L divise le polynôme
minimal de x sur K. L’implication réciproque résulte de la première partie du théorème.

Corollaire 5.18. — Soit K ,→ L une extension de corps. L’ensemble des éléments de L


séparables sur K est un sous-corps de L, extension séparable de K appelée clôture séparable
de K dans L.

Si L0 ⊆ L est la clôture séparable de K dans L, il résulte du corollaire précédent que tout


élément de L L0 est inséparable sur L0 .

Démonstration. — Soient x et y des éléments non nuls de L séparables sur K. Comme on


vient de le remarquer, cela entraîne que l’extension finie K ,→ K(x, y) est séparable. Les
éléments x − y et x/y de L sont donc séparables sur K.

En particulier, si K est une clôture algébrique de K, l’ensemble des éléments de K sépa-


s
rables sur K est une extension séparable K de K appelée clôture séparable de K. On peut
montrer que les clôtures séparables de K sont toutes K-isomorphes.
24 CHAPITRE I. EXTENSIONS DE CORPS

s s
Le corps K est parfait si et seulement si K = K. Toute extension séparable de K est
s s
triviale (th. 5.17). Tout élément de K K est inséparable sur K donc sur K.

Exercice 5.19. — Soit K ,→ L une extension algébrique de corps et soit Ls ⊆ L la clôture


séparable de K dans L (cf. cor. 5.18). Montrer [L : K]s = [Ls : K]. En déduire que [L : K]s
divise [L : K] et que soit le quotient est 1, soit la caractéristique de K est p > 0 et le quotient est
une puissance de p (il vous faudra sans doute aller explorer un peu la littérature sur les extensions
dites purement inséparables (ou radicielles)...).

Exercice 5.20. — Montrer que toute extension algébrique d’un corps parfait est encore un corps
parfait. En particulier, un corps imparfait (de caractéristique p > 0) ne peut être algébrique sur
Fp (on rappelle que le corps Fp (T ) est imparfait ; cf. § 5.2).

5.4. Théorème
√ de l’élément primitif. — On a rencontré à plusieurs reprises l’extension
Q ,→ Q( 3 2, j). Peut-on engendrer cette extension √ par un seul
√ élément (on dit que l’exten-
3 3
sion est simple) ? La réponse est oui : on a Q( 2, j) = Q( 2 + j) (cf. exerc. 6.16). En
revanche, en caractéristique non nulle, il existe des extensions finies non simples. Il se trouve
que cette propriété d’une extension algébrique (d’être engendrée par un élément) est liée à sa
séparabilité.

Exemple 5.21. — Soit p un nombre premier. Posons L = Fp (X, Y ) (corps des fractions
rationnelles en deux indéterminées à coefficients dans Fp ) et K := Lp = Fp (X p , Y p ).
L’extension K ,→ L est finie de degré p2 . Pour tout F ∈ L, on a F p ∈ K, donc [K(F ) : K]
vaut 1 ou p, et L n’est pas de la forme K(F ) : l’extension K ,→ L n’est pas simple.

Théorème 5.22 (de l’élément primitif). — Soit K ,→ L une extension finie de corps, avec
L = K(x, y1 , . . . , yn ), où y1 , . . . , yn sont séparables sur K. Il existe z ∈ L tel que L =
K(z).

Démonstration. — Si K est fini, L l’est aussi, le groupe (L∗ , ×) est cyclique (lemme 7.4).
Si z ∈ L∗ est un générateur de ce groupe, L = K(z).
On suppose donc K infini. En raisonnant par récurrence sur n, on voit qu’il suffit de traiter
le cas n = 1. On cherche z sous la forme z = x + ty1 , avec t ∈ K. Soit P le polynôme
minimal de x sur K et soit Q celui de y1 . Ces polynômes se décomposent dans leur corps de
décomposition en
r
Y s
Y
P (X) = (X − αi ) , Q(X) = (X − βj ),
i=1 j=1

avec α1 = x et β1 = y1 . Comme y1 est séparable sur K, les βj sont distincts deux à deux.
Comme K est infini, on peut trouver t ∈ K distinct de tous les (x − αi )/(βj − y1 ), pour tout
i et tout j 6= 1. Posant z = x + ty1 ∈ L, on a
P (z − tβ1 ) = 0 , P (z − tβj ) 6= 0 pour j 6= 1.
5. SÉPARABILITÉ 25

Les polynômes Q(X) ∈ K[X] et P (z − tX) ∈ K(z)[X] ont donc une unique racine com-
mune, à savoir β1 = y1 , et leur pgcd est ainsi X − y1 . Les coefficients de ce pgcd sont dans
K(z), donc y1 ∈ K(z). Mais alors x = z − ty1 ∈ K(z), donc L = K(x, y1 ) = K(z).

Théorème 5.23. — Soit K ,→ L une extension finie de corps. Les conditions suivantes sont
équivalentes :
(i) il n’existe qu’un nombre fini de corps intermédiaires entre K et L ;
(ii) il existe x ∈ L tel que L = K(x).

Si l’extension K ,→ L est finie et séparable, elle vérifie (th. 5.22) les conditions de ce
théorème. La réciproque est fausse (cf. ex. 5.14).

Démonstration. — Si K est fini, L l’est aussi, et le groupe (L∗ , ×) est cyclique (lemme 7.4).
Si x ∈ L∗ est un générateur de ce groupe, L = K(x). Donc (ii) est toujours vérifié dans ce
cas, et il en est bien sûr de même pour (i).
On suppose donc K infini. Si (i) est vérifié, on écrit L = K(x1 , . . . , xn ) et, procédant par
récurrence sur n, on voit qu’il suffit de traiter le cas n = 2. Vue l’hypothèse (i), et comme K
est infini, il existe deux éléments distincts t et u de K tels que K(x1 + tx2 ) = K(x1 + ux2 ).
On en déduit que x2 = ((x1 + tx2 ) − (x1 + ux2 ))/(t − u) est dans ce corps, ainsi que
x1 = (x1 + tx2 ) − tx2 , donc qu’il est égal à L. Cela prouve (ii).
Inversement, si (ii) est vérifié, on note P ∈ K[X] le polynôme minimal de x sur K. Soit
M un corps intermédiaire entre K et L. Le polynôme minimal PM ∈ M [X] de x sur M
divise alors P dans M [X], donc aussi dans L[X]. C’est donc un produit de facteurs irréduc-
tibles unitaires de P dans L[X] et il n’y a qu’un nombre fini de tels polynômes (cf. th. 1.16).
Soit M 0 ⊆ M le sous-corps engendré par les coefficients de PM . Le polynôme PM est a
fortiori irréductible dans M 0 [X], donc c’est le polynôme minimal de x sur M 0 . On en déduit

[L : M 0 ] = deg PM = [L : M ],

de sorte que M = M 0 . L’application M 7→ PM , de l’ensemble des extensions intermédiaires


entre K et L dans l’ensemble des facteurs irréductibles de P dans L[X], est donc injective,
ce qui montre (i).

Exercice 5.24. — Trouver une infinité d’extensions intermédiaires entre les corps Fp (X p , Y p )
et Fp (X, Y ) (cf. ex. 5.21).

Exercice 5.25. — Soit K ,→ L une extension séparable telle que les degrés des éléments de L
sur K soient majorés. Montrer que l’extension K ,→ L est finie. Montrer que la conclusion ne
subsiste pas nécessairement si l’extension K ,→ L n’est pas séparable.
26 CHAPITRE I. EXTENSIONS DE CORPS

5.5. Trace. — À toute extension finie K ,→ L, nous allons associer une forme K-linéaire
TrL/K sur L dont la non nullité caractérise les extensions (finies) séparables.

Définition 5.26. — Soit K ,→ L une extension finie de corps. Pour x ∈ L, on note mx le


K-endomorphisme de L défini par mx (z) = xz pour tout z dans L. On définit l’application
trace TrL/K : L → K par
TrL/K (x) = Tr(mx ).

Si a, b ∈ K et x, y ∈ L, on a max+by = amx + bmy ; l’application trace est donc une


forme K-linéaire sur L. Si x est dans K, on a TrL/K (x) = [L : K]x.

Exemple 5.27. — Considérons l’extension Q ,→ Q(i). Dans la base (1, i) du Q-espace


 
a −b
vectoriel Q(i), la matrice de l’endomorphisme ma+ib est . On a donc
b a
TrQ(i)/Q (a + ib) = 2a.

Théorème 5.28. — Soient K ,→ L et L ,→ M des extensions de corps. On a


TrM/K = TrL/K ◦ TrM/L .

Démonstration. — On garde les notations de la preuve du th. 2.2 : (l1 , . . . , lr ) est une base
du K-espace vectoriel L et soit (m1 , . . . , ms ) une base du L-espace vectoriel M , de sorte
que (li mj )1≤i≤r, 1≤j≤s est une base du K-espace vectoriel M . Soit x ∈ M . On écrit
s
X
xmj = bjk mk ,
k=1
Ps
avec bjk ∈ L, de sorte que xli mj = k=1 bjk li mk . On écrit ensuite
r
X
bjk li = ajkin ln ,
n=1
Ps Pr
avec ajkin ∈ L, de sorte que xli mj = k=1 n=1 ajkin ln mk . On en déduit
s X
X r
TrM/K (x) = ajjii .
j=1 i=1
Ps Pr
On a d’autre part TrM/L (x) = j=1 bjj et TrL/K (bjj ) = n=1 ajjnn , ce qui montre le
théorème.

Corollaire 5.29. — Soit K ,→ L une extension finie de corps et soit x un élément de L


inséparable sur K. On a TrL/K (x) = 0.

Démonstration. — Considérons les extensions K ,→ K(x) ,→ L. D’après le th. 5.28, on a



TrL/K (x) = TrK(x)/K TrL/K(x) (x) = TrK(x)/K ([L : K(x)]x).
5. SÉPARABILITÉ 27

Il suffit donc de montrer TrK(x)/K (x) = 0. Le polynôme minimal P de x sur K est, par
le lemme 5.3, dans K[X p ], où p est la caractéristique (non nulle) du corps K. Dans la base
(1, x, . . . , xpn−1 ) de K(x) sur K (où pn = deg(P )), la matrice de mx est la matrice compa-
gnon de P (cf. § II.4.2), dont la trace est l’opposé du coefficient de X pn−1 dans P , c’est-à-dire
0.

Corollaire 5.30. — Soit K ,→ L une extension finie de corps qui n’est pas séparable. La
forme linéaire TrL/K est identiquement nulle.

Démonstration. — Soit L0 ( L la clôture séparable de K dans L (cor. 5.18). Tout élément


x de L L0 est alors inséparable sur L0 , donc TrL/L0 (x) = 0 par le corollaire précédent.
D’autre part, le lemme 5.3 entraîne que [L0 (x) : L0 ] est un multiple de p, donc aussi [L : L0 ]
(th. 2.2). Pour tout x0 ∈ L0 , on a alors TrL/L0 (x0 ) = [L : L0 ]x0 = 0, ce qui montre que la
forme linéaire TrL/L0 est identiquement nulle. Le corollaire résulte alors du th. 5.28.

Théorème 5.31. — Soit K ,→ L une extension de corps finie et séparable. La forme linéaire
TrL/K n’est pas identiquement nulle et la fome bilinéaire symétrique
L × L −→ K
(x, y) 7−→ TrL/K (xy)
est non dégénérée.

Le théorème est évident en caractéristique nulle, puisque l’on a alors TrL/K (1K ) = [L :
K]1K 6= 0 et TrL/K (xx−1 ) = TrL/K (1K ) 6= 0 si x ∈ L {0}.

Démonstration. — Comme on l’a vu dans le § 5.4, l’extension K ,→ L est engendrée par


un élément x ∈ L, de polynôme minimal P ∈ K[X]. Si n = [L : K], une base du K-espace
vectoriel L est alors formée de 1, x, . . . , xn−1 . La matrice de mx dans cette base est la matrice
compagnon CP de P (cf. § II.4.2) dont la trace est l’opposé du coefficient de X n−1 dans P ,
c’est-à-dire la somme des racines x1 , . . . , xn de P dans un corps de décomposition de P (ces
racines sont distinctes deux à deux puisque P est séparable). Pour tout entier r ≥ 0, la matrice
Pn
de mrx = mxr est CPr , dont la trace est la somme i=1 xri . Ces sommes ne peuvent pas être
toutes nulles lorsque r décrit {0, . . . , n − 1}, puisque le déterminant dét(xri )1≤i≤n, 0≤r≤n−1
est non nul (déterminant de Vandermonde). Donc l’une au moins des traces TrL/K (xr ) est
non nulle, et la forme linéaire TrL/K n’est pas identiquement nulle.
Soit x0 ∈ L tel que TrL/K (x0 ) 6= 0. Si y ∈ L est non nul, on a alors TrL/K (y ·x0 /y) 6= 0,
donc la forme bilinéaire considérée est bien non dégénérée.

Exercice 5.32. — Soit K ,→ L une extension de corps finie et séparable. Soit Ω une extension
algébriquement close de K et soient σ1 , . . . , σn les différents K-morphismes de L dans Ω.
Montrer que pour tout x dans L, on a TrL/K (x) = σ1 (x) + · · · + σn (x).
28 CHAPITRE I. EXTENSIONS DE CORPS

6. Théorie de Galois

6.1. Groupe de Galois d’une extension de corps. —

Définition 6.1. — Soit K ,→ L une extension de corps. Un K-automorphisme de L est un



automorphisme de corps L → L qui est l’identité sur K. Le groupe de Galois Gal(L/K) est
le groupe des K-automorphismes de L.

Exemple 6.2. — Soit σ un élément de Gal(C/R). On a


σ(i)2 = σ(i2 ) = σ(−1) = −1,
de sorte que σ(i) = ±i. On en déduit que le groupe Gal(C/R) a deux éléments : l’identité
et la conjugaison complexe.

Soit σ un élément de Gal(Q( 3 2)/Q). On a
√ √
σ( 2)3 = σ(( 2)3 ) = σ(2) = 2,
3 3

√ √
de sorte que σ( 3 2) est√une racine
√ cubique de 2 dans le√sous-corps Q( 3 2) de R. On a
donc nécessairement σ( 3 2) = 3 2 et le groupe Gal(Q( 3 2)/Q) n’a qu’un seul élément,
l’identité.
√ √
Exercice 6.3. — Déterminer les groupes de Galois Gal(Q( 2, 3)/Q) et Gal(R/Q).

Théorème 6.4. — Soit K ,→ L une extension finie de corps. On a


Card(Gal(L/K)) ≤ [L : K]s ≤ [L : K].
La première inégalité est une égalité si et seulement si l’extension K ,→ L est normale ; la
seconde est une égalité si et seulement si l’extension K ,→ L est séparable.

Démonstration. — Soit Ω une extension algébriquement close de K. Le groupe Gal(L/K)


agit à droite sur l’ensemble des K-morphismes σ : L ,→ Ω (dont le cardinal est par définition
[L : K]s ) par la formule
∀g ∈ Gal(L/K) σ · g = σ ◦ g.
Cette action est libre (si σ ◦ g = σ, on a g = Id puisque σ est injectif), d’où la première
inégalité. Il y a égalité si et seulement si l’action est transitive.

Lemme 6.5. — L’action de Gal(L/K) sur l’ensemble des K-morphismes de L dans Ω est
transitive si et seulement si tous ces morphismes ont la même image dans Ω.

Démonstration. — Il est clair que σ ◦ g et σ ont la même image. Inversement, si σ(L) =


σ 0 (L), l’application g : L → L définie par g = (σL→σ(L) )−1 ◦ σ 0 est un K-morphisme tel
que σ 0 = σ ◦ g.
6. THÉORIE DE GALOIS 29

Si l’extension K ,→ L est normale, L est le corps de décomposition d’un polynôme


Q ∈ K[X]. Pour tout K-morphisme σ : L → Ω, l’image de σ est l’extension de K
engendrée par les racines de Q dans Ω, donc ne dépend pas de σ. Le lemme 6.5 entraîne
Card(Gal(L/K)) = [L : K]s .
Inversement, si Card(Gal(L/K)) = [L : K]s , tous les K-morphismes de L dans Ω ont
la même image, que l’on note L0 ⊆ Ω. Soit Q ∈ K[X] un polynôme irréductible avec une
racine x ∈ L et soit y une racine de Q dans Ω. Les corps K(x) ⊆ L et K(y) ⊆ Ω sont des
corps de rupture de Q, donc sont K-isomorphes (cor. 3.4). On en déduit un K-morphisme
K(x) → K(y) ⊆ Ω que l’on peut étendre en un K-morphisme L → Ω (lemme 3.15) dont
l’image est L0 . On en déduit que y est dans L0 . Le polynôme Q est donc scindé dans L0 , donc
l’extension K ,→ L0 est normale, ainsi que l’extension K ,→ L puisqu’elle lui est isomorphe.
L’égalité de droite du théorème, et le cas d’égalité, sont juste une retranscription du th.
5.15.

Exercice 6.6. — Soit K ,→ L une extension finie de corps. Montrer que Card(Gal(L/K))
divise [L : K]s (cf. exerc. 5.19).

6.2. Groupe de Galois de K ,→ K(X) et théorème de Lüroth. — Le but de cette sec-


tion (indépendante du reste du cours) est de comprendre le groupe de Galois de l’extension
transcendante K ,→ K(X) et la nature des extensions intermédiaires entre K et K(X).

Lemme 6.7. — Soit F ∈ K(X) K, que l’on écrit F = P/Q, avec P et Q dans K[X],
premiers entre eux. Alors :
a) F est transcendant sur K ;
b) l’extension K(F ) ,→ K(X) est finie, de degré δ(F ) := max(deg P, deg Q) ;
c) le polynôme minimal de X sur K(F ) est P (T ) − Q(T )F ∈ K(F )[T ].

Démonstration. — Posons R(T ) := P (T ) − Q(T )F ∈ K(F )[T ]. On a R(X) = 0 donc X


est algébrique sur K(F ). Comme X est transcendant sur K, il en est de même pour F par le
th. 2.2, ce qui montre a).
Cela entraîne que K[F ] est isomorphe à un anneau de polynômes en une variable à coef-
ficients dans K. On peut donc considérer R comme un élément de l’anneau de polynômes
en deux variables K[F ][T ] et il faut montrer que R est irréductible dans K(F )[T ]. Dans
K[T ][F ], R est irréductible car de degré 1 (en F ) à coefficients premiers entre eux. Il est
donc aussi irréductible dans K[F ][T ]. Ses coefficients sont du type pi − qi F , donc leur pgcd
dans K[F ] est 1 (sinon, P et Q seraient proportionnels). Cela entraîne (th. III.1.10) que R
est encore irréductible dans K(F )[T ]. Cela montre c), et comme le degré de R est δ(F ), cela
montre aussi b).
30 CHAPITRE I. EXTENSIONS DE CORPS

Pour tout corps K et tout entier n > 0, on note GL(n, K) le groupe des matrices inver-
sibles d’ordre n à coefficients dans K, et PGL(n, K) le groupe quotient de GL(n, K) par le
sous-groupe distingué des matrices de la forme tIn , pour t ∈ K ∗ .

Théorème 6.8. — On a un isomorphisme


PGL(2, K) −→ Gal(K(X)/K)
 
a b  aX + b 
7−→ X 7→ .
c d cX + d

Démonstration. — Soit ϕ : K(X) → K(X) un K-automorphisme. Il est déterminé par


F = ϕ(X). Comme ϕ est surjectif, on a par le lemme 6.7 δ(F ) = 1, donc F (X) = aX+b cX+d
avec (c, d) 6= (0, 0) et (a, b) non proportionnel à (c, d). L’application de l’énoncé du théo-
rème est donc surjective. On vérifie que c’est un morphisme dont le noyau est formé des
homothéties tI2 , pour t ∈ K ∗ .

Théorème 6.9 (Lüroth, 1874). — Les extensions intermédiaires entre K et K(X) sont de
la forme K(F ), avec F ∈ K(X). Autrement dit, ce sont K ou des corps de fractions ration-
nelles en une variable.

Démonstration. — Soit K ( L ⊆ K(X) et soit F ∈ L K. Par le lemme 6.7, X est


algébrique sur K(F ), donc aussi sur L. Soit
Φ(T ) = T n + Fn−1 T n−1 + · · · + F0 ∈ L[T ]
le polynôme minimal de X sur L. Comme X n’est pas algébrique sur K, il existe i tel que
Fi ∈ L K. On va montrer L = K(Fi ). Écrivons Fj = Pj /Pn , avec Pj ∈ K[X] et où Pn
est le ppcm des dénominateurs des Fj . On a ainsi
1
Φ(T ) = (Pn (X)T n + Pn−1 (X)T n−1 + · · · + P0 (X)) ∈ L[T ].
Pn (X)
Notons
P (X, T ) := Pn (X)T n + Pn−1 (X)T n−1 + · · · + P0 (X)
et posons m := degX P (X, T ) = max(deg Pj ). On a [K(X) : L] = deg(Φ) = n et
[K(X) : L] ≤ [K(X) : K(Fi )] = δ(Fi ) ≤ max(deg Pi , deg Pn ) ≤ m.
On va montrer m = n, ce qui entraînera L = K(Fi ) et le théorème.
Le polynôme Pi (T ) − Fi Pn (T ) ∈ L[T ] admet X comme racine. Il est donc multiple de
Φ : il existe Ψ ∈ L[T ] tel que
Pi (T ) − Fi Pn (T ) = Φ(T )Ψ(T ).
En multipliant par Pn (T ), on obtient
D(X, T ) := Pi (T )Pn (X) − Pi (X)Pn (T ) = P (X, T )Ψ(T ) ∈ L[T ] ∩ K[X][T ].
6. THÉORIE DE GALOIS 31

Comme P (X, T ) est primitif vu comme polynôme en T , on a Ψ ∈ K[X][T ] (lemme III.1.9).


Dans cette dernière égalité, le degré en X est ≤ m à gauche et m + degX Ψ à droite. Donc il
vaut m des deux côtés et Ψ ∈ K[T ]. On a donc
P (X, T )Ψ(T ) = D(X, T ) = −D(T, X) = −P (T, X)Ψ(X).
Comme P (X, T ) et Ψ(T ) sont primitifs vus comme polynôme en T à coefficients dans
K[X], il en est de même pour leur produit (lemme III.1.8), donc le polynôme Ψ(X), constant
vu comme polynôme en T , est une constante inversible dans K[X]. Les polynômes D et P
sont donc proportionnels. Les degrés de D en X et en T étant égaux, cela vaut aussi pour P ,
donc m = n.

Remarque 6.10. — L’analogue du théorème de Lüroth reste vrai en caractéristique 0 pour


K(X, Y ) (toutes les sous-extensions non triviales sont des corps de fractions rationnelles en
une ou deux variables sur K) ; c’est un théorème de Castelnuovo. Cela est faux en caracté-
ristique non nulle d’après des exemples de Zariski et de Shioda. Avec au moins trois indéter-
minées, c’est faux même sur C. L’étude de ces problèmes se fait par des outils de géométrie
algébrique (il s’agit de savoir si une variété algébrique « unirationnelle » est « rationnelle »).

Exercice 6.11. — Soit K un corps. Quelles sont les fractions rationnelles F ∈ K(X) vérifiant
F ◦ F (X) = X ? Plus généralement, quelles sont les fractions rationnelles vérifiant F ◦ · · · ◦
F (X) = X ?

Exercice 6.12. — Soit K un corps. Déterminer le corps

L = {F ∈ K(X) | F (X) = F (1/X)}.

6.3. Extensions galoisiennes. —

Définition 6.13. — Une extension de corps K ,→ L est dite galoisienne si elle est séparable
et normale.

Le th. 6.4 entraîne qu’une extension finie K ,→ L est galoisienne si et seulement si


Card(Gal(L/K)) = [L : K].

Remarque 6.14. — Si K ,→ L est une extension de corps galoisienne et que M est un corps
intermédiaire entre K et L, l’extension M ,→ L est encore galoisienne (rem. 4.3 et th. 5.17)
et Gal(L/M ) est un sous-groupe de Gal(L/K) :
Gal(L/M ) = {g ∈ Gal(L/K) | g|M = IdM }.
En revanche, l’extension K ,→ M n’est pas nécessairement galoisienne (cf. th. 6.26.b)).

Proposition 6.15. — Une extension finie K ,→ L est galoisienne si et seulement si c’est le


corps de décomposition sur K d’un polynôme séparable.
32 CHAPITRE I. EXTENSIONS DE CORPS

Démonstration. — Si L est le corps de décomposition d’un polynôme séparable Q ∈ K[X],


l’extension L est engendrée par des éléments séparables (les racines de Q) donc est séparable.
Elle est aussi normale par le th. 4.2.
Pour la réciproque, on reprend la démonstration du th. 4.2 : si K ,→ L est une extension
galoisienne, on écrit L = K(x1 , . . . , xn ) et l’on note Pi ∈ K[X] le polynôme minimal de xi .
Comme K ,→ L est normale (resp. séparable), chaque Pi est scindé (resp. à racines simples)
dans L, donc aussi le ppcm Q := P1 ∨ · · · ∨ Pn . Comme L est engendré sur K par les xi ,
qui sont des racines de Q, le corps L est un corps de décomposition du polynôme séparable
Q ∈ K[X].

En utilisant le th. 5.22, on peut aussi dire qu’il existe x ∈ L tel que le polynôme minimal
de x sur K est scindé à racines simples dans L et que L = K(x).
Soit K ,→ L une extension finie galoisienne. C’est donc le corps de décomposition d’un
polynôme séparable P ∈ K[X]. Si n = deg(P ), le groupe Gal(L/K) permute les n racines
distinctes de P et Gal(L/K) s’identifie à un sous-groupe du groupe symétrique Sn .


Exercice 6.16. — Montrer que l’extension Q ,→ Q( 3 2, j) est galoisienne et que son groupe
√ √
de Galois est S3 . En déduire Q( 3 2, j) = Q( 3 2 + j) et calculer le polynôme minimal de
√3
2 + j sur Q.

Proposition 6.17. — Soit K ,→ L le corps de décomposition d’un polynôme séparable P ∈


K[X]. L’action de Gal(L/K) sur l’ensemble des racines de P dans L est transitive si et
seulement si P est irréductible dans K[X].

Démonstration. — Si P n’est pas irréductible, on l’écrit P = QR avec Q et R non constants.


Comme P est séparable, Q et R n’ont pas de racine commune. Tout élément de Gal(L/K)
envoie chaque racine de Q (dans L) sur une racine de Q, donc l’action n’est pas transitive.
Supposons P irréductible. Soient x et y des racines de P dans L. Les sous-corps K(x)
et K(y) de L sont des corps de rupture de P , donc sont K-isomorphes. Plus précisément, il

existe un K-isomorphisme σ : K(x) → K(y) tel que σ(x) = y. Les extensions ι : K(x) ,→
0 σ
L et ι : K(x) → K(y) ,→ L sont alors des corps de décomposition de P ∈ K(x)[X], donc

sont K(x)-isomorphes (th. 3.5) : il existe un automorphisme g : L → L tel que g ◦ ι = ι0 .
D’une part g est un K-automorphisme, donc g ∈ Gal(L/K), d’autre part g(x) = g ◦ ι(x) =
ι0 (x) = y.

√ √
Exemple 6.18. — L’extension Q ,→ Q( 2, 3) est galoisienne car c’est le corps de dé-
2
√ −√
√ (X
composition du polynôme
√ 2)(X 2 − 3). Son groupe de Galois agit non transitivement
sur l’ensemble { 2, − 2, 3, − 3} de ses racines ; il est isomorphe à (Z/2Z)2 .
6. THÉORIE DE GALOIS 33

6.4. Corps finis. — On dit qu’un corps K est fini s’il n’a qu’un nombre fini d’éléments. Sa
caractéristique est alors un nombre premier p et son sous-corps premier le corps Fp . L’exten-
sion Fp ,→ K est de degré fini n, de sorte que K est de cardinal pn .
Théorème 6.19. — a) Pour tout entier premier p et tout entier n ≥ 1, il existe un corps fini
à pn éléments.
n
b) Tout corps fini à pn éléments est un corps de décomposition du polynôme X p − X sur
Fp . En particulier, deux tels corps sont isomorphes.

On parlera souvent du corps Fpn à pn éléments.


n
Démonstration. — Soit Fp ,→ K un corps de décomposition du polynôme P (X) := X p −
X sur Fp et soit K 0 := {x1 , . . . , xpn } ⊆ K l’ensemble des racines de P dans K. C’est un
sous-corps de K (par (1)) qui lui est donc égal. Ces racines sont toutes distinctes car sa
dérivée étant −1, le polynôme P est séparable (lemme 5.2). En particulier, Card(K) = pn .
Ceci montre a).
Soit K un corps fini à pn éléments. Le groupe (K ∗ , ×) est d’ordre pn − 1, donc tout élé-
n
ment non nul x de K vérifie xp −1 = 1. En particulier, les pn éléments de K sont exactement
les racines de P , qui est ainsi scindé dans K. Le corps K est donc un corps de décomposition
de P sur Fp . Ceci montre b).
Exercice 6.20. — Écrire les tables d’addition et de multiplication du corps F4 .

Exercice 6.21. — Quel est le groupe additif (Fpn , +) ?

6.5. Correspondance de Galois pour les corps finis. — Soit p un nombre premier. Comme
n
Fpn est le corps de décomposition du polynôme X p − X (th. 6.19) et que toute extension
de corps finis est séparable (tout corps fini est parfait par le th. 5.7), l’extension Fp ,→ Fpn
est galoisienne et son groupe de Galois est de cardinal n
Proposition 6.22. — Le groupe de Galois de l’extension Fp ,→ Fpn est cyclique d’ordre n,
engendré par l’automorphisme de Frobenius Fr : x 7→ xp .

Démonstration. — Il est clair que Fr est dans Gal(Fpn /Fp ). Soit m son ordre, un diviseur
m
de n. On a alors Frm = Id, d’où xp = x pour tout x dans Fpn . Tous les éléments de Fpn
m
sont ainsi racines du polynôme X p − X, donc Card(Fpn ) ≤ pm et m = n. Comme le
groupe Gal(Fpn /Fp ) est de cardinal n, il est cyclique engendré par Fr.

Ce résultat se généralise ainsi.


Théorème 6.23. — Le corps Fpn est une extension de Fpm si et seulement si m divise n et
le seul sous-corps de Fpn à pm éléments est
m
{x ∈ Fpn | xp = x}.
34 CHAPITRE I. EXTENSIONS DE CORPS

Le groupe de Galois de l’extension Fpm ,→ Fpn est cyclique d’ordre n/m, engendré par
Frm .

Démonstration. — Si Fpn est une extension de Fpm , c’est un Fpm -espace vectoriel, de di-
mension finie d, et son cardinal est alors (pm )d = pmd , de sorte que n = md.
Inversement, supposons que m divise n. Comme Fr est un automorphisme,
m
K := {x ∈ Fpn | xp = x} = {x ∈ Fpn | Frm = x}
m
est un sous-corps de Fpn . Il est formé de 0 et des racines du polynôme P (X) = X p −1 − 1
n
dans Fpn . Or m divise n, donc pm − 1 divise pn − 1, et P divise X p −1 − 1, qui est scindé
à racines simples dans Fpn . Donc P a pm − 1 racines dans Fpn , et K a pm éléments.
m
Réciproquement, si L ⊆ Fpn est un sous-corps à pm éléments, on a xp = x pour tout x
dans L, donc L ⊆ K et il y a égalité car ces deux ensembles ont même cardinal.
Enfin, on a déjà remarqué (rem. 6.14) que Gal(Fpn /Fpm ) est un sous-groupe de cardinal
[Fpn : Fpm ] = n/m du groupe Gal(Fpn /Fp ) = hFri. C’est donc le sous-groupe engendré
par Frm .

Exercice 6.24. — Soient m et n des entiers positifs non nuls. Quel est le nombre de racines du
m
polynôme X p − X dans Fpn ?

Comme les sous-groupes du groupe cyclique Gal(Fpn /Fp ) ' Z/nZ sont les sous-
groupes cycliques engendrés par les classes de chacun des diviseurs de n, on peut présenter
ce résultat sous la forme suivante : il existe des bijections inverses l’une de l’autre
Φ /
{sous-groupes de Gal(Fpn /Fp )} o {extensions intermédiaires entre Fp et Fpn}
Ψ
 / FH
H pn := {x ∈ Fpn | ∀g ∈ H g(x) = x}

Gal(Fpn /L) o 
L.

Le but de la théorie de Galois est d’étendre ces correspondances à toute extension galoisienne
finie.

Corollaire 6.25. — Pour tout entier premier p et tout entier n > 0, on a


n Y
Xp − X = (polynômes irréductibles unitaires de degré m dans Fp [X]).
m|n

Démonstration. — Le groupe G = Gal(Fpn /Fp ) agit sur Fpn ; soit Fpn = O1 ∪ · · · ∪ ON


Q
la décomposition en orbites. Pour chaque i ∈ {1, . . . , N }, on pose Pi = x∈Oi (X − x), de
6. THÉORIE DE GALOIS 35

sorte que
N Y N
n Y Y Y
Xp − X = (X − x) = (X − x) = Pi .
x∈Fpn i=1 x∈Oi i=1

Comme Fr(Pi ) = Pi , le polynôme Pi est à coefficients dans Fp . Comme Fr agit transiti-


vement sur l’ensemble de ses racines, il est irréductible sur Fp (prop. 6.17). Son degré est
Card(Oi ), qui est un diviseur de Card(G) = n. On a donc écrit la décomposition en fac-
n
teurs irréductibles dans Fp [X] du polynôme X p − X. Il n’y a pas de facteur multiple car ce
polynôme est séparable.
Inversement, soit P un polynôme irréductible dans Fp [X] de degré m, soit Fp ,→ K un
corps de rupture de P et soit x une racine de P dans K. Cette extension est de degré m, de
m n
sorte que K est isomorphe à Fpm et xp = x. Si m divise n, on a xp = x, et P , qui est le
n
polynôme minimal de x, divise donc X p − X.

6.6. Correspondance de Galois, lemme d’Artin. — Nous montrons maintenant le résultat


principal de cette section : le fait que pour une extension finie galoisienne, les extensions
intermédiaires correspondent bijectivement aux sous-groupes du groupe de Galois. On re-
trouve ainsi le fait qu’il n’y a qu’un nombre fini d’extensions intermédiaires (cf. th. 5.23)
mais surtout, on dispose d’un moyen concret de les trouver toutes.

Théorème 6.26. — Soit K ,→ L une extension finie galoisienne de groupe de Galois G :=


Gal(L/K).
a) Il existe des bijections inverses l’une de l’autre, qui renversent les inclusions,
Φ /
{sous-groupes de G} o {extensions intermédiaires entre K et L}
Ψ
 /
H LH := {x ∈ L | ∀g ∈ H g(x) = x}

Gal(L/M ) o 
M.

b) Si H est un sous-groupe de G, l’extension K ,→ LH est galoisienne si et seulement si


H est distingué dans G. Son groupe de Galois est alors le groupe quotient G/H.

Pour clarifier les choses, l’égalité Φ ◦ Ψ = Id signifie

LGal(L/M ) = M

pour tout corps intermédiaire M , tandis que, par la rem. 6.14, l’égalité Ψ ◦ Φ = Id signifie

{g ∈ G | g|LH = Id} = H

pour tout sous-groupe H de G.


36 CHAPITRE I. EXTENSIONS DE CORPS

Démonstration. — Il est clair que l’on a, pour toute extension intermédiaire M et tout sous-
groupe H de G :
M ⊆ Φ(Ψ(M ))) = LGal(L/M ) et H ⊆ Ψ(Φ(H))) = Gal(L/LH )
et il s’agit de montrer que ces deux inclusions sont des égalités. L’extension M ,→ L est
galoisienne (rem. 6.14). Nous lui appliquerons le lemme suivant.
Lemme 6.27. — Soit K ,→ L une extension finie galoisienne de groupe G. On a K = LG .

Démonstration. — Il est clair que K est contenu dans LG . Soit x ∈ LG et soit P ∈ K[X]
son polynôme minimal, qui est scindé dans L. Soit y une racine de P dans L. Comme l’ex-
tension K ,→ L est normale, il existe g ∈ G tel que y = g(x). Comme x ∈ LG , on a y = x.
Donc P n’a qu’une seule racine. Comme il est séparable, il est de degré 1 et x est dans K.

En appliquant ce lemme à l’extension finie galoisienne M ,→ L , on obtient M =


Gal(L/M )
L , c’est-à-dire M = Φ(Ψ(M ))). L’autre égalité H = Gal(L/LH ) résulte du th.
6.28 ci-dessous. Ceci montre le point a) du théorème.
Montrons maintenant b). Soit H un sous-groupe de G et soit g ∈ G. On vérifie que
l’extension intermédiaire g(LH ) correspond au sous-groupe gHg −1 de G.
Si H est un sous-groupe distingué dans G, on a g(LH ) = LH , d’où un morphisme de
groupes
ρ : G → Gal(LH /K)
dont le noyau est {g ∈ G | g|LH = Id}, c’est-à-dire, par a), H. On en déduit
Card(Gal(LH /K)) ≥ Card(G)/ Card(H) = [L : K]/[L : LH ] = [LH : K].
Cela entraîne que l’extension finie K ,→ LH est galoisienne, que ρ est surjectif, et que
Gal(LH /K) est isomorphe à G/H.
Inversement, supposons l’extension K ,→ LH galoisienne et considérons le sous-groupe
N := {g ∈ G | gHg −1 = H} de G (le normalisateur de H dans G) ainsi que le morphisme
π : N → Gal(LH /K). Son noyau est {g ∈ N | g|LH = Id}, c’est-à-dire de nouveau H.

Comme l’extension K ,→ L est normale, tout K-automorphisme LH → LH s’étend en un

K-automorphisme L → L, c’est-à-dire en un élément g de G qui doit satisfaire g(LH ) = LH .
Par la correspondance a), cela signifie gHg −1 = H, soit g ∈ N . Le morphisme π est donc
surjectif et on en déduit :
Card(N )/ Card(H) = Card(Gal(LH /K))
= [LH : K]
= [L : K]/[L : LH ]
= Card(G)/ Card(H),
de sorte que N = G : le sous-groupe H est distingué dans G. Ceci prouve b).
6. THÉORIE DE GALOIS 37

Théorème 6.28 (Lemme d’Artin). — Soit L un corps et soit G un groupe fini d’automor-
phismes de L. L’extension LG ⊆ L est finie galoisienne de groupe de Galois G.

Démonstration. — Posons K = LG . Soit x ∈ L ; posons P (X) = y∈Gx (X − y). Pour


Q

tout g ∈ G, on a alors gP = P , donc P est à coefficients dans K. Comme P est séparable, il


en résulte que x est séparable algébrique sur K de degré ≤ Card(G).
Choisissons x de degré maximal sur K. Nous allons montrer L = K(x). Soit y ∈ L.
Comme l’extension K(x, y) est séparable, elle est engendrée par un élément z (th. 5.22).
Comme K(z) contient K(x), ces deux corps sont égaux par maximalité du degré de x. On
a donc y ∈ K(x) et L = K(x), extension finie et séparable de K de degré ≤ Card(G). De
plus, G est un sous-groupe de Gal(L/K).
On en déduit (th. 6.4)
Card(G) ≤ Card(Gal(L/K)) ≤ [L : K] ≤ Card(G),
de sorte qu’il y a égalité partout. On en déduit que l’extension K ⊆ L est galoisienne (th.
6.4), et Gal(L/K) = G.
Exercice 6.29. — Soit L un corps et soit G un groupe infini d’automorphismes de L. Montrer
que l’extension LG ⊆ L est infinie.

Exercice 6.30. — Soit K ,→ L une extension de corps finie et normale et soit G le groupe
Gal(L/K) des K-automorphismes de L. On a des extensions K ,→ LG ,→ L. Si la caractéris-
tique de K est nulle, le lemme 6.27 entraîne K = LG . Supposons donc que la caractéristique de
K est p > 0.
a) Soit x ∈ LG . Montrer que le polynôme minimal de x sur K a une seule racine dans L.
n
b) En déduire qu’il existe un entier n ≥ 0 tel que xp ∈ K (Indication : on pourra utiliser
le lemme 5.5).
n
c) Montrer qu’il existe un entier n ≥ 0 tel que (LG )p ⊆ K.

Exemple 6.31. — Revenons à l’exerc. 6.16, où l’on a montré que l’extension Q ,→ Q( 3 2, j)

3
√ isomorphe à S3 (après numérotation des racines du po-
est galoisienne de groupe de Galois
2ikπ/3 3
lynôme X − 2 par xk = e 2, k ∈ {1, 2, 3}). Les sous-groupes de S3 sont

{Id}  WPu y WWWW


i  _  PPPP WWWWWWWWW
mmmmI PPP WWWWW
m
v mm
m  ' WWWWW
+
h(1, 2, 3)i h(1, 2)i h(2, 3)i e h(1, 3)i
 uQQQQ _ n I i
ffff ffffE
QQQ nn ff
QQ(  nnn fffff
vsfnnfnfffffff
S3 .

Le seul sous-groupe distingué non trivial est h(1, 2, 3)i (cyclique d’ordre 3). La transposition
(1, 2) correspond à la conjugaison complexe et le cycle (1, 2, 3) à la permutation cyclique des
38 CHAPITRE I. EXTENSIONS DE CORPS


racines. Les sous-extensions correspondantes de Q ,→ Q( 3 2, j) sont

Q( 3 2, j)
kXX
ooo7 O hQQQXXXXXXXXX
o QQQ XXXXX
* ooo ? Q5 U XXXXX
√ √ XX9 Y √
Q( 3 2) Q(j 3 2) 2 Q(j 2 2)
3
Q(j)
6 fffff
gPPP m ff f
PPP O mmm fffff
PPP  ? ) mmmmfmffffffff
PP5 U mfff f
Q %

Les quatre extensions de la ligne supérieures sont galoisiennes, tandis que sur la ligne infé-
rieure, seule l’extension (quadratique) Q ⊆ Q(j) l’est.

Exemple 6.32. — On vérifie (par exemple en utilisant le critère d’Eisenstein ; th. III.1.12)
que le polynôme P (X) = X 5 − 6X + 3 est irréductible dans Q[X]. Une étude de fonction
montre qu’il a exactement trois racines réelles x1 < x2 < x3 , donc deux racines complexes
conjuguées x4 et x5 = x̄4 . Soit Q ,→ L un corps de décomposition de P et soit G < S5
son groupe de Galois. Le groupe G contient la conjugaison complexe, qui agit comme la
transposition (4, 5). Il agit transitivement sur l’ensemble des racines (prop. 6.17), donc son
cardinal est divisible par 5 ; il divise d’autre part Card(S5 ) = 5! = 120 = 23 · 3 · 5. Le
théorème de Sylow entraîne que G contient un élément d’ordre 5, c’est-à-dire un 5-cycle
dont on peut supposer, quitte à le remplacer par une puissance, qu’il envoie 4 sur 5. En
renumérotant les racines réelles, on peut supposer que c’est le cycle (1, 2, 3, 4, 5), qui avec
(4, 5) engendre S5 . On a donc G = S5 .
Le seul sous-groupe distingué non trivial de S5 est le groupe alterné A5 . L’extension
Q ,→ L contient donc une unique sous-extension galoisienne de Q et elle est quadratique.

Exercice 6.33. — Dans l’exemple ci-dessus, montrer que le discriminant


Y
∆(P ) = (xi − xj )2
1≤i<j≤5

5 4 4 5
du polynôme P est égal à 5 ·3 −4 ·6 . En déduire que la seule sous-extension quadratique de L

est Q( −21451) (vous aurez sans doute besoin d’aller consulter la littérature sur le discriminant
d’un polynôme ; cf. par exemple [CL], § 1.5 et § 3.4).

Exercice 6.34. — Soit K un corps, soit P ∈ K[X] un polynôme irréductible séparable et soit
K ,→ L un corps de décomposition de P , où il est scindé à racines simples a1 , . . . , an . Si le
groupe Gal(L/K) est isomorphe à Sn , montrer que les corps de rupture K(ai ) de P (tous
K-isomorphes) vérifient K(ai ) ∩ K(aj ) = K pour 1 ≤ i < j ≤ n.

6.7. Clôture galoisienne. — On montre qu’une extension séparable finie est toujours conte-
nue dans une extension galoisienne finie, qui n’est autre que sa clôture normale (cf. prop. 4.4).
7. APPLICATIONS DE LA THÉORIE DE GALOIS 39

Proposition 6.35. — Soit K ,→ L une extension finie séparable et soit Ω un corps algébri-
quement clos contenant L. La clôture normale de L dans Ω est une extension finie galoisienne
de K.

On appelle M la clôture galoisienne de L dans Ω.


Cette proposition permet de retrouver le fait qu’il n’existe qu’un nombre fini d’extensions
intermédiaires entre K et L (cf. th. 5.23)

Démonstration. — Dans la preuve de la prop. 4.4, et en gardant les mêmes notations, le po-
lynôme Pi est séparable, donc aussi le ppcm P1 ∨· · ·∨Pn , donc l’extension normale K ⊆ M
est séparable.

7. Applications de la théorie de Galois

7.1. Constructibilité à la règle et au compas, polynômes cyclotomiques. — Revenons


sur les constructions à la règle et au compas telles qu’elles sont expliquées dans le § 2.3.
Plus précisément, on s’intéresse ici au nombres complexes z constructibles à partir de {0, 1}
(cela signifie par définition que ses parties réelle et complexe sont toutes deux constructibles).
On peut déduire du théorème de Wantzel (th. 2.20, qui traite le cas z ∈ R) que z est alors
algébrique de degré une puissance de 2 sur Q. On a déjà remarqué que cette condition n’est
pas suffisante (exerc. 2.25).

Théorème 7.1. — Un nombre algébrique z ∈ C est constructible si et seulement si le degré


de l’extension de Q engendrée par tous les conjugués (6) de z est une puissance de 2.

Démonstration. — Soit z ∈ C. On note L le sous-corps de C engendré par tous les conju-


gués de z (c’est-à-dire le corps de décomposition du polynôme minimal de z sur Q).
Supposons z constructible. Montrons que tous ses conjugués sont constructibles. Soit
Q = K0 ⊆ K1 ⊆ · · · ⊆ Kn
une suite d’extensions telle que [Ki : Ki−1 ] = 2 et z ∈ Kn , et soit M la clôture normale
de Kn dans C. C’est une extension galoisienne de Q et pour tout conjugué z 0 de z, il existe
g ∈ Gal(M/Q) tel que z 0 = g(z) (cf. prop. 6.17). Les corps g(Ki ) forment une suite
d’extensions de degré 2, donc z 0 , qui est dans g(Kn ), est constructible par le théorème de
Wantzel. En particulier, (cf. th. 2.19, qui s’étend facilement aux complexes constructibles),
tous les éléments de L sont constructibles. Le corps L est une extension séparable de Q, donc
elle est engendrée par un élément x ∈ L tel que L = Q[x] (th. 5.22), dont on vient de montrer
qu’il est constructible. Son degré [L : Q] est donc une puissance de 2.

6. C’est-à-dire les racines dans C du polynôme minimal de z sur Q.


40 CHAPITRE I. EXTENSIONS DE CORPS

Inversement, supposons que [L : Q] = 2m . Le groupe Gal(L/Q) est alors d’ordre 2m


donc il existe une suite de sous-groupes
Gal(L/Q) = G0 > · · · > Gm−1 > Gm = {Id}
tels que Gi est d’indice 2 dans Gi−1 . La correspondence de Galois (th. 6.26) lui associe une
suite
Q = K0 ⊆ K1 ⊆ · · · ⊆ Km = L
d’extensions de degré 2. Par le théorème de Wantzel, tout élément de L est constructible
(donc en particulier z !).
Exercice 7.2. — Montrer que le groupe de Galois sur Q du polynôme irréductible X 4 − X − 1
(cf. ex. 2.25) est isomorphe à S4 . En déduire qu’aucune de ses racines n’est constructible (bien
que de degré 4).

Dans le but d’étudier la constructibilité des polygones réguliers, nous nous intéressons
maintenant au groupe de Galois des polynômes X n − 1. Commençons par quelques prélimi-
naires sur les racines de l’unité. Soit K un corps et n un entier ≥ 1. On appelle groupe des
racines n-ièmes de l’unité dans K le groupe multiplicatif
µn (K) = {ζ ∈ K | ζ n = 1}.
Il a au plus n éléments. Un élément ζ de µn (K) est dit racine primitive n-ième de l’unité si
ζ d 6= 1 pour tout d ∈ {1, . . . , n − 1} ; en d’autres termes, si ζ est d’ordre n dans le groupe
µn (K). S’il existe une racine primitive n-ième de l’unité dans K, elle engendre le groupe
µn (K), qui est alors isomorphe à Z/nZ. Il y a alors
ϕ(n) := Card((Z/nZ)∗ ) = Card{d ∈ {1, . . . , n − 1} | d ∧ n = 1}.
différentes racines primitives n-ièmes de l’unité.
Exercice 7.3. — Soit K un corps de caractéristique p > 0 et soit r un entier ≥ 1. Quels sont
les groupes µpr (K) ?

Lemme 7.4. — Pour tout corps K et tout entier n ≥ 1, le groupe µn (K) est cyclique d’ordre
un diviseur de n. Plus généralement, tout sous-groupe fini de (K ∗ , ×) est cyclique.

Démonstration. — Posons m = Card(µn (K)). Tout élément ζ de µn (K) est d’ordre un


diviseur d de m (par le théorème de Lagrange) et de n (puisque ζ n = 1) ; c’est alors une
racine primitive d-ième de l’unité. On a vu plus haut que l’ensemble Pd ⊆ µn (K) des racines
primitives d-ièmes de l’unité est soit vide, soit de cardinal ϕ(d). Comme
[
µn (K) = Pd ,
d|m∧n
P
on a donc m ≤ d|m∧n ϕ(d). On vérifie (exercice !) que pour tout entier e ≥ 1, on a
P
d|e ϕ(d) = e. On en déduit m ≤ m ∧ n, donc m | n, et Pm 6= ∅. Il existe donc un élément
d’ordre m dans µn (K), qui est ainsi cyclique. Ceci montre le premier point.
7. APPLICATIONS DE LA THÉORIE DE GALOIS 41

Si G est un sous-groupe de (K ∗ , ×) de cardinal m, il est contenu par le théorème de


Lagrange dans le groupe cyclique µm (K), qui est de cardinal au plus m. On a donc G =
µm (K) ' Z/mZ. Ceci termine la démonstration du lemme.
Proposition 7.5. — Soit K un corps et soit n un entier strictement positif non divisible par
la caractéristique de K. Le groupe de Galois du polynôme séparable X n − 1 ∈ K[X] est
isomorphe à un sous-groupe de (Z/nZ)∗ .

Démonstration. — Soit K ,→ L un corps de décomposition de X n − 1. Le groupe µn (L)


est d’ordre n et est cyclique (lemme 7.4), donc isomorphe à (Z/nZ, +). Tout élément g de
Gal(L/K) induit un automorphisme de µn (L), donc de (Z/nZ, +) et cet automorphisme
détermine uniquement g. Un tel automorphisme est déterminé par l’image de 1, qui doit
être un générateur de ce groupe, donc une unité de l’anneau (Z/nZ, +, ×). On a donc une
injection de Gal(L/K) dans (Z/nZ)∗ .
Exemple 7.6. — On a déjà rencontré (en § 6.4) une situation dans laquelle le lemme s’ap-
plique : si p est un nombre premier, q = pn et K = Fp , le corps de décomposition du
polynôme séparable X q−1 − 1 est Fq . On a vu que le groupe de Galois de l’extension ga-
loisienne Fp ,→ Fq est cyclique d’ordre n. La proposition dit que c’est un sous-groupe de
(Z/(q − 1)Z)∗ , qui en est en général distinct.

Soit K un corps, soit n un entier non divisible par la caractéristique de K et soit K ,→ L


un corps de décomposition de X n − 1. La démonstration de la proposition montre que le
polynôme séparable Y
ΦKn (X) = (X − ζ)
ζ racine primitive
n-ième de 1 dans L
est de degré ϕ(n) et invariant sous l’action de Gal(L/K), donc à coefficients dans K par le
lemme d’Artin (th. 6.28). On l’appelle le n-ième polynôme cyclotomique.
On peut montrer que ΦQ n
n est irréductible, de sorte que le groupe de Galois de X − 1 sur
∗ Fp
Q est isomorphe à (Z/nZ) . En revanche, Φn n’est en général pas irréductible (on a par
Fp F
exemple Φmp = (Φmp )p−1 si m ∧ p = 1).
Exercice 7.7. — Calculer ΦK
n pour 1 ≤ n ≤ 6 et pour tout n premier. Pour tout entier n ≥ 1,
montrer l’égalité Y K
Xn − 1 = Φd (X).
d|n

ΦK
(En particulier,n (X) ne dépend en fait pas du corps K (toujours lorsque n est premier à la
caractéristique de K).)

On termine cette section par un théorème qui identifie les polygones réguliers construc-
tibles à la règle et au compas. Rappelons qu’un nombre premier de Fermat est un nombre
m
premier de la forme Fm := 22 + 1. On sait que F0 = 3, F1 = 5, F2 = 17, F3 = 257 et
42 CHAPITRE I. EXTENSIONS DE CORPS

F4 = 65537 sont premiers (on n’en connaît aucun autre !), mais que 641 divise F5 (Euler).
On sait aussi que F6 , . . . , F32 ne sont pas premiers (7) .

Théorème 7.8. — Un polygone régulier à n côtés est constructible à la règle et au compas


si et seulement si n est le produit d’une puissance de 2 et de nombres premiers de Fermat
distincts.

Démonstration. — Soit N l’ensemble des nombres entiers n ≥ 1 tels que le polygone


régulier à n côtés soit constructible à la règle et au compas. Si n ∈ N , alors 2n ∈ N (on
peut bissecter n’importe quel angle constructible), et tout diviseur de n est dans N . De plus,
si m et n sont dans N et sont premiers entre eux, alors mn ∈ N : en effet, exp(2iπ/m) et
exp(2iπ/n) sont alors constructibles, et si u et v sont des entiers tels que um + vn = 1, on a
exp(2iπ/mn) = exp(2iπ/m)u exp(2iπ/n)v ,
de sorte que exp(2iπ/mn) est aussi constructible.
Il suffit donc de montrer que les seuls nombres premiers impairs p qui appartiennent à N
sont des nombres premiers de Fermat, et que le carré d’un nombre premier impair n’est pas
dans N .
Soit p un nombre premier impair. Les deux assertions découlent du théorème 7.1 et du
fait que le degré de exp(2iπ/p2 ) sur Q est ϕ(p2 ) = p(p − 1), impair, qui n’est donc jamais
une puissance de 2, tandis que le degré de exp(2iπ/p) sur Q est ϕ(p) = p − 1 (il est dans
ce cas facile de déduire du critère d’Eisenstein l’irréductibilité du polynôme cyclotomique
ΦQ r
p ; cf. exerc. 1.13), et que si p − 1 s’écrit 2 , alors r doit lui-même être une puissance de 2
(pourquoi ?).

On retrouve le fait que le polygone régulier à 9 côtés n’est pas constructible à la règle et
au compas (cor. 2.26).

Corollaire 7.9 (Gauss, 1801). — Le polygone régulier à 17 côtés est constructible à la règle
et au compas.

Exercice 7.10. — On pose ζ = exp(2iπ/17). Le groupe de Galois G du polynôme X 17 − 1,


c’est-à-dire celui de l’extension Q ⊆ Q(ζ), est isomorphe au groupe multiplicatif ((Z/17Z)∗ , ×)
(prop. 7.5).
a) Montrer que ce groupe est engendré par la classe de 3 ; on note g ∈ G le générateur
correspondant.
b) On pose a0 = 7k=0 g 2k (ζ) et a1 = 7k=0 g 2k+1 (ζ). Calculer a0 + a1 et a0 a1 , puis a0
P P

et a1 (un signe est difficile à déterminer).

7. Cela ne veut pas dire que l’on sait tous les factoriser : si on sait par exemple factoriser explicitement F6 =
274177 · 67280421310721 et F11 (un nombre de 617 chiffres), et que l’on connaît explicitement un facteur non
trivial pour F14 , F22 et F31 , on ne connaît aucun facteur non trivial pour les nombres F20 et F24 .
7. APPLICATIONS DE LA THÉORIE DE GALOIS 43

c) Pour 0 ≤ j ≤ 3, on pose bj = 3k=0 g 4k+j (ζ). Calculer b0 +b2 et b0 b2 , puis b0 , b2 , b1 , b3


P

(là encore, les signes sont difficiles à déterminer).


d) Pour 0 ≤ j ≤ 7, on pose cj = g j (ζ) + g 8+j (ζ). Calculer c0 + c4 , c0 c4 , puis cos(2π/17).

7.2. Extensions cycliques. — Soit K un corps et soit n un entier ≥ 2. On fait l’hypothèse


que le groupe µn (K) des racines n-ièmes de l’unité est d’ordre n. Cela entraîne que la carac-
téristique de K ne divise pas n et que le polynôme X n − 1 est séparable (il n’a pas de racine
commune avec son polynôme dérivé). Rappelons enfin que le groupe µn (K) est toujours cy-
clique (cf. lemme 7.4 ; dans notre cas, il est donc isomorphe à Z/nZ). Les générateurs de ce
groupe sont les racines primitives.
Sous cette hypothèse, nous allons déterminer toutes les extensions cycliques de degré n de
K, c’est-à-dire les extensions galoisiennes de groupe de Galois Z/nZ.
Lemme 7.11. — Soit K un corps tel que Card(µn (K)) = n et soit a ∈ K. Si une extension
K ,→ L est engendrée par une racine du polynôme X n − a, cette extension est galoisienne
et Gal(L/K) < µn (K). En particulier, le groupe Gal(L/K) est cyclique.

Démonstration. — Soit x une racine de X n − a engendrant L. Les ζx, pour ζ ∈ µn (K),


forment l’ensemble des racines de ce polynôme. Puisque ζ est dans K, l’extension K ,→ L
est galoisienne, en tant que corps de décomposition du polynôme séparable X n − a. Tout
élément de Gal(L/K) permute les racines de X n − a et est déterminé par l’image ζx de x
(puisque les éléments ζ de µn (K) ⊆ K sont fixes), d’où un morphisme de groupes injectif
Gal(L/K) ,→ µn (K).
Exemple 7.12. — On a déjà √
vu, dans l’ex. 6.31, un cas où le lemme s’applique : c’est celui
de l’extension Q(j) ,→ Q( 3 2, j), qui est galoisienne de groupe de Galois isomorphe à
Z/3Z.
Proposition 7.13. — Soit K un corps tel que Card(µn (K)) = n et soit a ∈ K. On suppose
a∈/ K d pour tout diviseur d > 1 de n. Alors le polynôme X n − a est irréductible sur K et
son corps de rupture est une extension galoisienne de K de groupe de Galois µn (K).

Démonstration. — Soit L un corps de décomposition de P (X) = X n − a et soit x ∈ L une


racine de P . On a Y
P (X) = (X − ζx)
ζ∈µn (K)
dans L[X]. Soit Q ∈ K[X] un facteur irréductible unitaire de P , de degré e. Son coefficient
constant est produit de e facteurs ζx, avec ζ ∈ K, donc xe ∈ K. Comme xn = a ∈ K, par le
théorème de Bézout, on a xd ∈ K, où d = n∧e, de sorte que a = xn = (xd )n/d . L’hypothèse
faite entraîne n = d, donc P = Q et P est irréductible. Comme L est engendré par x, c’est
le corps de rupture de P . Par le lemme 7.11, K ,→ L est galoisienne, donc | Gal(L/K)| =
[L : K] = deg(P ) = n = |µn (K)| et le même lemme permet de conclure.
44 CHAPITRE I. EXTENSIONS DE CORPS

Théorème 7.14 (Kummer). — Soit K un corps tel que Card(µn (K)) = n et soit K ,→ L
une extension galoisienne de groupe de Galois cyclique d’ordre n. Il existe a ∈ K tel que L
soit le corps de décomposition de X n − a.

Cet énoncé généralise le lemme 2.21, qui traitait le cas des extensions de degré 2.

Démonstration. — Soit g un générateur de Gal(L/K), que l’on considère comme un endo-


morphisme du K-espace vectoriel L. Comme g n = IdL et que X n − 1 est scindé à racines
simples dans K, l’endomorphisme g est diagonalisable. Les valeurs propres de g forment un
sous-groupe de µn (K) : si λ et µ sont des valeurs propres, et que g(x) = λx et g(y) = µy,
avec x et y non nuls, on a g(xy −1 ) = g(x)g(y)−1 = λµ−1 (xy −1 ), de sorte que λµ−1 est
aussi une valeur propre.
Par le lemme 7.4, ce sous-groupe est cyclique d’ordre un diviseur d de n. On a alors
d
g = IdL , d’où d = n. Donc il existe x ∈ L {0} tel que g(x) = ζx où ζ est une racine
primitive n-ième de l’unité.
Considérons le polynôme
n
Y
(X − ζ i x) = X n − a,
i=1
avec a = xn . C’est un polynôme séparable scindé dans L, qui est invariant sous l’action
de Gal(L/K). Il est donc à coefficients dans K par le lemme d’Artin (th. 6.28). Comme
le groupe Gal(L/K) agit transitivement sur ses racines, il est irréductible dans K[X] (il
laisse stable l’ensemble des racines de n’importe quel facteur irréductible). Son corps de
décomposition est de degré n sur K et contenu dans L, donc c’est L.

Sans l’hypothèse faite sur K, la conclusion du théorème n’est en général plus valide.
Par exemple, si Q ,→ L est une extension galoisienne de degré 3 (par exemple l’extension
L = Q(cos 2π/9), où cos 2π/9 est une racine de X 3 − X + 1 ; cf. la preuve du cor. 2.26), elle
ne peut pas être engendrée par des éléments x tels que x3 ∈ Q : comme elle est galoisienne,
elle devrait contenir une racine cubique non triviale de 1, ce qui n’est pas le cas !
Dans une direction différente, si K est de caractéristique p > 0 (la seule racine p-ième
de l’unité est alors 1, donc Card(µp (K)) = 1), on peut décrire les extensions galoisiennes
K ,→ L de groupe de Galois Z/pZ : c’est la théorie d’Artin-Schreier (cf. [CL], Exercises 5.6
et 5.7). On montre qu’il existe a ∈ K tel que L soit le corps de décomposition de X p −X −a.

7.3. Extensions radicales, équations résolubles par radicaux. — Étant donné un poly-
nôme P , disons à coefficients rationnels, on aimerait savoir si chaque racine de P peut être
exprimée au moyen d’une formule ne faisant intervenir que des nombres rationnels, les opéra-
tions arithmétiques usuelles (addition, soustraction, multiplication et division) et l’extraction
de racines. Pour formuler ce problème de façon précise, nous sommes amenés à poser les
7. APPLICATIONS DE LA THÉORIE DE GALOIS 45

définitions suivantes. On suppose (pour simplifier) dans cette section que l’on est en caracté-
ristique 0.

Définition 7.15. — Une extension K ,→ L (de corps de caractéristique 0) est dite radicale
s’il existe une suite d’extensions
K = K0 ,→ K1 ,→ · · · ,→ Kn = L
telle qu’il existe pour chaque i un élément xi de Ki et un entier di > 0 tels que Ki =
Ki−1 (xi ) et xdi i ∈ Ki−1 .

On dit que L s’obtient à partir de K par adjonctions successives de racines. Il est clair que
si K ,→ L et L ,→ M sont des extensions radicales (de corps de caractéristique 0), il en est
de même de l’extension composée K ,→ M .

Définition 7.16. — Soit K un corps de caractéristique 0. Un polynôme à coefficients dans


K est dit résoluble par radicaux (sur K) s’il est scindé dans une extension radicale de K.

Lemme 7.17. — Soit K ,→ L une extension radicale. La clôture normale de L (dans n’im-
porte quelle clôture algébrique) est encore une extension radicale de K.

Démonstration. — Soit
K = K0 ,→ · · · ,→ Kn−1 ,→ Kn = L
une suite d’extensions comme dans la déf. 7.15, avec L = Kn−1 (x) et xd ∈ Kn−1 . Soit
M la clôture normale de Kn−1 dans une extension algébriquement close Ω de L. La clôture
normale de L dans Ω contient M et x, donc c’est la clôture normale M 0 de M (x) dans Ω. En
raisonnant par récurrence sur n, on voit qu’il suffit de montrer que l’extension M ,→ M 0 est
radicale.
Celle-ci est engendrée par tous les conjugués de x dans Ω, c’est-à-dire les racines dans
Ω du polynôme minimal de x sur K, ou encore les images de x par tous les K-morphismes
σ : M → Ω. Comme xd ∈ M , on a σ(x)d ∈ σ(M ), et σ(M ) = M puisque K ,→ M est
un extension normale. L’extension M ,→ M 0 est donc obtenue en ajoutant successivement
des éléments de Ω, les σ(x), dont la puissance d-ième est dans M . C’est bien une extension
radicale.

Théorème 7.18 (Galois). — Une extension galoisienne finie de corps de caractéristique 0


est contenue dans une extension radicale si et seulement si son groupe de Galois est réso-
luble (8) .

8. On rappelle qu’un groupe G est résoluble s’il existe une suite de sous-groupes {Id} = Gn / Gn−1 / · · · /
G0 = G où les groupes Gi−1 /Gi sont tous abéliens. Si G est fini, on peut même supposer ces quotients cycliques.
Tout sous-groupe et tout groupe quotient d’un groupe résoluble est résoluble. Inversement, si H est un sous-groupe
distingué de G et que H et G/H sont résolubles, alors G est résoluble.
46 CHAPITRE I. EXTENSIONS DE CORPS

Démonstration. — Soit K un corps de caractéristique 0 et soit K ,→ L une extension ga-


loisienne contenue dans une extension radicale K ,→ M , que l’on peut par le lemme 7.17
supposer galoisienne. Comme tout quotient d’un groupe résoluble est résoluble, il suffit de
montrer que le groupe Gal(M/K) est résoluble. Il existe une suite d’extensions
K = K0 ,→ K1 ,→ · · · ,→ Kn = M
avec Ki = Ki−1 (xi ) et xdi i ∈ Ki−1 . On aimerait pouvoir appliquer le lemme 7.11 aux
extensions Ki−1 ,→ Ki , mais il faut auparavant pour cela ajouter des racines de l’unité à
K. Considérons donc l’extension K ,→ K 0 obtenue en adjoignant à K toutes les racines
d1 · · · dn -ièmes de l’unité, c’est-à-dire le corps de décomposition du polynôme X d1 ···dn − 1
sur K. Par la prop. 7.5, c’est une extension galoisienne abélienne. Si on note Ki ,→ Ki0
l’extension analogue pour chaque i, on obtient une suite d’extensions
K ,→ K 0 = K00 ⊆ K10 ⊆ · · · ⊆ Kn0 =: M 0
avec Ki0 = Ki−10
(xi ) et xdi i ∈ Ki−1
0
. L’extension K ,→ M est galoisienne donc c’est le
corps de décomposition d’un polynôme P ∈ K[X] (th. 4.2). L’extension K ,→ M 0 est alors
le corps de décomposition de (X d1 ···dn − 1)P (X) ∈ K[X] : elle est galoisienne. La suite
d’extensions ci-dessus correspond à une suite de sous-groupes
G := Gal(M 0 /K) > G0 > G1 > · · · > Gn = {Id},
avec Gi = Gal(M 0 /Ki0 ).
Considérons la suite d’extensions
0
K ,→ Ki−1 ,→ Ki0 ,→ M 0 .
0
Comme l’extension Ki−1 ,→ Ki0 est galoisienne cyclique (lemme 7.11), la correspondance
de Galois nous dit que Gi = Gal(M 0 /Ki0 ) est distingué dans Gi−1 = Gal(M 0 /Ki−1
0
), avec
Gi−1 /Gi cyclique. De même, en considérant la suite d’extensions
K ,→ K 0 ,→ M 0 ,
on voit que G0 = Gal(M 0 /K 0 ) est distingué dans G = Gal(M 0 /K), avec G/G0 '
Gal(K 0 /K) abélien (prop. 7.5). Cela montre que G est résoluble, donc aussi son quotient
Gal(M/K).
Inversement, supposons le groupe Gal(L/K) résoluble et montrons que L est contenu
dans une extension radicale de K. Comme tout-à-l’heure, considérons l’extension galoisienne
radicale K ,→ K 0 obtenue en adjoignant à K toutes les racines d’ordre [L : K]! de l’unité
et l’extension analogue L ,→ L0 , galoisienne abélienne (prop. 7.5). L’extension K ,→ L0
est galoisienne (comme plus haut, c’est le corps de décomposition d’un polynôme), le sous-
groupe Gal(L0 /L) de Gal(L0 /K) est distingué, et le quotient est Gal(L/K).
Comme Gal(L/K) est résoluble et Gal(L0 /L) abélien, Gal(L0 /K) est résoluble (voir
note 8), donc aussi son sous-groupe G := Gal(L0 /K 0 ), et il suffit de montrer que l’extension
K 0 ,→ L0 est radicale (puisque l’extension K ,→ K 0 l’est). Remarquons que son degré est
7. APPLICATIONS DE LA THÉORIE DE GALOIS 47

≤ [L : K] (si L = K(a) (th. 5.22) et que le polynôme minimal de a sur K est P , de degré
[L : K], alors L0 = K 0 (a), et le polynôme minimal de a sur K divise P ), donc que K 0
contient toutes les racines d’ordre [L0 : K 0 ]! de l’unité.
Nous allons montrer, par récurrence sur [L0 : K 0 ], que l’extension K 0 ,→ L0 est radicale,
sous l’hypothèse que K 0 contient toutes les racines d’ordre [L0 : K 0 ]! de l’unité.
Soit H un sous-groupe distingué de G de quotient G/H cyclique non trivial. Il correspond
à des extensions galoisiennes K 0 ,→ M ,→ L0 . L’extension K 0 ,→ M est cyclique d’ordre
≤ [L0 : K 0 ], donc K 0 contient toutes les racines d’ordre [M : K 0 ] de l’unité. Elle est donc
radicale par le théorème de Kummer (th. 7.14). L’extension M ,→ L0 est galoisienne, de
groupe de Galois résoluble, de degré < [L0 : K 0 ], et M contient toutes les racines d’ordre
[M : L0 ]! de l’unité. Elle est donc radicale par hypothèse de récurrence. L’extension K 0 ,→ L0
est donc bien radicale et ceci termine la démonstration du théorème.

En particulier, le polynôme irréductible P (X) = X 5 −6X +3 ∈ Q[X], dont on a vu dans


l’ex. 6.32 que le groupe de Galois est isomorphe à S5 , non résoluble, n’est pas résoluble par
radicaux sur Q.
Une autre façon de formuler la question posée au début de cette section est de demander
s’il existe une « formule » ne faisant intervenir que des nombres rationnels, les opérations
arithmétiques usuelles et l’extraction de racines, permettant d’exprimer les racines de l’équa-
tion « générale »
X n + a1 X n−1 + · · · + an−1 X + an ,
en fonction de ses coefficients. On regarde cette équation comme étant à coefficients dans
Q(a0 , . . . , an−1 ). On démontre alors assez facilement que le groupe de Galois de ce polynô-
me est isomorphe à Sn (9) , qui n’est pas résoluble pour n ≥ 5. Ce polynôme n’est donc pas
résoluble par radicaux sur Q(a0 , . . . , an−1 ) (Abel, 1826).

9. Soient x1 , . . . , xn les racines de ce polynôme dans un corps de décomposition. Les coefficients sont alors,
au signe près, les polynômes symétriques élémentaires σ1 , σ2 , . . . , σn en les xi . Il s’agit simplement de remarquer
que le groupe de Galois de l’extension finie Q(σ1 , σ2 , . . . , σn ) ,→ Q(x1 , . . . , xn ) est isomorphe à Sn (utiliser
le lemme d’Artin, th. 6.28).
CHAPITRE II

MODULES

Soit A un anneau (commutatif unitaire). Un A-module est un groupe commutatif M muni


d’une opération
A × M −→ M
(a, m) 7−→ am
qui vérifie les relations habituelles (les mêmes que pour un espace vectoriel). On définit
comme d’habitude sous-modules (par exemple, les sous-A-modules de A sont ses idéaux),
sous-module engendré par une partie d’un module, modules quotients, sommes et produits di-
rects de A-modules, système générateur, système libre, morphismes (de A-modules), noyau,
image, dual... Il n’y a pas de piège ici. En revanche, contrairement à ce qui se passe dans la
théorie des espaces vectoriels sur un corps, certains A-modules n’ont pas de base. Ceux qui
en ont une sont isomorphes à une somme directe A(Λ) , où Λ est un ensemble (pas nécessai-
rement fini) ; on dit qu’ils sont libres.
Enfin, si M est un A-module et I un idéal de A, on note IM le sous-module de M formé
P
des sommes finies i ai mi , avec ai ∈ I et mi ∈ M .

Exemple 0.19. — Si A n’est pas un corps, il existe des tas de A-modules non libres, par
exemple tous les A/I, où I est un idéal de A distinct de {0} et de A.

Exercice 0.20. — Soit I un idéal non nul de A. Montrer que I est un A-module libre si et
seulement si I est un idéal principal engendré par un non diviseur de zéro.

Exercice 0.21. — Déterminer, pour chaque m, n ∈ N, le Z-module HomZ (Z/mZ, Z/nZ).

1. Modules libres

Proposition 1.1. — Soit A un anneau non nul et soit M un A-module libre. Toutes les bases
de M ont le même cardinal. On l’appelle le rang de M .
50 CHAPITRE II. MODULES

Démonstration. — On se ramène au résultat analogue pour les espaces vectoriels en procé-


dant ainsi. Soit (eλ )λ∈Λ une base de M . Soit m un idéal maximal de A. Le quotient k = A/m
est un corps et M/mM est un k-espace vectoriel dans lequel la famille des classes (ēλ )λ∈Λ
est génératrice. Montrons qu’elle est libre. Si on a une relation
X
āλ ēλ = 0
λ∈Λ

dans M/mM , avec aλ ∈ A, cela signifie


X
aλ eλ ∈ mM.
λ∈Λ
Pn
Cette somme s’écrit donc j=1 bj mj , avec bj ∈ m et mj ∈ M . En décomposant chaque mj
P
sur la base (eλ )λ∈Λ , on voit que l’on peut aussi écrire cette somme λ∈Λ cλ eλ , avec cλ ∈ m.
La famille (eλ )λ∈Λ étant libre, on en déduit pour pour tout λ ∈ Λ, on a aλ = cλ ∈ m, donc
āλ = 0.
La famille (ēλ )λ∈Λ est donc une base du k-espace vectoriel M/mM . Le cardinal de Λ est
donc la dimension de cet espace vectoriel : il est indépendant de la base (eλ )λ∈Λ .
Exercice 1.2. — Soit A un anneau non nul, soit M un A-module libre et soit N un sous-module
libre de M . Montrer rang(N ) ≤ rang(M ).

Attention aux habitudes issues de la théorie des espaces vectoriels ! Par exemple, une
famille libre à n éléments dans un module libre de rang n n’est pas nécessaire une base (par
exemple, 2 n’est pas une base du Z-module libre Z, de rang 1). En revanche, toute famille
génératrice à n éléments d’un A-module libre de rang n en est bien une base (cor. 3.4).
Exercice 1.3. — Montrer que le Z-module Q n’est pas libre.

Exercice 1.4. — Tout espace vectoriel est libre. En particulier le Q-espace vectoriel QN des
suites de nombres rationnels a une base (mais il faut l’axiome du choix pour montrer son exis-
tence). Montrer cependant que le Z-module ZN n’est pas libre (c’est difficile !).

2. Modules de torsion

Étant donné un élément m non nul d’un A-module M , il peut très bien exister un élément
non nul a de A tel que am = 0 (penser par exemple à 1 dans le Z-module Z/nZ). On dit
alors que m est un élément de torsion de M . Si A est intègre, l’ensemble
T (M ) := {m ∈ M | ∃a ∈ A {0} am = 0}
des éléments de torsion de M est un sous-module de M appelé sous-module de torsion de
M . On dit que M est sans torsion si T (M ) = 0 (c’est une condition nécessaire, mais pas
suffisante (cf. exerc. 1.3), pour pouvoir être libre !). Le module quotient M/T (M ) est alors
sans torsion.
3. MODULES DE TYPE FINI 51

3. Modules de type fini

On dit qu’un A-module est de type fini s’il admet une famille génératrice finie. Tout quo-
tient d’un module de type fini est encore de type fini, mais un sous-module d’un module de
type fini n’est pas nécessairement de type fini (trouver un exemple).

Exercice 3.1. — Soit M un A-module et soit N un sous-A-module de M . Si N et M/N sont


de type fini, montrer que M est de type fini.

Théorème 3.2 (Cayley-Hamilton). — Soit M un A-module de type fini et soit u : M → M


un endomorphisme.
Pn
Si m1 , . . . , mn sont des générateurs de M , on peut écrire u(mi ) = j=1 aij mj , où
R = (aij )1≤i,j≤n ∈ Mn (A). Posons P (X) = dét(XIn − R) ∈ A[X]. Alors P (u) = 0.

Il est important de remarquer que si I est un idéal de A tel que u(M ) ⊆ IM , on peut
prendre les aij dans I (le choix des aij n’est en général pas unique et on verra dans les
applications qu’il est parfois crucial de le faire de façon astucieuse !). Si on écrit P (X) =
X n + a1 X n−1 + · · · + an−1 X + an , on a alors aj ∈ I j .

Démonstration. — Munissons M d’une structure de A[X]-module en posant


∀Q ∈ A[X] ∀m ∈ M Q · m := Q(u)(m).
On a alors

m1
(XIn − R)  ...  = 0.
 

mn
où XIn − R est une matrice carrée d’ordre n à coefficients dans A[X]. En multipliant cette
égalité à gauche par la transposée de la comatrice de XIn − R, on obtient
 
m1
 .. 
dét(XIn − R)  .  = 0,
mn
ce qui signifie que P (X) = dét(XIn − R) annule le A[X]-module M , ou encore que P (u)
est nul sur M .

Corollaire 3.3. — Soit M un A-module de type fini. Tout endomorphisme surjectif de M est
bijectif (1) .

1. Attention ! Ce résultat ne généralise pas celui de l’exerc. III.2.15 : un endomorphisme d’anneaux (unitaires)
u : A → A qui serait aussi un endomorphisme de A-modules devrait vérifier u(a) = u(a1A ) = au(1A ) =
a1A = a pour tout a, donc seule l’identité convient !
52 CHAPITRE II. MODULES

Démonstration. — Soit f : M → M un endomorphisme surjectif. Comme dans la preuve


du théorème, on munit M d’une structure de A[X]-module en posant X ·m = f (m). Comme
f est surjectif, on a M = IM , où I = (X). Appliquons le th. 3.2 à u = IdM . On en déduit
une égalité dans EndA (M )
un + P1 un−1 + · · · + Pn−1 u + Pn IdM = 0,
avec Pj ∈ I j = (X j ). En écrivant Pj = XQj , on obtient
∀m ∈ M 0 = (un + P1 un−1 + · · · + Pn−1 u + Pn IdM )(m)
= m + P1 · m + · · · + Pn−1 · m + Pn · m
= m + P1 (f )(m) + · · · + Pn−1 (f )(m) + Pn (f )(m)
= m + f (Q1 (f ) + · · · + Qn−1 (f ) + Qn (f ))(m),
c’est-à-dire IdM +f ◦ Q(f ) = 0 pour un polynôme Q ∈ A[X]. L’endomorphisme −Q(f )
est l’inverse de f .
Corollaire 3.4. — Soit M un A-module libre de rang n. Toute famille génératrice de M à
n éléments est une base de M .

Démonstration. — On peut supposer M = An . Une famille génératrice B à n éléments


définit un endomorphisme surjectif An → An . Le cor. 3.3 dit qu’il est bijectif, donc B est
une base de M .
Corollaire 3.5. — Soit M un A-module de type fini et soit I un idéal tel que IM = M . Il
existe a ∈ I tel que (1 − a)M = 0.

Démonstration. — Appliquons le th. 3.2 à u = IdM . On en déduit qu’il existe des aj ∈ I j


tels que un + a1 un−1 + · · · + an−1 u + an IdM = 0, d’où le corollaire avec a = −a1 − · · · −
an .

Soit A un anneau non nul. On définit son radical de Jacobson comme l’intersection de ses
idéaux maximaux : \
rad(A) := m.
m⊆A
C’est un idéal de A.
Exemple 3.6. — On a rad(Z) = {0}. Si C est l’anneau des fonctions continues de [0, 1]
dans R, on a aussi rad(C ) = {0} (exerc. I.1.6). Soit K un corps. Il y a une infinité de po-
lynômes irréductibles dans K[X] donc rad(K[X]) = {0}. En revanche, dans l’anneau des
séries formelles K[[X]], il y a un seul idéal maximal (on dit que c’est un anneau local), à
savoir (X) (exerc. I.1.10). On a donc rad(K[[X]]) = (X).
Lemme 3.7. — Pour tout anneau non nul A, on a
rad(A) = {a ∈ A | 1 + xa est inversible pour tout x ∈ A}.
4. MODULES DE TYPE FINI SUR LES ANNEAUX PRINCIPAUX 53

Démonstration. — Supposons a ∈ / rad(A). Il existe un idéal maximal m ⊆ A tel que a ∈


/ m.
On a alors m + (a) = A, de sorte qu’il existe m ∈ m et x ∈ A tels que 1 = m + xa. Comme
m ∩ A∗ = ∅, cela entraîne 1 − xa ∈/ A∗ .
Inversement, si 1 + xa n’est pas inversible pour un x ∈ A, on a (1 + xa) ( A et cet idéal
est contenu dans un idéal maximal m de A. Comme 1 ∈ / m, cela entraîne a ∈
/ m.

Théorème 3.8 (Lemme de Nakayama, 1951). — Soit A un anneau non nul, soit I un idéal
contenu dans rad(A) et soit M un A-module de type fini.
a) Si IM = M , on a M = 0.
b) Soient m1 , . . . , mn des éléments de M ; si les images de m1 , . . . , mn dans M/IM
engendrent ce A-module, m1 , . . . , mn engendrent M .

Il semble que ce lemme soit en fait dû à Krull dans le cas où M est un idéal de A, puis à
Azumaya dans le cas général.

Démonstration. — Le point a) résulte du cor. 3.5, puisque si a ∈ rad(A), l’élément 1 − a


est inversible (lemme 3.7).
Supposons que les images de m1 , . . . , mn dans M/IM engendrent ce A-module et consi-
dérons le A-module N := M/(Am1 + · · · + Amn ). Soit m ∈ M . On peut écrire m =
Pn
j=1 aj mj (mod IM ) avec a1 , . . . , an ∈ A, c’est-à-dire m ∈ IM (mod Am1 + · · · +
Amn ). On a ainsi IN = N , donc, puisque N est de type fini, N = 0 par a). Ceci se réécrit
M = Am1 + · · · + Amn , d’où b).

4. Modules de type fini sur les anneaux principaux

Dans toute cette section, A est un anneau principal. Nous allons décrire tous les A-modules
de type fini. J’ai choisi de présenter une approche matricielle de ce problème. Le point central
de l’argument consiste à trouver, étant donnée une matrice M à coefficients dans A, une
matrice équivalente à M la plus simple possible. On sait qu’une matrice M de rang r à
coefficients dans un corps est équivalente à la matrice par blocs
 
Ir 0
.
0 0
Nous allons montrer une version analogue de ce résultat pour les matrices à coefficients
dans A. Rappelons qu’une matrice carrée à coefficients dans un anneau A est inversible si
et seulement si son déterminant est dans A∗ . Le groupe des matrices inversibles d’ordre n
à coefficients dans A est noté GL(n, A). Le sous-groupe distingué formé des matrices de
déterminant 1 est noté SL(n, A).
54 CHAPITRE II. MODULES

Théorème 4.1. — Soit M une matrice à coefficients dans un anneau principal A. Il existe
des matrices inversibles P et Q à coefficients dans A et des éléments non nuls d1 , . . . , dr de
A tels que avec d1 | · · · | dr telles que
 
d1
 .. 

 . 0 

dr
 
PMQ =  .
 
 0 
..
 
.
 
 0 
0
L’entier r et les éléments d1 , . . . , dr de A sont uniquement déterminés (à multiplication par
une unité de A près). On les appelle les facteurs invariants de la matrice M .

Bien sûr, l’entier r est le rang de la matrice M vue comme matrice à coefficients dans le
corps des fractions de A.
On peut voir ce théorème comme la description des classes d’équivalence des matrices à
coefficients dans un anneau principal. Il est beaucoup plus difficile de déterminer les classes
de similitude (on sait le faire lorsque A est un corps ; cf. § 4.2).
Avant de commencer la preuve de ce théorème, faisons quelques rappels sur les opérations
élémentaires. Par « opération élémentaire » sur les lignes (resp. sur les colonnes), nous enten-
drons uniquement ici « ajouter un multiple d’une ligne (resp. d’une colonne) à une autre ».
Cela correspond à multiplier à gauche (resp. à droite) la matrice d’origine par une matrice
élémentaire, c’est-à-dire une matrice qui ne diffère de la matrice identité que par un seul co-
efficient, situé hors de la diagonale. Une matrice élémentaire est inversible (son déterminant
est 1) donc on obtient après des opérations élémentaires une matrice équivalente à la matrice
d’origine (et de même déterminant). Nous noterons
E(n, A) < SL(n, A)
le sous-groupe engendré par les matrices élémentaires.
Avec des opérations élémentaires, on peut aussi échanger deux lignes, l’une d’elles étant
changée en son opposé :
       
Li Li −Lj −Lj
−→ −→ −→
Lj Li + Lj Li + Lj Li
(on ne peut pas juste échanger deux lignes, puisque le déterminant est inchangé par nos
opérations élémentaires).

Lemme 4.2. — Soit A un anneau principal et soient a1 , . . . , as des éléments de A. Il existe



un matrice carrée d’ordre s à coefficients dans A dont la première ligne est a1 · · · as
et dont le déterminant est un pgcd de a1 , . . . , as .
4. MODULES DE TYPE FINI SUR LES ANNEAUX PRINCIPAUX 55

Démonstration. — On raisonne par récurrence sur s, le cas s = 1 étant évident. Supposons


s ≥ 2. Par hypothèse de récurrence, il existe donc une matrice carrée N d’ordre s − 1 de

première ligne a2 · · · as et de déterminant d = a2 ∧ · · · ∧ as . Soient x et y des éléments
de A tels que
a1 ∧ a2 ∧ · · · ∧ as = a1 ∧ d = a1 x + dy.
La matrice  
a1

 0 N 

 .. 
.
 
 
 
 0 
(−1)s−1 y (−1)s a2 x/d ··· (−1)s as x/d
convient alors.

Démonstration du théorème. — Le lemme entraîne facilement le théorème dans le cas où M



est une matrice ligne (ou colonne), que l’on peut supposer non nulle : si M = m1 · · · ms
et que d = m1 ∧· · ·∧ms (non nul), il existe a1 , . . . , as dans A tels que d = a1 m1 +· · ·+as ms
et a1 , . . . , as sont premiers entre eux dans leur ensemble. Il existe donc d’après le lemme une

matrice inversible Q dont la première colonne est a1 · · · as . Le produit M Q s’écrit
alors

M Q = d b2 · · · bs ,
où d divise chacun des bi . En effectant des opérations élémentaires sur les colonnes de M Q,
on arrive à la matrice

d 0 ··· 0 ,
ce qui montre l’existence d’une réduction dans ce cas.
Traitons le cas général, en raisonnant par récurrence sur la taille de la matrice. Par le
processus décrit ci-dessus, on se ramène à une matrice dont la première ligne est du type

d(1) 0 · · · 0 puis, en procédant de façon analogue, on peut aussi supposer que la pre-
mière colonne est de ce type. Cela détruit la forme de la première ligne, donc on recommence
le processus. On obtient ainsi alternativement des matrices de première ligne ou de première
colonne de ce type, avec des premiers coefficients d(i) qui vérifient d(i+1) | d(i) . Comme l’an-
neau A est principal, cette suite se stabilise (cf. prop. III.2.1), ce qui signifie que l’on arrive

après un nombre fini d’opérations à une matrice disons de première ligne d(I) 0 · · · 0
telle que le pgcd d(I+1) des coefficients de la première colonne soit associé à d(I) . Cela si-
gnifie que d(I) divise chacun de ces coefficients. On peut alors, par opérations élémentaires
sur les lignes, se ramener à une matrice du type :
d 0 ··· 0
 
0 
.
 
.
.. N 
0
56 CHAPITRE II. MODULES

Appliquant l’hypothèse de récurrence à N , nous sommes ramenés à une matrice du type


 
d

 d2 0 

 . .

 0 . 
dr
(où nous n’avons écrit que les r premières lignes et colonnes de la matrice, tous les autres
coefficients étant nuls) avec d2 | · · · | dr , mais on n’a pas encore la condition que d divise
d2 ! Par une opération élémentaire sur les lignes, on arrive à la matrice
 
d d2 0 0
0 d2 0
.
 

 . .. 
0 0 dr
En appliquant le lemme 4.2 encore une fois, on peut remplacer d par d1 := d ∧ d2 . La
coefficient d1 divise maintenant d2 , d3 , . . . , dr , mais le nouveau d2 peut ne plus diviser d3 . Le
même procédé nous permet de le remplacer par d2 ∧ d3 . On conclut facilement en procédant
de proche en proche.
Pour montrer l’unicité, le plus rapide est de considérer

δk (M ) = pgcd(k × k mineurs de M )

et de montrer que δk (M ) divise δk (P M ) pour toute matrice carrée P de taille convenable.


Lorsque P est inversible, on a alors δk (P M ) | δk (P −1 P M ) = δk (M ), de sorte que δk (M )
et δk (P M ) sont associés. On en déduit en considérant les matrices transposées que si Q est
aussi inversible, δk (M ) et δk (M Q) sont associés, donc finalement que δk (M ) et δk (P M Q)
sont associés. Si P M Q a la forme donnée dans le théorème, on a de plus

δk (P M Q) = d1 · · · dk ,

ce qui exprime les dk en fonction d’entiers qui ne dépendent que de M (à multiplication par
une unité de A près).
Il reste à démontrer cette propriété. Elle résulte du fait que les lignes de P M sont combi-
naisons linéaires des lignes de M . Plus précisément, si l’on appelle Lki le k-vecteur formé des
k premiers coefficients de la ième ligne de M et que l’on note P = (bi,j )1≤i,j≤p , le premier
k × k mineur de P M est

dét(b1,1 Lk1 + · · · + b1,p Lkp , . . . , bk,1 Lk1 + · · · + bk,p Lkp )

qui est une combinaison linéaire des k × k mineurs extraits des k premières colonnes de M .
Il est donc divisible par δk (M ).
4. MODULES DE TYPE FINI SUR LES ANNEAUX PRINCIPAUX 57

Exercice 4.3. — Soit A un anneau principal et soient a et b des éléments non nuls!
de A. Quelle
a 0
est la forme réduite que l’on obtient en appliquant le théorème à la matrice ?
0 b

Exercice 4.4. — Soit A un anneau euclidien.


a) Montrer que dans la conclusion du théorème, on peut choisir P et Q (qui ne sont pas
uniquement déterminées !) produits de matrices élémentaires.
b) Si M ∈ GL(n, A), montrer qu’il existe P ∈ E(n, A) telle que
0 1
1 0
B .. C
PM = B
B . C
C.
B C
@ 1 A
0 dét M
En déduire SL(n, A) = E(n, A).

Exercice 4.5. — Soit A un anneau.


a) Soit M un élément de GL(n, A). Utiliser l’identité
! ! ! ! !
M 0 In M In 0 In M 0 −In
=
0 M −1 0 In −M −1 In 0 In In 0
!
M 0
pour montrer que la matrice est dans E(2n, A).
0 M −1
b) Soient M et N des éléments de GL(n, A). Utiliser l’identité
! ! ! !
M N M −1 N −1 0 MN 0 M −1 0 N −1 0
=
0 In 0 N −1 M −1 0 M 0 N

pour montrer que la matrice M N M −1 N −1 est dans E(2n, A).

Un peu de K-théorie. Les groupes E(n, A) et GL(n, A) ont été très étudiés car ils inter-
viennent en K-théorie. Considérons l’injection de groupes
GL(n, A) → GL(n + 1, A)
 
M 0
obtenue en envoyant une matrice M ∈ GL(n, A) sur et posons
0 1
[
GL(A) := GL(n, A).
n≥1

C’est un groupe dont [


E(A) := E(n, A)
n≥1
est un sous-groupe. On montre (cela résulte des deux derniers exercices ci-dessus) que E(A)
est le sous-groupe dérivé de GL(A) (c’est-à-dire le sous-groupe engendré par les commuta-
teurs d’éléments de GL(A)). Il est donc distingué et le groupe quotient
K1 (A) := GL(A)/E(A)
58 CHAPITRE II. MODULES

est abélien (on l’appelle l’abélianisé de GL(A)). Le déterminant induit une surjection
dét : K1 (A) → A∗
dont on note SK1 (A) le noyau. D’après l’exerc. 4.4, SK1 (A) est trivial lorsque A est eu-
clidien. Il existe en revanche des anneaux principaux A pour lesquels SK1 (A) n’est pas
compliqués (2) . Pour l’exemple standard d’anneau principal non eucli-
trivial, mais ils sont√
dien A = Z[(1 + i 19)/2], le groupe SK1 (A) est trivial (comme pour tous les anneaux
d’entiers de corps de nombres).

Corollaire 4.6 (Théorème de la base adaptée). — Soit A un anneau principal, soit M un


A-module libre de type fini et soit N un sous-module de M . Alors N est libre et il existe une
base (e1 , . . . , en ) de M et des éléments non nuls d1 , . . . , dr de A, avec 0 ≤ r ≤ n, tels que
d1 | · · · | dr et que (d1 e1 , . . . , dr er ) soit une base de N .

Il est facile de montrer que N est de type fini (voir la preuve ci-dessous). Si on savait
déjà que N était libre, le fait que son rang soit ≤ rang(M ) résulterait de l’exerc. 1.2, mais
c’est bien la liberté de N qui est le point difficile, et qui ne marche pas dès que A n’est pas
principal.
Attention aux erreurs habituelles : le théorème de la base adaptée ne dit pas que N admet
un supplémentaire, ni que l’on peut compléter une base de N en une base de M .
Enfin, il est clair qu’un sous-module, même de type fini, d’un module libre de type fini
n’est pas nécessairement libre (c’est le cas, par l’exerc. 0.20, pour les idéaux non principaux
d’un anneau non principal), et qu’un sous-module d’un module libre de type fini n’est pas
nécessairement de type fini (c’est le cas, dans un anneau non noethérien, pour les idéaux qui
ne sont pas de type fini (cf. prop. III.2.1)).

Démonstration. — On peut supposer M = An . Montrerons par récurrence sur n que N est


un A-module de type fini. Pour n = 0, il n’y a rien à démontrer. Si n > 0, on considère la
projection p : An → A sur un facteur. Le noyau Q = N ∩ An−1 du morphisme N → p(N )
est un sous-module de An−1 donc est de type fini par hypothèse de récurrence. L’image
p(N ) ' N/Q est un idéal de A donc est engendrée (en tant qu’idéal, donc aussi en tant que
A-module) par un élément. Il en résulte que N est de type fini (exerc. 3.1).
Choisissons une base de M et un système fini de générateurs de N , dont on écrit la ma-
trice des coordonnées dans la base de M . Multiplier à gauche cette matrice par une matrice
inversible revient à changer de base pour M . Multiplier à droite cette matrice par une matrice
inversible revient à changer de système de générateurs pour N . Le th. 4.1 donne immédiate-
ment le résultat.

2. Voir Ischebeck, F., Hauptidealringe mit nichttrivialer SK1 -Gruppe, Arch. Math. (Basel) 35 (1980), 138–139.
Pour un exemple où l’on a simplement E(2, A) 6= SL(2, A), voir le chapitre 6 de Cohn, P. M., On the structure of
the GL2 of a ring, Publ. Math. IHÉS 30 (1966), 5–53.
4. MODULES DE TYPE FINI SUR LES ANNEAUX PRINCIPAUX 59

Corollaire 4.7. — Soit M un module de type fini sur un anneau principal A. Il existe des
éléments non nuls et non inversibles d1 , . . . , ds de A, avec s ≥ 0 et tels que d1 | · · · | ds , et
un entier r ≥ 0, tels que
M ' Ar ⊕ A/(d1 ) ⊕ · · · ⊕ A/(ds ).
Les entiers r et s, et les di à association près, ne dépendent que de M . On appelle ces derniers
les facteurs invariants de M .

Démonstration. — Comme M est de type fini, il est engendré par n éléments, qui définissent
un morphisme surjectif An → M de A-modules. Il suffit d’appliquer le cor. 4.6 à son noyau
N , en ne gardant que les di non inversibles.
Pour l’unicité, il ne semble pas que l’on puisse facilement appliquer l’énoncé analogue
qui apparaît dans le th. 4.1. Nous allons donc procéder directement. Tout d’abord, dans une
telle décomposition, on a
(2) T (M ) ' A/(d1 ) ⊕ · · · ⊕ A/(ds )
et l’entier r ne dépend que de M : c’est le rang du A-module libre M/T (M ). Supposons que
l’on ait un isomorphisme
A/(d1 ) ⊕ · · · ⊕ A/(ds ) ' A/(e1 ) ⊕ · · · ⊕ A/(et ).
où les di et les ej ne sont ni nuls ni inversibles, d1 | · · · | ds et e1 | · · · | et . Nous allons
montrer s = t puis, par récurrence sur s, que ei est associé à di pour tout i.
Commençons par la remarque suivante : soit d et e des éléments non nuls de A ; on a
(3) d(A/(e)) ' A/((d ∨ e)/d).
×d
En effet, ce A-module est l’image de la multiplication A −−→ A/(e). Un élément x de A
est dans le noyau si et seulement si e divise dx, c’est-à-dire (e/e ∧ d) | x (utiliser le lemme
I.1.14). Comme e/e ∧ d = (d ∨ e)/d, on a l’isomorphisme cherché. En particulier, si p est un
élément irréductible de A, de sorte que A/(p) est un corps (prop. I.1.15), on a
(
A/(d) si p ∧ d = 1;
p(A/(d)) '
A/(d/p) si p | d,
d’où (
 0 si p ∧ d = 1;
A/(d) p(A/(d)) '
A/(p) si p | d.
Soit T le A-module apparaissant dans (2). Si on choisit p | d1 , on voit que la dimension du
A/(p)-espace vectoriel T /pT est s, tandis que c’est aussi le nombre (≤ t) de ej divisibles
par p. On a donc s ≤ t, puis égalité par symétrie.
Considérons maintenant le A-module T /d1 T . On a par (3)
T /d1 T ' A/(dk /d1 ) ⊕ · · · ⊕ A/(ds /d1 ) ' A/((d1 ∨ e1 )/d1 ) ⊕ · · · ⊕ A/((d1 ∨ es )/d1 ).
60 CHAPITRE II. MODULES

où dk est le premier di non associé à d1 . Le nombre de facteurs non nuls de chaque côté
devant être le même (comme on vient de le démontrer), on en déduit que (d1 ∨ ei )/d1 est
inversible pour 1 ≤ i < k, donc que ei divise d1 , donc di . Par symétrie, ils sont associés, et
on obtient des isomorphismes
T /d1 T ' A/(dk /d1 ) ⊕ · · · ⊕ A/(ds /d1 ) ' A/(ek /d1 ) ⊕ · · · ⊕ A/(es /d1 ).
On conclut par l’hypothèse de récurrence que di /d1 et ei /d1 sont associés pour k ≤ i ≤ s,
donc que di et ei sont associés. Ceci termine la démonstration.

Corollaire 4.8. — Soit A un anneau principal. Un A-module libre de type fini est libre si et
seulement s’il est sans torsion.

4.1. Application aux groupes abéliens de type fini. — Un groupe abélien de type fini
(c’est-à-dire engendré par un nombre fini d’éléments) n’est autre qu’un Z-module de type
fini. On déduit donc du cor. 4.7 le théorème de structure suivant.

Théorème 4.9. — Soit M un groupe abélien de type fini. On a


M ' Zr ⊕ Z/d1 Z ⊕ · · · ⊕ Z/ds Z,
où r ∈ N et les di sont des entiers strictement positifs vérifiant d1 | · · · | ds . De plus, les
entiers r, s et d1 , . . . , ds sont uniquement déterminés par M .

Bien entendu, M est fini si et seulement si r = 0.

4.2. Application à la réduction des endomorphismes. — Soit K un corps, soit E un K-


espace vectoriel de dimension finie et soit u un endomorphisme de E. On définit sur E une
structure de K[X]-module en posant
∀P ∈ K[X] ∀x ∈ E P · x := P (u)(x).
Remarquons que les sous-K[X]-modules de E correspondent aux sous-K-espaces vectoriels
invariants par u. Comme E est de dimension finie, c’est un K[X]-module de torsion et,
puisque K[X] est un anneau principal, on peut appliquer les résultats du § 4. On obtient en
particulier un isomorphisme de K[X]-modules :
E ' K[X]/(P1 ) ⊕ · · · ⊕ K[X]/(Ps )
où les Pi sont des polynômes unitaires non constants vérifiant P1 | · · · | Ps , uniquement
déterminés par E et u. C’est en particulier un isomorphisme de K-espaces vectoriels qui
correspond à une décomposition
E ' E1 ⊕ · · · ⊕ Es
en somme directe de sous-espaces vectoriels stables par u qui sont dits cycliques, c’est-à-dire
qu’il existe xi ∈ Ei (l’image de la classe de 1 par l’isomorphisme K[X]/(Pi ) ' Ei ) tel que
la famille (um (xi ))m∈N engendre le K-espace vectoriel Ei .
4. MODULES DE TYPE FINI SUR LES ANNEAUX PRINCIPAUX 61

Regardons d’un peu plus près la structure des espaces cycliques. Soit (F, v) un tel espace
et soit x un élément de F tel que la famille (v m (x))m∈N engendre F et soit
P (X) = X r + ar−1 X r−1 + · · · + a0
le polynôme unitaire qui engendre le noyau du morphisme d’anneaux
K[X] −→ F
Q 7−→ Q(v)(x).
C’est aussi le polynôme minimal de v (pourquoi ?).

Lemme 4.10. — Soit r le plus grand entier tel que la famille (x, v(x), . . . , v r−1 (x)) soit
libre. Cette famille est une base de F , qui est donc de dimension r.

Démonstration. — Il suffit de montrer que cette famille engendre F . Par définition de r, le


vecteur v r (x) est combinaison linéaire des vecteurs de cette famille et on voit facilement, par
récurrence sur m, qu’il en est de même pour tous les v m (x) pour m ≥ r.

Dans cette base, la matrice de v est la matrice compagnon de P


 
0 ··· ··· 0 −a0
1 0 · · · 0 −a1 
 
 .. .. .. .. 
C(P ) = 0
 . . . . 

. .. 
. .. ..
. . 0

. . 
0 ··· 0 1 −ar−1
(la matrice compagnon du polynôme constant 1 est vide). Le polynôme minimal de C(P ) est
P et on calcule facilement que c’est aussi son polynôme caractéristique.

Théorème 4.11. — Pour tout endomorphisme u d’un K-espace vectoriel E de dimension


finie, il existe une base de E dans laquelle la matrice de u est diagonale par blocs, de la
forme
 
C(P1 )

 C(P2 ) 


 . ..


C(Ps )
où les Pi sont des polynômes unitaires non constants de K[X] vérifiant P1 | · · · | Ps .
Les Pi sont entièrement déterminés par u ; on les appelle les invariants de similitude de u.
Deux matrices de Mn (K) sont semblables si et seulement si elles ont les mêmes invariants
de similitude (3) .

3. Bien entendu, les invariants de similitude d’une matrice sont par définition les invariants de l’endomorphisme
de K n qu’elle représente dans la base canonique.
62 CHAPITRE II. MODULES

Démonstration. — Il résulte de ce qui précède que la matrice de u dans une base convenable
est du type cherché si et seulement si le K[X]-module E est isomorphe à K[X]/(P1 ) ⊕ · · · ⊕
K[X]/(Ps ). Le théorème résulte donc du cor. 4.7.

Le polynôme minimal de u est Ps (c’est « le plus grand ») et le polynôme caractéristique


est P1 · · · Ps (puisque celui de C(Pi ) est Pi ). Le théorème permet par exemple de voir im-
médiatement que si deux matrices de Mn (K) sont semblables sur une extension de K, elles
sont déjà semblables sur K, résultat qui n’est pas du tout évident a priori (en particulier si K
est fini).

Proposition 4.12. — Soit M ∈ Mn (K) et soient P1 | · · · | Ps ses invariants de simi-


litude. La suite des n facteurs invariants (4) de la matrice XIn − M ∈ Mn (K[X]) est
(1, . . . , 1, P1 , . . . , Ps ).

Démonstration. — La matrice M est semblable à une matrice diagonale par blocs comme
dans le th. 4.11, donc la matrice XIn − M est semblable (donc aussi équivalente) à la ma-
trice diagonale par blocs du type XIdeg(Pi ) − C(Pi ). Il suffit donc de montrer que la suite
(d1 , . . . , dr ) des facteurs invariants d’une matrice XIr −C(P ) d’ordre r est (1, . . . , 1, P ). Or
on a vu lors de la preuve du th. 4.1 que d1 · · · di est le pgcd des i × i mineurs de XIr − C(P ).
Le mineur d’ordre r − 1 obtenu en effaçant la première ligne et la dernière colonne est 1. On
a donc (à association près) d1 = · · · = dr−1 = 1 et dr = dét(XIr − C(P )) = P .

En particulier, la proposition entraîne qu’étant données des matrices M et N dans Mn (K),


les matrices M et N sont semblables si et seulement si les matrices XIn − M et XIn − N
sont équivalentes, une propriété qui peut se vérifier directement « à la main » (mais ce n’est
pas facile !).
Nous nous arrêterons ici pour ce qui est de la réduction des endomorphismes, mais on
peut poursuive dans cette voie pour arriver d’une part, lorsque le polynôme caractéristique de
l’endomorphisme u est scindé, à la réduction de Jordan, d’autre part, lorsque K est parfait,
à la décomposition de Dunford u = d + n, avec d semi-simple (diagonalisable dans une
extension finie de K), n nilpotent et dn = nd.

Exercice 4.13. — Soient P et Q des polynômes. Calculer les invariants de similitude de la


matrice par blocs
!
C(P ) 0
.
0 C(Q)

4. Voir th. 4.1 pour la définition.


4. MODULES DE TYPE FINI SUR LES ANNEAUX PRINCIPAUX 63

Exercice 4.14. — Soit u un endomorphisme d’un K-espace vectoriel E de dimension finie. On


pose
Com(u) = {v ∈ End(E) | uv = vu},
P(u) = {P (u) | P ∈ K[X]} ⊆ Com(u) ⊆ End(E).
La dimension du K-espace vectoriel P(u) est le degré du polynôme minimal de u.
a) Montrer P(u) = v∈Com(u) Com(v).
T

b) Si K est infini (5) , montrer que les propriétés suivantes sont équivalentes :
(i) u est cyclique ;
(ii) le polynôme minimal de u est égal à son polynôme caractéristique ;
(iii) Com(u) = P(u) ;
(iv) E n’a qu’un nombre fini de sous-espaces vectoriels stables par u .

5. Cette hypothèse n’est pas nécessaire pour toutes les implications.


CHAPITRE III

ANNEAUX

Commençons par un peu d’histoire. On peut dire en première approximation que les débuts
de l’algèbre commutative sont dus à diverses tentatives de résoudre la conjecture de Fermat :

xn + y n + z n = 0 =⇒ xyz = 0,

pour x, y, z entiers et n ≥ 3. Il suffit de traiter les cas n = 4 (une démonstration a été laissée
par Fermat) et n = p, nombre premier impair. Des démonstrations ad hoc ont été apportées
par Euler en 1770 pour p = 3 (avec une erreur), par Legendre en 1823 pour p = 5, par Lamé
en 1839 pour p = 7, etc. Lamé annonce le 1er mars 1847 qu’il a une preuve complète, mais
Liouville trouve une faute majeure, que nous allons expliquer.
Une des idées pour attaquer le problème de Fermat (que l’on trouve déjà dans la « preuve »
d’Euler) est de transformer cette équation en
p−1
Y
−z p = (x + ζpj y),
j=0

où l’on a posé ζp = exp(2iπ/p). On obtient ainsi une équation à coefficients dans le sous-
anneau Z[ζp ] = Z + Zζp + · · · + Zζpp−1 de C engendré par ζp . Si par hasard les facteurs
du produit sont premiers entre eux deux à deux dans l’anneau Z[ζp ] (et c’est vrai lorsque p
ne divise pas xyz) et que l’on a unicité de la décomposition de z n en facteurs irréductibles
dans l’anneau Z[ζp ], on en déduit que chaque facteur x + ζpj y est une puissance p-ième dans
cet anneau. La suite n’est pas facile, mais on peut ensuite arriver à une contradiction avec un
peu de travail (essentiellement par la méthode de « descente infinie » de Fermat : on produit,
à partir d’une solution donnée, une autre solution plus petite).
Le problème majeur (à l’origine des erreurs d’Euler et de Lamé) est que l’anneau Z[ζp ]
n’est en général pas factoriel (il n’y a pas unicité de la décomposition en irréductibles) : il ne
l’est pour aucun p ≥ 23.
66 CHAPITRE III. ANNEAUX

C’est en essayant d’élargir le concept de facteur irréductible que Kummer crée celui de
nombre idéal, qui donnera plus tard lieu à la théorie actuelle des idéaux et des modules (De-
dekind). Les travaux de Kummer lui permettront de montrer le théorème de Fermat pour tous
les nombres premiers p réguliers, c’est-à-dire tels que p ne divise le dénominateur d’aucun
des nombres de Bernoulli (1) B2 , B4 , B6 , . . . , Bp−3 (on estime que la probabilité pour un
nombre premier d’être régulier est e−1/2 , soit environ 61%, même si on ne sait pas montrer
qu’il y en a une infinité !).

1. Anneaux factoriels

On formalise ici une propriété dont on a déjà montré (th. I.1.16) qu’elle est satisfaite par
l’anneau des polynômes à une indéterminée à coefficients dans un corps. On montrera plus
loin (cor. 2.14) qu’elle est en fait satisfaite par tout anneau principal.

Définition 1.1. — Un anneau A est factoriel (2) s’il est intègre et que tout élément non nul
a de A peut s’écrire
a = up1 · · · pr
avec u ∈ A∗ et p1 , . . . , pr irréductibles (3) , et que cette décomposition est unique au sens
suivant : si a = vq1 · · · qs est une autre telle décomposition, on a r = s et il existe une
permutation σ ∈ Sr telle que qi soit associé à pσ(i) pour tout i.

La plupart des anneaux intègres que l’on rencontre en algèbre ont la propriété d’existence
de la décomposition (cf. prop. 2.11) ; la propriété forte est l’unicité. On peut la reformuler
ainsi : fixons un système de représentants irréductibles P de A, c’est-à-dire un ensemble
d’éléments irréductibles tels que tout irréductible de A soit associé à un et un seul élément de
P. Alors tout élément non nul a de A s’écrit d’une manière unique
Y
a=u pnp ,
p∈P

avec u ∈ A , et où (np )p∈P est une famille presque nulle d’entiers naturels. On note alors
vp (a) := np .
Nous avons défini en § I.1.3 le pgcd de deux éléments d’un anneau principal. On peut
donner une définition analogue pour deux éléments a et b d’un anneau factoriel : si a = 0, le
pgcd a ∧ b est par définition b ; de même a ∧ 0 = a. Si ab 6= 0, on pose
Y
a∧b= pmin(vp (a),vp (b)) .
p∈P

tm
1. Ces nombres sont définis par la série génératrice et t−1 = +∞
P
m=0 Bm m! .
2. En anglais, on écrit souvent « UFD », pour « unique factorization domain ».
3. Voir § I.1.2 pour la définition.
1. ANNEAUX FACTORIELS 67

Cette définition dépend du choix de P ; on peut aussi déclarer que a ∧ b est bien défini à
association près. Dans tous les cas, le pgcd a ∧ b est alors un diviseur commun de a et b, et
tout diviseur commun à a et b divise a ∧ b.
On a une discussion analogue pour le ppcm, qui est laissée au lecteur en exercice. On
peut aussi parler du pgcd et du ppcm d’une famille finie quelconque d’éléments d’un anneau
factoriel.
Exemple 1.2. — L’anneau Z est factoriel (prendre pour P l’ensemble des nombres pre-
miers (positifs)). Si K est un corps, l’anneau K[X] est factoriel (prendre pour P l’ensemble
des polynômes irréductibles unitaires).

La proposition suivante donne un critère pour qu’un anneau soit factoriel quand on connaît
déjà l’existence de la décomposition en irréductibles.
Proposition 1.3. — Soit A un anneau intègre tel que tout élément non nul de A soit produit
d’irréductibles. Les propriétés suivantes sont équivalentes :
(i) A est factoriel ;
(ii) pour tout élément irréductible p de A, l’idéal (p) est premier (4) ;
(iii) pour tous éléments non nuls a, b et c de A tels que a divise bc mais est premier avec b,
a divise c.

Démonstration. — Montrons que (iii) implique (ii). Si p irréductible divise ab et ne divise


pas a, alors p est premier avec a puisque p est irréductible, de sorte que p divise b d’après
(iii). Ainsi l’idéal (p) est premier.
Montrons que (ii) implique (i). Soit P un système de représentants irréductibles. Si
Y Y
u pmp = v p np
p∈P p∈P

sont deux décompositions d’un élément non nul de A, la condition mq > nq pour un certain
q ∈ P implique, par intégrité de A, que q divise v p∈P, p6=q pnp , donc l’un des facteurs
Q

d’après (ii). Mais q ne peut diviser un élément p de P distinct de q car P est un système de
représentants irréductibles. Ainsi mp = np pour tout p ∈ P, puis u = v par intégrité de A.
Montrons que (i) implique (iii). On écrit ad = bc et on décompose les éléments non nuls
a, b, c et d comme ci-dessus. Alors pour tout p ∈ P, on a (par unicité de la décomposition)
vp (b)+vp (c) = vp (a)+vp (d) ≥ vp (a). Si vp (b) = 0, on a donc vp (a) ≤ vp (c). Si vp (b) > 0,
on a vp (a) = 0 (car a est premier avec b) donc vp (a) ≤ vp (c). Ainsi a divise c.

Exemple 1.4. — L’anneau Z[ −5] = Z[X]/(X 2 + 5) est intègre mais n’est pas factoriel :
3 est irréductible mais l’idéal (3) n’est pas premier (cf. ex. I.1.9).

4. Autrement dit, si a et b sont des éléments de A et que p divise ab, alors p divise a ou p divise b.
68 CHAPITRE III. ANNEAUX

Exercice 1.5. — Soit K un corps. Montrer que le sous-anneau K[X 2 , X 3 ] de K[X] engendré
par X 2 et X 3 n’est pas factoriel.

Exercice 1.6. — Soit A un anneau factoriel tel que tout idéal premier non nul est maximal (on
dit que la dimension de Krull de A est 1 ; cf. § 5.4). On se propose de montrer que A est principal.
a) Montrer que pour tout x et tout y non nuls dans A, il existe u et v dans A tels que ux +
vy = x ∧ y.
b) Soit I un idéal non nul de A. Montrer qu’il existe d ∈ A non nul qui est un pgcd de tous
les éléments de I ∩ (A {0}). Conclure.

Définition 1.7. — Soit A un anneau factoriel. Le contenu, noté c(P ), d’un polynôme P ∈
A[X] est le pgcd de ses coefficients. Le polynôme P est dit primitif si c(P ) = 1.

On notera que le contenu est défini à multiplication par une unité de A près. Le contenu
d’un polynôme est nul si et seulement si le polynôme est nul.
Lemme 1.8 (Gauss). — Soit A un anneau factoriel. Pour tous polynômes P et Q dans A[X],
on a c(P Q) = c(P )c(Q) (modulo A∗ ).

Démonstration. — Supposons d’abord P et Q primitifs et montrons que P Q est primitif.


Soit p un irréductible de A. Comme P et Q sont primitifs, chacun a au moins un coefficient
non divisible par p. Soit ai (resp. bj ) le coefficient de P (resp. de Q) d’indice minimal non
divisible par p. Alors le coefficient d’indice i + j de P Q est somme de termes divisibles par
p et de ai bj donc il n’est pas divisible par p car (p) est premier vu que A est factoriel. Ceci
montre qu’aucun élément irréductible de A ne divise tous les coefficients de P Q, qui est donc
primitif.
Le cas général s’en déduit : si P ou Q est nul, il est évident ; sinon, on applique le résultat
précédent à P/c(P ) et Q/c(Q).

On en déduit le résultat suivant, utilisé lors de la démonstration du théorème de Lüroth (th.


I.6.9).
Lemme 1.9. — Soit A un anneau factoriel de corps des fractions K. Soient P et Q des
éléments de A[X], avec P primitif, et soit R ∈ K[X] tel que Q = P R. Alors R ∈ A[X].

Démonstration. — On peut écrire R = R1 /r, avec r ∈ A et R1 ∈ A[X]. On a alors


rQ = P R1 , puis rc(Q) = c(P )c(R1 ) = c(R1 ) (modulo A∗ ) par le lemme de Gauss, de
sorte que r divise c(R1 ), donc aussi R1 , ce qui termine la démonstration.

On a aussi l’important résultat suivant.


Théorème 1.10. — Soit A un anneau factoriel de corps des fractions K. Les éléments irré-
ductibles de A[X] sont :
a) les polynômes constants p avec p irréductible dans A ;
1. ANNEAUX FACTORIELS 69

b) les polynômes primitifs de degré ≥ 1 qui sont irréductibles dans K[X].

En particulier, pour un polynôme primitif de A[X], il revient au même d’être irréductible


dans A[X] et dans l’anneau principal K[X] (ce qui n’est pas du tout évident vu qu’il y a a
priori plus de décompositions possibles dans K[X]).

Démonstration. — Comme (A[X])∗ = A∗ il est clair qu’un polynôme constant p est irré-
ductible si et seulement si p est irréductible dans A.
Soit maintenant P un polynôme primitif de degré ≥ 1 de A[X] qui est irréductible dans
K[X]. Toute écriture P = QR avec Q et R dans A[X] implique avec le lemme de Gauss que
c(Q) et c(R) sont inversibles. Comme d’autre part l’un des polynômes Q ou R est constant
(parce que P est irréductible dans K[X]), c’est une constante inversible dans A. Donc P , qui
n’est pas inversible dans A[X] car de degré au moins 1, est bien irréductible dans A[X].
Il reste à montrer qu’un polynôme P de degré ≥ 1 qui est irréductible dans A[X] est
primitif et irréductible dans K[X]. Le fait que P soit primitif résulte de ce que c(P ) divise
P dans A[X] et ne lui est pas associé pour raison de degré. Il reste à montrer que P (qui
n’est pas inversible dans K[X]) est irréductible dans K[X]. Or si P = QR dans K[X],
on peut écrire Q = Q1 /q et R = R1 /r avec q et r dans A et Q1 et R1 dans A[X]. On
obtient qrP = Q1 R1 et, en passant aux contenus (lemme de Gauss), qr = c(Q1 )c(R1 ).
Ainsi P = P1 Q1 /qr = (P1 /c(P1 ))(Q1 /c(Q1 )) (modulo A∗ ). Comme P est irréductible
dans A[X], l’un des polynômes P1 ou Q1 de A[X] est constant, et l’un des polynômes Q ou
R est constant, ce qui achève la preuve.

On a enfin le théorème fondamental suivant.

Théorème 1.11. — Soit A un anneau factoriel. Les anneaux A[X1 , . . . , Xn ] sont factoriels
pour tout n ∈ N.

La conclusion reste vraie avec un nombre infini d’indéterminées (cela découle du cas fini).

Démonstration. — Il suffit de montrer que A[X] est factoriel. Montrerons d’abord l’exis-
tence de la décomposition en produit d’irréductibles d’un polynôme P non nul. Quitte à
écrire P = c(P )(P/c(P )) et à décomposer c(P ) en produit d’irréductibles dans A, on se
ramène à P primitif non constant.
On décompose alors P en produit d’irréductibles dans l’anneau principal K[X] soit, en
chassant les dénominateurs, aP = P1 · · · Pr avec a ∈ A et Pi ∈ A[X] irréductible dans
K[X]. Écrivons Pi = c(Pi )Qi , avec Qi primitif, donc irréductible dans A[X] d’après le
théorème précédent. En passant aux contenus, on obtient qu’il existe u ∈ A∗ tel que ua =
Qr
c(P1 ) · · · c(Pr ), et P = u i=1 Qi est une décomposition de P en produits d’irréductibles
de A[X].
70 CHAPITRE III. ANNEAUX

Il suffit donc d’après la prop. 1.3 de montrer que si P ∈ A[X] est irréductible, l’idéal (P )
est premier. Si P est une constante irréductible p de A[X], c’est clair (par vérification directe,
ou encore en remarquant que A[X]/(p) est isomorphe à (A/(p))[X], qui est intègre vu que
(p) est premier dans A). Supposons maintenant P primitif de degré au moins 1, irréductible
dans K[X] d’après le théorème précédent. Si P divise le produit QR de deux polynômes de
A[X], il divise alors Q ou R dans l’anneau principal K[X] (prop. I.1.15), disons par exemple
Q. Comme P est primitif, par le lemme 1.9, le quotient Q/P est dans A[X], de sorte que P
divise Q dans A[X]. C’est ce que l’on voulait montrer.

Théorème 1.12 (Critère d’Eisenstein). — Soit A un anneau factoriel, soit P (X) =


Pn k
k=0 ak X un polynôme non constant à coefficients dans A et soit p un élément irréductible
de A. On suppose :
• p ne divise pas an ;
• p divise ak pour chaque k ∈ {0, . . . , n − 1} ;
• p2 ne divise pas a0 .
Alors P est irréductible dans K[X] (donc aussi dans A[X] s’il est primitif).

Démonstration. — Notons que P/c(P ) vérifie les mêmes hypothèses que P vu que c(P )
n’est pas divisible par p par le premier point. On peut donc supposer P primitif. Si P n’est
pas irréductible, il s’écrit (d’après le th. 1.10) P = QR avec Q et R non constants dans A[X].
Posons Q = br X r + · · · + b0 et R = cs X s + · · · + c0 . L’anneau B = A/(p) est intègre, et,
comme on l’a remarqué dans la démonstration plus haut, A[X]/(p) est isomorphe à B[X].
Dans cet anneau, on a ān X n = Q̄R̄. D’autre part, ān 6= 0 dans B, donc b̄r et c̄s sont aussi
non nuls. Ainsi Q et R ne sont pas constants et l’égalité ān X n = Q̄R̄ dans l’anneau factoriel
KB [X] (th. I.1.16) implique alors, comme X y est irréductible, que Q̄ et R̄ sont divisibles
des puissances de X dans KB [X]. Cela signifie que p divise b0 et c0 , ce qui contredit le fait
que a0 n’est pas divisible par p2 .

Par exemple X 18 − 4X 7 − 2 est irréductible dans Q[X], et X 5 − XY 3 − Y est irréductible


dans C[X, Y ] (prendre A = C[Y ] et p = Y ).

Exercice 1.13. — Montrer que si p est un nombre premier, le polynôme cyclotomique Φp (X) =
p
−1
X p−1 + · · · + X + 1 = XX−1 est irréductible dans Q[X] (on pourra poser X = Y + 1).

2. Anneaux noethériens

Les anneaux principaux sont agréables, mais ils sont très rares en algèbre. En affaiblissant
un peu les hypothèses (propriété (i) ci-dessous), on tombe sur une classe d’anneaux absolu-
ment fondamentale.
2. ANNEAUX NOETHÉRIENS 71

Proposition 2.1. — Soit A un anneau commutatif. Les trois propriétés suivantes sont équi-
valentes :
(i) tout idéal de A est engendré par un nombre fini d’éléments ;
(ii) toute suite croissante (pour l’inclusion) d’idéaux de A est stationnaire ;
(iii) toute famille non vide d’idéaux de A a un élément maximal pour l’inclusion.
On dira que l’anneau A est noethérien s’il vérifie ces propriétés.

Démonstration. — Montrons que (i) implique (ii). Soit (In ) une telle suite ; la réunion I des
In est encore un idéal car la famille (In ) est totalement ordonnée pour l’inclusion. Par (i), il
existe des éléments x1 , . . . , xr de I qui l’engendrent. Chaque xi est dans l’un des In , donc
il existe n0 (le plus grand des indices correspondants) tel que In0 les contienne tous. Alors
I = In0 et la suite (In ) stationne à In0 .
Montrons que (ii) implique (iii). Si une famille non vide d’idéaux de A n’a pas d’élément
maximal, on construit par récurrence une suite infinie strictement croissante d’idéaux de A,
ce qui contredit (ii).
Montrons que (iii) implique (i). Soit I un idéal de A. La famille E des idéaux J ⊆ I
qui sont engendrés par un nombre fini d’éléments est non vide (elle contient l’idéal (0)).
Soit J0 un élément maximal de E . Pour tout x ∈ I, l’idéal J0 + xA est aussi dans E , donc
J0 + xA = J0 par maximalité. Ceci signifie x ∈ J0 . Finalement I = J0 et I est engendré
par un nombre fini d’éléments.

Tout anneau principal est noethérien ((i) est trivialement vérifié). Si A est noethérien,
tout quotient de A l’est encore (c’est immédiat à partir de la caractérisation (ii), vu que les
idéaux de A/I sont les idéaux de A contenant I)). En revanche, un sous-anneau d’un anneau
noethérien n’est pas nécessairement noethérien (cf. exerc. 2.6).
Si K est un corps, l’anneau K[(Xn )n∈N ] n’est pas noethérien car
(X0 ) ⊆ (X0 , X1 ) ⊆ · · · ⊆ (X0 , . . . , Xn ) ⊆ · · ·
forme une suite infinie strictement croissante d’idéaux.
Exercice 2.2. — Soit A un anneau tel que tout idéal premier de A est engendré par un nombre
fini d’éléments. Montrer que A est noethérien (Indication : on pourra considérer un élément
maximal I dans la famille des idéaux qui ne sont pas engendrés par un nombre fini d’éléments,
des éléments x et y de A I tels que xy ∈ I, et les idéaux I + (y) et {a ∈ A | ay ∈ I}).

Exercice 2.3. — Soit A un anneau noethérien et soit M un A-module de type fini.


a) Montrer que tout sous-A-module de M est encore de type fini (Indication : on pourra se ramener
à M = An , puis procéder par récurrence sur n en utilisant l’exerc. II.3.1).
b) Montrer que toute suite croissante de sous-A-modules de M est stationnaire (Indication : on
pourra se ramener à M = An , puis procéder par récurrence sur n).
72 CHAPITRE III. ANNEAUX

La plupart des anneaux avec lesquels on travaille en algèbre sont noethériens, via le théo-
rème et le corollaire suivants.
Théorème 2.4 (Hilbert). — Soit A un anneau noethérien. Les anneaux A[X1 , . . . , Xn ] sont
noethériens pour tout n ∈ N.

Démonstration. — Il suffit de montrer que A[X] est noethérien. Soit I un idéal de A[X].
Pour chaque k ∈ N, on note Dk (I) le sous-ensemble de A constitué de 0 et des coefficients
dominants des polynômes de degré k de I. Il est immédiat que Dk (I) est un idéal de A, et
qu’une inclusion I ⊆ J entraîne Dk (I) ⊆ Dk (J). On a d’autre part les deux propriétés
suivantes :
a) pour tout k ∈ N, on a Dk (I) ⊆ Dk+1 (I) : il suffit de remarquer que si P ∈ I, alors
XP ∈ I ;
b) si I ⊆ J, le fait que Dk (I) = Dk (J) pour tout k ∈ N entraîne I = J : si I 6= J, on
choisit un polynôme P ∈ J I de degré r minimal ; comme Dr (I) = Dr (J), l’idéal I
contient un polynôme Q de degré r qui a même coefficient dominant que P , mais alors
P − Q est dans J I et est de degré < r, contradiction.
Ceci dit, soit (In )n∈N une suite croissante d’idéaux de A[X]. Comme A est noethérien, la
famille des Dk (In ) pour k ∈ N et n ∈ N admet un élément maximal Dl (Im ). D’autre part,
pour chaque k ≤ l, la suite d’idéaux (Dk (In ))n∈N est croissante, donc elle est stationnaire,
c’est-à-dire qu’il existe nk tel que pour
∀n ≥ nk Dk (In ) = Dk (Ink ).
Soit alors N le plus grand des entiers m, n0 , n1 , . . . , nl . Nous allons montrer que pour tout
n ≥ N et tout k, on a Dk (In ) = Dk (IN ), ce qui suffira à conclure In = IN via la propriété
b) ci-dessus. On distingue deux cas :
1) si k ≤ l, on a Dk (IN ) = Dk (Ink ) = Dk (In ) par définition de nk puisque n et N sont
tous deux ≥ nk ;
2) si k > l, on a Dk (IN ) ⊇ Dl (IN ) ⊇ Dl (Im ) (d’après la propriété a) ci-dessus, et
puisque N ≥ m) et Dk (In ) ⊇ Dl (In ) ⊇ Dl (Im ) pour les mêmes raisons, donc par maxima-
lité de Dl (Im ), on a Dk (IN ) = Dl (Im ) = Dk (In ).
Corollaire 2.5. — Soit A un anneau noethérien. Toute A-algèbre de type fini est noethé-
rienne.

Démonstration. — Par définition, une A-algèbre engendrée par des éléments x1 , . . . , xn est
un quotient de l’anneau A[X1 , . . . , Xn ], qui est noethérien par le th. 2.4. C’est donc un anneau
noethérien.

L’anneau de séries formelles A[[X]] est noethérien, mais n’est jamais une A-algèbre de
type fini (lorsque A est non nul ! Cf. cor. 10.8).
2. ANNEAUX NOETHÉRIENS 73

Exercice 2.6. — Soit K un corps. Montrer que le sous-anneau de K[X, Y ] engendré par les
X n Y , pour n ∈ N∗ , n’est pas noethérien.

Corollaire 2.7. — Soit A un anneau noethérien et soit I un idéal de A. Pour tout x ∈


T∞ n
n=1 I , on a x ∈ xI.

Démonstration. — Soient a1 , . . . , ar des éléments de A qui engendrent l’idéal I. Pour cha-


que n ≥ 1, on a x ∈ I n donc il existe un polynôme Pn ∈ A[X1 , . . . , Xr ] homogène de degré
n tel que x = Pn (a1 , . . . , ar ). Soit Jn l’idéal de A[X1 , . . . , Xr ] engendré par P1 , . . . , Pn .
On a bien sûr Jn ⊆ Jn+1 . Comme l’anneau A[X1 , . . . , Xr ] est noethérien (th. 2.4), il existe
un entier N > 0 tel que JN = JN +1 . On peut donc écrire
PN +1 = Q1 PN + · · · + QN P1 ,
où Qi ∈ A[X1 , . . . , Xr ] est homogène de degré i. En substituant aj à Xj , on obtient
x = Q1 (a1 , . . . , ar )x + · · · + QN (a1 , . . . , ar )x,
ce qui, puisque chaque Qi est homogène de degré strictement positif, prouve le théorème.

Corollaire 2.8 (Krull). — Soit A un anneau noethérien et soit I un idéal de A. On suppose


qu’au moins l’une des deux conditions suivantes est vérifiée :
• l’anneau A est intègre et I 6= A ;
• I ⊆ rad(A).
T∞
Alors n=1 I n = 0.

On rappelle (§ II.3) que le radical de Jacobson rad(A) de A est défini comme l’intersection
de ses idéaux maximaux. En particulier, le corollaire entraîne que si A a un unique idéal
T∞
maximal m (on dit que A est un anneau local) et est noethérien, n=1 mn = 0.
T∞
Démonstration. — Soit x un élément de n=1 I n . Le cor. 2.7 entraîne l’existence d’un élé-
ment a de I tel que x = xa. Sous la première hypothèse, on a a 6= 1 (puisque I 6= A), donc
x = 0. Sous la seconde hypothèse, on a a ∈ rad(A), donc 1 − a inversible (lemme II.3.7), et
de nouveau x = 0.

Exercice 2.9. — Dans l’anneau des fonctions de classe C ∞ de R dans R (cf. exerc. I.1.6 et
I.1.12), on note I l’idéal maximal des fonctions nulles en 0. Produire un élément non nul de
T∞ n
n=1 I .

Remarque 2.10 (Topologie I-adique). — Soit I un idéal d’un anneau A. On peut munir A
de la topologie pour laquelle les a+I n , n ∈ N∗ , forment une base de voisinages ouverts d’un
point quelconque a de A. On l’appelle la topologie I-adique (cette construction généralise la
topologie p-adique sur Z, qui est la topologie associée à l’idéal (p)). Si I = A (resp. I = 0),
la topologie I-adique est la topologie grossière (resp. discrète).
74 CHAPITRE III. ANNEAUX

Les opérations d’anneau sont continues pour cette topologie. Elle est séparée si et seule-
T∞
ment si n=1 I n = 0. Le résultat de Krull donne donc des conditions suffisantes pour que
cette propriété soit satisfaite. Dans ce cas, la topologie I-adique est métrisable (par une dis-
tance ultramétrique) et l’on construit le complété I-adique A b de A de la façon habituelle via
les suites de Cauchy. C’est un anneau topologique que l’on peut aussi voir comme la limite
projective limn (A/I n ) ; il est muni d’un morphisme d’anneaux A → A b qui est injectif et
←−
continu et dont l’image est dense. Par exemple, si A = Z et I = (p) (p nombre premier), le
complété I-adique de Z est l’anneau des entiers p-adiques Zp . Si A = B[X] (B anneau) et
I = (X), le complété I-adique de A est l’anneau des séries formelles B[[X]].
Toutes ces constructions s’étendent au cas d’un A-module (voir [M], § 8).
Proposition 2.11. — Soit A un anneau intègre noethérien. Tout élément non nul de A peut
s’écrire up1 · · · pr avec u ∈ A∗ et p1 , . . . , pr irréductibles.

Démonstration. — Soit F l’ensemble des idéaux de A de la forme (x), avec x non inversible
ne s’écrivant pas comme demandé. Si F n’est pas vide, il admet un élément maximal (a).
En particulier a n’est alors pas irréductible. Comme il n’est pas inversible, il s’écrit a = bc
avec b et c non associés à a. Mais alors les idéaux (b) et (c) contiennent strictement (a),
donc par maximalité, ils ne sont pas dans F , de sorte que b et c se décomposent en produit
d’irréductibles, ce qui contredit le fait que a ne s’écrit pas comme produit d’irréductibles.

On déduit alors de la prop. 1.3 les deux corollaires suivants.


Corollaire 2.12. — Un anneau intègre noethérien est factoriel si et seulement si tout élément
irréductible engendre un idéal premier.
Remarque 2.13. — Il existe des anneaux factoriels non noethériens (cf. R. Gilmer, A two-
dimensional non-noetherian factorial ring, Proc. Amer. Math. Soc. 44 (1974), 25–30).
Corollaire 2.14. — Tout anneau principal est factoriel.
Exercice 2.15. — Montrer que tout endomorphisme surjectif d’un anneau noethérien est bi-
jectif. Donner un exemple d’un tel endomorphisme injectif mais non surjectif. Montrer que le
résultat ne subsiste pas en général pour des anneaux non noethériens.

Exercice 2.16. — Soit Z̄ l’anneau des entiers algébriques (c’est-à-dire l’ensemble des nombres
complexes qui sont racines d’un polynôme unitaire à coefficients dans Z ; cf. § 8, en particulier le
cor. 8.7, où l’on montre que c’est bien un anneau). Montrer que Z̄ est un anneau intègre qui n’est
pas noethérien (Indication : on pourra considérer l’idéal de Z̄ engendré par les 21/n , pour n ∈
N∗ ). On peut montrer que tout idéal de Z̄ engendré par un nombre fini d’éléments est principal
(on dit que c’est un « anneau de Bézout »), mais je ne connais pas de preuve « élémentaire ».

Exercice 2.17. — Soit X ⊆ R un compact. On définit comme dans l’exerc. I.1.6 l’anneau CX
des fonctions continues de X dans R et ses idéaux maximaux
Ix = {f ∈ CX | f (x) = 0},
3. RADICAL D’UN IDÉAL 75

pour chaque x ∈ X.
a) Montrer que les conditions suivantes sont équivalentes :
(i) l’idéal Ix est engendré par un nombre fini d’éléments ;
(ii) l’idéal Ix est principal ;
(iii) le point x est isolé dans X.
b) Montrer que les conditions suivantes sont équivalentes :
(i) l’anneau CX est noethérien ;
(ii) le R-espace vectoriel CX est de dimension finie ;
(iii) X est fini.

Exercice 2.18. — On dit qu’un anneau A est artinien si toute suite décroissante (pour l’inclu-
sion) d’idéaux de A est stationnaire.
a) Si A est artinien et I un idéal de A, montrer que l’anneau A/I est artinien.
b) Montrer qu’un anneau artinien intègre est un corps (Indication : si x ∈ A {0}, considérer
la suite d’idéaux ((xn ))n≥1 ).
c) Dans un anneau artinien, montrer que les idéaux premiers sont maximaux (Indication :
utiliser a) et b)).
d) Montrer qu’un anneau artinien n’a qu’un nombre fini d’idéaux premiers (Indication : si
(mn )n≥1 est une suite d’idéaux maximaux distincts, on pourra considérer la suite d’idéaux
(m1 · · · mn )n≥1 ).
On peut montrer qu’un anneau est artinien si et seulement s’il est noethérien et que tous ses
idéaux premiers sont maximaux ([P], th. 4.9).

3. Radical d’un idéal

Définition 3.1. — Soit I un idéal de A. On pose



I := {a ∈ A | ∃m ∈ N∗ am ∈ I}.
C’est√un idéal de A contenant I, que l’on appelle radical de I. On dit que I est radical si
I = I.

Tout idéal premier est bien sûr radical. Le fait que I est bien un idéal de A est démontré
dans le lemme suivant.

Lemme 3.2. — Pour tous idéaux I et J de A, on a :



a) I est le plus petit idéal radical de A contenant I ;

b) I est l’intersection des idéaux premiers contenant I ;
√ √ √ √
c) IJ = I ∩ J = I ∩ J.
√ p√ √
d) I + J = I + J.
76 CHAPITRE III. ANNEAUX

√ m m m m
Démonstration.
√ √ Si a ∈ n I, avec a ∈ I, et x ∈ A, on a (xa) = x a ∈ I donc

xa ∈ I. Si b ∈ I, avec b ∈ I, on a
m+n
X m + n
(a + b)m+n = ai bm+n−i
i=0
i

par la formule du binôme, donc a + b ∈ I, puisque soit i ≥ m, soit m + n p − i ≥ n. Cela


√ √
montre que I est un√idéal (contenant I). Montrons qu’il est radical. Si a ∈ I, il existe

m mn m n
m ≥ 1 tel que a ∈ I, puis n ≥ 1 tel que a √= (a ) ∈ √ I, de sorte que a ∈ I. Enfin,
si J est un idéal radical contenant I, l’idéal J = J contient I. Ceci montre a).
√ √
√ Montrons b). Si p est un idéal premier contenant I, on a p = p ⊇ I. On a donc
T
I ⊆ I⊆p⊆A p.

Inversement, supposons a ∈ / I et considérons l’ensemble E , ordonné par l’inclusion,
des idéaux de A contenant I mais ne contenant aucun des am pour m ≥ 1. Il est non vide car
contient I et toute famille non vide admet une borne supérieure (la réunion). Le lemme de
Zorn entraîne qu’il existe un élément maximal J ∈ E . Montrons que J est un idéal premier.
Si x et y ne sont pas dans J, on a J + Ax ∈ / E , donc il existe m ≥ 1 avec am ∈ J + Ax. De
même, il existe n ≥ 1 avec an ∈ J + Ay. On a alors am+n ∈ J + Axy, donc J + Axy ∈ /E
T
et xy ∈/ J. Comme a ∈ / J, on a donc montré a ∈ / I⊆p⊆A p, d’où b).
√ √ √ √
Pour le point
√ c), √les inclusions IJ ⊆ I ∩ J ⊆ I ∩ J sont évidentes. m Soit a un
élément de I ∩ J, et soient m et n des entiers strictement √ positifs tels que a ∈ I et
an ∈ J. On a am+n = am an , qui est dans IJ, donc a ∈ IJ.
√ p√ √
p√ le√point d), l’inclusion I + J ⊆
En ce qui concerne I + J est claire. Soit donc a
un élément de I + J et soit n un entier strictement positif tels que an = b + c, avec
r s
b ∈ I et c ∈ J. On écrit
r+s  
n(r+s)
X r + s i r+s−i
a = bc
i=0
i

qui est dans J + I, puisque soit i ≥ r, soit r + s − i ≥ s. On a donc bien a ∈ I + J, ce qui
prouve d).

√ n 3.3. — Soit I un idéal d’un anneau noethérien A. Montrer qu’il existe n ∈ N tel que
Exercice
( I) ⊆ I. Montrer par un exemple qu’il ne suffit pas que I soit engendré par un nombre fini
d’éléments.

Exercice 3.4. — Soit C l’anneau des fonctions continues de [0, 1] dans R (cf. exerc. I.1.6). On
pose
I = {f ∈ C | ∀m ∈ N lim f (x)/xm = 0}.
x→0

Montrer que I est un idéal radical de C . En déduire qu’il existe dans C des idéaux premiers non
maximaux.
4. DÉCOMPOSITION PRIMAIRE 77

4. Décomposition primaire

Une fois qu’il est apparu que l’unicité de la décomposition en irréductibles n’était plus

vraie dans des anneaux pourtant très simples (comme Z[ −5] ; cf. ex. 1.4), il a fallu chercher
un substitut valable dans un cadre suffisamment général. C’est cette recherche qui a mené à
la « décomposition primaire » des idéaux (en fait, plus généralement, des modules) dans les
anneaux noethériens. La première formulation en revient à Lasker (1905, champion du monde
d’échecs et joueur de go), qui ne prouve cependant son existence que dans certains anneaux,
avec des méthodes très compliquées. C’est à Emmy Noether (1921) que l’on doit la théorie
actuelle qui déduit tout de la seule propriété que l’on appelle maintenant « noethérianité » en
son honneur.
La première piste (explorée par Dedekind) est de convertir la décomposition d’un élément
a non nul d’un anneau factoriel A en produits d’irréductibles en la décomposition d’un idéal
non nul en produit d’idéaux premiers. Plus précisément, si on a

a = upv11 · · · pvnn ,

avec u ∈ A∗ et p1 , . . . , pn irréductibles distincts, on a aussi

(4) (a) = (pv11 · · · pvnn ) = (pv11 ) · · · (pvnn ) = (p1 )v1 · · · (pn )vn = (p1 ) · · · (pr ),

où l’on a autorisé des répétitions dans la dernière écriture. De plus, on vérifie immédiatement
que cette dernière décomposition est unique dans le sens où si

(a) = (q1 ) · · · (qs ),

où les idéaux (qi ) sont premiers, alors r = s et il existe une permutation σ de {1, . . . , r} telle
que (qi ) = (pσ(i) ) pour tout i.
Cette « généralisation » paraît toute bête, mais il existe déjà beaucoup plus d’anneaux qui
ont cette propriété de factorisation unique des idéaux non nuls (cf. § 16). Ceux qui ne sont
pas des corps sont appelés anneaux de Dedekind et peuvent être aussi caractérisés (c’est
comme cela que nous les définirons dans le § 16) comme les anneaux noethériens intégres de
dimension 1 (c’est-à-dire pour lesquels tout idéal premier non nul est maximal) intégralement
clos (cf. § 5.4). Tous les anneaux d’entiers de corps de nombres (cf. § 8), dont la plupart
ne sont pas factoriels, sont des anneaux de Dedekind (§ 8.2). Mais il reste encore des tas
d’anneaux très simples qui n’ont pas cette propriété.

Exercice 4.1. — On a remarqué dans l’ex. 1.4 que les factorisations


√ √
2 · 3 = (1 + −5)(1 − −5)
78 CHAPITRE III. ANNEAUX


dans l’anneau Z[ −5] prouvent que celui-ci n’est pas factoriel (mais c’est un anneau de Dede-

kind, car c’est l’anneau des entiers de Q[ −5] ; cf. exerc. 8.20). Montrer que l’on a les décom-
positions suivantes en produits d’idéaux premiers :

(2) = (2, 1 + −5)2 ,
√ √
(3) = (3, 1 + −5) · (3, 1 − −5),
√ √ √
(1 ± −5) = (2, 1 ± −5) · (3, 1 ± −5).

Exercice 4.2. — Nous montrons dans cet exercice que l’anneau intègre Z[ 5] n’a pas la pro-
priété de factorisation unique des idéaux : ce n’est pas un anneau de Dedekind (en revanche,
√ √
Z[(1 + 5)/2] en est un : c’est l’anneau des entiers de Q[ 5] ; cf. exerc. 8.20).
√ √
a) Montrer que l’idéal m := (2, 1 − 5) de Z[ 5] est maximal (on pourra montrer que
√ √
l’anneau quotient Z[ 5]/m a deux éléments) et que c’est le seul idéal premier de Z[ 5]

qui contient l’idéal I = (2) de Z[ 5].
b) Montrer m2 ( I ( m. En déduire que I ne peut s’écrire comme produit d’idéaux premiers

de Z[ 5].

Exercice 4.3. — Soit I un idéal d’un anneau noethérien A. Si {0} ( I ( A, montrer qu’il
existe un entier n > 0, des idéaux premiers p1 , . . . , pn de A et des entiers strictement positifs
r1 , . . . , rn tels que
pr11 · · · prnn ⊆ I ⊆ p1 ∩ · · · ∩ pn .

(On pourra considérer un élément maximal dans l’ensemble des idéaux de A qui ne satisfont pas
cette propriété.)

Pour aller plus loin, réécrivons la décomposition (4) encore d’une autre façon, en utilisant
le lemme suivant.

Lemme 4.4. — Soient I1 , . . . , In des idéaux d’un anneau A tels que Ii + Ij = A pour tout
1 ≤ i < j ≤ n. Alors
I1 · · · In = I1 ∩ · · · ∩ In .

Démonstration. — On a toujours I1 · · · In ⊆ I1 ∩ · · · ∩ In . Pour montrer l’autre inclusion,


on procède par récurrence sur n, en commençant par le cas n = 2. On peut écrire 1 = a1 +a2 ,
avec aj ∈ Ij . Si a ∈ I1 ∩ I2 , on écrit a = a(a1 + a2 ) = aa1 + aa2 , égalité dans laquelle
aa1 ∈ I1 I2 (puisque a ∈ I2 ) et aa2 ∈ I1 I2 (puisque a ∈ I1 ). On a donc montré a ∈ I1 I2 .
Pour faire le pas de récurrence, il suffit de montrer que l’on peut appliquer l’hypothèse
de récurrence aux idéaux I1 I2 , I3 , . . . , Ir , donc que l’on a I1 I2 + Ij = A pour 3 ≤ j ≤ n.
Écrivons de nouveau 1 = a1 + aj = a2 + bj avec ai dans Ii et bj dans Ij . On en déduit
1 = (a1 + aj )(a2 + bj ) = a1 a2 + a1 bj + aj a2 + aj bj , où a1 a2 ∈ I1 I2 et les trois autres
termes sont dans Ij . On a donc bien montré I1 I2 + Ij = A, et le lemme.
4. DÉCOMPOSITION PRIMAIRE 79

Soit A un anneau qui a la propriété de factorisation unique des idéaux non nuls (c’est-à-
dire un anneau de Dedekind ; cf. § 16) et soit I un idéal non nul A. On peut l’écrire
I = pv11 · · · pvnn ,
où les idéaux p1 , . . . , pn sont premiers non nuls (donc maximaux) distincts. Posons qi = pvi i ,

de sorte que pi = qi (lemme 3.2.c)). Pour 1 ≤ i < j ≤ n, on a en particulier pi + pj = A,
ce qui entraîne (lemme 3.2.d))
p p
qi + qj = pi + pj = A,
soit encore qi + qj = A. Le lemme 4.4 entraîne alors
I = q1 ∩ · · · ∩ qn .
C’est un exemple de décomposition primaire de l’idéal I, et c’est ce genre de décomposition
que l’on va étendre à tous les anneaux noethériens. Les puissances d’idéaux premiers y seront
remplacées par les idéaux primaires, que nous allons maintenant définir.
Exercice 4.5 (Lemme d’évitement). — Soit A un anneau. Montrer que tout idéal de A contenu
dans une réunion finie d’idéaux premiers de A est contenu dans l’un d’eux (Indication : on pourra
procéder par récurrence sur le nombre d’idéaux premiers).

Exercice 4.6 (Théorème des restes chinois). — Soient I1 , . . . , In des idéaux d’un anneau A
tels que Ii + Ij = A pour tout 1 ≤ i < j ≤ n. Montrer que le morphisme injectif naturel
A/(I1 ∩ · · · ∩ In ) → (A/I1 ) × · · · × (A/In )
est bijectif.

4.1. Idéaux primaires, idéaux irréductibles. —

Définition 4.7. — Soit I un idéal d’un anneau A.


a) L’idéal I est primaire si

∀a, b ∈ A (ab ∈ I et a ∈
/ I) ⇒ b ∈ I.

b) L’idéal I est irréductible si, pour tous idéaux I1 et I2 de A tels que I = I1 ∩ I2 , on a


I = I1 ou I = I2 .

Un idéal premier est bien sûr primaire ! Mais une puissance d’un idéal premier n’est pas
nécessairement primaire (exerc. 4.8) et un idéal primaire n’est pas non plus en général une
puissance d’un idéal premier (exerc. 4.9 et 4.10). Dans les anneaux principaux, la situation
est plus simple (cf. exerc. 4.11).
La terminologie de b) n’est pas excellente : si I = (a) est un idéal principal, « I est ir-
réductible » n’est pas la même chose que « a est irréductible » (exerc. 4.11). Mais elle sera
justifiée plus tard lorsque l’on introduira la topologie de Zariski (§ 5).
80 CHAPITRE III. ANNEAUX

Exercice 4.8. — Soit K un corps et soit A l’anneau K[X, Y, Z]/(XY − Z 2 ). Montrer que
l’idéal p de A engendré par les classes X̄ et Z̄ est premier, mais que p2 n’est pas primaire.

Exercice 4.9. — Dans l’anneau Z[X], montrer que l’idéal (4, X) est primaire, de radical (2, X),
mais n’est pas une puissance d’un idéal premier.

Exercice 4.10. — Dans l’anneau Z[ 5], montrer que l’idéal (2) est primaire, de radical (2, 1 −

5), mais n’est pas une puissance d’un idéal premier (cf. exerc. 4.2).

Exercice 4.11. — Soit A un anneau principal et soit I un idéal de A. Montrer les équivalences :

I primaire ⇐⇒ I irréductible ⇐⇒ I puissance d’un idéal premier.

Voici quelques implications vraies en général.

Proposition 4.12. — Soit A un anneau et soit I un idéal de A.


a) I premier ⇔ I irréductible et radical ;
b) si A est noethérien, I irréductible ⇒ I primaire ;
√ √
c) I maximal ⇒ I primaire ⇒ I premier.

Aucune des implications dans b) et c) n’est en général une équivalence (chercher des
contre-exemples !).

Soit p un idéal premier. On dit qu’un idéal primaire I est p-primaire si I = p. La
terminologie peut sembler étrange, mais elle est pratique.
Enfin, si I et J sont des idéaux d’un anneau A, il est pratique (et classique) de poser
(I : J) := {x ∈ A | xJ ⊆ I}.
C’est un idéal de A contenant I (y penser comme à « I divisé par J »). Si a ∈ A, on pose
aussi (I : a) := (I : (a)) = {x ∈ A | xa ∈ I}.

Démonstration de la proposition. — Prouvons a). Supposons I premier. Il est alors radical


et il s’agit de montrer qu’il est irréductible. Supposons donc I = I1 ∩ I2 . Si I ( I1 et I ( I2 ,
il existe aj ∈ Ij I. Mais a1 a2 ∈ I1 I2 ⊆ I, ce qui contredit le fait que I est premier.
Pour la réciproque, supposons ab ∈ I. On a alors ((a) + I) · ((b) + I) ⊆ I, donc
2
I 2 ⊆ ((a) + I) ∩ ((b) + I) ⊆ ((a) + I) · ((b) + I) ⊆ I.
En prenant les radicaux, on obtient, en utilisant lemme 3.2.c),
√ p p p √
I ⊆ ((a) + I) ∩ ((b) + I) = (a) + I ∩ (b) + I ⊆ I.
p p
On a donc égalité et, si I est radical, I = (a) + I ∩ (b) + I. Si I est de plus irréductible,
il est égal à (a) + I ou à (b) + I, donc soit a ∈ I, soit b ∈ I. Cela montre que I est premier.
4. DÉCOMPOSITION PRIMAIRE 81

Prouvons b). On suppose A noethérien et I irréductible, avec ab ∈ I mais a ∈


/ I. Pour
chaque entier m > 0, considérons l’idéal
Im := (I : bm ) = {c ∈ A | cbm ∈ I}.
On a des inclusions I ⊆ I1 ⊆ I2 ⊆ · · · , donc, A étant noethérien, cette suite croissante se
stabilise : il existe n > 0 tel que In = In+1 .
Montrons ((bn ) + I) ∩ ((a) + I) = I. Une inclusion est claire. Pour l’autre, prenons
x ∈ ((bn ) + I) ∩ ((a) + I). On peut écrire x = cbn + u = da + v, avec c et d dans A et u
et v dans I. On a cbn+1 = dab + b(v − u) ∈ I, donc c ∈ In+1 . Ainsi, c est dans In , et x est
dans I.
Comme a ∈ / I et que I est irréductible, on en déduit (bn ) + I = I, soit bn ∈ I.
√ √ √
Prouvons c). Supposons I maximal et prenons ab ∈ I. Si b ∈ / I, on a (b) + I = A,
de sorte que l’on peut écrire 1 = xb + c, avec x ∈ A et cn ∈ I. Mais cn = (1 − xb)n peut
s’écrire cn = 1 + yb, avec y ∈ A, et a = a(cn − yb) = acn − yab est dans I puisque cn et
ab y sont. Cela prouve que I est un idéal primaire.
√ √
Si I est un idéal primaire, et que ab ∈ I, on a am bm ∈ I pour un m > √ 0. Si a ∈
/ I, on
a am ∈/ I. Puisque I est primaire, on a (bm )n ∈ I pour un n > 0, donc b ∈ I.
Exercice 4.13. — Soit A un anneau noethérien avec un seul idéal premier. Celui-ci est alors
maximal ; on le note m. Soit M un A-module de type fini. Pour tout m ∈ M , on pose (0 :
m) := {a ∈ A | am = 0M }. C’est un idéal de A.
a) Si M est non nul, montrer qu’il existe m ∈ M tel que (0 : m) = m (Indication : choisir
m ∈ M {0} tel que l’idéal (0 : m) soit maximal parmi tous les idéaux de A de ce type, et
montrer qu’il est premier). Montrer que le sous-A-module Am de M est isomorphe à A/m.
b) Montrer qu’il existe une suite finie 0 = M0 ⊆ M1 ⊆ · · · ⊆ Mn = M de sous-A-modules
de M telle que les A-modules Mi+1 /Mi soient tous isomorphes à A/m (Indication : on pourra
utiliser l’exerc. 2.3). On note `(M ) le plus petit entier n pour lequel il existe une telle suite.
c) Soit N un sous-A-module de M (il est encore de type fini par l’exerc. 2.3). Montrer que
l’on a `(N ) ≤ `(M ) et qu’il y a égalité si et seulement si N = M (Indication : on pourra utiliser
la suite de A-modules (Mi ∩ N )0≤i≤n ).
d) Montrer que pour toute suite de sous-A-modules de M comme dans b), on a n = `(M ).
e) Soit N un sous-A-module de M . Montrer que l’on a `(M ) = `(N ) + `(M/N ).

4.2. Décomposition primaire dans un anneau noethérien. —

Théorème 4.14. — Dans un anneau noethérien, tout idéal peut s’écrire comme intersection
finie d’idéaux primaires.

Une telle décomposition est dite décomposition primaire de l’idéal I.


82 CHAPITRE III. ANNEAUX

Démonstration. — Supposons au contraire que l’ensemble E des idéaux d’un anneau noe-
thérien A qui n’ont pas cette propriété soit non vide. Comme A est noethérien, E admet un
élément maximal I. Comme un idéal irréductible de A est primaire (prop. 4.12.b)), I ne peut
être irréductible, donc il existe des idéaux I1 et I2 de A tels que I = I1 ∩ I2 , mais I ( I1
et I ( I2 . Mais ni I1 , ni I2 ne sont alors dans E . Ils s’écrivent ainsi tous les deux comme
intersection finie d’idéaux primaires, et I aussi, ce qui contredit I ∈/ E . Donc E est vide, ce
qui montre le théorème.

Si on revient un peu sur les démonstrations précédentes, on réalise qu’elles fournissent


une méthode pour trouver pratiquement une telle décomposition.
Soit I un idéal d’un anneau
√ noethérien A. Si I est primaire, c’est terminé. Sinon, il existe
ab ∈ I avec a ∈/ I et b ∈
/ I. La suite croissante d’idéaux
(I : b) ⊆ (I : b2 ) ⊆ · · ·
se stabilise : il existe n > 0 avec (I : bn ) = (I : bn+1 ). La preuve du point b) de la prop. 4.12
montre que l’on a alors I = ((bn ) + I) ∩ ((a) + I). On a ainsi écrit I comme intersection de
deux idéaux contenant strictement I. Il « suffit » alors de recommencer le processus. Notons
tout de suite que cette méthode n’est pas un algorithme : elle n’explique ni comment tester si
un idéal est primaire ou non, ni, s’il ne l’est pas, comment trouver les éléments a et b comme
ci-dessus. Montrons quand même comment cela peut fonctionner sur un exemple.
2
√ — Soit K un corps. L’idéal I = (X , XY ) de K[X,√
Exemple 4.15. Y ] n’est pas primaire
(bien que I = (X) soit premier) : on a XY ∈ I mais X ∈
/ I et Y ∈
/ I. On a
(I : Y ) = {P ∈ K[X, Y ] | Y P ∈ I} = (X),
2
(I : Y ) = {P ∈ K[X, Y ] | Y 2 P ∈ I} = (X) = (I : Y ),
donc I = ((Y ) + I) ∩ ((X) + I) = (X 2 , Y ) ∩ (X). L’idéal X est premier, donc primaire.
L’idéal (X 2 , Y ) est primaire par prop. 4.12.c) puisque son radical (X, Y ) est maximal. L’écri-
ture
I = (X) ∩ (X 2 , Y )
est donc une décomposition primaire de I.

/ I et Y n ∈
Mais on peut aussi partir des éléments X ∈ / I (pour chaque n ∈ N∗ ). On
obtient alors
(I : Y n ) = {P ∈ I | Y n P ∈ I} = (X) = (I : Y 2n )
et une autre décomposition primaire
I = (X) ∩ (X 2 , XY, Y n )
pour tout n ≥ 1, où l’idéal (X 2 , XY, Y n ) est encore (X, Y )-primaire. Il n’y a donc pas
unicité.
4. DÉCOMPOSITION PRIMAIRE 83

Maintenant que nous savons qu’une décomposition primaire existe, nous allons la simpli-
fier pour supprimer les redondances possibles et arriver autant que faire se peut à des énoncés
d’unicité (cor. 4.19 et th. 4.22).
Lemme 4.16. — Toute intersection finie d’idéaux p-primaires est encore p-primaire.

Démonstration. — Il suffit de montrer que l’intersection


√ de deux idéaux p-primaires I et J
a la même propriété. Tout d’abord, on a bien I ∩ J = p par le lemme 3.2.c). Supposons
ab ∈ I ∩ J, avec a ∈
/ I ∩ J, disons a ∈
/ I. Comme I est p-primaire et ab ∈ I, on a b ∈ p.

Étant donnée une décomposition primaire d’un idéal I, on peut donc toujours la réécrire,
grâce au lemme ci-dessus,
I = q1 ∩ · · · ∩ qn
T √ √
de façon que I 6= i6=j qi pour tout j et que qi 6= qj pour tout i 6= j. On dit alors qu’elle
est minimale.

4.3. Idéaux premiers associés, idéaux premiers immergés. —


Définition 4.17. — Soit I un idéal d’un anneau A. On dit qu’un idéal premier p de A est
associé à I s’il existe x ∈ A tel que p = (I : x).
Théorème 4.18. — Soit A un anneau noethérien, soit I un idéal de A et soit
I = q1 ∩ · · · ∩ qn

une décomposition primaire minimale. Les qi sont exactement les idéaux premiers associés
à I.

En particulier, les qi , qui sont des idéaux premiers deux à deux distincts, sont indépen-
dants de la décomposition primaire minimale de I.

Démonstration. — Posons p1 := q1 . Comme la décomposition est minimale, il existe y ∈
Tn m m
i=2 qi q1 . Il existe m > 0 tel que p1 ⊆ q1 (exerc. 3.3), de sorte que yp1 ⊆ yq1 ⊆ I. Soit
r
/ I, on a r ≥ 1. Choisissons x ∈ ypr−1
r le plus petit entier vérifiant yp1 ⊆ I. Comme y ∈ 1 I.
Tn
On a alors x ∈ i=2 qi , donc x ∈ / q1 .
Montrons p1 = (I : x). On a xp1 ⊆ I, donc p1 ⊆ (I : x). Inversement, si z ∈ (I : x), on
a zx ∈ I ⊆ q1 , et, comme q1 est primaire et x ∈ / q1 , on en déduit z ∈ p1 . On a donc montré
que p1 est un idéal premier associé à I.
T T
Soit maintenant p = (I : x) un idéal associé à I. On a p = ( i qi : x) = i (qi : x),
et comme p est irréductible (prop. 4.12.a)), il existe i ∈ {1, . . . , n} tel que p = (qi : x). En

particulier, p contient qi , donc son radical qi (lemme 3.2.a)). Inversement, si y ∈ p, comme
p = (I : x), on a yx ∈ I ⊆ qi . Si x ∈ qi , on a (qi : x) = A, ce qui est absurde, puisque cet
√ √
idéal est p. Donc x ∈/ qi , de sorte que y ∈ qi . On a donc montré p = qi .
84 CHAPITRE III. ANNEAUX

Corollaire 4.19. — Soit A un anneau noethérien, soit I un idéal de A et soient


I = q1 ∩ · · · ∩ qm = q01 ∩ · · · ∩ q0n
des décompositions p primaires minimales. Alors m = n et il existe une permutation σ de

{1, . . . , n} telle que q0i = qσ(i) pour tout i.

Exercice 4.20. — Soit A un anneau noethérien. Montrer que l’ensemble des éléments nilpotents
de A est l’intersection des idéaux premiers associés à l’idéal (0), tandis que l’ensemble des
diviseurs de 0 est la réunion de ces mêmes idéaux.


Si les idéaux premiers qi qui apparaissent dans une décomposition minimale de I sont
ainsi uniquement déterminés par I, il n’est pas vrai en général que les qi eux-mêmes sont
uniquement déterminés, comme le montre l’ex. 4.15. Cependant, certains des qi sont unique-

ment déterminés : il s’agit de ceux pour lesquels l’idéal qi est un idéal premier minimal
contenant I, c’est-à-dire tel qu’il n’existe aucun autre idéal premier contenu dedans et conte-
nant I.

Exemple 4.21. — Soit K un corps. On a mis en évidence dans l’ex. 4.15 des décompositions
primaires de l’idéal I = (X 2 , XY ) ⊆ K[X, Y ] : on a
I = (X) ∩ (X 2 , XY, Y n )
pour chaque n ≥ 1. Celles-ci sont toutes minimales. L’idéal premier associé (X) = (I : Y )
est minimal. L’idéal (X 2 , XY, Y n ) est (X, Y )-primaire, et (X, Y ) = (I : X) est associé
mais pas minimal (il contient (X)).

Théorème 4.22. — Soit A un anneau noethérien et soit I un idéal de A. Tout idéal premier
minimal p contenant I est associé à I.
Dans toute décomposition primaire minimale de I, l’idéal p-primaire est
[
(I : x).
x∈p
/

Il est en particulier indépendant de la décomposition.

En particulier, dans un anneau noethérien, il n’y a qu’un nombre fini d’idéaux premiers
minimaux. Évidemment, si l’anneau est intègre, le seul idéal premier minimal est (0) !

Démonstration. — Soit I = q1 ∩ · · · ∩ qn une décomposition primaire minimale de I. Si


p est un idéal premier minimal contenant I, on a q1 ∩ · · · ∩ qn ⊆ p. Cela entraîne qu’il
existe i ∈ {1, . . . , n} tel que qi ⊆ p : sinon, on choisit xi ∈ qi p pour chaque i ; le produit
x1 · · · xn est dans q1 · · · qn , donc dans p, mais c’est absurde car p est premier et aucun des
√ √
facteurs n’est dans p. Cela entraîne I ⊆ qi ⊆ p = p et comme p est minimal, on a

qi = p et p est bien associé à I (th. 4.18).
4. DÉCOMPOSITION PRIMAIRE 85

√ T
Si j 6= i, on a p 6= qj , et ce qui précède montre que j6=i qj n’est pas contenu dans
T  T
p. Prenons x ∈ j6=i qj p. Pour tout élément a de qi , on a ax ∈ j qj = I, donc
a ∈ (I : x).
Inversement, si x ∈/ p et a ∈ (I : x), on a xa ∈ I donc xa ∈ qi . Comme qi est p-primaire,
S
cela entraîne a ∈ qi . On a ainsi montré qi = x∈p / (I : x), ce qui termine la démonstration
du théorème.

Soit A un anneau noethérien et soit I un idéal de A. Les idéaux premiers associés à I qui
ne sont pas minimaux sont appelés idéaux premiers immergés. Si
I = q1 ∩ · · · ∩ qn

est une décomposition primaire minimale de I, les idéaux premiers associés sont les pi = qi
et

I = p1 ∩ · · · ∩ pn ,
décomposition dans laquelle donc les idéaux premiers immergés ont disparu (cela justifie
partiellement la terminologie !).
On a indiqué plus haut une méthode qui peut aider à trouver à la main une décomposition
primaire d’un idéal (cf. ex. 4.15). Il existe par ailleurs de nombreux algorithmes et plusieurs
logiciels informatiques (Singular, Macaulay 2, CoCoA, Magma, etc.) qui font cela très bien
dans les anneaux de polynômes. Voici un autre exemple dans K[X, Y, Z] :
(X 2 Y 3 − X 3 Y Z, Y 2 Z − XZ 2 ) = (Y 2 − XZ) ∩ (X 2 , Z) ∩ (Y, Z 2 ).
L’idéal (Y 2 − XZ) est un idéal premier minimal ; l’idéal (X 2 , Z) est (X, Z)-primaire, et
(X, Z) est un idéal premier minimal ; l’idéal (Y, Z 2 ) est (Y, Z)-primaire, et (Y, Z) est un
idéal premier immergé (il contient l’idéal premier minimal (Y 2 − XZ)).
Exercice 4.23. — Montrer que l’idéal (0) dans l’anneau des fonctions continues de [0, 1] dans
R n’est pas intersection finie d’idéaux primaires.

Exercice 4.24. — Soit I un idéal d’un anneau noethérien. Montrer que I est radical si et seule-
ment si tous les idéaux primaires qui apparaissent dans une décomposition minimale sont pre-
miers. En particulier, si I est radical, I n’a pas d’idéal premier immergé.

Exercice 4.25. — Soient I et J des idéaux d’un anneau noethérien A, avec I 6= A. Montrer
que I = (I : J) si et seulement si J n’est contenu dans aucun idéal premier associé à I.

Exercice 4.26. — Soit K un corps. Dans l’anneau K[X, Y, Z], on définit p1 = (X, Y ), p2 =
(X, Z), I = p1 p2 et m = (X, Y, Z). Montrer que p1 et p2 sont des idéaux premiers, tandis que
m est un idéal maximal. Montrer que
I = p1 ∩ p2 ∩ m2
est une décomposition primaire minimale de I. Quels sont les idéaux premiers associés ? Les-
quels sont-ils immergés ?
86 CHAPITRE III. ANNEAUX

Exercice 4.27. — Soit K un corps. Dans l’anneau K[X, Y, Z], trouver une décomposition pri-
maire de l’idéal (XY, Y Z, ZX).

Exercice 4.28. — a) Donner une décomposition primaire minimale de l’idéal (X 2 − 2, Y 2 − 2)


dans C[X, Y ]. Y a-t-il des idéaux premiers immergés ?
b) Donner une décomposition primaire minimale de l’idéal (X 2 − 2, Y 2 − 2) dans Q[X, Y ].

5. Topologie de Zariski

Pour comprendre la décomposition primaire d’un point de vue géométrique, il est utile
d’introduire la topologie de Zariski.

5.1. Spectre d’un anneau. — Soit A un anneau. On appelle spectre de A, et l’on note
Spec(A), l’ensemble des idéaux premiers de A. Il est vide si et seulement si A = 0. Grâce au
lemme suivant, on peut munir cet ensemble d’une topologie en décrétant que les fermés sont
les
V (I) := {p ∈ Spec(A) | p ⊇ I},
où I décrit l’ensemble des idéaux de A.

Lemme 5.1. — Soit A un anneau.


a) On a V ((0)) = Spec(A), et V (I) = ∅ si et seulement si I = A.
b) Si (Iα ) est une famille d’idéaux de A, on a
\ X
V (Iα ) = V ( Iα ).
α α

c) Si I1 , . . . , In sont des idéaux de A,

V (I1 ) ∪ · · · ∪ V (In ) = V (I1 ∩ · · · ∩ In ) = V (I1 · · · In ).

Démonstration. — Le premier point est évident. Pour le deuxième point, on a


\ X
p∈ V (Iα ) ⇐⇒ ∀α p ⊇ Iα ⇐⇒ p ⊇ Iα .
α α

Pour le dernier point, il suffit de traiter le cas n = 2. Remarquons d’abord que si I ⊆ J, alors
V (I) ⊇ V (J). Comme I1 I2 ⊆ I1 ∩ I2 ⊆ Ij , on obtient

V (I1 I2 ) ⊇ V (I1 ∩ I2 ) ⊇ V (I1 ) ∪ V (I2 ).

Soit maintenant p ∈ V (I1 I2 ) V (I1 ). Il existe alors x1 ∈ I1 p, et pour tout x2 ∈ I2 , on a


x1 x2 ∈ I1 I2 ⊆ p, donc x2 ∈ p puisque p est un idéal premier. On a donc I2 ⊆ p, de sorte
que V (I1 I2 ) V (I1 ) ⊆ V (I2 ).
5. TOPOLOGIE DE ZARISKI 87

Une base d’ouverts pour cette topologie est formée des

(5) D(f ) := {p ∈ Spec(A) | f ∈ / p} = Spec(A) V ((f ))


T
pour f ∈ A. En effet, on a, pour tout idéal I, par lemme 5.1.b), V (I) = f ∈I V ((f )), donc
[
Spec(A) V (I) = D(f ).
f ∈I

√ √
Lemme 5.2. — On a V√(I) ⊆√V (J) si et seulement si J ⊆ I. En particulier, V (I) =
V (J) si et seulement si I = J.

Démonstration. — Le lemme 3.2.b) peut aussi s’énoncer


√ \
I= p.
p∈V (I)


⊆ V (J), alors J ⊆ I. Pour la réciproque, on remarque que
√ que si√V (I) √
On en déduit
V (I) = V ( I). Si J ⊆ I, on en déduit
√ √
V (J) = V ( J) ⊇ V ( I) = V (I),

ce qui termine la démonstration du lemme.

Pour toute partie S de Spec(A), on notera


\
I(S) := p.
p∈S

C’est un idéal de A qui est radical car intersection d’idéaux premiers (donc radicaux). On a :

V (I(S)) = S pour toute partie S de Spec(A) ;



I(V (J)) = J pour tout idéal J de A.

En effet, il est d’abord clair que le fermé V (I(S)) contient S, donc S. En particulier, pour
tout idéal J, on a V (I(V (J))) ⊇ V (J). D’autre part, l’idéal radical I(V (J)) contient J. On
en déduit aussi V (I(V (J))) ⊆ V (J) (puisque V renverse les inclusions) ; il y a donc égalité.
En particulier, comme S peut s’écrire V (J) et que I(S) = I(S), on a la première relation.
Enfin, de l’égalité V (I(V (J))) = V (J), on déduit (avec le lemme 5.2, et puisque I(V (J))
est radical) la seconde relation.
Une façon agréable de résumer tout cela est de dire que les correspondances
V /
(6) {idéaux radicaux de A} o {parties fermées de Spec(A)}
I

sont des bijections réciproques qui renversent les inclusions.


88 CHAPITRE III. ANNEAUX

L’adhérence d’un point p de Spec(A) est l’intersection de tous les fermés de Spec(A)
contenant p, c’est-à-dire de tous les V (I) pour lesquels p ∈ V (I), c’est-à-dire I ⊆ p. Mais
on a alors V (I) ⊇ V (p), donc
(7) {p} = V (p) = {q ∈ Spec(A) | q ⊇ p}.
En particulier, le point p est fermé si et seulement si p est un idéal maximal. Si l’anneau A
est intègre, l’idéal {0} correspond à un point dense dans Spec(A). On dit que c’est le point
générique, souvent noté η.

Exemple 5.3. — Si K est un corps, Spec(K) a un seul élément, (0).

Exemple 5.4. — L’ensemble Spec(Z) est


{η} ∪ {nombres premiers}.
Tous les points sont fermés, sauf η qui est dense. Les fermés sont les V ((m)), pour m ∈ Z,
et cet ensemble est Spec(Z) si m = 0, composé des facteurs premiers de m sinon ; ce sont
donc les sous-ensembles finis de Spec(Z) formés de points fermés, ainsi que Spec(Z) tout
entier.
Si f est un entier non nul, l’ouvert D(f ) est le complémentaire de l’ensemble (fini)
V ((f ))) des diviseurs premiers de f .

Exemple 5.5. — Si K est un corps, Spec(K[X]) est


{η} ∪ {polynômes irréductibles unitaires}.
Tous les points sont fermés, sauf η qui est dense. Si K est algébriquement clos, les polynômes
irréductibles unitaires sont les X − a, pour a ∈ K. On a alors
Spec(K[X]) = {η} ∪ K.
Les sous-ensembles fermés sont les sous-ensembles finis formés de points fermés, ainsi que
Spec(K[X]).
Lorsque K = R, on a
Spec(R[X]) = {η} ∪ R ∪ {paires de nombres complexes conjugués non réels}.

Exemple 5.6. — Si K est un corps, on a (cf. exerc. I.1.10)


Spec(K[[X]]) = {(0)} ∪ {(X)}.
Il y a donc deux points : un point dense (le point générique) et un point fermé.

Si A est un anneau, on note Aréd le quotient de A par l’idéal des éléments nilpotents de
A. On dit que A est réduit si le seul élément nilpotent de A est 0. L’anneau Aréd est toujours
réduit.
5. TOPOLOGIE DE ZARISKI 89

Exercice 5.7. — a) Soit u : A → B un morphisme d’anneaux. Montrer que l’image inverse par
u induit une application continue u] : Spec(B) → Spec(A).
b) Soit I un idéal d’un anneau A et soit p : A → A/I la surjection canonique. Alors
p] : Spec(A/I) → Spec(A) induit un homéomorphisme de Spec(A/I) sur le fermé V (I)
de Spec(A).
En particulier, la surjection canonique A → Aréd induit un homéomorphisme de Spec(Aréd )
sur Spec(A).

Exemple 5.8. — Soit P un ensemble de nombres premiers positifs et soit ZP l’anneau


des nombres rationnels dont le dénominateur n’est divisible par aucun élément de P (5) . Les
éléments de son spectre sont (0) et tous les (p), pour p ∈ P. L’inclusion Z ,→ ZP induit une
inclusion Spec(ZP ) ,→ Spec(Z) dont l’image est {(0)} ∪ P. Elle n’est donc (en général)
ni ouverte, ni fermée.

Exemple 5.9. — Si K est un corps, l’inclusion canonique de l’anneau des séries formelles
K[[X]] dans son corps des fractions K((X)) des séries de Laurent induit une application
continue
Spec(K((X))) → Spec(K[[X]])
qui envoie le seul point (fermé) de Spec(K((X))) sur le point générique de Spec(K[[X]]).

Nous allons maintenant examiner diverses propriétés topologiques de l’espace Spec(A).


Commençons par deux remarques sur les anneaux produit.
Supposons A = A1 × A2 . Soit I un idéal de A. Posons I1 = {x1 ∈ A1 | (x1 , 0) ∈ I}
et I2 = {x2 ∈ A2 | (0, x2 ) ∈ I}. Ce sont des idéaux de A1 et A2 respectivement, et on a
I1 × I2 ⊆ I. Inversement, si x = (x1 , x2 ) ∈ I, on a (x1 , 0) = x · (1, 0) ∈ I, donc x1 ∈ I1 ,
et de la même façon, x2 ∈ I2 . On a donc I = I1 × I2 : tout idéal de A se décompose donc en
produit.
Posons e = (1, 0) ; on a e2 = e. On dit que e est un idempotent de A, et qu’il est non
trivial (e 6= 0 et e 6= 1).
Inversement, si e est un idempotent non trivial d’un anneau A, il en est de même pour
1 − e, et l’application canonique p : A → A/(e) × A/(1 − e) est un isomorphisme d’anneaux
(elle est injective parce que si ae = b(1 − e), on obtient ae = 0 en multipliant par e ; elle
est surjective car l’image contient (1, 0) = p(1 − e) et (0, 1) = p(e)). Un anneau A est donc
produit d’anneaux non nuls si et seulement s’il contient un idempotent non trivial.

Proposition 5.10. — Soit A un anneau. L’espace topologique Spec(A) est connexe si et


seulement si A ne peut pas s’écrire comme produit d’anneaux non nuls.

5. Avec la terminologie du § 6, l’anneau ZP est le localisé de Z en la partie multiplicative engendrée par les
nombres premiers positifs qui ne sont pas dans P.
90 CHAPITRE III. ANNEAUX

Démonstration. — L’exerc. 5.7.b) montre que les deux projections A → Ai induisent une
injection continue de Spec(A1 ) t Spec(A2 ) dans Spec(A) qui est un homéomorphisme sur
son image. Si p ∈ Spec(A), il s’écrit comme on l’a vu plus haut p = I1 × I2 . On a (1, 0) ·
(0, 1) = (0, 0) ∈ p, donc soit (1, 0) ∈ p, c’est-à-dire I1 = A1 , soit (0, 1) ∈ p, c’est-à-dire
I2 = A2 . Cela prouve que l’on a une décomposition
Spec(A) = Spec(A1 ) t Spec(A2 )
en union de deux fermés disjoints.
Supposons maintenant Spec(A) réunion de deux fermés disjoints p non vides V (I1 ) et

V (I2 ). On a alors I1 6= A, I2 6= A, I1 + I2 = A et I1 I2 = (0) (lemme 5.1). Écri-
vons 1 = x1 + x2 , avec x1 ∈ I1 et x2 ∈ I2 . L’élément x1 x2 de I1 I2 est alors nilpotent, donc
il existe m ∈ N∗ tel que xm m
1 x2 = 0. On a alors
2m   m  
X 2m i−m 2m−i X 2m i m−i
1 = (x1 + x2 )2m = xm 1 x1 x 2 + x m
2 x1 x2 := y1 + y2 .
i=m+1
i i=0
i
On a alors y1 ∈ I1 , y2 ∈ I2 , 1 = y1 + y2 et y1 y2 = 0. Comme I1 6= A et I2 6= A, ni y1 , ni y2
n’est nul, donc y1 est un idempotent non trivial de A, qui est ainsi produit de deux anneaux
non nuls.

On rappelle qu’un espace topologique est quasi-compact si de tout recouvrement ouvert on


peut extraire un recouvrement fini (de sorte que « compact » est équivalent à « quasi-compact
et séparé »).

Proposition 5.11. — Soit A un anneau. L’espace topologique Spec(A) est quasi-compact.


Il est séparé si et seulement si tout idéal premier est maximal.

Démonstration. — Soit (Uα ) un recouvrement ouvert de Spec(A). Soit Iα ⊆ A un idéal tel


T P
que Spec(A) Uα = V (Iα ). On a alors α V (Iα ) = ∅, de sorte que α Iα = A par lemme
P
5.1.b) et a). On peut donc écrire 1 = α∈Λ xα , où Λ est un ensemble fini et xα ∈ Iα . En
P S
d’autres termes, on a α∈Λ Iα = A, donc Spec(A) = α∈Λ Uα . Cela montre que Spec(A)
est quasi-compact.
Un espace topologique est séparé si et seulement si deux points distincts ont des voisinages
disjoints. Cela entraîne que tout point est fermé donc, comme on l’a vu plus haut, que tout
idéal premier est maximal.
Inversement, si tout idéal premier de A est maximal, tout point est fermé donc, étant donné
deux points distincts p et q, le complémentaire de {q} est un voisinage de p qui ne contient
pas q. Mais montrer qu’il existe des voisinages disjoints est plus délicat et ne sera pas fait
ici.
Exercice 5.12. — Terminer la démonstration ci-dessus, en montrant que si A est anneau dans
lequel tout idéal premier est maximal, Spec(A) est séparé (lorsque A est noethérien, cela sera
5. TOPOLOGIE DE ZARISKI 91

fait dans le § 5.3 ; c’est alors équivalent au fait que Spec(A) est un ensemble fini muni de la
topologie discrète. Dans le cas général, je ne connais pas de preuve simple...).

5.2. Espaces topologiques irréductibles, composantes irréductibles. — Venons-en main-


tenant à une propriété moins courante.

Définition 5.13. — Un espace topologique est irréductible s’il est non vide et s’il n’est pas
réunion de deux fermés stricts.

Un espace topologique séparé X est irréductible si et seulement s’il est réduit à un point :
si X contient deux points distincts, ils ont des voisinages ouverts distincts U et V , et X =
(X U ) ∪ (X V ) est une décomposition en réunion de deux fermés stricts. Cette notion
n’a donc d’intérêt que pour les espaces topologiques non séparés.

Proposition 5.14. — Pour un espace topologique X non vide, les propriétés suivantes sont
équivalentes :
(i) X est irréductible ;
(ii) toute intersection finie d’ouverts non vides de X est non vide ;
(iii) tout ouvert non vide de X est dense.

Démonstration. — Supposons X irréductible et soient U1 , . . . , Un des ouverts non vides de


X. Pour montrer que U1 ∩ · · · ∩ Un n’est pas vide, on voit qu’il suffit de le faire pour n = 2.
Si U1 ∩ U2 = ∅, on a X = (X U1 ) ∪ (X U2 ), ce qui contredit l’irréductibilité de X. Ceci
montre que (i) entraîne (ii).
Supposons (ii). Si U est un ouvert non vide de X, les ouverts U et X U sont disjoints,
donc X U est vide, de sorte que U est dense dans X. Ceci montre que (ii) entraîne (iii).
Enfin, si tout ouvert non vide de X est dense, et si F1 et F2 sont des fermés stricts de X,
les ouverts non vides X F1 et X F2 sont denses donc se rencontrent, et F1 ∪ F2 6= X.
Ceci montre que (iii) entraîne (i).

Proposition 5.15. — Soit X un espace topologique et soit Y une partie de X. Alors Y (muni
de la topologie induite) est irréductible si et seulement si Y l’est.

Démonstration. — Supposons Y irréductible. Si Y est réunion de fermés F1 et F2 , alors


Y est réunion des fermés Y ∩ F1 et Y ∩ F2 , donc (par exemple) Y ⊆ F1 . En passant aux
adhérences, on obtient Y = F1 . Ceci prouve que Y est irréductible.
Inversement, si Y est irréductible et si Y est réunion de fermés F1 et F2 , il existe, par
définition de la topologie induite, des fermés G1 et G2 de X tels que Fj = Y ∩ Gj . On a
alors Y ⊆ G1 ∪ G2 , donc Y ⊆ G1 ∪ G2 . Comme Y est irréductible, on a (par exemple)
Y ⊆ G1 , donc Y ⊆ Y ∩ G1 = F1 . Ceci montre que Y est irréductible.
92 CHAPITRE III. ANNEAUX

Un espace irréductible est connexe, mais la réciproque est fausse. Comme pour les espaces
connexes, on a le résultat utile suivant.

Proposition 5.16. — L’image d’un espace irréductible par une application continue est en-
core irréductible.

Démonstration. — Soit X un espace irréductible et soit f : X → Y une application conti-


nue et supposons f (X) = F1 ∪ F2 . On a alors X = f −1 (F1 ) ∪ f −1 (F2 ), donc, par irré-
ductibilité de X, on a (par exemple) X = f −1 (F1 ), d’où f (X) = F1 . Donc f (X) est bien
irréductible.

Soit X un espace topologique. Un sous-espace de X irréductible maximal (pour l’inclu-


sion) est appelé composante irréductible de X ; c’est une partie fermée de X par prop. 5.15.
Le lemme de Zorn entraîne que tout point de X est contenu dans une composante irréductible
de X, de sorte que X est réunion de ses composantes irréductibles.
Voyons un peu ce que donnent ces concepts dans le cas X = Spec(A). Tout d’abord, un
espace topologique admettant un point dense est irréductible (prop. 5.14). En particulier, le
spectre d’un anneau intègre est irréductible, et donc, si p est un idéal premier d’un anneau A,
le fermé V (p) de Spec(A), qui s’identifie au spectre de l’anneau intègre A/p, est irréductible.

Proposition 5.17. — Soit A un anneau. Les applications de (6) induisent des bijections dé-
croissantes réciproques
V /
{idéaux premiers de A} o {parties fermées irréductibles de Spec(A)}.
I

En particulier, les composantes irréductibles de Spec(A) correspondent aux p idéaux premiers


minimaux de A, et Spec(A) est irréductible si et seulement si l’idéal (0) des éléments
nilpotents de A est premier, c’est-à-dire si et seulement si l’anneau Aréd est intègre.

Cela justifie a posteriori la terminologie introduite dans la déf. 4.7 : parmi les idéaux
radicaux, les idéaux irréductibles au sens de cette définition (qui, par la prop. 4.12, sont
exactement les idéaux premiers) correspondent aux fermés irréductibles au sens topologique.

Démonstration. — On vient de voir que V (p) est un fermé irréductible. Inversement, une
partie fermée de Spec(A) s’écrit V (I), avec I idéal radical. L’anneau B = A/I est alors
réduit, et il s’agit de montrer que si Spec(B) est irréductible, B est intègre. Si bc = 0 dans
B, on a V ((b)) ∪ V ((c)) = V ((bc)) = Spec(B)p (lemme
p 5.1.c)). On a donc par exemple
V ((b)) = Spec(B) par irréductibilité, donc (b) = (0) = (0) (puisque B est réduit).
Cela entraîne b = 0 et prouve que B est intègre.
5. TOPOLOGIE DE ZARISKI 93

5.3. Espaces topologiques noethériens. —

Définition 5.18. — Un espace topologique est noethérien si toute suite décroissante de par-
ties fermées est stationnaire.

On peut formuler cette définition de différentes façons : toute suite croissante de parties ou-
vertes est stationnaire, toute famille non vide de parties fermées a un élément minimal, toute
famille non vide de parties ouvertes a un élément maximal, tout ouvert est quasi-compact (on
laisse les démonstrations en exercice).
De nouveau, cette notion n’a donc d’intérêt que pour les espaces topologiques non sépa-
rés : un espace topologique noethérien séparé est fini.

Proposition 5.19. — Un espace topologique noethérien n’a qu’un nombre fini de compo-
santes irréductibles (dont il est la réunion).

Démonstration. — Soit X un espace topologique noethérien. Soit E l’ensemble des parties


fermées de X qui ne peuvent s’écrire comme réunion finie de parties irréductibles fermées.
Si E n’est pas vide, il admet un élément minimal Y , qui n’est pas irréductible. On peut donc
l’écrire comme rénion de deux fermés stricts Y1 et Y2 . Par minimalité de Y , Y1 et Y2 ne sont
pas dans E , donc s’écrivent comme union finie de parties irréductibles fermées. Il en est de
même pour Y , ce qui est une contradiction. Donc E est vide : toute partie fermée de X (donc
aussi X) peut s’écrire comme réunion finie de parties irréductibles fermées.
Écrivons donc X = X1 ∪ · · · ∪ Xn . Si l’un des Xi est contenu dans un autre Xj , on le
retire. On arrive ainsi à une décomposition où aucun des Xi n’est contenu dans un autre Xj .
Montrons que Xi est une composante irréductible de X. Supposons Xi ⊆ Y , où Y ⊆ X
S
est irréductible. On a Y = j (Y ∩ Xj ), donc il existe j tel que Y ∩ Xj = Xj . On a alors
Xi ⊆ Y ⊆ Xj , ce qui entraîne i = j et Xi = Y . Chaque Xi est donc une composante
irréductible de X.
S
Inversement, si Y est une composante irréductible de X, on a de nouveau Y = j (Y ∩
Xj ), et il existe i tel que Y ⊆ Xi . Par maximalité de Y , on a égalité. Ceci termine la dé-
monstration de la proposition.

La preuve ci-dessus montre que pour trouver les composantes irréductibles d’un espace
noethérien, il suffit de le décomposer en réunion finie de parties fermées irréductibles et de
supprimer les redondances.

Exemple 5.20. — Soit K un corps. Posons A := K[X, Y ]/(XY ). L’espace topologique


Spec(A) a deux composantes irréductibles : V ((X)) et V ((Y )). En effet V ((X)) est ho-
méomorphe à Spec(A/(X)) = Spec(K[Y ]), qui est irréductible puisque K[Y ] est intègre,
94 CHAPITRE III. ANNEAUX

et V ((Y )) est irréductible pour la même raison. Comme aucune de ces deux parties n’est
contenue dans l’autre, et que
V ((X)) ∪ V ((Y )) = V ((XY )) = V ((0)) = Spec(A),
ce sont les composantes irréductibles de Spec(A).
Proposition 5.21. — Soit A un anneau. L’espace topologique Spec(A) est noethérien si et
seulement si toute suite croissante d’idéaux radicaux de A est stationnaire. En particulier, si
l’anneau A est noethérien, Spec(A) est noethérien.

Démonstration. — Cela résulte du fait que l’application I 7→ V (I) induit une bijection
décroissante entre idéaux radicaux de A et parties fermées de Spec(A) (lemme 5.2).
Corollaire 5.22. — Soit A un anneau noethérien. Tout idéal radical de A peut s’écrire
comme intersection finie non redondante d’idéaux premiers, et ceux-ci sont alors uniquement
déterminés.

On peut en déduire une forme faible de la décomposition primaire des idéaux dans un
anneau noethérien. Notons quand même que la formulation du corollaire fait disparaître toute
les subtilités liées aux idéaux premiers immergés.

Démonstration. — Cela résulte des prop. 5.17 et 5.19.

On peut aussi terminer la démonstration de la prop. 5.11 dans le cas où A est noethérien :
si tout idéal premier de A est maximal, les composantes irréductibles de Spec(A) sont des
points fermés, donc Spec(A) est un ensemble fini de points fermés, et il est séparé.

5.4. Dimension d’un espace topologique, dimension de Krull d’un anneau. —


Définition 5.23. — Soit X un espace topologique. On appelle dimension (combinatoire) de
X le supremum des longueurs n des chaînes Fn ( · · · ( F1 ( F0 de fermés irréductibles
de X.
Soit A un anneau. On appelle dimension (de Krull) de A le supremum des longueurs n
des chaînes pn ) · · · ) p1 ) p0 d’idéaux premiers de A.

Ces dimensions sont des éléments de N ∪ {±∞} et on a bien sûr dim(Spec(A)) =


dim(A). La dimension d’un espace topologique est −∞ si et seulement s’il est vide et la
dimension de Krull d’un anneau est −∞ si et seulement s’il est nul.
Si A est noethérien, il n’y a pas de chaîne infinie d’idéaux, mais il se peut quand même que
la dimension de A soit infinie (exerc. 6.6). En revanche, nous verrons plus tard (cor. 11.13)
que toute algèbre de type fini sur un corps est de dimension de Krull finie. Il existe aussi des
anneaux A noethériens (dits « non caténaires ») dans lesquels il existe des chaînes d’idéaux
5. TOPOLOGIE DE ZARISKI 95

premiers maximales (c’est-à-dire, que l’on ne peut pas agrandir) de longueur < dim(A) (6) ;
heureusement, de nouveau, ce genre de pathologie n’arrive pas pour les algèbres de type fini
sur un corps.
Si B est un anneau quotient de A, on a dim(A) ≥ dim(B), puisque toute chaîne d’idéaux
premiers de B se remonte dans A en une chaîne d’idéaux premiers de A.
De façon plus générale, si Y est un sous-espace d’un espace topologique X, on a dim(Y ) ≤
dim(X) (exerc. 5.30).

Exemple 5.24. — Soit p un idéal premier d’un anneau A. Les idéaux premiers de l’anneau
intègre A/p sont en correspondance bijective (et croissante) avec les idéaux premiers de A
contenant p. La dimension de Krull de l’anneau A/p est donc le supremum des longueurs n
des chaînes d’idéaux premiers de A commençant en p, c’est-à-dire du type pn ) · · · ) p1 )
p0 = p.

Exemple 5.25. — Un anneau non nul est de dimension 0 si et seulement si tout idéal premier
est maximal (c’est le cas si et seulement si Spec(A) est séparé ; cf. prop. 5.11). Un corps est
de dimension 0, puisque le seul idéal premier est (0) ; plus précisément, les corps sont les
anneaux intègres de dimension 0.
En fait, les anneaux noethériens de dimension 0 sont les anneaux dits « artiniens », c’est-
à-dire ceux pour lesquels toute suite décroissante d’idéaux est stationnaire (exerc. 2.18).

Exemple 5.26. — Un anneau intègre est de dimension 1 si et seulement si tout idéal premier
non nul est maximal. C’est le cas pour tous les anneaux principaux qui ne sont pas des corps
(prop. I.1.15), comme Z ou K[X], où K est un corps. Plus généralement, les anneaux de
Dedekind (introduits rapidement dans le § 4) sont les anneaux noethériens de dimension 1
intégralement clos (cf. déf. 8.15). Ceci inclut tous les anneaux d’entiers de corps de nombres
(cf. § 8).

Exemple 5.27. — On a vu dans l’exerc. 1.6 qu’un anneau factoriel de dimension 1 est prin-
cipal.

Exemple 5.28. — Soit K un corps. La chaîne


(X1 , . . . , Xn ) ) · · · ) (X1 ) ) (0)
d’idéaux premiers de K[X1 , . . . , Xn ] entraîne que la dimension de cet anneau est ≥ n. Nous
montrerons (th. 11.11) qu’elle est exactement n. Plus généralement, si A est un anneau, on a
dim(A[X]) ≥ dim(A) + 1 (si pn ) · · · ) p0 est une chaîne d’idéaux premiers de A, alors
(X, pn ) ) (pn ) ) · · · ) (p0 ) est une chaîne d’idéaux premiers de A[X]). Il y a égalité si A

6. Le premier exemple d’un tel anneau est dû à Nagata (On the chain problem of prime ideals, Nagoya Math. J.
10 (1956), 51–64).
96 CHAPITRE III. ANNEAUX

est noethérien (7) , mais pas en général (on a toujours dim(A[X]) ≤ 2 dim(A) + 1, et il peut
y avoir égalité).
Exercice 5.29. — Soit A un anneau. Montrer dim(A[[X]]) ≥ dim(A) + 1 (mais il existe des
anneaux A de dimension de Krull finie pour lesquels A[[X]] est de dimension infinie !). De
nouveau, on peut montrer que l’on a égalité lorsque A est un anneau noethérien ([B2], § 3, no 4,
cor. 3 de la prop. 8).

Exercice 5.30. — Soit X un espace topologique et soit Y une partie de X. Montrer dim(Y ) =
dim(Y ) ≤ dim(X).

Exercice 5.31. — Soit X un espace topologique réunion de parties fermées X1 , . . . , Xn (par


exemple ses composantes irréductibles s’il est noethérien ; cf. prop. 5.19). Montrer
dim(X) = sup dim(Xi ).
1≤i≤n

Si X est réunion d’une famille (quelconque) (Ui )i∈I de parties ouvertes, montrer
dim(X) = sup dim(Ui ).
i∈I

6. Localisation

Nous allons avoir maintenant besoin de parler de localisation, une opération fondamentale
en algèbre commutative (que nous avons réussi à éviter jusqu’alors !).
Soit A un anneau et S une partie multiplicative de A, c’est-à-dire telle que 1 ∈ S et
S · S ⊆ S. Le but est d’inverser les éléments de S dans un anneau AS . La procédure est
analogue à celle de la construction du corps des fractions d’un anneau intègre (où l’on prend
pour S l’ensemble de tous les éléments non nuls). Plus précisément, on définit sur S × A une
relation d’équivalence en posant
(s, a) ∼ (s0 , a0 ) ⇐⇒ ∃t ∈ S (as0 − a0 s)t = 0.
On note a/s la classe d’équivalence de (s, a) et S −1 A l’ensemble des classes d’équivalence.
On munit ce dernier d’une structure d’anneau en posant
a a0 as0 + a0 s a a0 aa0
+ 0 = 0
et · 0 = 0.
s s ss s s ss
(Il faut bien sûr vérifier que ces définitions sont compatibles avec la relation d’équivalence.)
Les éléments de S deviennent ainsi inversibles dans S −1 A.
Le noyau de l’application canonique A → S −1 A qui envoie a sur a/1 est l’idéal {a |
∃s ∈ S as = 0} ; elle est donc injective si A est intègre et que S ne contient pas 0. L’anneau
S −1 A est nul si et seulement si S contient 0.

7. Cf. [B2], § 3, no 4, cor. 3 de la prop. 7 ; voir aussi exerc. 11.14 lorsque A est une algèbre de type fini sur un
corps.
6. LOCALISATION 97

Soit J ⊆ S −1 A un idéal ; il est courant (même si c’est un abus de notation) de noter J ∩ A


l’idéal image inverse de J par l’application canonique A → S −1 A (on fait comme si c’était
une inclusion !). On vérifie que l’on a
(J ∩ A)S −1 A = J.
(De nouveau, on a fait un abus de notation : (J ∩ A)S −1 A désigne l’idéal de S −1 A engendré
par J ∩ A.)
L’application Spec(S −1 A) → Spec(A) définie par J 7→ J ∩ A est donc injective ; son
image est l’ensemble des idéaux premiers de A qui ne rencontrent pas S : si p est un tel idéal,
c’est l’image de pS −1 A. On a donc en particulier dim(S −1 A) ≤ dim(A) (l’inégalité peut
bien sûr être stricte !).
Exemple 6.1. — Soit A un anneau, soit f un élément de A et soit S ⊆ A la partie multipli-
cative {f n | n ∈ N}. L’anneau S −1 A est souvent noté Af , ou même A[f −1 ] ; on peut aussi
le voir comme A[X]/(f X − 1), et il est nul si et seulement si f est nilpotent. L’image de
l’application Spec(Af ) → Spec(A) est l’ouvert
D(f ) := {p ∈ Spec(A) | f ∈
/ p} = Spec(A) V ((f ))
introduit dans (5).
Par exemple, l’anneau A[X]X (noté aussi A[X, X −1 ]) est l’anneau des polynômes de
Laurent X
ak X k ,
k∈Z
où les coefficients ak ∈ A sont presque tous nuls.

Si p ⊆ A est un idéal premier, la partie A p est multiplicative et on note


Ap := (A p)−1 A.
C’est un anneau local appelé localisé de A en p : son unique idéal maximal est pAp et son
corps résiduel Ap /pAp est le corps des fractions de l’anneau intègre A/p (en particulier, si m
est un idéal maximal de A, le corps résiduel de l’anneau local Am est simplement A/m).
L’application Spec(Ap ) → Spec(A) envoie l’idéal maximal pAp sur p et son image est
l’ensemble des idéaux premiers de A contenus dans p. C’est aussi l’ensemble des points de
Spec(A) auquel p est adhérent (cf. (7)), ou encore l’intersection de tous les voisinages de p ;
il n’est en général ni fermé, ni ouvert.
Les idéaux premiers de l’anneau Ap sont ainsi en correspondance bijective (et croissante)
avec les idéaux premiers de A contenus dans p, et la dimension de Krull de l’anneau Ap est
donc le supremum des longueurs n des chaînes d’idéaux premiers de A terminant en p, c’est-
à-dire du type p = pn ) · · · ) p1 ) p0 . On l’appelle aussi la hauteur de p, notée ht(p).
Nous montrerons plus loin (th. 7.2) que si A est noethérien, la hauteur de tout idéal premier
p est finie, majorée par le cardinal d’un ensemble quelconque de générateurs de p.
98 CHAPITRE III. ANNEAUX

On a (cf. ex. 5.24)


dim(Ap ) + dim(A/p) ≤ dim(A)
(le membre de gauche est la longueur maximale des chaînes d’idéaux premiers de A dont
l’un des maillons est p). On n’a pas toujours égalité, même si A est noethérien (des contre-
exemples très compliqués ont été construits par Nagata en 1956). En revanche, pour la plupart
des anneaux intervenant dans les applications (en particulier en géométrie algébrique et en
théorie des nombres), on a bien égalité pour tout p (c’est vrai en particulier pour toute algèbre
A de type fini sur un corps ; cf. cor. 14.2). Il faut alors penser à la hauteur de p comme à
la codimension de p dans A (elle est égale à dim(A) − dim(A/p) c’est-à-dire, en termes
topologiques, à dim(Spec(A)) − dim({p})).
Exercice 6.2. — Soit A un anneau et soient p ⊆ q des idéaux premiers de A. Exhiber un anneau
dont la dimension de Krull est le supremum des longueurs n des chaînes d’idéaux premiers de A
commençant en p et terminant en q, c’est-à-dire du type q = pn ) · · · ) p1 ) p0 = p.

Lorsque A est intègre, l’idéal (0) est premier et le localisé de A en cet idéal est le corps
des fractions KA de A. Tous les localisés S −1 A, où S ⊆ A est une partie multiplicative
ne contenant pas 0, sont alors des sous-anneaux de KA ; ce sont en particulier des anneaux
intègres.
Remarque 6.3. — Si A est un anneau et B une A-algèbre de type fini, les localisations
S −1 B sont des A-algèbres qui ne sont pas en général de type fini (penser à K[X](0) =
K(X)). Cette famille d’algèbres est cependant suffisamment importante pour avoir reçu un
nom : on dit que ce sont les A-algèbres essentiellement de type fini.
Exercice 6.4. — Soit A un anneau intègre. Montrer
\ \
A= Ap = Am ,
p⊆A premier m⊆A maximal

où les intersections sont prises dans le corps des fractions de A.

Exercice 6.5. — Soit A un anneau et soit S ⊆ A une partie multiplicative.


a) Si A est principal et que S ne contient pas 0, montrer que l’anneau S −1 A est principal.
b) Si A est factoriel et que S ne contient pas 0, montrer que l’anneau S −1 A est factoriel.
c) Si A est noethérien, montrer que l’anneau S −1 A est noethérien.

Exercice 6.6 (Un anneau noethérien de dimension infinie (Nagata)). — Soit K un corps et
soit A = K[(Xn )n∈N ] l’anneau de polynômes en une infinité de variables. Soit (un )n∈N une
suite tendant vers l’infini, avec u1 = 0. On note pn l’idéal premier (Xun + 1, . . . , Xun+1 ), puis
S le complémentaire de la réunion des pn , et B = S −1 A.
a) Quels sont les idéaux maximaux de B ?
b) Calculer la dimension de Krull de B et montrer qu’elle peut être infinie si la suite (un )
est bien choisie.
c) Soit R un anneau dont les localisés en tout idéal maximal sont noethériens et tel que pour
tout x ∈ R, il existe un nombre fini d’idéaux maximaux contenant x. Montrer que R est
noethérien.
7. HAUPTIDEALSATZ 99

d) Montrer que l’anneau B construit ci-dessus est noethérien.

Nous aurons aussi besoin plus tard du petit lemme suivant.

Lemme 6.7. — Soit A ,→ B une extension d’anneaux, soit S une partie multiplicative de A
(donc de B) et soit J un idéal de B. On a
(J ∩ A)S −1 A = JS −1 B ∩ S −1 A.

Nous avons fait dans cet énoncé les abus de notation habituels signalés plus haut.

Démonstration. — Il est clair que (J ∩ A)S −1 A est contenu dans JS −1 B ∩ S −1 A. Les


éléments de JS −1 B sont les x/s, avec x ∈ J et s ∈ S. Si cet élément est dans S −1 A, il
existe s0 , t ∈ S et a ∈ A tels que (xs0 − as)t = 0. On a alors ast = xs0 t ∈ J ∩ A et
x/s = (xs0 t)/(ss0 t) ∈ (J ∩ A)S −1 A, ce qui montre le lemme.

7. Hauptidealsatz

Le nom de ce paragraphe signifie en allemand « théorème de l’idéal principal ». Il majore


la hauteur d’un idéal principal dans un anneau noethérien.
Rappelons que la hauteur d’un idéal premier p dans un anneau A est le supremum des
longueurs n des chaînes d’idéaux premiers de A terminant en p, c’est-à-dire du type p =
pn ) · · · ) p1 ) p0 . C’est aussi la dimension de Krull de l’anneau local Ap . Si I ( A est un
idéal propre, on notera encore ht(I) l’infimum des hauteurs ht(p), où p est un idéal premier
de A contenant I. On a toujours l’inégalité
ht(I) + dim(A/I) ≤ dim(A).
De nouveau, dans les « bons » anneaux (où l’on a égalité), il faut penser à la hauteur de I
comme à sa « codimension » : elle est égale à dim(Spec(A)) − dim(V (I)).

Théorème 7.1 (Krulls Hauptidealsatz). — Soit A un anneau noethérien et soit a un élé-


ment de A. Pour tout idéal premier minimal p contenant (a), on a ht(p) ≤ 1. En particulier,
si a n’est pas inversible, ht((a)) ≤ 1.

Démonstration. — Soit p un idéal premier minimal contenant (a). Raisonnons par l’absurde
et supposons qu’il existe une chaîne p = p2 ) p1 ) p0 d’idéaux premiers de A. Si on
remplace A par A/p0 , on se ramène au cas p0 = 0 (l’anneau est en particulier intègre) ; si
on remplace ensuite A par Ap , on se ramène finalement au cas où A est un anneau intègre
local noethérien d’idéal maximal m avec un élément a tel que m est le seul idéal premier de
A contenant a. Autrement dit, l’anneau B := A/(a) a un seul idéal premier. Nous utiliserons
les notations et résultats de l’exerc. 4.13.
100 CHAPITRE III. ANNEAUX

Prenons b ∈ p1 non nul. Soit n ∈ N∗ ; nous allons considérer M := A/(an ) comme


un B-module. Notons M1 le noyau de son endomorphisme « multiplication par b », M3 son
image et M2 := M/M3 son conoyau. On a
M1 = {x ∈ M | xb ∈ (an )} ' ((an ) : b)/(an ),
A/(an ) bA/(an ) ' A/(an , b).
 
M2 =
Comme M3 ' M/M1 et M2 = M/M3 , nous avons d’autre part (exerc. 4.13.e))

`(M1 ) = `(M ) − `(M3 ) = `(M2 ) + `(M3 ) − `(M3 ) = `(M2 ),
de sorte que `(M1 ) = `(M2 ).
D’autre part, pour tout x ∈ M1 , il existe y ∈ A tel que xb = yan . On a en particulier
y ∈ ((b) : an ). Comme x est bien défini à addition d’un multiple de an près et que A est
intègre, x est bien défini à addition d’un multiple de b près et l’association x 7→ y définit un
isomorphisme ((an ) : b)/(an ) ' ((b) : an )/(b) de A-modules.
Comme A est noethérien, la suite croissante d’idéaux ((b) : an ) de A est stationnaire, donc
((b) : an ) = ((b) : an+1 ) pour un entier n > 0 assez grand. On en déduit un isomorphisme
((an ) : b)/(an ) ' ((an+1 ) : b)/(an+1 )
de A-modules, donc aussi de B-modules. Ils ont donc la même longueur. Il s’ensuit que les B-
modules A/(an , b) et A/(an+1 , b) ont aussi la même longueur. Cela entraîne (exerc. 4.13.e))
que la surjection canonique A/(an+1 , b) → A/(an , b) est un isomorphisme, donc que l’on
a (an , b) = (an+1 , b). Il existe donc des éléments x et y de A tels que an = xan+1 + yb,
c’est-à-dire an (1 − xa) = by.
Mais 1 − xa est une unité de A (lemme 3.7), donc an ∈ (b) ⊆ p1 et a ∈ p1 . Mais c’est
absurde car p est un idéal premier minimal contenant a. Ceci termine donc la démonstration.

On généralise le théorème précédent ainsi.


Théorème 7.2. — Soit A un anneau noethérien et soit I un idéal propre de A engendré par
n éléments. Pour tout idéal premier minimal p contenant I, on a ht(p) ≤ n. En particulier,
ht(I) ≤ n.

Dans un « bon » anneau A, ce théorème dit que la partie fermée de Spec(A) correspondant
à un idéal engendré par n éléments est de codimension au plus n (cor. 14.7).
On n’a bien sûr pas toujours égalité (on peut toujours ajouter des générateurs « inutiles ») ;
plus sérieusement, si ht(I) = n, il n’est pas toujours possible d’engendrer I avec seulement
n éléments (8) .

8. Si K un corps, l’idéal (XY, Y Z, ZX) de l’anneau K[X, Y, Z] est de hauteur 2 (cf. exerc. 4.27 et cor. 14.2),
mais ne peut être engendré par 2 éléments (c’est difficile à montrer !).
7. HAUPTIDEALSATZ 101

Démonstration. — On procède par récurrence sur n, le cas n = 1 étant le théorème pré-


cédent. Comme dans la preuve précédente, on se ramène au cas où A est un anneau intègre
local noethérien d’idéal maximal m ; si a1 , . . . , an engendrent un idéal I ⊆ m tel que m est
le seul idéal premier de A contenant I, il s’agit de montrer ht(m) = dim(A) ≤ n.
Supposons au contraire qu’il existe une chaîne m = pm ) · · · ) p1 ) (0) d’idéaux pre-
miers de A avec m > n. Comme A est noethérien, on peut supposer que pm−1 est maximal
parmi tous les idéaux premiers strictement contenus dans m. L’idéal pm−1 ne contient pas
tous les ai ; supposons an ∈
/ pm−1 . L’idéal pm−1 + (an ) n’est alors contenu dans aucun autre
idéal premier de A autre que m, qui est donc son radical (lemme 3.2.b)).
Pour chaque i ∈ {1, . . . , n − 1}, on a ai ∈ m ; il existe donc un entier r > 0 tel que
ari ∈ pm−1 + (an ) pour tout i. On écrit ari ∈ xi + yi an , avec xi ∈ pm−1 et yi ∈ A.
On a (ar1 , . . . , arn−1 , an ) = (x1 , . . . , xn−1 , an ), donc le seul idéal premier de A contenant
(x1 , . . . , xn−1 , an ) est m.
Posons J := (x1 , . . . , xn−1 ). Dans l’anneau quotient A := A/J, cela signifie que le
seul idéal premier de A contenant l’idéal principal (an ) est m := m/J. Le th. 7.1 entraîne
ht(m) ≤ 1. Comme on a m ) pm−1 /J, cela signifie que pm−1 est un idéal premier minimal
contenant J. L’hypothèse de récurrence entraîne alors m − 1 ≤ n − 1, d’où le théorème.

Corollaire 7.3. — La hauteur de tout idéal propre d’un anneau noethérien est finie.

Corollaire 7.4. — La dimension d’un anneau local noethérien est finie.


Exercice 7.5. — Soit A un anneau local noethérien d’idéal maximal m. On pose B = A[X].
Soit I un idéal de A de radical m et soit J un idéal de B contenu dans mB tel que J + XB =
IB + XB.
a) Montrer que mB + XB est un idéal maximal de B qui est le radical de IB + XB.
b) Dans l’anneau B := B/J, montrer que l’idéal (mB + XB)/J est un idéal premier
minimal contenant l’idéal principal (X).
c) En déduire que mB est un idéal premier minimal contenant J (Indication : on pourra
utiliser le th. 7.1).

Exercice 7.6 (Eagon-Northcott). — Soit A un anneau noethérien et soit M ∈ Mm×n (A) une
matrice à coefficients dans A. Soit I l’idéal de A engendré par les r × r mineurs de M . Le but
de cet exercice est de montrer que pour tout idéal premier minimal p contenant I, on a (9)
ht(p) ≤ (m − r + 1)(n − r + 1).
a) Montrer que cette inégalité est vraie lorsque m = 1. On procède par récurrence sur m.
b) Montrer que l’inégalité est vraie lorsque r = 1.
c) Montrer qu’on peut supposer A local d’idéal maximal m = p, égal au radical de I.

9. Si l’on utilise le th. 10.2, la prop. 10.9 et le cor. 14.2, ce résultat entraîne que lorsque K est un corps algébri-
quement clos, le fermé de Mm×n (K) ' K mn constitué des matrices de rang ≤ s est de codimension au plus (en
fait exactement) (m − s)(n − s) (il est défini par l’annulation des (s + 1) × (s + 1) mineurs).
102 CHAPITRE III. ANNEAUX

d) Montrer que si un des coefficients de M est une unité de A, l’inégalité est vraie (Indica-
tion : on pourra utiliser des opérations élémentaires pour se ramener à une matrice de taille
(m − 1) × (n − 1)).
e) On suppose r > 1 et que tous les coefficients de M sont dans m, et on pose B = A[X].
Soit N ∈ Mm×n (B) la matrice obtenue à partir de M en changeant le coefficient a11 en
a11 + X, et soit J l’idéal de B engendré par les r × r mineurs de N . Montrer J ⊆ mB et
J + XB = IB + XB. En déduire ht(mB) ≤ (m − r + 1)(n − r + 1) (Indication : on
pourra utiliser l’exerc. précédent, puis travailler dans l’anneau local BmB et utiliser d)).
f) Montrer ht(m) ≤ ht(mB) et conclure.

Exercice 7.7 (Anneaux locaux réguliers). — Soit A un anneau local noethérien d’idéal maxi-
mal m. On note κ le corps A/m (on l’appelle le corps résiduel de l’anneau local A).
a) Montrer que m/m2 est naturellement muni d’une structure de κ-espace vectoriel de di-
mension finie.
b) Montrer que dimκ m/m2 est égal au nombre minimum de générateurs de l’idéal m de A
(Indication : on pourra utiliser le lemme de Nakayama (th. II.3.8)).
c) Montrer dim(A) ≤ dimκ m/m2 . On dit que l’anneau local A est régulier s’il y a égalité.
d) Soient m et n des entiers strictement positifs et soit A le localisé de l’anneau quotient
C[X, Y ]/(X m −Y n ) en l’idéal maximal (X, Y ). Avec les notations précédentes, calculer
dimκ m/m2 en fonction de m et n. Déterminer les paires (m, n) pour lesquelles l’anneau
A est régulier (Indication : on pourra utiliser le fait que l’anneau A est de dimension 1 (cor.
11.15)).

8. Extensions finies et entières d’anneaux

Soit A un anneau et soit B une A-algèbre, c’est-à-dire un anneau muni d’un morphisme
d’anneaux A → B.

Définition 8.1. — Soit A un anneau et soit B une A-algèbre.


a) On dit que B est une A-algèbre de type fini si elle peut être engendrée, en tant que
A-algèbre, par un nombre fini d’éléments.
b) On dit que B est une A-algèbre finie si elle peut être engendrée, en tant que A-module,
par un nombre fini d’éléments.

Pour être tout-à-fait explicite, B est une A-algèbre de type fini s’il existe des éléments
x1 , . . . , xn de B tels que tout élément de B puisse s’écrire P (x1 , . . . , xn ), où P est un poly-
nôme en n variables à coefficients dans A. De façon équivalente, la A-algèbre B est quotient
d’un algèbre de polynômes A[X1 , . . . , Xn ].
Rappelons que l’anneau de séries formelles A[[X]] n’est jamais une A-algèbre de type fini
(lorsque A est non nul ! ; cf. cor. 10.8).
De même, B est une A-algèbre finie s’il existe des éléments x1 , . . . , xn de B tels que tout
élément de B puisse sécrire a1 x1 + · · · + an xn , avec a1 , . . . , an ∈ A. De façon équivalente,
8. EXTENSIONS FINIES ET ENTIÈRES D’ANNEAUX 103

le A-module B est quotient d’un A-module libre de type fini An . Une telle algèbre est bien
sûr de type fini, mais la réciproque est fausse en général : la A-algèbre A[X] est de type fini,
mais n’est pas finie.

Définition 8.2. — Soit A un anneau et soit B une A-algèbre.


a) On dit qu’un élément x de B est entier sur A s’il existe un polynôme unitaire P ∈ A[X]
tel que P (x) = 0.
b) On dit que B est entier sur A si tout élément de B est entier sur A.

On dira qu’une A-algèbre B est une extension de A si l’application canonique A → B est


injective. On notera alors A ,→ B.
Si A ,→ B est une extension de corps, elle est entière si et seulement si elle est algébrique,
tandis que les deux définitions de « finie » coïncident.

Proposition 8.3. — Soit A ,→ B une extension d’anneaux et soit x ∈ B. Les propriétés


suivantes sont équivalentes :
(i) x est entier sur A ;
(ii) A[x] est une A-algèbre finie ;
(iii) il existe une A-algèbre finie C telle que A[x] ⊆ C ⊆ B.

Démonstration. — Supposons x entier sur A. Il est alors annulé par un polynôme unitaire
de degré n et on vérifie que le A-module A[x] est (libre,) engendré par {1, x, . . . , xn−1 }.
Comme (ii) entraîne trivialement (iii), il reste à montrer que (iii) entraîne (i).
Appliquons le théorème de Cayley-Hamilton (th. II.3.2) à l’endomorphisme u du A-
module C donné par la multiplication par x. Il fournit un polynôme unitaire P ∈ A[X]
tel que P (u) = 0. Mais alors P (x) = P (u)(1) s’annule.

Corollaire 8.4. — Une extension d’anneaux finie est entière.

Proposition 8.5. — Soient A ,→ B ,→ C des extensions d’anneaux.


a) Si les extensions A ,→ B et B ,→ C sont finies, il en est de même pour l’extension
A ,→ C.
b) Si les extensions A ,→ B et B ,→ C sont entières, il en est de même pour l’extension
A ,→ C.
c) Si b1 , . . . , bn sont des éléments de B entiers sur A, la A-algèbre A[b1 , . . . , bn ] est finie.

Démonstration. — La démonstration de a) est la même que dans le cas des corps (cf. preuve
du th. I.2.2) : si (bi )i∈I engendre le A-module B et que (cj )j∈J engendre le B-module C,
alors (bi cj )(i,j)∈I×J engendre le A-module C.
Le point c) résulte de a) et de la prop. 8.3, par récurrence sur n.
104 CHAPITRE III. ANNEAUX

Enfin, supposons les extensions A ,→ B et B ,→ C entières et soit x ∈ C. Comme il est


entier sur B, il existe une relation
xn + bn−1 xn−1 + · · · + b1 x + b0 = 0.
Comme les bi sont entiers sur A, la A-algèbre A[b1 , . . . , bn ] est finie. Comme x est en-
tier sur cette algèbre, A[b1 , . . . , bn , x] est finie sur A[b1 , . . . , bn ]. Par a), il en résulte que
A[b1 , . . . , bn , x] est finie sur A, donc x est entier sur A par cor. 8.4. Ceci montre b) et termine
la démonstration de la proposition.

La réciproque du point b) est vraie : si l’extension A ,→ C est entière, tout élément de


C est entier sur A, donc sur B, de sorte que l’extension B ,→ C est entière ; de même, tout
élément de B est entier sur A, de sorte que l’extension A ,→ B est entière.
Si l’extension A ,→ C est finie, C est un A-module de type fini, donc aussi un B-module
de type fini, de sorte que l’extension B ,→ C est entière. L’extension A ,→ B est entière si A
est noethérien (parce qu’un sous-module d’un A-module de type fini est alors encore de type
fini ; cf. exerc. 2.3), mais pas en général (10) .
On a aussi l’analogue du cor. I.2.9.

Corollaire 8.6. — Toute extension d’anneaux A ,→ B engendrée par un nombre fini d’élé-
ments entiers sur A est finie, donc entière. En particulier, toute extension d’anneaux entière
et de type fini est finie.

Démonstration. — Ce n’est qu’une réécriture de la prop. 8.5.c).

Corollaire 8.7. — Soit A ,→ B une extension d’anneaux. L’ensemble des éléments de B


entiers sur A est un sous-anneau de B, extension entière de A appelée clôture intégrale de A
dans B.

On dit que A est intégralement clos dans B si sa clôture intégrale dans B est A, c’est-
à-dire que tout élément de B entier sur A est dans A. La clôture intégrale de A dans B est
intégralement close dans B (pourquoi ?).

Démonstration. — Si x et y sont des éléments de B entiers sur A, la A-algèbre A[x, y] est


finie par prop. 8.5.c), donc ses éléments x − y et xy sont entiers sur A (cor. 8.4).

Nous aurons besoin plus loin du résultat suivant.

10. Voici un exemple. Soit J un idéal d’un anneau A qui n’est pas engendré par un nombre fini d’éléments. Soit
C la A-algèbre finie A[X]/(X 2 ) et soit B la sous-A-algèbre de C engendrée par 1 et JX, c’est-à-dire {a + rX |
a ∈ A, r ∈ J}. Le A-module quotient B/A est isomorphe à J, donc n’est pas de type fini ; il s’ensuit que le
A-module B n’est pas non plus de type fini (merci à Jin Lie pour cet exemple !).
8. EXTENSIONS FINIES ET ENTIÈRES D’ANNEAUX 105

Lemme 8.8. — Soit A ,→ B une extension d’anneaux entière et soit S une partie multipli-
cative de A (donc de B). L’extension d’anneaux S −1 A ,→ S −1 B est entière.

Démonstration. — Soit x/s un élément de S −1 B. L’élément x de B est entier sur A donc il


existe une relation
xn + an−1 xn−1 + · · · + a1 x + a0 = 0
avec a0 , . . . , an−1 ∈ A. On a alors

(x/s)n + (an−1 /s)(x/s)n−1 + · · · + (a1 /sn−1 )(x/s) + (a0 /sn ) = 0

dans S −1 A, de sorte que x/s est entier sur cet anneau.

Exercice 8.9. — Soit A ,→ B une extension d’anneaux entière et soit S une partie multiplica-
tive de A.
a) Si l’extension A ,→ B est finie, l’extension S −1 A ,→ S −1 B est finie.
b) Si A est intégralement clos dans B, l’anneau S −1 A est intégralement clos dans S −1 B.

Exercice 8.10. — Soit A ,→ B une extension finie d’anneaux intègres. Montrer que l’extension
associée KA ,→ KB des corps de fractions est finie, mais que la réciproque est fausse.

Exercice 8.11 (Lemme d’Artin-Tate). — Soit A un anneau noethérien et soient A ,→ B ,→ C


des extensions d’anneaux. On suppose que C est une A-algèbre de type fini et une B-algèbre
finie. Le but de cet exercice est de montrer que B est une A-algèbre de type fini.
Soient c1 , . . . , cm des générateurs de la A-algèbre C et soient c01 , . . . , c0n des générateurs du
B-module C. On écrit ci = j bij c0j , avec bij ∈ B et c0i c0j = k b0ijk c0k , avec b0ijk ∈ B. Soit
P P

B 0 ⊆ B la sous-A-algèbre engendrée par les bij et les b0ijk .


a) Montrer que l’anneau B 0 est noethérien.
b) Montrer que C est une extension finie de B 0 .
c) Montrer que B est une extension finie de B 0 .
d) Conclure.

Exercice 8.12. — Soit K un corps et soit A une K-algèbre de type fini. Soit G un groupe fini
agissant sur A de façon que l’action soit triviale sur K.
a) Montrer que AG := {a ∈ A | ∀g ∈ G g · a = a} est une sous-K-algèbre de A.
b) Montrer que A est une extension finie de AG (Indication : si a ∈ A, on pourra considérer
Q
le polynôme g∈G (X − g · a)).
c) Montrer que AG est une K-algèbre de type fini (Indication : on pourra utiliser l’exerc.
8.11).

Exercice 8.13. — Soit K un corps de caractéristique différente de 2. Le groupe G := Z/2Z


agit sur A := K[X, Y ] par la multiplication par −1. Identifier la sous-K-algèbre AG := {a ∈
A | ∀g ∈ G g · a = a} de A et montrer qu’elle est isomorphe à K[U, V, W ]/(U V − W 2 ).
106 CHAPITRE III. ANNEAUX

8.1. Traces d’entiers. — Soit K ,→ L une extension finie de corps. On a défini dans le §
I.5.5 la forme K-linéaire TrL/K : L → K comme l’application qui à x ∈ L associe la trace
de l’endomorphisme K-linéaire mx de L « multiplication par x ».
Proposition 8.14. — Soit A un anneau intègre de corps de fractions K et soit K ,→ L une
extension finie de corps. Si x ∈ L est entier sur A, l’élément TrL/K (x) de K est entier sur
A.

La preuve ci-dessous montre aussi que tous les coefficients du polynôme minimal de x sur
K sont entiers sur A.

Démonstration. — Il ressort du th. I.5.28 que l’on a


TrL/K (x) = [L : K(x)] TrK(x)/K (x).
On peut donc supposer L = K(x). On a vu au cours de la preuve du th. I.5.31 que TrL/K (x)
est alors la somme des racines (dans un corps de décomposition de P ) du polynôme minimal
P de x sur K. Comme x est aussi racine d’un polynôme unitaire Q ∈ A[X], le polynôme P
divise Q, donc toutes les racines de P sont aussi racines de Q et sont ainsi entières sur A. Il
en est donc de même pour leur somme TrL/K (x) (cor. 8.7).

8.2. Anneaux intégralement clos. —


Définition 8.15. — Un anneau est dit intégralement clos s’il est intègre et intégralement
clos dans son corps des fractions.

Exemple 8.16. — L’anneau
√ intègre A = Z[
√ 5] n’est pas intégralement clos : son corps des
fractions est K = Q[ 5], l’élément (1 + 5)/2 de K est entier sur A (il est annulé par le
2
polynôme√ X − X − 1 ∈ A[X]), mais il n’est pas dans A. Sa clôture intégrale dans K est
Z[(1 + 5)/2] (exerc. 8.20).
Exercice 8.17. — Soit A un anneau intègre. Montrer que les propriétés suivantes sont équiva-
lentes (cf. exerc. 6.4) :
(i) l’anneau A est intégralement clos ;
(ii) pour tout idéal premier p de A, l’anneau Ap est intégralement clos ;
(iii) pour tout idéal maximal m de A, l’anneau Am est intégralement clos.

Exercice 8.18. — Soit A un anneau intégralement clos de corps des fractions K et soit K ,→ L
une extension algébrique de corps. Montrer qu’un élément de L est entier sur A si et seulement
si son polynôme minimal sur K est à coefficients dans A.

Un corps de nombres L est une extension finie de Q. L’anneau des entiers de L est la
clôture intégrale B de Z dans L. C’est un anneau intégralement clos. Comme Z, l’anneau B
est de dimension 1 (th. 11.8 ; mais il existe une preuve plus simple dans ce cas particulier que
l’on peut trouver dans [L], prop. I.5.6). Enfin, il est noethérien grâce au théorème suivant.
8. EXTENSIONS FINIES ET ENTIÈRES D’ANNEAUX 107

C’est donc un anneau de Dedekind, comme défini brièvement dans le § 4. Remarquons que
le groupe abélien (B, +) est sans torsion, de type fini par le théorème, donc isomorphe à un
Zn (th. II.4.9).

Théorème 8.19. — Soit A un anneau noethérien intégralement clos, de corps de fractions


K et soit K ,→ L une extension finie séparable de K. La clôture intégrale de A dans L est
un anneau noethérien, extension finie de A.

Démonstration. — Soit B la clôture intégrale de A dans L. Soit x un élément de L. Il satis-


fait alors à une équation

xn + λn−1 xn−1 + · · · + λ1 x + λ0 = 0,

avec λn−1 , . . . , λ0 ∈ K. Soit a ∈ A 0 tel que aλi soit dans A pour tout i. On a alors

(ax)n + aλn−1 (ax)n−1 + · · · + an−1 λ1 (ax) + an λ0 = 0,

de sorte que ax est entier sur A, donc dans B. En particulier, il existe une base (b1 , . . . , bm )
du K-espace vectoriel L constituée d’éléments de B.
Posons
N := {x ∈ L | ∀j ∈ {1, . . . , m} TrL/K (xbj ) ∈ A}.
C’est un sous-A-module de L contenant B (prop. 8.14). L’extension K ,→ L étant séparable,
l’application TrL/K définit une forme K-bilinéaire symétrique non dégénérée sur L (th.
I.5.31) et il existe une base (x1 , . . . , xm ) du K-espace vectoriel L telle que TrL/K (xi bj ) =
δi,j (symbole de Kronecker). On a alors N = Ax1 + · · · + Axm , de sorte que N est un A-
module de type fini. Comme A est noethérien, B est aussi un A-module de type fini (exerc.
2.3) ; c’est ainsi une extension finie de A. C’est un anneau noethérien par cor. 2.5.

Exercice 8.20. — √ Soit d un entier


√ sans facteur carré, différent de 1.√Montrer que l’anneau des
entiers du corps Q( d) est Z[ d] si d ≡ 2 ou 3 (mod 4), et Z[(1+ d)/2] si d ≡ 1 (mod 4).


Lorsque d < 0, l’anneau des entiers de Q( d) est principal si et seulement si d ∈
{−1, −2, −3, −7, −11, −19, −43, −67, −163}. Pour d > 0, les anneaux principaux sont
beaucoup plus nombreux. En 2008, il est conjecturé qu’il en existe une infinité (11) .

Proposition 8.21. — Un anneau factoriel est intégralement clos.


La réciproque est fausse : on a vu (ex. 1.4) que l’anneau intègre Z[ −5] n’est pas facto-
riel ; mais il est intégralement clos (exerc. 8.20).

11. Pour tous les anneaux d’entiers de corps de nombres, et plus généralement pour tous les anneaux de dimension
1, le fait d’être principal ou factoriel est la même chose (exerc. 1.6).
108 CHAPITRE III. ANNEAUX

Démonstration. — Soit A un anneau factoriel. Supposons qu’un élément x/y de son corps
des fractions (avec x ∧ y = 1) soit racine d’un polynôme unitaire
X n + an−1 X n−1 + · · · + a1 x + a0 ∈ A[X].
On a alors
xn + an−1 xn−1 y + · · · + a1 xy n−1 + a0 y n = 0,
de sorte que y divise xn . La prop. 1.3 entraîne que y divise x, donc est une unité de A, de
sorte que x/y ∈ A.
Exemple 8.22. — Si K est un corps, on a vu dans l’exerc. 1.5 que le sous-anneau A =
K[X 2 , X 3 ] de K[X] n’est pas factoriel. Il n’est en fait pas intégralement clos, puisque son
corps des fractions est K(X), que X est entier sur A (il est annulé par le polynôme T 2 −X 2 ∈
A[T ]), mais qu’il n’est pas dans A.
Théorème 8.23. — Soit A un anneau intégralement clos. L’anneau A[X] est intégralement
clos.

Démonstration. — Commençons par deux lemmes.


Lemme 8.24. — Soit A ,→ B une extension d’anneaux et soit P un élément de A[X] tel que
P = QR, où Q et R sont des polynômes unitaires de B[X]. Les coefficients de Q et de R
sont entiers sur A.

Démonstration. — Notons B1 l’anneau B[T ]/(Q). Comme Q est unitaire, c’est un B-module
libre de rang deg(Q) et l’application B → B1 est en particulier injective. Si α1 est la classe
de T dans B1 , on a Q(X) = (X − α1 )Q1 (X) dans B1 [X]. En répétant cette construction,
Q
on a obtient une extension finie d’anneaux B ,→ C dans laquelle Q(X) = j (X − αj )
Q
et R(X) = k (X − βk ) sont scindés. Les αj et βk sont entiers sur A car annulés par P ,
donc aussi les coefficients de Q et de R, puisque ce sont des polynômes en les αj et βk (cor.
8.7).

On en déduit immédiatement le lemme suivant, qui est une version du « lemme de Gauss »
(lemme I.1.9) pour les anneaux intégralement clos.
Lemme 8.25. — Soit A un anneau intégralement clos de corps des fractions K et soit P ∈
A[X] tel que P = QR, où Q et R sont des polynômes unitaires de K[X]. Alors Q et R sont
dans A[X].

Revenons à la démonstration du théorème. Si K est le corps des fractions de A, celui


de A[X] est K(X). On prend donc un élément P de K(X) entier sur A[X] et il s’agit de
montrer qu’il est dans A[X]. Comme K[X] est principal, donc intégralement clos (cor. 2.14
et prop. 8.21), P ∈ K[X] et on a une relation
P n + An−1 P n−1 + · · · + A1 P + A0 = 0,
9. LEMME DE NORMALISATION DE NOETHER 109

où A0 , . . . , An−1 ∈ A[X]. On peut donc écrire A0 comme le produit de P et d’un autre po-
lynôme. Malheureusement, on ne peut pas appliquer le lemme 8.24, puisque ces polynômes
n’ont aucune raison d’être unitaires. L’astuce consiste à poser Q = P − X m , où m est un
entier > max(deg(P ), deg(A0 ), . . . , deg(An−1 )). On a alors

0 = (X m + Q)n + An−1 (X m + Q)n−1 + · · · + A1 (X m + Q) + A0 ,

qui peut se réécrire


Qn + Bn−1 Qn−1 + · · · + B1 Q + B0 = 0,
avec
B0 = A0 + A1 X m + · · · + An−1 X m(n−1) + X mn ∈ A[X].
Le choix de m entraîne que −Q et B0 sont unitaires, puis le lemme 8.24 que Q est dans
A[X], c’est-à-dire P ∈ A[X].

Exercice 8.26. — Soit A un anneau factoriel dans lequel 2 est inversible et soit a ∈ A un

élément divisible par le carré d’aucun élément irréductible de A. Montrer que l’anneau A[ a] :=
2
A[X]/(X − a) est intégralement clos (Indication : utiliser l’exerc. 8.18).

Exercice 8.27. — Soit A un anneau intègre sur lequel agit un groupe fini G. On note AG l’an-
neau des invariants, c’est-à-dire AG := {a ∈ A | ∀g ∈ G g · a = a}.
a) Montrer que l’action de G sur A s’étend de façon unique en une action sur son corps des
fractions KA .
b) Montrer que le corps des fractions KAG de AG est un sous-corps du corps des invariants
G
KA .
G
c) Montrer que l’on a en fait KAG = KA .
d) Si A est intégralement clos, montrer que AG est intégralement clos.

9. Lemme de normalisation de Noether

Soit K un corps et soit A une K-algèbre. Des éléments a1 , . . . , an de A sont dits algébri-
quement indépendants si
 
∀P ∈ K[X1 , . . . , Xn ] P (a1 , . . . , an ) = 0 ⇒ P = 0 .

En d’autres termes, la sous-extension K[a1 , . . . , an ] ⊆ A est isomorphe à K[X1 , . . . , Xn ].


Dans le cas contraire, on dit que a1 , . . . , an sont algébriquement liés.

Théorème 9.1 (Lemme de normalisation d’E. Noether). — Soit K un corps et soit A une
K-algèbre de type fini. Il existe des éléments algébriquement indépendants a1 , . . . , an de A
tels que A soit une extension finie de K[a1 , . . . , an ].
110 CHAPITRE III. ANNEAUX

En d’autres termes, l’extension K ,→ A se décompose en K ,→ K[a1 , . . . , an ] ,→ A où


la première extension est dite transcendante pure et la seconde est finie. L’extension intermé-
diaire K[a1 , . . . , an ] n’est pas unique, mais l’entier n l’est : nous montrerons plus tard (cor.
11.13) que c’est la dimension de Krull de A.
La démonstration ci-dessous est due à Nagata (1962). La démonstration originale d’E.
Noether (1926) supposait K infini.

Démonstration. — Elle repose sur le lemme suivant.

Lemme 9.2. — Soit A une K-algèbre de type fini engendrée par des éléments x1 , . . . , xm
algébriquement liés. Il existe des éléments y1 , . . . , ym−1 de A tels que xm est entier sur
A0 := K[y1 , . . . , ym−1 ] et A = A0 [xm ].

Montrons comment ce lemme entraîne le théorème. Supposons A engendrée par des élé-
ments x1 , . . . , xm et procédons par récurrence sur m. Si les xi sont algébriquement indépen-
dants, on les prend pour les ai et A est une extension transcendante pure de K. S’ils sont
algébriquement liés, on applique le lemme : il existe y1 , . . . , ym−1 ∈ A tels que A est fini
sur A0 := K[y1 , . . . , ym−1 ]. L’hypothèse de récurrence s’applique à A0 : il existe des élé-
ments algébriquement indépendants a1 , . . . , an ∈ A0 tels que A0 soit une extension finie de
K[a1 , . . . , an ]. La prop. 8.5.a), appliquée aux extensions finies
K[a1 , . . . , an ] ,→ A0 ,→ A,
permet alors de terminer la démonstration du théorème.

Démonstration du lemme. — Soit P ∈ K[X1 , . . . , Xm ] non nul tel que P (x1 , . . . , xm ) =


i
0. On cherche les yi sous la forme yi = xi − xem , pour 1 ≤ i ≤ m − 1, où e est un entier
suffisamment grand. Pour tout choix de e, on a A = K[y1 , . . . , ym−1 , xm ]. En outre,
m−1
0 = P (y1 + xem , . . . , ym−1 + xem , xm ) =: Q(y1 , . . . , ym−1 , xm ).
Posons A0 := K[y1 , . . . , ym−1 ]. On aimerait que le coefficient dominant du polynôme
Q(y1 , . . . , ym−1 , X), vu comme élément de A0 [X], soit inversible dans A0 (car cela impli-
querait que xm est entier sur A0 ). On a pour tout monôme
 m−1 
e i ri
Y
X1r1 · · · Xm
rm
= (Yi + Xm ) Xm rm

i=1
2
r +···+rm−1 em−1 +rm
= Y1r1 m−1
· · · Ym−1 rm
Xm r1 e+r2 e
+ · · · + Xm .
Le dernier terme est l’unique terme de plus haut degré en Xm . Si e est strictement plus grand
que tous les exposants ri qui apparaissent dans les monômes de P , le degré r1 e + r2 e2 +
· · · + rm−1 em−1 + rm détermine les ri uniquement : ce sont les chiffres de son écriture en
base e. Dans ce cas, des monômes distincts de P donnent des puissances distinctes de Xm
9. LEMME DE NORMALISATION DE NOETHER 111

dans Q. Une seule de ces puissances est maximale et elle apparaît avec un coefficient dans
K ∗.

La clôture intégrale d’un anneau noethérien intègre n’est pas toujours un anneau noethé-
rien (encore un contre-exemple dû à Nagata !). Nous allons déduire du lemme de Noether que
dans le cas « géométrique », ce genre de pathologie n’arrive heureusement pas.

Corollaire 9.3. — Soit K un corps, soit A une K-algèbre intègre de type fini, de corps des
fractions KA , et soit KA ,→ L une extension finie. La clôture intégrale de A dans L est une
K-algèbre intègre de type fini, extension finie de A.

Démonstration. — D’après le th. 9.1, il existe des éléments algébriquement indépendants


a1 , . . . , an de A tels que A soit une extension finie de l’anneau K[a1 , . . . , an ] ; ce dernier
est isomorphe à un anneau de polynômes K[X1 , . . . , Xn ], donc est noethérien intégralement
clos. Le corps KA est alors une extension finie de K(a1 , . . . , an ) (exerc. 8.10), de sorte que
L est aussi une extension finie de K(a1 , . . . , an ). La clôture intégrale B de A dans L est
aussi la clôture intégrale de K[a1 , . . . , an ] dans L (les éléments de L entiers sur A sont les
mêmes que les éléments de L entiers sur K[a1 , . . . , an ] par la prop. 8.5.b)).
Si la caractéristique de K est nulle, l’extension finie K(a1 , . . . , an ) ,→ L est séparable, et
B est, par le th. 8.19, un anneau noethérien, extension finie de K[a1 , . . . , an ], donc de A.
Reste à traiter le cas plus compliqué où la caractéristique de K est un nombre premier p >
0. Comme expliqué dans le cas de caractéristique nulle, on peut supposer A = K[a1 , . . . , an ],
isomorphe à un anneau de polynômes K[X1 , . . . , Xn ]. Comme A est noethérien, un sous-A-
module d’un A-module de type fini est encore de type fini (exerc. 2.3), donc on peut aussi
remplacer pour la preuve L par une extension finie, par exemple par sa clôture normale dans
une clôture algébrique. L’extension finie KA ,→ L est alors normale. Soit G := Gal(L/KA )
le groupe de ses KA -automorphismes ; l’extension L0 := LG ,→ L est galoisienne (lemme
d’Artin ; th. 6.28) donc séparable.
Montrons tout d’abord le résultat pour la clôture intégrale B 0 de A dans L0 . Considérons
des générateurs y1 , . . . , ym de l’extension KA ,→ L0 . Par l’exerc. I.6.30, il existe un entier
r r
r > 0 tel que tous les yip sont dans KA . On peut écrire yip = Pi /Qi , où Pi et Qi sont dans
A = K[a1 , . . . , an ]. Soient t1 , . . . , ts ∈ K tous les coefficients non nuls qui interviennent
−r −r
dans ces polynômes. Notons K 0 := K(tp1 , . . . , tps ) (où les racines pr -ièmes sont prises
dans une clôture algébrique de L0 ) ; c’est une extension finie de K, et
L0 = KA (y1 , . . . , ym )
−r −r −r −r
⊆ KA (P1p , Qp1 , . . . , Pm
p
, Qpm )
−r −r −r −r
⊆ KA (tp1 , . . . , tps , ap1 , . . . , apn )
−r −r
= K 0 (a1p , . . . , anp ) =: L00 .
112 CHAPITRE III. ANNEAUX

La clôture intégrale B 0 de A dans L0 est contenue dans la clôture intégrale de A dans L00 .
Comme l’extension de corps K ,→ K 0 est finie, l’extension d’anneaux A = K[a1 , . . . , an ] ,→
−r −r
K 0 [a1 , . . . , an ] est aussi finie. L’extension d’anneaux K 0 [a1 , . . . , an ] ,→ K 0 [ap1 , . . . , apn ]
−r −r
est aussi finie, donc l’extension composée A ,→ K 0 [ap1 , . . . , apn ] est finie (prop. 8.5.a)),
−r −r
donc entière. Comme l’anneau K 0 [ap1 , . . . , apn ] est intégralement clos (dans son corps des
fractions L00 ), c’est la clôture intégrale de A dans L00 , qui est ainsi un A-module de type fini.
Comme A est noethérien, cela entraîne que son sous-A-module B 0 est aussi de type fini.
Comme B est la clôture intégrale de B 0 dans L, l’argument employé en caractéristique
nulle entraîne que l’extension B 0 ,→ B est finie, donc aussi l’extension composée A ,→
B 0 ,→ B. L’anneau B est en particulier une A-algèbre de type fini, donc aussi une K-algèbre
de type fini.

Exercice 9.4. — Soit K un corps et soit A une K-algèbre intègre essentiellement de type fini
(rem. 6.3). Montrer que la clôture intégrale de A dans son corps de fractions est une extension
finie de A.

Remarque 9.5 (Anneaux excellents). — La finitude de la clôture intégrale est une propriété
essentielle pour pouvoir construire ce que l’on appelle la « normalisation » d’une variété en
géométrie algébrique. Elle est heureusement partagée par de nombreux anneaux noethériens,
en particulier les anneaux appelés « excellents » par Grothendieck (Éléments de géométrie
algébrique IV 2, Publ. Math. IHÉS 24 (1965), § 7.8). Cette classe d’anneau est stable par lo-
calisation et passage à une algèbre de type fini ; elle comprend aussi les anneaux de Dedekind
de caractéristique nulle (donc par exemple Z) et les anneaux de séries formelles sur un corps.

10. Théorème des zéros de Hilbert

Ce théorème fondamental (« Nullstellensatz » en allemand) prend plusieurs formes. Sa


plus frappante est celle du cor. 10.4.

Lemme 10.1. — Soit A ,→ B une extension entière d’anneaux intègres. Alors A est un
corps si et seulement si B est un corps.

Démonstration. — Supposons que A est un corps. Soit x un élément non nul de B. Comme x
est entier sur A, le A-espace vectoriel A[x] est de dimension finie et comme la multiplication
par x est une application linéaire injective (puisque B est intègre), elle est surjective. Donc 1
est atteint, et un inverse de x existe dans A[x]. Cela signifie que x est inversible dans B, qui
est donc un corps.
Inversement, supposons que B est un corps. Soit x un élément non nul de A et soit y
l’inverse de x dans B. Il est entier sur A, donc on a une relation y n +an−1 y n−1 +· · ·+a0 = 0.
10. THÉORÈME DES ZÉROS DE HILBERT 113

En multipliant par xn−1 , on obtient


y + an−1 + · · · + a0 xn−1 = 0,
ce qui prouve que y est dans A.

Théorème 10.2 (Nullstellensatz faible). — Soit K ,→ L une extension de corps telle que L
est une K-algèbre de type fini. L’extension K ,→ L est finie.

Démonstration. — Par le lemme de normalisation, il existe des éléments algébriquement


indépendants a1 , . . . , an de L tels que L soit une extension finie, donc entière (cor. 8.4), de
K[a1 , . . . , an ]. Par le lemme 10.1, K[a1 , . . . , an ] est un corps, donc n = 0.

Le Nullstellensatz entraîne que si K est un corps, pour tout idéal maximal m de l’anneau
K[X1 , . . . , Xn ], le corps K[X1 , . . . , Xn ]/m, qui est une K-algèbre de type fini, est une
extension finie de K.

Corollaire 10.3. — Soit K un corps algébriquement clos. Les idéaux maximaux de l’anneau
K[X1 , . . . , Xn ] sont les idéaux
mx := (X1 − x1 , . . . , Xn − xn )
pour x = (x1 , . . . , xn ) décrivant K n .

Démonstration. — Soit x ∈ K n . L’idéal mx est le noyau du morphisme (surjectif) d’évalua-


tion ex : K[X1 , . . . , Xn ] → K défini par ex (P ) = P (x). On a donc K[X1 , . . . , Xn ]/mx '
K et mx est donc bien un idéal maximal (quel que soit le corps K).
Inversement, si m est un idéal maximal, on a vu ci-dessus que K[X1 , . . . , Xn ]/m est une
extension finie de K, qui est donc, K étant algébriquement clos, isomorphe à K. Soit xi
l’image de Xi par cet isomorphisme. Chaque polynôme Xi − xi s’annule dans ce quotient,
donc est dans m. L’idéal maximal m(x1 ,...,xn ) est contenu dans m, donc lui est égal.

Corollaire 10.4. — Soit K un corps algébriquement clos. Considérons un système d’équa-


tions polynomiales

F1 (x1 , . . . , xn ) = 0

..
 .

Fr (x1 , . . . , xn ) = 0
à coefficients dans K. Pour que ce système n’admette aucune solution dans K n , il faut et il
Pr
suffit qu’il existe G1 , . . . , Gr ∈ K[X1 , . . . , Xn ] tels que i=1 Fi Gi = 1.

Démonstration. — Soit I l’idéal de K[X1 , . . . , Xn ] engendré par F1 , . . . , Fr . Pour que x ∈


K n soit solution du système, il faut et il suffit que ex (Fi ) soit nul pour tout i, c’est-à-dire que
I soit contenu dans Ker(ex ) = mx .
114 CHAPITRE III. ANNEAUX

Pour que le système n’ait pas de solution, il faut et il suffit donc que I ne soit contenu dans
aucun mx , donc dans aucun idéal maximal de K[X1 , . . . , Xn ] (cor. 10.3). Cela n’est possible
que lorsque I = K[X1 , . . . , Xn ], c’est-à-dire lorsque 1 ∈ I.

Il existe des versions « effectives » de ce résultat qui bornent a priori les degrés des poly-
nômes Gi en fonction de ceux des Fi ; c’est important du point de vue du calcul pratique des
Gi et de la preuve de leur existence (ou pas) (12) .

Exercice 10.5. — Soit K un corps quelconque et soient F1 , . . . , Fr ∈ K[X1 , . . . , Xn ] des


polynômes qui n’ont pas de zéro commun dans une clôture algébrique K de K (c’est-à-dire
n
que le système d’équations du cor. 10.4 n’a aucune solution dans K ). Montrer qu’il existe des
Pr
polynômes G1 , . . . , Gr ∈ K[X1 , . . . , Xn ] tels que i=1 Fi Gi = 1.

Corollaire 10.6. — Soit K un corps et soit I un idéal de K[X1 , . . . , Xn ]. On a


√ \
I= m.
I⊆m maximal


Rappelons que dans tout anneau, I est l’intersection des idéaux premiers contenant I
(lemme 3.2.b)).

Démonstration. — Une inclusion est claire. Soit donc P ∈ / I. Nous allons construire
un idéal maximal de K[X1 , . . . , Xn ] contenant I mais pas P . Considérons l’idéal J de
K[X1 , . . . , Xn , Xn+1 ] engendré par Xn+1 P − 1 et I. Si J = K[X1 , . . . , Xn+1 ], on peut
écrire
m
X j
(8) 1 = A(X1 , . . . , Xn+1 )(Xn+1 P − 1) + Xn+1 Fj (X1 , . . . , Xn ),
j=0

où les Fj sont tous dans I. Considérons le morphisme d’anneaux


K[X1 , . . . , Xn , Xn+1 ] → K(X1 , . . . , Xn )
qui envoie Xi sur Xi pour 1 ≤ i ≤ n et Xn+1 sur 1/P . L’image de (8) par ce morphisme se
réécrit, dans K[X1 , . . . , Xn ],
m
X
Pm = P m−j Fj (X1 , . . . , Xn ),
j=0

ce qui contredit le fait que P n’est pas dans I. On a donc J 6= K[X1 , . . . , Xn+1 ] et il existe
un idéal maximal n de K[X1 , . . . , Xn+1 ] contenant J.

12. Kollár a démontré (Sharp effective Nullstellensatz, J. Amer. Math. Soc. 1 (1988), 963–975) que si
F1 , . . . , Fr ∈ K[X1 , . . . , Xn ], avec n ≥ 2, n’ont pas de zéro commun (dans une clôture algébrique de K) et
que d1 ≥ · · · ≥ dr ≥ 3, où di := deg(Fi ), il existe des polynômes G1 , . . . , Gr ∈ K[X1 , . . . , Xn ] comme dans
l’énoncé du corollaire avec deg(Fi Gi ) ≤ d1 · · · dr pour tout i.
10. THÉORÈME DES ZÉROS DE HILBERT 115

Comme on l’a vu plus haut, l’extension de corps K ,→ K[X1 , . . . , Xn+1 ]/n est finie.
Posons
m := n ∩ K[X1 , . . . , Xn ].
C’est un idéal de K[X1 , . . . , Xn ] contenant I, mais pas P (puisque 1 = Xn+1 P −(Xn+1 P −
1) ∈
/ n) et on a des inclusions
K ⊆ K[X1 , . . . , Xn ]/m ⊆ K[X1 , . . . , Xn+1 ]/n.
Le K-espace vectoriel K[X1 , . . . , Xn ]/m est donc de dimension finie, de sorte que l’an-
neau intègre K[X1 , . . . , Xn ]/m est une extension d’anneaux finie de K. C’est donc un corps
(lemme 10.1), ce qui montre que m est un idéal maximal de K[X1 , . . . , Xn ] contenant I mais
pas P .

Corollaire 10.7. — Soit K un corps et soit A une K-algèbre de type fini. Les points fermés
sont denses dans toute partie fermée de Spec(A).

Un anneau A qui vérifie la conclusion du corollaire est dit « anneau de Jacobson ».

Démonstration. — On peut écrire A comme quotient d’une algèbre de polynômes B :=


K[X1 , . . . , Xn ], de sorte que Spec(A) s’identifie à une partie fermée de Spec(B). Il suffit
donc de traiter le cas A = B.
Toute partie fermée de Spec(B) est du type V (I), où I est un idéal radical de B. L’adhé-
rence de l’ensemble des points fermés de V (I) s’écrit V (J) ⊆ V (I), où J est un idéal radical
de B contenant I.
Tous les idéaux maximaux de B qui sont dans V (I), c’est-à-dire qui contiennent I, sont
alors dans V (J), donc contiennent J. Le cor. 10.6 entraîne alors
\ \
I= m ⊇ m = J,
I⊆m maximal J⊆m maximal

d’où V (I) ⊆ V (J). Cela montre que les points fermés sont denses dans toute partie fermée
de Spec(B).

Rappelons que les points fermés ne sont en général pas denses dans le spectre d’un anneau,
même noethérien (cf. ex. 5.6). Cela nous permet d’ailleurs de démontrer un résultat déjà
évoqué pp. 72 et 102.

Corollaire 10.8. — Soit A un anneau non nul. L’anneau A[[X]] n’est pas une A-algèbre de
type fini.

Démonstration. — Quitte à quotienter par un idéal maximal de A (qui existe puisque A est
non nul), on peut supposer que A est un corps K. L’unique point fermé de Spec(K[[X]])
n’est alors pas dense, donc K[[X]] n’est pas une K-algèbre de type fini par le cor. 10.7.
116 CHAPITRE III. ANNEAUX

Lorqu’il y a beaucoup de points fermés dans le spectre d’un anneau A, on peut se limiter
à considérer le sous-ensemble
Specmax(A) := {idéaux maximaux de A}
de Spec(A), muni de la topologie induite par la topologie de Zariski. Il a l’« avantage »
psychologique que tous ses points sont fermés (13) .
Soit A une algèbre de type fini sur un corps (on dit souvent que A est une algèbre « géo-
métrique »). Notons ι : Specmax(A) ,→ Spec(A) l’injection naturelle. Pour tout fermé F de
Spec(A), on a F = ι−1 (F ) (cor. 10.7) et F est irréductible si et seulement si ι−1 (F ) l’est
(prop. 5.15).
Proposition 10.9. — Soit K un corps algébriquement clos. L’application
ϕ : K n → Specmax(K[X1 , . . . , Xn ])
qui associe à (x1 , . . . , xn ) l’idéal maximal (X1 − x1 , . . . , Xn − xn ) est une bijection. Pour
tout idéal I de K[X1 , . . . , Xn ], on a
ϕ−1 (Vmax (I)) = {x ∈ K n | ∀P ∈ I P (x) = 0}.

Démonstration. — Le fait que ϕ soit une bijection est juste le cor. 10.3. Pour le second point,
on a
ϕ−1 (Vmax (I)) = {x ∈ K n | mx ⊇ I} = {x ∈ K n | ex (I) = 0}
et ex (I) = 0 est équivalent au fait que tous les éléments de I s’annulent en x.

Toujours si K est algébriquement clos, la bijection ϕ permet de munir aussi K n d’une


topologie, encore dite de Zariski, pour laquelle les fermés sont les sous-ensembles décrits
ci-dessus, c’est-à-dire les
Vmax (I) := {x ∈ K n | ∀P ∈ I P (x) = 0}.

On a défini en général dans § 5.1 (6) des bijections réciproques


V /
{idéaux radicaux de A} o {parties fermées de Spec(A)}.
I

Lorsque A = K[X1 , . . . , Xn ], comme alors V (I) = Vmax (I), celles-ci induisent des bijec-
tions réciproques
Vmax
/
{idéaux radicaux de K[X1 , . . . , Xn ]} o {parties fermées de K n },
Imax

13. Rappelons cependant que même s’il peut sembler désagréable d’avoir à considérer l’espace topologique
Spec(A) et ses points non fermés, c’est celui qui se comporte le mieux en général : l’avantage primordial des
idéaux premiers sur les idéaux maximaux est que l’image inverse d’un idéal premier par un morphisme d’anneaux
est encore un idéal premier, alors que ce n’est pas vrai en général pour les idéaux maximaux ; c’est cet avantage
essentiel qui permet d’avoir la propriété fonctorielle de l’exerc. 5.7.a).
10. THÉORÈME DES ZÉROS DE HILBERT 117


Imax (S) := {P ∈ K[X1 , . . . , Xn ] | ∀x ∈ S P (x) = 0}.

Plus généralement, si A est une K-algèbre de type fini, on peut l’écrire sous la forme (non
unique) A = K[X1 , . . . , Xn ]/I, et Specmax(A) est homéomorphe à Vmax (I) ⊆ K n . On a
alors des bijections réciproques
Vmax
/
{idéaux radicaux de A} o {parties fermées de Vmax (I) ⊆ K n },
Imax

Exemple 10.10. — Soit K un corps algébriquement clos, soit P un élément non nul de
K[X1 , . . . , Xn ] et soit Vmax (P ) ⊆ K n l’hypersurface qu’il définit. Si
P = uP1v1 · · · Pnvn
est sa décomposition en produits d’irréductibles, on a (lemme 5.1)
Vmax (P ) = Vmax ((P1 )v1 · · · (Pn )vn ) = Vmax (P1 ) ∪ · · · ∪ Vmax (Pn ).
Comme chaque Pi est irréductible, chaque idéal (Pi ) est premier (prop. 1.3), donc chaque
Vmax (Pi ) est irréductible et ils sont distincts deux à deux (prop. 5.17) : ce sont les composantes
irréductibles de Vmax (P ) (§ 5.2). Nous montrerons dans le cor. 11.15 (cf. aussi cor. 12.5)
qu’elles sont toutes de dimension n − 1.

Exemple 10.11. — Soit K un corps algébriquement clos, soit I = (X 2 ,√ XY ) ⊆ K[X, Y ]


l’idéal considéré dans l’ex. 4.15, et soit A la K-algèbre K[X, Y ]/I. On a I = (X) et

Specmax(A) ' Vmax (I) = Vmax ( I) = {(x, y) ∈ K 2 | x = 0}.
C’est une droite dans le plan affine. Elle est irréductible (donc aussi Spec(A)).

Exemple 10.12. — Soit K un corps algébriquement clos, soit


I = (X 2 Y 3 − X 3 Y Z, Y 2 Z − XZ 2 ) ⊆ K[X, Y, Z]
l’idéal considéré p. 85, et soit A la K-algèbre K[X, Y, Z]/I. On a

I = (Y 2 − XZ) ∩ (X, Z)
et

Specmax(A) ' Vmax (I) = Vmax ( I)
= {(x, y, z) ∈ K 3 | y 2 = xz} ∪ {(x, y, z) ∈ K 3 | x = z = 0}.
C’est la réunion d’une surface quadrique et d’une droite dans l’espace affine, qui sont ses
composantes irréductibles (pourquoi ?).

Exemple 10.13. — Soit K un corps algébriquement clos et soit A la K-algèbre


K[X, Y ]/(XY ) considérée dans l’ex. 5.20. On a
Specmax(A) ' (K × {0}) ∪ ({0} × K).
118 CHAPITRE III. ANNEAUX

C’est la réunion des deux axes de coordonnées dans le plan affine, qui sont ses composantes
irréductibles.

Exemple 10.14. — Soit K un corps algébriquement clos, soit


I = (XY, Y Z, ZX) ⊆ K[X, Y, Z]
l’idéal considéré dans l’exerc. 4.27, et soit A la K-algèbre K[X, Y, Z]/I. On a
Specmax(A) ' Vmax (I) = (K × {0} × {0}) ∪ ({0} × K × {0}) ∪ ({0} × {0} × K).
C’est la réunion des trois axes de coordonnées dans l’espace affine, qui sont ses composantes
irréductibles.

Exemple 10.15. — Soit K un corps algébriquement clos et soit A la sous-K-algèbre


K[X 2 , X 3 ] de K[X] considérée dans l’ex. 8.22. Elle est de type fini, engendrée par X 2
et X 3 , avec la relation (X 2 )3 = (X 3 )2 , ce qui permet de l’écrire
A ' K[Y, Z]/(Y 3 − Z 2 ).
On a donc
Specmax(A) ' {(y, z) ∈ K 2 | y 3 = z 2 }.
C’est une courbe irréductible (pourquoi ?) plane. Le fait que l’anneau A ne soit pas inté-
gralement clos est relié au fait que cette courbe présente une singularité en (0, 0) (cf. exerc.
16.2).

Exercice 10.16. — Soit A un anneau qui est une extension de type fini de Z. Montrer que pour
tout idéal maximal m de A, le corps A/m est fini (Indication : on pourra appliquer le th. 10.2 à
la (Z/Z ∩ m)-algèbre A/m, puis montrer Z ∩ m 6= 0).

11. « Going-up » et théorème de Cohen-Seidenberg

Soit ι : A ,→ B une extension d’anneaux entière. On va étudier l’application induite


Spec(B) _q
]
ι
 
Spec(A) q∩A
Dans ce contexte, on dit souvent que l’idéal q est « au-dessus » de l’idéal p := q ∩ A (il
est traditionnel de représenter une application comme ι] « verticalement », comme ci-dessus,
avec sa source au-dessus de son but). La fibre d’un élément p de Spec(A) est (ι] )−1 (p),
c’est-à-dire l’ensemble (fermé) des idéaux de B au-dessus de p.

Lemme 11.1. — Soit q un idéal premier de B. Si ι] (q) = p, l’idéal p est maximal si et


seulement si q est maximal.
11. « GOING-UP » ET THÉORÈME DE COHEN-SEIDENBERG 119

Démonstration. — Le noyau de la composée A ,→ B → B/q est p. On a donc une extension


d’anneaux intègres A/p ,→ B/q qui est entière (le vérifier !) et le lemme résulte du lemme
10.1.

Lemme 11.2. — Soient q1 et q2 des idéaux premiers de B. Si q1 ⊆ q2 et ι] (q1 ) = ι] (q2 ),


on a q1 = q2 .

Démonstration. — Posons p := ι] (q1 ) = ι] (q2 ), idéal premier de A. Considérons la partie


multiplicative S = A p de A (et de B). On a (lemme 6.7)

pS −1 A = q1 S −1 B ∩ S −1 A = q2 S −1 B ∩ S −1 A.

Comme l’idéal pS −1 A est maximal et que l’extension S −1 A ,→ S −1 B est entière (lemme


8.8), l’idéal q1 S −1 B est maximal (lemme 11.1). Il en est de même pour l’idéal q2 S −1 B, et
comme il contient le précédent, ils sont égaux. On en déduit

q1 = (q1 S −1 B) ∩ B = (q2 S −1 B) ∩ B = q2 ,

d’où le lemme.

Lemme 11.3. — L’application ι] est surjective.

Démonstration. — On peut supposer l’anneau A non nul (puisque sinon, son spectre est
vide !). Il s’agit de montrer que pour tout idéal premier p de A, il existe un idéal premier q de
B tel que q ∩ A = p.
Considérons la partie multiplicative S = A p. L’extension S −1 A ,→ S −1 B est entière
(lemme 8.8). Si m est un idéal maximal de l’anneau (non nul !) S −1 B, l’idéal m ∩ S −1 A
est un idéal maximal de S −1 A (lemme 11.1). Cet anneau étant local, c’est pS −1 A. Posons
q := m ∩ B (c’est l’abus de notation usuel : on écrit ∩ B pour désigner l’image inverse par
B → S −1 B). On a alors (avec les mêmes abus de notation)

q ∩ A = m ∩ B ∩ A = m ∩ S −1 A ∩ A = pS −1 A ∩ A = p,

ce qui termine la preuve.

Exercice 11.4. — Soit ι : A ,→ B une extension d’anneaux.


a) Montrer que l’application ι] : Spec(B) → Spec(A) est dominante, c’est-à-dire que son
image est dense dans Spec(A).
b) Si ι est une extension entière, montrer que l’application ι] est fermée, c’est-à-dire que
pour toute partie fermée F de Spec(B), la partie ι] (F ) de Spec(A) est fermée.

Le théorème suivant est appelé dans la littérature « going-up ». Ce nom provient de sa


représentation suivante : on se demande si on peut trouver q2 qui complète le diagramme
120 CHAPITRE III. ANNEAUX

ci-dessous
Spec(B) q_1 ⊆ q_2 ?

ι]
  
Spec(A) p1 ⊆ p2
(voir th. 13.4 pour le « going-down », un énoncé analogue mais de démonstration plus déli-
cate !).

Théorème 11.5 (« Going-up »). — Soit A ,→ B une extension d’anneaux entière. Soient
p1 ⊆ p2 ⊆ A des idéaux premiers et soit q1 un idéal premier de B au-dessus de p1 . Il existe
une idéal premier q2 de B, contenant q1 , au-dessus de p2 .

Démonstration. — L’extension d’anneaux A/p1 ,→ B/q1 est entière. Par le lemme 11.3,
il existe un idéal premier de B/q1 au-dessus de l’idéal premier p2 /p1 de A/p1 . Cet idéal
correspond à un idéal premier de B contenant q1 au-dessus de p2 .

Exercice 11.6. — Soit ι : A ,→ B une extension d’anneaux. Si l’application ι] est fermée (cf.
exerc. 11.4), montrer que ι satisfait la propriété de « going-up ».

Remarque 11.7. — En termes « géométriques », la propriété de « going-up » pour une ex-


tension d’anneaux ι : A ,→ B signifie la chose suivante : pour tous fermés irréductibles
F2 ⊆ F1 de Spec(A), et tout fermé irréductible G1 ⊆ Spec(B) tel que ι] (G1 ) = F1 , il
existe un fermé irréductible G2 ⊆ G1 tel que ι] (G2 ) = F2 .

Théorème 11.8 (Cohen-Seidenberg, 1946). — Soit A ,→ B une extension d’anneaux en-


tière. On a dim(A) = dim(B).

Démonstration. — Comme A est nul si et seulement si B est nul, et que dans ce cas, ces
anneaux sont de même dimension −∞, on va supposer A et B non nuls, donc de dimension
≥ 0.
Soit qn ) · · · ) q0 une chaîne d’idéaux premiers de B. Alors

(qn ∩ A) ) · · · ) (q0 ∩ A)

est une chaîne d’idéaux premiers de A (lemme 11.2). On en déduit dim(A) ≥ dim(B).
Inversement, si on se donne une chaîne d’idéaux premiers pm ) · · · ) p0 de A, et q0 un
idéal premier de B tel que q0 ∩ A = p0 (lemme 11.3), on va montrer par récurrence sur m
qu’on peut trouver une chaîne d’idéaux premiers qm ) · · · ) q0 de B telle que qi ∩ A = pi
pour tout i. Le cas m = 0 est trivial. Si pm−1 ) · · · ) p0 est relevée en qm−1 ) · · · ) q0 ,
le th. 11.5 montre qu’il existe un idéal premier qm ) qm−1 au-dessus de pm . On a donc
dim(A) ≤ dim(B).
11. « GOING-UP » ET THÉORÈME DE COHEN-SEIDENBERG 121

Exemple 11.9. — Soit K un corps. L’extension


ι : K[X] ,→ K[X, Y ]/(X 2 + Y 2 − 1)
est finie (donc entière) puisque les classes de 1 et de Y engendrent le K[X]-module
K[X, Y ]/(X 2 +Y 2 −1). On en déduit que la dimension de Krull de l’anneau K[X, Y ]/(X 2 +
Y 2 − 1) est 1 (ex. 5.26 et th. 11.8).
Si K est algébriquement clos, l’application ι]max s’identifie à la projection
{(x, y) ∈ K 2 | x2 + y 2 = 1} −→ K
(x, y) 7−→ x.
Elle est bien surjective. Tout point a deux préimages, sauf −1 et 1, qui n’en ont qu’une.
Exercice 11.10. — Soit K un corps. Montrer que les K-algèbres K[X] et K[X, Y ]/(X 2 +
Y 2 − 1) sont isomorphes. Montrer que les R-algèbres R[X] et R[X, Y ]/(X 2 + Y 2 + 1) ne
sont pas isomorphes. Si a ∈ K, à quelle condition nécessaire et suffisante les K-algèbres K[X]
et K[X, Y ]/(X 2 + Y 2 − a) sont-elles isomorphes ?

Théorème 11.11. — Soit K un corps. Pour tout n ∈ N, la dimension de Krull de l’anneau


K[X1 , . . . , Xn ] est n.

Démonstration. — On a déjà remarqué (ex. 5.28) que cette dimension est ≥ n. Nous allons
procéder par récurrence sur n pour montrer l’égalité (qui a bien lieu pour n = 0). Supposons
donc n ≥ 1 et soit pm ) · · · ) p1 ) (0), avec m ≥ 1, une chaîne d’idéaux premiers de
A := K[X1 , . . . , Xn ] et soit P un élément non nul de p1 . Alors
pm /(P ) ) · · · ) p1 /(P )
est une chaîne d’idéaux premiers de l’anneau B := A/(P ), donc dim(B) ≥ m − 1. Soit xi
l’image de Xi dans B. Les éléments x1 , . . . , xn de B sont algébriquement liés, donc il existe
(lemme 9.2) des éléments y1 , . . . , yn−1 de B tels que xn est entier sur B 0 := K[y1 , . . . , yn−1 ]
et B = B 0 [xn ]. Le th. 11.8 donne dim(B 0 ) = dim(B).
D’autre part, B 0 est un quotient de l’algèbre de polynômes K[Y1 , . . . , Yn−1 ], donc, par
l’hypothèse de récurrence,
dim(B 0 ) ≤ dim(K[Y1 , . . . , Yn−1 ]) = n − 1.
On en déduit m − 1 ≤ dim(B) = dim(B 0 ) ≤ n − 1, ce qui donne l’inégalité cherchée.
Remarque 11.12. — On peut montrer que l’anneau de séries formelles K[[X1 , . . . , Xn ]] est
aussi de dimension n ([ZS2], th. 33 ; cf. exerc. 5.29).
Corollaire 11.13. — Toute algèbre de type fini sur un corps est de dimension de Krull finie.

Démonstration. — Soit A une telle algèbre sur un corps K. Le lemme de normalisation (th.
9.1) dit que c’est une extension finie d’un anneau de polynômes K[X1 , . . . , Xn ]. Par le th.
11.8 et le th. 11.11, on en déduit dim(A) = n.
122 CHAPITRE III. ANNEAUX

Exercice 11.14. — Soit K un corps et soit A une K-algèbre de type fini. Pour tout n ∈ N,
montrer dim(A[X1 , . . . , Xn ]) = dim(A) + n (Indication : on pourra utiliser le th. 9.1 et le th.
11.11).

Corollaire 11.15. — Soit K un corps et soit P un élément non constant de K[X1 , . . . , Xn ].


La dimension de K[X1 , . . . , Xn ]/(P ) est n − 1.

Nous donnerons dans le cor. 12.5 une autre démonstration de ce résultat.

Démonstration. — La démonstration du lemme 9.2 nous dit que la K-algèbre


A := K[X1 , . . . , Xn ]/(P ) est finie sur la sous-K-algèbre engendrée par les classes yi de
i
Yi := Xi − Xne , pour 1 ≤ i ≤ n − 1 et e  0.
Montrons que ces classes sont algébriquement indépendantes dans A. Si ce n’est pas le
cas, il existe un polynôme non nul R ∈ K[Y1 , . . . , Yn−1 ] tel que
n−1
P (X1 , . . . , Xn ) | R(X1 − Xne , . . . , Xn−1 − Xne )
dans K[X1 , . . . , Xn ], ou encore
n−1
Q(Y1 , . . . , Yn−1 , Xn ) := P (Y1 + Xne , . . . , Yn−1 + Xne , Xn ) | R(Y1 , . . . , Yn−1 )
dans K[Y1 , . . . , Yn−1 , Xn ]. Mais on a vu au cours de la preuve du lemme 9.2 que comme P
est non constant, le degré de Q, vu comme polynôme en Xn , est, pour e  0, strictement
positif. Comme R est de degré nul en Xn , on a une contradiction.
Le th. 11.8 donne dim(A) = dim(K[y1 , . . . , yn−1 ]). Comme les yi sont algébriquement
indépendants, le th. 11.11 nous donne dim(K[y1 , . . . , yn−1 ]) = n − 1, ce qui termine la
preuve du corollaire.

Soit ι : A ,→ B une extension de type fini d’anneaux intègres et soit  : KA ,→ KB


l’extension des corps de fractions associée. La condition que ι est une extension d’anneaux
finie est très forte. Elle entraîne que  est une extension de corps finie (exerc. 8.10) ; la ré-
ciproque est fausse, comme le montre l’exemple ci-dessous, mais on peut quand même dire
quelque chose. Supposons donc l’extension  finie, et soient b1 , . . . , bn des générateurs de la
A-algèbre B. Chaque bi est algébrique sur KA ; soit f un dénominateur commun à tous les
coefficients des polynôme minimaux correspondants. Chaque bi est alors algébrique sur le
localisé Af , donc l’extension Af ,→ Bf est finie (prop. 8.5.c)). En particulier, l’application
ι] : Spec(B) → Spec(A)
se restreint sur l’ouvert dense Spec(Bf ) ⊆ Spec(B) en une application
Spec(Bf ) → Spec(Af )
à laquelle on peut appliquer les résultats vus plus haut : elle est surjective (lemme 11.3),
fermée (exerc. 11.4) et à fibres finies (rem. 13.3).
12. BASES ET DEGRÉ DE TRANSCENDANCE 123

Exemple 11.16. — Soit K un corps algébriquement clos. Posons A = K[X, Y ] et B =


K[X, Y, Z]/(XZ − Y ). L’inclusion ι : A ,→ B n’est pas entière car l’application
ι]max : Specmax(B) = {(x, y, z) ∈ K 3 | xz = y} −→ K 2 = Specmax(A)
(x, y, z) 7−→ (x, y)
n’est pas surjective (lemme 11.3) : son image est {(x, y) ∈ K 2 | x 6= 0 ou x = y = 0}.
L’inclusion  : KA ,→ KB est un isomorphisme puisque Z = Y /X dans KA . L’inclusion
AX ,→ BX est aussi un isomorphisme. Cela correspond au fait que l’application
{(x, y, z) ∈ K 3 | xz = y, x 6= 0} −→ {(x, y) ∈ K 2 | x 6= 0}
induite par ι]max est un isomorphisme.
Exercice 11.17. — Soit K un corps. Soit A le sous-anneau de K[X, Y ] engendré par les X n Y ,
pour n ∈ N∗ (il n’est pas noethérien par l’exerc. 2.6). Montrer que l’extension d’anneaux in-
tègres A ,→ K[X, Y ] n’est pas de type fini, mais qu’elle induit un isomorphisme entre les corps
de fractions.

12. Bases et degré de transcendance

On s’intéresse ici aux extensions de corps qui ne sont pas algébriques, en définissant leur
degré de transcendance. Nous faisons ensuite le lien entre ce degré et la dimension des al-
gèbres intègres de type fini sur un corps.

Définition 12.1. — Soit K ⊆ L une extension de corps. Une partie B de L est une base de
transcendance de L sur K si
– les éléments de B sont algébriquement indépendants sur K (14) ;
– le corps L est une extension algébrique du corps K(B).

Par exemple, {X1 , . . . , Xn } est une base de transcendance de K(X1 , . . . , Xn ) sur K,


tandis que ∅ est une base de transcendance de n’importe quelle extension algébrique.
Si K ,→ L une extension de corps de type fini et que S ⊆ L est une partie finie telle
que L = K(S), un sous-ensemble maximal algébriquement indépendant de S est une base
de transcendance finie de L sur K. Il existe donc toujours (pour une extension de type fini),
une base de transcendance (finie). Nous allons maintenant montrer que ces bases ont toutes
le même cardinal (15) .

Proposition 12.2. — Soit K ,→ L une extension de corps de type fini.

14. Cela siginife que tout sous-ensemble fini de B a cette propriété.


15. Nous nous limitons ici aux extensions de type fini, mais on peut développer cette théorie (qui est d’ailleurs
analogue à celle des bases dans les espaces vectoriels, et qui est traitée parallèlement dans [ZS1]) pour toute exten-
sion ([ZS1], Ch. 2, §12, th. 24).
124 CHAPITRE III. ANNEAUX

a) Soit A ⊆ L une partie finie formée d’éléments algébriquement indépendants et soit


S ⊆ L une partie telle que L est algébrique sur K(S). Alors Card(S) ≥ Card(A).
b) Toutes les bases de transcendance de L sur K ont le même cardinal (fini).

Dans la situation de la proposition, le cardinal commun (fini) des bases de transcendance


de L sur K s’appelle le degré de transcendance de L sur K ; on le note [Link] L.

Démonstration. — Notons A = {a1 , . . . , an }. On peut supposer n > 0. Si tous les éléments


de S sont algébriques sur K(a2 , . . . , an ), l’extension K(a2 , . . . , an ) ⊆ K({a2 , . . . , an } ∪
S) est algébrique (cor. 2.11), donc aussi l’extension K(a2 , . . . , an ) ⊆ L par le th. 2.14
(puisque L est algébrique sur K(S)), ce qui est absurde (puisque a1 n’est pas algébrique sur
K(a2 , . . . , an )).
Il existe donc un élément s1 de S qui n’est pas algébrique sur K(a2 , . . . , an ), de sorte que
s1 , a2 , . . . , an sont algébriquement indépendants. En continuant ainsi, on peut remplacer un
par un les éléments a1 , . . . , an de A par des éléments s1 , . . . , sn de S (qui restent algébri-
quement indépendants, donc distincts), ce qui montre a).
Soient B et B 0 des bases de transcendance de L sur K, avec B finie. Tout sous-ensemble
fini A de B 0 est formé d’éléments algébriquement indépendants, donc est de cardinal ≤
Card(B) par a). On en déduit que B 0 est (fini) de cardinal ≤ Card(B). Par symétrie, on
a égalité.

Exercice 12.3. — Soient K ,→ L et L ,→ M des extensions de corps. On suppose que l’exten-


sion K ,→ M est de type fini. Montrer les extensions K ,→ L et L ,→ M sont de type fini et
que
[Link] M = [Link] L + [Link] M.

Théorème 12.4. — Soit K un corps et soit A une K-algèbre de type fini intègre de corps
des fractions KA . On a
dim(A) = [Link] KA .

Démonstration. — D’après le lemme de Noether (th. 9.1), il existe des éléments algébri-
quement indépendants a1 , . . . , an de A tels que A soit une extension finie de K[a1 , . . . , an ].
Alors {a1 , . . . , an } est une base de transcendance de KA sur K et
[Link] KA = n = dim(K[a1 , . . . , an ]) = dim(A),
ce qui prouve la proposition.

On peut donner une autre preuve du corollaire 11.15.

Corollaire 12.5. — Soit K un corps et soit P un élément non constant de K[X1 , . . . , Xn ].


La dimension de K[X1 , . . . , Xn ]/(P ) est n − 1.
13. « GOING-DOWN » 125

Démonstration. — Grâce à l’ex. 10.10, on peut supposer P irréductible puis, quitte à réor-
donner les variables, P ∈
/ K[X1 , . . . , Xn−1 ]. Le morphisme canonique entre anneaux in-
tègres
K[X1 , . . . , Xn−1 ] → A := K[X1 , . . . , Xn ]/(P )
est alors injectif, d’où une extension de corps
K(X1 , . . . , Xn−1 ) → KA
qui est finie (puisque KA est engendré sur K(X1 , . . . , Xn−1 ) par l’élément algébrique X̄n ).
On en déduit
dim(A) = [Link] KA = [Link] K(X1 , . . . , Xn−1 ) = n − 1,
ce qui prouve le corollaire.
Exercice 12.6. — Soit K un corps algébriquement clos. On considère des polynômes homo-
gènes P1 , . . . , Pm ∈ K[X1 , . . . , Xn ] de degré > 0. Le but de l’exercice est de montrer que si
n > m, il existe dans K n un zéro différent de (0, . . . , 0) commun à P1 , . . . , Pm . On suppose
donc que le seul zéro commun à P1 , . . . , Pm est (0, . . . , 0) et on va montrer n ≤ m.
a) Montrer qu’il existe r ∈ N tel que tout monôme de degré (total) ≥ r en X1 , . . . , Xn
appartienne à l’idéal engendré par P1 , . . . , Pm dans K[X1 , . . . , Xn ].
b) En déduire que tout monôme de degré total ≥ r en X1 , . . . , Xn peut s’écrire sous la forme
Q(X1 , . . . , Xn ), où Q est un polynôme de degré total < r en X1 , . . . , Xn à coefficients
dans l’anneau A := K[P1 , . . . , Pm ] ⊆ K[X1 , . . . , Xn ].
c) En notant KA = K(P1 , . . . , Pm ) ⊆ K(X1 , . . . , Xn ) le corps des fractions de l’anneau
intègre A, en déduire que le KA -espace vectoriel KA [X1 , . . . , Xn ] est de dimension finie.
Conclure que K(X1 , . . . , Xn ) est un KA -espace vectoriel de dimension finie.
d) En raisonnant sur le degré de transcendance, conclure n ≤ m.

13. « Going-down »

Soit ι : A ,→ B une extension d’anneaux. Nous avons vu dans le § 11 que des propriétés
algébriques de ι se traduisent par des propriétés topologiques de l’application continue ι] :
Spec(B) → Spec(A). Par exemple, si ι est entière, ι] est surjective (lemme 11.3) et fermée
(exerc. 11.4). Nous continuons ici à explorer ces relations.

Théorème 13.1. — Soit A un anneau intégralement clos, soit K son corps des fractions,
soit K ,→ L une extension finie et normale et soit B ⊆ L la clôture intégrale de A dans L.
Soit p un idéal premier de A. Tous les idéaux premiers de B au-dessus de p sont conjugués
sous l’action du groupe des automorphismes de L sur K.

Démonstration. — Commençons par remarquer que l’image d’un élément de B par n’im-
porte quel élément σ de G := Gal(L/K) est encore entière sur A (elle est racine du même po-
lynôme unitaire à coefficients dans A), donc est dans B. En d’autres termes, on a σ(B) = B
126 CHAPITRE III. ANNEAUX

et l’image par σ d’un idéal premier de B est encore un idéal premier de B. Le groupe G agit
alors bien sur l’ensemble des idéaux premiers q de B au-dessus de p, puisque ceux-ci sont
caractérisés par la propriété q ∩ A = p.
Soient q1 et q2 des idéaux premiers de B au-dessus de p. On raisonne par l’absurde, en
supposant

(9) ∀σ ∈ G q2 6= σ(q1 ).

On a alors
∀σ ∈ G q2 6⊆ σ(q1 ).
En effet, σ(q1 ) et q2 sont des idéaux premiers distincts de B au-dessus de p. Par le lemme
11.2, il ne peut y avoir d’inclusion entre les deux.
S
Par l’exerc. 4.5, q2 n’est pas contenu dans la réunion σ∈G σ(q1 ). Il existe donc x ∈ q2
qui n’est dans aucun σ(q1 ). Posons y0 = σ∈G σ(x). On a y0 ∈ LG , de sorte que soit la
Q

caractéristique de K est nulle et y := y0 ∈ K (l’extension K ,→ L est alors galoisienne et


on peut appliquer le lemme I.6.27), soit la caractéristique de K est p > 0 et il existe n ≥ 0
n
tel que y := y0p ∈ K (exerc. I.6.30).
Chaque σ(x), donc aussi y, est dans B, donc entier sur A. Comme y ∈ K et que A est
intégralement clos, on a y ∈ A. Parmi les éléments de G se trouve l’identité. Tout comme x,
l’élément y de B est donc dans q2 , de sorte que y ∈ q2 ∩ A = p ⊆ q1 . Comme q1 est un idéal
premier, cela contredit le fait qu’aucun des σ(x) n’est dans q1 (car σ(x) ∈ q1 est la même
chose que x ∈ σ −1 (q1 )).
L’hypothèse (9) faite plus haut est donc absurde, et le théorème est démontré.

Corollaire 13.2. — Soit A ,→ B une extension finie d’anneaux intègres, avec A intégrale-
ment clos. Les fibres de l’application canonique ι] : Spec(B) → Spec(A) sont finies.

Démonstration. — Soit KA le corps de fractions de A et soit KB celui de B. L’extension


KA ,→ KB induite par ι est alors finie (exerc. 8.10). Soit KA ,→ L la clôture normale de
KA ,→ KB dans une clôture algébrique de KB (prop. I.4.4). C’est une extension normale
finie de KA contenant KB . On note enfin C ⊆ L la clôture intégrale de A dans L ; c’est une
extension entière (16) de A contenant B. On a des applications
] ι]
Spec(C) −→ Spec(B) −→ Spec(A).

Le th. 13.1 entraîne que la composée ι] ◦ ] est à fibres finies (puisque le groupe Gal(L/K)
est fini), tandis que l’application ] est surjective (lemme 11.3). Cela entraîne que ι] est à
fibres finies.

16. Pas nécessairement finie !


13. « GOING-DOWN » 127

Remarque 13.3. — On peut montrer que les fibres de ι] sont finies pour toute extension
finie d’anneaux ι (c’est-à-dire que les hypothèses « A intégralement clos et B intègre » dans
le corollaire sont inutiles). On trouvera une démonstration dans [B1], § 2, no 2, prop. 3 ; sans
être très difficile, elle fait appel à quelques notions que nous n’avons pas vues dans ce cours.

Le théorème suivant est appelé dans la littérature « going-down » : on se demande si on


peut trouver q1 qui complète le diagramme ci-dessous
Spec(B) q_1 ? ⊆ q_2

ι]
  
Spec(A) p1 ⊆ p2

Théorème 13.4 (« Going-down »). — Soit A ,→ B une extension finie d’anneaux intègres,
avec A intégralement clos. Soient p1 ⊆ p2 des idéaux premiers de A et soit q2 un idéal
premier de B au-dessus de p2 . Il existe un idéal premier q1 de B tel que q1 ⊆ q2 au-dessus
de p1 .

Démonstration. — On garde les mêmes notations que dans la preuve du cor. 13.2. Grâce au
lemme 11.3, il existe des idéaux premiers r2 ⊆ C au-dessus de q2 et r01 ⊆ C au-dessus de p1 .
Par le going-up (th. 11.5), on peut trouver r02 ⊆ C contenant r01 au-dessus de p2 . Mais alors
r2 et r02 sont au-dessus de p2 , donc il existe (th. 13.1) σ ∈ Gal(L/KA ) tel que σ(r02 ) = r2 .
Posant r1 := σ(r01 ), on a r1 ⊆ r2 et r1 ∩ A = r01 ∩ A = p1 . Posant q1 := r1 ∩ B, on a
q1 ∩ A = p1 et q1 ⊆ r2 ∩ B = q2 . Ceci termine la preuve du théorème.
Remarque 13.5. — En termes « géométriques », la propriété de « going-down » pour une
extension d’anneaux ι : A ,→ B signifie la chose suivante : pour tous fermés irréductibles
F2 ⊆ F1 de Spec(A), et tout fermé irréductible G2 ⊆ Spec(B) tel que ι] (G2 ) = F2 , il existe
un fermé irréductible G1 ⊇ G2 tel que ι] (G1 ) = F1 .
Exemple 13.6. — La propriété de « going-down » n’est pas vraie pour toutes les extensions
entières. Voici un contre-exemple dû à Cohen et Seidenberg (17) .
Considérons l’anneau B := Z[X]/(X 2 − X, 2X) et notons x ∈ B la classe de X. On a
B = Z + Zx, donc l’extension d’anneaux Z ,→ B est finie. Considérons les idéaux premiers
(0) ( (2) de Z et l’idéal maximal q2 := (2, x − 1) de B au-dessus de (2). Il n’existe aucun
idéal premier q1 ⊆ q2 de B au-dessus de (0). En effet, on aurait alors 2x = 0 ∈ q1 et 2 ∈
/ q1 ,
donc x ∈ q1 ; mais c’est impossible puisqu’alors 1 = (1 − x) + x ∈ q2 .
Théorème 13.7. — Soit A ,→ B une extension finie d’anneaux intègres, avec A intégrale-
ment clos. L’application canonique ι] : Spec(B) → Spec(A) est ouverte.

17. Il est tiré de l’article : Prime ideals and integral dependance, Bull. Amer. Math. Soc. 52 (1946), 252–261. Je
conseille la lecture de cet article, très accessible, qui démontre de façon très moderne beaucoup des théorèmes de
cette section. Les contre-exemples se trouvent au § 3.
128 CHAPITRE III. ANNEAUX

Démonstration. — Soit KA le corps de fractions de A et soit KB celui de B. Soit b ∈ B


non nul et soit
P (X) = X n + an−1 X n−1 + · · · + a1 X + a0 ∈ KA [X]
le polynôme minimal de b sur KA . Comme b est entier sur A, il existe un polynôme unitaire
Q ∈ A[X] tel que Q(b) = 0. Par définition du polynôme minimal, P divise Q. Comme A est
intégralement clos, le lemme 8.25 entraîne que P est à coefficients dans A (cf. aussi exerc.
8.18).
Nous allons montrer (avec les notations de (5))
n−1
[
ι] (D(b)) = D(ai ).
i=0

C’est donc un ouvert de Spec(A). Comme tout ouvert de Spec(B) est réunion d’ouverts du
type D(b), cela montrera le théorème.
Soit q ∈ D(b). Posons p := ι] (q) = q ∩ A. Si tous les ai sont dans p, on a bn ∈ q,
donc b ∈ q puisque q est un idéal premier, ce qui contredit q ∈ D(b). On a donc bien
Sn−1
ι] (q) ∈ i=0 D(ai ), ce qui montre une inclusion.
Sn−1
Supposons inversement p ∈ i=0 D(ai ).

Notons R le sous-anneau A[b] de B. Supposons b ∈ pR. C’est un A-module libre de
base (1, b, . . . , bn−1 ). Comme bm ∈ pR pour un m ≥ 1, il existe a00 , . . . , a0n−1 ∈ p tels
Pn−1
que bm = i=0 a0i bi . Par définition du polynôme minimal, P divise le polynôme X m −
Pn−1 0 i
i=0 ai X ∈ A[X] dans KA [X], donc aussi dans A[X] par le même lemme 8.25 que ci-
dessus. En passant modulo p, on obtient, puisque chaque a0i est dans p, que X m est divisible
par
P̄ (X) = X n + ān−1 X n−1 + · · · + ā1 X + ā0
dans (A/p)[X]. Comme (A/p)[X] est un anneau intègre, cela entraîne que tous les āi sont
Sn−1
nuls, ce qui contredit l’hypothèse p ∈ i=0 D(ai ).
√ √
On a donc b ∈ / pR. Comme pR est l’intersection des idéaux premiers de R contenant
pR, il existe un tel idéal q2 ne contenant pas b. On pose p2 := q2 ∩ A. Par le going-down (th.
13.4) appliqué à l’extension entière A ,→ R, il existe q ∈ Spec(R) avec q ⊆ q2 et q ∩ A = p.
Comme B est entier sur R, il existe r ∈ Spec(B) au-dessus de q (lemme 11.3). On a
r ∈ D(b), puisque sinon b ∈ r ∩ R = q ⊆ q2 . On a ainsi montré p = ι] (r) ∈ ι] (D(b)).

14. Dimension des algèbres de type fini sur un corps

Dans ce paragraphe, nous allons utiliser le « going-down » pour montrer des résultats sur
la hauteur des idéaux premiers dans les algèbres de type fini sur un corps.
14. DIMENSION DES ALGÈBRES DE TYPE FINI SUR UN CORPS 129

Soit A un anneau. On dira qu’une chaîne d’idéaux premiers de A est saturée si elle n’est
contenue dans aucune chaîne d’idéaux premiers de longueur strictement supérieure. A priori,
on peut seulement dire que la longueur d’une chaîne saturée est au plus la dimension de A.
Lorsque A n’est pas intègre, il est facile d’exhiber des chaînes saturées de longueur <
dim(A) : si Spec(A) a deux composantes irréductibles de dimensions différentes, celles-ci
correspondent à des idéaux premiers p1 et p2 minimaux (prop. 5.17) tels que dim(A/p1 ) 6=
dim(A/p2 ). Des chaînes d’idéaux premiers de A/pi de longueur maximale donnent lieu à
des chaînes saturées d’idéaux premiers de A de longueurs différentes.
Il est plus surprenant d’apprendre qu’il existe un anneau noethérien intègre A avec une
chaîne saturée d’idéaux premiers de longueur < dim(A) < +∞. Ces anneaux restent très
exotiques. Un tel phénomène n’arrive pas dans le cadre « géométrique », comme le montre le
théorème suivant.
Théorème 14.1. — Soit K un corps et soit A une K-algèbre de type fini intègre. Toute
chaîne saturée d’idéaux premiers de A est de longueur dim(A).

Démonstration. — On raisonne par récurrence sur la dimension de A. Si cette dimension


vaut 0, il n’y a rien à démontrer.
Soit pm ) · · · ) p1 ) (0) une telle chaîne. D’après le lemme de Noether (th. 9.1), il existe
des éléments algébriquement indépendants a1 , . . . , an de A tels que A soit une extension
finie de l’anneau B := K[a1 , . . . , an ] (attention, les notations sont inversées par rapport aux
notations habituelles !). On a dim(A) = n par les th. 11.8 et 11.11.
Pour tout i ∈ {0, . . . , m}, posons qi := pi ∩ B. Soit b ∈ q1 un élément irréductible dans
l’anneau factoriel B. L’idéal premier (b) est contenu dans q1 et B est intégralement clos,
donc il existe, par le th. 13.4 (« going-down »), un idéal premier p01 ⊆ p1 tel que p01 ∩ B =
(b). Comme la chaîne (pi ) est saturée, on a p01 = p1 , d’où p1 ∩ B = (b). En particulier,
B/(b) est un sous-anneau de A/p1 , et l’extension correspondante est entière. Par le cor.
12.5 et le th. 11.8, on a dim(A/p1 ) = n − 1. Or pm /p1 ) · · · ) p1 /p1 = (0) est une
chaîne saturée d’idéaux premiers de la K-algèbre de type fini intègre A/p1 . L’hypothèse de
récurrence entraîne dim(A/p1 ) = m − 1. On en déduit m = n, ce qui termine la preuve.
Corollaire 14.2. — Soit K un corps et soit A une K-algèbre de type fini intègre. Pour tout
idéal premier p de A, on a ht(p) = dim(A) − dim(A/p).

Démonstration. — On rappelle que ht(p)+dim(A/p) est la longueur maximale des chaînes


d’idéaux premiers de A contenant p. Cette longueur maximale (qui est ≤ dim(A), donc finie)
est atteinte pour une chaîne qui est nécessairement saturée. Il suffit donc d’appliquer le th.
14.1.
Corollaire 14.3. — Soit K un corps et soit A une K-algèbre de type fini intègre. Pour tous
idéaux premiers q ⊆ p de A, la longueur maximale des chaînes d’idéaux premiers de A entre
130 CHAPITRE III. ANNEAUX

p et q est
dim(A/q) − dim(A/p).

Démonstration. — Il suffit d’appliquer le corollaire précédent à l’idéal premier p/q de la


K-algèbre de type fini intègre A/q.

On a vu (cor. 12.5) que si K est un corps et P un élément non constant de K[X1 , . . . , Xn ],


la dimension de V (P ) est n − 1. On va montrer que la réciproque est vraie : toute partie
fermée de Spec(K[X1 , . . . , Xn ]) qui est de dimension n − 1 « peut être définie par une
équation » (c’est-à-dire, est du type V (P )). Cela résulte du corollaire plus général suivant,
dont la conclusion est remarquable : une partie de Spec(K[X1 , . . . , Xn ]) de dimension n − c
ne peut pas en général être définie par c équations lorsque c ≥ 2 (cf. note 8).

Corollaire 14.4. — Soit K un corps et soit A une K-algèbre de type fini factorielle. Toute
partie fermée irréductible de Spec(A) de dimension dim(A) − 1 est du type V (a), où a est
un élément irréductible de A.

Démonstration. — Une telle partie s’écrit V (p), où p est un idéal premier de A qui, grâce
au cor. 14.2, est de hauteur 1. Le corollaire résulte alors du lemme ci-dessous.

Lemme 14.5. — Soit A un anneau factoriel noethérien. Tout idéal premier de A de hauteur
1 est principal, engendré par un élément irréductible.

Démonstration. — Soit p un tel idéal et soit a un élément non nul de p. Décomposons a en


produits d’irréductibles. L’un au moins des facteurs est dans p ; prenons-en un, p. L’idéal (p)
est premier (prop. 1.3) et p ⊇ (p) ) (0). Comme p est de hauteur 1, on a p = (p).

Exercice 14.6. — Prouver la réciproque du lemme : un anneau noethérien intègre dans lequel
tout idéal premier de hauteur 1 est principal est factoriel (Indication : on pourra utiliser le cor.
I.2.12 et le th. 7.1).

Le corollaire suivant généralise le cor. 12.5.

Corollaire 14.7. — Soit K un corps, soit A une K-algèbre de type fini intègre et soit I un
idéal de A engendré par n éléments. Toutes les composantes irréductibles de V (I) sont de
dimension ≥ dim(A) − n.

Démonstration. — Les composantes irréductibles de V (I) s’identifient aux Spec(A/p), où


p décrit l’ensemble des idéaux premiers de A minimaux contenant I (prop. 5.17). Par le th.
7.2, on a ht(p) ≤ n. Il suffit donc d’appliquer le cor. 14.2 pour conclure.

Exercice 14.8. — Redémontrer l’exerc. 12.6 comme conséquence immédiate du cor. 14.7.
15. ANNEAUX DE VALUATION DISCRÈTE 131

15. Anneaux de valuation discrète

Ces anneaux jouent un rôle important en géométrie algébrique et il serait dommage de les
passer sous silence.
Définition 15.1. — Un anneau de valuation discrète est un anneau local principal qui n’est
pas un corps.

En anglais, on dit « discrete valuation ring », souvent abbrévié en « DVR ».


Exemple 15.2. — Soit K un corps. L’anneau des séries formelles K[[X]] est un anneau de
valuation discrète : il est local d’idéal maximal (X), et il est euclidien (exerc. I.1.10) donc
principal.
Exemple 15.3. — Le localisé d’un anneau principal en un idéal premier est encore principal
(exerc. 6.5). Si ce n’est pas un corps, c’est un anneau de valuation discrète. Si K est un corps,
c’est le cas par exemple de K[X](X) , anneau des fractions rationnelles du type P/Q, avec
Q(0) 6= 0. Si p ∈ N est un nombre premier, c’est aussi le cas de l’anneau Z(p) formé des
rationnels a/b, où p ne divise pas b.

Pourquoi le mot valuation ? Tout d’abord, si A est un anneau de valuation discrète, d’idéal
maximal m, on appelle uniformisante de A tout générateur de m. Toute uniformisante est un
élément irréductible de A (prop. I.1.15). Inversement, tout élément irréductible de A engendre
m (prop. I.1.15) donc est une uniformisante. Comme A est factoriel (cor. 2.14), si π est une
uniformisante de A, tout élément non nul de A s’écrit de façon unique sous la forme uπ n , où
u est une unité de A et n ∈ N ; remarquons que l’entier n ne dépend pas du choix de π : c’est
le plus petit n ∈ N tel que x ∈ mn . Les seuls idéaux de A sont (0) et les mn , pour n ∈ N, et
les seuls idéaux premiers sont (0) et m.
Soit v : A {0} → N l’application définie par v(x) = n. Elle vérifie les propriétés
suivantes :
1. v(xy) = v(x) + v(y) ;
2. v(x + y) ≥ min(v(x), v(y)).
Soit KA le corps des fractions de A. On étend v en une application surjective v : KA {0} →
Z vérifiant les mêmes propriétés en posant v(x/y) = v(x) − v(y) (on doit bien sûr vérifier
que cela ne dépend pas de l’écriture x/y).
Inversement, si K est un corps, une application surjective v : K {0} → Z vérifiant ces
propriétés s’appelle une valuation discrète de K (18) . Le sous-ensemble
A := {0} ∪ {x ∈ K ∗ | v(x) ≥ 0}

18. Le terme discret renvoie au fait que l’image de v est contenue dans le groupe discret Z. On peut définir une
valuation générale en remplaçant Z par un groupe abélien ordonné quelconque.
132 CHAPITRE III. ANNEAUX

de K en est un sous-anneau qui est un anneau de valuation discrète d’idéal maximal

m := {0} ∪ {x ∈ K ∗ | v(x) > 0}.

En effet, la vérification du fait que A est un sous-anneau étant laissée au lecteur, soit I un
idéal non nul de A et soit a un élément non nul de I tel que v(a) soit minimal. Si b ∈ I est
non nul, on a v(b/a) = v(b) − v(a) ≥ 0, donc b/a ∈ A et b = (b/a)a ∈ (a). On en déduit
I = (a), de sorte que tout idéal de A est principal. Enfin, si x ∈ A {0} n’est pas inversible,
on a v(1/x) < 0, donc v(x) > 0 ; si π ∈ A est tel que v(π) = 1, le même raisonnement
montre que x est dans (π). C’est donc l’unique idéal maximal de A.

Exemple 15.4. — Le corps des fractions de l’anneau de valuation discrète K[[X]] est l’an-
neau K((X)) des séries de Laurent. La valuation associée v : K((X)) {0} → Z envoie une
telle série non nulle m∈Z am X m (avec am = 0 pour tout m  0) sur le plus petit entier
P

m tel que am 6= 0.

Exemple 15.5. — Pour tout élément irréductible p d’un anneau factoriel A, on a défini dans
le § 1 une valuation discrète vp sur A (si a ∈ A, l’entier vp (a) est le plus grand entier n tel
que pn divise A) qui s’étend comme ci-dessus à son corps des fractions KA . L’anneau de
valuation discrète associé est A(p) .
On peut montrer (c’est une conséquence du théorème d’Ostrowski qui détermine toutes les
valeurs absolues sur le corps Q) que les seules valuations discrètes de Q sont les valuations
p-adiques vp , pour p ∈ N nombre premier.

Théorème 15.6. — Soit A un anneau. Les propriétés suivantes sont équivalentes :


(i) A est un anneau de valuation discrète ;
(ii) A est un anneau local noethérien, dim(A) > 0 et son idéal maximal est principal ;
(iii) A est un anneau local noethérien intégralement clos de dimension 1.

Démonstration. — Il est clair que (i) entraîne (iii) (prop. 8.21 et ex. 5.26).
Supposons (iii). Par hypothèse, A est intègre. Soit KA son corps de fractions. L’idéal
maximal m de A n’est pas nul par hypothèse, donc m2 ( m (théorème de Krull ; cor. 2.8).
Soit π ∈ m m2 . Comme dim(A) = 1 et que A est local, les seuls idéaux premiers de A
sont (0) et m. L’idéal premier m est donc minimal contenant (π) ; il lui est donc associé (th.
4.22) : il existe (déf. 4.17) a ∈ A tel que m = ((π) : a) = {b ∈ A | π | ab}. Posons
x := aπ −1 ∈ KA ; comme 1 ∈ / m, on a x ∈
/ A, mais xm ⊆ A.
Si xm ⊆ m, appliquons le théorème de Cayley-Hamilton (th. II.3.2) à l’endomorphisme u
du A-module de type fini m donné par la multiplication par x. Il fournit un polynôme unitaire
P ∈ A[X] tel que P (u) = 0. Alors P (x) = P (u)(1) = 0, de sorte que x est entier sur A.
Comme A est intégralement clos, x ∈ A, ce qui est absurde.
16. ANNEAUX DE DEDEKIND 133

On a donc xm = A, c’est-à-dire x−1 ∈ m. On en déduit


m = ((π) : a) = ((ax−1 ) : a) = (x−1 ),
ce qui montre que m est principal, d’où (ii).

Supposons (ii). Soit π un générateur de l’idéal maximal m de A. Le théorème de Krull


T∞
(cor. 2.8) entraîne n=1 (π n ) = 0.
Pour tout x ∈ A {0}, il existe donc un plus grand entier m ≥ 0 tel que x ∈ (π m ). On
peut écrire x = uπ m , avec u ∈/ (π) = m, donc u inversible. Montrons que l’entier m est
uniquement déterminé : si x = uπ m = wπ n , avec disons m ≥ n, on a (uw−1 π m−n −1)π n =
0. Si m > n, on a uw−1 π m−n −1 ∈ / m, donc il est inversible et π n = 0. Comme dim(A) > 0,
il existe un idéal premier p ( m. On a alors π n ∈ p, donc π ∈ p, ce qui est absurde. On a
donc m = n. On pose v(x) = m, définissant ainsi une application v : A {0} → N.
Si x et y sont non nuls, on les écrit x = uπ m et y = wπ n . On a alors xy = uwπ m+n
et on montre de la même façon que ce n’est pas nul. Donc A est intègre. L’application v se
prolonge alors en une valuation discrète sur le corps des fractions de A, et A est l’anneau de
valuation discrète associé à cette valuation, d’où (i).

Remarque 15.7. — Les anneaux de valuation discrète sont les anneaux locaux noethériens
réguliers de dimension 1 (cf. exerc. 7.7 ; si A est un tel anneau, d’idéal maximal m et de corps
résiduel κ := A/m, cela signifie que le κ-espace vectoriel m/m2 est de dimension 1).
En effet, si A est un anneau de valuation discrète d’uniformisante π, tout élément de m
est multiple de π, qui engendre donc le κ-espace vectoriel m/m2 . Inversement, si cet espace
vectoriel est de dimension 1, m est principal (exerc. 7.7), et A est un anneau de valuation
discrète (th. 15.6).

Exercice 15.8 (Vecteurs de Witt). — Soit K un corps parfait de caractéristique p > 0. Montrer
qu’il existe un anneau de valuation discrète W (K) de caractéristique 0 et de corps résiduel K
(Indication : on pourra consulter la littérature ([S], chap. II, § 6 ou [B2], chap. IX, § 1)). L’anneau
W (K) s’appelle anneau des vecteurs de Witt à coefficients dans K. Lorsque K = Fp , l’anneau
W (Fp ) est l’anneau des entiers p-adiques Zp (cf. rem. 2.10).

16. Anneaux de Dedekind

Rappelons que nous avons défini (rapidement dans le § 4) les anneaux de Dedekind comme
les anneaux noethériens de dimension 1 (c’est-à-dire pour lesquels tout idéal premier non nul
est maximal) intégralement clos (cf. § 5.4). Les anneaux de Dedekind locaux sont donc les
anneaux de valuation discrète (th. 15.6).
D’autres exemples sont donnés par les anneaux principaux qui ne sont pas des corps, ainsi
que par les anneaux d’entiers de corps de nombres (cf. § 8), c’est-à-dire les clôtures intégrales
134 CHAPITRE III. ANNEAUX

de Z dans des extensions finies de Q. Notre but est de montrer la décomposition des idéaux
non nuls en produit d’idéaux maximaux (th. 16.3).

Proposition 16.1. — Soit A un anneau intègre noethérien. Les deux propriétés suivantes
sont équivalentes :
(i) A est un anneau de Dedekind ;
(ii) pour tout idéal maximal m de A, l’anneau local Am est un anneau de valuation dis-
crète.

Démonstration. — Soit A un anneau de Dedekind et soit m un idéal maximal de A. L’anneau


local Am est noethérien et intégralement clos (exerc. 8.17) et il est de dimension 1 puisque
tout chaîne d’idéaux premiers de Am est une chaîne d’idéaux premiers de A et que m ) (0)
est une telle chaîne. C’est donc un anneau de valuation discrète (th. 15.6).
Inversement, supposons (ii). Comme l’anneau A est intègre et que chaque Am est inté-
gralement clos, il en est de même pour A (exerc. 8.17). Enfin, toute chaîne saturée d’idéaux
premiers de A commence par un idéal maximal m donc est de longueur dim(Am ) = 1. On a
donc montré que A est un anneau de Dedekind.

Exercice 16.2. — Soit P un élément non constant de C[X, Y ]. Si on note A l’anneau quotient
C[X, Y ]/(P ), l’ensemble Specmax(A) est en bijection avec la courbe plane

C := {(x, y) ∈ C2 | P (x, y) = 0}

(prop. 10.9, ex. 10.10, ex. 10.15). Nous allons montrer que l’anneau A est un anneau de Dedekind
si et seulement si la courbe C est non singulière au sens de la géométrie différentielle, c’est-à-
∂P ∂P
dire qu’en chaque point (x, y) de C, une des dérivées partielles ∂X (x, y) ou ∂Y (x, y) n’est pas
nulle. Remarquons que cette condition est équivalente, par le cor. 10.4, à l’égalité
“ ∂P ∂P ”
P, , = C[X, Y ].
∂X ∂Y
a) Soit (x, y) un point de C et soit m l’idéal maximal (X − x, Y − y) de C[X, Y ]. Montrer
que l’anneau Am est un anneau de valuation discrète si et seulement si l’une des dérivées
∂P ∂P
partielles ∂X (x, y) ou ∂Y (x, y) n’est pas nulle (Indication : on pourra utiliser la rem.
15.7).
b) En déduire l’énoncé annoncé.

Théorème 16.3. — Tout idéal non nul d’un anneau de Dedekind s’écrit de façon unique
comme produit d’idéaux maximaux.

Démonstration. — Soit A un anneau de Dedekind et soit q un idéal primaire non nul de


A, de radical m (maximal comme tout idéal premier non nul de A). Le localisé Am est un
anneau de valuation discrète, donc l’idéal qAm est une puissance (mAm )n = mn Am de son
idéal maximal, avec n ≥ 1. Mais mn est, comme q, un idéal m-primaire : m est l’unique
16. ANNEAUX DE DEDEKIND 135

idéal premier de A contenant mn , donc il est sa propre décomposition primaire minimale (th.
4.18). Pour ces idéaux, on vérifie facilement que l’on a (cf. § 6 pour les idéaux premiers)
mn = mn Am ∩ A et q = qAm ∩ A.
On en déduit q = mn .
Soit I un idéal non nul de A. Une décomposition primaire minimale de I (th. 4.18) s’écrit
Ts
donc I = i=1 mni i . Les idéaux premiers mi sont aussi minimaux contenant I, donc cette
décomposition est unique (th. 4.22). Enfin, on déduit du lemme 4.4 que l’on a aussi I =
Qs ni
i=1 mi .

Remarque 16.4. — On peut montrer qu’un anneau intègre pour lequel tout idéal non nul est
produit d’idéaux premiers est un anneau de Dedekind.

Corollaire 16.5. — Soit I un idéal non nul d’un anneau de Dedekind A. Tout idéal de l’an-
neau A/I est engendré par un élément.

Attention, l’anneau A/I n’est en général pas intègre, donc ce n’est pas un anneau princi-
pal.
Ts
Démonstration. — Le th. 16.3 fournit une décomposition I = i=1 mni i et le théorème des
restes chinois (exerc. 4.6) un isomorphisme
s
Y
A/I ' (A/mni i ).
i=1

Chaque facteur A/mni i est isomorphe à Ami /mni i Ami donc est un anneau principal comme
quotient de l’anneau de valuation discrète ( donc principal) Ami . Comme on l’a vu dans le
§ 5, tout idéal de A/I est produit d’idéaux des anneaux A/mni i , qui sont engendrés par un
élément. Il a donc la même propriété.

Nous montrons maintenant que tout idéal d’un anneau de Dedekind est engendré par deux
éléments, sous la forme plus précise suivante.

Proposition 16.6. — Soit A un anneau intègre qui n’est pas un corps. Alors A est un anneau
de Dedekind si et seulement si, pour tout idéal non nul I de A et tout a ∈ I {0}, il existe
b ∈ I tel que I = (a, b).

Démonstration. — Soit A un anneau de Dedekind, soit I un idéal non nul de A et soit


a ∈ I {0}. Le cor. 16.5 entraîne que dans A/(a), l’idéal I/(a) est engendré par un élément
b. On a alors I = (a, b).
Montrons la réciproque. L’anneau A est alors noethérien, et il suffit donc, par la prop. 16.1,
de montrer que pour tout idéal maximal m de A, l’anneau local intègre Am (qui n’est pas un
136 CHAPITRE III. ANNEAUX

corps) est un anneau principal. Soit I un idéal non nul de cet anneau. Comme m 6= (0), il
existe a ∈ m(I ∩ A) {0}, puis b ∈ I tel que I ∩ A = (a, b). On a alors
I = (I ∩ A)Am = (a, b)Am = mI + bAm .
Le lemme de Nakayama (th. II.3.8) entraîne alors I = bAm , de sorte que I est principal.

Proposition 16.7. — Un anneau de Dedekind qui n’a qu’un nombre fini d’idéaux premiers
non principaux est principal.

En particulier, un anneau de Dedekind qui n’a qu’un nombre fini d’idéaux maximaux est
principal.
La proposition dit qu’un anneau de Dedekind non principal a une infinité d’idéaux pre-

miers non principaux. Noter que dans l’anneau (non intégralement clos) Z[ −3], il y a exac-
√ √
tement un idéal premier non principal : (1 + −3, 1 − −3).

Démonstration. — Soit A un anneau de Dedekind et soient m1 , . . . , mn les différents idéaux


maximaux non principaux de A. Supposons n ≥ 1. Par le lemme d’évitement (exerc. 4.5),
il existe a ∈ m1 tel que a ∈ / m21 ∪ m2 ∪ · · · ∪ mn . L’idéal (a) n’est contenu dans aucun des
idéaux m2 , . . . , mn , donc sa décomposition primaire s’écrit
s
Y
(a) = m1 ni ,
i=2

où les idéaux maximaux n2 , . . . , ns sont distincts des idéaux m1 , . . . , mn , donc principaux.


On en déduit (a) = m1 (b) pour un b ∈ A. On peut donc écrire a = xb, avec x ∈ m1 .
Comme A est intègre, on obtient m1 = (x), ce qui est absurde. On a donc n = 0 et A est
principal.

Exercice 16.8. — Soit A un anneau de Dedekind. Le contenu, noté c(P ), d’un polynôme P ∈
A[X] est l’idéal de A engendré par les coefficients de P (comparer avec la déf. 1.7). Montrer
le lemme de Gauss (cf. lemme 1.8) : pour tous polynômes P et Q dans A[X], on a c(P Q) =
c(P )c(Q) (Indication : on pourra localiser en les idéaux maximaux de A).

Exercice 16.9. — Soit A un anneau de Dedekind. Pour tous idéaux I1 , I2 et I3 de A, montrer


les égalités

I1 ∩ (I2 + I3 ) = (I1 ∩ I2 ) + (I1 ∩ I3 ),


I1 + (I2 ∩ I3 ) = (I1 + I2 ) ∩ (I1 + I3 ).

(Indication : localiser !)

Remarque 16.10 (Ramification). — Soit A un anneau de Dedekind et soit KA son corps


de fractions. Soit KA ,→ L une extension séparable et soit B ⊆ L la clôture intégrale de A
dans L. C’est un anneau noethérien, extension finie de A (th. 8.19), donc c’est un anneau de
16. ANNEAUX DE DEDEKIND 137

Dedekind (th. 11.8). Soit m un idéal maximal de A ; par le lemme 11.3, il est contenu dans
un idéal maximal de B, donc on peut écrire
mB = me11 · · · mess .
où e1 , . . . , ee sont des entiers strictement positifs et m1 , . . . , ms des idéaux maximaux de B
(ce sont les idéaux premiers de B « au-dessus » de m ; cf. § 11). L’entier ei est appelé l’indice
de ramification de mi au-dessus de m. On a la belle formule ([ZS1], cor. du th. V.21 ; [S],
chap. I, § 4, prop. 10)
Xs
[L : KA ] = ei [B/mi : A/m].
i=1

Voici un exemple géométrique. Reprenons l’exemple 11.9 (avec K = C) avec ses nota-
tions. Posons A = C[X] et B = C[X, Y ]/(X 2 + Y 2 − 1). L’anneau B est intégralement
clos (exerc. 16.2), donc c’est la clôture intégrale de A dans KB . Rappelons que l’application
ι]max s’identifie à la projection (surjective)
{(x, y) ∈ C2 | x2 + y 2 = 1} −→ C
(x, y) 7−→ x.
Tout point t ∈ C a deux préimages, sauf −1 et 1, qui n’en ont qu’une. Soit mt ⊆ A l’idéal
maximal (X − t). On a
p p
mt B = (X − t, Y − t2 − 1)(X − t, Y + t2 − 1).
Les indices de ramification sont donc 1, sauf lorsque t ∈ {−1, 1}, où l’on a mt B = (X −
t, Y )2 . Le terme « ramifié » correspond au fait géométrique que l’unique préimage de 1 se
« sépare » en deux au voisinage de 1.

√ Soit d un entier sans facteur carré, différent de


Voici maintenant un exemple arithmétique.
1, soit B l’anneau des entiers du corps Q( d), c’est-à-dire la clôture intégrale de A = Z dans
ce corps (cf. exerc. 8.20), et soit p ∈ N un nombre premier, supposé impair pour simplifier.
On est alors dans exactement
√ un des trois cas√suivants :
• p | d et (p) = (p, d)2 (où l’idéal (p, d) de B est maximal ; on dit que p est ramifié
dans B) ;
• p - d, d n’est pas un carré modulo p et (p) est un idéal maximal de B (on dit que p est
inerte dans B) ; √ √ √
• p - d, d = n2 (mod p) et (p) = (p, d + n)(p, d − n) (où les idéaux (p, d ± n) de
B sont maximaux distincts ; on dit que p est décomposé dans B).
Pour plus de détails, on pourra consulter [L], Chap. III.

Remarque 16.11 (Modules de type fini sur un anneau de Dedekind)


On peut étendre aux anneaux de Dedekind la description des modules de type fini sur un
anneau principal donnée au cor. II.4.7. On montre ainsi que tout module de type fini sur un
138 CHAPITRE III. ANNEAUX

anneau de Dedekind A est isomorphe à une somme directe


Ar ⊕ I ⊕ A/I1 ⊕ · · · ⊕ A/Is ,
où I, I1 , . . . , Is sont des idéaux de A vérifiant A ) I1 ⊇ · · · ⊇ Is ) (0). Le fait qu’il n’y
ait qu’un seul idéal dans la décomposition provient du résultat suivant : si I et J sont des
idéaux de A, on a un isomorphisme de A-modules I ⊕ J ' A ⊕ IJ (exercice !). Si A n’est
pas principal, il existe donc des modules sans torsion, de type fini, non libres (n’importe quel
idéal non principal ! Comparer avec le cor. II.4.8).
BIBLIOGRAPHIE

[AM] Atiyah, M. F., Macdonald, I. G., Introduction to commutative algebra. Addison-


Wesley Publishing Co., Reading, Mass.-London-Don Mills, Ont. 1969.

[B1] Bourbaki, N., Éléments de mathématique. Algèbre commutative. Chapitres 5 à 7. Ac-


tualités Scientifiques et Industrielles, Hermann, Paris.

[B2] Bourbaki, N., Éléments de mathématique. Algèbre commutative. Chapitres 8 et 9. Ac-


tualités Scientifiques et Industrielles, Hermann, Paris.

[CL] Chambert-Loir, A., A field guide to algebra. Undergraduate Texts in Mathematics.


Springer-Verlag, New York, 2005, ou en version française : Algèbre corporelle. École
Polytechnique, 2005.

[L] Lorenzini, D., An invitation to arithmetic geometry. Graduate Studies in Mathematics


9. American Mathematical Society, Providence, RI, 1996.

[M] Matsumura, H., Commutative algebra. Second edition. Mathematics Lecture Note Se-
ries 56. Benjamin/Cummings Publishing Co., Inc., Reading, Mass., 1980.

[P] Peskine, Ch., An algebraic introduction to complex projective geometry. 1. Commuta-


tive algebra. Cambridge Studies in Advanced Mathematics 47. Cambridge University
Press, Cambridge, 1996.

[S] Serre, J.-P., Corps locaux. Hermann, Paris, 1997.

[ZS1] Zariski, O., Samuel, P., Commutative algebra. Vol. I. With the cooperation of I. S.
Cohen. Corrected reprinting of the 1958 edition. Graduate Texts in Mathematics 28.
Springer-Verlag, New York-Heidelberg-Berlin, 1975.
140 BIBLIOGRAPHIE

[ZS2] Zariski, O., Samuel, P., Commutative algebra. Vol. II. Reprint of the 1960 edition.
Graduate Texts in Mathematics 29. Springer-Verlag, New York-Heidelberg, 1975.

Vous aimerez peut-être aussi