ÉNS de Lyon Cours d’algèbre
M2 FEADéP 2019–2020
Compléments d’arithmétique
Leçons concernées (2020)
(120) Anneaux Z/nZ. Applications.
(121) Nombres premiers. Applications.
(122) Anneaux principaux. Applications.
(123) Corps finis. Applications.
(125) Extensions de corps. Exemples et applications.
(126) Exemples d’équations en arithmétique.
Bibliographie
• Hindry, Arithmétique.
• Naudin, Quitté, Algorithmique algébrique.
• Perrin, Cours d’algèbre.
• Serre, Cours d’arithmétique.
Table des matières
1 Entiers algébriques 2
2 Équations modulaires 3
2.1 Relations de Bézout et lemme des restes chinois . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Le lemme de Hensel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Équations diophantiennes linéaires 6
3.1 Le cas de dimension 1 en 2 variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2 Le cas de dimension k en ` variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.3 Forme normale de Hermite et de Smith d’une matrice . . . . . . . . . . . . . . . . . . . 7
4 Le problème des d carrés 8
4.1 L’anneau des entiers de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4.2 Propriétés de l’anneau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.3 Éléments irréductibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.4 Le théorème des 2 carrés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.5 Le théorème des 4 carrés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
4.6 Sommes de 3 carrés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1
Lorsqu’on se donne P ∈ Z[X1 , . . . , Xd ], il est naturel de se demander s’il existe des solutions à
l’équation P (x1 , . . . , xd ) = 0 pour x = (x1 , . . . , xd ) ∈ Zd . D’un côté, si on dispose d’une solution dans Zd ,
alors on a en particulier une solution dans Rd et une solution modulo n pour tout n ∈ N∗ et on peut par
exemple se poser la question d’une éventuelle réciproque.
Par des techniques de nature analytique, on peut chercher l’existence ou l’approximation de solutions
dans Rd . On peut notamment chercher à borner le domaine d’existence des solutions. Si on sait par
exemple que l’ensemble des solutions est borné, contenu dans une boule centrée en 0 de rayon M ∈ N∗ ,
alors il suffit de raisonner modulo 2M pour trouver toutes les solutions. On voit alors qu’une application
du Lemme des restes chinois permettra de réduire le problème.
En raisonnant modulo p, pour p premier, on peut chercher des solutions via des techniques de dé-
nombrement ou des méthodes arithmétiques dans les corps finis. Dans certains cas favorables (Lemme de
Hensel), une solution modulo p se relève en une solution modulo pm (ou même dans Zp ). Par le Lemme
des restes chinois, une solution modulo pm pour tout p premier, tout m entier donnera une solution mo-
dulo n pour tout n. Cependant, en général, il n’est pas toujours possible de relever une solution modulo
n pour tout n en une solution dans Z.
L’enjeu de ce cours est de présenter différentes techniques de résolution d’équations en arithmétiques
qui peuvent être réinvesties dans de nombreuses leçons d’agrégation. Certaines d’entre elles sont cependant
l’apanage de l’option C et ne seront pas détaillées mais seulement présentées ici.
Dans toute la suite, on désignera par A un anneau commutatif unitaire intègre et K un corps (com-
mutatif) contenant A.
1 Entiers algébriques
De même que pour les polynômes sur un corps, on commence par introduire une notion de clôture
intégrale permettant de fournir des domaines d’existence de solutions aux équations diophantiennes.
Définition 1.1. On dit qu’un élément α ∈ K est entier sur A s’il existe un polynôme unitaire P ∈ A[X]
tel que P (α) = 0.
Remarque 1.2. On peut supposer que K est un anneau et non pas un corps dans cette définition et dans
une bonne partie de la suite.
Exemple 1.3. L’élément i ∈ C est un entier algébrique sur Z car annulé par le polynôme irréductible
unitaire X 2 + 1 ∈ Z[X].
Fait 1.4. On suppose que A est factoriel et que K est algébriquement clos. Si P est un polynôme
irréductible unitaire, alors pour toute racine α de P , on a un isomorphisme d’anneaux A[X]/(P ) ' A[α].
Démonstration. On a un morphisme d’anneaux surjectif canonique A[X] → A[α] donné par propriété
universelle des anneaux de polynômes via P 7→ P (α). Soit I son noyau. Par construction (P ) = P A[X] ⊂
I. Notons k = Frac(A) qui est un sous-corps de K. Comme P est unitaire et irréductible sur A, c’est un
polynôme primitif irréductible sur A donc irréductible sur k[X]. En particulier P = µα,k est le polynôme
minimal de α sur k. Soit R ∈ I. Alors R ∈ k[X] annule α, ce qui montre que R ∈ P k[X]. On écrit
R = rP Q avec r ∈ k et Q ∈ A[X] primitif. Soit a ∈ A tel que ar ∈ A. Alors ac(R) = c(aR) =
c(arP Q) = arc(P )c(Q) = ar. Donc c(R) = r ∈ A. Ce qui montre que R ∈ (P ) = P A[X]. Ainsi on a bien
(P ) = P A[X] = I, d’où l’isomorphisme.
Théorème 1.5. L’ensemble C des éléments de K qui sont entiers sur A est un sous-anneau de K.
Démonstration. Soit α ∈ K. On montre d’abord que s’équivalent :
(i) α est entier sur A ;
(ii) A[α] est un A-module de type fini ;
(iii) il existe un sous-anneau B de A contenant α qui est un A-module de type fini.
En effet, on a (i) ⇒ (ii) ⇒ (iii) par définition. Supposons (iii). Soit f l’endomorphisme du A-module B
donné par la multiplication par α. Alors le théorème de Cayley-Hamilton donne un polynôme unitaire
qui annule α. D’où (iii) ⇒ (i).
Soit α, β ∈ C. Alors β est entier sur A et donc sur A[α] par définition. Donc A[α, β] = A[α][β] est
un A[α]-module de type fini via (i) ⇒ (ii). On en déduit que l’anneau A[α, β] est un A-module de type
fini car A[α] l’est également et cet anneau contient α + β et αβ. Ainsi, par (iii) ⇒ (i) on en déduit que
α + β ∈ C et αβ ∈ C. Donc C est bien un sous-anneau de K.
2
Définition 1.6. L’anneau C du théorème précédent s’appelle clôture intégrale de A dans K. On dira
que A est intégralement clos dans K si C = A. Si K = Frac(A) et C = A, on dira plus simplement que
A est intégralement clos.
Exercice 1. Un anneau factoriel est intégralement clos.
Indication : on dispose d’un pgcd donc d’un contenu par exemple.
Notation 1.7. Si K est une extension finie de Q (contenue dans C) on notera OK la clôture intégrale
de Z dans K.
Exemple 1.8. OQ√= Z car Z est factoriel donc intégralement clos.
OQ(i√5) = Z[i 5] n’est pas factoriel mais est intégralement clos.
On verra tout au long de ce cours que certains anneaux d’entiers s’avèrent pratiques pour résoudre
certaines équations arithmétiques.
2 Équations modulaires
Dans cette partie, on veut résoudre l’équation
P (x) ≡ 0 mod n
∗
pour P ∈ Z[X] et n ∈ N . Voici quelques pistes pour aborder ce type de problèmes.
2.1 Relations de Bézout et lemme des restes chinois
On se place dans l’anneau A = Z. La principalité, d’une part, et la factorialité, d’autre part, de cet
anneau euclidien permettent de réinterpréter le lemme des restes chinois :
Théorème 2.1 (Restes chinois). Soit n ∈ N∗ et n = p pαp une décomposition de n en produit de
Q
facteurs premiers. Alors on a un isomorphisme canonique d’anneaux :
Y
f : Z/nN → Z/pαp Z
p
donné par f (x mod n) = (x mod pαp )p .
On ne sait pas donner de formule explicite à l’inverse de f en général mais néanmoins, la principalité
donne
Théorème 2.2 (Relations de Bézout). Soient a, b ∈ N∗ et d = pgcd(a, b). Alors il existe des entiers
relatifs u, v ∈ Z tels que d = au + bv.
De plus, lorsque d = 1, l’isomorphisme canonique d’anneaux f : Z/abZ → Z/aZ × Z/bZ admet la
formule explicite suivante pour son inverse :
f −1 (x mod a, y mod b) = bvx + auy mod ab
Démonstration. Le premier point est immédiat car aZ + bZ = dZ car Z est principal.
Pour le second point, on observe que
x = (au + bv)x = bvx mod a
et que
y = (au + bv)y = auy mod b
Par somme,
bvx + auy = bvx = x mod a bvx + auy = auy = y mod b
3
On peut alors définir un algorithme explicite (cf. cours d’option C) pour trouver le couple (u, v) en
fonction de (a, b) en même temps que d = pgcd(a, b).
Le principe est le suivant :
On effectue successivement les divions euclidiennes successives :
a =bq1 + r1
b =r1 q2 + r2
..
.
rn−1 =rn qn+1 + rn+1
..
.
rm−1 =rm qm+1 + 0
Alors d = pgcd(a, b) = pgcd(b, r1 ) = · · · = pgcd(rm−1 , rm ) = rm .
Pour calculer u, v, on part de u0 = 1, u1 = 0, v0 = 0, v1 = 1 et on pose récursivement un = un−2 −
qn un−1 et vn = vn−2 − qn vn−1 . On vérifie immédiatement que aun + bvn = rn pour tout n donc en
particulier pour n = m.
Matriciellement, cela se réécrit également, pour :
un−2 vn−2 1 0
Xn = X2 = I2 =
un−1 vn−1 0 1
0 1
Xn+1 = Qn Xn Qn =
1 −qn
Les étudiants en option C savent très bien que le coût est un
O(log max(|a|, |b|)3 ).
2.2 Le lemme de Hensel
Le lemme des restes chinois permet de réduire partiellement le problème : au lieu de raisonner modulo
un entier n quelconque, on voit que l’équation P (x) = 0 mod n est équivalente au système d’équations
P (x) = 0 mod pαp .
On se demande alors comment résoudre P (x) = 0 mod pαp . Cela n’est pas toujours évident mais,
lorsque αp = 1, alors Z/pZ est un corps et le nombre de solutions est alors majoré par max deg(P ), p .
On ne traitera pas ici de la question de la résolution d’une équation polynômiale dans un corps (fini).
On observe qu’une solution modulo pα donne toujours lieu à une solution modulo p (descente). On
cherche alors à remonter les solutions, c’est-à-dire à répondre au problème suivant :
Étant donné une solution à P (x) = 0 mod p, existe-t-il des solutions à P (x) = 0 mod pα
telles que x = x mod p ?
On observe que certains polynômes ne se comportent pas bien vis-à-vis de ce problème. Par exemple,
le polynôme P = X 2 − p admet une solution modulo p mais pas modulo p2 .
Une réponse partielle mais souvent utile à ce problème est le Lemme de Hensel, qu’on a déjà utilisé
et démontré dans le cas particulier des résidus quadratiques. Ceci devrait certainement rappeler des
souvenirs aux étudiants en option C :
Lemme 2.3 (Dérivée de Hasse). Pour Q = ad X d + · · · + a0 ∈ Z[X] et i ∈ J0, dK, on définit la i-ème
dérivée de Hasse de Q par :
d i
Q[i] = ad X d−i + · · · + ai ∈ Z[X]
i i
On a alors l’égalité suivante dans Z[X, Y ] :
Q(X + Y ) = Q(X) + Y Q[1] (X) + · · · + Y d Q[d] (X)
où d = deg(Q).
4
Démonstration. Ceci est laissé en exercice au lecteur. Celui-ci pourra également observer que dans Q[X],
Q(i) (X)
on a Q[i] (X) = i! .
Proposition 2.4. Soit P un polynôme dans Z[X] et p ∈ N un nombre premier. On suppose qu’il existe
x ∈ Z et α ∈ N tels que
P (x) = 0 mod pα et P 0 (x) 6= 0 mod p
Alors, il existe un entier y ∈ Z tel que
P (y) = 0 mod p2α et y = x mod pα
De plus, cet entier y est alors uniquement déterminé modulo p2α et on peut le choisir sous la forme
y = x − P (x)z où z ∈ Z vérifie zP 0 (x) = 1 mod pα .
Démonstration. On cherche y sous la forme y = x + tpα . Le lemme précédent (ou une formule de Taylor
si on justifie correctement) donne alors
P (x + tpα ) = P (x) + tpα P 0 (x) + t2 p2α Q(x)
pour un certain Q ∈ Z[X]. Comme P (x) = 0 mod pα , il existe s ∈ Z tel que P (x) = pα s. On a alors
P (x + tpα ) = pα (s + tP 0 (x)) mod p2α . Comme P 0 (x) 6= 0 mod p, on sait en particulier que P 0 (x) est
inversible modulo pα . On note z = (P 0 (x))−1 mod pα son inverse. Il suffit de prendre t = −zs mod pα
pour obtenir l’existence annoncée.
On observe de plus qu’on a trouvé y sous la forme y = x − zspα = x − P (x)z mod p2α .
On laisse au lecteur le soin de justifier l’unicité.
Corollaire 2.5 (Lemme de Hensel – version 1). Soit P un polynôme dans Z[X], soit p ∈ N un nombre
premier et α ∈ N∗ . Toute solution x ∈ Z/pα Z telle que
P (x) = 0 mod pα et P 0 (x) 6= 0 mod p
se relève de manière unique modulo pn pour tout n > α. Autrement dit, pour tout n > α, il existe un
unique xn ∈ Z/pn Z tel que
P (xn ) = 0 mod pn et xn = x mod pα
Démonstration. Il suffit de définir par récurrence xα = x et pour n > α
xn+1 = xn − P (xn )z où zP 0 (xn ) = 1 mod pn
En effet, la formule de Taylor
P 0 (xn ) = P 0 (x + (xn − x)) = P 0 (x) + (xn − x)Q(x) = P 0 (x) mod p
pour un certain Q ∈ Z[X] permet de justifier l’inversibilité de P 0 (xn ) pour tout n.
Remarque 2.6. Formellement, on recopie ici une méthode de Newton où on part d’un certain x0 qui n’est
« pas trop loin » d’être solution puisque c’est le cas modulo p et on veut poser, comme pour une méthode
de Newton classique
f (xn )
xn+1 = xn − 0
f (xn )
pour f = P tant que f 0 (xn ) ne s’annule pas, ce qui est en fait toujours le cas sous ces hypothèse. Le
nombre ε = p est, en topologie p-adique de norme strictement inférieure à 1, ce qui permet d’interpréter
la congruence modulo pn pour n → ∞ comme une certaine convergence. Autrement dit, la suite de terme
général pn converge vers 0 lorsque n tend vers +∞.
Il existe des versions plus générales de ce théorème. Par exemple, par convergence dans l’anneau des
entiers p-adiques, une solution modulo pα pour tout α, relevée de manière « compatible » est en fait un
élément de Zp .
Voici par exemple un énoncé assez général qu’on laisse au lecteur le soin de le réécrire en termes de
congruences modulo pn pour tout n et de le démontrer.
Théorème 2.7 (Lemme de Hensel – variante 2). Si P ∈ Zp [X] et k > 1 et x ∈ Zp sont tels que
P (x) ∈ pk Q0 (x)2 Zp , alors il existe un unique x ∈ Zp tel que P (x) = 0 et x − x ∈ pk P 0 (x)Zp .
On notera que la première condition dit, en particulier, que P (x) = 0 mod pk .
5
3 Équations diophantiennes linéaires
On a vu une première technique pour s’intéresser à des équations en 1 indéterminée. L’étape suivante
est de s’intéresser à plusieurs indéterminer. Commençons par le cas le plus simple de 2 indéterminées et
d’un polynôme de degré d = 1 (cas linéaire).
Comme souvent, la situation linéaire est simplifiée et permettra de se ramener à des méthodes d’algèbre
linéaire et/ou des calculs matriciels.
3.1 Le cas de dimension 1 en 2 variables
Soient a, b, c ∈ Z. On s’intéresse à l’équation diophantienne
ax + by = c
c’est-à-dire à l’équation P (x, y) = 0 pour P = aX + bY − c ∈ Z[X, Y ].
La principalité de Z donne immédiatement une obstruction à l’existence de solutions : pour tous
x, y ∈ Z, ax + by ∈ aZ + bZ = pgcd(a, b)Z. Si c n’est pas un multiplie du pgcd de a et b, alors il n’y a
pas de solutions.
Dans la suite notons d = pgcd(a, b). On peut alors poser a0 = ad , b0 = db et c0 = dc . Cela donne
l’équivalence des problèmes
ax + by = x ⇐⇒ a0 x + b0 y = c0
On suppose donc dans la suite, sans restriction, que a et b sont premiers entre eux et on se donne alors
une relation de Bézout :
au + bv = 1
Ainsi, par multiplication par c, on dispose d’une solution évidente
(x0 , y0 ) = (uc, vc)
Soit (x, y) ∈ Z2 une autre solution. Par soustraction des équations ax + by = c et ax0 + by0 = c, on a
alors
a(x − x0 ) + b(y − y0 ) = 0
Comme a et b sont premiers entre eux, le lemme de Gauss donne
a|y − y0 et b|x − x0
2
Donc il existe (k, `) ∈ Z tels que
x = x0 + bk et y = y0 + a`
Réciproquement, on observe que (x0 + bk, y0 + a`) est solution si, et seulement si, ` = −k. On a ainsi
démontré le :
Théorème 3.1. Soient a, b, c ∈ Z trois entiers non tous nuls et d = pgcd(a, b). Soit (E) l’équation
diophantienne ax + by = c. Soit au + bv = d une relation de Bézout.
Si d 6 |c alors (E) n’admet pas de solutions entières.
Si d|c, alors d 6= 0 et les solutions entières de (E) sont exactement les
c b c a
(u + k , v − k , k ∈ Z
d d d d
3.2 Le cas de dimension k en ` variables
Matriciellement, on a résolu l’équation diophantienne :
x
a b = c
y
Plus généralement, pour A ∈ Mk,` (Z) et C ∈ Mk,1 (Z), on cherche à résoudre
AX = C
pour X ∈ M`,1 (Z).
Un très mauvais réflexe serait de chercher à résoudre dans Q puis à chercher à éliminer les dénomina-
teurs communs : on risque alors de « rater » des solutions comme le montre le contre-exemple suivant :
6
Exemple 3.2. L’espace des solutions sur Q de
x
2x + 3y + 5z = 2 3 5 y = 0
z
est
3 5
Q − , 1, 0 ⊕ Q − , 0, 1
2 2
mais l’espace des solutions sur Z n’est pas
Z (−3, 2, 0) ⊕ Z (−5, 0, 2)
En effet, l’élément (0, 5, −3) n’est pas dans l’ensemble précédente puisque sa dernière coordonnée est
impair alors que c’est effectivement une solution du système diophantien.
Revenons à la résolution de AX = C. Supposons qu’on puisse échelonner la matrice A suivant ses
colonnes via des opérations élémentaires dans Z, c’est-à-dire trouver R ∈ GLk (Z) telle que B = AR ∈
Mk,` (Z) est échelonnée. Il devient alors facile de résoudre BY = C comme suit :
Supposons que B ait r colonnes B1 , . . . , Br non nulles. Alors, grâce à l’échelonnement, on
peut facilement vérifier s’il existe des entiers u1 , . . . , ur (forcément uniques) tels que C =
u1 B1 + · · · + ur Br . ∗ Si cette condition nécessaire et suffisante pour l’existence de solutions
entières du système est remplie, alors les solutions entières du système BY = C sont les
(u1 , . . . , ur , vr+1 , . . . , v` ) pour vr+1 , . . . , v` ∈ Z quelconques.
On résout ainsi AX = C en posant X = RY .
Exemple 3.3 (Le cas k = 1 et ` = 2). Ce cas a fait l’objet de la section précédente. Voyons comment
échelonner en colonnes la matrice A = a b . Si au + bv = d = pgcd(a, b) est une relation de Bézout,
alors on observe en posant a0 = ad et b0 = db qu’on a l’égalité matricielle :
u −b0
a b = d 0
v a0
Cela donne un échelonnement suivant les colonnes de A = a b en B = d 0 via la matrice R =
u −b0
∈ SL2 (Z).
v a0
0
0 c
L’équation BY = c d = c se résout très bien en Y = pour k ∈ Z quelconque. On retrouve alors
k
les solutions
u −b0
0 0
uc − b0 k
c
X = RY = =
v a0 k vc0 + a0 k
de la section précédente.
3.3 Forme normale de Hermite et de Smith d’une matrice
On rappelle (voir cours d’algèbre linéaire de début d’année) la définition suivante :
Définition 3.4. Soit A = (ai,j ) ∈ Mk,` (Z) une matrice échelonnée suivant les lignes. Soit r le nombre
de lignes non nulles de A et soit p(i) (appelé pivot) tel que ai,p(i) est le premier coefficient non nul sur la
i-ème ligne.
On dit que la matrice échelonnée A est réduite suivant les lignes si pour tout i ∈ llbracket1, rK on a
ai,p(i) > 0 et 0 6 ak,p(i) < ai,p(i) pour tout k ∈ J1, i − 1K.
Exercice 2. Donner une définition analogue pour les matrices échelonnées suivant les colonnes.
Pour échelonner une matrice à coefficients entiers suivant les colonnes, on utilise alors le théorème
suivant :
Théorème 3.5 (Forme normale de Hermite). Soit A ∈ Mk,` (Z). Alors il existe une unique matrice
B ∈ Mk,` (Z) échelonnée réduite suivant les lignes telle qu’il existe L ∈ GLk (Z) satisfaisant B = LA.
La matrice B ainsi obtenue est appelée la forme normale de Hermite de A.
∗. Ceci revient à dire que C appartient au Z-module de A dont (B1 , . . . , Br ) est une base.
7
Esquisse de preuve. L’existence est en fait constructive : on commence par échelonner la matrice A pour
obtenir B. On peut supposer que le premier coefficient non nul bi,p(i) de chaque ligne non nulle de B est
positif, quitte à multiplier cette ligne par −1. On peut ensuite faire 0 6 bk,p(i) < bi,p(i) pour k < i en
soustrayant à la k-ème ligne la i-ème multipliée par le quotient de la division euclidienne de bk,p(i) par
bi,p(i) ; on le fait dans l’ordre pour i = 1, 2, . . . (de gauche à droite).
Supposons qu’on ait deux formes normales de Hermite B et B 0 pour une même matrice A. Les lignes
non nulles de B et B 0 sont deux bases du même sous-module de Z` de rang r. Notons ces lignes B1 , . . . , Br
r
X
et B10 , . . . , Br0 respectivement. Par la condition d’échelonnement pour B et B 0 , on a Bi0 = λi,` B` avec
`=i
λi,i ∈ {±1}. Le fait que B et B 0 sont réduites impose d’abord λi,i = 1 puis λi,` = 0 pour ` ∈ Ji + 1, rK.
Remarque 3.6. Attention : le théorème statue l’unicité de la forme normale de Hermite mais pas de la
matrice de transformation L.
Exercice 3. Proposer et démontrer un théorème analogue pour l’échelonnement suivant les colonnes
d’une matrice.
Exercice 4. Soient A, B ∈ Mk,` (Z) deux matrices. Montrer que s’équivalent :
(i) il existe L ∈ GLk (Z) telle que B = LA ;
(ii) les lignes de A engendrent le même sous-Z-module de Z` que les lignes de B ;
(iii) les matrices A et B ont même forme normale de Hermite.
Bien que ceci ne soit pas utile dans la résolution de systèmes linéaires d’équations diophantiennes,
indiquons tout de même l’existence de la forme normale de Smith, qui s’avère essentielle pour manipuler
les Z-modules de type fini.
Théorème 3.7 (Forme normale de Smith). Soit A ∈ Mk,` (Z). Il existe une matrice diagonale B =
Mk,` (Z) dont les coefficients diagonaux b1 , . . . , br pour r = min(k, `) sont positifs ou nuls et vérifient
bi |bi+1 pour tout i ∈ J1, r − 1K et deux matrices inversibles L ∈ GLk (Z) et R ∈ GL` (Z) telles que
B = LAR.
De plus la matrice B vérifiant ces conditions est uniquement déterminée. On l’appelle la forme normale
de Smith de A.
Remarque 3.8. Encore une fois, on prendra garde que les matrices L et R ne sont pas uniquement
déterminées.
Contrairement à la forme normale de Hermite, il est possible de généraliser ce résultat à tout anneau
principal comme vous l’aviez vu l’année dernière en M1.
4 Le problème des d carrés
On se pose le problème suivant :
Étant donné un entier d > 1, à quelle(s) condition(s) un entier n ∈ Z s’écrit-il comme somme
de d carrés ?
Les carrés entiers – donc réels – étant positifs, une condition nécessaire immédiate est n > 0. Est-elle
suffisante ? Si d = 2, en raisonnant modulo 4 on observe qu’une somme de deux carrés est nécessairement
congrue à 0, 1 ou 2 modulo 4.
4.1 L’anneau des entiers de Gauss
On appelle anneau des entiers de Gauss l’anneau Z[i].
Pour z = a + ib ∈ Z[i], on définit :
1. son conjugué z = a − ib ;
2. sa trace Tr(z) = z + z = 2a ;
3. sa norme zz = a2 + b2 .
On observe en particulier que z est solution de l’équation entière X 2 − Tr(z)X + N (z).
L’application trace est Z-linéaire et l’application norme est multiplicative.
8
4.2 Propriétés de l’anneau
Fait 4.1. L’anneau Z[i] est intègre comme sous-anneau de C.
Proposition 4.2. L’application norme définit un stathme euclidien qui fait de Z[i] un anneau euclidien.
Démonstration. Tout d’abord, on constate que N (Z[i]) ⊂ N. Établissons l’existence d’une division eucli-
dienne.
Si x, y ∈ Z[i], alors il existe des réels α, β ∈ R tels que xy = α + iβ. Il existe alors des entiers
a, b ∈ Z tels que |α − a| < 12 et |β − b| < 12 . On pose q = a + ib ∈ Z[i] et r = x − qy. On a alors
2
N (r) 2
N (y)= |x−qy|
|y|2 = xy − q 6 |α − a|2 + |β − b|2 < 12 . En particulier, on a N (r) = 0 ou N (r) < N (y), ce
qui montre que N est bien un stathme.
Remarque 4.3. Ici, on observe, en particulier, qu’il n’y a pas toujours unicité de la division euclidienne
contrairement au cas Z ou K[X].
Exercice 5. Effectuer une division euclidienne de 3 − 3i par 2. Quels sont les différents quotients et restes
possibles ?
4.3 Éléments irréductibles
Avant de déterminer les éléments irréductibles de Z[i], il est utile de donner la liste de ses inversibles.
Fait 4.4. On a Z[i]× = {x ∈ Z[i], N (x) = 1} = {±1, ±i}.
Démonstration. Si x ∈ Z[i] est inversible, alors il existe y ∈ Z[i] tel que xy = 1. Comme la norme est
multiplicative, on a N (x)N (y) = 1 dans Z. Ceci impose que N (x) ∈ Z× ∩ N = {1}. Donc x = a + ib
avec a2 + b2 = 1. Cette équation impose a = ±1 et b = 0 ou a = 0 et b = ±1 dans Z par un argument
élémentaire de comparaison.
Réciproquement, on constate que les éléments ±1 et ±i sont inversibles dans Z[i].
Lemme 4.5. Tout élément irréductible de Z[i] divise dans Z[i] un élément irréductible de Z (i.e. un
nombre premier).
Démonstration. Soit x ∈ Z[i] irréductible. Alors x est également irréductible car sinon x ne le serait pas
en appliquant la conjugaison. Soit p ∈ Z premier divisant a = N (x) = xx. Comme Z[i] est factoriel, on
sait que x|p ou x|p dans Z[i]. Dans le premier cas, on a obtenu le résultat souhaité. On se ramène du
second cas au premier par conjugaison.
Lemme 4.6. Si un nombre premier p ∈ Z est réductible dans Z[i], alors c’est le produit de deux irréduc-
tibles conjugués l’un de l’autre. De plus, ces irréductibles sont associés si, et seulement si, p = 2.
Démonstration. On écrit p = xy avec N (x) 6= 1 et N (y) 6= 1. Alors N (p) = p2 = N (x)N (y) donne
p = N (x) = N (y) = xx. D’où y = x.
Écrivons x = uv avec u, v ∈ Z[i]. Alors N (x) = p = N (u)N (v) est une égalité dans Z. Donc N (u) = 1
ou N (v) = 1 par factorialité de Z. Ceci montre que u ou v est inversible dans Z[i] et donc que x et x sont
irréductibles.
Enfin, si x ∈ Z[i]× · x, alors les cas x = ±x sont exclus car p = ±x2 ne pourrait pas être un nombre
premier. Si x = ix, écrivons x = a + ib et x = a − ib = ia − b. On en déduit que b = −a et x = a(−1 + i).
Donc N (x) = p = 2N (a) est premier donne N (a) = 1 et p = 2. Il en est de même pour x = −ix.
Proposition 4.7. À inversibles près, les irréductibles de Z[i] sont :
{1 + i} t {p premier, p ≡ 3 mod 4} t {a + ib, p = a2 + b2 est premier et p ≡ 1 mod 4}.
Démonstration. Soit x = a + ib irréductible et p ∈ Z premier tel que a + ib divise p dans Z[i].
Si p est irréductible dans Z[i], alors a + ib = p.
Sinon, p = xx = a2 + b2 est somme de deux carrés. Donc p ≡ 1 ou 2 mod 4. Si p ≡ 1 mod 4,
montrons que p est réductible dans Z[i]. Par double quotient, cela revient à montrer que X 2 + 1 est
9
réductible dans Fp . Or
F× F×
p → p
−1 est un carré dans Fp ⇔ (−1) ∈ im
x 7 → x2
p−1
⇔ (−1) 2 = 1
p−1
⇔ ≡ 0 mod 2
2
⇔ p ≡ 1 mod 4
Enfin, on conclut en observant que 2 est le seul nombre premier pair.
4.4 Le théorème des 2 carrés
Théorème 4.8. Un nombre entier positif n ∈ N est somme de deux carrés si, et seulement si, vp (n) est
pair pour tout nombre premier p ≡ 3 mod 4.
Démonstration. Notons Σ = N (Z[i]) l’ensemble des sommes de deux carrés d’entiers. Il est clair que Σ
est stable par multiplication.
De plus, on a vu que 2 = 12 + 12 = N (1 + i) et les nombres premiers p ≡ 1 mod 4 sont des sommes
de 2 carrés. Si pour tout p ≡ 3 mod 4, on a vp (n) pair, alors on sait par multiplicativité de Σ que n est
somme de deux carrés.
Réciproquement, supposons n ∈ Σ et p premier tel que p ≡ 3 mod 4. On a vu que p est alors
irréductible dans l’anneau Z[i]. On écrit n = a2 + b2 avec a, b ∈ Z. Notons respectivement α et β les
valuations p-adiques dans Z[i] de a + ib et a − ib, ce qui est loisible puisque Z[i] est factoriel. La division
pα |a+ib donne alors N (pα ) = p2α |N (a+ib) = a2 +b2 = n. De même p2β |N (a−ib) = n. Donc la valuation
p-adique de n dans Z[i] est α + β > max(2α, 2β). Ce qui donne α = β et donc α + β est pair.
4.5 Le théorème des 4 carrés
Si on augmente la quantités de carrés à prendre en compte, il est claire que les conditions suffisantes
à une écriture en somme de d carrés est encore suffisante pour une écriture en somme de d + 1 carrés
puisque 0 = 02 est un carré dans Z. Le théorème suivant montre que le problème est en fait trivialisé dès
la situation d = 4.
Théorème 4.9. Tout entier positif n ∈ N s’écrit comme somme de 4 carrés n = a2 + b2 + c2 + d2 pour
a, b, c, d ∈ Z.
Pour démontrer ce résultat, on introduit cette fois la R-algèbre (non-commutative) des quaternions
u −v
H= ∈ M2 (C), u, v ∈ C
v u
dont une R base est donnée par
1 0 i 0 0 1 0 i
1= I= J= K=
0 1 0 −i −1 0 i 0
On observe les relations I 2 = J 2 = K 2 = −1 et IJ = K, JK = I, KI = J.
On appelle quaternions purs les éléments du sous-espace vectoriel de dimension 3, noté H0 , engendré
par I, J et K.
Si z = a1 + w avec a ∈ R et w = bI + cJ + dK ∈ H0 , on définit :
— son conjugué par z = a1 − w = a1 − bI − cJ − dK ;
— sa trace par Tr(z) = z + z = 2a1 ;
— sa norme par N (z) = zz = (a2 + b2 + c2 + d2 )1.
On observe en particulier que zz = N (z) = zz, que N (z1 z2 ) = N (z1 )N (z2 ) et que z est une racine
dans H du polynôme X 2 − Tr(z)X + N (z) ∈ R[X].
On définit A0 = Z1 + ZI + ZJ + ZK. On observe que A0 est une sous-Z-algèbre (non-commutative)
de H et que l’ensemble S des sommes de 4 carrés entiers est exactement S = N (A0 ).
Il est également commode d’introduire l’élément suivant L = 1+I+J+K
2 .
10
Lemme 4.10. L’ensemble A = A0 + ZL est une sous-Z-algèbre de H.
Démonstration. L’ensemble A est clairement stable par somme. L’ensemble A est stable par multiplication
par les éléments 1, I, J, K. Enfin Tr(L) = 1 et N (L) = 1 donnent L2 − L + 1 = 0 donc A est stable par
multiplication par L.
Proposition 4.11. On a S = N (A) = N (A0 ).
Démonstration. L’inclusion N (A0 ) ⊂ N (A) est claire. Pour α = a1+bI+cJ+dK 2 ∈ A avec a, b, c, d ∈ Z,
les entiers a, b, c, d sont de même parité. S’ils sont pairs, on a α ∈ A0 . Sinon, il existe des nombres
εa , εb , εc , εd ∈ {±1} et a0 , b0 , c0 , d0 ∈ Z tels que a = 4a0 + εa , b = 4b0 + εb , c = 4c0 + εc , d = 4d0 + εd . On pose
0 0 0
J+d0 K
ε = εa 1−εb I−ε 2
c J−εd K
∈ A. Alors N (ε) = 1 donc N (α) = N (αε). De plus, αε = 4 a 1+b I+c 2 ε+N (ε) =
(a0 1 + b0 I + c0 J + d0 K)(2ε) + 1 ∈ A0 . D’où N (α) = N (αε) ∈ N (A). Ainsi N (A) = N (A0 ) = S.
Démontrons à présent le théorème des 4 carrés.
Démonstration. De l’observation N (z1 z2 ) = N (z1 )N (z2 ) on tire qu’il suffit de démontrer que tout nombre
premier p est somme de 4 carrés. C’est vrai si p = 2 et on suppose désormais que p > 3 est premier donc,
en particulier, impair.
2
Le nombre de carrés dans Z/pZ est p+1 2 donc le polynôme −1 − X prend au moins une fois pour
valeur un carré modulo p. Autrement dit, il existe a, b ∈ Z tels que 1+a +b2 ∈ pZ. Ainsi (1+aI +bJ)(1−
2
aI − bJ) ∈ pZ1. Considérons l’idéal à gauche I de A engendré par p et 1 + aI + bJ. Avec une technique
analogue à celle utilisée pour l’anneau des entiers de Gauss, on définit un stathme sur A et on en déduit
que l’idéal à gauche I est principal, engendré par un élément β ∈ A de sorte que I = Aβ. D’autre part,
on observe que pA = Ap ⊂ I ⊂ A. Ainsi, il existe α ∈ A tel que p1 = αβ. Donc p2 = N (p1) = N (α)N (β).
Montrons que α et β ne sont pas inversibles.
Si α était inversible, alors p diviserait 1+aI +bJ. Autrement dit, il existerait des entiers a0 , b0 , c0 , d0 ∈ Z
0 0 0
J+d0 K
tels que 1 + aI + bJ = p a 1+b I+c 2 . En particulier, comme 1, I, J, K est une R-base, on a p2 = 1 ce
qui contredit p impair. Ainsi α est inversible.
Si β était inversible, on aurait I = A donc 1 = z1 (1 + aI + bJ) + z2 p ∈ I. En multipliant à droite
par 1 + aI + bJ = 1 − aI − bJ, on en déduit que 1 − aI − bJ ∈ Ap, ce qui est absurde par le même
raisonnement que précédemment.
Ainsi, on en déduit que N (α) 6= 1 et N (β) 6= 1 donc N (α) = N (β) = p dans Z factoriel. En particulier,
N (α) = p est une somme de quatre carrés.
Corollaire 4.12. Il existe une équation diophantienne qui admet une solution modulo n pour tout entier
n ∈ N∗ mais qui n’admet pas de solution dans Z.
Démonstration. Considérons P = X12 +X22 +X32 +X42 +1. Alors P (a, b, c, d) = 0 ⇐⇒ a2 +b2 +c2 +d2 = −1
n’a pas de solutions dans Z pour des raisons de signe. Mais P (a, b, c, d) = 0 mod n ⇐⇒ a2 +b2 +c2 +d2 =
n−1 mod n admet une solution dans Z/nZ puisque n−1 est somme de quatre carrés d’après le théorème
précédent.
4.6 Sommes de 3 carrés
La situation intermédiaire est celle des sommes de 3 carrés. Celle-ci utilise des techniques beaucoup
plus avancées et nous nous contenterons d’observer ici le résultat suivant :
Théorème 4.13 (Admis !). Un entier n s’écrit comme somme de 3 carrés si, et seulement si, il n’est pas
de la forme n = 4a (8m + 7) avec m, a ∈ N.
Pour une preuve complète du théorème, le lecteur qui s’ennuie pourra consulter le Cours d’arithmétique
de Serre.
Remarque 4.14. On observera que l’énoncé laisse d’emblée penser que le résultat est plus technique
puisque contrairement aux sommes de 2 carrés et 4 carrés, l’ensemble des sommes de 3 carrés n’est pas
stable par multiplication.
11