0% ont trouvé ce document utile (0 vote)
23 vues264 pages

Développements pour l'agrégation mathématique

Transféré par

abdullatif ellawy
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • séries de Fourier,
  • fonctions continues,
  • théorèmes,
  • équations différentielles,
  • théorème de Chevalley-Warning,
  • théorème de Rothstein-Trager,
  • mathématiques,
  • théorème de Frobenius-Zolotare…,
  • ellipses,
  • théorème de Wantzel
0% ont trouvé ce document utile (0 vote)
23 vues264 pages

Développements pour l'agrégation mathématique

Transféré par

abdullatif ellawy
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • séries de Fourier,
  • fonctions continues,
  • théorèmes,
  • équations différentielles,
  • théorème de Chevalley-Warning,
  • théorème de Rothstein-Trager,
  • mathématiques,
  • théorème de Frobenius-Zolotare…,
  • ellipses,
  • théorème de Wantzel

Développements pour les oraux

de l'agrégation externe

de mathématiques

Romain GIUGE

Année 2012-2013
Ce document regroupe les développements que j'ai préparé pour les oraux de
l'agrégation externe de mathématiques. Mon travail n'a pas été de me restreindre
aux développements proprement dits. J'ai voulu aller plus loin en ajoutant à la suite
de chaque développement des compléments pouvant concerner, selon les cas, des
rappels de dénitions et de théorèmes utilisés dans le développement, des ajouts de
remarques, d'applications et d'exemples liés au développement. Le but recherché est
que chaque développement se suse à lui-même autant que possible, en permettant
d'élargir un peu son champ et éventuellement d'anticiper des questions du jury.
Un exemple parmi tant d'autres : dans le développement "Densité des fonctions
continues et nulle part dérivables" sont donnés des exemples de fonctions continues
et nulle part dérivables qu'il est bon d'avoir en tête lorsqu'on le présente.

Pour chaque développement, la partie à présenter s'arrête à la première barre


horizontale. Les divers compléments se trouvent en-dessous, et à la n une ou plu-
sieurs références sont données dans la mesure du possible. Tous mes développements
ont été relus de nombreuses fois au cours de l'année, j'espère donc que les coquilles
et erreurs soient maintenant presque éradiquées. Il va néanmoins sans dire qu'un
regard critique doit toujours être porté sur tout ce qui est écrit ici.

Je donne ma répartition de mes développements dans le chapitre "Couplages".


Cette répartition est également sujette à des révisions. Les vaguelettes indiquent des
choix très certainement douteux, et les développements barrés sont des développe-
ments qui pourraient aller mais dont je me suis nalement passé. Ces développements
sont alors placés dans le chapitre "Développements bonus".

J'adresse pour nir un grand remerciement à notre formidable club agrég de Lyon
pour cette super année de préparation : merci à Donatien Bénéat pour toutes ses
méthodes bizarres sorties de son esprit ou de livres que personne n'a jamais pensé
à emprunter ; à Abdelhakc Yakoub pour son rôle de délégué parfaitement réalisé
avec une belle organisation des évènements de notre promo de l'université Lyon 1 ; à
Nicolas Doyen pour notre course aux développements, pour ses 74 développements
uniquement d'algèbre dont on n'oubliera pas la longueur interminable de chacun,
et pour ses réponses précises à mes questions d'algèbre ; à Sa Sainte Omniscience
Guillaume Delon pour ses corrections, ses éclaircissements des documents de Nico-
las, et ses nombreux chocolats ; à Simon Boyer pour sa solution qui nous a tous
fait gagner des points aux écrits et son talent pour des présentations de leçons pé-
dagogiques, bien qu'interminables ; à Chloé Bourquard pour toutes les fois où elle
a bien voulu manger avec nous et pour les leçons pénibles qu'elle a dû présenter
dans l'année mais dont l'utilité a été certaine. Et merci à toute notre promo pour
l'ambiance formidable qu'on a eu cette année !

1 || Romain Giuge
Table des matières

1 Couplages 5
1.1 Leçons d'algèbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Leçons d'analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Développements d'algèbre 16
2.1 Algorithme pour le calcul des facteurs invariants . . . . . . . . . . . . 17
2.2 Comptage de racines par les formes quadratiques . . . . . . . . . . . 22
2.3 Décomposition de Dunford . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 Décomposition polaire dans GLn (C) . . . . . . . . . . . . . . . . . . . 32
2.5 Décomposition QR . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.6 Dénombrement des polynômes irréductibles sur un corps ni . . . . . 42
2.7 Dénombrement des solutions d'une équation diophantienne . . . . . . 46
2.8 Ellipse de Steiner et application . . . . . . . . . . . . . . . . . . . . . 49
2.9 Irréductibilité des polynômes cyclotomiques sur Q . . . . . . . . . . . 54
2.10 Méthode de Gauss-Seidel . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.11 Quelques propriétés des homographies . . . . . . . . . . . . . . . . . 66
2.12 Réduction des isométries d'un espace euclidien . . . . . . . . . . . . . 73
2.13 Simplicité de An . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
2.14 Sous-groupes compacts de GLn (R) . . . . . . . . . . . . . . . . . . . 80
2.15 Surjectivité de l'exponentielle . . . . . . . . . . . . . . . . . . . . . . 87

2
Table des matières

2.16 Théorème de Burnside . . . . . . . . . . . . . . . . . . . . . . . . . . 90


2.17 Théorème de Cartan-Dieudonné . . . . . . . . . . . . . . . . . . . . . 93
2.18 Théorème de Chevalley-Warning . . . . . . . . . . . . . . . . . . . . . 97
2.19 Théorème de Frobenius-Zolotarev . . . . . . . . . . . . . . . . . . . . 100
2.20 Théorème de Krein-Milman . . . . . . . . . . . . . . . . . . . . . . . 103
2.21 Théorème de Kronecker . . . . . . . . . . . . . . . . . . . . . . . . . 106
2.22 Théorème de Pascal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
2.23 Théorème de Rothstein-Trager . . . . . . . . . . . . . . . . . . . . . . 113
2.24 Théorème de Wantzel . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
2.25 Théorème de Wedderburn . . . . . . . . . . . . . . . . . . . . . . . . 120
2.26 Théorème des deux carrés . . . . . . . . . . . . . . . . . . . . . . . . 122
2.27 Topologie des orbites de l'action de Steinitz . . . . . . . . . . . . . . 126

3 Développements d'analyse 129


∞ α−1 it
3.1 Calcul de l'intégrale dt . . . . . . . . . . . . . . . . . . . . 130
R
0
t e
3.2 Complétude de l'espace L (µ) . . . . . . . . . . . . . . . . . . .
p
. . . 133
3.3 Comportement des solutions d'une équation diérentielle linéaire . . . 136
3.4 Densité des fonctions continues et nulle part dérivables . . . . . . . . 140
3.5 Densité des polynômes orthogonaux . . . . . . . . . . . . . . . . . . . 144
3.6 Ellipsoïde de John-Loewner . . . . . . . . . . . . . . . . . . . . . . . 148
3.7 Equation de la chaleur . . . . . . . . . . . . . . . . . . . . . . . . . . 152
3.8 Etude du folium de Descartes . . . . . . . . . . . . . . . . . . . . . . 157
3.9 Formule des compléments . . . . . . . . . . . . . . . . . . . . . . . . 162
3.10 Formule sommatoire de Poisson et application . . . . . . . . . . . . . 166
3.11 Lemme de Morse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
3.12 Maximalité et globalité des solutions de y 0 = f (t, y) . . . . . . . . . . 174
3.13 Méthode de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
3.14 Nombres de Bell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
3.15 Nombres normaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
3.16 Polynômes de Bernstein . . . . . . . . . . . . . . . . . . . . . . . . . 192
3.17 Preuve probabiliste de la formule de Stirling . . . . . . . . . . . . . . 197
3.18 Projection sur un convexe fermé et représentation de Riesz . . . . . . 200
3.19 Sous-espaces vectoriels fermés de Lp (µ) . . . . . . . . . . . . . . . . . 204
3.20 Théorème de Borel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
3.21 Théorème de Brouwer . . . . . . . . . . . . . . . . . . . . . . . . . . 211
3.22 Théorème de Hardy-Littlewood . . . . . . . . . . . . . . . . . . . . . 217
3.23 Théorème de Le Cam . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
3.24 Théorème de Liapounov . . . . . . . . . . . . . . . . . . . . . . . . . 224
3.25 Théorème des extrema liés . . . . . . . . . . . . . . . . . . . . . . . . 228

3 || Romain Giuge
Table des matières

3.26 Théorème des quatre sommets . . . . . . . . . . . . . . . . . . . . . . 234

4 Développements bonus 241


4.1 Diérentielle d'une limite et application exponentielle . . . . . . . . . 242
4.2 Points extrémaux de la boule unité de Mn (R) . . . . . . . . . . . . . 245
4.3 Sous-espaces de dimension nie de C (R, C) stables par translations . . 248
4.4 Théorème de Brauer . . . . . . . . . . . . . . . . . . . . . . . . . . . 250

5 Quelques résultats intéressants 253


5.1 Application du théorème de Chevalley-Warning . . . . . . . . . . . . 254
5.2 Cyclicité du groupe multiplicatif d'un corps ni . . . . . . . . . . . . 256
5.3 Groupes d'ordre p2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
5.4 Réunion de sous-espaces stricts . . . . . . . . . . . . . . . . . . . . . 259
5.5 Sous-groupes à un paramètre de GLn (K) . . . . . . . . . . . . . . . . 260
5.6 Tout hyperplan de Mn (K) rencontre GLn (K) . . . . . . . . . . . . . 261
5.7 Un polynôme irréductible . . . . . . . . . . . . . . . . . . . . . . . . 262
5.8 Une fonction donnant tous les nombres premiers . . . . . . . . . . . . 263

4 || Romain Giuge
Chapitre 1
Couplages

5
1.1. Leçons d'algèbre

1.1 Leçons d'algèbre


1. 101 - Groupe opérant sur un ensemble. Exemples et applications.
â Théorème de Wedderburn.
â Topologie des orbites de l'action de Steinitz.
â Théorème de Brauer.
2. 102 - Groupe des nombres complexes de module 1. Sous-groupes des racines
de l'unité. Applications.
â Irréductibilité des polynômes cyclotomiques sur Q.
â Dénombrement des solutions d'une équation diophantienne.
â Théorème de Kronecker.
3. 103 - Exemples et applications des notions de sous-groupe distingué et de
groupe quotient.
â Simplicité de An .
â Théorème de Frobenius-Zolotarev.
4. 104 - Groupes nis. Exemples et applications.
â Simplicité de An .
â Théorème de Frobenius-Zolotarev.
â Théorème de Burnside.
5. 105 - Groupe des permutations d'un ensemble ni. Applications.
â Simplicité de An .
â Théorème de Frobenius-Zolotarev.
â Théorème de Brauer.
6. 106 - Groupe linéaire d'un espace vectoriel de dimension nie E , sous-groupes
de GL(E). Applications.
â Décomposition polaire dans GLn (C).
â Théorème de Frobenius-Zolotarev.
â Théorème de Burnside.
â Théorème de Brauer.
7. 107 - Représentations et caractères des groupes nis sur un espace vectoriel
complexe.
â 7
â 7

6 || Romain Giuge
1.1. Leçons d'algèbre

8. 108 - Exemples de parties génératrices d'un groupe. Applications.


â Théorème de Frobenius-Zolotarev.
â Théorème de Cartan-Dieudonné.
9. 109 - Représentations des groupes nis de petit cardinal.
â 7
â 7
10. 120 - Anneau Z/nZ. Applications.
â Irréductibilité des polynômes cyclotomiques sur Q.
â Théorème des deux carrés.
11. 121 - Nombres premiers. Applications.
â Irréductibilité des polynômes cyclotomiques sur Q.
â Théorème des deux carrés.
12. 122 - Anneaux principaux. Applications.
â Théorème des deux carrés.
â Algorithme pour le calcul des facteurs invariants.
13. 123 - Corps nis. Applications.
â Dénombrement des polynômes irréductibles sur un corps ni.
â Théorème de Chevalley-Warning.
â Théorème de Wedderburn.
14. 124 - Anneau des séries formelles. Applications.
â Dénombrement des solutions d'une équation diophantienne.
â Nombres de Bell (la version adaptée).
15. 125 - Extensions de corps. Exemples et applications.
â Dénombrement des polynômes irréductibles sur un corps ni.
â Théorème de Wantzel.
â Théorème de Rothstein-Trager.
16. 140 - Corps des fractions rationnelles à une indéterminée sur un corps com-
mutatif. Applications.
â Dénombrement des solutions d'une équation diophantienne.
â Théorème de Rothstein-Trager. (décomposition en éléments simples, pri-
mitives de fractions rationnelles)
17. 141 - Polynômes irréductibles à une indéterminée. Corps de rupture. Exemples
et applications.

7 || Romain Giuge
1.1. Leçons d'algèbre

â Dénombrement des polynômes irréductibles sur un corps ni.


â Irréductibilité des polynômes cyclotomiques sur Q.
18. 142 - Algèbre des polynômes à n indéterminées. Applications.
â Théorème de Chevalley-Warning.
â Théorème de Kronecker.
19. 143 - Résultant. Applications.
â Théorème de Kronecker.
â Théorème de Rothstein-Trager.
20. 144 - Racines d'un polynômes, fonctions symétriques élémentaires. Localisation
des racines dans les cas réel et complexe.
â Comptage de racines par les formes quadratiques.
â Théorème de Kronecker.
â Ellipse de Steiner et application.
21. 150 - Exemples d'actions de groupes sur les espaces de matrices.
â Décomposition polaire dans GLn (C) (l'énoncé adapté).
â Topologie des orbites de l'action de Steinitz.
â Théorème de Brauer (l'énoncé adapté).
22. 151 - Dimension d'un espace vectoriel (on se limitera au cas de dimension
nie). Rang. Exemples et applications.
â Théorème des extrema liés.
â Comptage de racines par les formes quadratiques.
â Sous-espaces de dimension nie de C (R, C) stables par translations.
23. 152 - Déterminant. Exemples et applications.
â Théorème de Frobenius-Zolotarev.
â Ellipsoïde de John-Loewner.
â Topologie des orbites de l'action de Steinitz.
â Théorème de Brauer.
24. 153 - Polynômes d'endomorphismes en dimension nie. Application à la ré-
duction d'un endomorphisme en dimension nie.
â Décomposition de Dunford.
â Théorème de Burnside.
â Décomposition polaire dans GLn (C).

8 || Romain Giuge
1.1. Leçons d'algèbre

â Surjectivité de l'exponentielle.
25. 154 - Sous-espaces stables d'un endomorphisme ou d'une famille d'endomor-
phismes en dimension nie. Applications.
â Réduction des isométries d'un espace euclidien.
â Décomposition de Dunford.
â Sous-espaces de dimension nie de C (R, C) stables par translations (stabilité
par l'endomorphisme de dérivation).
26. 155 - Endomorphismes diagonalisables en dimension nie.
â Théorème de Burnside.
â Décomposition de Dunford.
27. 156 - Exponentielle de matrices. Applications.
â Surjectivité de l'exponentielle.
â Théorème de Liapounov.
â Diérentielle d'une limite et application exponentielle.
28. 157 - Endomorphismes trigonalisables. Endomorphismes nilpotents.
â Théorème de Burnside.
â Décomposition de Dunford.
29. 158 - Matrices symétriques réelles, matrices hermitiennes.
â Méthode de Gauss-Seidel.
â Lemme de Morse.
â Décomposition polaire dans GLn (C).
â Points extrémaux de la boule unité de Mn (R).
30. 159 - Formes linéaires et hyperplans en dimension nie. Exemples et applica-
tions.
â Théorème de Cartan-Dieudonné.
â Théorème de Krein-Milman.
â Comptage de racines par les formes quadratiques.
â Théorème des extrema liés.
::::::::::::::::::::::::::::

31. 160 - Endomorphismes remarquables d'un espace vectoriel euclidien de dimen-


sion nie.
â Théorème de Cartan-Dieudonné.
â Décomposition polaire dans GLn (C).
â Réduction des isométries d'un espace euclidien.

9 || Romain Giuge
1.1. Leçons d'algèbre

32. 161 - Isométries d'un espace ane euclidien de dimension nie. Formes ré-
duites. Applications en dimensions 2 et 3.
â Réduction des isométries d'un espace euclidien.
â Théorème de Cartan-Dieudonné.
â Points extrémaux de la boule unité de Mn (R).
33. 162 - Systèmes d'équations linéaires. Opérations, aspects algorithmiques et
conséquences théoriques.
â Méthode de Gauss-Seidel.
â Décomposition QR.
34. 170 - Formes quadratiques sur un espace vectoriel de dimension nie. Ortho-
gonalité, isotropie. Applications.
â Comptage de racines par les formes quadratiques.
â Théorème de Liapounov.
â Lemme de Morse.
35. 171 - Formes quadratiques réelles. Exemples et applications.
â Comptage de racines par les formes quadratiques.
â Théorème de Liapounov.
â Lemme de Morse.
36. 180 - Coniques. Applications.
â Ellipse de Steiner et application.
â Théorème de Pascal.
37. 181 - Barycentres dans un espace ane réel de dimension nie, convexité.
Applications.
â Sous-groupes compacts de GLn (R).
â Théorème de Krein-Milman.
â Points extrémaux de la boule unité de Mn (R).
38. 182 - Application des nombres complexes à la géométrie.
â Ellipse de Steiner et application.
â Quelques propriétés des homographies.
39. 183 - Utilisation des groupes en géométrie.
â Quelques propriétés des homographies.
â Ellipse de Steiner et application (à adapter avec l'action du groupe ane).
40. 190 - Méthodes combinatoires, problèmes de dénombrement.

10 || Romain Giuge
1.2. Leçons d'analyse

â Dénombrement des solutions d'une équation diophantienne.


â Dénombrement des polynômes irréductibles sur un corps ni.
â Nombres de Bell.
â Théorème de Brauer.

1.2 Leçons d'analyse


1. 201 - Espaces de fonctions. Exemples et applications.
â Densité des fonctions continues et nulle part dérivables.
â Complétude de Lp .
2. 202 - Exemples de parties denses et applications.
â Densité des fonctions continues et nulle part dérivables.
â Densité des polynômes orthogonaux.
â Sous-espaces vectoriels fermés de Lp (application de Cn est séparable).
3. 203 - Utilisation de la notion de compacité.
â Sous-groupes compacts de GLn (R).
â Théorème de Brouwer.
â Décomposition polaire dans GLn (C).
4. 204 - Connexité. Exemples et applications.
â Surjectivité de l'exponentielle.
â Théorème de Brouwer.
5. 205 - Espaces complets. Exemples et applications.
â Complétude de Lp .
â Densité des fonctions continues et nulle part dérivables (utilisation du
théorème de Baire).
6. 206 - Théorèmes de point xe. Exemples et applications.
â Sous-groupes compacts de GLn (R).
â Théorème de Brouwer.
7. 207 - Prolongement de fonctions. Exemples et applications.
â Densité des polynômes orthogonaux (prolongement analytique).
â Maximalité et globalité des solutions de y 0 = f (t, y).
8. 208 - Espaces vectoriels normés, applications linéaires continues. Exemples.
â Sous-espaces vectoriels fermés de Lp .

11 || Romain Giuge
1.2. Leçons d'analyse

â Projection sur un convexe fermé et représentation de Riesz.


9. 213 - Espaces de Hilbert, bases hilbertiennes. Exemples et applications.
â Densité des polynômes orthogonaux.
â Projection sur un convexe fermé et représentation de Riesz.
10. 214 - Théorème d'inversion locale, théorème des fonctions implicites. Exemples
et applications.
â Théorème de Brouwer.
â Surjectivité de l'exponentielle.
â Théorème des extrema liés.
â Lemme de Morse.
11. 215 - Applications diérentiables dénies sur un ouvert de Rn . Exemples et
applications.
â Théorème de Brouwer.
â Lemme de Morse.
â Théorème de Liapounov.
â Diérentielle d'une limite et application exponentielle.
12. 216 - Etude métrique des courbes. Exemples.
â Etude du folium de Descartes.
â Théorème des quatre sommets.
13. 217 - Sous-variétés de Rn , exemples.
â Etude du folium de Descartes.
â Théorème des extrema liés.
::::::::::::::::::::::::::::

14. 218 - Applications des formules de Taylor.


â Méthode de Newton.
â Lemme de Morse.
15. 219 - Problèmes d'extremum.
â Théorème des extrema liés.
â Ellipsoïde de John-Loewner.
16. 220 - Equations diérentielles X 0 = f (t, X), exemples d'études qualitatives
des solutions.
â Théorème de Liapounov.
â Maximalité et globalité des solutions de y 0 = f (t, y).

12 || Romain Giuge
1.2. Leçons d'analyse

17. 221 - Equations diérentielles linéaires. Systèmes d'équations diérentielles


linéaires. Exemples et applications.
â Théorème de Liapounov.
â Comportement des solutions d'une équation diérentielle linéaire.
â Sous-espaces de dimension nie de C (R, C) stables par translations.
18. 223 - Convergence des suites numériques. Exemples et applications.
â Méthode de Newton.
â Preuve probabiliste de la formule de Stirling.
19. 224 - Comportement asymptotique des suites numériques. Rapidité de conver-
gence. Exemples.
â Méthode de Newton.
â Preuve probabiliste de la formule de Stirling.
20. 226 - Comportement d'une suite réelle ou vectorielle dénie par une itération
un+1 = f (un ). Exemples.
â Méthode de Newton.
â Méthode de Gauss-Seidel.
21. 228 - Continuité et dérivabilité des fonctions réelles d'une variable réelle.
Exemples et contre-exemples.
â Densité des fonctions continues et nulle part dérivables.
â Théorème de Borel.
22. 229 - Fonctions monotones. Fonctions convexes. Exemples et applications.
â Méthode de Newton.
â Ellipsoïde de John-Loewner.
23. 230 - Séries de nombres réels ou complexes. Comportement des restes ou des
sommes partielles des séries numériques. Exemples.
â Théorème de Hardy-Littlewood.
â Nombres de Bell.
24. 232 - Méthodes d'approximation des solutions d'une équation F (X) = 0.
Exemples.
â Méthode de Newton.
â Méthode de Gauss-Seidel.
25. 234 - Espaces Lp .
â Complétude de Lp .

13 || Romain Giuge
1.2. Leçons d'analyse

â Sous-espaces vectoriels fermés de Lp .


26. 235 - Suites et séries de fonctions intégrables. Exemples et applications.
â Calcul d'une intégrale.
â Complétude de Lp .
â Preuve probabiliste de la formule de Stirling.
27. 236 - Illustrer par des exemples quelques méthodes de calcul d'intégrales de
fonctions d'une ou plusieurs variables réelles.
â Calcul d'une intégrale.
â La formule des compléments.
28. 239 - Fonctions dénies par une intégrale dépendant d'un paramètre. Exemples
et applications.
â Calcul d'une intégrale.
â Densité des polynômes orthogonaux.
29. 240 - Transformation de Fourier, produit de convolution. Applications.
â Densité des polynômes orthogonaux.
â Formule sommatoire de Poisson et application.
30. 241 - Suites et séries de fonctions. Exemples et contre-exemples.
â Théorème de Borel.
â Equation de la chaleur.
â Preuve probabiliste de la formule de Stirling.
â Diérentielle d'une limite et application exponentielle.
31. 243 - Convergence des séries entières, propriétés de la somme. Exemples et
applications.
â Théorème de Hardy-Littlewood.
â Nombres de Bell.
â Dénombrement des solutions d'une équation diophantienne (à adapter
avec les séries entières).
32. 245 - Fonctions holomorphes et méromorphes sur un ouvert de C.
â La formule des compléments.
â Densité des polynômes orthogonaux.
33. 246 - Séries de Fourier. Exemples et applications.
â Equation de la chaleur.
â Formule sommatoire de Poisson et application.

14 || Romain Giuge
1.2. Leçons d'analyse

34. 247 - Exemples de problèmes d'interversion de limites.


â Calcul d'une intégrale.
â Théorème de Hardy-Littlewood.
â Diérentielle d'une limite et application exponentielle.
35. 249 - Suites de variables de Bernoulli indépendantes.
â Théorème de Le Cam.
â Polynômes de Bernstein.
36. 250 - Loi des grands nombres, théorème de la limite centrale. Applications.
â Nombres normaux.
â Preuve probabiliste de la formule de Stirling.
37. 251 - Indépendance d'événements et de variables aléatoires. Exemples.
â Théorème de Le Cam.
â Nombres normaux.
38. 252 - Loi binomiale, loi de Poisson. Applications.
â Théorème de Le Cam.
â Polynômes de Bernstein.
â Preuve probabiliste de la formule de Stirling.
39. 253 - Utilisation de la notion de convexité en analyse.
â Méthode de Newton.
â Ellipsoïde de John-Loewner.
40. 254 - Espace de Schwartz et distributions tempérées. Transformation de Fou-
rier dans S(Rd ) et S 0 (Rd ).
â Formule sommatoire de Poisson et application.
â 7
41. 255 - Espaces de Schwartz. Distributions. Dérivation au sens des distributions.
â Formule sommatoire de Poisson et application.
â 7

15 || Romain Giuge
Chapitre 2
Développements d'algèbre

16
2.1. Algorithme pour le calcul des facteurs invariants

2.1 Algorithme pour le calcul des facteurs invariants


Théorème. Soit A un anneau principal. Soit U ∈ Mm×n (A). Alors il existe une
famille (d1 , . . . , ds ) d'éléments non nuls de A vériant d1 | . . . |ds et telle que U soit
équivalente à la matrice D = Diag(d1 , . . . , ds , 0, . . . , 0) ∈ Mm×n (A), i.e. il existe
(P, Q) ∈ GLm (A) × GLn (A) tel que U = P DQ. Les di sont uniques à des inversibles
près, ils sont appelés facteurs invariants de la matrice U .
Nous allons donner une preuve algorithmique de ce théorème dans le cas où A est
un anneau euclidien. On note ϕ le stathme de A euclidien. Pour alléger les notations,
on note constamment U = (ui,j )16i6m la matrice modiée à chaque étape. Sa i-ième
16j6n
ligne est notée Li et sa j -ième colonne est notée Cj .

Etape 1. Si U = 0, n de l'algorithme.
Etape 2. Sinon, soit (i0 , j0 ) tel que ϕ(ui0 ,j0 ) = min{ϕ(ui,j ), ui,j 6= 0}. Permuter les
colonnes C1 et Cj0 puis les lignes L1 et Li0 an de placer ui0 ,j0 en haut à
gauche de U .
Etape 3. Traitement de la première colonne. Soit i = 2.
Etape 3.a. Eectuer la division euclidienne de ui,1 par u1,1 :
ui,1 = u1,1 q + ri avec ri = 0 ou ϕ(ri ) < ϕ(u1,1 ).

Soustraire q fois la ligne L1 à la ligne Li pour obtenir ui,1 = ri .


Etape 3.b. Si ri 6= 0, échanger les lignes Li et L1 et retourner à Etape 3.a.
Etape 3.c. Si ri = 0 et i < m, passer à la ligne suivante : i := i + 1 et aller à Etape
3.a.
Etape 3.d. Si ri = 0 et i = m, aller à Etape 4.
Etape 4. Traitement de la première ligne. Soit j = 2.
Etape 4.a. Eectuer la division euclidienne de u1,j par u1,1 :

u1,j = u1,1 q + sj avec sj = 0 ou ϕ(sj ) < ϕ(u1,1 ).

Soustraire q fois la colonne C1 à la colonne Cj pour obtenir u1,j = sj .


Etape 4.b. Si sj 6= 0, échanger les colonnes Cj et C1 et retourner à Etape 3.
Etape 4.c. Si sj = 0 et j < n, passer à la colonne suivante : j := j + 1 et aller à
Etape 4.a.
Etape 4.d. Si sj = 0 et j = n, aller à Etape 5.
Etape 5. Divisibilité.

17 || Romain Giuge
2.1. Algorithme pour le calcul des facteurs invariants

Etape 5.a. S'il existe i1 > 2 et j1 > 2 tels que u1,1 ne divise pas ui1 ,j1 , ajouter la
colonne Cj1 à la colonne C1 et retourner à Etape 3.
Etape 5.b. Sinon, retourner à Etape 1. avec la matrice extraite U = (ui,j )26i6m .
26j6n

Comme on revient souvent en arrière, il n'est pas garanti que l'agorithme termine.
Cependant, il terminera car à chaque retour en arrière, ϕ(u1,1 ) décroît d'au moins
une unité, et comme ϕ est à valeur dans N, l'algorithme s'arrêtera au bout d'un
nombre ni d'étapes.
A chaque étape de l'algorithme, les opérations eectuées sont des opérations
élémentaires sur les lignes et les colonnes, d'où le résultat après traduction en termes
de matrices.

Unicité des di :
Pour U ∈ Mm×n (A), on note

Λj (U ) = PGCD(∆j , ∆j mineur de taille j de U ).

Par convention, on pose Λ0 (U ) = 1.


On note d1 , . . . , ds les facteurs invariants obtenus avec l'algorithme et on va
montrer qu'ils sont uniques à des inversibles près. On a donc U = P DQ avec
D = Diag(d1 , . . . , ds , 0, . . . , 0). De manière évidente, on a Λj (D) = d1 . . . dj . Par la
proposition suivante, pour tout j 6 s, il existe aj ∈ A∗ tel que Λj (D) = d1 . . . dj =
aj Λj (U ). Ainsi  
aj Λj (U ) aj Λj (U )
dj = = ,
aj−1 Λj−1 (U ) aj−1 Λj−1 (U )
| {z }
∈A∗

ce qui prouve l'unicité à inversibles près.

Proposition. Soient U, U 0 ∈ Mm×n (A) deux matrices équivalentes. Alors pour tout
j ∈ [[1, min(m, n)]], on a
hΛj (U )i = hΛj (U 0 )i.

Démonstration. Supposons d'abord que U = P U 0 avec P ∈ GLm (A). Alors les lignes
de U sont combinaisons linéaires des lignes de U 0 . Par multilinéarité du déterminant,
un mineur de taille j de U est combinaison linéaire de mineurs de taille j de U 0 , et
ainsi hΛj (U )i ⊂ hΛj (U 0 )i. Comme on peut aussi écrire U 0 = P −1 U , on obtient de
même hΛj (U 0 )i ⊂ hΛj (U )i, d'où égalité.
De la même manière, si U = U 0 Q avec Q ∈ GLn (A), on a hΛj (U 0 )i = hΛj (U )i
(cette fois les colonnes de U sont combinaison linéaires des colonnes de U 0 ).
En rassemblant, si U = P U 0 Q, alors hΛj (U )i = hΛj (U 0 )i.

18 || Romain Giuge
2.1. Algorithme pour le calcul des facteurs invariants

Remarque. Les corps sont des anneaux euclidiens. En eet, la division euclidienne
dans un corps K s'écrit : pour tout (x, y) ∈ K × (K\{0}), x = (xy −1 )y + 0. Le reste
est toujours nul, donc on peut choisir n'importe quelle stathme ϕ.
Ainsi, lorsque A est un corps, l'algorithme aboutit à la matrice Jr : en réalité,
on a n'importe quel nombre non nul sur la diagonale pour i 6 s, et comme les di
sont donnés à des inversibles près, on peut mettre 1. L'algorithme fournit ainsi une
méthode de calcul du rang par opérations élémentaires.
Enn, la proposition donne la caractérisation du rang par les mineurs extraits :
le rang d'une matrice est égal au plus grand ordre d'un mineur non nul de cette
matrice.

Corollaire (Théorème de la base adaptée). Soient A un anneau principal et M


un A-module libre de rang n. Si N est un sous-module de M , il existe une base
(e1 , . . . , en ) de M et des scalaires non nuls d1 , . . . , ds , uniques à inversibles près,
vériant d1 | . . . |ds et tels que la famille (d1 e1 , . . . , ds es ) soit une base de N .
Démonstration. On admet qu'un sous-module d'un module libre de rang ni est éga-
lement libre de rang ni : ça n'est pas immédiat, voir page 291 de Objectif agrégation
(Beck, Malick, Peyré).
Soient alors (v1 , . . . , vs ) une base de N et (u1 , . . . , un ) une base de M . On note
U la matrice dans les bases (vi ) et (ui ) de l'injection canonique de N dans M .
D'après le théorème des facteurs invariants, U est équivalente à

U 0 = Diag(d1 , . . . , dr , 0, . . . , 0)

avec d1 | . . . |dr . Par conséquent, il existe une base (e1 , . . . , en ) de M et une base
(f1 , . . . , fs ) de N telles que Id(fi ) = di ei pour tout i 6 r et Id(fi ) = 0 pour tout
i > r. Comme Id(fi ) 6= 0, on a nécessairement r = s.

Corollaire (Théorème de structure). Soient A un anneau principal et M un A-


module de type ni. Alors il existe un unique couple (r, s) d'entiers et d1 | . . . |ds des
éléments de A, uniques à inversibles près, tels que
s
!
M
r
M 'A ⊕ A/(di ) .
i=1

Les di sont appelés facteurs invariants du module M .

19 || Romain Giuge
2.1. Algorithme pour le calcul des facteurs invariants

Démonstration. Comme M est de type ni, on a un morphisme surjectif ϕ : An → M


avec n ∈ N. D'après le corollaire précédent, il existe une base (e1 , . . . , en ) de An et
d1 | . . . |ds des élements de A tels que (d1 e1 , . . . , ds es ) soit une base de Ker(ϕ). Comme
M = Im(ϕ) ' An /Ker(ϕ), on obtient
n
! s
! s
! n
!
M M M M
M' Aei / Adi ei ' Aei /Adi ei ⊕ Aei .
i=1 i=1 i=1 i=s+1
| {z } | {z }
Ls
'( i=1 A/(di ))
'An−s

Enonçons un théorème donnant une méthode de calcul des invariants de simili-


tude d'une matrice :
Théorème. Soient E un K -espace vectoriel de dimension nie n, u ∈ L(E), B une
base de E et U la matrice de u dans la base B. Les invariants de similitude de u
sont les facteurs invariants non inversibles de la matrice U − XIn ∈ Mn (K[X]).
Application. Calculer les invariants de similitude de la matrice
 
3 2 −2
V = −1 0 1  ∈ M3 (Q).
 

1 1 0
Par le théorème précédent, il nous sut de calculer les facteurs invariants de
la matrice U = V − XI3 . Pour cela, d'après ce qui précède, on a deux méthodes :
appliquer l'algorithme ou calculer les PGCD des mineurs de taille 1, 2 et 3 de U .
Appliquer l'algorithme est très long et fastidieux, mais à l'issue, on aura également
les matrices P et Q : par exemple P est le produit des matrices des opérations
élémentaires qu'on aura eectué sur les lignes.
On va se contenter de calculer les PGCD des mineurs. On a directement Λ1 (U ) =
1. Le calcul plutôt simple des 9 mineurs de taille 2 donne Λ2 (U ) = X − 1. Enn, le
calcul du déterminant de U donne Λ3 (U ) = (X − 1)3 . Finalement, on obtient

d1 = Λ1 (U ) = 1



d2 = ΛΛ12 (U
(U )
)
=X −1

d3 = Λ3 (U ) = (X − 1)2 ,


Λ2 (U )

en se rappelant que les di sont donnés à des inversibles près.


Finalement, les invariants de similitude de V sont P1 = X − 1 et P2 = (X − 1)2 .

20 || Romain Giuge
2.1. Algorithme pour le calcul des facteurs invariants

Références :
 Beck, Malick, Peyré - Objectif agrégation - Page 285 (algorithme), page 291
(théorème de la base adaptée), page 278 (théorème de structure), page 301
(théorème pour le calcul des invariants de similitude), page 319 (exercice de
mise en pratique).

21 || Romain Giuge
2.2. Comptage de racines par les formes quadratiques

2.2 Comptage de racines par les formes quadratiques


Soit P ∈ R[X] un polynôme de degré n dont on note α1 , . . . , αn les racines
complexes (comptées avec multiplicité). Pour i ∈ N, on note
n
X
si = αki .
k=1

Les si sont réels : en eet, on peut les calculer avec les formules de Newton qui
donneront une expression en fonction des polynômes symétriques élémentaires, eux-
mêmes fonction des coecients de P .

Théorème. Soit Q la forme quadratique dénie pour x = (x0 , . . . , xn−1 ) ∈ Rn par


X
Q(x) = si+j xi xj .
06i,j6n−1

On note (s, t) la signature de Q. Alors le nombre de racines réelles distinctes de P


vaut s − t et son nombre de racines complexes distinctes s + t (i .e. le rang de Q).
Démonstration. On a :
X n
X X
Q(x) = si+j xi xj = αki+j xi xj .
06i,j6n−1 k=1 06i,j6n−1

Pn−1
En notant lk (x) = αki xi , on obtient :
i=0

n n−1
! n−1 !! n
X X X j X
i
Q(x) = α k xi αk xj = lk (x)2 .
k=1 i=0 j=0 k=1

Quitte à réordonner, on peut supposer que α1 , . . . , αr sont les racines complexes


distinctes de P dont on note m1 , . . . , mr les multiplicités. Ainsi :
r
X
Q= mk lk2 .
k=1

Les formes linéaires lk pour k ∈ [[1, r]] sont linéairement indépendantes sur C. En
eet, on écrit le déterminant de leurs r premières coordonnées dans la base duale
(e∗0 , . . . , e∗n−1 ) de la base canonique de Cn , sachant que lk = n−1
i=0 αk ei :
i ∗
P

 
1 ··· 1
 α1 ··· αr 
 
det 
 .. .
.. 
 . ··· . 
α1r−1 · · · αrr−1

22 || Romain Giuge
2.2. Comptage de racines par les formes quadratiques

On reconnaît le déterminant de Vandermonde associé aux scalaires α1 , . . . , αr , qui


est non nul car les αi sont deux à deux distincts.

On remarque maintenant que si αk n'est pas réel, alors αk fait aussi partie des ra-
cines de P et est diérent de αk . Quitte à réordonner, on suppose que α1 , . . . , αp sont
les racines réelles distinctes de P , et αp+1 , αp+1 , . . . , αp+c , αp+c ses racines complexes
distinctes (on a alors r = p + 2c). Il vient :
r p p+c  
X X X 2
Q= mk lk2 = mk lk2 + mk lk2 + lk .
k=1 k=1 k=p+1

On note vk = lk +lk
2
et wk = lk −lk
2i
de sorte que les coecients de vk et wk soient réels.
On a alors :
2
lk2 + lk
− = vk2 . wk2
2
On en déduit une décomposition de Q sur R en somme de carrés de formes linéaires
réelles :
p p+c
X X
2
2mk vk2 − wk2 .

Q= mk lk +
k=1 k=p+1

Les lk , vi , wj de cette décomposition sont linéairement indépendantes sur R. En eet,


si elles ne l'étaient pas, on aurait

a1 l1 + · · · + ap lp + bp+1 vp+1 + · · · + bp+c vp+c + cp+1 wp+1 + · · · + cp+c wp+c = 0,

et donc
   
bp+1 cp+1 bp+c cp+c
a1 l1 + · · · + ap lp + + lp+1 + · · · + + lp+c
2 2i 2 2i
   
bp+1 cp+1 bp+c cp+c
+ − lp+1 + · · · + − lp+c = 0.
2 2i 2 2i

En se rappelant que lp+i = lp+c+i (si on classe les lk dans le bon ordre), on a donc
obtenu une combinaison linéaire complexe non triviale des lk , 1 6 k 6 r, ce qui est
absurde car elles sont linéairement indépendantes sur C comme démontré ci-dessus.
Cette décomposition indique que la signature de Q est (p + c, c), qui vaut aussi
(s, t). Donc p = s − c = s − t est le nombre de racines réelles distinctes de P . Enn,
r = p + 2c = s − t + 2t = s + t est le nombre de racines complexes distinctes de
P.

Alternative pour montrer que r = s + t juste après avoir montré l'indépendance


des lk , 1 6 k 6 r :

23 || Romain Giuge
2.2. Comptage de racines par les formes quadratiques

On a montré que les (lk )16k6r sont indépendantes sur C, donc le rang de Q sur C
(i .e. en tant que forme quadratique sur C) vaut r : en eet, Q s'écrit comme somme
de carrés de r formes linéaires indépendantes. Si on note B(x, y) = 06i,j6n si+j xi yj
P

la forme polaire associée à Q (en tant que forme quadratique sur C), alors la matrice
de Q est (B(ei , ej ))06i,j6n−1 et est de rang r. Comme le rang d'une matrice ne dépend
pas du corps de base (car il correspond à l'annulation d'un déterminant extrait), le
rang de Q sur R vaut aussi r (en eet, (B(ei , ej ))06i,j6n−1 est également la matrice
de Q en tant que forme quadratique sur R). Enn, le rang de Q valant s + t, on
obtient r = s + t, d'où la deuxième armation du théorème.

Dénition. Soit P ∈ A[X1 , . . . , Xn ]. On dit que P est symétrique si pour toute


permutation σ ∈ Sn , on a :

P (Xσ(1) , . . . , Xσ(n) ) = P (X1 , . . . , Xn ).

Dénition. Les n polynômes


X
Σk = Xi1 . . . Xik
16i1 <···<ik 6n

pour 1 6 k 6 n sont symétriques. On les appelle polynômes symétriques élémen-


taires de A[X1 , . . . , Xn ].

Théorème (Relations coecients-racines). Soit P = an X n + · · · + a0 ∈ K[X] avec


an 6= 0. On suppose P scindé sur K et on note x1 , . . . , xn ses racines. Alors pour
tout k ∈ [[1, n]], on a :
an−k
Σk (x1 , . . . , xn ) = (−1)k .
an
Théorème (Formules de Newton). Pour k ∈ N, on note
n
X
Sk = Xik ∈ A[X1 , . . . , Xn ],
i=1

appelés sommes de Newton. On a les relations suivantes entre les sommes de Newton
et les polynômes symétriques élémentaires :
Sk − Σ1 Sk−1 + · · · + (−1)k−1 Σk−1 S1 + (−1)k |{z}
k Σk = 0
ne pas
oublier

pour tout k ∈ [[1, n − 1]], et


Sk − Σ1 Sk−1 + · · · + (−1)n−1 Σn−1 Sk−n−1 + (−1)n Σn Sk−n = 0

pour tout k > n.

24 || Romain Giuge
2.2. Comptage de racines par les formes quadratiques

Démonstration. Soient x1 , . . . , xn ∈ A. On note σi = Σi (x1 , . . . , xn ). On considère


Qn
le polynôme P = i=1 (X − xi ) ∈ A[X]. Il s'écrit aussi
n
X
n
P =X + (−1)i σi X n−i .
i=1

Pour i ∈ [[1, n]], on a P (xi ) = xni − σ1 xn−1


i + · · · + (−1)n σn = 0. On suppose alors
k > n et on multiplie par xk−n i :

xki − σ1 xk−1
i + · · · + (−1)n σn xk−n
i = 0.

On additionne enn pour 1 6 i 6 n et on obtient l'égalité :

Sk − Σ1 Sk−1 + · · · + (−1)n−1 Σn−1 Sk−n−1 + (−1)n Σn Sk−n = 0.

Soit maintenant k ∈ [[1, n − 1]]. Exprimons :


n
! n !
X X X X
σ1 Sk−1 = xi xk−1
j = xi xk−1
j = Sk + xi xjk−1 .
i=1 j=1 i,j i6=j

Ensuite,
! n
!
X X X X
σ2 Sk−2 = xi xj xk−2
l = xi xjk−1 + xi xj xk−2
l .
i<j l=1 i6=j i<j
l6=i,j

On pose alors pour p ∈ [[0, k − 1]],


X
Ap = xi1 . . . xip xik−p
p+1
.
16i1 <···<ip 6n
ip+1 6=i1 ,...,ip

Pour p ∈ [[1, k − 1]], on a


σp Sk−p = Ap−1 + Ap ,
en ayant remarqué que A0 = Sk et
X
Ak−1 = xi1 . . . xik = kσk
16i1 <···<ik−1 6n
ik 6=i1 ,...,ik−1

car on peut intercaler ik dans les k emplacements entre 1 et i1 , entre i1 et i2 , etc... En


multipliant la première relation par −1, la seconde par (−1)2 ,..., et la (p − 1)-ième
par (−1)p−1 , puis en sommant, on obtient
p−1
X
(−1)k σk Sp−k = −A0 + (−1)p−1 Ap−1 = −Sp + (−1)p−1 pσp .
k=1

On a donc le résultat voulu en faisant tout passer dans le membre de gauche.

25 || Romain Giuge
2.2. Comptage de racines par les formes quadratiques

Remarque. Sur un corps de caractéristique nulle (il faut pouvoir diviser par les
entiers), on peut inverser facilement le système triangulaire donné par les n premières
égalités. On peut ainsi exprimer les sommes de Newton en fonction des polynômes
symétriques élémentaires, et donc aussi en fonction des coecients de P .

Dénition. Soit Q une forme quadratique sur E , de forme polaire B (l'unique


forme bilinéaire symétrique associée). On appelle rang de Q le rang de l'application
linéaire
ϕ : E −→ E ∗
x 7−→ (y 7→ B(x, y)) .
C'est aussi le rang de la matrice de Q par rapport à une base quelconque. En eet,
si B = (e1 , . . . , en ) est une base de E , alors
 
B(e1 , e1 ) . . . B(en , e1 )
 .. .. .. 
MatB (ϕ) =   . . .
 = MatB (Q)

B(e1 , en ) . . . B(en , en )

Dénition. Soit Q une forme quadratique sur un R-espace vectoriel E de dimension


nie. Soit α la plus grande des dimensions des sous-espaces de E sur lesquels Q est
dénie positive. Soit β la plus grande des dimensions des sous-espaces de E sur
lesquels Q est dénie négative. Le couple (α, β) est appelé la signature de Q.

Théorème. Soit Q une forme quadratique sur E de dimension nie. Il existe des
formes linéaires l1 , . . . , lk sur E , linéairement indépendantes, telles que :
Q = l12 + · · · + lm
2 2
− lm+1 − · · · − lk2 .

Démonstration. La forme quadratique Q est un polynôme homogène de degré 2


en les xi (coordonnées d'un point x ∈ E ). On raisonne alors par récurrence sur
le nombre de variables xi apparaissant dans Q. S'il n'y en a qu'une, par exemple
Q(x) = ax21 , c'est bon. S'il y en a au moins deux, il faut distinguer deux sous-cas :
Q contient un terme carré, disons ax21 , et on pourra y incorporer les termes de la
forme bx1 xi . Donc on pourra écrire Q = a(x1 + A)2 + Q2 avec Q2 homogène du
second degré en x2 , . . . , xn et A polynôme homogone de degré 1 en x2 , . . . , xn . La
forme linéaire x1 + A sera linéairement indépendante de celles de la décomposition
de Q2 (décomposition par l'hypothèse de récurrence) car la variable x1 n'apparaît
pas dans Q2 .
Le deuxième sous-cas est celui où Q ne contient que des termes rectangles de la
forme axi xj . On peut supposer qu'on a
n
X n
X
Q = ax1 x2 + b1,j x1 xj + b2,j x2 xj + Q2
j=3 j=3

26 || Romain Giuge
2.2. Comptage de racines par les formes quadratiques

Pn b1,j
où Q2 est homogène de degré 2 en x3 , . . . , xn . On pose alors r1 = x1 + j=3 a
xj
b
et r2 = x2 + nj=3 2,j xj . On obtient
P
a

Q = ar1 r2 + Q3

avec Q3 homogène de degré 2 en x3 , . . . , xn et (r1 , r2 , x3 , . . . , xn ) est libre. On pose


ensuite u1 = r1 +r
2
2
et u2 = r1 −r 2
2
et on note que u21 − u22 = r1 r2 . On obtient alors un
polynôme en u1 , u2 , x3 , . . . , xn homogène de degré 2 contenant un terme carré au21 .
On peut alors appliquer le cas précédent.

Conséquence : si Q = l12 + · · · + lm2 − lm+1


2
− · · · − lk2 , alors sa forme polaire est
B(x, y) = l1 (x)l1 (y) + · · · + lm (x)lm (y) − lm+1 (x)lm+1 (y) − · · · − lk (x)lk (y). Comme
les formes linéaires li sont indépendantes, on peut les compléter en une base de E ∗
puis dénir sa base anté-duale (f1 , . . . , fn ) dans E . Alors B(fi , fj ) = 0 si i 6= j , 1 si
i = j 6 m, −1 si m + 1 6 i = j 6 k , et 0 si i = j > k + 1. La matrice de Q dans la
base (f1 , . . . , fn ) est donc diagonale et on obtient que le rang de Q vaut k .

Corollaire. Il existe une base de E dans laquelle la matrice de Q est diagonale avec
des 1, −1 et 0 sur la diagonale. On dit que la matrice de Q dans cette base est
diagonale normalisée.
Théorème. Soit Q une forme quadratique sur E de dimension nie. Soit B une base
dans laquelle la matrice A de Q soit diagonale normalisée. Soient a le nombre de
coecients +1 dans A et b le nombre de coecients −1. Alors (a, b) est la signature
de Q. En particulier, a et b ne dépendent pas de la base choisie.
Démonstration. Soit (α, β) la signature de Q. On sait que Q est dénie positive sur
le sous-espace de E engendré par les vecteurs e de la base pour lesquels Q(e) = +1.
Ce sous-espace est de dimension a. On a donc α > a. D'autre part, Q est négative
sur le sous-espace F engendré par les autres vecteurs de la base (les vecteurs e pour
lesquels Q(e) = −1 ou 0). Soit G un sous-espace de E de dimension α sur lequel Q
est dénie positive. Si α > a, alors dim(G) + dim(F ) > dim(E). Par la formule de
Grassmann, cela implique que dim(G ∩ F ) > 0. Il existe donc x ∈ F ∩ G, x 6= 0.
Mais comme x ∈ F , Q(x) 6 0, et comme x ∈ G et x 6= 0, Q(x) > 0, ce qui est
impossible. On a donc α = a. En appliquant ce résultat à la forme quadratique −Q,
on obtient aussi β = b.

Références :
 Gantmacher - Théorie des matrices, tome 2 - Page 199.

27 || Romain Giuge
2.3. Décomposition de Dunford

2.3 Décomposition de Dunford


Proposition. Soient f ∈ L(E) et P ∈ K[X] un polynôme annulateur de f . Soit
P = βM1α1 . . . Mrαr la décomposition de P en facteurs irréductibles de K[X]. On
note Fi = Ker(Miαi (f )). Alors E = F1 ⊕ · · · ⊕ Fr et pour tout i, la projection sur Fi
parallèlement à j6=i Fj est un polynôme en f .
L

Démonstration. Le fait que E = F1 ⊕ · · · ⊕ Fr résulte directement du lemme des


noyaux.
α
Pour tout i, on note Qi = j6=i Mj j . Aucun facteur n'est commun à tous les
Q

Qi , ils sont donc premiers entre eux dans leur ensemble. Par l'identité de Bézout, il
existe U1 , . . . , Ur ∈ K[X] tels que U1 Q1 + · · · + Ur Qr = 1, ce qui implique

U1 (f )Q1 (f ) + · · · + Ur (f )Qr (f ) = Id.

Pour tout i, on note Pi = Ui Qi et pi = Pi (f ). On a donc

p1 + · · · + pr = Id. (∗)

D'autre part, si j 6= i, alors P divise Qi Qj , donc pi ◦ pj = (Ui Uj )(f ) ◦ (Qi Qj )(f ) = 0


(puisque P (f ) = 0, (Qi Qj )(f ) = 0). En composant (∗) par pi , on obtient alors
pi = ri=1 pi ◦ pj = p2i . Les pi sont donc des projecteurs.
P

Montrons que pour tout i, Im(pi ) = Fi . Soit y = pi (x) ∈ Im(pi ). Alors

Miαi (f )(y) = (Miαi Ui Qi )(f )(x) = Ui (f ) ◦ P (f )(x) = 0.

Donc Im(pi ) ⊂ Fi . Réciproquement, soit x ∈ Fi . D'après (∗), x = p1 (x) + · · · + pr (x).


Or pour tout j 6= i, pj (x) = Uj (f ) ◦ Qj (f )(x) = 0 car Miαi divise Qj . Donc x =
pi (x) ∈ Im(pi ), et nalement, Im(pi ) = Fi .
Il ne reste plus qu'à montrer que pour tout i, Ker(pi ) = Fj . Pour tout
L
αj L j6=i
j 6= i, on a Fj ⊂ Ker(pi ) car Mj divise Pi = Ui Qi . Donc j6=i Fj ⊂ Ker(pi ).
Réciproquement, soit x ∈ Ker(pi ). D'après (∗), x = j6=i pj (x), donc x ∈ j6=i Fj .
P L

Finalement, Ker(pi ) = j6=i Fj .


L

Théorème (Décomposition de Dunford). Soit f ∈ L(E) tel que son polynôme ca-
ractéristique Pf soit scindé sur K . Alors il existe un unique couple (d, n) ∈ K[f ]2
avec d diagonalisable et n nilpotent tels que f = d + n et d ◦ n = n ◦ d.
Démonstration. On écrit Pf = (X − λ1 )m1 . . . (X − λr )mr et on note Fi = Ker((f −
λi Id)mi ). Alors d'après la proposition précédente, E = F1 ⊕ · · · ⊕ Fr . On dénit d
et n sur les Fi en posant d|Fi = λi IdFi et n|Fi = f − λi IdFi . Alors n|Fi est nilpotent

28 || Romain Giuge
2.3. Décomposition de Dunford

d'indice mi et n est nilpotent d'indice m = maxi (mi ). Sur chaque Fi , di est une
homothétie donc d ◦ n = n ◦ d. Si on note pi le projecteur sur Fi parallèlement à
F1 ⊕ · · · ⊕ Fi−1 ⊕ Fi+1 ⊕ · · · ⊕ Fr , alors d = λ1 p1 + · · · + λr pr et d est un polynôme
en f car les pi le sont. Enn, n = f − d est aussi un polynôme en f . On a prouvé
l'existence du couple (d, n) demandé.

Soit (d0 , n0 ) un autre couple vériant les conditions. Comme f = d0 + n0 et d0


commute avec n0 , on a f ◦ d0 = (d0 + n0 ) ◦ d0 = d0 ◦ (d0 + n0 ) = d0 ◦ f . Donc Fi est
stable par d0 pour tout i. Comme d est une homothétie sur Fi , on en déduit que
d ◦ d0 = d0 ◦ d sur Fi pour tout i, donc sur E . De plus, d et d0 sont diagonalisables,
on peut donc les diagonaliser dans une même base, ce qui prouve que d0 − d est
diagonalisable.
Comme n = f − d, n0 = f − d0 et d ◦ d0 = d0 ◦ d, alors n et n0 commutent. Si p et
q sont tels que np = n0q = 0, alors
p+q  
0 p+q
X p+q
(n − n ) = nk (−1)p+q−k n0p+q−k = 0.
k=0
k

Donc n − n0 = d0 − d est nilpotent. Or d0 − d est diagonalisable, donc d0 − d = 0,


ce qui prouve que d0 = d et n0 = n. On a donc unicité du couple (d, n) vériant les
hypothèses du théorème.

Calcul pratique de la décomposition de Dunford :


Il s'agit de calculer les projecteurs pi car alors, d = ri=1 λi pi et n = f − d.
P

On remarque qu'on aurait pu remplacer Pf par n'importe quel polynôme P


annulant f dans la démonstration de la décomposition de Dunford. Soit P =
Qr
i=1 (X − λi ) un polynôme annulateur de f . On décompose P en éléments simples
ri 1

dans K(X) :
r X ri
1 X xi,j
= .
P i=1 j=1
(X − λi )j

Pour tout i, on pose ensuite Ui = rj=1 xi,j (X − λi )ri −j . Alors


Pi

r
1 X Ui
= .
P i=1
(X − λi )ri

En multipliant par P , on obtient ri=1 Ui Qi = 1 avec Qi = j6=i (X − λi )ri . Donc


P Q

d'après la démonstration faite, en notant Pi = Ui Qi , les projecteurs pi sont donnés


par pi = Pi (f ).

29 || Romain Giuge
2.3. Décomposition de Dunford

Application au calcul d'exponentielle :


Si on connaît une base de diagonalisation de d, on a directement ed . Comme n
np
est nilpotente d'indice q , en = q−1 p=0 p! . Enn e = e e car d et n commutent.
f d n
P

Sinon on utilise les projecteurs pi . On a d = i=1 λi pi et n = ri=1 (f − λi Id)pi .


Pr P

Les relations sur les pi (i.e. p2i = pi et pi ◦ pj = 0) entraînent dp = ri=1 λpi pi . Donc
P

∞ ∞
r
! r
p p
X d X X λ i
X
ed = = pi = eλi pi .
p=0
p! i=1 p=0
p! i=1

D'autre part,
∞ i −1
r m
!
X np X X (f − λi Id)p
en = = pi .
p=0
p! i=1 p=0
p!
On en déduit, toujours grâce aux relations sur les pi ,
i −1
r m
!
X X (f − λi Id)p
ef = ed en = e λi pi .
i=1 p=0
p!

Application. Calculer l'exponentielle de la matrice


 
1 4 −2
M =  0 6 −3 .
 

−1 4 0

Démonstration. Le polynôme caractéristique est PM = (X − 2)2 (X − 3). On note


λ1 = 2, λ2 = 3, et Q1 = (X −3), Q2 = (X −2)2 . On décompose en éléments simples :
1 1 X −1
= − .
PM X − 3 (X − 2)2
Donc (X − 2)2 − (X − 1)(X − 3) = Q2 − (X − 1)Q1 = 1. On pose U1 = −(X − 1)
et U2 = 1. Alors
 
−2 −4 6
p1 = (U1 Q1 )(M ) = −(M − I3 )(M − 3I3 ) = −3 −3 6 ,
 

−3 −4 7
et  
3 4 −6
p2 = (M − 2I3 )2 = 3 4 −6 .
 

3 4 −6
Ainsi
 
M λ1 1
e =e I3 + (M − λ1 I3 ) p1 + eλ2 p2 = e2 (M − I3 )p1 + e3 p2 .
1!

30 || Romain Giuge
2.3. Décomposition de Dunford

Théorème (Lemme des noyaux). Soient f ∈ L(E) et P = P1 . . . Pr ∈ K[X] avec


les Pi polynômes premiers entre eux deux à deux. Alors
Ker(P (f )) = Ker(P1 (f )) ⊕ · · · ⊕ Ker(Pr (f )).

Démonstration. La preuve se fait bien par récurrence sur k > 2.

Question : Peut-on calculer d et n de la décomposition de Dunford de f sans


connaître les valeurs propres de f ?
Réponse : Oui, grâce à une démonstration eective (i.e. transformable en un al-
gorithme) de la décomposition de Dunford.

Théorème. Soient K un corps parfait et f un endomorphisme d'un K -espace vec-


toriel E de dimension nie. Alors il existe d, n ∈ K[f ] tels que f = d + n avec d
semi-simple et n nilpotent. De plus, cette décomposition est eective lorsque K est
de caractéristique 0.
Démonstration. Nous donnons seulement les idées de la preuve. Soit P un polynôme
annulateur de f , P = P1α1 . . . Prαr . On note Q = P1 . . . Pr . Si K est de caractéristique
0, on peut calculer Q de manière eective grâce à l'égalité P = PGCD(P, P 0 )Q (on
a l'algorithme d'Euclide pour calculer un PGCD).
Soient A = K[X]/(P ) et x = X . Comme P (f ) = 0, on a un morphisme ϕ : A →
K[f ], x 7→ f . Il s'agit donc de trouver une décomposition x = u + v avec Q(u) = 0
et v nilpotent dans A. Alors d = ϕ(u) et n = ϕ(v) conviendront : d est semi-simple
car annulé par Q qui est sans facteur carré.
Nous obtenons u grâce à la méthode de Newton : x0 = x et xn+1 = xn − QQ(x n)
0 (x ) .
n

On montre par récurrence que Q0 (xn ) est inversible dans A (la suite est alors bien
dénie) et Q(xn ) ∈ (Q(xn )2 ). Comme P divise QPPCM(αi ) , Q(x) est nilpotent dans
n

A et la suite stationne rapidement. Soient u sa limite, et v = x − u. Alors Q(u) =


P∞
0 et v = n=0 (xn+1 − xn ) (la somme est nie) est nilpotent comme somme de
nilpotents.

Références :
 Gourdon - Algèbre - Page 192.

31 || Romain Giuge
2.4. Décomposition polaire dans GLn (C)

2.4 Décomposition polaire dans GLn(C)


Théorème. Soit A ∈ GLn (C). Il existe un unique couple de matrices (U, H) ∈
Mn (C)2 , avec U unitaire et H hermitienne dénie positive, tel que A = U H . De
plus, l'application
Φ : Un × Hn++ −→ GLn (C)
(U, H) 7−→ U H
est un homéomorphisme.
Démonstration. Si A = U H , alors t A = t H t U = HU −1 . Donc t AA = H 2 . Nous
allons par conséquent commencer par chercher une matrice hermitienne H vériant
t
AA = H 2 .
On remarque que la matrice t AA est hermitienne :
t t t t 
= tA = t AA.

AA A

De plus, t AA est positive : en eet, pour tout vecteur colonne X , on a :

t t
AA X = t AXAX = kAXk2 > 0,

X

où k · k désigne la norme hermitienne standard sur Cn .


Or lorsqu'une matrice M est hermitienne positive, il existe une unique matrice
R hermitienne positive telle que M = R2 (ce qu'on démontre après). Donc il existe
une unique matrice hermitienne H positive telle que t AA = H 2 .
Si on suppose A inversible, alors H est inversible, donc H est dénie positive (elle
ne peut pas avoir de valeur propre nulle). On pose alors U = AH −1 et on vérie que
U est unitaire :
−1
t
U U = t H −1 t AAH −1 = t
H H 2 H −1 = H −1 H 2 H −1 = In .

On vient donc de prouver l'existence et l'unicité du couple (U, H) lorsque A est


inversible (l'unicité de U découle de celle de H ).

Proposition. Soit M ∈ Mn (C) une matrice hermitienne positive. Alors il existe


une unique matrice R hermitienne positive telle que M = R2 .
Démonstration. La matrice M étant hermitienne, il existe une matrice unitaire C
telle que
t
CM C = D
avec D = Diag(λ1 , . . . , λn ) matrice diagonale réelle. Comme M est positive, tous
√ √ 
les λi sont positifs. On pose D0 = Diag λ1 , . . . , λn . Alors R = CD0 t C est
hermitienne positive et vérie R2 = M .

32 || Romain Giuge
2.4. Décomposition polaire dans GLn (C)

Pour l'unicité, on considère le polynôme d'interpolation de Lagrange ϕ déni par



ϕ(λi ) = λi pour tout i 6 n. Alors ϕ(M ) = Cϕ(D)t C = CD0 t C = R. Donc R
est polynomiale en M . Par conséquent, si S est matrice hermitienne positive telle
que S 2 = M , alors S commute avec M (car SM = S 3 = M S ), et puisque R est
polynomiale en M , S commute avec R. Les matrices R et S commutent et sont
diagonalisables (car hermitiennes), elles sont donc simultanément diagonalisables :
R = QD1 Q−1 et S = QD2 Q−1 avec D1 et D2 diagonales à coecients diagonaux
positifs. Sachant que M = R2 = S 2 , on obtient D12 = D22 , et donc D1 = D2 .
Finalement R = S et l'unicité est prouvée.

Il nous reste maintenant à démontrer que Φ est un homéomorphisme. La conti-


nuité de Φ est évidente et on vient de montrer que Φ est bijective. Il reste donc
à montrer que Φ−1 est continue, i .e. que si (Mp ) est une suite de GLn (C), avec
Mp = Up Hp , qui converge vers M = U H , alors (Up ) converge vers U et (Hp ) converge
vers H .
Montrons que le groupe des matrices unitaires est compact. En eet, c'est un
fermé borné de Mn (C) et Mn (C) est de dimension nie. Il est fermé car c'est l'image
réciproque de {In } par l'application continue U 7→ t U U . Si P = (pij ) est unitaire,
alors !
Xn
t
PP = pki pkj = In .
k=1

En particulier, les coecients diagonaux de t P P sont égaux à 1, i .e. pour tout k ,


n
X
|pki |2 = 1.
k=1

Donc pour tout i, j , |pij | 6 1, et donc Un est borné par 1 au sens de la norme dénie
par kP k = sup |pij | (toutes les normes sont équivalentes sur Mn (C) de dimension
nie).
Par compacité de Un , il existe une sous-suite (Uϕ(p) ) de (Up ) qui converge vers
U ∈ Un . Par conséquent :
0

Hϕ(p) = t Uϕ(p) Mϕ(p) −→ H 0 = t U 0 M.

L'expression de H 0 montre que H 0 est inversible, et de plus, H 0 est hermitienne


positive (limite des matrices hermitiennes positives Hϕ(p) ), donc H 0 ∈ Hn++ . Par
unicité de la décomposition polaire, on a donc U 0 = U et H 0 = H . Cela prouve que
la suite (Up ) du compact Un n'a qu'une seule valeur d'adhérence, donc qu'elle est
convergente et Uk → U . Il vient ensuite Hk = t Uk Mk → t U M = H .

33 || Romain Giuge
2.4. Décomposition polaire dans GLn (C)

Enoncé du théorème adapté pour la leçon Exemples d'actions de groupes sur les
espaces de matrices :
Théorème. On considère l'action de groupe suivante sur Mn (C) :
ϕ : Un × Mn (C) −→ Mn (C)
(U, M ) 7−→ U M.

Alors l'orbite de toute matrice M contient une matrice hermitienne positive. De


plus, si M est inversible, l'orbite de M ∈ GLn (C) contient une unique matrice
hermitienne positive, qui est par conséquent dénie positive.
Rappelons que l'orbite d'un élément x ∈ E sous l'action du groupe G est

Ox = {g.x, g ∈ G}.

Donc ici, pour M ∈ Mn (C), on a OM = {U M, U ∈ Un }. On vérie donc bien que si


H ∈ Hn ∩ OM , alors M = t U H est le produit d'une matrice unitaire par une matrice
hermitienne positive.

Si on a du temps, on peut présenter une application facile de la décomposition


polaire :

Proposition. Le groupe Un est un sous-groupe compact maximal de GLn (C).


Démonstration. On a déjà montré que Un est compact. Soit G un sous-groupe com-
pact de GLn (C) avec Un ⊂ G. On va montrer que nécessairement G = Un (on ne
peut pas avoir G = GLn (C) qui n'est pas compact).
Soit M ∈ G. On écrit la décomposition polaire de M : M = U H . Or U ∈
Un ⊂ G, donc H = U −1 M ∈ G. Le sous-groupe G étant compact, la suite (H k )k∈N
admet une valeur d'adhérence dans G. Mais H ∈ Hn++ est diagonalisable en une
matrice diagonale dont les éléments diagonaux sont des réels strictement positifs.
La convergence d'une sous-suite de (H k ) implique que les valeurs propres de H sont
6 1. Mais s'il existe une valeur propre de H strictement plus petite que 1, alors la
limite de la sous-suite est non inversible, donc n'est pas dans G. Finalement, toutes
les valeurs propres de H valent 1, donc H = In . Ainsi M = U ∈ Un , ce qui montre
que G ⊂ Un .

34 || Romain Giuge
2.4. Décomposition polaire dans GLn (C)

Remarque. L'existence de la décomposition polaire est encore vraie pour M ∈


Mn (C) (avec bien sûr H positive et non dénie positive). Par contre on perd l'uni-
cité. Pour montrer l'existence, on se sert de la densité de GLn (C) dans Mn (C) et
de la compacité de Un .
On a aussi une décomposition polaire sur Mn (R) en tout point similaire à celle
sur Mn (C), en remplaçant Un par On (R) (les matrices orthogonales) et Hn par
Sn (R) (la matrices symétriques). La démonstration est en tout point identique (tout
se transpose à l'identique : On (R) est aussi compact, etc...).
Remarque. On peut exprimer facilement l'inverse de Φ grâce à la construction donnée
dans la démonstration. On note :

ϕ : Hn++ −→ Hn++
√ .
H 7−→ H

Alors si M ∈ GLn (C), on avait M = U H avec H = ϕ t M M . D'où :




 −1 
Φ−1 (M ) = M ϕ t M M , ϕ tM M .

Dénition. On appelle matrice unitaire toute matrice U ∈ Mn (C) vériant t U U =


In .

Dénition. On appelle matrice hermitienne toute matrice H ∈ Mn (C) vériant


t
H = H.

Proposition. Si A est symétrique réelle, toutes ses valeurs propres sont réelles.
Démonstration. Soit λ ∈ C une racine complexe du polynôme caractéristique de A.
Il existe un vecteur colonne X 6= 0 tel que AX = λX . On a d'une part :
t
XAX = t XAX = t XλX = λ t XX,

car A est réelle, donc A = A. D'autre part :


t
XAX = t X t AX = t (AX)X = λt XX,

car A est symétrique. Mais si on écrit t X = (z1 , . . . , zn ), alors t XX = ni=1 |zi |2 > 0
P

car X 6= 0. Donc λ = λ, i .e. toutes les valeurs propres de A sont réelles.

C'est pareil pour les matrices hermitiennes :

Proposition. Si A ∈ Mn (C) est hermitienne, toutes ses valeurs propres sont


réelles.
Démonstration. On fait pareil mais cette fois en calculant de deux façons diérentes
t
XA X .

35 || Romain Giuge
2.4. Décomposition polaire dans GLn (C)

Théorème. Tout endormorphisme symétrique d'un espace euclidien est diagonali-


sable dans une base orthonormée, en une matrice diagonale réelle.
Démonstration. On raisonne par récurrence sur la dimension n de l'espace. D'après
la proposition précédente, il existe une valeur propre réelle λ, dont on note e1 le
vecteur propre associé. On prend F = (Re1 )⊥ et on montre que F est stable par
l'endomorphisme u : si x ∈ F ,

(u(x)|e1 ) = (x|u(e1 )) = (x|λe1 ) = λ(x|e1 ) = 0,

car u est symétrique pour la première égalité. Donc u(x) ∈ F . On applique ensuite
l'hypothèse de récurrence à u|F qui est toujours symétrique.

C'est pareil pour les endomorphismes hermitiens :


Théorème. Tout endormorphisme hermitien d'un espace hermitien est diagonali-
sable dans une base orthonormée, en une matrice diagonale réelle.
Démonstration. Pareil que le cas des endomorphismes symétriques.
En termes de matrices, cela se traduit par :
Théorème. Toute matrice hermitienne est diagonalisable en une matrice diagonale
réelle au moyen d'une matrice unitaire.
Démonstration. Soit H une matrice hermitienne. D'après le théorème d'avant, il
existe une base orthonormée telle que l'endomorphisme associé à H soit diagona-
lisable. On note P la matrice de passage de la base canonique (e1 , . . . , en ) à cette
base orthonormée (ε1 , . . . , εn ). Alors :

H = P DP −1

avec D diagonale réelle. On note P = (pij ), i .e. εi = nk=1 pki ek pour tout i. Alors
P

la famille (ε1 , . . . , εn ) est orthonormée équivaut à


n n
! n
X X X
(εi |εj ) = pki ek pkj ek = pki pkj = δij ,
k=1 k=1 k=1

qui équivaut à P P = In , i .e. P est unitaire.


t

Références :
 Gourdon - Algèbre - Page 249.
 Mneimné et Testard - Introduction à la théorie des groupes de Lie classiques -
Page 19 (pour l'homéomorphisme).
 Serre - Les matrices (pour l'homéomorphisme et l'application).

36 || Romain Giuge
2.5. Décomposition QR

2.5 Décomposition QR
On note Tn++ le groupe des matrices triangulaires supérieures de Mn (C) dont
tous les coecients diagonaux sont strictement positifs. On note aussi Un le groupe
des matrices de Mn (C) unitaires, i .e. les M telles que t M M = In .

Théorème. Pour tout A ∈ GLn (C), il existe un unique couple (Q, R) ∈ Un × Tn++
tel que A = QR. De plus, cette factorisation permet de résoudre le système Ax = b.
Démonstration. Nous ne montrerons que l'existence. Voir les suppléments plus bas
pour l'unicité.
Soit A ∈ GLn (C) dont on note a1 , . . . , an ses vecteurs colonnes qui forment une
base de Cn . Appliquons le procédé d'orthonormalisation de Gram-Schmidt. On pose
q1 = kaa11 k . On construit les vecteurs qj pour j > 2 par la formule de récurrence de
Gram-Schmidt :
j−1
wj X
qj = avec wj = aj − (qk , aj )qk ,
kwj k k=1

où (·, ·) désigne le produit scalaire hermitien canonique de Cn . La base (q1 , . . . , qn )


ainsi construite est orthonormée et donc si on note Q = (q1 , . . . , qn ) la matrice formée
par les qi , alors Q ∈ Un .
Par ailleurs, pour tout j , aj = kwj kqj + j−1 k=1 (qk , aj )qk . En notant rj,j = kwj k
P

pour tout j , et rk,j = (qk , aj ) pour tout 1 6 k 6 j − 1, on obtient aj = jk=1 rk,j qk .


P

On note (qi,j )16i6n les composantes du vecteur qj et (ai,j )16i6n celles du vecteur aj .
Alors
  
q1,1 . . . q1,n r1,1 . . . r1,n j
!
 . ..   .. . .
  ..  X
 .
 . .  . . . = qi,k rk,j = (aij )i,j = A,
k=1 i,j
qn,1 . . . qn,n 0 . . . rn,n
| {z }| {z }
=Q =R

et on a bien R ∈ Tn++ .

On souhaite maintenant résoudre le système Ax = b. On décompose A en A =


QR. Le système devient alors QRx = b, et en multipliant à gauche par t Q, le système
se transforme en Rx = t Qb. Ce système se résout facilement par un algorithme de
remontée puisque R est triangulaire supérieure.

37 || Romain Giuge
2.5. Décomposition QR

Algorithme 1: Procédé d'orthonormalisation de Gram-Schmidt


Données : A = (a1 , . . . , an )
Résultat : Q = (q1 , . . . , qn ) et R = (rij )
pour j = 1 à n faire
w j = aj
pour k = 1 à j − 1 faire
rkj = (qk , aj )
wj = wj − rkj qk
n
rjj = kwj k
qj = wj /rjj
n
Comptons le nombre d'opérations que cet algorithme nécessite. Pour un produit
scalaire, on doit eectuer n − 1 additions et n multiplications. Pour ajouter deux
vecteurs, on doit eectuer n additions. Pour calculer une norme, on doit eectuer
un produit scalaire et une extraction de racine carrée. Nous avons donc le nombre
suivant d'additions dans l'algorithme :
j−1
n
! n
X X X  n(n − 1)(2n + 1)
(n − 1 + n) + (n − 1) = (2n−1)(j−1)+(n−1) = .
j=1 i=1 j=1
2

De la même façon, on trouve n3 multiplications, n2 divisions et n extractions de


racines carrées. Au nal, on doit eectuer de l'ordre de 2n3 opérations.

Cependant, sur ordinateur, la propagation d'erreurs d'arrondis fait que les vec-
teurs qi calculés ne sont pas forcément linéairement indépendants, donc en particulier
pas orthogonaux. Cela empêche donc la matrice Q d'être exactement orthogonale.
Ces instabilités numériques sont dues au fait que la procédure d'orthonormalisation
produit des valeurs très petites, ce qui pose problème en arithmétique à virgule ot-
tante (i .e. l'arithmétique des nombres réels sur ordinateur où tout réel est représenté
par un nombre ni de bits). Il convient alors de recourir à une version plus stable
de l'algorithme, appelée procédé de Gram-Schmidt modié.
La modication consiste tout simplement en un réordonnancement des calculs
de façon à ce que dès qu'un vecteur de la base orthonormée est obtenu, tous les
vecteurs restants à orthonormaliser lui soient rendus orthogonaux. Les deux versions
de Gram-Schmidt sont mathématiquement équivalentes, mais la version modiée est
préférable à la première lorsque les calculs sont eectués sur ordinateur.

38 || Romain Giuge
2.5. Décomposition QR

Algorithme 2: Procédé d'orthonormalisation de Gram-Schmidt modié


Données : A = (a1 , . . . , an )
Résultat : Q = (q1 , . . . , qn ) et R = (rij )
pour i = 1 à n faire wi = ai
pour k = 1 à n faire
rkk = kwk k
qk = wk /rkk
pour j = k + 1 à n faire
rkj = (qk , wj )
wj = wj − rkj qk
n
n
Après calculs, on trouve que les nombres d'additions, de multiplications, de di-
visions et d'extractions de racines carrées sont les mêmes que pour l'algorithme non
modié. On a donc encore de l'ordre de 2n3 opérations au total.

Enn, pour résoudre un système Ax = b où A est inversible et triangulaire


inférieure, on utilise naturellement une méthode dite de descente :

x 1 = b 1
a11  
xi = 1 bi − Pi−1 aij xj , i = 2, . . . , n.
aii j=1

Cet algorithme eectue n(n−1)


2
additions, n(n−1)
2
multiplications et n divisions,
soit un nombre d'opérations global de l'ordre de n2 .

Comparaison avec d'autres méthodes :



Méthodes + ∗ / ·
Résolution par la règle de Cramer (n + 1)!(n + 2)! n 0
n3 n3 n2
Décomposition LU 3 3 2
0
Décomposition QR n 3
n 3 2
n n

On a indiqué les ordres de grandeurs, en ne comptant que les opérations de la


décomposition (pas la résolution nale du système avec l'algorithme de remontée
par exemple, sauf pour la règle de Cramer).

Sur la décomposition QR par la méthode de Householder :

39 || Romain Giuge
2.5. Décomposition QR

En pratique, on préfère calculer la factorisation QR d'une matrice par la méthode


de Householder dont le principe est de multiplier A par une suite de matrices de
transformations très simples dites de Householder pour l'amener progressivement
sous forme triangulaire supérieure.

Dénition. Soit v un vecteur non nul de Rn . On appelle matrice de Householder


associée au vecteur de Householder v la matrice dénie par :

vtv
H(v) = In − 2 t .
vv
On pose de plus H(0) = In , ce qui permet de considérer la matrice identité comme
une matrice de Householder.

Les matrices de Householder possèdent des propriétés intéressantes :

Propriété. Soit v un vecteur non nul de Rn et H(v) la matrice de Householder qui


lui est associée. Alors H(v) est symétrique et orthogonale. De plus, si x ∈ Rn et e
est un vecteur unitaire tel que x 6= ±kxk2 e, on a

H(x ± kxk2 e)x = ∓kxk2 e.

La matrice de Householder H(v) est la matrice de la symétrie orthogonale par


rapport à l'hyperplan orthogonal à v . Les matrices de Householder peuvent par
conséquent être utilisées pour annuler certaines composantes d'un vecteur x de Rn
donné.

La méthode de Householder est sensiblement plus coûteuse que la méthode de


Gram-Schmidt, mais son succès est sa grande stabilité numérique : elle ne modie pas
le conditionnement du problème (la norme k · k2 est invariante par transformation
unitaire, et le conditionnement est calculé par cond(A) = kAkkA−1 k). De plus,
les colonnes de Q sont numériquement orthonormale, cela ne dépend pas du degré
d'indépendance des colonnes de la matrice A comme cela était le cas pour le procédé
de Gram-Schmidt.
Cependant, si la connaissance de Q n'est pas requise et qu'on souhaite juste la
solution de Ax = b, un raccourci existe : la structure des matrices de Householder
fait qu'il n'est pas nécessaire d'assembler la matrice de Householder pour en eectuer
le produit avec une autre matrice. Cela réduit le nombre d'opérations à un ordre de
grandeur de 34 n3 , plus avantageux que Gram-Schmidt, mais encore le double de LU
(par l'élimination de Gauss).

Méthode de Cholesky pour les matrices symétriques dénies positives :


n3
Elle nécessite un nombre d'opérations total de l'ordre de 3
.

40 || Romain Giuge
2.5. Décomposition QR

Montrons l'unicité de la décomposition A = QR annoncée dans le théorème.

Démonstration. Commençons par montrer que Tn++ ∩Un = {In }. Il est clair que In ∈
Tn++ ∩ Un . Réciproquement, soit M ∈ Tn++ ∩ Un . Alors M = (mij ) est triangulaire
supérieure (i .e. mij = 0 si i > j ) avec mii > 0 et M t M = In . On a donc :
 
Xn
M tM =  mik mjk  = In .
k=max(i,j)
i,j

En prenant j = n, on trouve nk=n mik mnk = min mnn = 0 pour tout i < n, ce qui
P

implique min = 0 pour tout i < n. En prenant ensuite j = n − 1, on trouve


n
X
mik mn−1,k = mi,n−1 mn−1,n−1 + mi,n mn−1,n = mi,n−1 mn−1,n−1 = 0
|{z} | {z } | {z }
k=n−1 =0 =0 >0

pour tout i < n − 1, ce qui implique mi,n−1 = 0 pour tout i < n − 1. On recommence
jusqu'à j = 1 et on obtient nalement que tous les coecients non diagonaux sont
nuls. Comme les coecients diagonaux sont des réels > 0 tels que |mii |2 = 1, on en
déduit M = In .
Soient maintenant (Q1 , R1 ) et (Q2 , R2 ) ∈ Un × Tn++ tels que A = Q1 R1 = Q2 R2 .
Alors Q−1
2 Q1 = R2 R1 . Or Q2 Q1 ∈ Un et R2 R1 est triangulaire supérieure avec
−1 −1 −1

ses coecients diagonaux strictements positifs. Donc

Q−1
2 Q1 ∈ Un ∩ Tn
++
et R2 R1−1 ∈ Un ∩ Tn++ .

Comme Un ∩ Tn++ = {In }, il vient Q2 = Q1 et R2 = R1 .

Références :
 Filbet - Analyse numérique, algorithme et étude mathématique - Exercice 1.5
page 49, solution page 55.
 Legendre - Méthodes numériques, Introduction à l'analyse numérique et au cal-
cul scientique - Cours PDF daté de 2009/2010 (pour Gram-Schmidt modié,
les algorithmes et les complexités).
 Ciarlet - Introduction à l'analyse numérique matricielle et à l'optimisation -
Les nombres d'opérations y sont aussi.

41 || Romain Giuge
2.6. Dénombrement des polynômes irréductibles sur un corps ni

2.6 Dénombrement des polynômes irréductibles sur


un corps ni
Soient p un nombre premier, r ∈ N∗ et q = pr . On s'intéresse à l'ensemble
Iq (n) des polynômes irréductibles unitaires de degré n sur Fq dont on va calculer le
cardinal, qu'on note Nq (n).

Proposition. Pour n > 1, on a


n
Y Y
Xq − X = P
d|n P ∈Iq (d)

et
1 X n d
Nq (n) = µ q ,
n d
d|n

µ désignant la fonction de Möbius.

Démonstration. Soient d un diviseur de n et P ∈ Iq (d). On veut montrer que P


n
divise X q − X . Soit alors α une racine de P dans un corps de rupture de P sur
Fq . Ainsi Fq (α) est un corps de rupture de P et [Fq (α) : Fq ] = deg(P ) = d car
P est irréductible, c'est donc le polynôme minimal de α sur Fq . Par conséquent,
Fq (α) ∼
d d
= Fqd . Or tout élément de Fqd est racine du polynôme X q − X , donc αq = α.
Comme d divise n, il existe un entier k tel que n = kd, et alors :
 q d qd
qn qd
α = α ... = α.

fois
| {z }
k

n
Ainsi α est racine de X q − X et P divise ce polynôme car ses racines sont simples
(c'est un polynôme irréductible sur un corps ni, et tout corps ni est parfait, donc
P est séparable).
Si on prend un autre polynôme Q ∈ Iq (d0 ) avec d0 un diviseur de n, alors Q divise
n
aussi X q − X , et les deux polynômes P et Q étant irréductibles, leur produit P Q
n
divise X q − X .
Finalement :  
n
Y Y
P  divise X q − X .


d|n P ∈Iq (d)
n
Réciproquement, soit P ∈ Fq [X] un facteur irréductible de X q − X de degré
n
d > 1. Soit α ∈ Fqn une racine de P (X q − X est scindé sur Fqn , donc P aussi).
Alors
[Fqn : Fq (α)][Fq (α) : Fq ] = n.

42 || Romain Giuge
2.6. Dénombrement des polynômes irréductibles sur un corps ni

Or [Fq (α) : Fq ] = deg(P ) = d car P est irréductible sur Fq , c'est donc le polynôme
minimal de α sur Fq . Ceci prouve que d divise n.
n
On vient donc de montrer que tout facteur irréductible de X q − X est un
polynôme de Iq (d) avec d un diviseur de n. Il existe donc des polynômes deux à
deux distincts Qi dans Iq (di ) avec di un diviseur de n et des entiers αi > 1 tels que
n
Y
Xq − X = Qαi i .
i

n
Montrons maintenant que X q − X est sans facteur carré dans Fq [X]. Supposons
n
par l'absurde que ce polynôme admet un facteur carré : on écrit X q − X = Q2 P
n
avec P, Q ∈ Fq [X]. En dérivant, on obtient q n X q −1 − 1 = 2QQ0 P + Q2 P 0 . Comme
q n = 0 dans Fq , on en déduit que Q divise le polynôme constant −1. Donc Q est
constant, ce qui est absurde. Ceci montre que pour tout i, αi = 1, et enn :
!  
n
Y Y Y
Xq − X = Qi divise  P.
i d|n P ∈Iq (d)

On a donc montré que


n
Y Y
Xq − X = P.
d|n P ∈Iq (d)

Pour calculer Nq (n), on passe au degré dans cette dernière égalité polynomiale :
X
qn = dNq (d).
d|n

On introduit alors les fonctions arithmétiques f et g dénies par f (n) = nNq (n) et
g(n) = q n pour n ∈ N∗ . La formule précédente s'écrit :
X
g(n) = f (d) = f ∗ 1l(n).
d|n

La formule d'inversion de Möbius nous donne alors :

f = g ∗ µ,

soit encore
1 X n d
Nq (n) = µ q .
n d
d|n

43 || Romain Giuge
2.6. Dénombrement des polynômes irréductibles sur un corps ni

Remarque. Si on pose rn = n
q d , alors :
P 
d|n µ d
d6=n

bX
2c
n

q b 2 c+1 − q
n
d
|rn | 6 q = .
d=1
q−1

On en déduit :
q n + rn qn qn
Nq (n) = ∼ = .
n n→∞ n logq (q n )
On peut faire l'analogie avec le nombre π(n) de nombres premiers inférieurs à n :
n
π(n) ∼ .
n→∞ ln(n)
Remarque. On obtient une autre démonstration de l'existence d'un corps à pn élé-
ments avec n ∈ N∗ : avec r = 1, le dénombrement des polynômes irréductibles sur
Fq pour q = pr = p montre que

nNp (n) = pn + rn > pn − |rn |.

avec rn déni comme dans la remarque précédente (la fonction µ peut être négative).
Or |rn | < pn , donc Np (n) 6= 0. Il existe donc P irréductible de degré n dans Fp [X].
Alors K = Fp [X]/(P ) est un corps (car P est irréductible), de cardinal pn car K est
un Fp -espace vectoriel de dimension n.
Remarque. Le corps Fp est un sous-corps de Fq (c'est son sous-corps premier, i .e.
plus petit sous-corps inclu dans Fq ). En eet, la caractéristique d'un corps ni est
nécessairement un nombre premier (plus petit entier n tel que n1 = 0), donc en
notant ϕ : Z → Fq , n 7→ n1, alors Ker(ϕ) = pZ, si bien que Z/pZ = Fp ∼ = Im(ϕ) ⊂
Fq , d'où Fp ⊂ Fq . Ensuite Fp est un corps premier : si k est un sous-corps de Fp , en
particulier k est un sous-groupe additif de Fp , donc le cardinal de k divise celui de
Fp (théorème de Lagrange), qui vaut p, donc k = {0} ou Fp . Comme 1 ∈ K , on a
donc k = Fp .
Si P est un polynôme de Fp [X] irréductible dans Fq [X], il est irréductible dans
Fp [X]. En eet, si P = QR avec Q, R ∈ Fp [X], alors P, Q, R ∈ Fq [X], et donc Q ou
R est de degré 0.

Dénition (Fonction de Möbius). On note µ la fonction de Möbius dénie par

µ : N∗ −→ 
{−1, 0, 1}

1 si n = 1,



n 7−→ 0 si n a un facteur carré,

(−1)r sinon, où r est le nombre de facteurs premiers de n.

44 || Romain Giuge
2.6. Dénombrement des polynômes irréductibles sur un corps ni

Proposition (Formule d'inversion de Möbius). Soient f, g : N → C telles que pour


tout n > 1, X
g(n) = f (d).
d|n

Alors pour tout n > 1, X n


f (n) = µ g(d).
d
d|n

Démonstration. Si f et g sont multiplicatives, alors f ∗ g aussi. Donc µ ∗ 1l est


multiplicative et pour la connaître, il sut de calculer µ ∗ 1l(pα ) :

µ ∗ 1l(pα ) = µ(1) + µ(p) + µ(p2 ) + · · · + µ(pα ) = 1 − 1 = 0.


| {z } | {z }
=0 =0

Donc immédiatement, on obtient µ ∗ 1l = δ , d'où le résultat.

Références :
 Francinou et Gianella - Exercices de mathématiques pour l'agrégation, Algèbre
1 - Page 189.

45 || Romain Giuge
2.7. Dénombrement des solutions d'une équation diophantienne

2.7 Dénombrement des solutions d'une équation dio-


phantienne
Proposition. Soient α1 , . . . , αr∈ N∗ des entiers naturels non nuls premiers entre
eux dans leur ensemble. Pour n ∈ N, on considère l'équation diophantienne (En ) :
α1 n1 + · · · + αr nr = n d'inconnues n1 , . . . , nr ∈ N.
Alors l'équation (En ) admet un nombre ni de solutions sn que l'on peut calculer
de manière explicite. De plus
1 nr−1
sn ∼ .
n→∞ α1 . . . αr (r − 1)!

Démonstration. Soit F (X) =


Qr
i=1 1−X αi . Dans C[[X]], on a
1


r
! r ∞
!
Y X Y X
F (X) = X nαi = X n 1l{n∈αi N}
i=1 n=0 i=1 n=0

!
X X
= X n1 1l{n1 ∈α1 N} . . . X nr 1l{nr ∈αr N}
n=0 n1 +···+nr =n

!
X X
= X n1 α1 . . . X nr αr
n=0 n1 α1 +···+nr αr =n

! ∞
X X X
n
= 1 X = sn X n .
n=0 n1 α1 +···+nr αr =n n=0

On note Un le groupe des racines n-ième de l'unité dans C. On décompose F en


éléments simples dans C(X) :
X  aω,1 aω,mω

F (X) = + ··· + ,
Sr ω−X (ω − X)mω
ω∈ i=1 U αi

où mω est la multiplicité du pôle ω de F (attention, mω n'est pas nécessairement


égal à 1 car ω peut être racine de 1 − X αi et de 1 − X αj pour i 6= j ).
Ensuite, on a
 (k−1) ∞  n !(k−1)
1 1 1 1 X 1 X
k
= =
(ω − X) (k − 1)! ω−X (k − 1)! n=0
ω ω

1 X 1
= n(n − 1) . . . (n − (k − 2)) n+1 X n−(k−1)
(k − 1)! n=k−1 ω

1 X 1
= (m + k − 1) . . . (m + 1) m+k X m .
(k − 1)! m=0 ω

46 || Romain Giuge
2.7. Dénombrement des solutions d'une équation diophantienne

En reportant dans l'expression de F (X) et en identiant les coecients, on en


déduit une expression de sn qui est donc calculable explicitement.

Comme F (X) = ri=1 1−X 1


αi , 1 est un pôle de F d'ordre r . Soit ω un pôle de
Q

F . Puisque chaque polynôme 1 − X αi est à racines simples, mω 6 r. Si mω =


r, alors ω est racine de tous les 1 − X αi . Comme les αi sont premiers entre eux
dans leur ensemble, d'après l'identité de Bézout, il existe u1 , . . . , ur ∈ Z tels que
u1 α1 +· · ·+ur αr = 1. Ainsi, comme ω αi = 1 pour tout i, on a ω = ω u1 α1 +···+ur αr = 1.
Finalement, pour tout ω 6= 1 pôle de F , on a mω < r.
Le terme général de la série (ω−X) 1
k vaut, d'après le calcul ci-dessus,

1 1
(n + 1) . . . (n + k − 1) n+k = O nk−1

(k − 1)! ω
car |ω| = 1. Donc pour tout k < r, c'est un O (nr−2 ), soit encore un o (nr−1 ). On
en déduit que dans l'expression de sn , les contributions des (ω−X)
1
k sont négligeables

devant celle de (1−X)


1
r quand n → ∞. Ainsi,

nr−1
sn ∼ a1,r .
n→∞ (r − 1)!
Il ne reste plus qu'à calculer a1,r . On a
r r
Y 1−X Y 1
(1 − X)r F (X) = αi
= αi −1
.
i=1
1 − X i=1
1 + X + · · · + X

Comme a1,r = [(1 − z)r F (z)](1), on obtient a1,r = 1


α1 ...αr
, d'où le résultat.

Application. Le nombre de solutions (x, y, z) ∈ N3 de l'équation x + 2y + 3z = n


est
(n + 1)(n + 5) 17 (−1)n 2
 
2kπ
sn = + + + cos .
12 72 8 9 3

Théorème (Décomposition en éléments simples). Soit Q P


∈ K(X). On écrit la dé-
composition de Q en produit de polynômes unitaires irréductibles : Q = λQα1 1 . . . Qαr r .
Alors on peut écrire
P A1,1 A1,α Ak,1 Ak,α
=R+ + · · · + α11 + · · · + + · · · + αkk
Q Q1 Q1 Qk Qk
où R et les Ai,j sont des polynômes de K[X] tels que deg(Ai,j ) < deg(Qi ) pour tout
i, j .

47 || Romain Giuge
2.7. Dénombrement des solutions d'une équation diophantienne

Démonstration. Les polynômes Ti = λQα1 1 . . . Q


d
i . . . Qr sont premiers entre eux
αi αr

dans leur ensemble, donc d'après l'identité de Bézout, on a

S1 T1 + · · · + Sr Tr = 1.

On en déduit l'écriture, en notant Bi = P Si :

P P S1 T1 + · · · + P Sr Tr B1 Br
= = α1 + · · · + αr .
Q Q Q1 Qr

A présent, on eectue la division euclidienne de B1 par Q1 : B1 = B1,α1 Q1 + A1,α1


avec deg(A1,α1 ) < deg(Q1 ). On obtient alors

B1 B1,α1 A1,α1
α1 = α1 −1 + .
Q1 Q1 Qα1 1

On eectue une nouvelle division euclidienne sur B1,α1 , par Q1 , et en recommençant


un nombre susant de fois, on trouve

B1 A1,1 A1,α
α1 = B1,1 + + · · · + α11 ,
Q1 Q1 Q1

d'où la décomposition en éléments simples de P


Q
.

Références :
 Chambert-Loir - Analyse 1.
 Francinou, Gianella, Nicolas - Oraux X-ENS, Analyse 2 - Page 197.
 Gourdon - Analyse.

48 || Romain Giuge
2.8. Ellipse de Steiner et application

2.8 Ellipse de Steiner et application


Soit ABC un triangle du plan ane euclidien P , qu'on suppose non applati
et non équilatéral. On prend pour origine le point O centre de gravité du triangle
ABC et on rapporte le plan à un repère orthonormé direct (O, → −
u ,→

v ). On note
respectivement a, b, c les axes de A, B, C et I, J, K les points d'axes respectives
1, j, j 2 .

Lemme. Il existe α, β ∈ C∗ tels que l'application f : P → P associée à la transfor-


mation ϕ : z 7→ αz + βz envoie respectivement les points I, J, K sur A, B, C .
Démonstration. On cherche α, β tels que α + β = a, αj + βj 2 = b et αj 2 + βj = c. Il
s'agit d'un système de 3 équations à 2 inconnues, et pour avoir une solution, il est
nécessaire que ces équations soient liées. On vérie :
 
1 1 a
det  j j 2 b  = (a + b + c)(j 2 − j) = 0
 

j2 j c
car O étant!le centre de gravité de ABC , on a a + b + c = 0. D'autre part, comme
1 1
det 6= 0, ce système est de rang 2. Il existe donc un unique couple (α, β) ∈
j j2
C2 vériant les 3 équations. Si α = 0, alors le triangle ABC est l'image du triangle
IJK par la similitude indirecte z 7→ βz qui conserve les rapports de distances, il est
donc équilatéral comme IJK , ce qui est exclu. Donc α 6= 0, et de même β 6= 0.

Proposition. Les axes des foyers de l'ellipse de Steiner du triangle ABC sont les
deux racines carrées du nombre complexe αβ .
Démonstration. Soit C le cercle de Steiner du triangle équilatéral IJK . Comme f

→ −→
est une transformation ane bijective (car par exemple ϕ envoie la base (IJ, IK)
−→ −→
sur la base (AB, AC)), elle envoie C sur une conique C 0 = f (C) de même nature,
i .e. une ellipse. Comme les barycentres sont conservés par les applications anes,
les milieux des côtés du triangle IJK sont envoyés sur les milieux des côtés du
triangle ABC . En admettant que C 0 est tangente à chacun des côtés de ABC en
leurs milieux (voir plus bas la démonstration de l'existence de l'ellipse de Steiner),
par unicité de l'ellipse de Steiner, C 0 est l'ellipse de Steiner du triangle ABC .

Comme C est le cercle inscrit au triangle équilatéral IJK , c'est le cercle de centre
O et de rayon 12 (il passe par le milieu de JK qui est en z = − 12 ). Donc M ∈ C si
et seulement s'il existe t tel que l'axe de M dans (O, → −u ,→

v ) soit z = 21 eit . Donc
M 0 = f (M ) ∈ C 0 si et seulement s'il existe t tel que l'axe de M 0 dans (O, → −u ,→

v)
soit z = ϕ(z) = 2 (αe + βe ).
0 1 it −it

49 || Romain Giuge
2.8. Ellipse de Steiner et application

On note α = |α|eiϕ , β = |β|eiψ , → −


u1 le vecteur d'axe ei 2 et → −
ϕ+ψ
v1 le vecteur
ϕ+ψ
d'axe iei 2 (on a fait tourner le repère d'un angle 2 ). Alors M 0 ∈ C 0 si et
ϕ+ψ

seulement s'il existe t tel que l'axe de M 0 dans (O, →



u1 , →
− ϕ+ψ
v1 ) soit z10 = z 0 e−i 2 . On
a alors
1 ϕ+ψ 1 ϕ+ψ
z10 = (αeit + βe−it )e−i 2 = (|α|ei(ϕ+t) + |β|ei(ψ−t) )e−i 2
2 2
1 ϕ−ψ ϕ−ψ
= (|α|ei 2 +it + |β|e−i 2 −it ).
2
On en déduit une représentation paramétrique de C 0 dans le repère (O, →

u1 , →

v1 ) :

x0 = 1 (|α| + |β|) cos ϕ−ψ + t
1 2 2
y 0 = 1 (|α| − |β|) sin ϕ−ψ + t .
1 2 2

Une équation de C 0 dans ce repère est donc


x02
1 y102
 2 +  2 = 1.
|α|+|β| |α|−|β|
2 2

Les foyers F et F 0 de C 0 appartiennent au grand axe qui est dirigé par → −


u1 et O

− →

est leur centre. Dans (O, u , v ), un argument de F est donc 2 et un argument
ϕ+ψ

de F 0 est ϕ+ψ
2
+ π . Ensuite on note c = OF . Si N désigne un point de C sur la
médiatrice de [F F 0 ] (i .e. N est un sommet de l'ellipse sur son petit axe), alors on
a ON = |α|−|β|
2
, OF = c et N F = |α|+|β| 2
(le demi-grand axe, car par la dénition
|α|+|β|
bifocale, N F + N F 0 = 2 2 et comme N est sur la médiatrice, N F = N F 0 ). Par
le théorème de Pythagore, on a donc
 2  2
2 |α| + |β| |α| − |β|
c = − = |αβ|.
2 2

Donc les axes de F et F 0 dans (O, → −


u ,→− ϕ+ψ
v ) sont ± |αβ|ei 2 , i .e. les deux racines
p

carrées de αβ .

Application. Si Q = (X − a)(X − b)(X − c), alors les racines de Q0 sont les axes
des foyers de l'ellipse de Steiner du triangle ABC .
Démonstration. On a
Q = X 3 − (a + b + c)X 2 + (ab + bc + ca)X − abc.

On rappelle que a + b + c = 0 puisque O est le centre de gravité du triangle ABC .


On calcule ensuite, en se rappelant que α et β sont tels que α + β = a, αj + βj 2 = b
et αj 2 + βj = c :

ab + bc + ca = (α + β)(αj + βj 2 ) + (αj + βj 2 )(αj 2 + βj) + (αj 2 + βj)(α + β)

50 || Romain Giuge
2.8. Ellipse de Steiner et application

= (1 + j + j 2 )α2 + (1 + j + j 2 )β 2 + 3αβ(j + j 2 )
= −3αβ,

car 1 + j + j 2 = 0. Donc

Q = X 3 − 3αβX − abc.

On obtient ainsi que Q0 = 3X 2 − 3αβ . Les racines de Q0 sont donc les racines de
X 2 − αβ , i.e. les deux racines carrées de αβ , qui sont les axes des foyers de l'ellipse
de Steiner de ABC d'après la proposition précédente.

Théorème. L'image d'une conique par une application ane bijective est une co-
nique de même nature.
Démonstration. Soit f une application ane bijective associée à une application
linéaire bijective ϕ. Soit (O, →

u ,→

v ) un repère. Alors les coordonnées du point M dans
(O, u , v ) sont les mêmes que les coordonnées de f (M ) dans (f (O), ϕ(→

− →
− −u ), ϕ(→

v ))
(qui est bien un repère puisque ϕ est bijective et donc conserve les bases). En eet,
par bijectivité de ϕ, on a l'équivalence
−−→ −−→ −−−−−−−→
OM = x→ −u + y→ −
v ⇐⇒ ϕ OM = f (O)f (M ) = xϕ(→ −u ) + yϕ(→

v ),
−−→ −−−−−−−→
où l'on a utilisé que ϕ M N = f (M )f (N ).
Ainsi, si C est une conique d'équation (E) dans (O, →−
u ,→−v ), alors son image
C = f (C) est dénie par la même équation dans (f (O), ϕ( u ), ϕ(→
0 →
− −
v )). Donc C 0 est
une conique de même nature que C .

Théorème. Pour tout triangle du plan, il existe une unique ellipse tangente à cha-
cun des côtés en leur milieu, appelée ellipse de Steiner.
Démonstration. Nous ne montrerons que l'existence, l'unicité est plus délicate.
Soit ABC un triangle non applati du plan ane. On note A0 , B 0 , C 0 les milieux
respectifs des segments [BC], [AC], [AB].
Comme les points A, B, C ne sont pas alignés, ils dénissent un repère du plan
ane. Si le triangle ABC est équilatéral, l'existence d'une ellipse répondant au
problème est évidente : il s'agit du cercle inscrit au triangle. L'idée est donc de se
ramener à un triangle équilatéral.
Soit A0 B0 C0 un triangle équilatéral. Il existe une unique bijection ane telle que

g(A0 ) = A, g(B0 ) = B et g(C0 ) = C.

51 || Romain Giuge
2.8. Ellipse de Steiner et application

−−−→ −→ −−−→ −→
En eet, g est dénie par g(A0 ) = A, → −g (A0 B0 ) = AB et →−g (A0 C0 ) = AC , et on
note que → −
g est uniquement déterminée par l'envoi d'une base sur une base. Ainsi
par g , le triangle équilatéral A0 B0 C0 est envoyé sur le triangle ABC .
Comme les barycentres sont conservés par les applications anes, les milieux des
côtés du triangle A0 B0 C0 sont envoyés sur les milieux des côtés du triangle ABC .
De plus, l'image d'une conique par une application ane bijective reste une
conique de même nature. Donc g envoie le cercle inscrit C de A0 B0 C0 sur une ellipse
E.
Enn, une application ane est diérentiable, de diérentielle sa partie linéaire.
En eet, si M et N sont deux points, on a
−−→ −−→  −−→ 
g(M ) = g(N ) + →−g (N M ) = g(N ) + Dg(N ).N M + o kN M k ,

et donc Dg(N ) = → −
g . Par conséquent, si →

u est un vecteur directeur de la tangente

− →

en un point M de C , alors g ( u ) dirige la tangente à l'ellipse E au point g(M ).
Ainsi, comme la droite (A0 B0 ) est tangente à C en C00 le milieu de [A0 B0 ], on
−−−→ −−−−−−−→ −→
obtient que → −
g (A0 B0 ) = g(A0 )g(B0 ) = AB dirige la tangente à E en g(C00 ) = C 0 .
Donc la droite (AB) est tangente à E en C 0 . Le raisonnement est le même pour
les autres tangences. L'ellipse E est donc tangente au triangle ABC aux points
A0 , B 0 , C 0 .

Proposition. On se place dans un repère R. Alors l'ellipse d'équation


2
x2
+ yb2 = 1
a2
avec a > b est exactement l'ensemble des points M = (x, y) vériant M F + M F 0 =

2a où F = (c, 0) et F 0 = (−c, 0) avec c = a2 − b2 . Les points F et F 0 sont appelés
les foyers de l'ellipse.
Démonstration.

M F + M F 0 = 2a ⇐⇒ (M F + M F 0 )2 = 4a2
⇐⇒ (x − c)2 + y 2 + (x + c)2 + y 2 + 2M F.M F 0 = 4a2
⇐⇒ 2x2 + 2y 2 + 2c2 + 2M F.M F 0 = 4a2
⇐⇒ M F.M F 0 = 2a2 − c2 − x2 − y 2
=⇒ (M F.M F 0 )2 = (a2 + b2 − x2 − y 2 )2
⇐⇒ (x2 − 2cx + c2 + y 2 )(x2 + 2cx + c2 + y 2 )
= (a2 + b2 − x2 − y 2 )2
⇐⇒ (x2 + y 2 + c2 )2 − 4c2 x2 = (a2 + b2 − x2 − y 2 )2
⇐⇒ (x2 + y 2 + c2 )2 − (a2 + b2 − x2 − y 2 )2 = 4c2 x2
⇐⇒ (a2 + b2 + c2 )(2x2 + 2y 2 + c2 − a2 − b2 ) = 4c2 x2
⇐⇒ 2a2 .2(x2 + y 2 − b2 ) = 4c2 x2

52 || Romain Giuge
2.8. Ellipse de Steiner et application

⇐⇒ a2 x2 + a2 y 2 − a2 b2 = c2 x2
⇐⇒ (a2 − c2 )x2 + a2 y 2 = a2 b2
⇐⇒ b2 x2 + a2 y 2 = a2 b2
x2 y 2
⇐⇒ 2 + 2 = 1.
a b
Il reste à prouver que l'implication au milieu est en fait une équivalence. A la n,
on obtient que nécessairement, x2 6 a2 et y 2 6 b2 , donc a2 + b2 − x2 − y 2 > 0 et on
a bien l'équivalence.

Références :
 Deuxième composition du CAPES externe de 1990.

53 || Romain Giuge
2.9. Irréductibilité des polynômes cyclotomiques sur Q

2.9 Irréductibilité des polynômes cyclotomiques sur


Q
Théorème. Le polynôme cyclotomique Φn est irréductible sur Q.
Démonstration. Soit K un corps de décomposition de Φn sur Q. On note ω une
racine primitive n-ième de 1, et on xe un nombre premier p ne divisant pas n.
On remarque que ω p est une autre racine primitive de 1. En eet, les racines
2ikπ
primitives de 1 sont les ω m avec m et n premiers entre eux : si ω = e n , alors
(k, n) = 1 (k et n sont premiers entre eux car ω est une racine primitive de 1), et
donc (kp, n) = 1 comme p ne divise pas n.

Soit P ∈ Q[X] le polynôme minimal de ω sur Q et Q ∈ Q[X] celui de ω p . Nous


allons montrer que P ∈ Z[X] et P = Φn .
Comme Z[X] est factoriel, on peut écrire Φn = R1α1 . . . Rrαr avec les Ri ∈ Z[X]
irréductibles. Puisque Φn est unitaire, quitte à multiplier les Ri par −1, on peut
les supposer unitaires. Enn, ω est racine de Φn , donc de l'un des Ri . Or Ri est
unitaire et irréductible sur Z, donc sur Q (un polynôme primitif de Z[X] de degré
> 1 non irréductible sur Q ne peut pas être irréductible sur Z, voir les irréductibles
d'un anneau de polynômes), et donc Ri est le polynôme minimal de ω sur Q, i .e.
P = Ri ∈ Z[X]. De même, Q ∈ Z[X].
On note au passage que P et Q divisent Φn dans Z[X].

Montrons maintenant que P = Q. On suppose P 6= Q. Comme P et Q sont


irréductibles et distincts, leur produit P Q divise Φn dans Q[X]. D'autre part, ω p est
racine de Q, donc ω est racine de Q(X p ), et donc P divise Q(X p ) dans Q[X] (car
P est le polynôme minimal de ω sur Q) : il existe R ∈ Q[X] tel que

Q(X p ) = P (X)R(X).

En écrivant R = ab R2 avec R2 ∈ Z[X] primitif, a, b ∈ Z, a et b premiers entre eux,


et en prenant les contenus, on obtient :

c(bQ(X p )) = b c(Q(X p )) = c(aP R2 ) = a c(P )c(R2 ).

Or P et Q(X p ) sont unitaires, leurs contenus valent donc 1. D'où b = ±a (le contenu
est déni modulo Z∗ ), et donc R ∈ Z[X].
On projette l'égalité Q(X p ) = P (X)R(X) dans Fp . On écrit Q = ar X r + · · · + a0
avec ai ∈ Z. Alors comme ai = ai p pour tout i, on a :

Q(X p ) = ar X pr + · · · + a0

54 || Romain Giuge
2.9. Irréductibilité des polynômes cyclotomiques sur Q

= ar p X pr + · · · + a0 p
= (ar X r + · · · + a0 )p
= Q(X)p .
p
Soit S un facteur irréductible de P sur Fp . Puisque Q = P R, on obtient S divise
Q. Comme P Q divise Φn sur Q (on est toujours sous l'hypothèse P 6= Q faite plus
haut), il divise Φn sur Z (grâce aux contenus, de la même façon que P divise Q(X p )
2
sur Z), alors P Q divise Φn sur Fp , et donc S divise Φn sur Fp . On en déduit que
Φn a une racine double (dans un corps de rupture de S sur Fp ). Mais Φn n'a pas
de racine double : en eet, sinon, comme Φn divise X n − 1, ce polynôme aurait une
racine double. Ce n'est pas le cas puisque sa dérivée vaut nX n−1 ayant 0 pour seule
racine (car p et n sont premiers entre eux), et 0 n'est pas racine de X n − 1.
On a donc une absurdité qui nous permet de conclure que P = Q.

Soit ω 0 une racine primitive n-ième de 1. Alors il existe m premier avec n tel que
ω 0 = ω m . On écrit m = pα1 1 . . . pαr r avec pi ne divisant pas n. Par une récurrence sur
le nombre de facteurs premiers de m, on montre que ω 0 et ω ont même polynôme
minimal sur Q. En eet, ω et ω p1 ont même polynôme minimal d'après ce qui précède,
2
puis ω p1 et (ω p1 )p1 = ω p1 ont même polynôme minimal, etc... Donc P (ω 0 ) = 0 pour
toute racine primitive n-ième de 1, et par conséquent,

Φn divise P sur Q.

Comme on avait déjà P divise Φn et que les polynômes P et Φn sont unitaires, on


en déduit Φn = P et Φn est irréductible sur Q.

Remarque. Comme Φn est irréductible sur Q, que Φn ∈ Z[X] et que son contenu
vaut 1 (car il est unitaire), on en déduit que Φn est irréductible sur Z.

Dénition (Polynôme cyclotomique d'ordre n). Pour n ∈ N∗ , on dénit Φn le


n-ième polynôme cyclotomique sur C par
Y
Φn = (X − ω),
ω∈Un∗
n 2ikπ o
où Un = e n , k ∈ Z et Un∗ est l'ensemble des racines primitives n-ième de l'unité.

Proposition. On a : Y
Xn − 1 = Φd .
d|n

55 || Romain Giuge
2.9. Irréductibilité des polynômes cyclotomiques sur Q

Démonstration. Soit ω = e n . Soient k ∈ [[0, n − 1]] et d l'ordre de ωk dans Un . On


2iπ

a donc que d divise n. D'autre part, (ω k )d = 1, donc ω k ∈ Ud , et étant d'ordre d, on


a même ω k ∈ Ud∗ . Ainsi (X − ω k ) divise Φd , donc divise d|n Φd .
Q

Les ω k pour k ∈ [[0, n − 1]] étant deux à deux distincts, on en déduit que :
n−1
Y Y
n
X −1= (X − ω k ) divise Φd .
k=0 d|n

Or  
Y X X
deg  Φd  = deg(Φd ) = ϕ(d) = n = deg(X n − 1).
d|n d|n d|n

Les deux polynômes X n − 1 et d|n Φd sont unitaires et de même degré, avec le


Q

premier qui divise le deuxième, ils sont donc égaux.

Proposition. Pour tout n ∈ N∗ , Φn ∈ Z[X].


Démonstration. On le montre par récurrence :
Pour n = 1, Φ1 = X − 1 ∈ Z[X].
On suppose maintenant que pour tout k 6 n − 1, Φk ∈ Z[X]. Alors le polynôme
P = d|n Φd ∈ Z[X] et on a X n − 1 = P Φn d'après la proposition précédente.
Q
d6=n
Comme P est unitaire, son coecient dominant est inversible dans Z et on peut
eectuer la division euclidienne de X n − 1 par P dans Z[X] : il existe Q, R ∈ Z[X]
tels que
Xn − 1 = P Q + R
avec deg(R) < deg(P ). Comme on a d'autre part X n −1 = P Φn dans C[X] (a priori,
on a seulement Φn ∈ C[X]), en faisant la diérence, il vient P (Φn − Q) = R. Or
deg(R) < deg(P ), donc nécessairement Φn = Q ∈ Z[X].

Dénition (Contenu d'un polynôme). Soit A un anneau. Pour P ∈ A[X], P =


an X + · · · + a0 6= 0, on dénit le contenu de P , noté c(P ), par :
n

c(P ) = PGCD(a0 , . . . , an ).

Le contenu est bien sûr déni modulo A∗ .

Proposition (Lemme de Gauss). Soit A un anneau factoriel. Pour P, Q ∈ A[X]


non nuls, on a :
c(P Q) = c(P )c(Q) mod A∗ .

Démonstration. On suppose d'abord P et Q primitifs, i.e. c(P ) = c(Q) = 1. Si


c(P Q) 6= 1, comme A est factoriel, il existe p ∈ A irréductible qui divise c(P Q).

56 || Romain Giuge
2.9. Irréductibilité des polynômes cyclotomiques sur Q

On écrit P = an X n + · · · + a0 et Q = bm X m + · · · + b0 . Comme c(P ) = 1, p ne


divise pas tous les ai . Soit i0 le plus petit i tel que p ne divise pas ai . De même, soit
j0 le plus petit j tel que p ne divise pas bj . On a P Q = cn+m X n+m + · · · + c0 . En
particulier,
X X
ci0 +j0 = ai b j = ai 0 b j 0 + ai b j .
i+j=i0 +j0 i+j=i0 +j0
i<i0 ou j<j0

Alors p divise ci0 +j0 (il divise tous les ck ) et p divise ai bj . Donc p divise
P
i+j=i0 +j0
i<i0 ou j<j0
ai0 bj0 , ce qui est absurde, car p étant irréductible, cela implique qu'il divise ai0 ou
bj0 . Finalement
c(P Q) = 1.

Remarque : Dans le cas A = Z, on peut réduire modulo p : P Q = 0 dans Fp [X].


Et comme Fp [X] est intègre, cela implique P = 0 ou Q = 0, ce qui est absurde
puisque c(P ) = c(Q) = 1.

On suppose maintenant P et Q quelconques, et on note a = c(P ), b = c(Q).


Alors P2 = a1 P et Q2 = 1b Q sont primitifs, donc c(P2 Q2 ) = 1 d'après le cas précédent.
Par conséquent, P Q = abP2 Q2 et le PGCD des coecient de P Q vaut clairement
ab = c(P )c(Q).

Proposition (Irréductibles d'un anneau de polynômes). Soit A un anneau et K


son corps des fractions. Les polynômes irréductibles dans A[X] sont :
(i) Les constantes p ∈ A irréductibles dans A.
(ii) Les polynômes P de degré > 1 primitifs et irréductibles dans K[X].
Démonstration. On vérie que ces éléments sont bien irréductibles dans A[X] :
(i ) Si p ∈ A et si p = P (X)Q(X), alors deg(P ) = deg(Q) = 0, donc P, Q ∈ A. En
supposant p irréductible, on a donc P ∈ A∗ ou Q ∈ A∗ , donc P ∈ A[X]∗ ou
Q ∈ A[X]∗ , i .e. p est irréductible dans A[X].
(ii ) Soit P de degré > 1 primitif et irréductible dans K[X]. Si P = QR avec
Q, R ∈ A[X], alors comme Q et R sont aussi dans K[X], on a Q ou R dans
K[X]∗ . Supposons par exemple que Q ∈ K[X]∗ . Alors deg(Q) = 0 avec Q 6= 0,
donc Q = a ∈ A. On en déduit que P = aR, donc a divise c(P ), et comme
c(P ) = 1, a ∈ A∗ et P est irréductible dans A[X].
Montrons maintenant que ces éléments sont les seuls irréductibles dans A[X].
Soit P ∈ A[X] irréductible dans A[X].
(i ) Si deg(P ) = 0, P = p ∈ A est irréductible dans A[X], donc clairement dans
A.

57 || Romain Giuge
2.9. Irréductibilité des polynômes cyclotomiques sur Q

(ii ) Si deg(P ) > 0, on a nécessairement c(P ) = 1 (on rappelle que le contenu est
déni modulo A∗ ). En eet, on aurait sinon P = c(P )Q avec c(P ) 6∈ A∗ et
Q ∈ A[X]. Comme P est irréductible et que c(P ) 6∈ A[X]∗ (car A[X]∗ = A∗ ),
on a Q ∈ A[X]∗ . Donc Q ∈ A∗ et alors deg(P ) = 0.
Il reste à montrer que P est irréductible dans K[X]. On écrit P = QR avec
Q, R ∈ K[X]. On peut écrire Q = ab Q2 et R = dc R2 avec Q2 , R2 ∈ A[X]
primitifs et a, b, c, d ∈ A. On a alors

bdP = acQ2 R2 .

En prenant les contenus, on obtient c(bdP ) = bd = c(acQ2 R2 ) = ac (toujours


modulo A∗ ). On a donc P = λQ2 R2 avec λ ∈ A∗ . Comme P est irréductible
dans A[X], on a Q2 ou R2 dans A[X]∗ = A∗ , donc de degré 0. Par exemple
Q = ab Q2 est de degré 0, donc Q ∈ K ∗ = K[X]∗ , i .e. P est irréductible dans
K[X].

Proposition (Division euclidienne). Soit A un anneau et P ∈ A[X], P 6= 0 de


coecient dominant inversible. Soit F ∈ A[X]. Alors il existe Q, R ∈ A[X] tels que
F = PQ + R

et deg(R) < deg(P ) ou R = 0.


Démonstration. On peut le faire par récurrence. Sinon, comme le coecient domi-
nant de P est inversible, on peut le supposer unitaire : P = X n +an−1 X n−1 +· · ·+a0 .
Soient l'anneau quotient B = A[X]/(P ) et x l'image de X dans B . Il sut de
prouver que tout élément de B est combinaison linéaire à coecients dans A de
1, x, . . . , xn−1 . En eet, on aurait alors F = R + P A[X] où R ∈ B , i .e. R = 0 ou
deg(R) < n = deg(P ), et on pourrait alors écrire F = R + P Q avec R, Q ∈ A[X].
Par linéarité, il sut même de montrer que xi est combinaison linéaire à coe-
cients dans A de 1, x, . . . , xn−1 . Comme P = 0 dans B , on a

xn = −an−1 xn−1 − · · · − a0 .

On a donc le résultat par une récurrence immédiate.

Remarque. On peut prouver l'unicité du couple (Q, R) : si (Q1 , R1 ) et (Q2 , R2 ) sont


deux couples vériant les hypothèses, on a

(Q2 − Q1 )P = (R1 − R2 ).

Comme le coecient dominant de P est inversible dans A, si Q2 − Q1 6= 0, on


a deg((Q2 − Q1 )P ) > deg(P ). Or deg(R1 − R2 ) < deg(P ). Donc Q2 = Q1 , puis
R2 = R1 .

58 || Romain Giuge
2.9. Irréductibilité des polynômes cyclotomiques sur Q

Références :
 Perrin - Cours d'algèbre - Page 83.
 Gourdon - Algèbre - Page 91 (pour la dénition des polynômes cyclotomiques
et le fait qu'ils sont dans Z[X]).

59 || Romain Giuge
2.10. Méthode de Gauss-Seidel

2.10 Méthode de Gauss-Seidel


Méthode (Méthodologie générale). On considère K = R ou C. Soient A ∈ GLn (K)
et b ∈ K n . On cherche une approximation de x ∈ K n solution de Ax = b. Pour
cela on pose A = M − N où M est une matrice inversible "facile à inverser" (par
exemple diagonale, triangulaire ou orthogonale). Pour x0 donné, on dénit alors la
suite itérative
xk+1 = M −1 N xk + M −1 b.
Si la suite (xk ) converge, alors sa limite x doit satisfaire x = M −1 N x + M −1 b, soit
Ax = b. Il s'agit d'établir un critère sur les matrices M et N pour que la méthode
converge. Par dénition (on pose cette dénition), l'algorithme converge si pour tout
b et tout x0 , l'erreur ek = xk − x vérie kek k → 0 quand k → ∞ (pour une norme
quelconque, elles sont toutes équivalentes). On a :

ek+1 = xk+1 − x
= (M −1 N xk + M −1 b) − (M −1 N x + M −1 b)
= M −1 N ek .

En posant G = M −1 N , on obtient ek = Gk e0 . Or Gk e0 → 0 pour tout e0 est


équivalent à ρ(G) < 1 où ρ(G) désigne le rayon spectral de G.

Méthode (Gauss-Seidel). On choisit pour M le triangle inférieur de A, et N le tri-


angle supérieur strict. Le vecteur xk+1 est solution du système triangulaire inférieur
M xk+1 = N xk + b, d'où :
i−1 n
!
1 X X
xk+1,i = bi − aij xk+1,j − aij xk,j ,
aii j=1 j=i+1

pour tout i ∈ [[1, n]].

Théorème. Si la matrice A est symétrique réelle dénie positive, alors la méthode


de Gauss-Seidel converge.
Démonstration. Comme A est symétrique dénie positive, ses termes diagonaux
sont strictement positifs : on prend le vecteur X ayant un 1 en i-ème position et
des 0 partout ailleurs, et après calcul, t XSX = aii > 0. Donc M est inversible et la
méthode de Gauss-Seidel s'applique.
Soit λ ∈ C une valeur propre de G = M −1 N de vecteur propre associé x, et on
a N x = λM x. On écrit M = D + E où D est constituée par la diagonale de A et
E le triangle inférieur strict de A, puis N = −F , de sorte que A = D + E + F . On
note (·, ·) le produit scalaire hermitien canonique de Cn . On a :

(x, Ax) = (x, Dx) + (x, Ex) + (x, F x). (1)

60 || Romain Giuge
2.10. Méthode de Gauss-Seidel

Comme N x = λM x, on a F x = −λ(Dx + Ex), d'où



(x, Ax) = (1 − λ) (x, Dx) + (x, Ex) . (2)

Or (x, Ax) > 0 car x 6= 0 et A dénie positive, donc λ 6= 1. On prend ensuite la


conjugaison complexe de cette égalité. Sachant que (x, Ax) = (x, Ax) (puisque c'est
un réel), que (x, Dx) = (x, Dx) (c'est aussi un réel car D est symétrique réelle dénie
positive), et que (x, Ex) = (Ex, x) = t Exx = t xF x = (x, F x) (car t E = t E = F ),
on obtient

(x, Ax) = (1 − λ) (x, Dx) + (x, F x) . (3)
En faisant 1
1−λ
(2) + 1
1−λ
− (1), on aboutit à
(3)
 
1 1
+ − 1 (x, Ax) = (x, Dx),
1−λ 1−λ
soit
1 − |λ|2
(x, Ax) = (x, Dx).
|1 − λ|2
Or (x, Ax) > 0 et (x, Dx) > 0 (les matrices A et D sont dénies positives), donc
|λ| < 1. On en conclut que ρ(G) < 1 et que la méthode de Gauss-Seidel converge.

Théorème. Si la matrice A est à diagonale strictement dominante, alors la méthode


de Gauss-Seidel converge.
Démonstration. On note A = (aij ) et on a par hypothèse |aii | > |aij |, pour
P
j6=i
tout i. En particulier, A a tous ses termes diagonaux non nuls et on peut utiliser la
méthode de Gauss-Seidel (car M sera bien inversible).
On écrit A = M − N avec M le triangle inférieur de A, et G = M −1 N . Soit
λ ∈ C une valeur propre de G de vecteur propre associé x. On a alors N x = λM x,
i .e.
Xn i
X
− aij xj = λ aij xj
j=i+1 j=1

pour tout i ∈ [[1, n]]. Soit i tel que |xi | = maxk |xk |. On suppose |λ| > 1. Alors :
n i−1
1 X X X
|λ||aii | = − aij xj − λ aij xj 6 |λ||aij |,
|xi | j=i+1 j=1 j6=i

ce qui donne |aii | 6 j6=i |aij | et contredit le fait que A est à diagonale strictement
P

dominante. Donc ρ(G) < 1 et la méthode de Gauss-Seidel converge.

Sur le nombre d'itérations à eectuer :


61 || Romain Giuge
2.10. Méthode de Gauss-Seidel

On dénit le vecteur résidu à l'itération k par rk = b − Axk . Le vecteur x est


solution de Ax = b pour lequel le résidu r = b − Ax est nul. On sera donc d'autant
plus proche de la solution que le résidu sera petit. On poursuit les itérations jusqu'à
ce que
krk k
6 ε.
kAk
Or krk k = kb − Axk k = kAx − Axk k 6 kAkkek k. On poursuit donc jusqu'à ce que
kek k 6 ε. Si on a ek = B k e0 avec kBk < 1, alors kek k 6 kBkk ke0 k. D'autre part

ke0 k 6 kx0 − x1 k + ke1 k 6 kx0 − x1 k + kBkke0 k,

d'où
1
ke0 k 6 kx0 − x1 k.
1 − kBk
Il vient alors
kBkk
kek k 6 kx1 − x0 k
1 − kBk
et il est facile de trouver un nombre d'itérations k de sorte que kek k 6 ε pour le
ε > 0 que l'on veut.

Sur le nombre d'opérations à eectuer :


Pour résoudre un système Ax = b où A est inversible et triangulaire inférieure,
on utilise naturellement une méthode dite de descente :

x 1 = b 1
a11  
xi = 1 bi − Pi−1 aij xj , i = 2, . . . , n.
aii j=1

Cet algorithme eectue n(n−1)


2
additions, n(n−1)
2
multiplications et n divisions,
soit un nombre d'opérations global de l'ordre de n .
2

Comptons le nombre d'opérations pour passer de l'étape k à l'étape k + 1 dans la


méthode de Gauss-Seidel. On doit eectuer ni=1 n = n2 additions, ni=1 (n − 1) =
P P

n(n − 1) multiplications, et n divisions. Il faut ensuite calculer le vecteur résidu


pour savoir si on s'arrête où non : n + n(n − 1) = n2 additions (pour ajouter deux
vecteurs, on doit faire n additions, et pour multiplier une matrice par un vecteur,
n(n − 1) additions), n2 multiplications (dans la multiplication d'une matrice par un
vecteur). Enn, il faudra réaliser n − 1 additions, n multiplications et une extraction
de racine carrée (extraction dont on peut se passer si on raisonne avec la norme au
carrée) pour calculer la norme du résidu. On obtient de l'ordre de 4n2 opérations au
total.

On peut en réalité faire un peu mieux. Ci-dessus, on a calculé xk+1 en se servant


de la relation M xk+1 = N xk + b. Mais N = M − A et la relation devient xk+1 =

62 || Romain Giuge
2.10. Méthode de Gauss-Seidel

xk + M −1 (b − Axk ) = xk + M −1 rk . On commence donc par calculer le résidu rk , puis


pour calculer y = M −1 rk , on résout M y = rk par un algorithme de descente, donc
de l'ordre de n2 opérations. Il ne reste plus qu'à faire les n additions de xk + y pour
obtenir xk+1 . On obtient de l'ordre de 3n2 opérations au total.
Dans tous les cas, si le nombre d'itérations à eectuer reste petit devant n, la
méthode de Gauss-Seidel est plus ecace que les méthodes directes qui nécessitent
un O (n3 ) opérations (voir document "Décomposition QR").

La méthode de Gauss-Seidel est à mettre en comparaison avec celle de Jacobi :

Méthode (Jacobi). On choisit pour M la matrice diagonale formée par la diagonale


de A. Le vecteur xk+1 est solution du système triangulaire inférieur M xk+1 = N xk +b,
d'où :  
n
1  X
xk+1,i = bi − aij xk,j  ,

aii j=1
j6=i

pour tout i ∈ [[1, n]].

Comme M est diagonale, la résolution de M y = rk est encore plus simple que


pour la méthode de Gauss-Seidel : on n'a besoin de faire que n divisions. Cette
méthode nécessite donc un nombre d'opérations de l'ordre de 2n2 au total.

Théorème. Si A est à diagonale strictement dominante, alors la méthode de Jacobi


converge.
Remarque. La méthode de Jacobi nécessite de garder en mémoire le vecteur xk
entier pour le calcul des composantes de xk+1 , contrairement à la méthode de Gauss-
Seidel. Pour Jacobi, on a donc besoin de 2n cases mémoires, contre n pour Gauss-
Seidel. Cette remarque concerne a priori l'utilisation de M xk+1 = N xk + b, et non
la reformulation en xk+1 = xk + M −1 rk .
Remarque. De manière générale, quand les méthodes de Jacobi et Gauss-Seidel sont
convergentes, il vaut mieux choisir celle de Gauss-Seidel. Mais il se peut que la
méthode de Gauss-Seidel diverge alors que celle de Jacobi converge. Exemple :
 
1 2 −2
A = 1 1 1  .
 

2 2 1

Pour la méthode de Jacobi, toutes les valeurs propres sont nulles, alors que pour
celle de Gauss-Seidel, on a 0, 0.35 et 5.64 > 1.

63 || Romain Giuge
2.10. Méthode de Gauss-Seidel

Théorème (Critères de convergence). Soit A ∈ Mn (K). Les quatre propositions


suivantes sont équivalentes :
(i) Pour une norme subordonnée quelconque, on a limk→∞ kAk k = 0.
(ii) Pour tout vecteur v ∈ K n , on a limk→∞ Ak v = 0.
(iii) Le rayon spectral de A vérie ρ(A) < 1.
(iv) Il existe une norme matricielle subordonnée (dont le choix dépend de A) telle
que kAk < 1.
Démonstration. Noter qu'étant en dimension nie, toutes les normes sont équiva-
lentes.
(i) ⇒ (ii) : résulte de kAk xk 6 kAk kkxk.
(ii) ⇒ (iii) : si ρ(A) > 1, soient |λ| = ρ(A) et x un vecteur propre associé à λ,
i .e. tel que Ax = λx. Alors la suite de terme général Ak x = λk x ne converge pas
vers 0.
(iii) ⇒ (iv) : c'est l'implication la plus délicate et celle qui nous intéresse le plus.
On va se servir du résultat suivant qu'on démontre dans la suite : pour tout ε > 0,
il existe une norme subordonnée k · kA,ε telle que kAkA,ε 6 ρ(A) + ε. Dans le cas où
ρ(A) < 1, on peut trouver ε > 0 tel que ρ(A) + ε < 1, ce qui donne le résultat.
(iv) ⇒ (i) : conséquence de l'inégalité kAk k 6 kAkk .
Proposition. Soit A ∈ Mn (K). On note kAk∞ = supx6=0 kAxk∞
kxk∞
la norme subor-
donnée de A à la norme k · k∞ sur K n . Alors
n
X
kAk∞ = max |aij |.
16i6n
j=1

Démonstration. On majore kAxk∞ pour x 6= 0 :


n
X n
X
kAxk∞ = max aij xj 6 kxk∞ max |aij |.
16i6n 16i6n
j=1 j=1
Pn
Donc kAk∞ 6 max16i6n j=1 |aij |.
Soit k un indice tel que nj=1 |akj | = max16i6n nj=1 |aij |. Soit x ∈ K n tel que
P P
a
xj = |akj
kj |
si akj 6= 0, xj = 1 sinon. Ainsi kxk∞ = 1 et
n
X n
X
(Ax)k = akj xj = |akj |.
j=1 j=1

Donc n
kAxk∞ X
kAk∞ > = kAxk∞ > (Ax)k > max |aij |,
kxk∞ 16i6n
j=1

d'où le résultat.

64 || Romain Giuge
2.10. Méthode de Gauss-Seidel

Théorème. Soient A ∈ Mn (K) et ε > 0. Alors il existe une norme matricielle


subordonnée k · kA,ε telle que
kAkA,ε 6 ρ(A) + ε.

Démonstration. On note λ1 , . . . , λn les valeurs propres complexes de A. On peut


trigonaliser A dans C : il existe U ∈ GLn (C) telle que U −1 AU = D + C avec
D = Diag(λ1 , . . . , λn ) et
 
0 c1,2 . . . c1,n
. .. .. .. 
 .. . . . 
C = . .
 
. ..
. . cn−1,n 

0 ... ... 0

Pour δ > 0, on introduit la matrice diagonale Dδ = Diag(1, δ, δ 2 , . . . , δ n−1 ) de sorte


que  
0 δc1,2 . . . δ n−1 c1,n
. . ..
.. ...

 .. . 
Dδ−1 (D + C)Dδ = D + Dδ−1 CDδ =  . .
 
. ..
. . δcn−1,n  
0 ... ... 0
Ainsi pour δ > 0 assez petit, on a
n
X
kDδ−1 CDδ k∞ = max δ j−i |cij | 6 ε.
16i6n
j=i+1

On obtient alors

k(U Dδ )−1 A(U Dδ )k∞ 6 kDk∞ + kDδ−1 CDδ k∞ 6 ρ(A) + ε.

Soit la norme kBkA,ε = k(U Dδ )−1 B(U Dδ )k∞ pour B ∈ GLn (K). Cette norme vérie
bien kAkA,ε 6 ρ(A) + ε. Il reste à montrer que c'est une norme subordonnée. On a :
k(U Dδ )−1 B(U Dδ )xk∞ k(U Dδ )−1 Byk∞ kBykA,ε
kBkA,ε = sup = sup −1
= sup
x6=0 kxk∞ y6=0 k(U Dδ ) yk∞ y6=0 kykA,ε

où kykA,ε = k(U Dδ )−1 yk∞ .

Références :
 Rombaldi - Analyse matricielle, cours et exercices résolus.
 Filbet - Analyse numérique, algorithme et étude mathématique - Pages 38 à
47 (pour une autre méthode et des compléments).

65 || Romain Giuge
2.11. Quelques propriétés des homographies

2.11 Quelques propriétés des homographies


Cette section propose 4 développements possibles. Dans l'ordre :
1. Les homographies conservent les pseudo-cercles.
2. Les homographies conservent les angles orientés.
3. Existence et unicité d'une homographie envoyant trois points distincts z1 , z2 , z3
sur trois points distincts z10 , z20 , z30 .
4. Les homographies conservent le birapport et caractérisation de la cocyclicité
(ou alignement) de quatre points avec le birapport.

Dans toute cette section, on se place dans le plan R2 que l'on identie à C.
On note H le groupe des homographies constitué des transformations de la forme
z 7→ az+b
cz+d
avec ad − bc 6= 0.
Enn, on note Ĉ = C ∪ {∞}.

Proposition. Le groupe H est engendré par les similitudes directes z 7→ az +b (avec


a 6= 0) et l'application z 7→ z1 .

Démonstration. Soit h : z 7→ .
Si c = 0, h est une similitude directe. Si c 6= 0,
az+b
cz+d
on décompose h en éléments simples :

a bc − ad 1
h(z) = + .
c c cz + d

On note s1 (z) = cz + d, f (z) = 1


z
et s2 (z) = a
c
+ bc−ad
c
z. Alors h = s2 ◦ f ◦ s1 .

Dénition. On appelle pseudo-cercle de C tout cercle ou droite de C, les droites


étant vues comme des cercles de rayon inni. On appelle pseudo-cercle de Ĉ tout
cercle de C ou droite de C à laquelle on ajoute le point {∞}.

Proposition. Les pseudo-cercles de C sont exactement donnés par les équations de


la forme azz + bz + bz + c = 0 avec a, c ∈ R et b ∈ C tels que |b|2 > ac.
Démonstration. Une droite a pour équation αx + βy + γ = 0 avec (α, β) 6= (0, 0).
On pose a = 0, b = α−iβ
2
et c = γ . On obtient bien l'équation voulue, avec de plus
|b|2 > ac = 0.

66 || Romain Giuge
2.11. Quelques propriétés des homographies

Un cercle a pour équation x2 + y 2 + αx + βy = R2 avec α, β, R ∈ R et (α, β, R) 6=


(0, 0, 0). On pose z = x + iy et l'équation devient :
z+z z−z
|z|2 + α +β − R2 = azz + bz + bz + c = 0,
2 2i
en ayant posé a = 1, b = α−iβ 2
et c = −R2 . De plus, on a |b|2 > ac = −R2 dès
lors que (b, R) 6= (0, 0). Mais si b = R = 0, alors α = β = 0 et l'équation devient
x2 + y 2 = 0 qui ne représente pas un cercle.

Réciproquement, considérons l'équation azz + bz + bz + c = 0 avec a, c ∈ R et


|b| > ac. On écrit z = x + iy et b = α + iβ et on obtient
2

ax2 + ay 2 + 2αx − 2βy + c = 0.

Si a = 0, on a (α, β) 6= (0, 0) car sinon b = 0 et on aurait une contradiction avec


l'hypothèse |b|2 > ac. Ainsi l'équation 2αx − 2βy + c = 0 est l'équation d'une droite
du plan.
Si a 6= 0, l'équation peut se réécrire
2
c α2 β 2 −ac + |b|2

 α 2 β
x+ + y− =− + 2 + 2 = .
a a a a a a2

On retrouve bien l'équation d'un cercle car |b|2 − ac > 0.

Théorème. Les homographies conservent les pseudo-cercles de Ĉ.


Démonstration. Grâce aux deux premières propositions, il sut de montrer que les
équations de la forme azz + bz + bz + c = 0 sont préservées par les similitudes et par
l'application z 7→ z1 .
Les similitudes sont les composées de translations, homothéties et rotations, elles
transforment donc les cercles en cercles et les droites en droites.
L'ensemble des z ∈ C∗ tels que azz + bz + bz + c = 0 est transformé par l'appli-
cation z 7→ z1 en l'ensemble des z 0 ∈ C∗ tels que

a b b
+ 0
+ + c = 0,
z0z0 z z0
soit encore a + bz 0 + bz 0 + cz 0 z 0 = 0 qui est un pseudo-cercle car |b|2 > ac. De plus,
si z = 0 appartient au pseudo-cercle d'équation azz + bz + bz + c = 0, alors c = 0 et
l'ensemble obtenu après transformation est une droite à laquelle on ajoute le point
{∞}.

67 || Romain Giuge
2.11. Quelques propriétés des homographies

Proposition. Les homographies conservent les angles orientés.


Démonstration. Si on admet que les applications holomorphes conservent les angles,
le résultat est immédiat.
Sinon on se sert du fait que les homographies sont engendrées par les similitudes
directes qui préservent les angles orientés, et l'application z 7→ z1 . Cette dernière est
la composée de la réexion z 7→ z et de l'inversion z 7→ z1 qui renversent toutes les
deux les angles orientés, d'où le résultat.

Dénition. Soit A un point du plan et k un nombre réel non nul. On appelle


inversion de pôle A et de puissance k la transformation IA,k : M 7→ M 0 où M 0 est
le point de la droite AM vériant l'égalité AM .AM 0 = k .
On peut exprimer la même chose en d'autres termes :
−−→0 k −−→
OM = OM .
OM 2
Si zA , z, z 0 sont les axes de A, M, M 0 , c'est équivalent à
k k zA z − |zA |2 + k
z 0 = IA,k (z) = zA + (z − zA ) = zA + = .
|z − zA |2 z − zA z − zA
Remarque. Il est clair que l'inversion IA,k est involutive (IA,k ◦ IA,k = Id. Si k >√ 0,
elle admet des points xes qui sont les points du cercle de centre O et de rayon k ,
appelé cercle d'inversion. Une inversion échange intérieur et extérieur de son cercle
d'inversion.

Proposition. Les réexions renversent les angles orientés.


Démonstration. Soient D une droite vectorielle et u, v deux vecteurs unitaires. On
considère la réexion sD par rapport à la droite D (la symétrie orthogonale par
rapport à la droite D) et on veut montrer que (sD (u), sD (v)) = (v, u).
Considérons la droite D0 engendrée par u + v . Alors si sD0 est la réexion par
rapport à D0 , on a sD0 (u) = v et sD0 (v) = u. D'autre part, sD ◦ sD0 est une isométrie
(composée d'isométries), positive (la composée de deux isométries négatives et une
isométrie positive), donc une rotation, et donc on a l'égalité des angles :

(v, u) = sD ◦ sD0 (v), sD ◦ sD0 (u) .

Mais ce dernier angle vaut (sD (u), sD (v)) car sD0 (u) = v et sD0 (v) = u.

Proposition. Les inversions renversent les angles orientés.


Démonstration. On calcule la diérentielle de l'inversion ϕ = IO,k :
−−−−−−−−→ k −−→
Oϕ(M + u) = 2
(OM + u)
kOM + uk

68 || Romain Giuge
2.11. Quelques propriétés des homographies

−−→ !−1
k OM .u kuk2 −−→
= 1+2 + (OM + u)
OM 2 OM 2 OM 2

−−→ !
k −−→ k OM .u −−→
= OM + u−2 OM + o (kOM k) .
OM 2 OM 2 OM 2

On en déduit que
−−→ !
k OM .u −−→
Dϕ(M ).u = u−2 OM .
OM 2 OM 2

On se rappelle maintenant (c'est facile à démontrer) que si H est un hyperplan


d'un espace vectoriel euclidien E avec x0 vecteur non nul de H ⊥ , alors la réexion
sH par rapport à l'hyperplan H est
x.x0
sH (x) = x − 2 x0 .
kx0 k2

Donc Dϕ(M ) est la composée de la réexion par rapport à la droite vectorielle ortho-
gonale à OM et de l'homothétie de rapport OM k
2 . En particulier, Dϕ(M ) transforme

les angles orientés en leurs opposés car on a montré dans la proposition précédente
que les réexions renversent les angles orientés.
A présent, soient deux courbes planes se coupant en un point A. L'angle de
ces deux courbes est l'angle de leurs tangentes en A. Considérons les images de
ces courbes par une inversion dont le pôle n'est pas en A. Ce sont deux nouvelles
courbes qui se coupent en l'image A0 de A. Les tangentes en A0 à ces deux courbes
sont les images des tangentes en A aux deux courbes d'origine par la diérentielle de
l'inversion utilisée. En particulier, l'angle des courbes images est l'opposé de l'angle
des courbes de départ.

Proposition. L'action H × Ĉ → Ĉ qui à (h, z) associe h(z) est dèle et simplement


3-transitive, i .e.
(i) Seule l'identité xe tous les points de Ĉ (action dèle).
(ii) Pour tout z1 , z2 , z3 ∈ Ĉ deux à deux distincts, et tout z10 , z20 , z30 ∈ Ĉ deux à
deux distincts, il existe une unique homographie h telle que h(zi ) = zi0 pour
i ∈ {1, 2, 3} (action simplement 3-transitive).

Démonstration. La délité est facile : si = z pour tout z ∈ Ĉ, on obtient


az+b
cz+d
cz + (d − a)z − b = 0 pour tout z ∈ Ĉ, et donc ce polynôme du second degré en z
2

est nul, i .e. c = b = 0 et d = a, d'où z 7→ az+b


cz+d
est l'identité.

69 || Romain Giuge
2.11. Quelques propriétés des homographies

Pour la simple 3-transitivité, il sut de montrer la propriété pour (z10 , z20 , z30 ) =
(0, 1, ∞), car alors il existera une unique homographie h1 envoyant (z1 , z2 , z3 ) sur
(0, 1, ∞) et une unique homographie h2 envoyant (z10 , z20 , z30 ) sur (0, 1, ∞), donc h−12 ◦
h1 est une homographie envoyant (z1 , z2 , z3 ) sur (z1 , z2 , z3 ). Elle est unique car si h3
0 0 0

en est une autre, h3 6= h−1 2 ◦ h1 , alors h2 ◦ h3 est une homographie diérente de h1


et qui envoie (z1 , z2 , z3 ) sur (0, 1, ∞), ce qui est absurde.
Traitons les diérents cas possibles :
1. Si z1 , z2 , z3 ∈ C :
az1 + b
= 0 ⇐⇒ az1 + b = 0 ⇐⇒ b = −az1 .
cz1 + d
az3 + b
= ∞ ⇐⇒ cz3 + d = 0 ⇐⇒ d = −cz3 .
cz3 + d
az2 + b
= 1 ⇐⇒ az2 + b = cz2 + d.
cz2 + d
Si z2 = 0,
z3
a=c, b = −cz3 , d = −cz3 .
z1
Si z2 6= 0, az2 + b = cz2 + d =⇒ az2 − az1 = cz2 − cz3 , donc
z2 − z3 z2 − z3
a=c , b = −c z1 , d = −cz3 .
z2 − z1 z2 − z1
Dans tous les cas, a, b, d s'expriment en fonction de c, z1 , z2 , z3 et dépendent
multiplicativement de c, donc a, b, c, d déniront la même homographie quelle
que soit la valeur de c (multiplier au numérateur et au dénominateur par un
même nombre ne change pas l'homographie). Il faut encore vérier que c 6= 0 :
si c = 0, alors comme h(z3 ) = ∞, cela implique z3 = ∞ 6∈ C, et on avait
supposé z3 ∈ C. Enn,

ad − bc = a(−cz3 ) − (−az1 )c = ac(z1 − z3 ) 6= 0.

2. Si z1 = ∞ :
az1 + b
= 0 ⇐⇒ a = 0.
cz1 + d
Il vient ensuite
b b
= ∞ ⇐⇒ d = −cz3 ; = 1 ⇐⇒ b = c(z2 − z3 ).
cz3 + d cz2 + d
3. Si z2 = ∞ :
az2 + b
= 1 ⇐⇒ a = c.
cz2 + d
Il vient ensuite
az1 + b az3 + b
= 0 ⇐⇒ b = −az1 = −cz1 ; = ∞ ⇐⇒ d = −cz3 .
cz1 + d cz3 + d

70 || Romain Giuge
2.11. Quelques propriétés des homographies

4. Si z3 = ∞ :
az3 + b a
= ∞ ⇐⇒ = ∞ ⇐⇒ c = 0.
cz3 + d c
Il vient ensuite
az1 + b az2 + b
= 0 ⇐⇒ b = −az1 ; = 1 ⇐⇒ d = a(z2 − z1 ).
d d

Dénition. Le birapport de quatre points w1 , w2 , w3 , w4 ∈ Ĉ avec w1 , w2 , w3 deux à


deux distincts est l'image de w4 par l'unique homographie h qui envoie (w1 , w2 , w3 )
sur (∞, 0, 1). On le note [w1 , w2 , w3 , w4 ] = h(w4 ).

Proposition. Soient w1 , w2 , w3 , w4 ∈ Ĉ avec w1 , w2 , w3 deux à deux distincts. Alors


w4 − w2 w3 − w2
[w1 , w2 , w3 , w4 ] = ÷ .
w4 − w1 w3 − w1
Démonstration. Soit h l'unique homographie qui envoie (w1 , w2 , w3 ) sur (∞, 0, 1).
On vérie facilement que
z − w2 w3 − w2
h(z) = ÷ ,
z − w1 w3 − w1
d'où l'expression de [w1 , w2 , w3 , w4 ] = h(w4 ).

Proposition. Soient w1 , . . . , w4 , w10 , . . . , w40 ∈ Ĉ avec w1 , w2 , w3 deux à deux dis-


tincts et w10 , w20 , w30 deux à deux distincts. Alors
[w1 , w2 , w3 , w4 ] = [w10 , w20 , w30 , w40 ]

si et seulement s'il existe une homographie h telle que h(wi ) = wi0 pour tout i ∈
{1, 2, 3, 4}.
En particulier, les homographies conservent le birapport : si h ∈ H ,
[w1 , w2 , w3 , w4 ] = [h(w1 ), h(w2 ), h(w3 ), h(w4 )].

Démonstration. On note k l'unique homographie qui envoie (w1 , w2 , w3 ) sur (∞, 0, 1)


et k 0 l'unique homographie qui envoie (w10 , w20 , w30 ) sur (∞, 0, 1). Alors

[w1 , w2 , w3 , w4 ] = k(w4 ) et [w10 , w20 , w30 , w40 ] = k 0 (w40 ).

Supposons [w1 , w2 , w3 , w4 ] = [w10 , w20 , w30 , w40 ], i .e. k(w4 ) = k 0 (w40 ). Alors h =
k 0−1 ◦ k est une homographie telle que h(wi ) = wi0 pour tout i ∈ {1, 2, 3} et

h(w4 ) = k 0−1 (k(w4 )) = k 0−1 (k 0 (w40 )) = w40 .

71 || Romain Giuge
2.11. Quelques propriétés des homographies

Réciproquement, supposons qu'il existe une homographie h telle que h(wi ) = wi0
pour tout i ∈ {1, 2, 3, 4}. Alors h est l'unique homographie qui envoie (w1 , w2 , w3 ) sur
(w10 , w20 , w30 ). Comme k 0−1 ◦ k eectue ces trois mêmes transformations, par unicité,
on a donc h = k 0−1 ◦ k . Donc w40 = h(w4 ) = k 0−1 (k(w4 )), d'où k 0 (w40 ) = k(w4 ), soit
encore
[w1 , w2 , w3 , w4 ] = [w10 , w20 , w30 , w40 ].

Proposition. Quatre points w1 , w2 , w3 , w4 ∈ Ĉ distincts sont cocycliques ou alignés


si et seulement si [w1 , w2 , w3 , w4 ] ∈ R.
Démonstration. Rappelons que les homographies conservent les pseudo-cercles de
Ĉ.
Soit h l'unique homographie envoyant (w1 , w2 , w3 ) sur (∞, 0, 1). Si w4 appartient
au pseudo-cercle contenant w1 , w2 , w3 (une droite s'ils sont alignés, le cercle circons-
crit au triangle w1 w2 w3 sinon), alors h(w4 ) appartient au pseudo-cercle contenant
∞, 0 et 1, i .e. à la droite réelle. Par conséquent,

[w1 , w2 , w3 , w4 ] = h(w4 ) ∈ R.

Réciproquement, supposons que [w1 , w2 , w3 , w4 ] ∈ R. Alors

h(w4 ) = [w1 , w2 , w3 , w4 ] ∈ R,

et par conséquent, h(w4 ) appartient à la droite réelle, qui est également le pseudo-
cercle contenant ∞, 0 et 1. Comme h−1 est encore une homographie, on en déduit
que w4 appartient au pseudo-cercle contenant w1 , w2 et w3 , i .e. w1 , . . . , w4 sont
cocycliques ou alignés.

Références :
 Issu d'un document ayant pour sources :
 Samuel - Géométrie projective.
 Cartan - Fonctions d'une ou plusieurs variables complexes.
 Berger.
 Audin - Géométrie - Page 78 (les réexions renversent les angles orientés),
page 95 (les inversions renversent les angles orientés).

72 || Romain Giuge
2.12. Réduction des isométries d'un espace euclidien

2.12 Réduction des isométries d'un espace euclidien


Théorème. Soit f une isométrie d'un espace euclidien E . Alors il existe une base
orthonormée de E dans laquelle la matrice de f s'écrit :
 
D1 . . . . . . . . . 0
 . .. 
 .. D . 
 −1 
 . .. 
 .
 . C1 . 

 . .. 
 . ..
 . . . 

0 . . . . . . . . . Cp

où D1 est une matrice diagonale de 1 (éventuellement de taille nulle), D−1 une ma-
trice diagonale de −1 (aussi éventuellement de
! taille nulle), p > 0 (éventuellement
cos(θi ) − sin(θi )
nul) et les Ci de la forme .
sin(θi ) cos(θi )

Démonstration. On va commencer par montrer que f possède une droite ou un plan


stable. Pour cela, on va se servir de l'endomorphisme f + f −1 . Comme f est une
isométrie, f ∗ = f −1 . On a donc :

(f + f −1 )∗ = f ∗ + (f −1 )∗ = f −1 + f,

i .e. f + f −1 est symétrique. Par conséquent, f + f −1 est diagonalisable dans une


base orthonormée.
Soit λ une valeur propre réelle de f + f −1 . Alors il existe un vecteur x 6= 0 tel
que (f + f −1 )(x) = λx. En composant par f , il vient f 2 (x) − λf (x) + x = 0. Ainsi
le sous-espace Vect(x, f (x)) est stable par f et est soit un plan (si x et f (x) ne sont
pas colinéaires), soit une droite (si x et f (x) sont colinéaires).

Raisonnons par récurrence pour montrer que la matrice de f a la forme demandée


dans une certaine base. D'après ce qui précède, f admet une droite ou un plan stable,
qu'on note V .
Si V est une droite, soit e1 un vecteur unitaire engendrant V . Alors soit f (e1 ) =
e1 , soit f (e1 ) = −e1 . En eet, f (e1 ) = λe1 et kf (e1 )k = 1 = |λ|.
Si V est un plan, on note (e1 , e2 ) une base orthonormée de V . Comme f est une
isométrie, f|V aussi (elle conserve toujours le produit scalaire). Démontrons que si
f|V est une isométrie directe, il existe θ1 tel que
!
cos(θ1 ) − sin(θ1 )
Mat(e1 ,e2 ) (f|V ) = .
sin(θ1 ) cos(θ1 )

73 || Romain Giuge
2.12. Réduction des isométries d'un espace euclidien

Comme kf (e1 )k = 1, on peut écrire f (e1 ) = cos(θ1 )e1 + sin(θ1 )e2 . Ensuite il existe
a, b ∈ R tels que f (e2 ) = ae1 + be2 . On exploite le fait que f (e1 )|f (e2 ) = 0 :


a cos(θ1 )+b sin(θ1 ) = 0. On a soit cos(θ1 ) 6= 0, soit sin(θ1 ) 6= 0 (car kf (e1 )k = 1 6= 0).
Supposons que sin(θ1 ) 6= 0. Alors

−a cos(θ1 )
b= .
sin(θ1 )
2
On a d'autre part que kf (e2 )k2 = a2 + b2 = 1, donc a2 + a2 cos (θ1 )
sin2 (θ1 )
= 1, et après
multiplication par sin (θ1 ), il vient a = sin (θ1 ). Donc il existe ε ∈ {−1, 1} tel que
2 2 2

a = ε sin(θ1 ). Puis b = −ε cos(θ1 ). Comme f|V est directe, on trouve ε = −1.


Si f|V est une isométrie indirecte, on a
!
cos(θ1 ) sin(θ1 )
Mat(e1 ,e2 ) (f|V ) = ,
sin(θ1 ) − cos(θ1 )

qui est une matrice symétrique réelle. On obtient donc une valeur propre réelle pour
f et donc f admet une droite stable : on est ramené au cas où V est une droite.

On écrit maintenant E = V ⊕ V ⊥ . Le sous-espace V ⊥ est stable par f : en eet,


soient v ∈ V et w ∈ V ⊥ . Comme f|V est une isométrie de V , elle est bijective, donc
il existe v 0 ∈ V tel que v = f (v 0 ). Ainsi,

(f (w), v) = (f (w), f (v 0 )) = (w, v 0 ) = 0,

ce qui prouve que f (w) ∈ V ⊥ . Comme f|V ⊥ est une isométrie de V ⊥ , on peut
appliquer l'hypothèse de récurrence. Enn, quitte à réordonner les vecteurs de la
base trouvée, on obtient bien la matrice de f de la forme demandée.

Théorème. Soient E un espace euclidien et u un endomorphisme de E . Alors il


existe un unique endomorphisme v tel que pour tout x, y ∈ E , (u(x), y) = (x, v(y)).
On appelle v l'adjoint de u et on le note u∗ . De plus, si B est une base orthonormée
de E , on a MatB (u∗ ) = t MatB (u).
Démonstration. On note A = MatB (u). Alors (u(x), y) = t (AX)Y = t X t AY . On
note v l'endomorphisme associé à la matrice t A dans la base B . L'unicité est facile
à montrer.

Proposition. Si u est une isométrie, alors u est bijective et u∗ = u−1 .

74 || Romain Giuge
2.12. Réduction des isométries d'un espace euclidien

Démonstration. Si u est une isométrie, u conserve la norme, et on prouve alors


facilement que Ker(u) = {0}. Donc u est bijective. Ensuite :

(u(x), y) = u(x), u(u−1 (y)) = (x, u−1 (y))




car u conserve le produit scalaire. Par unicité de l'adjoint, on a donc u∗ = u−1 .

Références :
 Aucune.

75 || Romain Giuge
2.13. Simplicité de An

2.13 Simplicité de An
Théorème. Pour n 6= 4, le groupe alterné An est simple.
Démonstration. On commence par les cas où n 6 4 : A1 = S1 = {Id} est simple,
A2 = {Id} est simple, Card(A3 ) = 3!2 = 3 donc A3 est simple (le cardinal d'un
sous-groupe de A3 divise 3, donc vaut 1 ou 3, c'est donc soit {Id}, soit A3 ), A4 n'est
pas simple car il contient V4 = {Id, (12)(34), (13)(24), (14)(23)} comme sous-groupe
distingué non trivial.
Soit maintenant n > 5. On commence par montrer que les 3-cycles sont conjugués
dans An . Soient c1 = (i1 i2 i3 ) et c2 = (j1 j2 j3 ) deux 3-cycles. Si σ ∈ Sn , on vérie
facilement que
σ(i1 i2 i3 )σ −1 = (σ(i1 )σ(i2 )σ(i3 )).
On choisit alors σ telle que σ(i1 ) = j1 , σ(i2 ) = j2 , σ(i3 ) = j3 et envoyant bijective-
ment [[1, n]]\{i1 , i2 , i3 } sur [[1, n]]\{j1 , j2 , j3 }. Si σ ∈ An , c'est terminé. Sinon, puisque
n > 5, il existe i4 , i5 6∈ {i1 , i2 , i3 } et alors en notant τ = (i4 i5 ) et σ 0 = στ , on a

σ 0 c1 σ 0−1 = c2

et σ 0 ∈ An (en eet, ε(σ 0 ) = ε(σ)ε(τ ) = 1).

Soit H 6= {Id} un sous-groupe distingué de An . On va montrer que H contient


un 3-cycle. Ainsi, H contiendra tous les 3-cycles car on vient de montrer qu'ils sont
conjugués dans An , et comme H est distingué dans An , il contient tous les conjugués
de ses éléments. Mais on sait que An est engendré par les 3-cycles, donc on aura
H = An , i.e. An est simple.

Soit r le minimum des cardinaux des supports des éléments de H\{Id}. Si r = 3,


on aura le résultat.
Soit σ ∈ H , σ 6= Id. Il existe a, b ∈ [[1, n]] tels que b = σ(a) 6= a. Soient s le
3-cycle (abc) avec c 6∈ {a, b} et τ = sσs−1 σ −1 . Comme σ ∈ H , s ∈ An et H distingué
dans An , on a : τ = sσs σ ∈ H. Comme s−1 = (acb), on a :
−1 −1
| {z } |{z}
∈H ∈H

σs−1 σ −1 = (σ(a)σ(c)σ(b)) = (bσ(c)σ(b)) et τ = (abc)(bσ(c)σ(b)).

Ainsi τ est une permutation dont le support est inclu dans {a, b, c, σ(c), σ(b)}. De
plus, pour s'assurer que τ 6= Id, choisissons c 6= σ(b). Ainsi τ (σ(b)) = c 6= σ(b). On
a donc prouvé que r 6 5.
Supposons par l'absurde que r = 5. Alors H contient un élément h dont le
support est de cardinal 5 : c'est nécessairement un 5-cycle car le produit d'un 3-
cycle et d'une transposition n'est pas dans An . On note h = (i1 i2 i3 i4 i5 ). Alors après

76 || Romain Giuge
2.13. Simplicité de An

calculs :
 −1 −1
h
|{z} | (i 2 i5 )(i 1 i 4 ) h (i 2 i 5 )(i1 i4 ) = (i1 i4 i3 ) ∈ H,
∈H car (i2 i5 )(i1 i4 )∈An
{z }
∈H

ce qui est absurde car H contiendrait un élément dont le support est de cardinal
3 < r. Donc r 6 4.
Supposons maintenant par l'absurde que r = 4. Alors H contient un élément
h dont le support est de cardinal 4 : c'est nécessairement un produit de deux
transpositions à supports disjoints car les 4-cycles ne sont pas dans An . On note
h = (i1 i2 )(i3 i4 ). Alors après calculs :

h (i3 i4 i5 )h−1 (i3 i4 i5 )−1 = (i3 i4 i5 ) ∈ H,


|{z}
∈H car (i3 i4 i5 )∈An
| {z }
∈H

ce qui est absurde car H contiendrait un élément dont le support est de cardinal
3 < r. Donc r 6 3.
Enn, aucune transposition n'est dans H car les transpositions ne sont pas dans
An . D'où r > 3, et donc r = 3, ce qui achève la démonstration.

Applications possibles :

Application. Pour n 6= 4, les seuls sous-groupes distingués de Sn sont {Id}, An et


Sn .

Démonstration. Soit H un sous-groupe distingué de Sn . Alors H ∩ An est un sous-


groupe distingué de An . Donc par le théorème précédent, on a soit H ∩ An = An ,
soit H ∩ An = {Id}.
Si H ∩ An = An , alors An ⊂ H et donc Card(An ) = n! 2
divise Card(H) qui divise
Card(Sn ) = n!. On écrit Card(H) = k 2 et n! = lCard(H), ce qui donne n! = n!2 kl.
n!

Donc nécessairement, kl = 2. Si k = 2, on obtient H = Sn , et si k = 1, on obtient


H = An .
Si H ∩ An = {Id}, alors Ker(ε|H ) = H ∩ An = {Id}. Donc la signature ε induit
un isomorphisme de H sur ε(H) ⊂ {−1, 1}. Donc Card(H) 6 2. Si Card(H) = 2, il
existe τ ∈ Sn tel que H = {Id, τ }. Comme on doit avoir τ −1 ∈ H , nécessairement
τ est une transposition. De plus, H étant distingué dans Sn , on a στ σ −1 ∈ H pour
tout σ ∈ Sn . Mais si on note τ = (ij), alors pour tout σ ∈ Sn , στ σ −1 = (σ(i)σ(j)) ∈
H = {Id, (ij)} : c'est clairement impossible. On en déduit que Card(H) = 1 et donc
H = {Id}.

Application. Pour n > 5, il n'existe pas de surjection de Sn dans Sn−1 .

77 || Romain Giuge
2.13. Simplicité de An

Démonstration. Supposons qu'une telle surjection f existe. Alors Sn /Ker(f ) '


Im(f ) = Sn−1 par passage au quotient et surjectivité de f . Donc [Sn : Ker(f )] =
Card(Sn−1 ) = (n − 1)!, d'où Card(Ker(f )) = n. Or Ker(f ) est un sous-groupe
distingué de Sn (c'est toujours le cas pour un morphisme de groupes comme on
peut le vérier facilement). De plus, Ker(f ) est non trivial : s'il était réduit au
neutre, f serait bijective ce qui est impossible car Sn et Sn−1 sont de cardinal dif-
férent, et s'il était égal à Sn , f serait identiquement nulle, donc non surjective. Le
seul sous-groupe distingué de Sn non trivial est An d'après l'application précédente,
donc Ker(f ) = An . En prenant les cardinaux, on trouve n = n! 2
, ce qui est absurde
lorsque n > 5.

Dénition. Le support d'une permutation σ est l'ensemble des i tels que σ(i) 6= i.

Dénition. Un groupe G est dit simple s'il a exactement deux sous-groupes distin-
gués : {e} et lui-même.

Proposition. On a Card(An ) = n!2 .


Démonstration. Soit τ une transposition. Alors f : σ 7→ στ est une bijection de Sn
qui induit une bijection de An sur l'ensemble de permutations impaires. Ces deux
ensembles ont donc même cardinal, et puisqu'ils forment une partition de Sn , on a
Card(An ) = Card(S
2
n)
= n!2 .

Proposition. Pour n > 3, les cycles de longueur 3 engendrent An .


Démonstration. Puisque tout élément de Sn peut s'écrire comme un produit de
transpositions, An est aussi l'ensemble des produits pairs de transpositions. Notons
A0n le sous-groupe de Sn engendré par les cycles de longueur 3 et montrons que
A0n = An . Clairement, A0n ⊂ An (un cycle de longueur 3 est de signature 1). Pour
montrer l'inclusion inverse, il sut de prouver que le produit de deux transpositions
est dans A0n (car An est l'ensemble des produits pairs de transpositions).
Montrons donc que pour tout i, j, k, l, (i, j)(k, l) ∈ A0n :
 Si i, j, k, l sont deux à deux distincts, alors (i, j)(k, l) = (i, j, k)(j, k, l) ∈ A0n .
 Si i, j, k sont deux à deux distincts et l = i (par exemple), alors (i, j)(k, l) =
(k, j, i) ∈ A0n .
 Si i 6= j , k = i et l = j (par exemple), alors (i, j)(k, l) = Id ∈ A0n .

78 || Romain Giuge
2.13. Simplicité de An

Références :
 Risler et Boyer - Algèbre pour la licence 3.
 Perrin - Cours d'algèbre - Page 30 (pour la première application).

79 || Romain Giuge
2.14. Sous-groupes compacts de GLn (R)

2.14 Sous-groupes compacts de GLn(R)


Lemme. Soient E un espace euclidien, K un convexe compact de E et H un sous-
groupe compact de GL(E). Si K est stable par tous les éléments de H , alors il existe
a ∈ K qui est xé par tous les éléments de H .

Démonstration. Soit k · k une norme euclidienne sur E . Pour x ∈ E , on pose

N (x) = sup ku(x)k = max ku(x)k,


u∈H u∈H

le borne supérieure étant atteinte sur le compact H (l'application u 7→ ku(x)k est


continue grâce à l'inégalité triangulaire bis, et en prenant la norme triple sur GL(E)).
Alors N est une norme sur E . En eet :
(i) Si N (x) = 0, comme IdE ∈ H , on a en particulier kIdE (x)k = kxk = 0, i .e.
x = 0.
(ii) On a clairement N (λx) = |λ|N (x) pour tout λ ∈ R.
(iii) ku(x + y)k = ku(x) + u(y)k 6 ku(x)k + ku(y)k 6 N (x) + N (y) pour tout
u ∈ H et tout x, y ∈ E . En passant au sup à gauche, on obtient N (x + y) 6
N (x) + N (y) pour tout x, y ∈ E .
De plus, N vérie : pour tout v ∈ H , N (v(x)) = N (x), ce qui est clair car u 7→ u ◦ v
est une permutation de H .
On montre ensuite que N vérie : si N (x + y) = N (x) + N (y), alors x et y sont
positivement liés. Soient x, y ∈ E tels que N (x + y) = N (x) + N (y). Soit u0 ∈ H tel
que le sup dénissant N (x + y) soit atteint : N (x + y) = ku0 (x + y)k. Alors :

N (x + y) = ku0 (x + y)k 6 ku0 (x)k + ku0 (y)k 6 N (x) + N (y) = N (x + y).

Les inégalités précédentes sont donc des égalités, d'où ku0 (x + y)k = ku0 (x)k +
ku0 (y)k, ce qui implique que u0 (x) et u0 (y) sont positivement liés (une norme eu-
clidienne vérie cette propriété). Comme u0 est linéaire et inversible, cela entraîne
immédiatement que x et y sont positivement liés. Le résultat est donc établi.

Par compacité de K et continuité de N sur K (une norme est toujours continue),


il existe a ∈ K tel que N (x) > N (a) pour tout x ∈ K . Ce point a est unique : si b 6= a
vérie N (b) = N (a), comme K est convexe, a+b 2
∈ K . Si a et b sont positivement
liés, alors a = λb avec λ > 0 (par exemple), et N (a) = N (b) entraîne λ = 1, ce qui
est absurde. Donc a2 et 2b ne sont pas positivement liés, d'où, d'après ce qui précède :
 
a+b 1 1
N < N (a) + N (b) = N (a).
2 2 2

80 || Romain Giuge
2.14. Sous-groupes compacts de GLn (R)

Ceci contredit la minimalité de N en a.

On suppose K stable par tous les éléments de H . Donc si v ∈ H , v(a) ∈ K , et


d'autre part, N (v(a)) = N (a). Par unicité de a, cela implique v(a) = a. Le point a
est donc un point de K xé par tous les éléments de H .

Théorème. Tout sous-groupe compact de GLn (R) est conjugué à un sous-groupe de


On (R).

Démonstration. Soit G un sous-groupe compact de GLn (R). On munit G d'une


nouvelle structure de groupe (G, ∗) dénie par A ∗ B = BA pour tout A, B ∈ G
(c'est bien une loi interne). On considère l'application :

ρ : (G, ∗) −→ GL(Sn (R)), ◦

A 7−→ S 7→ t ASA .
On vérie facilement que ρ est bien dénie et qu'il s'agit d'un morphisme de groupes
(grâce au changement de la loi sur G, on a bien ρ(A ∗ B) = ρ(BA) = ρ(A) ◦ ρ(B)).
De plus, ρ est continue : pour le voir on peut écrire ρ = b ◦ f avec b : (A, B) 7→
(S 7→ t ASB) application bilinéaire de Mn (R)2 dans L(Sn (R), Mn (R)) continue car
dimensions nies, et f : A 7→ (A, A) bien sûr continue.
On pose J = {t M M, M ∈ G} qui est un compact (non vide) du convexe Sn++ (R)
comme image du compact G par l'application continue M 7→ t M M . Le corollaire
du théorème de Carathéodory nous dit que l'enveloppe convexe K = Cv(J) reste
compacte dans Sn++ (R). De plus, H = ρ(G) est un sous-groupe (car ρ est un mor-
phisme de groupes) compact (car ρ est continue et G est compact) de GL(Sn (R)).
Enn, on montre que K est stable par tous les éléments de H : si A ∈ G et M ∈ G,
alors
ρ(A)(t M M ) = t At M M A = t (M A)M A ∈ J,
car G étant un sous-groupe, M A ∈ G. Comme ρ(A) est linéaire, il conserve les
combinaisons convexes, donc ρ(A)(K) ⊂ K (on se sert de la caractérisation : K est
l'ensemble des combinaisons convexes d'éléments de J ), i.e. K est stable par tous
les éléments de H .
On peut donc appliquer le lemme : il existe S ∈ K tel que pour tout A ∈ G,
on ait ρ(A)(S) = S , i .e. t ASA = S . Comme K ⊂ Sn++ (R), on a S ∈ Sn++ (R) et on
obtient G ⊂ On (q, R) où q : x 7→ t xSx est une forme quadratique dénie positive.
En réduisant la forme quadratique q , on obtient enn que G est conjugué à un
sous-groupe de On (R).

Compléments de la démonstration :
81 || Romain Giuge
2.14. Sous-groupes compacts de GLn (R)

1. Justions que J ⊂ Sn++ (R) : si A = t M M ∈ J , alors t XAX = t (M X)M X =


kM Xk2 > 0. Or M ∈ G ⊂ GLn (R), donc si t XAX = 0, alors M X = 0, et
donc X = 0.
2. Justions que Sn++ (R) est convexe : si A, B ∈ Sn++ (R), alors pour t ∈ [0, 1],
M = tA + (1 − t)B ∈ Sn++ (R). En eet, on a directement t M = M , d'où
M ∈ Sn (R). De plus, si X 6= 0,

t
XM X = t t|XAX t
{z } +(1 − t) |XBX
{z } > 0.
>0 >0

Donc M ∈ Sn++ (R).


3. Justions que G ⊂ On (q, R) implique que G est conjugué à un sous-groupe de
On (R). Par dénition,

On (q, R) = M ∈ Mn (R) / t M SM = S .


Mais S est diagonalisable au moyen d'une matrice orthogonale pour le produit


scalaire usuel : il existe P ∈ On (R) telle que S = t P DP avec D diagonale
dont les éléments diagonaux sont strictement positifs. On écrit D = C 2 avec
C diagonale dont les éléments diagonaux sont strictement positifs (en prenant
les racines carrées des éléments diagonaux de D). Alors

M ∈ Mn (R) / t (CP M t P C −1 )(CP M t P C −1 ) = In



On (q, R) =
M ∈ Mn (R) / CP M t P C −1 ∈ On (R)

=
P C −1 XCP, X ∈ On (R)
t
=
= t
P C −1 On (R)CP
= (CP )−1 On (R)CP.

Finalement, G ⊂ (CP )−1 On (R)CP , soit encore CP G(CP )−1 ⊂ On (R). Mais
CP G(CP )−1 reste un sous-groupe, donc CP G(CP )−1 = H avec H sous-
groupe de On (R). D'où
G = (CP )−1 HCP.

Application. Le groupe On (R) est un sous-groupe compact maximal de GLn (R).


Démonstration. Soit G un sous-groupe compact de GLn (R) avec On (R) ⊂ G ⊂
GLn (R). D'après ce qui précède, il existe un sous-groupe H de On (R), il existe C
diagonale à coecients diagonaux strictement positifs et P ∈ On (R) tels que

G = (CP )−1 HCP.

82 || Romain Giuge
2.14. Sous-groupes compacts de GLn (R)

Le fait que On (R) ⊂ G ⊂ (CP )−1 On (R)CP entraîne que CP On (R)(CP )−1 ⊂
On (R). Or P On (R)P −1 = On (R) car P ∈ On (R). Donc COn (R)C −1 ⊂ On (R). On
note C = Diag(λ1 , . . . , λn ) et
 
0 ... 1
.
.. . . . ...  .

J =
 
1 ... 0

On vérie facilement que J ∈ On (R). On calcule ensuite :


 
λ1
0 ... ... 0 λn
 0 . . . . . . λ λ2
 
 n−1
0 
.
.. . . .
.. 
CJC −1 = 
 
 . 

 0 λn−1 . . . . . . .. 
 λ2
.
λn
λ1
0 ... ... 0

et cette matrice appartient à On (R). Donc t (CJC −1 )(CJC −1 ) = In , i .e. :


 2 
λ
  
0 . . . λλn1 0 . . . λλn1  λ1
n
... 0 
 . . . . ..   .. . . . ..  =  .. .. 
.     ..
. .  . .  . . .  = In .

λ1 λn   2 
λn
... 0 λ1
... 0 0 ... λ1
λn

Comme les λi sont positifs, on en déduit λn = λ1 , λn−1 = λ2 , etc... On recommence


cela en faisant monter d'une ligne tous les 1 dans la matrice J :
 
0 ... 0 1 0
. .
 .. . . 0 0

 
J = 0 1 . .
 . .
.. 

 
 
1 0 0
0 ... ... 0 1

On répète cela jusqu'à retomber sur la première matrice J . Au nal, on obtient


λi = λj , pour tout i 6= j , i .e. C = λ1 In . Donc C commute avec toutes les matrices,
d'où :
On (R) ⊂ G ⊂ (CP )−1 On (R)CP = P −1 On (R)P = On (R),
la dernière égalité étant due au fait que P ∈ On (R). Soit enn G = On (R).

Remarque. On peut partir juste du fait que G est conjugué à un sous-groupe de


On (R). Ainsi il existe Q ∈ GLn (R) tel que G ⊂ Q−1 On (R)Q, d'où encore

QOn (R)Q−1 ⊂ On (R).

83 || Romain Giuge
2.14. Sous-groupes compacts de GLn (R)

En écrivant Q = SO avec S symétrique réelle dénie positive et O ∈ On (R) par la


décomposition polaire, on obtient SOn (R)S −1 ⊂ On (R). Il existe P ∈ On (R) telle
que S = P CP −1 avec C diagonale à coecients diagonaux strictement positifs. On
obtient alors
SOn (R)S −1 = P COn (R)(P C)−1 ⊂ On (R),
et en multipliant à gauche par P −1 et à droite par P :

COn (R)C −1 ⊂ P −1 On (R)P = On (R).

On est donc ramené à la démonstration qui précède.

Soient E un espace ane euclidien de dimension nie non nulle et A une partie
de E .

Dénition. L'enveloppe convexe d'une partie A de E , notée Cv(A), est l'inter-


section de tous les convexes contenant A. C'est donc le plus petit convexe de E
contenant A.

Proposition.
(i) Cv(A) est l'ensemble des combinaisons convexes d'éléments de A.
(ii) Si A est convexe et compacte, on a A = Cv(Fr(A)) où Fr(A) désigne la fron-
tière de A.
Théorème (Carathéodory). Tout élément de Cv(A) s'écrit comme combinaison
convexe de k points de A avec k 6 dim(E) + 1.

Démonstration. Soit x ∈ Cv(A). On écrit x = t1 a1 + · · · + tk ak avec k ∈ N∗ , ti > 0


et ki=1 ti = 1. On suppose k > dim(E) + 1. Alors la famille ((a2 − a1 ), . . . , (ak − a1 ))
P

est liée car de cardinal > dim(E). Donc il existe λ2 , . . . , λk non tous nuls tels que

λ2 (a2 − a1 ) + · · · + λk (ak − a1 ) = 0.

On note µ1 = λ2 + · · · + λk et µi = −λi pour tout i > 2. Alors pour tout y ∈ E ,

µ1 (a1 − y) + · · · + µk (ak − y) = 0.
Pk
En particulier, l'égalité est vraie pour x. On a d'autre part j=1 µj = 0, donc il
existe j tel que µj > 0. Soit
 
ti ti
λ = min , µi > 0 = 0 .
µi µi0

84 || Romain Giuge
2.14. Sous-groupes compacts de GLn (R)

Soit ensuite νi = ti − λµi . Alors, sachant que ti 6= 0 (car ti > 0),


 
 ti0 µi 
1 − µi ti  > 0.
νi = ti  
0
| {z }
61

D'autre part,
k
X k
X k
X
νi = ti −λ µi = 1.
i=1 i=1 i=1
| {z } | {z }
=1 =0

Et de plus, il existe q tel que νq = 0. Donc

x = t1 a1 + · · · + tk ak

= t1 a1 + · · · + tk ak − λ µ1 (a1 − x) + · · · + µk (ak − x)
k
!
X
= (t1 − λµ1 )a1 + · · · + (tk − λµk )ak − λ µi x
i=1
| {z }
=0
k
X X
= ν i ai = ν i ai .
i=1 i6=q

On a ainsi écrit x comme combinaison convexe de k − 1 points de A.

Corollaire. On suppose A non vide. Si A est compacte, il en est de même de Cv(A).


Démonstration. Soit n = dim(E). On note

K = (t1 , . . . , tn+1 ) ∈ [0, 1]n+1 / t1 + · · · + tn+1 = 1 .




L'ensemble K est compact car fermé borné, fermé comme image réciproque de 1 par
la fonction continue g : (t1 , . . . , tn+1 ) 7→ t1 + · · · + tn+1 . Soit

f: K × E n+1 −→ E
(t1 , . . . , tn+1 , a1 , . . . , an+1 ) 7−→ t1 a1 + · · · + tn+1 an+1 .

D'après le théorème de Carathéodory, Cv(A) = f (K ×An+1 ). Comme f est continue


et K × An+1 est compact, on en déduit que Cv(A) est compact.

Autre résultat intéressant :

Proposition. On suppose A non vide. Si A est bornée, il en est de même de Cv(A).


De plus, δ(A) = δ(Cv(A)) où δ(A) = supx,y∈A kx − yk.

85 || Romain Giuge
2.14. Sous-groupes compacts de GLn (R)

Démonstration. Comme la partie A est bornée, elle est contenue dans une boule
fermée B = B(a, r). Or, B étant convexe, il vient Cv(A) ⊂ B . D'où Cv(A) est
bornée.
Il est clair que δ(A) 6 δ(Cv(A)).
Soit maintenant x = t1 a1 + · · · + tk ak ∈ Cv(A) écrit comme combinaison convexe
d'éléments de A. Si a ∈ A, alors

ka − xk = kt1 (a − a1 ) + · · · + tk (a − ak )k
6 t1 ka − a1 k + · · · + tk ka − ak k
6 δ(A)(t1 + · · · + tk ) = δ(A),

sachant que ka − ai k 6 δ(A) car a, ai ∈ A. Soit y ∈ Cv(A). Alors :

ky − xk = kt1 (y − a1 ) + · · · + tk (y − ak )k
6 t1 ky − a1 k + · · · + tk ky − ak k
6 δ(A)(t1 + · · · + tk ) = δ(A),

sachant que ky−ai k 6 δ(A) d'après l'inégalité précédente avec y ∈ Cv(A) et ai ∈ A.


On en déduit que δ(Cv(A)) 6 δ(A), d'où le résultat.

Références :
 Alessandri - Thèmes de géométrie - Pages 59, 141 et 160.
 Tauvel - Cours de géométrie - Page 77 (pour le théorème de Carathéodory).

86 || Romain Giuge
2.15. Surjectivité de l'exponentielle

2.15 Surjectivité de l'exponentielle


Lemme. Soient G un groupe topologique et H un sous-groupe de G contenant un
voisinage du neutre e de G. Alors H est ouvert et fermé dans G.
Démonstration. Montrons que H est ouvert. Par hypothèse, il existe un voisinage
ouvert V de e dans G avec V ⊂ H . Alors si h ∈ H , hV ⊂ H . Si on note ϕ : g 7→ h−1 g
le morphisme de multiplication à gauche par h−1 dans G qui est continu, alors
hV = ϕ−1 (V ) est ouvert comme image réciproque d'un ouvert par une application
continue. Ainsi H est un voisinage de chacun de ses points, donc H est ouvert.
Montrons que H est fermé. On a clairement G = g∈G gV et H = h∈H hV .
S S

Donc c H = g6∈H gV (si g 6∈ H , gV ⊂ c H car s'il existe gv ∈ H , alors on aurait


S

g ∈ H ). Comme gV est ouvert pour tout g , c H est ouvert, et donc H est fermé.

Théorème. Soit A ∈ GLn (C). On note


C[A] = {P (A), P ∈ C[X]} et U = C[A] ∩ GLn (C).

Alors exp(C[A]) = U .
En particulier, il existe P ∈ C[X] tel que A = eP (A) , et exp : Mn (C) → GLn (C)
est surjective.
Démonstration. Soit A ∈ GLn (C). D'abord, C[A] = {P (A), P ∈ C[X]} est un
sous-espace vectoriel de Mn (C) de dimension nie, donc fermé. Pour toute matrice
M ∈ C[A], comme eM est limite d'éléments de C[A], on a eM ∈ C[A]. De plus eM
est inversible d'inverse e−M ∈ C[A]. Comme tous les éléments de C[A] commutent,
on en déduit que exp induit un homomorphisme du groupe additif (C[A], +) dans le
groupe multiplicatif U des inversibles de C[A]. On vérie bien que U est un groupe :
si M ∈ U , M −1 ∈ C[M ] ⊂ C[A] par le théorème de Cayley-Hamilton, donc dans
U (sinon on peut aussi dire que comme M est inversible, X et ΠM le polynôme
minimal de M sont premiers entre eux, et avec le théorème de Bézout, il existe deux
polynômes P et Q tels que P X + QΠM = 1, d'où M −1 = P (M ) ∈ C[M ] ⊂ C[A]).

On va maintenant montrer que exp(C[A]) est un ouvert-fermé de U en utilisant


le lemme. On sait d'une part que l'application exp est de classe C 1 sur Mn (C).
On trouve facilement que la diérentielle de exp : C[A] → U en 0 ∈ C[A] est
D exp(0) = Id (en écrivant e0+H = In + H + o (kHk)), qui est inversible. On peut
donc appliquer le théorème d'inversion locale : il existe un voisinage ouvert V0 de 0
dans C[A] et un voisinage ouvert V de In dans U tels que exp|V0 : V0 → V soit un
C 1 -diéomorphisme. Par le lemme précédent avec G = U , H = exp(C[A]) et V ⊂ H
voisinage ouvert de In , on en déduit que exp(C[A]) est ouvert et fermé dans U .

87 || Romain Giuge
2.15. Surjectivité de l'exponentielle

Montrons à présent que U est connexe. Soient M, N ∈ U et f : z 7→ zM +(1−z)N


dénie pour z ∈ C, et à valeurs dans C[A]. Le polynôme en z , det(zM + (1 − z)N ),
s'annule sur un ensemble Z ni. Or C\Z est connexe par arcs. Donc il existe un
chemin continu γ : [0, 1] → C\Z tel que γ(0) = 0 et γ(1) = 1. Ainsi f ◦ γ : [0, 1] → U
est un chemin continu qui relie M à N . Donc U est connexe par arcs, donc connexe.

Finalement, exp(C[A]) est un ouvert-fermé de U qui est connexe, donc

exp(C[A]) = U.

En particulier, comme A ∈ U , il existe P ∈ C[X] tel que A = exp(P (A)).

Corollaire. Si A ∈ GLn (C) et k ∈ N∗ , alors il existe B ∈ GLn (C) tel que A = B k .


 
Démonstration. B = exp P (A)
k
convient.

Remarque. exp : Mn (R) → GLn (R) n'est pas surjective : exp est continue et GLn (R)
a deux composantes connexes alors que Mn (R) est connexe.

Application. Soit A ∈ GLn (R). Alors il existe M ∈ Mn (R) telle que A = eM si et


seulement s'il existe B ∈ Mn (R) telle que A = B 2 .
Démonstration. Le sens direct est évident en prenant B = e 2 .
M

Sens indirect : soit A ∈ GLn (R). On suppose qu'il existe B ∈ GLn (R) telle que
A = B 2 . On a aussi B ∈ GLn (C), donc d'après le théorème, il existe Q ∈ C[X] tel
que B = eQ(B) . Mais comme B est une matrice réelle, on a

B = B = eQ(B) = eQ(B) .

On obtient alors
A = BB = BB = eQ(B) eQ(B) .
Or Q(B) et Q(B) = Q(B) commutent comme polynômes en B , donc :

A = eQ(B)+Q(B) = eM

avec M = Q(B) + Q(B) ∈ Mn (R), d'où le résultat.

88 || Romain Giuge
2.15. Surjectivité de l'exponentielle

Dénition. Un groupe topologique est un triplet (G, ·, T ) où (G, ·) est un groupe,


(G, T ) est un espace topologique, et ces deux notions sont compatibles : les applica-
tions (g, h) 7→ gh et g 7→ g −1 sont continues.

Dénition. Un espace topologique E est connexe si et seulement s'il ne peut pas


s'écrire comme réunion de deux ouverts non vides disjoints de E . C'est équivalent à
dire que les seuls sous-ensembles de E à la fois ouverts et fermés dans E sont E et
∅.

Une proposition intéressante liée à l'exponentielle mais sans rapport avec sa


surjectivité :

Proposition. GLn (C) n'admet pas de sous-groupes arbitrairement petits.

Démonstration. Par le théorème d'inversion locale appliqué à exp, il existe U voisi-


nage de 0 dans Mn (C) et V voisinage de e0 = In dans GLn (C) tels que exp réalise
un C 1 -diéomorphisme de U sur V .
On pose U 0 = 21 U et V 0 = exp(U 0 ). Alors V 0 est ouvert : en eet, exp réalise un
C 1 -diéomorphisme de U 0 sur V 0 et donc en notant ψ : V 0 → U 0 la réciproque de
exp qui est continue, on a V 0 = ψ −1 (U 0 ) qui est l'image réciproque de l'ouvert U 0
par ψ continue. De plus, V 0 est un voisinage de In .
Soit maintenant H un sous-groupe de GLn (C) inclu dans V 0 et soit M ∈ H . En
particulier, M ∈ V 0 et il existe A ∈ U 0 tel que M = eA . Si on suppose A 6= 0, il existe
k ∈ N tel que kA ∈ U \U 0 , et ainsi, exp(kA) = M k ∈ V \V 0 . On a donc M k 6∈ H ,
c'est qui est absurde, donc A = 0, M = In et H = {In }.

Références :
 Aucune.

89 || Romain Giuge
2.16. Théorème de Burnside

2.16 Théorème de Burnside


Théorème. Soit G un sous-groupe de GLn (C). Alors G est ni si et seulement si
G est d'exposant ni.

Démonstration. Le sens direct est immédiat : si G est ni de cardinal p, alors par le
théorème de Lagrange, Ap = In pour tout A ∈ G. Donc G est d'exposant e ni avec
e qui divise p.
Supposons maintenant que G est un sous-groupe d'exposant e ni. Alors le po-
lynôme P = X e − 1 annule tous les éléments de G. Or P est scindé à racines simples
dans C, donc tous les éléments de G sont diagonalisables. De plus, pour tout A ∈ G,
on sait que les racines du polynôme caractéristique χA sont aussi racines de tout
polynôme annulateur. Donc les racines de χA , qui sont les valeurs propres de A, sont
des racines de P , i .e. des racines e-ième de l'unité.
On va construire une application ϕ injective de G dans ϕ(G) avec ϕ(G) ni.
Ainsi on aura Card(G) 6 Card(ϕ(G)) < ∞.
On note Vect(G) le sous-espace vectoriel de Mn (C) engendré par G, qui est donc
de dimension nie. Les éléments de G forment une famille génératrice de Vect(G)
dont on peut extraire une famille libre C1 , . . . , Cr ∈ G, base de Vect(G). Soit

ϕ : G −→ Cr
A 7−→ (tr(AC1 ), . . . , tr(ACr )).

Montrons que Im(ϕ) est nie. Les valeurs propres de toute matrice A ∈ G sont des
racines e-ième de l'unité qui sont en nombre ni, donc {tr(A), A ∈ G} est ni. Mais
comme G est un groupe, ACi ∈ G pour tout i ∈ [[1, r]] et tout A ∈ G. Donc pour
tout i et tout A, tr(ACi ) ∈ {tr(B), B ∈ G}. Les tr(ACi ) ne peuvent donc prendre
qu'un nombre ni de valeurs, d'où Im(ϕ) est ni.

Montrons maintenant que ϕ est injectif. Soient A, B ∈ G tels que ϕ(A) = ϕ(B).
Alors pour tout i, tr(ACi ) = tr(BCi ). Pour M ∈ G ⊂ Vect(G), il existe α1 , . . . , αr
tels que M = α1 C1 + · · · + αr Cr et on a :
r
X r
X
tr(AM ) = αi tr(ACi ) = αi tr(BCi ) = tr(BM ).
i=1 i=1

Soit N = AB −1 − In . Comme A, B ∈ G et G est un groupe, AB −1 ∈ G, donc


diagonalisable. Donc N est diagonalisable (N = P DP −1 − In = P (D − In )P −1 ). Si
on montre que N est nilpotente, on aura alors N = 0, d'où ensuite A = B .
Supposons que tr(N p ) = 0 pour tout p ∈ [[1, n]] et montrons que dans ce cas, N
est nilpotente. Soit χN = X α (X − λ1 )α1 . . . (X − λr )αr le polynôme caractéristique

90 || Romain Giuge
2.16. Théorème de Burnside

de N , où les λi sont non nuls et deux à deux distincts, r 6 n. Pour tout p ∈ [[1, n]],
on a : r
X
p
tr(N ) = αi λpi = 0.
i=1

Si on suppose que N n'est pas nilpotente, alors 0 n'est pas la seule valeur propre
de N , et donc (α1 , . . . , αr ) est un zéro non trivial du système suivant d'inconnues
x1 , . . . , x r : 
 λ x + · · · + λr xr = 0
 1 1


..
(S) .


λr x + · · · + λr x = 0

1 1 r r

Donc le déterminant V de ce système est nul, soit :


   
λ1 λ2 . . . λr 1 1 ... 1
 2 2 2
λ1 λ2 . . . λr   λ1 λ2 ... λr 
 
V = det  .. .. .  = λ 1 . . . λr det  ..
 ..  = 0.
.. 
. . . . . ..   . . ... . 
r−1 r−1
λ1 λr2
r
. . . λrr
λ1 λ2 . . . λr−1
r

Or les λi étant non nuls et deux à deux distincts, V est non nul car multiple du déter-
minant de Vandermonde non nul associé aux scalaires λi . Donc N est nécessairement
nilpotente.
Montrons donc enn que tr(N p ) = 0 pour tout p ∈ [[1, n]]. Comme AB −1 et In
commutent, on a :
p  
−1
X p
p
N = (AB p
− In ) = (−1)p−k (AB −1 )k .
k=0
k

D'autre part, comme tr(AM ) = tr(BM ) pour tout M ∈ G, on a pour k ∈ [[1, n]],

tr((AB −1 )k ) = tr(AB −1 (AB −1 )k−1 )


= tr(BB −1 (AB −1 )k−1 )
= tr((AB −1 )k−1 ).

En itérant, on obtient tr((AB −1 )k ) = tr(In ) = n. D'où :


p  
p
X p
tr(N ) = (−1)p−k n = n(1 − 1)p = 0.
k=0
k

91 || Romain Giuge
2.16. Théorème de Burnside

Proposition. Pour A ∈ Mn (K), les racines du polynôme caractéristique χA sont


aussi racines de tout polynôme annulateur.
Démonstration. Si λ est racine de χA , alors λ est valeur propre de u, et on montre
facilement que λk est valeur propre de Ak . Par des combinaisons linéaires, on obtient
que P (λ) est valeur propre de P (A).
Si P est un polynôme annulateur de A, alors P (A) = 0. Mais P (λ) étant valeur
propre de P (A), nécessairement P (λ) = 0, d'où λ est racine de P .

Proposition. Soit A ∈ Mn (K). Si ΠA est un polynôme minimal de A, alors les


valeurs propres de A sont exactement les racines dans K de ΠA .
Démonstration. Le polynôme ΠA étant annulateur, les valeurs propres de A doivent
être des racines de ΠA d'après la proposition précédente.
Réciproquement, soit α une racine de ΠA : on écrit ΠA = (X − α)Q. Alors
ΠA (A) = (A − αIn )Q(A) = 0. Si α n'était pas valeur propre de A, A − αIn serait
injectif. Mais alors Im(Q(A)) ⊂ Ker(A−αIn ) = {0}, ce qui impliquerait que Q(A) =
0 et contredirait la minimalité de ΠA .

Références :
 Alessandri - Thèmes de géométrie - Page 113.

92 || Romain Giuge
2.17. Théorème de Cartan-Dieudonné

2.17 Théorème de Cartan-Dieudonné


Théorème (Cartan-Dieudonné vectoriel). Soient E un espace vectoriel euclidien de
dimension n et f ∈ O(E). On note F = Ker(f − Id) l'espace des éléments xés par
f et p(f ) = n − dim(F ). Alors f s'écrit comme produit de p(f ) réexions et on ne
peut pas faire moins.
Par convention, on dit que Id est le produit de 0 réexion.
Démonstration. Raisonnons par récurrence sur p(f ). Si p(f ) = 0, alors f = Id et
donc f est le produit de 0 réexions.
Supposons que p(f ) > 1 et que toute isométrie g telle que p(g) < p(f ) s'écrive
comme produit de p(g) réexions et pas moins. Comme p(f ) > 1, on a E = F ⊕ F ⊥
avec dim(F ⊥ ) > 1.
Notons E 0 = F ⊥ . Alors E 0 est stable par f car les isométries conservent l'orthogo-
nalité. Donc f 0 = f|E 0 est une isométrie de E 0 . Comme dim(E 0 ) > 1, il existe x0 6= 0
tel que x0 ∈ E 0 , et on a f 0 (x0 ) 6= x0 (sinon x0 ∈ F ). Mais f 0 étant une isométrie, on a
kf 0 (x0 )k = kx0 k. Soit alors la réexion s0 par rapport à H 0 = Vect(f 0 (x0 ) − x0 )⊥ hy-
perplan de E 0 (on travaille dans E 0 et on prend l'orthogonal dans E 0 ). Cette réexion
vérie
s0 ◦ f 0 (x0 ) = x0
car s0 (f 0 (x0 ) − x0 ) = −(f 0 (x0 ) − x0 ) et s0 (f 0 (x0 ) + x0 ) = f 0 (x0 ) + x0 : l'élément
f 0 (x0 ) + x0 est xé par s0 car il est dans H 0 , puisque (f 0 (x0 ) + x0 , f 0 (x0 ) − x0 ) =
kf 0 (x0 )k2 − kx0 k2 = 0.
On prolonge s0 sur E tout entier en posant s0 (x) = x si x ∈ F , et s0 est maintenant
une réexion de E . On note g = s0 ◦ f qui est une isométrie de E car une composée
d'isométries conserve encore la norme. Par construction, on a Vect(x0 ) ⊂ Ker(g −Id)
et F ⊂ Ker(g − Id), donc p(g) 6 p(f ) − 1. On applique l'hypothèse de récurrence à
g : il existe des réexions si de E telles que

g = s0 ◦ f = s1 ◦ · · · ◦ sp(g) .

Donc, comme s0 ◦ s0 = Id, on obtient f = s0 ◦ s1 ◦ · · · ◦ sp(g) .

On vient de prouver qu'on peut décomposer f en produit de réexions. Il reste à


faire le lien avec p(f ). Soit q le nombre minimal de réexions qu'on peut utiliser pour
décomposer f . On a déjà q 6 p(g) + 1, et on avait plus haut que p(g) 6 p(f ) − 1,
donc q 6 p(f ). On écrit ensuite f = s1 ◦ · · · ◦ sq avec si réexion par rapport à un
hyperplan Hi . On a d'une part l'inclusion qi=1 Hi ⊂ F , et d'autre part qi=1 Hi =
T T

93 || Romain Giuge
2.17. Théorème de Cartan-Dieudonné

Vect(x1 , . . . , xq )⊥ si on écrit Hi = Vect(xi )⊥ . On obtient :


q
!
\
dim Vect(x1 , . . . , xq )⊥ = dim

Hi 6 dim(F ) = n − p(f ).
| {z } i=1
>n−q

On en déduit que q > p(f ), soit nalement q = p(f ).

Théorème (Cartan-Dieudonné ane). Soient E un espace ane euclidien et ϕ une


isométrie de E . Alors :
(i) Si ϕ a un point xe, ϕ peut s'écrire comme produit de p(→−ϕ ) réexions anes.
(ii) Si ϕ n'a pas de point xe, ϕ peut s'écrire comme produit de p(→−
ϕ ) + 2 réexions


anes. On a de plus p( ϕ ) < n.
(on pourrait montrer qu'on ne peut pas écrire ϕ comme produit de moins de réexions
qu'annoncé ci-dessus).
Démonstration. (i) Il existe A ∈ E tel que ϕ(A) = A. On a alors, pour tout
M ∈ E,
−−→
ϕ(M ) = A + →

ϕ (AM ).
Par le théorème de Cartan-Dieudonné vectoriel, on peut écrire →

ϕ =→−
s1 ◦· · ·◦ →

sp

− →

avec p = p( ϕ ) et les si sont des réexions vectorielles par rapport à des
−−→
hyperplans vectoriels Hi . On note si : M 7→ A + →−
si (AM ) la réexion ane
d'hyperplan ane associé l'hyperplan passant par A de direction l'hyperplan
vectoriel Hi . Comme A est xé par toutes ces réexions anes, on obtient :

ϕ(M ) = s1 ◦ · · · ◦ sp (M ),

pour tout M ∈ E . En eet, on a :


−−−−−→


s1 ◦ s2 (M ) = A + s1 As2 (M )
−−−−−−−−→
= A+→ −
s1 s2 (A)s2 (M )
 −−→ 
= A+→ −
s1 →−s2 (AM )
−−→
= A+→ −
s1 ◦ →

s2 (AM ).

(ii) Soit A ∈ E . Par hypothèse, ϕ(A) 6= A car ϕ ne xe aucun point. Soient H
l'hyperplan médiateur de [A, ϕ(A)] et σ la réexion par rapport à H . Alors
σ ◦ ϕ(A) = A. D'après le cas précédent, σ ◦ ϕ s'écrit comme produit d'au plus
p(−σ−◦−→
ϕ) 6 n réexions. En composant par σ , on obtient que ϕ est produit
d'au plus n + 1 réexions.

94 || Romain Giuge
2.17. Théorème de Cartan-Dieudonné

D'autre part, on peut écrire ϕ = τ ◦ ψ où τ est une translation et ψ une




isométrie ane possédant un point xe. De plus, → −
ϕ = ψ , donc ψ s'écrit
comme produit de p(→ −
ϕ ) réexions. Il est clair que τ s'écrit comme produit de
deux réexions. Donc ϕ s'écrit comme produit de p(→ −
ϕ ) + 2 réexions, et on
a, par ce qu'on a dit juste au-dessus, que p( ϕ ) + 2 6 n + 1, i .e. p(→

− −
ϕ ) < n.

Compléments :
Montrons qu'on ne peut pas écrire ϕ comme produit de moins de réexions
qu'annoncé dans le théorème de Cartan-Dieudonné ane.
On écrit ϕ = s1 ◦ · · · ◦ sk . Alors →

ϕ =→−
s1 ◦ · · · ◦ →

sk , donc k > p(→

ϕ ). Ce qui prouve
le résultat pour le point (i).
Pour le point (ii), on suppose que k < p(→ −ϕ ) + 2. Comme le déterminant d'une

− −

réexion vaut −1, on a det( ϕ ) = (−1) = (−1)p( ϕ )+2 puisqu'on sait qu'on peut
k

écrire un produit de p(→ −ϕ ) + 2 réexions. Donc nécessairement k = p(→ −


ϕ ) < n.


Soient Hi l'hyperplan associé à si et Hi l'hyperplan associé à si . On note F =
∩Hi et F = ∩Hi . Soit ψi ∈ E ∗ telle que Hi = Ker(ψi ). Le point M appartient à
−−→ −−→ −−→ −−→
Hi = Ai + Hi SSi Ai M ∈ Hi , SSi ψi (Ai M ) = 0, SSi ψi (Ai A) + ψi (AM ) = 0 pour un
−−→
point A xé dans E , SSi il existe βi tel que ψi (AM ) = βi . D'où :
−−→
F = {M ∈ E / ψi (AM ) = βi , pour tout i}.

On a dim(F ) > n − k (intersection d'hyperplans), et F ⊂ Ker(→ −ϕ − Id). Or


dim(Ker(→ −ϕ − Id)) = n − k : en eet, d'après le théorème de Cartan-Dieudonné
vectoriel, dim(Ker(→ −
ϕ − Id)) = n − p(→ −
ϕ ) et on a ici k = p(→ −ϕ ). Ainsi, dim(F ) =
n − k , et donc les formes linéaires ψi sont indépendantes. On complète les ψi en
une base (ψ1 , . . . , ψn ) de E ∗ , de base anté-duale (e1 , . . . , en ). Soit M ∈ E tel que
−−→ −−→
OM = β1 e1 + . . . βn en . Alors ψi (OM ) = βi , pour tout i. On vient donc de prouver
que F n'est pas vide. Mais tout point de F est point xe de ϕ et ϕ n'a pas de point
xe : c'est absurde.

Dénition. On note O(E) l'ensemble des isométries vectorielles d'un espace vec-
toriel euclidien E . Il s'agit de l'ensemble des applications linéaires conservant le
produit scalaire.

Dénition. On appelle réexion une symétrie orthogonale par rapport à un hyper-


plan.

95 || Romain Giuge
2.17. Théorème de Cartan-Dieudonné

Proposition. Soient a et b deux vecteurs distincts d'un espace euclidien E tels que
kak = kbk. Alors il existe une unique réexion échangeant a et b.

Démonstration. Unicité : si σ est une réexion par rapport à un hyperplan H et


échangeant a et b, alors σ(a − b) = b − a et donc H = Vect(b − a)⊥ .
Existence : soient H = Vect(b − a)⊥ et σ la réexion par rapport à H . Alors
σ(a − b) = b − a. D'autre part, on a

(a + b, a − b) = kak2 − kbk2 = 0

par l'hypothèse kak = kbk. Donc a + b ∈ H et σ(a + b) = a + b. On en déduit


σ(a) = 12 σ(a + b) + 12 σ(a − b) = b et σ(b) = a. La réexion σ est solution.

Théorème. Pour toute isométrie f de E , il existe un unique couple (t, h) avec t


translation de E et h isométrie de E tel que h a un point xe et f = h ◦ t = t ◦ h.
Proposition. Soit t une translation de E de vecteur →

u . Si (F, F ) est un sous-espace
de E tel que →−
u ∈ F ⊥ et si G = F + 12 →

u , alors t = σG ◦ σF . En particulier, toute
translation est composée de deux réexions.

Références :
 Cognet - Algèbre bilinéaire - page 96.
 Tauvel - Cours de géométrie - page 97 (pour Cartan-Dieudonné ane).

96 || Romain Giuge
2.18. Théorème de Chevalley-Warning

2.18 Théorème de Chevalley-Warning


Théorème. Soient d, n ∈ N∗ et p un nombre premier. On note q = pd , et pour
P1 , . . . , Pr ∈ Fq [X1 , . . . , Xn ],

Z(P1 , . . . , Pr ) = x ∈ Fnq / Pi (x) = 0, ∀i ∈ [[1, r]] .




Alors si deg(Pi ) < n, on a :


Pr
i=1

Card(Z(P1 , . . . , Pr )) ≡ 0 [p].

Démonstration. Soient P1 , . . . , Pr ∈ Fq [X1 , . . . , Xn ] tels que


Pr
i=1 deg(Pi ) < n. On
introduit le polynôme :
r
Y
S(X1 , . . . , Xn ) = (1 − Pi (X1 , . . . , Xn )q−1 ) ∈ Fq [X1 , . . . , Xn ].
i=1

Si x ∈ Z(P1 , . . . , Pr ), alors Pi (x) = 0 pour tout i. Donc S(x) = 1.


Si x 6∈ Z(P1 , . . . , Pr ), alors il existe i tel que Pi (x) 6= 0. En particulier, Pi (x) ∈ F∗q ,
donc Pi (x)q−1 = 1 et on en déduit S(x) = 0. Au nal :

1 si x ∈ Z(P , . . . , P )
1 r
S(x) =
0 sinon,

d'où :
X
S(x) = Card(Z(P1 , . . . , Pr ))1Fq .
x∈Fn
q

D'autre part, S ∈ Fq [X1 , . . . , Xn ] s'écrit sous la forme


X
S= cα X1α1 . . . Xnαn ,
α=(α1 ,...,αn )∈Nn

où seulement un nombre ni de cα ∈ Fq sont non nuls. On obtient :


X X X
S(x) = cα xα1 1 . . . xαnn
x∈Fn
q x=(x1 ,...,xn )∈Fn
q α=(α1 ,...,αn )∈N
n
X X X
= cα xα1 1 . . . xαnn
α=(α1 ,...,αn )∈Nn x1 ∈Fq xn ∈Fq
X n
Y X
= cα xα0 i .
α=(α1 ,...,αn )∈Nn i=1 x0 ∈Fq

On majore maintenant le degré de S :


r
X r
X r
X
deg(S) = deg(1 − Piq−1 ) 6 deg(Piq−1 ) = (q − 1) deg(Pi ) < n(q − 1),
i=1 i=1 i=1

97 || Romain Giuge
2.18. Théorème de Chevalley-Warning

cette dernière inégalité stricte étant donnée par l'hypothèse du théorème. Cette
majoration implique que pour tout monôme X1α1 . . . Xnαn apparaissant dans l'écri-
ture de S , il existe i ∈ [[1, n]] tel que αi < q − 1, car sinon on aurait deg(S) >
deg(X1α1 . . . Xnαn ) = ni=1 αi > n(q − 1). Pour un tel i, on a αi = 0 ou q − 1 - αi , et
P

nous démontrerons juste après que cela implique :


X n X
Y
xα0 i = 0, et donc xα0 i = 0
x0 ∈Fq i=1 x0 ∈Fq

pour tout α = (α1 , . . . , αn ) ∈ Nn tel que cα 6= 0. Finalement, il vient :


X
S(x) = 0 = Card(Z(P1 , . . . , Pr ))1Fq ,
x∈Fn
q

et comme Fq est de caractéristique p,

Card(Z(P1 , . . . , Pr )) ≡ 0 [p].

Démontrons maintenant le point manquant :

Proposition. Soient d ∈ N∗ et p un nombre premier. On note q = pd . Alors :



X 0 si m = 0 ou si q − 1 - m
xm =
−1 sinon.
x∈Fq

Démonstration. Si m = 0, alors pour tout x ∈ Fq , x0 = 1, d'où le résultat :


x0 = q = 0 dans Fq .
P
x∈Fq
Supposons maintenant q − 1 - m. Le groupe F∗q est un groupe cyclique dont on
note g un générateur. Comme l'application

f : Fq −→ Fq
x 7−→ gx
est bijective, il vient :
X X X
xm = (gx)m = g m xm ,
x∈Fq x∈Fq x∈Fq

soit encore
X
(1 − g m ) xm = 0.
x∈Fq

Mais g étant un générateur de F∗q , g est d'ordre q − 1, avec q − 1 - m, donc g m 6= 1.


Le corps Fq étant intègre, on conclut nalement :
X
xm = 0.
x∈Fq

98 || Romain Giuge
2.18. Théorème de Chevalley-Warning

Si on suppose maintenant q − 1 | m, il existe k ∈ Z tel que m = (q − 1)k . Or pour


tout x ∈ F∗q , xq−1 = 1. Donc xm = 1. Comme 0m = 0, on obtient :
X X X
xm = xm = 1 = q − 1 = −1
x∈Fq x∈F∗q x∈F∗q

dans Fq de caractéristique p où on a q = 0.

Si on a le temps, on peut donner le corollaire et l'application ci-après :


Corollaire. Soient d, n ∈ N∗ et p un nombre premier. On note q = pd . Soient
P1 , . . . , Pr ∈ Fq [X1 , . . . , Xn ] tels que :
(i) Chaque Pi est sans terme constant.
(ii) ri=1 deg(Pi ) < n.
P

Alors les Pi admettent un zéro commun non trivial.


Démonstration. Comme Pi est sans terme constant, Pi (0, . . . , 0) = 0, et donc 0Fnq
est un zéro commun à tous les Pi . On en déduit que

Card(Z(P1 , . . . , Pr )) > 1.

D'après le théorème de Chevalley-Warning,

Card(Z(P1 , . . . , Pr )) ≡ 0 [p].

Donc Card(Z(P1 , . . . , Pr )) > p > 2 et il existe un autre zéro que 0Fnq commun à tous
les Pi .
Application. Toute forme quadratique sur un Fq -espace vectoriel de dimension > 3
est isotrope, i.e. admet un zéro non trivial.
Démonstration. Soit Q une forme quadratique sur E un Fq -espace vectoriel de di-
mension n > 3, i .e. Q ∈ Fq [X1 , . . . , Xn ]. Par dénition d'une forme quadratique,
Q est un polynôme homogène de degré 2. On applique le corollaire précédent avec
r=1:
(i ) Q est sans terme constant car homogène de degré 2.
(ii ) deg(Q) = 2 < n.
Donc Q admet un zéro non trivial.

Références :
 Jean-Pierre Serre - Cours d'arithmétique - Page 13.

99 || Romain Giuge
2.19. Théorème de Frobenius-Zolotarev

2.19 Théorème de Frobenius-Zolotarev


Théorème. Soient p un nombre premier > 3 et V un espace vectoriel de dimension
nie n sur Fp . Soit u ∈ GL(V ). Si ε(u) désigne la signature de u en tant qu'élément
de Spn , alors  
det(u)
ε(u) = ,
p
 
où a
p
désigne le symbole de Legendre égal à 1 si a est un carré dans Fp , −1 sinon.
Démonstration. On regarde GL(V ) comme sous-groupe de Spn : la signature ε induit
un morphisme de groupes de GL(V ) sur {−1, 1} par restriction. On note D(GL(V ))
le groupe dérivé de GL(V ) engendré par les commutateurs [u, v] = uvu−1 v −1 . Alors
comme {−1, 1} est un groupe commutatif, D(GL(V )) ⊂ Ker(ε) et donc le théorème
de factorisation nous permet d'écrire ε = ε ◦ Π avec

ε : GL(V )/D(GL(V )) → {−1, 1}

et Π la projection canonique de GL(V ) sur GL(V )/D(GL(V )).


Or D(GL(V )) = SL(V ). En eet, on a clairement D(GL(V )) ⊂ SL(V ). Pour
l'inclusion inverse, on sait que SL(V ) est engendré par les transvections (on le montre
par l'algorithme du pivot de Gauss), donc il sut de montrer que toute transvection
est un commutateur. Or toutes les transvections de GL(V ) sont conjuguées : dans
une bonne base, la matrice d'une transvection est :
 
1 ... ... 0
. . .. 
 .. . . .
,
 
.
.
. 1 1

0 ... ... 1

en échangeant correctement les vecteurs de la base et en leur faisant subir des ho-
mothéties. Soit u ∈ GL(V ) une transvection, u = In + λEij avec i 6= j . On a :

u2 = (In + λEij )2 = In + 2λEij + λ2 Eij2 = In + 2λEij .


|{z}
=δji Eij =0

Comme p > 3, la caractéristique de Fp est diérente de 2, donc u2 est encore


une transvection. Donc il existe v ∈ GL(V ) tel que u2 = vuv −1 , soit encore u =
vuv −1 u−1 , i .e. u est un commutateur.
Par ailleurs, le morphisme surjectif det : GL(V ) → F∗p a pour noyau SL(V )
par dénition. Par le théorème de factorisation, il existe det : GL(V )/SL(V ) → F∗p
isomorphisme tel que det = det ◦ Π.

100 || Romain Giuge


2.19. Théorème de Frobenius-Zolotarev

−1
On obtient nalement un morphisme δ = ε ◦ det : F∗p → {−1, 1} tel que
δ ◦ det = ε. Le but est de montrer que δ est le symbole de Legendre.
 
On note d'abord que p· : F∗p → {−1, 1} est un morphisme (il est multiplicatif)
et qu'il est non trivial. En eet, il vaut −1 sur les générateurs de F∗p (on sait que F∗p
est cyclique) : si g est un générateur de F∗p , g est d'ordre p − 1, et si g était un carré,
p−1
on aurait g = h2 , donc g 2 = hp−1 = 1, ce qui contredirait la dénition de l'ordre.
Mais comme F∗p est cyclique, tout morphisme de groupes de F∗p sur {−1, 1} est
déterminé par l'image d'un générateur : il n'y en a donc que deux, qui sont le
morphisme trivial et le symbole de Legendre.
Il reste à montrer que δ n'est pas le morphisme trivial. Comme V est un Fp -espace
vectoriel de dimension n, on a V ∼ = Fnp ∼
= Fpn = Fq . On prend g un générateur de F∗q
et on considère
ϕ : Fq −→ Fq
x 7−→ gx
qui est une application Fp -linéaire. Donc ϕ ∈ GL(V ). De plus, ϕ est égal en tant
que permutation au cycle (1, g, g 2 , . . . , g q−2 ) qui est de longueur paire q − 1, donc
ε(ϕ) = −1. Comme ε = δ◦det, on a δ(det(ϕ)) = −1 et donc δ n'est pas le morphisme
trivial.
Finalement, δ ne peut être que le symbole de Legendre, d'où le résultat.

Comme V est un Fp -espace vectoriel de dimension n sur Fp , V est un espace de


cardinal pn . Donc tout u ∈ GL(V ) est une bijection de V sur V qui peut être vue
comme une permutation de Spn . Donc GL(V ) est isomorphe à un sous-groupe de Spn .
Mais on n'a pas GL(V ) ∼ = Spn pour des raisons de cardinal : GL(V ) ∼
= GLn (Fp ) ⊂
2
Mn (Fp ), donc Card(GL(V )) 6 Card(Mn (Fp )) = pn , et comme Card(Spn ) = (pn )!,
2
on aurait (pn )! 6 pn , ce qui n'est pas le cas. En eet :

(pn )! = 1 . . . p(p + 1) . . . p2 (p2 + 1) . . . pn


= kp(p + 1)p2 (p2 + 1)pn−1 (pn−1 + 1)pn
> kppp2 p2 . . . pn−1 pn−1 pn
n(n+1) n(n−1) 2
= kp 2 p 2 = kpn ,

et on voit bien que k > 1.

Proposition. Le groupe dérivé de G est un sous-groupe distingué de G.

101 || Romain Giuge


2.19. Théorème de Frobenius-Zolotarev

Démonstration. Il s'agit de montrer que si g ∈ G et [x, y] = xyx−1 y−1 ∈ D(G), alors


g[x, y]g −1 ∈ D(G). On a le résultat en écrivant :

g[x, y]g −1 = (gxg −1 )(gyg −1 )(gx−1 g −1 )(gy −1 g −1 ) = [gxg −1 , gyg −1 ].

Cela revient aussi à dire que D(G) est stable par les automorphismes intérieurs, i .e.
les ig : x 7→ gxg −1 .

Proposition. Le symbole de Legendre est un morphisme.


Démonstration. Dans le document Théorème des deux carrés, on montre que
n q−1
o
F∗2
q = x ∈ Fq / x 2 =1 .
 p−1
2
On prend ici q = p. Comme x = xp−1 = 1 et que le polynôme X 2 − 1 admet
2

au plus deux racines (qui sont en fait 1 et −1), alors pour tout x ∈ F∗p , on a soit
p−1 p−1
x 2 = 1 (lorsque x est un carré), soit x 2 = −1 (lorsque x n'est pas un carré).
Donc  
x p−1
=x 2 .
p
Ainsi il s'agit bien d'un morphisme :
    
ab p−1 p−1 p−1 a b
= (ab) 2 = a 2 b 2 = .
p p p

Références :
 Beck, Malick, Peyré - Objectif Agrégation - Page 251.

102 || Romain Giuge


2.20. Théorème de Krein-Milman

2.20 Théorème de Krein-Milman


Proposition. Soit E un espace euclidien et C un convexe fermé non vide de E .
On note p la projection sur C (qui est continue, voir document "Projection sur un
convexe fermé"). Soit c un point de la frontière de C . Alors il existe un hyperplan
d'appui de C en c.
Démonstration. Le point c est adhérent à E\C , donc il existe une suite (xk ) de E\C
qui converge vers c. Par continuité de p, la suite p(xk ) converge vers p(c) = c. On
sait de plus qu'en chacun des points p(xk ), on dispose d'un hyperplan d'appui dont
un vecteur normal unitaire est
xk − p(xk )
uk = .
kxk − p(xk )k
La suite (uk ) est dans la sphère unité de E qui est compacte, on peut donc en extraire
une sous-suite convergente, qu'on appellera encore (uk ). On note u sa limite et on
considère l'hyperplan ane

H = {x ∈ E / (u, x) = (u, c)}.

Cet hyperplan contient c et on va montrer qu'il s'agit d'un hyperplan d'appui en c.


Soit z ∈ C . Pour tout k ∈ N, on a

(uk , z − p(xk )) 6 0.

En passant à la limite quand k → ∞, on obtient (u, z −p(c)) 6 0, i .e. (u, z) 6 (u, c).
Ceci prouve que C est inclu dans un des demi-espaces fermés délimité par H et H
est donc un hyperplan d'appui.

Théorème (Krein-Milman). Soit E un espace euclidien et K un convexe compact


non vide de E . Alors K est égal à l'enveloppe convexe de l'ensemble de ses points
extrémaux.
Démonstration. On commence par montrer un résultat préliminaire : soit a ∈ K tel
que a appartienne à un hyperplan d'appui H de K . Alors a est un point extrémal
de K si et seulement si a est un point extrémal du convexe compact K ∩ H .
D'abord, K ∩ H est non vide (il contient a), convexe (intersection de deux
convexes), et compact (intersection du compact K et du fermé H ).
On suppose que a est un point extrémal de K . Alors K\{a} est convexe, donc
K\{a} ∩ H = (K ∩ H)\{a} aussi comme intersection de deux convexes. Par consé-
quent, a est un point extrémal de K ∩ H .
Réciproquement, on suppose que a est un point extrémal de K ∩ H . Soient
u, v ∈ K tels que a = u+v 2
. On veut montrer que u = v = a. Soit ϕ une forme

103 || Romain Giuge


2.20. Théorème de Krein-Milman

linéaire sur E telle que H = {x ∈ E / ϕ(x) = λ}. Comme K est contenu dans un
demi-espace fermé délimité par H , on a par exemple ϕ(u) 6 λ et ϕ(v) 6 λ. Mais
ϕ(a) = ϕ(u)+ϕ(v)
2
= λ, donc nécessairement ϕ(u) = ϕ(v) = λ, ce qui signie que u et
v sont dans H , donc dans K ∩ H . Par conséquent, comme a est un point extrémal
de K ∩ H , on a u = v = a.

On va montrer que K est l'enveloppe convexe de l'ensemble de ses points extré-


maux par récurrence sur la dimension p du sous-espace ane engendré par K . Si
p = 0, alors K est un singleton et le résultat est immédiat. On suppose le résultat
vrai jusqu'au rang p − 1 et on se donne un convexe compact K qui engendre un
sous-espace ane de dimension p. Quitte à translater K et à remplacer E par un de
ses sous-espaces vectoriels, on peut supposer que dim(E) = p (on regarde K comme
convexe compact de l'espace vectoriel engendré par ses éléments). Soit c ∈ K . On
cherche à écrire c comme combinaison convexe de points extrémaux de K .
Distinguons deux cas :
(i) Si c appartient à la frontière de K , par la proposition précédente, il existe
un hyperplan d'appui H de K en c. On pose K 0 = K ∩ H . Il s'agit d'un
convexe compact qui engendre un sous-espace ane de dimension 6 p − 1
(car dim(H) = p − 1 puisqu'on a supposé que dim(E) = p) auquel on peut
appliquer l'hypothèse de récurrence. Comme les points extrémaux de K 0 sont
des points extrémaux de K d'après le premier résultat montré au-dessus, c est
bien combinaison convexe de points extrémaux de K .
(ii) Si maintenant c est intérieur à K , on considère une droite quelconque D qui
passe par c. Alors D ∩ K est une partie convexe de D qui est de plus compact
(car D est fermée). Il s'agit donc d'un segment [a, b]. Les points a et b sont
clairement sur la frontière de K et on peut appliquer le cas précédent. Par
associativité, c est barycentre à coecients positifs de points extrémaux de K .

Soient E un espace euclidien et K une partie non vide, convexe et fermée de


E . D'après le théorème de projection sur un convexe fermé, pour tout x ∈ E , il
existe un unique point p(x) ∈ K tel que d(x, K) = kx − p(x)k. De plus, on a
(x − p(x), y − p(x)) 6 0 pour tout y ∈ K , ce qui signie que si x 6∈ K , l'hyperplan
ane H passant par p(x) et de vecteur normal x − p(x) sépare K et x. En eet, on
a
H = {y ∈ E / (x − p(x), y − p(x)) = 0}

104 || Romain Giuge


2.20. Théorème de Krein-Milman

et K ⊂ {y ∈ E / (x − p(x), y − p(x)) 6 0} alors que (x − p(x), x − p(x)) =


kx − p(x)k2 > 0.

Dénition. On dit que H est un hyperplan d'appui de K en p(x).

Remarque. Il n'y a pas nécessairement unicité de l'hyperplan d'appui en un point :


par exemple dans le plan, lorsque c est l'un des sommets d'un carré.

Dénition. Un point x d'un convexe X est dit extrémal si X\{x} est encore
convexe. Cela équivaut à dire que x ne peut pas s'écrire comme milieu de deux
points distincts de X .

Exemple. Les points extrémaux d'un carré plein de R2 sont ses quatre sommets.

Références :
 Francinou, Gianella, Nicolas - Oraux X-ENS, Analyse 3 - Page 101.

105 || Romain Giuge


2.21. Théorème de Kronecker

2.21 Théorème de Kronecker


Théorème. Soit P ∈ Z[X] unitaire tel que P (0) 6= 0. On suppose que les racines
complexes α1 , . . . , αn de P sont de module 6 1. Alors les αi sont des racines de
l'unité.
Démonstration. On note σ1 , . . . , σn les fonctions symétriques élémentaires en les αi .
Par les relations coecients-racines, sachant que P est unitaire, on a :

P = X n − σ1 X n−1 + · · · + (−1)n σn .

Les σi sont dans Z car P ∈ Z[X]. Comme |αi | 6 1 pour tout i, on a :


 
X X n
|σk | = αi1 . . . αik 6 1= .
16i1 <···<ik 6n 16i1 <···<ik 6n
k

On note Ωn l'ensemble des polynômes unitaires de Z[X] de degré n dont les racines
complexes sont de module 6 1. La majoration précédente montre qu'il n'y a qu'un
nombre ni de choix pour les coecients de P (les σi sont entiers et bornés). Donc
Ωn est ni.
On dénit maintenant, pour k ∈ N∗ , les polynômes Pk et Qk par
n
Y
Pk (X) = (X − αik ) et Qk (X, Y ) = X k − Y ∈ Z[X, Y ].
i=1

On pose Rk = ResX (P, Qk ) le résultant des polynômes P et Qk vus comme poly-


nômes à coecients dans Z[Y ], de l'indéterminée X . On a donc Rk ∈ Z[Y ]. De plus,
la relation entre le résultant et les racines des polynômes nous donne :
n
Y n
Y
Rk = Qk (αi ) = (αik − Y ) = (−1)n Pk (Y ).
i=1 i=1

Finalement, Pk (X) = (−1)n Rk (X) ∈ Z[X]. Comme |αi | 6 1, on a encore |αi |k 6 1,


d'où enn : Pk ∈ Ωn , pour tout k ∈ N∗ .
Comme Ωn est ni et que chaque polynôme de Ωn admet au plus n racines
complexes distinctes, l'ensemble des racines des polynômes de Ωn est ni. Donc
{αik , k ∈ N∗ } est ni pour tout i. Par conséquent, pour tout i, il existe p 6= q , par
exemple p > q , tels que αip = αiq . Comme P (0) 6= 0, on a αi 6= 0, et donc αip−q = 1.
Les αi sont donc des racines de l'unité.

Application. En gardant les mêmes hypothèses que le théorème précédent, on a de


plus : si P est irréductible, alors P est un polynôme cyclotomique.

106 || Romain Giuge


2.21. Théorème de Kronecker

Démonstration. D'après le théorème précédent, les racines αi de P sont des racines


de l'unité, disons racines li -ième de l'unité. Comme P est irréductible sur Z et
unitaire, il est irréductible sur Q. Et comme Q est de caractéristique nulle, c'est un
corps parfait, donc P étant irréductible, il est scindé à racines simples sur C.
On peut aussi dire que P étant irréductible sur Q, P et P 0 sont premiers entre
eux dans Q[X]. Donc il existe U, V ∈ Q[X] tels que P U + P 0 V = 1. Cette relation
étant vraie dans C[X], P et P 0 sont premiers entre eux dans C[X], donc n'ont pas
de racine commune, et donc P est scindé à racines simples sur C.

Notons m = PPCM(l1 , . . . , ln ). Alors pour tout i, αi est racine de X m − 1 =


d|m Φd (X). Comme les racines αi de P sont simples, P divise X − 1 dans C[X] :
m
Q

on écrit X m − 1 = P Q avec Q ∈ C[X]. En développant, on voit directement que les


coecients de Q sont dans Q. Donc P divise X m − 1 dans Q[X]. Enn, comme P
est unitaire et irréductible sur Q et que les Φd aussi, il existe d diviseur de m tel que
P = Φd .

Remarque. Dans la démonstration du théorème, on peut ne pas utiliser le résultant


pour montrer que Pk ∈ Z[X]. On peut voir Pk comme un polynôme symétrique en
les αi , à coecients dans Z[X]. D'après le théorème de structure des polynômes
symétriques, il est égal à un polynôme en les fonctions symétriques élémentaires des
αi , à coecients dans Z[X]. Mais les fonctions symétriques élémentaires des αi sont
dans Z d'après les relations coecients-racines et le fait que P soit unitaire. Donc
Pk ∈ Z[X].

Théorème (Structure des polynômes symétriques). Soient A un anneau et P ∈


A[X1 , . . . , Xn ] symétrique. Alors il existe un unique polynôme Q ∈ A[X1 , . . . , Xn ]
tel que
P (X1 , . . . , Xn ) = Q(Σ1 , . . . , Σn ),
où les Σi sont les polynômes symétriques élémentaires de A[X1 , . . . , Xn ].

Théorème. Soit K une clotûre algébrique d'un corps K . On note x1 , . . . , xm les


racines de P = i=0 ai X i ∈ K[X] et y1 , . . . , yn celles de Q = nj=0 bj X j ∈ K[X].
Pm P

On a alors :
Y m
Y n
Y
ResX (P, Q) = anm bm
n (xi − yj ) = anm Q(xi ) = (−1)mn bm
n P (yj ).
16i6m i=1 j=1
16j6n

107 || Romain Giuge


2.21. Théorème de Kronecker

Démonstration. On a P = am (X − x1 ) . . . (X − xm ) et Q = bn (X − y1 ) . . . (X − yn )
qu'on regarde comme polynômes de A = Z[am , bn , x1 , . . . , xm , y1 , . . . , yn , X]. Il s'agit
de montrer que xi − yj divise ResX (P, Q) ∈ Z[am , bn , x1 , . . . , xm , y1 , . . . , yn ]. Pour se
xer les idées, on prend i = 1 et j = 1, et on eectue la division euclidienne par
x1 − y1 , par rapport à l'indéterminée x1 :

ResX (P, Q) = (x1 − y1 )S + T

avec T ∈ Z[am , bn , x2 , . . . , xm , y1 , . . . , yn ]. On spécialise les indéterminées en les choi-


sissant dans C2+m+n telles que x1 = y1 . Alors P et Q ont une racine commune, ils
ne sont donc pas premiers entre eux, donc leur résultant est nul. On obtient alors
T (am , bn , x2 , . . . , xm , y1 , . . . , yn ) = 0 pour tout am , bn , x2 , . . . , yn ∈ C. Donc T est le
polynôme nul et on a le résultat.
Les xi − yj sont deux à deux premiers entre eux dans A et ils divisent tous
R = ResX (P, Q). Remarque : on les regarde en tant qu'indéterminées, il n'y a donc
pas de problème selon qu'il existe des racines multiples ou des racines nulles. Par
factorialité de A (car Z est factoriel), le produit i,j (xi − yj ) divise R :
Q

Y
R=F (xi − yj ).
i,j

Le coecient constant de Q (vu dans K[X]) vaut (−1)n bn y1 . . . yn et ses autres


coecients sont de degré strictement plus petit en les yi . On se rend donc compte
en développant le déterminant de la matrice de Sylvester que la partie homogène
de plus haut degré en les yi de R est donnée par la diagonale, que l'on trouve égale
à anm bm
0 = am ((−1) bn y1 . . . yn ) . Comme la partie homogène de plus haut degré
n n m

en les yi de i,j (xi − yj ) vaut (−1)nm (y1 . . . yn )m , on en déduit F = anm bm


n (une
Q

considération sur les degrés montre que F ne dépend ni des xi , ni des yj ), d'où le
résultat.

Références :
 Szpirglas - Mathématiques L3 Algèbre - Page 573.
 Francinou, Gianella, Nicolas - Oraux X-ENS, Algèbre 1 - Page 213.

108 || Romain Giuge


2.22. Théorème de Pascal

2.22 Théorème de Pascal


Théorème. Soit C une conique propre. On xe six droites distinctes L1 , L2 , L3 ,
M1 , M2 , M3 telles que pour tout i, j ∈ {1, 2, 3}, i 6= j , les droites Li et Mj se coupent
en un point de C . Alors les trois points pi = Li ∩ Mi , i ∈ {1, 2, 3} sont alignés.

Démonstration. Fixons un repère du plan : on notera (x, y) les coordonnées d'un


point dans ce repère. Pour tout i ∈ {1, 2, 3}, on note li = 0 (resp. mi = 0) l'équation
de la droite Li (resp. Mi ) : les li et mi sont des polynômes de degré 1 en x, y . On
introduit le polynôme fλ suivant, dépendant d'un paramètre λ ∈ R :

fλ = l1 l2 l3 + λm1 m2 m3 .

Montrons que fλ est de degré exactement 3 en x, y . Supposons que son degré soit
< 3. On écrit li = ai x + bi y + ci et mi = αi x + βi y + γi . Alors la partie homogène de
degré 3 de fλ est

(a1 x + b1 y)(a2 x + b2 y)(a3 x + b3 y) + λ(α1 x + β1 y)(α2 x + β2 y)(α3 x + β3 y).

Comme elle est nulle, que R[x, y] est factoriel, et que les ai x + bi y et αi x + βi y sont
irréductibles dans R[x, y], on obtient que pour tout i, il existe j tel que li et mj
soient égaux à une constante multiplicative près. Par conséquent, Li serait parallèle
à Mj , ce qui est contraire aux hypothèses (les deux droites se coupent en un point
appartenant à C , en particulier pas à l'inni).
Finalement, l'équation fλ (x, y) = 0 dénit une cubique Fλ . De façon évidente,
les six points d'intersection Li ∩ Mj , i, j ∈ {1, 2, 3}, i 6= j , appartiennent à Fλ .
Soit p ∈ C distinct des six points Li ∩ Mj , i 6= j : p n'appartient donc à aucune
des droites Mi , car une droite coupe une conique en au plus deux points (une conique
a une équation de degré 2 en x, y , donc si on y injecte y = ax + b, on obtient que
x est racine d'un polynôme de degré 2). Par conséquent, le polynôme m1 m2 m3 ne
s'annule pas en p. On peut alors poser

(l1 l2 l3 )(p)
λ=− .
(m1 m2 m3 )(p)

109 || Romain Giuge


2.22. Théorème de Pascal

Avec cette valeur de λ, on a p ∈ C ∩ Fλ : l'intersection C ∩ Fλ contient donc au


moins 7 points distincts. D'après la forme faible du théorème de Bézout que l'on
démontrera ensuite, cela implique que la conique C est incluse dans Fλ . On note
c = 0 l'équation de la conique C . Alors c divise fλ , et pour des raisons de degré, il
existe un polynôme l de degré 1 en x, y tel que

fλ = cl.

Or, pour i ∈ {1, 2, 3}, le point pi appartient à Fλ mais pas à C (car l'intersection
Li ∩ C contient au plus deux points, qui sont Li ∩ Mj pour j 6= i). Par conséquent,
pour tout i, on a l(pi ) = 0, ce qui exprime que les pi sont alignés sur la droite
d'équation l = 0.

Théorème (Forme faible du théorème de Bézout). Soit C une conique propre et


F une cubique propre (ensemble des solutions dans R2 d'un polynôme de degré 3).
Alors soit C est contenue dans F , soit C ∩ F contient au plus 6 points distincts.
Démonstration. Supposons que C n'est pas contenue dans F . Comme la conique est
propre, on peut choisir un repère dans lequel son équation est

y 2 = f (x)

avec f polynôme de degré au plus 2. Dans ce repère, F a une équation de la forme


e(x, y) = 0 avec e polynôme de degré 3 en x, y . Ainsi
 
y 2 = f (x) y 2 = f (x)
(x, y) ∈ C ∩ F ⇐⇒ ⇐⇒ (∗)
e(x, y) = 0 g(x)y + h(x) = 0,

en ayant remplacé les y 2 par f (x) dans l'équation e(x, y) = 0, g et h sont alors des
polynômes tels que deg(g) 6 2 et deg(h) 6 3. Notre but est de montrer qu'il y a au
plus six solutions au système (∗) d'inconnues x, y .
Il va falloir distinguer les solutions (x, y) telles que g(x) = 0 (qui impliquent
h(x) = 0) et celles telles que g(x) 6= 0. Soient x1 , . . . , xk les racines communes à g
et h, répétées avec multiplicité. Comme g est de degré au plus 2, on a k 6 2. On
factorise g et h :
k
Y k
Y
g(x) = (x − xi )g̃(x), h(x) = (x − xi )h̃(x),
i=1 i=1

avec g̃ et h̃ deux polynômes sans racines communes, deg(g̃) 6 2−k et deg(h̃) 6 3−k .
Comme l'équation y 2 = f (x) est de degré 2 en y , pour chaque xi , il existe au plus
deux valeurs de y telles que y 2 = f (xi ). Donc le système (∗) possède au plus 2k
solutions dont l'abscisse x vérie g(x) = 0.

110 || Romain Giuge


2.22. Théorème de Pascal

Les solutions de (∗) dont l'abscisse x est telle que g(x) 6= 0 sont aussi solutions
de 
2
y = f (x)



(∗∗) g̃(x)y + h̃(x) = 0


g̃(x) 6= 0.

Si (x, y) est solution de (∗∗), alors x est solution de

h̃(x)2 = g̃(x)2 f (x),

équation polynomiale de degré d 6 max(2 deg(h̃), 2 deg(g̃) + deg(f )) 6 max(2(3 −


k), 2(2 − k) + 2) = 6 − 2k . Si le polynôme h̃2 − g̃ 2 f n'est pas nul, (∗∗) admet au plus
6 − 2k solutions. Au nal, le système (∗) admet au plus 6 − 2k + 2k = 6 solutions.

Montrons donc que le polynôme h̃2 − g̃ 2 f n'est pas nul. Supposons h̃2 = g̃ 2 f .
Quitte à simplier l'équation par les facteurs irréductibles de degré 2 communs à g̃
et h̃, on peut supposer g̃ et h̃ premiers entre eux. Alors h̃2 = g̃ 2 f implique que g̃ est
constant. Si g̃ était la constante nulle, h̃ aussi, et g et h seraient nuls également, ce
qui est absurde car g(x)y + h(x) = 0 dénit la cubique F de degré 3. Donc

1
f˜ = 2 h̃2 .

Comme deg(f ) 6 2, on obtient deg(h̃) 6 1. Par conséquent, la conique C a pour


équation
1
y 2 = f (x) = 2 h̃2 (x),

soit encore y = ± g̃1 h̃(x). Donc C est une conique dégénérée (la réunion de deux
droites), ce qui est absurde car on l'a supposé propre.

Remarque. 6 vient de 2 ∗ 3, le produit des degrés des polynômes qui dénissent les
courbes.

Le théorème de Pascal entraîne sa réciproque :

Proposition. Soient six points du plan m1 , m2 , m3 , m4 , m5 , m6 . On note


p2 = m1 m2 ∩ m4 m5 , p3 = m2 m3 ∩ m5 m6 , p1 = m3 m4 ∩ m1 m6 .

Alors si p1 , p2 et p3 sont alignés, il existe une conique qui contient tous les mi ,
i ∈ {1, . . . , 6}.

111 || Romain Giuge


2.22. Théorème de Pascal

Démonstration. On sait qu'il existe une unique conique passant par 5 points donnés.
Notons C la conique passant par m1 , m2 , m3 , m4 , m5 . Soit m06 le point d'intersection
de C avec m5 p3 autre que m5 , et soit p01 = m3 m4 ∩ m06 m1 .
Par le théorème de Pascal appliqué à m1 , m2 , m3 , m4 , m5 , m06 (p3 est l'intersection
de m2 m3 avec m5 m06 , etc...), on a p01 ∈ p2 p3 . On en déduit que p01 = p2 p3 ∩ m3 m4 , et
comme p1 est aussi à cette unique intersection, p01 = p1 . Mais

m6 = m1 p1 ∩ m5 p3 et m06 = m1 p01 ∩ m5 p3 ,

ce qui prouve que m06 = m6 , et donc que m6 ∈ C .

Théorème (Pappus). Si C est la réunion de deux droites, le théorème de Pascal


est encore vrai.

Références :
 Un document PDF de Jérôme Germoni.
 Shafarevich - Basic algebraic geometry - Page 20.

112 || Romain Giuge


2.23. Théorème de Rothstein-Trager

2.23 Théorème de Rothstein-Trager


Théorème. Soient P, Q ∈ Q[X] premiers entre eux tels que deg(P ) < deg(Q). On
suppose de plus Q unitaire et sans facteur carré. Soit K une extension de Q dans
laquelle on ait Z n
XP
= ci ln(Pi )
Q i=1

avec les ci ∈ K ∗ et les Pi unitaires non constants (car deg(P ) < deg(Q)) sans facteur
carré, et premiers entre eux deux à deux. Quitte à regrouper, on peut supposer les ci
deux à deux distincts. Alors :
(i) Pour tout i, on a Pi = PGCD(P − ci Q0 , Q).
(ii) Les ci sont exactement les racines du polynôme

R(Y ) = ResX (P − Y Q0 , Q) ∈ K[Y ].

Démonstration. L'existence de l'extension K est donnée par le théorème de décom-


position en éléments simples.
Pour i ∈ [[1, n]], on pose Ui = j6=i Pj . On dérive ensuite formellement la relation
Q

de l'énoncé : n
P X P0
= ci i .
Q i=1
Pi
On en déduit en multipliant par Q ni=1 Pi ,
Q

n
Y n
X
P Pi = Q ci Pi0 Ui . (∗)
i=1 i=1

Par conséquent, dans K[X], on a que Q divise ni=1 Pi et Pj divise Q ni=1 ci Pi0 Ui
Q P

pour tout j . Soit i ∈ [[1, n]]. Comme pour tout j 6= i, Pi divise Uj , on en déduit
que Pi divise ci QPi0 Ui . Or Pi est sans facteur carré, donc Pi est premier avec Pi0 ,
et de plus, Pi est premier avec Ui car il est premier avec tous les Pj pour j 6= i.
Finalement, on en conclut que Pi divise Q. Ceci étant vrai pour tout i et que les Pi
sont premiers entre eux deux à deux, il vient
n
Y
Pi divise Q.
i=1

Comme les deux polynômes sont unitaires, on a donc montré que


n
Y
Q= Pi ,
i=1

113 || Romain Giuge


2.23. Théorème de Rothstein-Trager

puis par (∗), que


n
X
P = ci Pi0 Ui .
i=1

Soit i ∈ [[1, n]]. Montrons que Pi divise P − ci Q0 . En dérivant Q, il vient Q0 =


Pn
j=1 Pj Uj . Donc
0

n
X n
X n
X X
0
P − ci Q = cj Pj0 Uj − ci Pj0 Uj = (cj − ci )Pj0 Uj = (cj − ci )Pj0 Uj .
j=1 j=1 j=1 j6=i

Mais pour j 6= i, Pi divise Uj . On a donc bien que Pi divise P − ci Q0 . Ensuite,


n
! n
Y Y
0 0
PGCD(P − ci Q , Q) = PGCD P − ci Q , Pj = PGCD (P − ci Q0 , Pj )
j=1 j=1

car les Pj sont premiers entre eux deux à deux. Or si j 6= i,


!
X
PGCD (P − ci Q0 , Pj ) = PGCD (ck − ci )Pk0 Uk , Pj = PGCD (cj − ci )Pj0 Uj , Pj

k6=i

car Pj divise tous les autres termes de la somme. Mais comme Pj est premier avec
Pj0 et premier avec Uj , on obtient

PGCD (P − ci Q0 , Pj ) = 1.

Finalement,
n
Y
PGCD(P − ci Q0 , Q) = PGCD (P − ci Q0 , Pj ) = PGCD (P − ci Q0 , Pi ) = Pi
j=1

car Pi divise P − ci Q0 .

Le fait que ci soit racine du résultant R découle directement du fait que P − ci Q0


et Q ont un PGCD non constant.
Réciproquement, soit c une racine de R dans une extension L de K . Alors S =
PGCD(P − cQ0 , Q) ∈ L[X] est non constant. Soit T un facteur irréductible de S
dans L[X], on a donc

T divise P − cQ0 et T divise Q.

Comme Q = ni=1 Pi et comme les Pi sont deux à deux premiers entre eux (dans
Q

K[X], donc dans L[X] par l'identité de Bézout), T doit nécessairement diviser un
et un seul des Pi , qu'on note Pi0 . Mais
n
X
0
P − cQ = (cj − c)Pj0 Uj .
j=1

114 || Romain Giuge


2.23. Théorème de Rothstein-Trager

Comme T divise Pi0 , il divise tous les Ui pour i 6= i0 . Et puisque T divise P − cQ0 ,
on a alors
T divise (ci0 − c)Pi00 Ui0 .
Or T ne divise pas Ui0 , car sinon il diviserait un Pi pour i 6= i0 . Donc si on suppose
que c est diérent de tous les ci , alors T divise Pi00 , et donc Pi0 admet un facteur
carré, ce qui est absurde. Donc il existe i tel que c = ci .

Pour calculer l'intégrale d'une fration rationnelle Q


P
avec Q sans facteur carré,
on a donc deux méthodes : décomposer en éléments simples ou utiliser le théorème
de Rothstein-Trager. Pour cette deuxième méthode, l'avantage est qu'on n'a pas
besoin de connaître les racines de Q, même si en revanche on devra calculer celles
du résultant R(Y ).

Réduction de Hermite :
Par le théorème de décomposition en éléments simples, la recherche de primitives
de fractions rationnelles est ramenée à la recherche de primitives de QPi où Q est sans
facteur carré et deg(P ) < deg(Q). Comme Q est sans facteur carré, Q et Q0 sont
premiers entre eux, et par l'identité de Bézout, il existe U, V tels que U Q + V Q0 = 1.
En multipliant par P , il vient

P = P U Q + P V Q0 .

On peut réduire davantage en faisant les deux divisions euclidiennes suivantes :


P U = AQ0 + R avec deg(R) < deg(Q0 ) et P V = BQ + S avec deg(S) < deg(Q).
Alors
P = (A + B)QQ0 + (RQ + SQ0 ),
avec deg(RQ + SQ0 ) 6 max(deg(RQ), deg(SQ0 )) < deg(QQ0 ). Or la partie entière
de Q
P
est nulle, car deg(P ) < deg(Q). Cela impose A + B = 0 (on a QP
= (A + B)Q0 +
0 0
R + SQ
Q
, mais R n'est pas nécessairement nul puisque SQ
Q
admet une partie entière
qui peut compenser R, les degrés le permettent). Finalement

P = RQ + SQ0

avec deg(R) < deg(Q0 ) et deg(S) < deg(Q).


Pour i > 1, on a donc

SQ0
Z Z Z
P R
= +
Qi Qi−1 Qi

115 || Romain Giuge


2.23. Théorème de Rothstein-Trager

En intégrant par partie, il vient

S0
Z Z Z
P R S
= + −
Qi Qi−1 (1 − i)Qi−1 (1 − i)Qi−1
(i − 1)R + S 0
Z
S
= + ,
(1 − i)Qi−1 (i − 1)Qi−1

où l'on a deg((i − 1)R + S 0 ) < deg(Q0 ) < deg(Q). En itérant ce procédé, on


est ramené à chercher des primitives de QP
avec Q sans facteur carré et deg(P ) <
deg(Q). Ce procédé est nommé réduction de Hermite. Le théorème de Rothstein-
Trager intervient à ce niveau-là : il nous permet de calculer ces primitives sans
factoriser Q sur C, en utilisant des PGCD et des résultants.

Références :
 Saux-Picart - Cours de calcul formel, Algorithmes fondamentaux - Page 153.

116 || Romain Giuge


2.24. Théorème de Wantzel

2.24 Théorème de Wantzel


Commençons par donner la structure des extensions de degré 2, dites aussi ex-
tensions quadratiques : elles sont obtenues par adjonction d'une racine carrée.

Proposition. Soit E un sous-corps de R (plus généralement un corps de caracté-


ristique diérente de 2). Soit j : E → F une extension de degré 2. Alors il existe un
élément a ∈ F \E tel que a2 ∈ E et F = E[a].
Démonstration. Soit x ∈ F \E . La famille (1, x) est libre sur E , donc une base de
F comme E -espace vectoriel. La famille (1, x, x2 ) est alors liée : il existe a, b, c ∈ E
non tous nuls tels que ax2 + bx + c = 0. Comme (1, x) est libre, a 6= 0, et on peut
écrire : 2
b2 − 4ac

b
x+ = .
2a 4a2
Posons δ = 2ax + b. Alors δ 2 = b2 − 4ac ∈ E est le discriminant du polynôme
aX 2 + bX + c. Comme x = δ−b
2a
, la famille (1, δ) est une base de F sur E .

Théorème (Wantzel). Soit E un sous-corps de R. Un réel x est constructible à la


règle et au compas à partir de E si et seulement s'il existe une suite E0 , . . . , En de
sous-corps de R telle que
(i) E = E0 ⊂ E1 ⊂ · · · ⊂ En .
(ii) [Ei : Ei−1 ] = 2, pour tout i ∈ [[1, n]].
(iii) x ∈ En .
Démonstration. Soit α ∈ R constructible à partir de E . Raisonnons par récurrence
sur le nombre r d'étapes pour construire α. Montrons le résultat pour r = 1. Dans ce
cas, il existe un point P dont une des coordonnées est égale à α, qui est constructible
en une étape à partir de l'ensemble F des points du plan R2 dont les coordonnées
sont des éléments de E . Cela signie que α est à l'intersection de deux droites, d'une
droite et d'un cercle, ou de deux cercles constructibles (i .e. les droites doivent passer
par deux points de F et les cercles doivent avoir pour centre un point de F et passer
en un autre point de F ).
Tout d'abord, une droite D passant par deux points A = (a, a0 ) et B = (b, b0 )
dont les coordonnées sont dans E possède une équation à coecients dans E :
−−→ −→
M = (x, y) ∈ D ⇐⇒ det(AM , AB) = 0
!
x−a b−a
⇐⇒ det = 0.
y − b b0 − a0

117 || Romain Giuge


2.24. Théorème de Wantzel

Un cercle C de centre A et de rayon AB possède aussi une équation à coecients


dans E :

M = (x, y) ∈ C ⇐⇒ (x − a)2 + (y − a0 )2 = (b − a)2 + (b0 − a0 )2 .

Les coordonnées du point à l'intersection de deux droites concourantes sont donc


des expressions rationnelles en les coecients des équations des droites. Elles sont
donc dans E .
Soit M = (x, y) un point à une des intersections d'une droite et d'un cercle.
Alors 
x2 + y 2 + Ax + By + C = 0
Dx + Ey + F = 0,

avec A, B, C, D, E, F ∈ E . Supposons par exemple E 6= 0. Alors en éliminant y


dans la première équation, on obtient une équation du second degré à coecients
dans E dont x est solution. Son discriminant ∆ appartient à E . Donc x appartient

à l'extension E( ∆) qui est de degré au plus 2 sur K . Enn, on a également y ∈

E( ∆).
Si M est à l'intersection de deux cercles, on soustrait les deux équations de cercles
et on est ramené au cas précédent (intersection d'un cercle et d'une droite).

Finalement, soit α ∈ E , soit α ∈ E( ∆) et on a le résultat. La récurrence est
immédiate.

Réciproquement, soit E0 , . . . , En une suite de sous-corps de R vériant les hypo-


thèses, avec x ∈ En . Pour montrer que x est constructible, il sut de montrer que
si E ⊂ F est une extension de degré 2, tout élément de F est constructible à partir
de E .
D'après la proposition démontrée juste avant, il existe a ∈ F tel que F = E[a]
et a2 ∈ E . Or la racine carrée d'un nombre constructible est constructible. Donc

a = ± a2 est constructible. Ainsi, tout élément de F est constructible, car il s'écrit
x + ay avec x, y ∈ E .

Remarque. Comme l'ensemble des nombres constructibles est un corps, il revient


au même de dire que x est constructible à partir d'une partie E contenant 0 et 1
que de dire qu'il est constructible à partir du corps engendré par E dans R. En
particulier, être constructible à partir de {0, 1} et l'être à partir de Q sont deux
notions équivalentes.

118 || Romain Giuge


2.24. Théorème de Wantzel

Proposition. L'ensemble K des nombres réels constructibles est un sous-corps de


R.

Démonstration. Soient a, b ∈ K . On a facilement que a + b ∈ K et a − b ∈ K . Les


réels x = ab et y = 1
a
sont obtenues avec le théorème de Thalès :

a 1 y 1
= et = ,
x b 1 a
où la première fraction est le quotient des longueurs des deux segments parallèles
(faire le dessin).

Proposition. Si x est constructible, alors x est constructible.

Démonstration. On place x et −1 sur l'axe des abscisses et on trace le cercle passant


par ces deux points : son centre est à l'abscisse x−1
2
et son rayon vaut x+1
2
. On note
h le nombre à l'intersection de ce cercle et du demi-axe positif [Oy). Alors
s 2  2
x+1 x−1 √
h= − = x.
2 2

Corollaire. Soit E un sous-corps de R et soit x un nombre réel constructible à


partir de E . Alors x est algébrique sur E et son degré est une puissance de 2.
Démonstration. Soit E = E0 ⊂ E1 ⊂ · · · ⊂ En ⊂ R une chaîne d'extensions
quadratiques avec x ∈ En . La multiplicativité des degrés entraîne que

[En : E] = [En : E1 ][E1 : E0 ] = 2[En : E1 ] = · · · = 2n .

En considérant les extensions E ⊂ E[x] ⊂ En , on obtient que le degré d de E[x] sur


E doit diviser 2n , c'est donc une puissance de 2.
La famille (1, x, . . . , xd ) est donc liée sur E[x] vu comme E -espace vectoriel. Donc
x est algébrique sur E .

Références :
 Audin - Géométrie - Page 130.

119 || Romain Giuge


2.25. Théorème de Wedderburn

2.25 Théorème de Wedderburn


Théorème. Tout corps ni est commutatif.
Démonstration. Soit K un corps ni dont on note Z le centre :

Z = {x ∈ K / xy = yx pour tout y ∈ K}.

Cet ensemble Z est un sous-corps commutatif de K et on note q son cardinal.


On sait que q > 2 car 0, 1 ∈ Z . Comme on peut voir K comme un Z -espace
vectoriel de dimension nie n, on a Card(K) = q n (on prend e1 ∈ K\Z et on
obtient Z + Ze1 ⊂ K , puis e2 ∈ K\(Z + Ze1 ), et ainsi de suite jusqu'à avoir
K = Z + Ze1 + · · · + Zen−1 ).
On suppose que K n'est pas commutatif (donc que n > 1). Le groupe multipli-
catif K ∗ opère sur lui-même par conjugaison. Pour x ∈ K ∗ , on note Ox l'orbite de
x et
kx = {y ∈ K / yx = xy}.
Alors kx est un sous-corps de K (pas nécessairement commutatif) et on a kx∗ =
StabK ∗ (x). Comme Z ⊂ kx , on peut voir kx comme un Z -espace vectoriel de dimen-
sion nie d et on a Card(kx ) = q d .
Comme kx∗ ⊂ K ∗ , on a q d − 1 | q n − 1, et donc d | n (voir la proposition plus bas).
Enn, on a
Card(K ∗ ) qn − 1
Card(Ox ) = = .
Card(kx∗ ) qd − 1
Soit Φm le m-ième polynôme cyclotomique. Grâce à la relation
Y
Xn − 1 = Φm ,
m|n

on obtient Q
qn − 1 m | n Φm (q)
Y
= Q = Φm (q).
qd − 1 m | d Φm (q) m | n, m - d

q n −1
Donc si d 6= n, Φn (q) | qd −1 .
On écrit maintenant l'équation aux classes :
X
Card(K ∗ ) = Card(Z ∗ ) + Card(Ox )
x∈E

où E désigne un ensemble de représentants des orbites tel que pour tout x ∈ E ,


x 6∈ Z . Mais si x 6∈ Z , alors kx 6= K , et donc d 6= n. On obtient ainsi :
X qn − 1
qn − 1 = q − 1 +
qd − 1

120 || Romain Giuge


2.25. Théorème de Wedderburn

où la somme porte sur un certain nombre de diviseurs stricts de n et d'après ce


qui précède, tous les termes de cette somme sont divisibles par Φn (q). Cette égalité
prouve que Φn (q) | q − 1, et en particulier, |Φn (q)| 6 q − 1.
Par dénition du n-ième polynôme cyclotomique, on a Φn (q) = (q − ω1 ) . . . (q −
ωϕ(n) ) où les ωi sont les racines primitives n-ièmes de l'unité dans C. Comme n 6=
1, ωi 6= 1 pour tout i. Mais alors, pour tout i, |q − ωi | > q − 1 (cela se voit
géométriquement sur un dessin), et donc

|Φn (q)| > (q − 1)ϕ(n) > q − 1,

ce qui est une contradiction.

Proposition. Soient q un entier > 2, et d, n ∈ N. Si qd − 1 | qn − 1, alors d | n.


Démonstration. On eectue la division euclidienne de n par d : il existe k, r ∈ N
tels que n = kd + r et 0 6 r < d. On se rappelle ensuite de la formule :
n−1
X
n n
a − b = (a − b) ai bn−1−i .
i=0

On a donc :

q n − 1 = q kd+r − 1
= q kd q r − q r + q r − 1
= q r (q kd − 1) + (q r − 1)
k−1
!
X
= q r (q d − 1) q id (−1)k−1−i + (q r − 1).
i=0

Mais par hypothèse, q d − 1 | q n − 1, donc nécessairement, q d − 1 | q r − 1. Comme


r < d, cela implique r = 0, et donc n = kd.

Références :
 Perrin - Cours d'algèbre - Page 82.

121 || Romain Giuge


2.26. Théorème des deux carrés

2.26 Théorème des deux carrés


Le problème est de déterminer quels entiers n ∈ N sont somme de deux carrés :
n = a2 + b2 avec a, b ∈ N. On pose :

Σ = {n ∈ N / ∃a, b ∈ N avec n = a2 + b2 }.

On introduit Z[i] = {a + ib ∈ C / a, b ∈ Z} anneau euclidien, muni de la "norme"


N (a + ib) = |z|2 = a2 + b2 , qui est clairement multiplicative.

Théorème (Théorème des deux carrés, version faible). Soit p ∈ N un nombre


premier. On a l'équivalence :

p ∈ Σ ⇐⇒ p = 2 ou p ≡ 1 [4].

Démonstration. Nous allons pouvoir raisonner uniquement par équivalence. D'abord :

p ∈ Σ ⇐⇒ p n'est pas irréductible dans Z[i].

En eet, si p ∈ Σ, p = a2 + b2 = (a + ib)(a − ib). Comme p est premier, on a


nécessairement a 6= 0 et b 6= 0. Donc a + ib et a − ib ne sont pas dans Z[i]∗ =
{1, −1, i, −i}. Donc p n'est pas irréductible dans Z[i].
Réciproquement, si p = zz 0 avec z, z 0 6∈ Z[i]∗ = {1, −1, i, −i}, on a N (p) =
N (z)N (z 0 ) = p2 et comme N (z), N (z 0 ) 6= 1, on a p = N (z) = N (z 0 ). Donc en
particulier, p = N (z) = N (a + ib) = a2 + b2 ∈ Σ.

Ensuite, Z[i] est euclidien, donc principal, donc factoriel, et donc :

p est réductible dans Z[i] ⇐⇒ (p) n'est pas premier


⇐⇒ Z[i]/(p) n'est pas intègre (par dénition).

Par ailleurs, on a Z[i] ∼


= Z[X]/(X 2 + 1). Pour le voir, on dénit ϕ : Z[X] → Z[i]
avec ϕ(X) = i. Alors ϕ est un morphisme d'anneaux surjectif. Si P ∈ Z[X] est tel
que ϕ(P ) = 0, on eectue la division euclidienne de P par X 2 +1 : P = (X 2 +1)Q+R.
Donc ϕ(P ) = 0 implique R(i) = 0, mais R est de degré 6 1 et la famille (1, i) est
libre, donc R = 0. Finalement Ker(ϕ) = (X 2 + 1), et Z[X]/Ker(ϕ) ∼ = Z[i].
On obtient alors les isomorphismes suivants par le théorème d'isomorphisme :

Z[i]/(p) ∼
= Z[X]/(X 2 + 1) /(p)



= Z[X]/(X 2 + 1, p)

= Z[X]/(p) /(X 2 + 1)



= (Z/pZ)[X]/(X 2 + 1) = Fp [X]/(X 2 + 1).

122 || Romain Giuge


2.26. Théorème des deux carrés

On poursuit alors nos équivalences :

Z[i]/(p) n'est pas intègre ⇐⇒ Fp [X]/(X 2 + 1) n'est pas intègre


⇐⇒ (X 2 + 1) n'est pas premier
⇐⇒ X 2 + 1 est réductible sur Fp ,

La dernière équivalence est justiée par le fait que Fp est factoriel (car c'est un
corps), donc aussi Fp [X]. On poursuit encore :

X 2 + 1 est réductible sur Fp ⇐⇒ X 2 + 1 admet une racine dans Fp


⇐⇒ −1 est un carré dans F∗p
⇐⇒ p = 2 ou p ≡ 1 [4].

Pour justier la dernière équivalence lorsque p 6= 2, on considère, pour q = p ou plus


généralement q = pr avec r > 1, le morphisme de groupes (groupes multiplicatifs)

ϕ : F∗q −→ F∗2
q
2
x 7−→ x

qui est surjectif (F∗2


q = {x ∈ Fq / ∃y ∈ Fq , x = y }). Son noyau vaut {−1, 1}
∗ ∗ 2

car le polynôme X 2 − 1 admet au plus deux racines, ce sont donc −1 et 1. Donc


∼ ∗
q = Fq /Ker(ϕ). En prenant les cardinaux, on obtient Card(Fq ) = 2 .
q−1
Im(ϕ) = F∗2 ∗2

On montre ensuite que n o


q−1
F∗2
q = x ∈ F q / x 2 = 1 .

En eet, en notant A le deuxième ensemble, son cardinal est 6 q−1


2
(nombre de
q−1
racines maximum du polynôme X 2 − 1). D'autre part si x ∈ Fq , alors x = y 2 ,
∗2
q−1
et donc x 2 = y q−1 = 1. Donc F∗2
q ⊂ A. Pour une raison de cardinal, on conclut
l'égalité.
A présent, on a :
p−1 p−1
−1 ∈ F∗2
p ⇔ (−1) 2 =1 ⇔ est pair ⇔ p ≡ 1 [4].
2

Théorème (Théorème des deux carrés). Soit n ∈ N∗ , n 6= 1. On décompose n en


facteurs premiers : n = p∈P pvp (n) . Alors on a l'équivalence :
Q

n ∈ Σ ⇐⇒ vp (n) est pair pour tout p ≡ 3 [4].

Démonstration. On traduit la propriété n ∈ Σ en termes d'entiers de Gauss :

n ∈ Σ ⇐⇒ ∃z ∈ Z[i] tel que n = N (z).

123 || Romain Giuge


2.26. Théorème des deux carrés

Alors comme N est multiplicative, si n, n0 ∈ Σ, alors n = N (z) et n0 = N (z 0 ), et


donc nn0 = N (zz 0 ) ∈ Σ. Le sens indirect de l'équivalence est donc immédiat grâce à
la version faible du théorème des deux carrés : n est un produit de nombres premiers
pi , avec pi ∈ Σ si pi = 2 ou pi ≡ 1 [4], et si pi ≡ 3 [4], on a p2i ∈ Σ car un carré est
toujours dans Σ (en eet, p2i = p2i + 0).
Montrons le sens direct. Soit p ≡ 3 [4]. On va montrer par récurrence sur vp (n) que
vp (n) est pair. Si vp (n) = 0, c'est clair. Sinon, p divise n = a2 + b2 = (a + ib)(a − ib).
D'après les résultats précédents, p 6∈ Σ (car p ≡ 3 [4]), et ceci est équivalent à p est
irréductible dans Z[i]. Donc p divise (a + ib) ou (a − ib). Or p est entier,
 donc p divise
a et b. On écrit a = pa et b = pb . Alors p2 = a + b ∈ Σ. Mais vp pn2 = vp (n) − 2
0 0 n 02 02

est pair d'après l'hypothèse de récurrence, donc aussi vp (n).

Théorème (Théorème d'isomorphisme). Soit f : A → B un homomorphisme d'an-


neaux. On note I = Ker(f ). Soient J ⊂ I un idéal de A et p : A → A/J la projection
canonique. Alors :
(i) Il existe un unique homomorphisme f : A/J → B tel que f = f ◦ p.
(ii) f est injectif si et seulement si J = I .
(iii) f est surjectif si et seulement si f l'est.
En particulier, on a Im(f ) ∼ = A/Ker(f ).

Remarque. Justication de Fp est factoriel : Fp est un corps, donc Fp est engendré


par 1 en tant qu'idéal. Tout idéal de Fp non réduit à {0} contient 1 (s'il contient
x 6= 0, il contient x−1 x = 1), donc vaut Fp . Les idéaux de Fp sont {0} = (0) et
Fp = (1) qui sont bien principaux. Donc Fp est principal, donc factoriel.
En fait, on a même que tout corps K est un anneau euclidien, donc principal,
donc factoriel. En eet, si x ∈ K et y ∈ K ∗ , alors x = (xy −1 )y + 0. Le reste de la
division euclidienne est toujours nul et on peut dénir n'importe quel stathme.

Proposition. On a Z[i]∗ = {−1, 1, −i, i}.


Démonstration. Si z ∈ Z[i]∗ , il existe z 0 ∈ Z[i] tel que zz 0 = 1. Donc N (zz 0 ) =
N (z)N (z 0 ) = N (1) = 1. Comme N (z), N (z 0 ) ∈ N, cela implique N (z) = N (z 0 ) = 1.
En écrivant z = a + ib, on a donc a2 + b2 = 1, d'où le résultat.

Proposition. L'anneau Z[i] est euclidien (relativement à N ), donc principal.

124 || Romain Giuge


2.26. Théorème des deux carrés

Démonstration. Soient z, t ∈ Z[i]\{0}. Pour faire la division euclidienne de z par t,


on commence par considérer zt ∈ C. On approxime zt par un entier de Gauss q : si
z
t
= x + iy , on prend q = a + ib où a et b sont les entiers les plus proches de x et y .
On a ainsi :
s 
2  2 √
z p 1 1 2
− q = (x − a)2 + (y − b)2 6 + = < 1.
t 2 2 2

Alors r = z − qt ∈ Z[i] est tel que |r| = |t| zt − q < |t|. En élevant au carré, on
obtient N (r) < N (t). On a donc bien écrit z = qt + r avec N (r) < N (t).

Remarque. On peut expliciter un isomorphisme d'anneaux pour montrer que


Z[i]/(p) ∼
= (Z/pZ)[X]/(X 2 + 1).

En eet, soit
ϕ: Z[i] −→ (Z/pZ)[X]/(X 2 + 1)
a + ib 7−→ a + bΠ(X)
où Π : (Z/pZ)[X] → (Z/pZ)[X]/(X 2 + 1) est la surjection canonique. On vérie
alors que ϕ est un morphisme d'anneau surjectif (facile), de noyau (p) = pZ[i]
(facile aussi).

Proposition. Soit A un anneau intègre. On a :


(i) L'idéal (p) est premier implique p est irréductible.
(ii) Si A est factoriel, alors la réciproque est vraie : p est irréductible implique
l'idéal (p) est premier.
Démonstration. (i ) Soit (p) un idéal premier. Alors si p = ab, on a ab ∈ (p),
et comme (p) est premier, cela implique a ∈ (p) ou b ∈ (p). Si par exemple
a ∈ (p), alors p divise a : a = pc, c ∈ A. On a donc p = ab = pbc. Comme A
est intègre, cela implique bc = 1, i .e. b ∈ A∗ . Donc p est irréductible.
(ii ) Soit p irréductible. Soit ab ∈ (p). Alors il existe k ∈ A tel que ab = kp. Comme
A est factoriel, on peut décomposer a, b et k de façon unique en produit de
facteurs irréductibles à une unité de l'anneau près. En comparant les décom-
positions de ab et kp, on obtient que p divise a ou b. Donc a ∈ (p) ou b ∈ (p),
ce qui prouve que (p) est premier.

Références :
 Perrin - Cours d'algèbre - Page 56.

125 || Romain Giuge


2.27. Topologie des orbites de l'action de Steinitz

2.27 Topologie des orbites de l'action de Steinitz


Propriété. Soit K = R ou C. On note Or l'orbite des matrices de Mn,p (K) de
rang r (on a 0 6 r 6 min(n, p)) pour l'action de Steinitz. Alors
r
G
Or = Ok .
k=0

Démonstration. On commence par montrer que


Fr
Ok est un fermé de Mn,p (K).
k=0
Soient I ⊂ {1, . . . , n} et J ⊂ {1, . . . , p} tels que |I| = |J|. On note
∆I,J : Mn,p (K) −→ K
(aij )i6n,j6n 7−→ det((aij )i∈I,j∈J ),
application mineur d'indice (I, J). On considère ensuite l'application
p n
δ : Mn,p (K) −→ K (r+1)(r+1)
A 7−→ (∆I,J (A))I⊂{1,...,n},J⊂{1,...,p},|I|=|J|=r+1 .
Comme le rang d'une matrice A est l'ordre de son plus grand mineur non nul,
on a :
Gr
Ok = {A ∈ Mn,p (K) / rg(A) 6 r}
k=0
= {A ∈ Mn,p (K) / ∆I,J (A) = 0, ∀I ⊂ {1, . . . , n},
∀J ⊂ {1, . . . , p}, |I| = |J| > r + 1}
= {A ∈ Mn,p (K) / ∆I,J (A) = 0, ∀I ⊂ {1, . . . , n},
∀J ⊂ {1, . . . , p}, |I| = |J| = r + 1}
= δ −1 ({0}).
Les applications ∆I,J étant continues car polynomiales en les coecients de la
matrice, δ est continue et rk=0 Ok est un fermé de Mn,p (K).
F

Comme Or ⊂ rk=0 Ok et comme Or est le plus petit fermé contenant Or , on


F

obtient r
G
Or ⊂ Ok .
k=0

Soit maintenant A ∈ rk=0 Ok . Il existe k ∈ [[0, r]] tel que A ∈ Ok , i .e. A s'écrit
F

A = P Jk Q−1 avec (P, Q) ∈ GLn (K) × GLp (K). Pour n ∈ N∗ , on dénit


 
Ik 0 0
An = P  0 n1 Ir−k 0 Q−1 .
 

0 0 0
Pour tout n ∈ N∗ , An ∈ Or et limn→∞ An = A, donc A ∈ Or . On a donc démontré
l'autre inclusion.

126 || Romain Giuge


2.27. Topologie des orbites de l'action de Steinitz

Application. GLn (K) est dense dans Mn (K).

Démonstration. On a GLn (K) = On l'orbite des matrices de rang n dans Mn (K),


donc d'après ce qui précède,
n
G
GLn (K) = On = Ok = Mn (K).
k=0

Proposition. On suppose K = C. Alors pour tout r ∈ [[0, min(n, p)]], Or est


connexe.
Démonstration. Soit l'application
ϕr : GLn (C) × GLp (C) −→ Mn,p (C)
(P, Q) 7−→ P Jr Q−1

qui est continue car les coecients de P Jr Q−1 sont polynomiaux en les coecients
de P et Q (on rappelle que Q−1 = det(Q)
1 t
com(Q)).
Ensuite, comme GLn (C) et GLp (C) sont connexes, leur produit GLn (C)×GLp (C)
l'est aussi.
Enn,

Or = ϕr GLn (C) × GLp (C)
est connexe comme image d'un connexe par une application continue.

K désigne un corps commutatif.

Dénition. Le groupe G = GLn (K) × GLp (K) agit à gauche sur Mn,p (K) par :

G × Mn,p (K) −→ Mn,p (K)


((P, Q), M ) 7−→ P M Q−1 .

On dit que deux matrices A, B ∈ Mn,p (K) sont équivalentes si elles sont dans la
même orbite pour cette action, appelée action de Steinitz.
!
Ir 0
Proposition. Soit r ∈ [[1, min(n, p)]] et Jr = . L'orbite de Jr est l'ensemble
0 0
des matrices de rang r de Mn,p (K). De plus, toute matrice de Mn,p (K) est dans
l'orbite d'une unique matrice Jr .
Théorème (Théorème du rang). Deux matrices A, B ∈ Mn,p (K) sont dans la même
orbite si et seulement si elles ont même rang.

127 || Romain Giuge


2.27. Topologie des orbites de l'action de Steinitz

Références :
 Caldero, Germoni - Histoires hédonistes de groupes et de géométries.
 Francinou, Gianella, Nicolas - Oraux X-ENS, Algèbre 2 - Page 217 (autre
version).

128 || Romain Giuge


Chapitre 3
Développements d'analyse

129
R∞
3.1. Calcul de l'intégrale 0
tα−1 eit dt

3.1 Calcul de l'intégrale


R∞
0 tα−1eit dt
R∞
Soit α ∈]0, 1[. On veut calculer J = 0 tα−1 eit dt. Son existence est justiée par
la règle d'Abel, ou par une intégration par parties :
b b b
1 − eit α−1 1 − eit α − 1
Z  Z
α−1 it
t e dt = t − dt.
a −i a a −i t2−α

Comme |1 − eit | ∼ t quand t → 0, on en déduit que la limite quand a → 0 existe.


La limite quand b → ∞ existe aussi.

Pour x > 0, on pose Z ∞


I(x) = tα−1 eixt e−t dt.
0

On va commencer par calculer I(x). Vérions les hypothèses du théorème de déri-


vation des intégrales à paramètre :
(i) Pour tout x > 0, t 7→ tα−1 eixt e−t est intégrable sur ]0, ∞[ car continue et
majorée en module par tα−1 e−t qui est intégrable.
(ii) Pour tout t ∈]0, ∞[, x 7→ tα−1 eixt e−t est de classe C 1 sur R+ , de dérivée x 7→
itα eixt e−t , majorée en module par e−t tα indépendante de x et intégrable sur
]0, ∞[.
On en conclut que I est dérivable sur R+ , et pour tout x > 0,
Z ∞
0
I (x) = i tα eixt e−t dt.
0

Par ailleurs, on intègre I(x) par parties :


α ∞
−1 + ix ∞ α ixt −t
  Z
(−1+ix)t t i+x 0
I(x) = e − t e e dt = − I (x),
α 0 α 0 α

pour tout x > 0. On sait intégrer cette équation diérentielle :


Z x 
−α
I(x) = I(0) exp dt
0 i+t
 Z x 
t−i
= I(0) exp −α 2
dt
0 1+t
  
1 2
= I(0) exp −α ln(1 + x ) − i arctan(x)
2
− α
= I(0) 1 + x2 2 eiα arctan(x) .

On remarque enn que I(0) = Γ(α).

130 || Romain Giuge


R∞
3.1. Calcul de l'intégrale 0
tα−1 eit dt

Pour retrouver l'intégrale J , on fait le changement de variable u = xt pour x > 0


dans l'intégrale dénissant I(x). On obtient :
Z ∞
u
−α
I(x) = x e− x eiu uα−1 du.
0

On a donc envie de faire tendre x vers l'inni à l'intérieur de l'intégrale pour obtenir
J , soit encore de faire tendre y vers 0 dans l'intégrale :
Z ∞
K(y) = e−uy eiu uα−1 du.
0

Mais le théorème de continuité sous le signe intégral ne s'applique pas car on ne peut
dominer e−uy eiu uα−1 par une fonction intégrable indépendante de y que sur [ε, ∞[
pour ε > 0. On prouve ainsi que K est continue sur [ε, ∞[ pour tout ε > 0, donc
sur R∗+ , mais on ne peut pas conclure que K est continue en 0.
Pour montrer que K est continue en 0, on va l'exprimer comme limite uniforme
de fonctions continues en 0. On considère la suite de fonctions (Kn )n∈N∗ où les Kn
sont dénies par : Z n
Kn (y) = e−uy eiu uα−1 du
0
pour tout y > 0. Comme on intègre sur un compact, le théorème de continuité sous
le signe intégral s'applique immédiatement : les Kn sont continues sur R+ . Il reste
à montrer que la convergence vers K est uniforme. On calcule la diérence :
Z ∞
Kn (y) − K(y) = e−uy eiu uα−1 du
n (i−y)u ∞ Z ∞ (i−y)u
e α−1 e α−1
= u − du
i−y n n i − y u2−α
 (i−y)n Z ∞ (i−y)u 
1 e e
= 1−α
+ (α − 1) du .
i−y n n u2−α
q
Comme |e (i−y)n
| 6 1 et i−y = 1+y
1 1
2 6 1, on obtient :

Z ∞
1 1
|Kn (y) − K(y)| 6 1−α + (1 − α) 2−α
du
n n u
et cette majoration tend vers 0 quand n tend vers l'inni indépendamment de y .

Au nal, on a :
 
1 1 1 iα arctan(x)
I(x) = α K = Γ(α) α e ,
x x (1 + x2 ) 2
pour tout x > 0. En faisant tendre x vers l'inni, on obtient :
π
J = K(0) = Γ(α)eiα 2 .

131 || Romain Giuge


R∞
3.1. Calcul de l'intégrale 0
tα−1 eit dt

Application. On eectue le changement de variable t = x2 dans l'intégrale dénis-


sant J , qui est un C 1 -diéomorphisme de ]0, ∞[→]0, ∞[ :
Z ∞
2
J =2 x2α−1 eix dx.
0

En prenant α = 12 , on trouve :

1 iπ √ iπ
Z  
ix2
J =2 e dx = Γ e 4 = πe 4 .
0 2

D'où la valeur de l'intégrale de Fresnel :


Z ∞ Z ∞ √ π
ix2 2
e dx = 2 eix dx = πei 4 .
−∞ 0

Références :
 Gourdon - Analyse - Page 164 (exercice 4, question 2).

132 || Romain Giuge


3.2. Complétude de l'espace Lp (µ)

3.2 Complétude de l'espace Lp(µ)


Théorème. Pour 1 6 p 6 ∞ et pour toute mesure positive µ, Lp (µ) est un espace
métrique complet.
Démonstration. Soit (fn )n∈N une suite de Cauchy de Lp (µ).
Supposons d'abord p < ∞. On peut extraire une sous-suite (fni )i∈N telle que
1
kfni+1 − fni kp 6 .
2i
On pose
k
X ∞
X
gk = |fni+1 − fni | et g = |fni+1 − fni |.
i=1 i=1
P∞
D'après l'inégalité de Minkowski, kgk kp 6 6 1 pour tout k . On applique le
1
i=1 2i
p
lemme de Fatou à la suite (gk )k∈N∗ :
Z Z
p
lim inf (gk ) dµ 6 lim inf gkp dµ = lim inf kgk kp p 6 1,
X | {z } X
=g p

qui nous donne kgkp 6 1. En particulier, on a g(x) < ∞ presque partout, et donc
que la série
X 
fn1 + fni+1 (x) − fni (x)
i>1

est absolument convergente pour presque tout x. On note alors f (x) la somme de
cette série lorsqu'elle converge et on pose f (x) = 0 sur l'ensemble restant qui est de
mesure nulle. Comme
k−1
X 
fn 1 + fni+1 (x) − fni (x) = fnk ,
i=1

on a directement f (x) = limi→∞ fni (x) pour presque tout x. Nous avons donc trouvé
une fonction f qui est la limite simple presque partout de (fni ). Il faut maintenant
démontrer que cette fonction est la limite de (fn ) au sens de Lp (µ).

Soit ε > 0. Il existe N tel que pour tout n, m > N , kfn − fm kp 6 ε. On applique
à nouveau le lemme de Fatou :
Z Z
p
lim inf |fni − fm | dµ 6 lim inf |fni − fm |p dµ 6 εp .
X| i→∞ i→∞ X
{z }
=|f −fm |p

Cette inégalité montre que f − fm ∈ Lp (µ), que f ∈ Lp (µ) (en eet, on écrit
f = (f − fm ) + fm et on applique l'inégalité de Minkowski), et que kf − fm kp → 0
quand m → ∞. La démonstration est donc terminée dans le cas où p < ∞.

133 || Romain Giuge


3.2. Complétude de l'espace Lp (µ)

Supposons maintenant p = ∞. On note Ak l'ensemble sur lequel |fk (x)| > kfk k∞
et Bn,m l'ensemble sur lequel |fn (x) − fm (x)| > kfn − fm k∞ . Alors les Ak et les Bn,m
sont de mesure nulle par dénition de la norme inni sur L∞ (µ). On note :

! ∞ [ ∞
!
[ [
E= Ak ∪ Bn,m .
k=1 n=1 m=1

L'ensemble E est de mesure nulle car c'est une union dénombrable d'ensembles de
mesure nulle. Pour x ∈ c E ,

|fn (x) − fm (x)| 6 kfn − fm k∞ ,

donc (fn (x))n∈N est une suite de Cauchy dans C, qui converge donc vers f (x) ∈ C.
D'autre part, on sait qu'il existe N tel que pour tout n, m > N ,

|fn (x) − fm (x)| 6 kfn − fm k∞ 6 ε.

Alors pour tout n, m > N , on a aussi

|fm (x)| 6 |fn (x)| + |fn (x) − fm (x)| 6 kfn k∞ + kfn − fm k∞ 6 kfn k∞ + ε.

En faisant tendre m vers l'inni, on en déduit que pour tout x ∈ c E ,

|fn (x) − f (x)| 6 ε et |f (x)| 6 kfn k∞ + ε,

en particulier f est bornée sur c E .


Pour x ∈ E , on pose f (x) = 0. Alors f ∈ L∞ (µ) et kfn − f k∞ → 0 quand
n → ∞, ce qui achève la démonstration.

Dans ce qui suit, on désigne par X un espace mesuré quelconque muni d'une
mesure positive µ.

Dénition (Lp (µ), 1 < p < ∞). Soit 1 < p < ∞. Pour toute fonction f mesurable
à valeurs complexes dénie sur X , on pose
Z  p1
kf kp = |f |p dµ
X

et on appelle Lp (µ) l'ensemble de toutes les fonctions f pour lesquelles kf kp < ∞.

134 || Romain Giuge


3.2. Complétude de l'espace Lp (µ)

Dénition (Borne essentielle). Soient g : X → [0, ∞] mesurable et S l'ensemble de


tous les nombres réels α tels que

µ g −1 (]α, ∞]) = 0.


Pour S = ∅, on pose β = ∞, et pour S 6= ∅, β = inf(S). Comme


∞  
−1
[
−1 1
g (]β, ∞]) = g β + ,∞
n=1
n

et que la réunion dénombrable d'ensembles de mesure nulle est de mesure nulle,


alors β ∈ S . On appelle β la borne essentielle de g .

Dénition (L∞ (µ)). Pour toute fonction f mesurable à valeurs complexes dénie
sur X , on pose
kf k∞ = la borne essentielle de |f |
et on appelle L∞ (µ) l'ensemble de toutes les fonctions f mesurables pour lesquelles
kf k∞ < ∞.

On peut noter que le début de la démonstration de la complétude de Lp (µ)


contient le résultat intéressant suivant :

Théorème. Soit 1 6 p 6 ∞. Soit (fn )n∈N une suite de Cauchy dans Lp (µ), qui
possède donc une limite f ∈ Lp (µ). Alors il existe une sous-suite de (fn ) qui converge
ponctuellement presque partout vers f .
Démonstration. Pour p < ∞, c'est la suite (fni )i∈N de la démonstration. Pour p =
∞, la suite toute entière, (fn )n∈N , convient.

Références :
 Rudin - Analyse réelle et complexe - Page 82.

135 || Romain Giuge


3.3. Comportement des solutions d'une équation diérentielle linéaire

3.3 Comportement des solutions d'une équation dif-


férentielle linéaire
Théorème. Soient A ∈ Mn (R), B ∈ C (R+ , Mn (R)), f ∈ C (R+ , Rn ). On suppose
que l'application t 7→ etA est bornée sur R+ et que
Z ∞ Z ∞
kB(s)k ds < ∞ et kf (s)k ds < ∞.
0 0

Alors :
(i) Toutes les solutions (maximales) du système x0 = (A + B(t))x + f (t) sont
bornées.
(ii) Toutes les solutions maximales de x0 = B(t)x ont une limite nie en +∞.
(iii) En supposant de plus t 7→ etA bornée sur R tout entier, on a que pour toute
solution maximale de x0 = (A + B(t))x, l'application y : t 7→ e−tA x(t) a une
limite en +∞.
Démonstration. (i) Soit M un majorant de ketA k. Par la formule de Duhamel ap-
pliquée avec le terme source B(t)x + f (t) dépendant de x, on a
Z t
tA
x(t) = e x(0) + e(t−s)A (B(s)x(s) + f (s)) ds.
0
Rt Rt
On note u(t) = kx(t)k, F (t) = 0
kf (s)k ds et β(t) = 0
kB(s)k ds. On obtient alors
la majoration suivante :
Z t
u(t) 6 M u(0) + M (β 0 (s)u(s) + f (s)) ds
0
Z t
= M (u(0) + F (t)) + M β 0 (s)u(s) ds.
0

D'après le lemme de Gronwall, en notant c(t) = u(0) + F (t),


Z t Rt 0
u(t) 6 M c(t) + M c(τ )β 0 (τ )e τ β (s) ds dτ.
0

Il ne reste plus qu'à majorer tous les termes :


Z t
u(t) 6 M (u(0) + F (∞)) + M (u(0) + F (∞)) β 0 (τ )eβ(t)−β(τ ) dτ
0
Z t
6 M (u(0) + F (∞)) + M (u(0) + F (∞))eβ(∞)
β 0 (τ ) dτ
0
6 M (u(0) + F (∞)) + M (u(0) + F (∞))eβ(∞) β(∞).

136 || Romain Giuge


3.3. Comportement des solutions d'une équation diérentielle linéaire

(ii) D'après (i) appliqué à A = 0 et f = 0, les solutions maximales de x0 = B(t)x


sont bornées. De plus, on sait que les solutions maximales sont globales, c'est-à-dire
ici dénies sur R+ . Soit x une telle solution. Alors pour tout t, s ∈ R+ avec s 6 t,
Z t
x(t) − x(s) = B(τ )x(τ ) dτ.
s

En notant C un majorant de kx(τ )k pour τ ∈ R+ , on obtient


Z t
kx(t) − x(s)k 6 C kB(τ )k dτ.
s
R∞
Ce majorant tend vers 0 quand s et t tendent vers l'inni car 0 kB(τ )k dτ < ∞.
Donc x satisfait le critère de Cauchy en +∞, ce qui implique que x a une limite
nie en +∞.

(iii) Soit x une solution maximale de x0 = (A + B(t))x. L'application y : t 7→


e−tA x(t) est solution de y 0 = e−tA B(t)etA y . On note M 0 un majorant de ketA k pour
t ∈ R. On a :
Z ∞ Z ∞
−sA sA 02
ke B(s)e k ds 6 M kB(s)k ds < ∞.
0 0

La question précédente s'applique donc à l'équation diérentielle y 0 = e−tA B(t)etA y ,


ce qui prouve que y a une limite nie en +∞.

Application. Soient q : R+ → R continue telle que 0∞ |q(t)| dt < ∞ et x une


R

solution de
x00 + (1 + q(t))x = 0.
Alors il existe α, β ∈ R tels que limt→∞ x(t) − α cos(t) − β sin(t) = 0.
!
x(t)
Démonstration. On pose X(t) = . Alors X est solution du système X 0 =
x0 (t)
(A + B(t))X avec
! !
0 1 0 0
A= et B(t) = .
−1 0 −q(t) 0
Or !
cos(t) sin(t)
etA =
− sin(t) cos(t)
est bornée pour t ∈!R. Donc la question précédente s'applique : Y (t) = e−tA X(t) a
α
une limite nie à l'inni, i .e.
β
!
α
e−tA X(t) − −→ 0.
β t→∞

137 || Romain Giuge


3.3. Comportement des solutions d'une équation diérentielle linéaire

Comme etA est bornée, en multipliant, on obtient


!
α
X(t) − etA −→ 0.
β t→∞

En particulier, la première composante, x(t) − α cos(t) − β sin(t) tend vers 0 quand


t → +∞.

Formule de Duhamel :
En appliquant la méthode de variation de la constante, on trouve que les solutions
de l'équation u0 = Au + b(t) sont donnés par la formule de Duhamel :
Z t
(t−t0 )A
u(t) = e u(t0 ) + e(t−s)A b(s) ds.
t0

La formule de Duhamel peut s'appliquer à des équations dont le terme source (ici
b(t)) dépend aussi de u(t), ce qui fournit une équation implicite en u.

Théorème (Lemme de Gronwall). Soit u ∈ C(I, R+ ). On suppose qu'il existe a ∈


C (I, R+ ) et c ∈ C(I, R) tels que pour tout t ∈ I ,
Z t
u(t) 6 c(t) + a(τ )u(τ ) dτ.
0

Alors pour tout t ∈ I ,


Z t Rt
a(s) ds
u(t) 6 c(t) + c(τ )a(τ )e τ dτ.
0

Démonstration. Soit v(t) =


Rt
0
a(τ )u(τ ) dτ . En dérivant, on obtient

v 0 (t) = a(t)u(t) 6 a(t)(c(t) + v(t)).

On intègre cette inéquation diérentielle et on obtient le résultat voulu.

Dénition. Soit λ une valeur propre d'une matrice A. On dit que λ est semi-simple
si les dimensions de l'espace propre et de l'espace caractéristique associés sont égales,
i .e. si
dim(Ker(A − λIn )) = dim(Ker((A − λIn )m ))
où m est la multiplicité de λ. Comme Ker(A−λIn ) ⊂ Ker((A−λIn )m ), cela implique
l'égalité de ces sous-espaces.
On dit que λ est simple si

dim(Ker(A − λIn )) = dim(Ker((A − λIn )m )) = 1.

138 || Romain Giuge


3.3. Comportement des solutions d'une équation diérentielle linéaire

Proposition. L'application t 7→ etA est bornée sur R+ si et seulement si les valeurs


propres de A sont toutes de partie réelle négative ou nulle et si les valeurs propres
imaginaires pures sont semi-simples. Elle tend vers 0 à l'inni si et seulement si les
valeurs propres de A sont toutes de partie réelle strictement négative.
Démonstration. Voir le document "Théorème de Liapounov". Le cas où les valeurs
propres imaginaires pures sont semi-simples s'en déduit facilement. En eet, si λ est
une valeur propre imaginaire pure semi-simple, on a Ker(A−λIn ) = Ker((A−λIn )m ),
on peut donc prendre m = 1 dans la décomposition par le lemme des noyaux.

Références :
 Benzoni-Gavage - Calcul diérentiel et équations diérentielles - Page 210
(exercice 6.3).

139 || Romain Giuge


3.4. Densité des fonctions continues et nulle part dérivables

3.4 Densité des fonctions continues et nulle part dé-


rivables
Proposition. Soit E l'ensemble des fonctions continues sur [0, 1] et à valeurs dans
F complet. On munit E de la norme innie. Alors le sous-ensemble A de E des
fonctions continues sur [0, 1] qui ne sont dérivables en aucun point de [0, 1] est
dense dans E .
Démonstration. L'espace E est un espace métrique complet (car F est complet et
on travaille avec la norme innie), c'est donc un espace de Baire. Il nous sut
donc de trouver une suite dénombrable d'ouverts (On )n∈N denses dans E tels que
n=1 On ⊂ A, car par le théorème de Baire, ∩n=1 On sera dense dans E , donc A
∩∞ ∞

aussi. Par passage au complémentaire, on pose B = c A et on va trouver une suite


dénombrable (Fn )n∈N de fermés d'intérieur vide tels que B ⊂ ∪∞ n=1 Fn .
Remarquons que B est l'ensemble des fonctions continues dérivables en au moins
un point de [0, 1]. Si f est dérivable en un point x, alors la quantité f (y)−f
y−x
(x)
est
bornée quand y → x. Posons alors pour n ∈ N : ∗

Fn = {f ∈ E / ∃x ∈ [0, 1] tel que ∀y ∈ [0, 1], |f (x) − f (y)| 6 n|x − y|}.

Alors clairement, B ⊂ ∪∞ ˚
n=1 Fn . Il reste à montrer que Fn est fermé et Fn = ∅.

Montrons que Fn est fermé. Soit (fk ) une suite de Fn convergeant vers f ∈ E .
Pour tout k ∈ N, il existe xk tel que pour tout y , |fk (y) − fk (xk )| 6 n|y − xk |. Le
segment [0, 1] étant compact dans R, il existe une suite extraite (xϕ(k) ) qui converge
vers x ∈ [0, 1]. Pour alléger les notations, on note encore (xk ) cette suite extraite.
Soit y ∈ [0, 1]. On veut alors montrer que fk (y) − fk (xk ) → f (y) − f (x) quand
k → ∞, car ainsi, en passant à la limite dans l'inégalité plus haut, on aura |f (y) −
f (x)| 6 n|y − x|, pour tout y , i.e. f ∈ Fn . On a :
 
fk (y) − fk (xk ) − f (y) − f (x) 6 |fk (y) − f (y)| + |fk (xk ) − f (xk )|
+|f (xk ) − f (x)|
6 2kfk − f k∞ + |f (xk ) − f (x)|,

et ce majorant tend vers 0 car |f (xk ) − f (x)| → 0 par continuité de f .

Montrons maintenant que F˚n = ∅. Soit f ∈ Fn . Il s'agit de montrer que toute


boule B(f, ε) rencontre c Fn , i.e. il existe g ∈ E tel que kf − gk∞ 6 ε et pour tout
x ∈ [0, 1], il existe y ∈ [0, 1] avec |g(y) − g(x)| > n|y − x|.
Les polynômes étant denses dans E pour la norme innie, il existe un polynôme
P tel que kP − f k∞ < 2ε . L'idée est d'ajouter à P une fonction g0 de E assez petite

140 || Romain Giuge


3.4. Densité des fonctions continues et nulle part dérivables

de sorte à avoir P + g0 ∈ c Fn . Soit alors N ∈ N∗ . On écrit :


N −1  
[ k k+1
[0, 1] = , ,
k=0
N N

et on considère la fonction en dents de scie g0 , périodique de période 1


N
, qui vaut :

εN x pour 0 6 x 6 1
2N
g0 (x) =
ε − εN x pour 1 6 x 6 1 .
2N N

La fonction g0 est continue sur [0, 1], dérivable sauf en un nombre ni de points,
et aux points où elle est dérivable, |g00 (x)| = εN . De plus, kg0 k∞ = 2ε . Si on pose
g = P + g0 , alors kf − gk∞ 6 kf − P k∞ + kg0 k∞ < ε. Il reste à voir si g ∈ c Fn . Pour
x, y ∈ [0, 1], on eectue la minoration :

|g(y) − g(x)| > |g0 (y) − g0 (x)| − |P (y) − P (x)|.

Par l'inégalité des accroissements nis, on a |P (y) − P (x)| 6 M |x − y|, où M =


kP 0 k∞ . Prenons y assez proche de x de sorte que g0 soit dérivable sur ]x, y[. Alors
par l'égalité des accroissements nis, il existe c ∈]x, y[ tel que

|g0 (y) − g0 (x)| = |g00 (c)||x − y| = εN |x − y|.

Ainsi :
|g(y) − g(x)| > (εN − M )|x − y|.
En reprenant plus haut, on xe l'entier N tel que N > n+1+M
ε
, ce qui implique :

|g(y) − g(x)| > (n + 1)|x − y|.

Finalement, pour tout x ∈ [0, 1], on peut trouver y ∈ [0, 1] tel que |g(y) − g(x)| >
n|y − x|, i .e. g ∈ c Fn .

Exemple (Fonction de Weierstrass). Soient a ∈]0, 1[ et b ∈ N∗ entier pair tel que


ab > 1 + π . Alors la fonction f dénie pour x ∈ R par

n πx
X
f (x) = an eib
n=1

est continue mais nulle part dérivable.

141 || Romain Giuge


3.4. Densité des fonctions continues et nulle part dérivables

Démonstration. La série dénissant f est normalement convergente, donc f est


continue. Soient x ∈ R et h 6= 0. On regarde le taux décroissement
∞ n
f (x + h) − f (x) X n ibn πx eiπb h − 1
= a e .
h n=1
h
nh
Prenons h = b1m avec m ∈ N. Comme b est pair, pour n > m, on a eiπb −1 =
n−m
eiπb − 1 = 0. Alors
f (x + h) − f (x) m
= Sm−1 − 2am bm eiπb x ,
h
avec
m−1 nh
X n πx eiπb −1
|Sm−1 | = an eib
n=1
h
m−1
πbn h
 
n2
X
6 a sin
n=1
h 2
m−1
X am b m − 1
n n
6 π a b =π
n=0
ab − 1

où on a utilisé que | sin(x)| 6 x pour x ∈ R+ . Mais ab > 1 + π , donc


am b m − 1 am b m − 1
π <π = am bm − 1 < am bm .
ab − 1 π
On a donc |Sm−1 | 6 am bm . On en déduit :
mx mx
Sm−1 − 2am bm eiπb > 2am bm eiπb − |Sm−1 | > 2am bm − am bm = am bm .

Ainsi,
1

f x+ bm
− f (x)
1 > (ab)m −→ ∞,
m→∞
bm

ce qui prouve que f n'est pas dérivable en x.

Exemple (Fonction de Bolzano). Sur [0, 1], on part de la fonction x 7→ x. On


découpe [0, 1] en trois, on double les pentes des deux morceaux de la fonction aux
extrémités et on les rejoint par une ligne droite. On recommence à l'inni.
Exemple (Fonction de Van der Waerden). Pour x ∈ R, on note {x} la distance de
x à l'entier le plus proche. Alors la fonction f dénie par

X {10n x}
f (x) =
n=0
10n

est continue sur R mais dérivable en aucun point de R. Noter que x 7→ {x} est
1-périodique et continue sur [0, 1] avec {0} = {1} = 0, donc continue sur R. Par
conséquent les fonctions x 7→ {1010nx} sont continues sur R.
n

142 || Romain Giuge


3.4. Densité des fonctions continues et nulle part dérivables

Théorème (Théorème de Baire). Soit E est un espace métrique complet.


(i) Si (On )n∈N est une suite d'ouverts denses de E , alors ∩∞
n=1 On est encore dense
dans E .
(ii) Si (Fn )n∈N est une suite de fermés d'intérieur vide de E , alors ∪∞ n=1 Fn est
encore d'intérieur vide dans E .
Démonstration. On ne va que démontrer que (i) implique (ii) : il s'agit juste de
passer au complémentaire en remarquant qu'une partie A est dense si et seulement
si son complémentaire est d'intérieur vide. En eet, A est dense si et seulement si
tout ouvert rencontre A, ce qui est équivalent à ce qu'aucun ouvert n'est contenu
dans le complémentaire de A, et donc à ce que c A soit d'intérieur vide. On remarque
aussi que

! ∞
c [ \
c
Fn = Fn .
n=1 n=1

En eet, x ∈ c
(∪∞ équivaut à x 6∈
n=1 Fn ) n=1 Fn ,
∪∞ qui est équivalent à x 6∈ Fn pour
tout n, équivalent à x ∈ Fn pour tout n, équivalent à x ∈ ∩∞
c
n=1 Fn .
c

Références :
 Zuily et Queélec - Eléments d'analyse (2ème édition) - Page 263.
 Valiron - Page 160 (pour l'exemple de la fonction de Weierstrass).

143 || Romain Giuge


3.5. Densité des polynômes orthogonaux

3.5 Densité des polynômes orthogonaux


Théorème. Soient I un intervalle de R et ρ une fonction poids. On suppose qu'il
existe α > 0 tel que Z
eα|x| ρ(x) dx < ∞.
I
Alors les polynômes orthogonaux associés à ρ forment une base hilbertienne de
L2 (I, ρdλ), espace de Hilbert muni du produit scalaire
Z
(f, g) = f (x)g(x)ρ(x) dx.
I

Démonstration. On commence par noter que tout polynôme appartient à L2 (I, ρ),
donc en particulier les polynômes orthogonaux : par dénition de la fonction poids,
x 7→ xn ∈ L1 (I, ρ) pour tout n, donc les carrés de ces fonctions aussi. Le résultat
s'ensuit par linéarité.
Par dénition, les polynômes orthogonaux Pn associés à ρ forment une famille
orthonormale pour le produit scalaire (·, ·). Pour prouver qu'ils forment une base
hilbertienne, nous allons montrer que

{x 7→ Pn (x), n ∈ N}⊥ = {0},

ce qui démontrera le résultat (c'est l'une des caractérisations des bases hilbertiennes
lorsque la famille est orthonormée). Mais les X k s'expriment sur les Pn et récipro-
quement, c'est donc équivalent à montrer que {x 7→ xn , n ∈ N}⊥ = {0}.
Soit alors f ∈ L2 (I, ρ) telle que I xn f (x)ρ(x) dx = 0 pour tout n ∈ N. On veut
R

prouver que f = 0 presque partout.


On dénit la fonction ϕ sur R par :

f (x)ρ(x) si x ∈ I
ϕ(x) =
0 sinon.

On a la majoration évidente suivante :

|f (x)|ρ(x) 6 1 + |f (x)|2 ρ(x),




pour tout x ∈ I . Comme ρ et f 2 ρ sont intégrables sur I , on obtient ϕ ∈ L1 (R). On


peut donc considérer la transformée de Fourier de ϕ :
Z
ϕ̂(ω) = f (x)e−iωx ρ(x) dx
I

pour ω ∈ R.

144 || Romain Giuge


3.5. Densité des polynômes orthogonaux

On pose maintenant Bα = z ∈ C / |Im(z)| < α2 et on va montrer que ϕ̂ se




prolonge en une fonction holomorphe sur Bα . Soient g(z, x) = e−izx f (x)ρ(x) pour
x ∈ I et z ∈ Bα , et Z
F (z) = g(z, x) dx.
I
Montrons que F est bien dénie et holomorphe sur Bα . On vérie pour cela les
hypothèses du théorème d'holomorphie sous le signe intégral :
(i) Pour tout x ∈ I , z 7→ g(z, x) est holomorphe.
(ii) Pour tout z ∈ Bα , x 7→ g(z, x) est mesurable (comme produit de fonctions
mesurables).
α
(iii) Pour tout z ∈ Bα , |g(z, x)| 6 e 2 |x| |f (x)|ρ(x) qui est une fonction intégrable
sur I et indépendante de z . En eet, par l'inégalité de Cauchy-Schwarz :
Z Z  12 Z  21
α
|x| α|x| 2
e 2 |f (x)|ρ(x) dx 6 e ρ(x) dx |f (x)| ρ(x) dx < ∞.
I I I

La fonction F est donc holomorphe sur Bα et pour tout n ∈ N,


Z n Z
∂ g(z, x)
(n)
F (z) = n
dx = (−i) n
xn e−izx f (x)ρ(x) dx.
I ∂z I

En évaluant en zéro, on obtient :


Z
(n) n
F (0) = (−i) xn f (x)ρ(x) dx = 0
I

par l'hypothèse faite sur f .


Par unicité du développement en série entière, on en déduit que F est nulle sur
un voisinage de 0. Par le théorème du prolongement analytique, il s'ensuit que F est
nulle sur tout le connexe Bα . En particulier, F est nulle sur l'axe réel, i .e. ϕ̂ = 0. Par
injectivité de la transformée de Fourier, cela implique ϕ = 0 dans L1 (R). Comme
ρ(x) > 0 pour tout x, on en déduit que f (x) = 0 pour presque tout x ∈ I .

On peut donner l'exemple suivant pour justier que l'hypothèse d'existence d'un
α > 0 tel que Z
eα|x| ρ(x) dx < ∞
I
est nécessaire.

Exemple. Soient I =]0, ∞[ et la fonction de poids ρ(x) = x− ln(x) . Alors les po-
lynômes orthogonaux associés au poids ρ ne forment pas une base hilbertienne de
L2 (I, ρ).

145 || Romain Giuge


3.5. Densité des polynômes orthogonaux

Démonstration. Soit f : x 7→ sin(2π ln(x)) dénie sur I . En notant gn : x 7→ xn , on


calcule :
Z ∞ Z ∞
(n+1)2 n+1 2
(f, gn ) = n
f (x)x ρ(x) dx = e 4 e−(y− 2 ) sin(2πy) dy
0 −∞

par le changement de variables y = ln(x) qui est bien un C 1 -diéomorphisme de R∗+


sur R. Par le deuxième changement de variables ane t = y − n+1 2
, on obtient
Z ∞
(n+1)2 2
n
(f, gn ) = (−1) e 4 sin(2πt)e−t dt = 0
−∞

car la fonction intégrée est impaire.


On en conclut que la famille des gn n'est pas dense dans L2 (I, ρ). En eet, si P
est un polynôme,

kf − P k22 = (f − P, f − P ) = kf k22 + kP k22 > kf k22 > 0,

on ne pourra donc pas approcher f par un polynôme à ε près. La famille des poly-
nômes orthogonaux associés au poids ρ n'est alors pas dense dans L2 (I, ρ), ce n'est
donc pas une base hilbertienne.

Dénition (Fonction poids). Soit I un intervalle de R. On appelle fonction poids


une fonction ρ : I → R mesurable, strictement positive et telle que
Z
|x|n ρ(x) dx < ∞
I

pour tout n ∈ N.

Remarque. Par dénition de la fonction poids, la mesure ρdλ sur I est nie. En
particulier, on a l'emboîtement décroissant des espaces Lp (I, ρdλ), i .e. Lq (I, ρdλ) ⊂
Lp (I, ρdλ) si q > p.

Dénition (Polynôme orthogonaux). On dénit le k -ième polynôme orthogonal


associé au poids ρ par le polynôme unitaire de norme 1 qui dirige la droite vectorielle
orthogonale à Rk−1 [X] dans Rk [X]. Cette famille s'obtient également en appliquant
le procédé d'orthonormalisation de Gram-Schmidt sur la base canonique de R[X].
Les polynômes orthogonaux forment une famille échelonnée qui existe et est unique.

Théorème (Caractérisation des bases hilbertiennes). Soient H, (·, ·) un espace de




Hilbert séparable et (en )n∈N une famille orthonormée de H . Les propriétés suivantes
sont équivalentes :

146 || Romain Giuge


3.5. Densité des polynômes orthogonaux

(i) La famille orthonormée (en ) est une base hilbertienne, i .e.

H = Vect(en , n ∈ N).

(ii) Pour tout x ∈ H , x = , ce qui signie


P∞
n=0 (x, en )en

N
X
lim x− (x, en )en = 0.
N →∞
n=0

(iii) Pour tout x ∈ H , kxk2 = ∞ n=0 |(x, en )| .


2
P

(iv) On a : {en , n ∈ N}⊥ = {0}.


Théorème. La transformation de Fourier
F : L1 (R) −→ L∞ (R)
7−→ fˆ : ω 7→ R f (x)e−iωx dx
R
f

est un morphisme d'algèbres de la C-algèbre de Banach (L1 , +, ·, ∗, k · k1 ) sur la


C-algèbre normée (L∞ , +, ·, ×, k · k∞ ). C'est un opérateur injectif dont l'image est
dense dans L∞ . Il est de plus continu et sa norme d'opérateur vaut 1.

Références :
 Beck, Malick et Peyré - Objectif agrégation - Page 140.

147 || Romain Giuge


3.6. Ellipsoïde de John-Loewner

3.6 Ellipsoïde de John-Loewner


Théorème. Tout compact K de Rn contenant 0 dans son intérieur est contenu dans
un unique ellipsoïde de volume minimal.
Démonstration. Tout ellipsoïde de Rn centré en 0 est une boule unité fermée pour
un produit scalaire déni par S ∈ Sn++ (R), qu'on note BS . Si B est la boule unité

fermée canonique de Rn , alors en notant A = S −1 ,

x ∈ B ⇔ t xx 6 1 ⇔ t (Ax)S(Ax) 6 1 ⇔ Ax ∈ BS .

Par le changement de variables ϕ : B → BS , x 7→ Ax, C 1 -diéomorphisme, on


calcule le volume V (BS ) de BS :
Z Z
V (B)
V (BS ) = dλ(x) = |Jϕ (x)| dλ(x) = | det(A)|V (B) = p .
BS B det(S)

Soit l'application
µ : Sn++ (R) −→ R
S 7−→ √ 1
.
det(S)

Le but est de minimiser µ sur l'ensemble des S ∈ Sn++ (R) telles que K ⊂ BS . On va
montrer que µ est strictement convexe sur le convexe Sn++ (R). Soient R, S ∈ Sn++ (R).
Par le théorème de pseudo-réduction simultanée pour des matrices symétriques dé-
nies positives, il existe P ∈ GLn (R) telle que

R = t P P et S = t P Diag(s1 , . . . , sn ) P

où si > 0 pour tout i. Soit t ∈ [0, 1]. Pour y voir clair dans nos raisonnements de
convexité, on note ri = 1 pour tout i, de sorte que R = t P Diag(r1 , . . . , rn ) P . On a

µ(tR + (1 − t)S) = µ t P Diag(tr1 + (1 − t)s1 , . . . , trn + (1 − t)sn ) P




n
!− 21
Y
= det(P )2 (tri + (1 − t)si )
i=1
n  
1 Y 1
= exp − (ln(tri + (1 − t)si )
| det(P )| i=1
2
n  
1 Y 1
6 exp − (t ln(ri ) + (1 − t) ln(si )) ,
| det(P )| i=1 2

par concavité du logarithme. Ensuite,


1 Qn Qn
| det(P )|µ(tR + (1 − t)S) 6 e− 2 (t ln( i=1 ri )+(1−t) ln( i=1 si )) .

148 || Romain Giuge


3.6. Ellipsoïde de John-Loewner

1
Or x 7→ e− 2 x est convexe, donc
1 Qn Qn
| det(P )|µ(tR + (1 − t)S) 6 te− 2 ln( i=1 ri ) + (1 − t)e− 12 ln( i=1 si )

= t| det(P )|µ(R) + (1 − t)| det(P )|µ(S),

car ni=1 ri = det(P


det(R)
. On a donc la convexité de µ. De plus, la stricte concavité du
Q
)2
logarithme entraîne que s'il existe i tel que ri 6= si , alors l'inégalité est stricte. On a
donc égalité si et seulement si ri = si pour tout i, i .e. R = S . Donc µ est strictement
convexe.

Comme K est compact, il est borné : il existe r > 0 tel que K ⊂ rB . Mais
rB = BS0 où S0 = r12 In . On considère alors l'ensemble

E = {S ∈ Sn++ (R) / K ⊂ BS et µ(S) 6 µ(S0 )}.

L'ensemble E est :
(i) Non vide : S0 ∈ E .
(ii) Convexe : car µ est convexe. On vérie que si S1 , S2 ∈ E , tS1 +(1−t)S2 ∈ E :
µ(tS1 + (1 − t)S2 ) 6 µ(S0 ) par convexité de µ. De plus, pour tout x ∈ K ,
t
x(tS1 + (1 − t)S2 )x 6 1, donc K ⊂ BtS1 +(1−t)S2 .
(iii) Fermé : le seul point non trivial est que la limite d'une suite d'éléments de
E reste dénie positive, ce qui est assuré par la condition µ(S) 6 µ(S0 ) qui
implique det(S) > det(S0 ) > 0.
(iv) Borné : comme 0 est un point intérieur de K , il existe λ > 0 tel que K
contienne λB . Soit S ∈ E . On a λB ⊂ K ⊂ BS . Si x ∈ B , on a λx ∈ BS ,
√ √ √
i .e. t (λx)S(λx) 6 1, i .e. k Sxk2 6 λ12 . Donc k Sk = supkxk61 k Sxk 6 λ1 .
√ √
Il s'ensuit alors que kSk 6 k Skk Sk 6 λ12 .
(v) Compact : car fermé borné dans Mn (R) de dimension nie.
La fonction µ est continue (le déterminant et la racine carrée sont continues) sur
le compact E , donc y atteint son minimum. L'unicité du minimum est acquise par
la stricte convexité de µ sur le convexe E .

Application. Tout sous-groupe compact de GLn (R) est conjugué à un sous-groupe


de On (R).

149 || Romain Giuge


3.6. Ellipsoïde de John-Loewner

Démonstration. Soit G un sous-groupe compact de GLn (R). On note B la boule


unité fermée de Rn et on pose
[
K= AB.
A∈G

Alors K = Im(ϕ) avec


ϕ : G × B −→ Rn
(A, X) 7−→ AX.
L'application ϕ est continue sur le compact G × B , donc K est compact. De plus, K
contient 0 dans son intérieur car B ⊂ K . D'après le théorème, K est donc contenu
dans un unique ellipsoïde BS de volume minimal.
On va montrer que G ⊂ O(S) = {M ∈ Mn (R) / t M SM = S} le groupe ortho-
gonal associé à la matrice symétrique dénie positive S .
Soit M ∈ G. D'une part, on a immédiatement M K = K d'après la dénition
de K . D'autre part, on considère la suite (M p )p∈N d'éléments de G. Comme G
est compact, il existe une suite extraite (M pk )k∈N qui converge vers N ∈ G. Donc
| det(M )| > 1 car sinon on aurait det(N ) = limk→∞ det(M )pk = 0 alors que N
est inversible. De plus, l'application det est continue sur le compact G, donc y est
bornée, et donc nécessairement | det(M )| 6 1. Finalement, | det(M )| = 1.
Soit R = t M SM . Alors :
(i) R ∈ Sn++ (R). En eet, t xRx = t (M x)S(M x) > 0 car S ∈ Sn++ (R), et on
égalité si et seulement si M x = 0, i .e. x = 0 puisque M est inversible.
(ii) K ⊂ BR . En eet, si x ∈ K , t xRx = t (M x)S(M x) 6 1 car M x ∈ M K = K ⊂
BS .
(iii) det(R) = det(B)2 det(S) = det(S) car | det(B)| = 1. Donc µ(R) = µ(S) où
µ : Q 7→ √ 1 est la fonction dénie dans la démonstration du théorème.
det(Q)

Par unicité de l'ellipsoïde de volume minimal contenant K , on a donc R = S . Ainsi


t
M SM = S , ce qui signie que M ∈ O(S).

Remarque. Le résultat reste vrai dans un espace vectoriel réel E de dimension -


nie quelconque avec la même démonstration : il sut de munir E d'une structure
euclidienne quelconque.

Théorème (Pseudo-réduction simultanée). Soient S1 et S2 deux matrices symé-


triques réelles avec S1 dénie positive. Alors il existe P ∈ GLn (R) et D diagonale
réelle telles que
S1 = t P P et S2 = t P DP.

150 || Romain Giuge


3.6. Ellipsoïde de John-Loewner

Démonstration. Comme S1 est symétrique réelle, il existe A ∈ On (R) et D1 dia-


gonale telles que S1 = t AD1 A, et comme elle est dénie positive, on peut écrire
D1 = D102 . Alors en posant B = D10 A, on a

S1 = t AD102 A = t (D10 A)D10 A = t BB.

Ensuite, la matrice t B −1 S2 B −1 est symétrique réelle, il existe donc C ∈ On (R) et


D2 diagonale telles que t B −1 S2 B −1 = t CD2 C . En posant P = CB , on obtient

S2 = t B t CD2 CB = t P D2 P.

Enn, on vérie que


t
P P = t B t CCB = t BB = S1 .

Références :
 Alessandri - Thèmes de géométrie.
 Francinou, Gianella, Nicolas - Oraux X-ENS, Algèbre 3 - Page 229 (si on veut
quelques variations dans la méthode).

151 || Romain Giuge


3.7. Equation de la chaleur

3.7 Equation de la chaleur


Considérons une barre métallique. Connaissant, à l'instant initial, la température
en chaque point de la barre et, à tout instant, la température aux deux extrémités,
peut-on déterminer, à tout moment et en tout point, la température de la barre ?
Ce problème a été modélisé et la température u qui est une fonction du temps t et
du point x est solution d'une équation de la chaleur.
On peut supposer que la barre est le segment [0, L]. Notons Q =]0, L[×]0, ∞[,
Q = [0, L] × [0, ∞[.
On peut résoudre le problème simplié suivant à l'aide des séries de Fourier : on
cherche s'il existe une fonction u continue sur Q, de classe C 2 sur Q telle que :

∂2u




∂u
∂t
− ∂x2
= 0 sur Q,
u(0, t) = u(L, t) = 0, pour tout t ∈ [0, ∞[,

u(x, 0) = h(x), pour tout x ∈ [0, L],

où h est une fonction C 1 sur [0, L] telle que h(0) = h(L) = 0.


Le problème est simplié car ici la température aux extrémités est imposée
constante (l'équation étant linéaire, on a xé cette constante à 0).

Proposition. Le problème précédent admet une unique solution u. De plus, on a


u ∈ C ∞ (Q).

Démonstration. Nous ne montrerons que l'existence. Cherchons une solution de la


forme u(x, t) = f (x)g(t). Alors l'équation diérentielle vériée par u est équivalente
à
f (x)g 0 (t) = f 00 (x)g(t).
On peut essayer de chercher u telle que u(x, t) 6= 0 pour tout x ∈]0, L[ et tout
t ∈]0, ∞[. On a alors :
f 00 (x) g 0 (t)
= .
f (x) g(t)
0
Comme gg(t)
(t)
ne dépend pas de x, on en déduit qu'il existe λ ∈ R tel que f 00 (x) =
λf (x) pour tout x ∈]0, L[. On a aussi g 0 (t) = λg(t) pour tout t ∈]0, ∞[.
Si λ > 0, la solution générale pour f est
√ √
f (x) = Ae λx
+ Be− λx
.
√ √
La condition u(0, t) = u(L, t) = 0 conduit à A + B = 0 et Ae λL + Be− λL = 0,
puis A = B = 0. On aurait donc u = 0 qui ne satisfait pas u(x, 0) = h(x).
Si λ = 0, on a f (x) = Ax + B et la condition u(0, t) = u(L, t) = 0 donne encore
A = B = 0.

152 || Romain Giuge


3.7. Equation de la chaleur

Considérons maintenant le cas λ = −α2 < 0. Alors


2
f (x) = A cos(αx) + B sin(αx) et g(t) = Ce−α t .

La condition u(0, t) = 0 conduit à A = 0 et la condition u(L, t) = 0 donne


B sin(αL) = 0, donc α = nπ
L
avec n ∈ Z. On a donc une famille de solutions :
 nπ  n2 π2
un (x, t) = bn sin x e− L2 t .
L
An de pouvoir avoir u(x, 0) = h(x), on va envisager une somme innie de ces
solutions : ∞
X  nπ  n2 π2
u(x, t) = bn sin x e− L2 t
n=1
L
P∞
et essayer d'écrire h(x) = n=1 bn sin nπ x . Les bn doivent alors être les coecients

L
de Fourier d'une fonction périodique h̃ égale à h sur [0, L]. Il faudra aussi que la
série de Fourier de h̃ converge vers h̃ sur [0, L].

Soit h1 la fonction dénie sur [−L, L] par



h(x) si x ∈ [0, L]
h1 (x) =
−h(−x) si x ∈ [−L, 0].

Soit h̃ la fonction 2L-périodique égale à h1 sur [−L, L]. Comme h(L) = 0, h̃ est conti-
nue sur R et C 1 par morceaux. La série de Fourier de h̃ converge donc normalement
et ∞
2 L
X  nπ  Z  nπ 
h̃(x) = bn sin x avec bn = h(x) sin x dx,
n=1
L L 0 L

pour tout x ∈ R (les coecients de Fourier an sont nuls car h̃ est impaire). On note
que la convergence normale signie ici

X
|bn | < ∞.
n=1

Alors la fonction u dénie par



X  nπ  n2 π2
u(x, t) = bn sin x e− L2 t
n=1
L

est dénie et continue sur Q. En eet, la série la dénissant est normalement conver-
gente (son terme général est majoré par |bn |). La condition u(0, t) = u(L, t) = 0 est
trivialement vériée. De plus, si t ∈ [ε, M ] avec ε > 0, k, k1 , k2 ∈ N avec k1 + k2 = k ,
on a :
∂ k un 2 2
2k − nLπ2 ε
6 C k |b n |n e
∂xk1 ∂tk2

153 || Romain Giuge


3.7. Equation de la chaleur

k
qui est le terme général d'une série convergente. La série n>1 ∂x∂k1u∂tnk2 converge donc
P

normalement, donc uniformément (sur tout compact de Q), et donc u ∈ C k (Q). On


en déduit que u ∈ C ∞ (Q).

Pour montrer l'unicité, nous avons besoin du lemme suivant :

Lemme (Principe du maximum pour l'équation de la chaleur). Soit u une fonction


continue sur Q et C 2 sur Q telle que P u(x, t) > 0 sur Q, où P = ∂2
∂x2
− ∂
∂t
. Soient
T > 0 et K = [0, L] × [0, T ]. Alors

sup u = sup u.
K K∩∂Q

Démonstration. Soient ε > 0 et uε (x, t) = u(x, t)+εx2 . On a P uε = P u+2ε > 2ε sur


Q. Soit mε = (xε , tε ) un point de K où uε atteint son maximum sur K et supposons
que mε 6∈ K ∩ ∂Q. Alors xε ∈]0, L[. En notant g : x 7→ uε (x, tε ), on a

(x − xε )2
g(x) − g(xε ) = g 0 (xε )(x − xε ) + g 00 (xε ) + o (x − xε )2 .

2
Comme g atteint son maximum en xε , g(x) − g(xε ) 6 0, et en regardant l'égalité
pour x assez proche de xε (des deux côtés de xε , grâce au fait que xε ∈]0, L[), ceci
implique g 0 (xε ) = 0 et g 00 (xε ) 6 0. On obtient donc

∂uε ∂ 2 uε
(mε ) = 0 et (mε ) 6 0.
∂x ∂x2
D'autre part, comme tε ∈]0, T ], on peut toujours envisager son taux d'accroissement
en tε par valeur inférieure :

∂uε uε (xε , tε + h) − uε (xε , tε )


(mε ) = lim > 0.
∂t h→0
h<0
h

Il découle de tout cela que P uε (mε ) 6 0, ce qui contredit le fait que P uε > 2ε
sur Q.
Donc mε ∈ K ∩ ∂Q et :

sup u 6 sup u 6 sup uε = sup uε 6 sup u + εL2 .


K∩∂Q K K K∩∂Q K∩∂Q

En faisant tendre ε vers 0, on obtient

sup u = sup u.
K K∩∂Q

154 || Romain Giuge


3.7. Equation de la chaleur

Démontrons maintenant l'unicité de notre problème. Soient u et v deux solutions


et w = v − u. Alors w est continue sur Q, de classe C 2 sur Q et telle que P w = 0.
De plus, w = 0 sur ∂Q du fait des conditions initiales vériées par u et v . Fixons
T > 0. D'après le lemme, on a donc w(x, t) 6 0 sur [0, L] × [0, T ]. Mais P w = 0
implique qu'on a aussi P (−w) = 0, et donc toujours d'après le lemme, w(x, t) = 0
sur [0, L] × [0, T ]. Comme T est arbitraire, on en déduit w = 0 sur Q, i .e. u = v .

Remarque. 1. On peut montrer que le problème reste vrai si h est seulement


continue sur [0, 1].
2. La méthode utilisée permet de traiter d'autres équations comme l'équation
aux ondes :
∂ 2u ∂ 2u
− 2 =0
∂t2 ∂x
qui intervient dans tous les phénomènes de propagation d'ondes (son, lu-
mière,...) et l'équation de Laplace :

∂ 2u ∂ 2u
+ 2 =0
∂t2 ∂x
qui intervient par exemple en électromagnétisme.

Théorème. Si f est 2π-périodique, continue et C 1 par morceaux, alors la série de


Fourier de f converge normalement et f est égale à sa série de Fourier.
Démonstration. Comme f est C 1 par morceaux, on a cn (f 0 ) = incn (f ) et f 0 ∈ L2 (T).
D'après le théorème de Parseval, la série |cn (f 0 )|2 converge et
P

X X
|cn (f 0 )|2 = n2 |cn (f )|2 = kf 0 k22 .
n∈Z n∈Z

L'inégalité de Cauchy-Schwarz donne :


X X 1
|ck (f )| = k|ck (f )|
k
16|k|6n 16|k|6n
  12   21
X 1  X
6  k 2 |ck (f )|2 
k2
16|k|6n 16|k|6n
1

! 2
X 1
6 2 kf 0 k2
k=1
k2
π
= √ kf 0 k2 .
3

155 || Romain Giuge


3.7. Equation de la chaleur

En faisant tendre n vers l'inni, on obtient :


X π
|cn (f )| 6 |c0 (f )| + √ kf 0 k2 .
n∈Z
3

La série de Fourier de f est donc en particulier normalement convergente. Dans ce


cas, la série de Fourier de f converge uniformément (donc est continue), et f étant
continue, f est égal à sa série de Fourier (on montre que la série de Fourier de f et
f ont les mêmes coecients de Fourier, donc sont égales car continues).

Références :
 Zuily et Queélec - Eléments d'analyse (2ème édition) - Page 103.

156 || Romain Giuge


3.8. Etude du folium de Descartes

3.8 Etude du folium de Descartes


Nous allons faire l'étude complète de la courbe C donnée par l'ensemble des
(x, y) ∈ R2 tels que
x3 + y 3 − 3xy = 0,
appelée folium de Descartes.

Représentation paramétrique rationnelle :


Si (x, y) ∈ C et x = 0, alors y = 0. On suppose maintenant que x et y sont non
nuls. On résout 
y = tx
x3 + y 3 − 3xy = 0.

On obtient l'équation x2 ((1 + t3 )x − 3t) = 0 et y = tx. Comme x 6= 0, cela implique

3t2
 
3t
(x, y) = , .
1 + t3 1 + t3

En t = 0 on retrouve le point (0, 0). On a donc obtenu une représentation paramé-


trique rationnelle de C .

Symétries :
Les fonctions x et y sont dénies sur R\{−1}. On remarque que x 1t = y(t) et


y 1t = x(t). La courbe est donc symétrique par rapport à la première bissectrice.




On peut donc se contenter de faire l'étude sur I =] − 1, 1].

Variations :
On calcule les dérivées :
1 − 2t3 2 − t3
x0 (t) = 3 et y 0
(t) = 3t .
(t3 + 1)2 (t3 + 1)2
On obtient le tableau de variations suivant :
1
t −1 0 2− 3 1
2
x(t)−∞%0% 2 3 & 32
1
y(t)+∞&0% 2 3 % 32

On note qu'il n'y a pas de point stationnaire car x0 et y 0 ne s'annulent pas


simultanément (pas de point d'inexion à étudier).

Branches innies :
Notons que l'on passe par l'origine en t = 0 où on a une tangente horizontale
y(t)
puisque x(t) = t → 0.

157 || Romain Giuge


3.8. Etude du folium de Descartes

y(t)
Lorsque t tend vers −1, on a x(t)
= t → −1. On étudie donc

t2 + t 3t
x(t) + y(t) = 3 3
= → −1.
1+t 1 − t + t2
Donc la droite y = −x − 1 est asymptote à C , et la courbe est au-dessus de son
aymptote car

3t (t + 1)2
x(t) + y(t) + 1 = + 1 = > 0.
t2 − t + 1 t2 − t + 1

Courbe non lisse en 0 :


Comme ∂f ∂x
(0, 0) = ∂f
∂y
(0, 0) = 0, le théorème des fonctions implicites ne s'applique
pas.
Pour tout voisinage U de 0, le complémentaire de 0 dans C ∩ U a au moins
3 composantes connexes : il y en a en eet au moins une dans chacun des trois
quadrants ouverts du plan, x > 0 et y > 0, x > 0 et y < 0, x < 0 et y > 0 (que
l'on distingue par les signes de x(t) et y(t)). Il n'y a donc pas homémorphisme local
du folium de Descartes avec une droite. Le folium de Descartes n'est donc pas une
sous-variété.

Application du lemme de Morse :


La fonction f : (x, y) 7→ x3 + y 3 − 3xy est de classe C 3 sur R2 , et 0 est un!point
0 −3
critique de f non dégénéré : en eet, on a Df (0) = 0 et D2 f (0) = dont
−3 0
les valeurs propres sont −3 et 3. La forme quadratique hessienne D2 f (0) étant de
signature (1, 1), le lemme de Morse nous dit qu'il existe un changement de coordon-
nées local ϕ : (x, y) 7→ (u, v) de classe C 1 entre deux voisinages de l'origine dans Rn
tel que ϕ(0) = 0 et

f (x, y) − f (0, 0) = u2 (x, y) − v 2 (x, y).

158 || Romain Giuge


3.8. Etude du folium de Descartes

Alors f (x, y) = 0 équivaut à u2 (x, y) − v 2 (x, y) = 0, soit encore

u(x, y) + v(x, y) = 0 ou u(x, y) − v(x, y) = 0.

La courbe de niveau de f se décompose donc en deux courbes C + et C − dénies


implicitement par u + v = 0 et u − v = 0 : il y a un point double à l'origine.

Aire délimitée par la boucle :


On choisit la formule suivante pour l'aire délimitée par la boucle, qui va nous
donner une intégrale calculable :
Z
1
A= (x dy − y dx).
2 C
On note que la boucle est parcourue pour t variant entre 0 et +∞ et que ce sens de
parcours donne bien le sens trigonométrique. Ensuite, on tient compte du fait que
y(t) = tx(t) : on a alors x dy = x(t)(x(t) + tx0 (t)) dt, et y dx = tx(t)x0 (t) dt. On en
déduit :
∞
1 ∞ 1 ∞ 9t2
Z Z 
2 3 1 3
A= x(t) dt = 3 2
dt = − 3
= .
2 0 2 0 (1 + t ) 2 1+t 0 2

Théorème (Théorème des sous-variétés). Soient V un sous-ensemble de Rn , a ∈ V


et d ∈ N. Les quatre propriétés suivantes sont équivalentes :
(i) V est lisse en a, de dimension d.
(ii) (Dénition implicite) Il existe un voisinage ouvert U de a dans Rn et n − d
fonctions fi : U → R de classe C 1 telles que

x ∈ V ∩ U ⇐⇒ x ∈ U et f1 (x) = 0, . . . , fn−d (x) = 0,

et les diérentielles Df1 (a), . . . , Dfn−d (a) sont linéairement indépendantes.


(iii) (Graphe) Il existe un voisinage ouvert U de a dans Rn , un voisinage ouvert
U 0 de (a1 , . . . , ad ) dans Rd et n − d fonctions gi : U 0 → R de classe C 1 telles
que, après permutation éventuelle des coordonnées xi ,

(x , . . . , x ) ∈ U 0
1 d
x ∈ V ∩ U ⇐⇒
xd+1 = g1 (x1 , . . . , xd ), . . . , xn = gn−d (x1 , . . . , xd ).

159 || Romain Giuge


3.8. Etude du folium de Descartes

(iv) (Dénition paramétrique) Il existe un voisinage ouvert U de a dans Rn , un


voisinage ouvert Ω de 0 dans Rd et n fonctions ϕi : Ω → R de classe C 1 telles
que l'application
ϕ : u = (u1 , . . . , ud ) 7→ x = (ϕ1 (u), . . . , ϕn (u))

soit un homéomorphisme de Ω sur V ∩ U , avec a = ϕ(0) et que la matrice


jacobienne Dϕ(0) soit injective (i .e. de rang d).
Si on note f = (f1 , . . . , fn−d ), g = (g1 , . . . , gn−d ), ϕ = (ϕ1 , . . . , ϕn ), l'espace
vectoriel tangent en a à V est alors
(ii) Le noyau de Df (a).
(iii) Le graphe de Dg(a1 , . . . , ad ).
(iv) L'image de Dϕ(0).

Calcul de l'aire délimitée par une courbe plane :


On considère une courbe patatoïdale (fermée). On appelle A son point le plus
à gauche, d'abscisse a, et B son point le plus à droite, d'abscisse b. Alors on peut
voir le patatoïde comme réunion de deux courbes x 7→ y1 = f1 (x) et x 7→ y2 = f2 (x)
(celle "du bas" et celle "du haut"). L'aire délimitée par ce patatoïde est donc donnée
par : Z b Z b
A= y2 dx − y1 dx.
a a
Supposons maintenant que le patatoïde est déni paramétriquement par x = f (t)
et y = g(t). On suppose que la "courbe du bas" est décrite pour t ∈ [t0 , t1 ] et celle
"du haut" pour t ∈ [t1 , t2 ]. Alors comme dx = f 0 (t)dt,
Z b Z t2 Z b Z t1
y2 dx = − g(t)f (t) dt et
0
y1 dx = g(t)f 0 (t) dt,
a t1 a t0

et on obtient l'aire de notre boucle par la formule :


Z b Z b Z t2 Z
0
A= y2 dx − y1 dx = − g(t)f (t) dt = − y dx.
a a t0 C

La dernière écriture est une intégrale curviligne : on intègre par rapport au paramètre
t sur le pourtour C de la boucle, que l'on parcourt dans le sens trigonométrique (un
mobile parcourant la courbe voit l'intérieur à sa gauche).

Si on eectue une rotation d'angle π2 autour de l'origine, cela revient à changer


y en x et x en −y . On obtient donc une nouvelle expression de l'aire :
Z
A= x dy.
C

160 || Romain Giuge


3.8. Etude du folium de Descartes

On en déduit également l'expression suivante :


Z
1
A= (x dy − y dx).
2 C

Références :
 Rouvière - Petit guide de calcul diérentiel à l'usage de la licence et de l'agré-
gation - Page 237 et page 269 (pour l'aspect sous-variété).

161 || Romain Giuge


3.9. Formule des compléments

3.9 Formule des compléments


Lemme. Pour tout α ∈]0, 1[, on a :
Z ∞
1 π
Iα = dt = .
0 tα (1 + t) sin(πα)

Démonstration. Soit α ∈]0, 1[. On note Ω = C\R+ et on choisit la détermination du


logarithme log(z) = ln(r) + it pour z = reit ∈ Ω, t ∈]0, 2π[. On dénit alors z α par
z α = eα log(z) = rα eiαt pour z = reit ∈ Ω. La fonction z 7→ z α est ainsi holomorphe
sur Ω. On introduit ensuite la fonction f : z 7→ zα (1+z)1
dénie sur Ω\{−1}. La
fonction f est holomorphe sur Ω\{−1} et possède un pôle simple en −1 dont on
calcule le résidu :
1 1
Res−1 (f ) = lim (z + 1)f (z) = lim α
= lim α iαθ = e−iπα .
z→−1 z→−1 z r→1
θ→π
r e

Pour 0 < ε < 1 < R, on note Kε,R le compact délimité par :

Cε = {z ∈ C / |z| = ε et Re(z) 6 0} ,
+
n √ o
Iε,R = t + iε / 0 6 t 6 R2 − ε2 ,

n √ o
Iε,R = t − iε / 0 6 t 6 R2 − ε2 ,
Γε,R = Reiθ / θ ∈ [−π, π], |θ| > θε,R ,


 
où θε,R = arctan R2 −ε2 .
√ ε

162 || Romain Giuge


3.9. Formule des compléments

Le théorème des résidus nous donne :


Z
f (z) dz = 2πie−iπα
∂Kε,R

pour tout ε, R.
Nous allons maintenant calculer la limite de l'intégrale sur chaque morceau de
∂Kε,R quand ε → 0. Sur Cε , on a :
Z Z π Z 3π
2

2 ε
f (z) dz = f (εe )iε dθ 6 α iθ |

Cε 3π
2
π
2
ε |1 + εe
Z 3π
2 ε πε πε1−α
6 dθ = = −→ 0.
π
2
εα |1 − ε| εα (1 − ε) 1 − ε ε→0
Sur Γε,R , on a :
2π−θε,R 2π
ei(1−α)θ ei(1−α)θ
Z Z Z
1−α
f (z) dz = iR dθ −→ iR1−α dθ.
Γε,R θε,R 1 + Reiθ ε→0 0 1 + Reiθ
On étudie maintenant l'intégrale sur Iε,R
+
et sur Iε,R

. Pour t ∈]0, ∞[, on a :

(t + iε)α −→ tα et (t − iε)α −→ tα e2iπα ,


ε→0 ε→0

car arg((t − iε)α ) = α arg(t − iε) = α 2π − arctan εt −→ 2πα. D'autre part, on a



ε→0

1 1
|f (t + iε)| = 6 .
(t + iε)α (1 + t + iε) tα (1 + t)
Ce majorant est intégrable sur Iε,R
+
et sur Iε,R

et ne dépend pas de ε. On peut
appliquer le théorème de convergence dominée :
Z Z R Z Z 0 −2iπα
1 e
f (z) dz −→ α
dt et f (z) dz −→ α
dt.
+
Iε,R ε→0 0 t (1 + t) −
Iε,R ε→0 R t (1 + t)

On fait maintenant tendre ε vers 0 dans la formule donnée par le théorème des
résidus. On obtient :
Z R Z 2π i(1−α)θ
−2iπα 1 1−α e
(1 − e ) α (1 + t)
dt + iR iθ
dθ = 2iπe−iπα ,
0 t 0 1 + Re
et cela pour tout R > 1. Mais
Z 2π i(1−α)θ
R1−α 2π
Z
1−α e
iR dθ 6 dθ −→ 0.
0 1 + Reiθ R−1 0 R→∞

En faisant maintenant tendre R vers l'inni dans la formule précédente, on trouve :

(1 − e−2iπα )Iα = 2iπe−iπα .


On en conclut alors :
2i 2i π
Iα = π −2iπα
= π iπα −iπα
= .
eiπα (1 −e ) e −e sin(πα)

163 || Romain Giuge


3.9. Formule des compléments

Proposition (Formule des compléments). Pour tout z ∈ C tel que Re(z) ∈]0, 1[, on
a:
π
Γ(z)Γ(1 − z) = .
sin(πz)
Démonstration. On doit prouver l'égalité de fonctions holomorphes sur le domaine
{z ∈ C / Re(z) ∈]0, 1[}, il sut donc de prouver l'égalité pour z = α ∈]0, 1[. En
eet, leur fonction diérence est une fonction analytique qui aura ainsi un zéro non
isolé et sera donc nulle sur tout le domaine (principe des zéros isolés et principe du
prolongement analytique).
Soit α ∈]0, 1[. On note U = {(s, t) ∈ R2 / s, t > 0}. On a :
Z ∞  Z ∞ 
α−1 −t −α −s
Γ(α)Γ(1 − α) = t e dt s e ds
0 0
Z  α
1 t
= e−(t+s) dsdt
U t s
par le théorème de Fubini-Tonelli (tout est positif et intégrable). On eectue le
changement de variable ϕ : (s, t) 7→ s + t, st d'inverse ψ : (u, v) 7→ 1+v u uv
qui
 
, 1+v
dénit un C -diéomorphisme de U sur U (ϕ et ψ sont clairement diérentiables sur
1

U ). On calcule le jacobien de ψ en (u, v) :


! !
∂ψ1 ∂ψ1 1 −u
(u, v) (u, v) 2
= det 1+v (1+v)
 ∂u ∂v
Jψ (u, v) = det ∂ψ 2 ∂ψ2 v u
∂u
(u, v) ∂v (u, v) 1+v (1+v)2
u −uv u
= 3
− 3
= .
(1 + v) (1 + v) (1 + v)2

En posant f (s, t) = st e−(t+s) 1t , on a :
Z  α Z
1 t −(t+s)
e dsdt = f (s, t) dsdt
U t s
ZU

= f ψ(u, v) |Jψ (u, v)| dudv
ZU
1 u
= v α e−u uv dudv
U 1+v
(1 + v)2
Z
1
= v α e−u dudv
v(1 + v)
UZ ∞  Z ∞ 
−u 1
= e du dv .
0 0 v 1−α (1 + v)
| {z }| {z }
=1 =I1−α

D'où enn :
π π
Γ(α)Γ(1 − α) = I1−α = = .
sin π(1 − α) sin(πα)

164 || Romain Giuge


3.9. Formule des compléments

Dénition. Pour tout z ∈ C tel que Re(z) > 0, on dénit la fonction Γ, appelée
fonction gamma d'Euler, par :
Z ∞
Γ(z) = tz−1 e−t dt.
0

Cette intégrale converge absolument pour Re(z) > 0. La fonction Γ peut être pro-
longée analytiquement en une fonction méromorphe sur C\(−N), les nombres 0, −1,
−2, . . . étant des pôles de Γ.

Dénition. Soient U et V deux ouverts non vides de Rn et ϕ : U → V diérentiable


sur U . Si on écrit ϕ = (ϕ1 , . . . , ϕn ), le jacobien Jϕ (x) de ϕ en x ∈ U est le déterminant
de la matrice jacobienne de ϕ en x, i .e.
 
∂ϕ1 ∂ϕ1
(x) . . . (x)
 ∂x1. ∂xn
.. 
Jϕ (x) = det  .  . ... . .

∂ϕn
∂x1
(x) . . . ∂ϕ
∂xn
n
(x)

Théorème (Théorème de changement de variables). Soient U et V deux ouverts


non vides de Rn et ϕ : U → V un C 1 -diéomorphisme. On note λ la mesure de
Lebesgue sur Rn . Alors pour toute fonction f : V → R+ mesurable positive, on a :
Z Z
f (t) dλ(t) = f (ϕ(x))|Jϕ (x)| dλ(x).
V U

De plus, si f : V → R ou C, alors f est intégrable sur V si et seulement si (f ◦ϕ)|Jϕ |


est intégrable sur U , et dans ce cas l'égalité précédente est encore valable.

Références :
 Amar et Matheron - Analyse complexe - Page 249.

165 || Romain Giuge


3.10. Formule sommatoire de Poisson et application

3.10 Formule sommatoire de Poisson et application


Proposition (Formule sommatoire de Poisson). Soit F ∈ L1 (R) ∩ C 0 (R). On sup-
pose :
(i) Il existe M > 0 et α > 1 tels que pour tout x ∈ R, |F (x)| 6 M
(1+|x|)α
.
(ii) ∞ n=−∞ |F̂ (n)| < ∞.
P

Alors pour tout x ∈ R, les séries (à double sens) suivantes convergent et on a :



X ∞
X
F (x + n) = F̂ (n)e2iπnx .
n=−∞ n=−∞

Démonstration. Introduisons la fonction f : x 7→


P∞
F (x + n). La série la
n=−∞
dénissant est normalement convergente sur tout compact de R : en eet,

M
|F (x + n)| 6
(1 + |x + n|)α

et si A > 0, |x| 6 A, et |n| > 2A, alors |x + n| > |n| − |x| > |n| − A > |n| − |n|
2
= |n|
2
.
Donc
M
|F (x + n)| 6  α
|n|
1+ 2

qui est le terme général d'une série (à double sens) convergente. Comme F est par
hypothèse continue, f l'est aussi. On eectue le changement d'indice p = n + 1 :
X X
f (x + 1) = F (x + n + 1) = F (x + p) = f (x),
n∈Z p∈Z

qui nous donne que f est 1-périodique. On calcule son coecient de Fourier d'indice
m: Z 1 XZ 1
−2iπmt
cm (f ) = f (t)e dt = F (t + n)e−2iπmt dt,
0 n∈Z 0

où l'on a pu intervertir somme et intégrale par convergence normale de


P
F (x + n)
sur le compact [0, 1]. Puis :
XZ 1
cm (f ) = F (t + n)e−2iπm(t+n) dt
n∈Z 0
XZ n+1
= F (u)e−2iπmu du
n∈Z n
Z ∞
= F (u)e−2iπmu du = F̂ (m).
−∞

166 || Romain Giuge


3.10. Formule sommatoire de Poisson et application

Par hypothèse, m∈Z |F̂ (m)| converge, donc m∈Z |cm (f )| converge. On en déduit
P P

que la série de Fourier de f converge normalement, donc uniformément, et ainsi f


est somme de sa série de Fourier :

X ∞
X
f (x) = F (x + n) = F̂ (n)e2iπnx .
n=−∞ n=−∞

Selon la leçon, on pourra donner une des applications suivantes.

Application (Inversion de Fourier). Soit f ∈ L1 (R) ∩ C 0 (R). On suppose que f et


fˆ vérient l'hypothèse (i) de la formule sommatoire de Poisson. Alors
Z
f (x) = fˆ(t)e2iπxt dt
R

pour tout x ∈ R.
Démonstration. Soit g : x 7→ e−2iπxτ . On a :
Z Z
fcg(x) = f (t)g(t)e −2iπxt
dt = f (t)e−2iπ(x+τ )t dt = fˆ(x + τ ).
R R

On applique la formule sommatoire de Poisson à la fonction f g :


X X
(f g)(x + n) = fcg(n)e2iπnx ,
n∈Z n∈Z

soit
X X
f (x + n)e−2iπ(x+n)τ = fˆ(n + τ )e2iπnx .
n∈Z n∈Z

En multipliant des deux côtés par e , on obtient


2iπxτ

X X
f (x + n)e−2iπnτ = fˆ(n + τ )e2iπ(n+τ )x .
n∈Z n∈Z

On peut intégrer termes à termes par rapport à la variable τ (grâce aux hypothèses
de convergence) les deux membres de l'égalité : d'une part
Z 1X
f (x + n)e−2iπnτ dτ = f (x),
0 n∈Z

et d'autre part
Z 1X XZ n+1 Z
ˆ
f (n + τ )e 2iπ(n+τ )x
dτ = fˆ(t)e2iπtx dt = fˆ(t)e2iπtx dt,
0 n∈Z n∈Z n R

d'où le résultat.

167 || Romain Giuge


3.10. Formule sommatoire de Poisson et application

Remarque (Source : Wikipedia). La formule de transformation de Fourier inverse est


en fait valable si f et fˆ sont intégrables. Pour le prouver, on utilise cette formule
établie sous ces hypothèses plus fortes et une méthode de densité. On approche f
par une suite de fonctions (fp ) vériant les hypothèses de l'application qu'on vient
de donner et telle que (fp ) et (fbp ) convergent respectivement vers f et fˆ en norme
L1 (R). Pour obtenir une telle suite, on tronque f en l'annulant en dehors de [−p, p] et
en la régularisant par convolution. Soit alors ϕ une fonction de classe C 2 , d'intégrale
1 et à support borné. On pose ϕp (x) = pϕ(px) et on convole f|[−p,p] par ϕp . A vérier
si ça marche bien...

Application. Soit a > 0. On a alors


X 1 π
= coth(πa).
n∈Z
a2 +n2 a

Démonstration. Soit f : x 7→ e−2πa|x| . On a :


Z
fˆ(x) = e−2πa|t| e−2iπtx dt
ZR0 Z ∞
2πat −2iπtx
= e e dt + e−2πat e−2iπtx dt
−∞ 0
1 a
= .
π a2 + x 2
On peut appliquer la formule sommatoire de Poisson qui nous donne en x = 0 :
X X1 a
e−2πa|n| = .
n∈Z
π a2 + n 2 n∈Z

On calcule enn :

X
−2πa|n|
X
−2πan 1 1 + e−2πa
e =2 e −1=2 −1= = coth(πa),
n∈Z n=0
1 − e−2πa 1 − e−2πa

d'où le résultat.

Si F ∈ S(R) (l'espace de Schwartz), F̂ ∈ S(R) (voir [ZQ] page 321). Donc les
hypothèses de la formule sommatoire de Poisson sont vériées.

Application (Distributions). Pour N > 0, on pose TN = Nn=−N δn ∈ S 0 (R). Alors


P

la suite (TN )N ∈N converge dans S 0 (R) vers une distribution δZ qui vérie la relation
δˆZ = δZ .

168 || Romain Giuge


3.10. Formule sommatoire de Poisson et application

Démonstration. Soit ϕ ∈ S(R). D'après la formule sommatoire de Poisson en x = 0,


ϕ(n) converge, donc
P
n∈Z

N
X N
X ∞
X
(TN , ϕ) = (δn , ϕ) = ϕ(n) −→ ϕ(n).
N →∞
n=−N n=−N n=−∞
P∞
On dénit alors δZ par (δZ , f ) = n=−∞ f (n) pour f ∈ S(R).
Vérions que δZ est bien une distribution tempérée. Pour f ∈ S(R), on a
!
X X 1 X 1
|(δZ , f )| 6 |f (n)| = |f (0)| + 2
|n2 f (n)| 6 kf k0,0 + kf k2,0 ,
n∈Z ∗
n n∈Z ∗
n2 n∈Z

où kf kn,p = supx∈R |xn f (p) (x)| (ce sont les semi-normes dénissant la topologie de
S(R)). Donc δZ est une distribution tempérée.
Pour f ∈ S(R), on a par dénition de la transformée de Fourier sur S 0 (R) :
(δˆZ , f ) = (δZ , fˆ) = n∈Z fˆ(n). La formule sommatoire de Poisson en x = 0 nous
P

donne ensuite n∈Z fˆ(n) = n∈Z f (n), et on en déduit :


P P

X
(δˆZ , f ) = f (n) = (δZ , f ),
n∈Z

soit δˆZ = δZ .

Conventions :
 Pour f ∈ L1 (R), on dénit la transformée de Fourier de f sur R par
Z
fˆ : x 7→ f (t)e−2iπxt dt.
R

On a rajouté le facteur 2π dans l'exponentielle pour que la formule nale de


la formule de Poisson soit plus agréable.
 Pour f continue et 1-périodique sur R, on note (cn (f ))n∈Z la suite des coe-
cients de Fourier de f , dénis par
Z 1
cn (f ) = f (t)e−2iπnt dt.
0

Références :
 Zuily et Queélec - Eléments d'analyse, 2ème édition - Page 93.

169 || Romain Giuge


3.11. Lemme de Morse

3.11 Lemme de Morse


Lemme. Soit S0 ∈ Sn (R) une matrice symétrique inversible. Alors il existe un
voisinage U de S0 dans Sn (R) et une application f : U → GLn (R) de classe C 1 tels
que f (S0 ) = In et pour tout S ∈ U , S = t (f (S))S0 f (S).
Démonstration. Soit
ϕ : Mn (R) −→ Sn (R)
M 7−→ t M S0 M.
D'abord, ϕ est de classe C 1 (car polynomiale). En développant ϕ(In + H), on trouve
Dϕ(In ).H = t (S0 H)+(S0 H). Donc le noyau Ker(Dϕ(In )) est l'ensemble des matrices
H telles que S0 H soit antisymétrique.
On note maintenant

F = {M ∈ Mn (R) / S0 M ∈ Sn (R)},

qui est un sous-espace vectoriel de Mn (R) de même dimension que Sn (R) car S0 est
inversible. Soit alors ψ = ϕ|F . On a :

Ker(Dψ(In )) = Ker(Dϕ(In )) ∩ F = {0}

car S0 M ∈ An (R) ∩ Sn (R) implique S0 M = 0 et donc M = 0 puisque S0 est


inversible. La diérentielle Dψ(In ) est donc inversible (injective, donc surjective par
égalité des dimensions). On peut appliquer le théorème d'inversion locale : il existe
un voisinage ouvert V de In dans F et un voisinage ouvert U de S0 = ψ(In ) dans
Sn (R) tels que ψ|V : V → U est un C 1 -diéomorphisme. Comme GLn (R) est ouvert,
quitte à restreindre, on peut supposer V ⊂ GLn (R).
Ainsi, en posant f = ψ|V −1 : U → V , on obtient

ψ ◦ f (S) = S = t f (S)S0 f (S)

pour tout S ∈ U , d'où le résultat.

Théorème (Lemme de Morse). Soit f : U → R une fonction de classe C 3 sur un


ouvert U de Rn contenant l'origine. On suppose que 0 est un point critique non
dégénéré de f , i .e. Df (0) = 0 et la forme quadratique hessienne D2 f (0) est non
dégénérée, de signature (p, n − p). Alors il existe un changement de coordonnées
local ϕ : x 7→ u de classe C 1 entre deux voisinages de l'origine dans Rn tel que
ϕ(0) = 0 et
f (x) − f (0) = u21 + · · · + u2p − u2p+1 − · · · − u2n .

170 || Romain Giuge


3.11. Lemme de Morse

Démonstration. On écrit la formule de Taylor avec reste intégral à l'ordre 1 en 0 :


Z 1
f (x) − f (0) = (1 − t)D2 f (tx).(x, x) dt = t xQ(x)x,
0
R1
avec Q(x) = 0 (1 − t)D2 f (tx) dt matrice symétrique, Q est une fonction C 1 de x
car f est C 3 . On a Q(0) = 21 D2 f (0) matrice symétrique inversible car D2 f (0) non
dégénérée.
On applique le lemme : il existe U voisinage ouvert de Q(0) dans Sn (R) et g : U →
GLn (R) de classe C 1 tels que g(Q(0)) = In et pour tout S ∈ U , S = t (g(S))Q(0)g(S).
Comme Q est C 1 , en particulier continue, il existe un voisinage W de 0 dans Rn tel
que Q(x) ∈ U pour tout x ∈ W . Donc pour tout x ∈ W , Q(x) = t (M (x))Q(0)M (x)
avec M (x) = g(Q(x)) fonction C 1 de x comme composée de fonctions C 1 . D'où

f (x) − f (0) = t (y(x))Q(0)y(x)

avec y(x) = M (x)x. Or Q(0) = 21 D2 f (0) est de signature (p, n − p) : il existe donc
un changement linéaire de coordonnées y(x) = Au(x) avec A inversible tel que

t
yQ(0)y = t u t AQ(0)A u = u21 + · · · + u2p − u2p+1 − · · · − u2n .

On a bien la forme demandée pour f . Enn, l'application ϕ : x 7→ u = A−1 M (x)x


est C 1 . On calcule sa diérentielle à l'origine :

ϕ(x) − ϕ(0) = A−1 M (x)x − 0


= A−1 M (0) + DM (0).x + o (kxk) x


= A−1 M (0)x + (A−1 DM (0).x)x + o kxk2




= A−1 M (0)x + o (kxk) .

On en déduit que Dϕ(0) = A−1 M (0) = A−1 qui est inversible. D'après le théorème
d'inversion locale, ϕ est un C 1 -diéomorphisme entre deux voisinages de l'origine
dans Rn .

Remarque. La fonction f devient par changement de coordonnées une simple forme


quadratique (formule de Taylor sans reste). Le résultat s'étend immédiatement au
cas où Df (0) 6= 0 en remplaçant f (x) par g(x) = f (x) − f (0) − Df (0)x.

Remarque. Dans la démonstration du lemme, la diérentielle Dϕ(In ) est surjective :


pour un S donné dans Sn (R), on a Dϕ(In ).H = S pour la matrice H = 12 S0−1 S ∈
Mn (R). Mais cela ne sert pas.

171 || Romain Giuge


3.11. Lemme de Morse

On peut proposer l'application suivante qui consiste à étudier la position d'une


surface par rapport à son plan tangent :

Application. Soit S la surface d'équation z = f (x, y) où f est une fonction de


classe C au voisinage de a ∈ R2 . On suppose la forme quadratique D2 f (a) non
3

dégénérée et on note Π le plan tangent à S au point (a, f (a)). Alors :


(i) Si D2 f (a) est de signature (2, 0), alors S est au-dessus de Π au voisinage de
a.
(ii) Si D2 f (a) est de signature (0, 2), alors S est en-dessous de Π au voisinage de
a.
(iii) Si D2 f (a) est de signature (1, 1), alors S traverse Π selon deux courbes qui se
coupent en a.
Démonstration. Comme le plan Π a pour équation z = f (a) + Df (a).h, le problème
revient à étudier la diérence d'altitude

δ(h) = f (a + h) − f (a) + Df (a).h .

Quitte à translater, on peut supposer a = 0. Le lemme de Morse appliqué à δ


nous donne alors l'existence d'un C 1 -diéomorphisme h 7→ (u(h), v(h)) entre deux
voisinages de 0 dans R2 tel que

δ(h) = ε1 u(h)2 + ε2 v(h)2

où ε1 , ε2 ∈ {−1, +1}. En particulier, u et v ne s'annulent simultanément que pour


h = 0.
(i ) On obtient immédiatement δ(h) > 0, d'où le résultat.
(ii ) De même, δ(h) < 0 donne le résultat.
(iii ) On a δ(h) = u2 − v 2 et la surface S traverse son plan tangent Π selon une
courbe admettant un point double en (a, f (a)), dont la projection sur le plan
xOy se décompose en les deux courbes u = v et u = −v (dans le plan xOy ,
δ(h) qui représente l'altitude est nul, d'où u2 = v 2 , ce qui donne l'équation des
deux courbes).

172 || Romain Giuge


3.11. Lemme de Morse

Notation. Soit f : U → Rp avec U ouvert de Rn , k fois diérentiable en a ∈ U .


Pour simplier les formules de Taylor, on introduit la notation abrégée suivante :
pour h = (h1 , . . . , hn ) ∈ Rn , on note

k k k
X ∂kf
D f (a)(h) = D f (a)(h, h, . . . , h) = (a)hi1 . . . hik .
16i1 ,...,ik 6n
∂xi1 . . . ∂xik

Théorème (Formule de Taylor-Young). Si f : U → Rp est k fois diérentiable en


a ∈ U , U ouvert de Rn , on a
1 k
D f (a)(h)k + o khkk

f (a + h) = f (a) + Df (a).h + · · · +
k!
lorsque h tend vers 0 dans Rn .
Théorème (Formule de Taylor avec reste intégral). Si f : U → Rp , U ouvert de
Rn , est de classe C k+1 sur U , et si le segment [a, a + h] est entièrement contenu dans
U , on a
1
(1 − t)k k+1
Z
1
f (a+h) = f (a)+Df (a).h+· · ·+ Dk f (a)(h)k + D f (a+th)(h)k+1 dt.
k! 0 k!

Références :
 Rouvière - Petit guide de calcul diérentiel à l'usage de la licence et de l'agréga-
tion - Page 209 (le lemme), page 354 (le théorème) et page 341 (l'application).

173 || Romain Giuge


3.12. Maximalité et globalité des solutions de y 0 = f (t, y)

3.12 Maximalité et globalité des solutions de y0 =


f (t, y)
Théorème. Soient U un ouvert de R × Rn et y : [t0 , b[→ Rn une solution de
l'équation y0 = f (t, y) où f est une fonction continue sur U . Alors y peut se prolonger
au-delà de b si et seulement s'il existe un compact K ⊂ U tel que la courbe t 7→
(t, y(t)), t ∈ [t0 , b[, reste contenue dans K .

Démonstration. Si y se prolonge en b, alors l'image du compact [t0 , b] par l'applica-


tion continue t 7→ (t, y(t)) est un compact K ⊂ U .
Réciproquement, supposons qu'il existe un compact K de U tel que (t, y(t)) ∈ K
pour tout t ∈ [t0 , b[. Comme f est continue et K compact, on a

M = sup kf (t, z)k < ∞.


(t,z)∈K

Par l'inégalité de la moyenne, on a

ky(t1 ) − y(t2 )k 6 M |t1 − t2 |

pour tout t1 , t2 ∈ [t0 , b[. Par le critère de Cauchy, on en déduit que y(t) admet une
limite nie l lorsque t tend vers b à gauche. On peut prolonger y par continuité
en b en posant y(b) = l et on a (b, y(b)) ∈ K ⊂ U car K est fermé. De plus,
y 0 (t) = f (t, y(t)) → f (b, y(b)) quand t → b. Par le théorème de prolongement de la
dérivée, cela prouve que y 0 (b) existe et vaut f (b, y(b)).
Maintenant, le théorème d'existence locale des solutions implique qu'il existe une
solution locale z au problème de Cauchy de donnée initiale z(b) = l = y(b) sur un
intervalle [b − ε, b + ε]. On obtient alors un prolongement ỹ de y sur [t0 , b + ε] en
posant ỹ(t) = z(t) pour t ∈ [b, b + ε].

Théorème. Soit f : U → Rn une application continue sur un ouvert U = J × Rn


où J ⊂ R est un intervalle ouvert. On fait l'une ou l'autre des deux hypothèses
suivantes :
(i) Il existe une fonction continue k : J → R+ telle que pour tout t ∈ J xé,
l'application y 7→ f (t, y) soit lipschitzienne de rapport k(t) sur Rn .
(ii) Il existe des fonctions c, k : J → R+ continues telles que l'application y 7→
f (t, y) satisfasse une croissance linéaire à l'inni du type

kf (t, y)k 6 c(t) + k(t)kyk.

Alors toute solution maximale de l'équation diérentielle y0 = f (t, y) est globale, i .e.
dénie sur J tout entier.

174 || Romain Giuge


3.12. Maximalité et globalité des solutions de y 0 = f (t, y)

Démonstration. On remarque que l'hypothèse (i) entraîne l'hypothèse (ii) : en eet,


pour t ∈ J , l'hypothèse y 7→ f (t, y) est lipschitzienne implique

kf (t, y) − f (t, 0)k 6 k(t)ky − 0k,

pour tout y ∈ Rn . On obtient alors (ii) avec c(t) = kf (t, 0)k.


Nous allons donc pouvoir nous contenter de démontrer le résultat sous l'hypo-
thèse (ii). Supposons qu'on ait une solution y : [t0 , b[→ Rn avec t0 , b ∈ J (ainsi b
n'est pas la borne supérieure de J ). On pose C = supt∈[t0 ,b] c(t) et K = supt∈[t0 ,b] k(t).
Alors
ky 0 (t)k = kf (t, y(t))k 6 C + Kky(t)k
Rt
pour tout t ∈ [t0 , b[. Majorons maintenant ky(t)k. On a y(t) = y(t0 ) + t0 y 0 (u) du,
donc Z t
ky(t)k 6 v(t) = ky(t0 )k + ky 0 (u)k du.
t0

De plus, v (t) = ky (t)k 6 C + Kky(t)k 6 C + Kv(t). On intègre cette inéquation


0 0

diérentielle :
0
v(t)e−K(t−t0 ) = (v 0 (t) − Kv(t))e−K(t−t0 ) 6 Ce−K(t−t0 ) ,

d'où
C
v(t)e−K(t−t0 ) − v(t0 ) 6 1 − e−K(t−t0 ) .

K
Comme v(t0 ) = ky(t0 )k, il vient

C K(b−t0 )
− 1 + ky(t0 )keK(b−t0 ) .

sup ky(t)k 6 sup v(t) 6 R = e
t∈[t0 ,b[ t∈[t0 ,b[ K

Par conséquent, (t, y(t)) reste dans le compact K = [t0 , b] × B(0, R) de U = J × Rn .


D'après le théorème précédent, y peut se prolonger au-delà de b.
D'autre part, si y :]a, t0 ] → Rn est solution, avec a, t0 ∈ J , on pose z(t) =
y(t0 + a − t). Alors z : [a, t0 [→ Rn et vérie l'équation diérentielle z 0 = g(t, z) avec
g(t, z) = −f (t0 + a − t, z). Cette application g vérie l'hypothèse (ii), donc d'après
le premier cas eectué, z peut se prolonger au-delà de t0 , donc y peut se prolonger
au-delà de a. Finalement, toute solution maximale est nécessairement globale, sinon
elle pourrait se prolonger.

Application. Toute solution maximale de l'équation diérentielle y0 = t t2 + y 2 ,


p

(t, y) ∈ R × R, est globale.

175 || Romain Giuge


3.12. Maximalité et globalité des solutions de y 0 = f (t, y)

Démonstration. On note f (t, y) = t t2 + y2 . Alors


p

∂f 2ty
(t, y) = p 6 |t|
∂y 2 t2 + y 2

car √ |y| 6 1. Par l'inégalité des accroissements nis, y 7→ f (t, y) est lipschitzienne
t +y 2
2

de rapport k(t) = |t|. La fonction k étant continue, le théorème s'applique et les


solutions maximales de l'équation diérentielle sont globales.

Remarque. La fonction f : y 7→ y sin(y) vérie l'hypothèse (ii) du théorème mais


pas l'hypothèse (i). En eet, on a f 0 (y) = y cos(y) + sin(y), donc par l'égalité des
accroissements nis, pour tout y1 , y2 ∈ R, il existe y3 ∈]y1 , y2 [ tel que

|f (y1 ) − f (y2 )| = |y3 cos(y3 ) + sin(y3 )||y1 − y2 |.

Comme |y3 cos(y3 ) + sin(y3 )| n'est pas borné quand y1 et y2 varient dans R, f n'est
pas lipschitzienne sur R.
Remarque. Les conditions du théorème ne sont pas nécessaires. En eet, considérons
f : R −→ R
0 si y 6 0
y 7−→
y ln(y) si y > 0.

Alors f n'est pas lipschitzienne : si elle l'était, on aurait |f (y) − f (0)| 6 k|y − 0|
pour tout y > 0, soit |y ln(y)| 6 k|y| pour tout y > 0, soit encore | ln(y)| 6 k pour
tout y > 0 (faux au voisinage de 0 et au voisinage de l'inni). Donc f ne vérie pas
l'hypothèse (i) du théorème.
D'autre part, f ne vérie pas non plus l'hypothèse (ii) : sinon il existerait des
constantes c, k ∈ R telles que |y ln(y)| 6 c + k|y| au voisinage de l'inni, ce qui est
absurde. On note au passage que comme (i) implique (ii), si f ne vérie pas (ii),
elle ne peut pas vérier (i).
Résolvons maintenant l'équation diérentielle y 0 = f (y). Les fonctions constantes
égales à k ∈] − ∞, 0] ∪ {1} sont solutions sur R. Soient y une solution maximale et I
un intervalle sur lequel elle est strictement positive et diérente de 1 (s'il n'en existe
pas, alors y 0 = 0 sur tout intervalle où elle est dénie, donc y est constante égale à
k ∈] − ∞, 0] ∪ {1} sur tout son intervalle de dénition grâce à sa continuité, et cet
intervalle vaut nécessairement R puisque y est une solution maximale). Alors sur I ,
on a
y0
= 1.
y ln(y)
y0
Or ln(ln(y))0 = y ln(y)
, donc il existe K ∈ R tel que
t+K
y(t) = ee ,

176 || Romain Giuge


3.12. Maximalité et globalité des solutions de y 0 = f (t, y)

pour tout t ∈ I . Cette fonction est toujours strictement plus grande que 1, elle est
donc solution sur R. Toute solution maximale de l'équation diérentielle y 0 = f (y)
est donc globale bien qu'aucune des hypothèses du théorème ne soit vériée.

Conséquence immédiate du théorème de prolongement :

Corollaire (Critère de maximalité). Une solution y :]a, b[→ Rn de y 0 = f (t, y) est


maximale si et seulement si t 7→ (t, y(t)) s'échappe de tout compact K de U quand
t → a+ ou quand t → b− .
Puisque les compacts sont les fermés bornés, ceci signie encore que (t, y(t))
s'approche du bord de U ou tend vers l'inni, i .e.
1
|t| + ky(t)k + −→ ∞.
ou b−

d (t, y(t)), ∂U t→a+

Exemple. Voici un exemple de non-unicité d'une solution maximale à y0 = f (t, y)


lorsque f est seulement continue. On considère l'équation y0 = 3|y| 3 . Le problème de
2

Cauchy de condition initiale y(0) = 0 admet au moins deux solutions maximales :


y1 (t) = 0 et y2 (t) = t3 pour t ∈ R.

Références :
 Demailly - Analyse numérique et équations diérentielles - Pages 138 (pour le
critère de maximalité) et 144 (pour la globalité).

177 || Romain Giuge


3.13. Méthode de Newton

3.13 Méthode de Newton


Théorème. Soit I un intervalle de R et f : I → R. On suppose que f s'annule en
un point a ∈ ˚ I , que f est deux fois dérivable sur un voisinage de a, que f 0 (a) 6= 0 et
que f 00 est bornée. Alors la suite (xn ) dénie par
f (xn )
xn+1 = xn −
f 0 (xn )
converge quadratiquement vers a si x0 est susamment proche de a.
Démonstration. Quitte à changer f en −f , on peut supposer que f 0 (a) > 0. Comme
a∈˚ I et f 0 est continue (car dérivable) au voisinage de a, il existe α > 0 tel que
J = [a − α, a + α] ⊂ I et f 0 > 0 sur J . Pour x ∈ J , on pose :
f (x)
F (x) = x − .
f 0 (x)
On peut noter qu'ainsi, F (a) = a et F 0 (a) = 0 (calcul immédiat). On a :
f (x) f (a) − f (x) − (a − x)f 0 (x)
F (x) − a = x − a − = ,
f 0 (x) f 0 (x)
en ayant articiellement ajouté f (a) qui est nul par hypothèse. On applique main-
tenant la formule de Taylor-Lagrange : pour x ∈ J , il existe c entre a et x tel
que
f 00 (c)(x − a)2
F (x) − a = .
2f 0 (x)
Comme f 00 est bornée sur un voisinage de a qu'on peut supposer contenant J (quitte
à réduire J ), il existe M > 0 tel que pour tout x ∈ J ,
M
|F (x) − a| 6 |x − a|2 = C|x − a|2 ,
2f 0 (γ)
car f 0 est continue sur le segment J donc atteint sa borne inférieure en un γ ∈ J , et
on a ensuite noté C = 2fM 0 (γ) > 0.

On a donc pour tout x ∈ J ,

|F (x) − a| 6 C|x − a|2 6 Cα2 6 α,

quitte à réduire J en prenant α plus petit de sorte que Cα < 1. Ainsi, l'intervalle
J est stable par F . Pour x0 ∈ J , la suite (xn ) est donc bien dénie. De plus, pour
tout n > 0,
|xn+1 − a| = |F (xn ) − a| 6 C|xn − a|2 ,
2
soit encore, en multipliant par C : C|xn+1 − a| 6 C|xn − a| . Par une récurrence
immédiate, on obtient :
2n
C|xn − a| 6 C|x0 − a|
avec C|x0 − a| 6 Cα < 1, d'où la convergence quadratique.

178 || Romain Giuge


3.13. Méthode de Newton

Proposition. Sous les hypothèses du théorème précédent, en supposant de plus f


deux fois dérivable sur tout l'intervalle I et convexe sur I , toujours avec la supposi-
tion f 0 (a) > 0, alors tout x0 ∈ I avec x0 > a convient.
Démonstration. La fonction f étant convexe sur I , on a que f 0 est croissante (et
f 00 > 0), donc f 0 (x) > f 0 (a) > 0 pour tout x > a. La fonction F précédente est donc
désormais dénie pour tout x > a. De plus, la stricte positivité de f 0 (x) pour x > a
implique que f (x) > f (a) = 0, donc pour x > a :
f (x)
F (x) = x − < x,
f 0 (x)
De plus, en reprenant une égalité déjà établie plus haut :
f 00 (c)(x − a)2
F (x) − a = > 0,
2f 0 (x)
d'où F (x) > a pour tout x > a (ceci se voit aussi géométriquement par convexité
de f ). Ces deux inégalités montrent que l'intervalle I ∩ {x > a} est stable par F et
donc que la suite (xn ) est bien dénie pour tout n lorsque x0 > a. De plus, F (x) 6 x
implique la décroissance de (xn ), et même la stricte décroissance lorsque x0 6= a. La
suite (xn ) est décroissante minorée, elle converge donc vers une limite l > a vériant
F (l) = l, i .e. f (l) = 0, et le seul l possible est l = a (car f (x) > f (a) = 0 pour
x > a).
Enn, la décroissance de (xn ) est quadratique comme démontrée dans le théorème
précédent.

Ici, si on suppose f 00 continue (i .e. f de classe C 2 ) et strictement positive, l'in-


égalité de décroissance quadratique est essentiellement optimale car si x0 6= a, alors
xn > a pour tout n et
f 00 (cn )(xn − a)2
xn+1 − a =
2f 0 (xn )
avec a < cn < xn . Donc par continuité de f 00 :
xn+1 − a f 00 (a)
∼ > 0.
(xn − a)2 n→∞ 2f 0 (a)

On peut éventuellement donner l'exemple suivant :

Exemple. Soient y > 0 et la fonction f dénie par f (x) = x2 −y. On veut approcher

a= y.
On choisit comme intervalle d'étude [c, d] avec 0 < c < d et c2 < y < d2 (pour

que a = y soit compris entre c et d). Toutes les hypothèses du théorème et de la

179 || Romain Giuge


3.13. Méthode de Newton

proposition sont alors vériées pour f (f 00 = 2 > 0, donc f est convexe). On doit
alors itérer la fonction
x2 − y 1 y
F (x) = x − = x+ ,
2x 2 x
en partant d'un x0 > a, par exemple x0 > max(y, 1). L'erreur en = |xn − a| commise
à la n-ième itération est majorée par l'inégalité déjà établie :
2n
C|xn − a| 6 C|x0 − a| .

Ici, C = M
2f 0 (γ)
= kf 00 k∞
2f 0 (a)
= 2
4a
= 1
2a
. D'où :
 2n
x0 − a
en 6 2a .
2a
Bien sûr, si on a pris x0 trop grand, cette majoration ne nous donne rien. Mais la
convergence quadratique est quand même juste car d'après la démonstration faite,
la suite converge nécessairement vers a, donc pour n assez grand, la majoration
quadratique de l'erreur sera valable.

Sur l'origine de cette méthode : pour résoudre f (x) = 0, on cherche à transformer


l'équation en un problème équivalent de point xe, de la forme F (x) = x. Cela peut
se faire de plusieurs manières, par exemple en prenant F (x) = x + λ(x)f (x) où λ est
une fonction ne s'annulant pas. On sait que la convergence de la suite xn+1 = F (xn )
vers la solution a recherchée (point xe de F et zéro de f ) sera très rapide si ce
point a est superattractif, i .e. si F 0 (a) = 0. Or

F 0 (a) = 1 + λ0 (a) f (a) +λ(a)f 0 (a) = 1 + λ(a)f 0 (a).


|{z}
=0

On est donc incité à choisir λ(x) = − f 01(x) et à considérer la suite récurrente

f (xn )
xn+1 = xn − .
f 0 (xn )

Application pour les polynômes :


Soit P (x) = (x − α1 )m1 . . . (x − αr )mr où α1 < · · · < αr sont des réels et les mi
sont des entiers non nuls. D'après le théorème de Gauss-Lucas, les racines de P 0 sont
dans l'enveloppe convexe (dans C) des racines de P . Donc les racines de P 0 et celles
de P 00 sont dans [α1 , αr ], et donc P 0 et P 00 ne s'annulent pas sur ]αr , ∞[.

On a les deux résultats suivants :

180 || Romain Giuge


3.13. Méthode de Newton

Proposition. Si x0 > αr , alors la suite (xn ) décroît strictement et converge vers


αr .

Démonstration. On a pour tout x, P 0 (x) Pr


i=1 x−αi . Donc pour tout n > 0,
mi
P (x)
=

r
!−1
X mi
xn+1 = xn − .
i=1
xn − α i
P (x)
En particulier si xn > αr , alors xn+1 < xn . En dérivant F (x) = x − P 0 (x)
, on trouve
P (x)P 00 (x)
F 0 (x) = P 0 (x)2 . Donc F 0 > 0 sur ]αr , ∞[ car P est unitaire et on a dit plus haut
que P , P 0 , P 00 ne s'annulent pas sur ]αr , ∞[. Donc F est strictement croissante sur
]αr , ∞[. Si αr < xn , alors αr = F (αr ) < F (xn ) = xn+1 . La condition x0 > αr
implique donc que xn > αr pour tout n > 0.
Finalement, la suite (xn ) est décroissante minorée, elle converge donc vers un
élément qui annule PP0 , i.e. vers αr .

Proposition. En ayant
n choisit x0 > αr , si mr > 2, alors il existe c > 0 tel que
|xn − αr | ∼ c 1 − 1
mr
.
Démonstration. Comme P 0 (x) Pr
i=1 x−αi , on a en dérivant cette égalité :
mi
P (x)
=
r
P 00 (x)P (x) P 0 (x)2 X mi
− = − .
P (x)2 P (x)2 i=1
(x − α i )2

P (x)
On dérive ensuite F (x) = x − P 0 (x)
:

P (x)P 00 (x)
F 0 (x) =
P 0 (x)2
2
P (x)P 00 (x) P (x)

=
P (x)2 P 0 (x)
 !2  !−2
r r r
X m i
X m i
X mi
=  − 2

i=1
x − α i i=1
(x − α i ) i=1
x − αi
r
! r
!−2
X mi X mi
= 1− 2
.
i=1
(x − α i ) i=1
x − α i

En multipliant le numérateur et le dénominateur par (x − αr )2 , on a :


! !−2 Pr (x−αr )2

i=1 mi (x−αi )2
r r
X mi X mi mr 1
2
= 2 −→ 2 = .
(x − αi ) x − αi x→αr mr mr
 P r x−αr
i=1 i=1
i=1 mi x−αi

D'où :
1
F 0 (αr ) = lim F 0 (x) = 1 − < 1.
x→αr mr

181 || Romain Giuge


3.13. Méthode de Newton

D'après la proposition précédente, la suite (xn ) est décroissante et converge vers


αr . Ainsi par l'inégalité des accroissements nis, si on choisit d ∈]F 0 (αr ), 1[, alors
|xn − αr | = O (dn ).
D'après la formule de Taylor-Lagrange, il existe zn ∈]αr , xn [ tel que

F 00 (zn )
xn+1 − αr = F 0 (αr )(xn − αr ) + (xn − αr )2 .
2
D'où :
xn+1 − αr
εn = 0
− 1 = O (xn − αr ) = O (dn ) .
F (αr )(xn − αr )
On passe au logarithme :

ln(1 + εn ) = ln(xn+1 − αr ) − ln(xn − αr ) − ln(F 0 (αr )).


O O
| {z }
= (εn )= (dn )

Par conséquent, la série dénie par ce terme général converge, ce qui signie que
ln(xn − αr ) − n ln(F 0 (αr )) converge vers un réel λ. Finalement :
 n
λ 0 n λ 1
xn − αr ∼ e F (αr ) = e 1 − .
mr

Donc tout x0 > αr convient pour avoir la convergence de (xn ) vers αr . Pour
trouver un tel x0 , on écrit P = xn + an−1 xn−1 + · · · + a0 , et alors si P (α) = 0, on a
n−1
X n−1
X
n i
|α| = ai α 6 |ai ||α|i .
i=0 i=0

Pn−1
Si |α| > 1, en divisant cette inégalité par |α|n−1 , on obtient |α| 6 i=0 |ai |. D'où :
n−1
!
X
|αr | 6 max 1, |ai | .
i=0

Pn−1
Il nous sut donc ne prendre n'importe quel x0 plus grand que max 1, i=0 |ai | .


Par ailleurs, il est conseillé de diviser P par le PGCD de P et P 0 de sorte que αr


soit racine simple, ce qui donne une convergence plus rapide.
Pour trouver les autres racines de P , on peut appliquer la méthode de Newton à
P (x)
(x−αr )mr
, mais cela pose des problèmes de stabilité car on n'a qu'une valeur approchée
de αr .

Théorème (Gauss-Lucas). Les racines de P 0 sont dans l'enveloppe convexe des


racines de P .

182 || Romain Giuge


3.13. Méthode de Newton

Démonstration. Ecrivons P = (X − α1 )m1 . . . (X − αr )mr . Alors


r
P 0 (x) X mi
= .
P (x) i=1
x − α i

Soit β une racine de P 0 . S'il s'agit aussi d'une racine de P , alors le résultat est clair.
Sinon on a : r r
P 0 (β) X mi X β − αi
= = mi = 0.
P (β) i=1
β − αi i=1
|β − αi |2
D'où : r r
X mi X mi
β 2
= αi .
i=1
|β − αi | i=1
|β − αi |2
En posant ai = mi
|β−αi |2
, on a donc :

r
X a
β= Pr i αi ,
i=1 j=1 aj

d'où le résultat.
Remarque : Dans le cas où les racines sont toutes réelles, le résultat s'obtient
aussi en remarquant que chaque αi est une racine de P 0 de multiplicité mi − 1 et
en appliquant le théorème de Rolle sur chaque intervalle ]αi , αi+1 [, on obtient r − 1
autres racines. On a alors bien n − 1 racines, toutes comprises entre les αi .

Références :
 Rouvière - Petit guide de calcul diérentiel à l'usage de la licence et de l'agré-
gation - Page 152.
 Chambert-Loir - Exercices d'analyse 2 (pour l'application aux polynômes).

183 || Romain Giuge


3.14. Nombres de Bell

3.14 Nombres de Bell


Proposition. Pour n ∈ N∗ , on note Bn le nombre de partitions de l'ensemble [[1, n]],
avec B0 = 1 par convention. Alors :
(i) La série entière Bn!n z n a un rayon de convergence R > 0 et en notant f sa
P

somme, on a
z −1
f (z) = ee
pour tout |z| < R.
(ii) Pour tout k ∈ N, on a

1 X nk
Bk = .
e n=0 n!

Démonstration. Pour k ∈ [[1, n]], on note Ek l'ensemble des partitions de [[1, n + 1]]
pour lesquelles la partie de [[1, n + 1]] contenant n + 1 est de cardinal k + 1. Alors on
a:  
n
Card(Ek ) = Bn−k .
k
En eet, il y a nk choix possibles pour la partie à k +1 éléments contenant l'élément


n + 1 (on a k éléments à choisir dans [[1, n]]), puis il faut réaliser une partition des
n − k éléments restants.
Les ensembles E0 , E1 , . . . , En forment clairement une partition de l'ensemble des
partitions de [[1, n + 1]]. On a donc
n   n  
X n X n
Bn+1 = Bn−k = Bj
k=0
k j=0
j

car n−k
n
= nk . On montre maintenant par récurrence sur n que Bn 6 n!. Pour
 

n = 0 et n = 1, c'est clair : B0 = 1, B1 = 1. Supposons que Bk 6 k! pour tout


k 6 n. Alors
n   n
X n X 1
Bn+1 6 k! = n! 6 (n + 1)!.
k=0
k (n − k)!
k=0 | {z }
61

Donc pour tout n ∈ N∗ , Bn


n!
6 1, ce qui prouve que le rayon de convergence R est
> 1.
Pour |z| < R, on a

X Bn+1 n+1
f (z) = 1 + z .
n=0
(n + 1)!
La fonction f est dérivable sur son disque ouvert de convergence et

0
X Bn+1
f (z) = zn.
n=0
n!

184 || Romain Giuge


3.14. Nombres de Bell

Donc pour tout |z| < R,


∞ n  
! ∞ n
!
0
X 1 X n n
X X Bk 1
f (z) = Bk z = zn.
n=0
n! k=0
k n=0 k=0
k! (n − k)!

On reconnaît dans le terme de droite le produit de Cauchy des séries z et


P Bn n
n!
P zn
n!
qui ont toutes deux un rayon de convergence > R. Donc pour |z| < R, on a

f 0 (z) = f (z)ez .
z
On en déduit qu'il existe C ∈ C tel que f (z) = Cee . En évaluant en 0, comme
f (0) = B0 = 1, on trouve C = e−1 . D'où
z −1
f (z) = ee .

On a donc démontré le point (i), et on peut remarquer que l'expression de f donne


R = ∞.
Pour tout z ∈ C, on a :
∞ ∞ ∞
ez
X enz X 1 X (nz)k
e = = .
n=0
n! n=0
n! k=0 k!

(nz)k
En notant un,k = n!k!
, on a, pour tout n ∈ N,
∞ ∞
X X |nz|k e|nz|
|un,k | = = .
k=0 k=0
n!k! n!

Puis, n
∞ ∞
X e|nz| X e|z| |z|
= = ee .
n=0
n! n=0
n!
P P∞
Donc la série n k=0 |un,k | est convergente. Par le théorème de Fubini pour les
séries doubles, on peut intervertir les symboles sommes :
∞ X ∞ ∞ X∞ ∞ ∞
!
k
X X X X n zk
f (z) = e−1 un,k = e−1 un,k = e−1 .
n=0 k=0 n=0 k=0 n=0
n! k! k=0

Par unicité du développement en série entière de f , on obtient



−1
X nk
Bk = e
n=0
n!

pour tout k ∈ N.

Formulation adaptée pour la leçon "Anneau des séries formelles, applications" :

185 || Romain Giuge


3.14. Nombres de Bell

Proposition. Pour n ∈ N∗ , on note Bn le nombre de partitions de l'ensemble [[1, n]],


avec B0 = 1 par convention. Alors pour tout k ∈ N, on a

1 X nk
Bk = .
e n=0 n!

Démonstration. Pour k ∈ [[1, n]], on note Ek l'ensemble des partitions de [[1, n + 1]]
pour lesquelles la partie de [[1, n + 1]] contenant n + 1 est de cardinal k + 1. Alors on
a:  
n
Card(Ek ) = Bn−k .
k
En eet, il y a nk choix possibles pour la partie à k +1 éléments contenant l'élément


n + 1 (on a k éléments à choisir dans [[1, n]]), puis il faut réaliser une partition des
n − k éléments restants.
Les ensembles E0 , E1 , . . . , En forment clairement une partition de l'ensemble des
partitions de [[1, n + 1]]. On a donc
n   n  
X n X n
Bn+1 = Bn−k = Bj
k k=0 j=0
j

car n
= nk .
 
n−k
P∞
On note F = Bn
n=0 n! X
n
la série génératrice exponentielle de (Bn ). On dérive
F :

0
X Bn+1
F = Xn
n=0
n!
∞ n  
!
X 1 X n
= Bk Xn
n=0
n! k=0
k
∞ n
!
X X Bk 1
= X n.
n=0 k=0
k! (n − k)!

On reconnaît dans le terme de droite le produit des séries formelles X et


P Bn n
n!
P Xn
n!
. On a donc
F 0 = E1 F,
où E1 = ∞ Xn
n=0 n! .
P

On sait que l'équation A0 = E1 A admet une unique solution dans C[[X]] lorsque
A(0) est donné. En eet, en écrivant A = ∞ n=0 an X , on obtient (n + 1)an+1 =
n
P
Pn
k=0 (n−k)! , ce qui détermine uniquement la suite (an ) en fonction de a0 .
ak

Comme on a F (0) = B0 = 1, on va chercher une série entière f = an z n


P

vériant f 0 (z) = E1 (z)f (z) et f (0) = 1. La série formelle n=0 an X sera alors
n
P

égale à F .

186 || Romain Giuge


3.14. Nombres de Bell

z
L'équation f 0 (z) = E1 (z)f (z) = ez f (z) s'intègre en f (z) = Kee , et f (0) = 1
donne K = e−1 . Pour tout z ∈ C, on a :
∞ ∞ ∞
z
X enz X 1 X (nz)k
ee = = .
n=0
n! n=0
n! k=0
k!

(nz)k
En notant un,k = n!k!
, on a, pour tout n ∈ N,
∞ ∞
X X |nz|k e|nz|
|un,k | = = .
k=0 k=0
n!k! n!

Puis, n
∞ ∞
X e|nz| X e|z| |z|
= = ee .
n=0
n! n=0
n!
P P∞
Donc la série n k=0 |un,k | est convergente. Par le théorème de Fubini pour les
séries doubles, on peut intervertir les symboles sommes :
∞ X ∞ ∞ X∞ ∞ ∞
!
k
X X X X n zk
f (z) = e−1 un,k = e−1 un,k = e−1 .
n=0 k=0 n=0 k=0 n=0
n! k! k=0

Finalement,
∞ ∞ ∞
!
X Bk k −1
X X nk Xk
F = X =e ,
k=0
k! k=0 n=0
n! k!
d'où l'on déduit ∞
−1
X nk
Bk = e
n=0
n!
pour tout k ∈ N.

Références :
 Francinou, Gianella, Nicolas - Oraux X-ENS, Algèbre 1 - Page 14.
 Saux-Picart - Cours de calcul formel, Algorithmes fondamentaux - Page 132
(exercice 14, pour une idée dans le cadre des séries formelles).

187 || Romain Giuge


3.15. Nombres normaux

3.15 Nombres normaux


On considère l'espace de probabilité (Ω, A, P ) constitué des irrationnels de [0, 1]
avec leur tribu borélienne A et la probabilité induite par la mesure de Lebesgue :
R1
P (B) = 0 1lB (x) dx si B ∈ A.

Théorème. Presque tout irrationnel est normal.


Démonstration. Soient r > 2 et A = {0, 1, . . . , r−1}. Pour x ∈ Ω, on note (εn (x))n>1
le développement propre de x en base r. On commence par montrer que les v .a. εn
sont indépendantes sous P et de même loi uniforme sur A.
Soient a1 , . . . , aN ∈ A. On montre que :
# N N
"
X an X an 1
{ε1 = a1 , . . . , εN = aN } = , + ∩ Ω.
n=1
rn n=1 rn rN
P∞ εn (x)
En eet, si x = n=1 rn
avec εn (x) = an pour tout n ∈ [[1, N ]], alors

N ∞ N
X an X r − 1 X an 1
x6 + = + ,
n=1
rn n=N +1
r n
n=1
r n r N

et l'inégalité est stricte puisque x est irrationnel. On a donc que l'ensemble de gauche
est inclu dans celui de droite. Pour l'autre inclusion, voir ((i)) des compléments.
Par conséquent, P (ε1 = a1 , . . . , εN = aN ) = r1N (la mesure de l'ensemble de
droite). Par ailleurs, on a
X X 1 rN −1 1
P (ε1 = a1 ) = P (ε1 = a1 , . . . , εN = aN ) = N
= N
= .
a2 ,...,aN ∈A a2 ,...,aN ∈A
r r r

De même, P (εi = ai ) = 1r , et on trouve ainsi :

1
P (ε1 = a1 , . . . , εN = aN ) = = P (ε1 = a1 ) . . . P (εN = aN ),
rN
ce qui prouve l'indépendance des εi (voir ((ii)) des compléments) qui suivent une loi
uniforme sur A.

Soit b ∈ A. On note Xj = 1l{εj =b} et

Nb,n (x) = Card({i ∈ [[1, n]] / εi (x) = b}).

Alors par la loi forte des grands nombres (X1 ∈ L1 ), on a :

Nb,n X1 + · · · + Xn p.s. 1
= −→ E[X1 ] = P (ε1 = b) = .
n n n→∞ r

188 || Romain Giuge


3.15. Nombres normaux

Ceci étant vrai pour tout b ∈ A, on en déduit que presque tout x ∈ Ω est simplement
normal en base r.
Soit maintenant b = (u, v) ∈ A2 . On note Yi = 1l{εi =u, εi+1 =v} . Alors en notant
Nb,n (x) = Card({i ∈ [[1, n − 1]] / εi (x) = u, εi+1 (x) = v}), on a

Nb,n Y1 + · · · + Yn−1
= .
n n
On ne peut pas conclure directement car les Yi ne sont pas indépendantes. Mais les
Yi sont identiquement distribuées, et (Y1 , Y3 , . . . ) d'une part et (Y2 , Y4 , . . . ) d'autre
part sont des suites indépendantes. Par la loi forte des grands nombres, on obtient :
 p.s.
 Y1 +Y3 +···+Y2n−1 −→ E[Y1 ] = P (ε1 = u, ε2 = v) = r12
n n→∞
p.s.
 Y2 +Y4 +···+Y2n −→ 1
n
E[Y2 ] = P (ε2 = u, ε3 = v) = r2
.
n→∞

Donc
  
Y1 +Y3 +···+Y2n−1 p.s.
 Y1 +Y2 +···+Y2n = 1 Y2 +Y4 +···+Y2n 1 1
+ r12 1

2n 2 n
+ n
−→ 2 r2
= r2
 n→∞ 
 Y1 +Y2 +···+Y2n−1 = n Y1 +Y3 +···+Y2n−1 Y2 +Y4 +···+Y2n−2 p.s.
2n−1 2n−1 n
+ n
−→ 12 .
n→∞ r

On en déduit que
Nb,n p.s. 1
−→ .
n n→∞ r2
On peut faire de même avec les mots b ∈ Ak de longueur k > 1.

On note à présent Er = {x ∈ Ω / x est normal en base r}. Alors


∞ \  
\ Nb,n (x) 1
Er = x ∈ Ω/ −→
n n→∞ r k
k=1 k b∈A

est de probabilité 1 comme intersection dénombrable d'événements de probabilité


1. Enn, on note E = {x ∈ Ω / x est normal}. Alors E = r>2 Er et on a de même
T

P (E) = 1 (voir ((iii)) des compléments), ce qui termine la démonstration.

Compléments de la démonstration :
(i) Montrons que
N N
# "
X an X an 1
{ε1 = a1 , . . . , εN = aN } ⊃ n
, n
+ N ∩ Ω.
n=1
r n=1 r r

189 || Romain Giuge


3.15. Nombres normaux

Fixons x = ∞ εn (x)
n=1 rn dans l'ensemble de droite. Supposons qu'il existe i 6 N
P

tel que εi (x) 6= ai et considérons le plus petit i vériant cette propriété. On


note SN = N n=1 rn . Alors
an
P

N ∞
εi (x) − ai X εn (x) − an X εn (x)
x − SN = i
+ n
+ n
.
r n=i+1
r n=N +1
r
| {z }
= Ri

On a |Ri | 6 ∞ n=i+1 rn 6 ri , et l'inégalité est stricte puisque x est irrationnel.


r−1 1
P
PN
D'autre part, Ri > n=i+1 εn (x)−a
rn
n
et l'inégalité est aussi stricte. Il vient alors
en calculant :
N 1
X r−1 ri+1
− rN1+1 1 1
Ri > − n
= −(r − 1) 1 = − i + N.
n=i+1
r 1− r r r

Finalement, si εi (x) − ai 6 −1, on obtient x − SN 6 − r1i + Ri < − r1i + r1i = 0.


Et si εi (x) − ai > 1, on obtient x − SN > r1i + Ri > r1i − r1i + r1N = r1N . Dans
tous les cas, c'est absurde. Donc pour tout i 6 N , εi (x) = ai , et on obtient
l'inclusion voulue.
(ii) Pour l'indépendance, on a en eet que si I ⊂ N∗ est une partie nie de N∗ ,
alors il existe N tel que I ⊂ [[1, N ]] et ainsi
! N
!
\ X \ X 1
P {εi = ai } = P {εi = ai } = ,
i∈I a ,...,a ∈A i=1 a ,...,a ∈A
rN
i1 ik i1 ik
ij 6∈I ij 6∈I

où k = N − Card(I). Enn, on obtient :


!
\ rN −Card(I) 1 Y
P {εi = ai } = N
= Card(I)
= P (εi = ai ).
i∈I
r r i∈I

(iii) Justions que P (E) = 1. On a :


! ! ∞
\ [ X
P (Ω\E) = P Ω\ Er = P (Ω\Er ) 6 P (Ω\Er ) = 0.
| {z }
r>2 r>2 r=2 =0

Notation. Si x ∈ [0, 1] et r ∈ N, r > 2. On sait que x possède un unique déve-


loppement propre en base r, i .e. qu'il existe des εn (x) ∈ A = {0, 1, . . . , r − 1} tels
que

X εn (x)
x= n
,
n=1
r

190 || Romain Giuge


3.15. Nombres normaux

et tels qu'il n'existe pas de rang n0 à partir duquel εn (x) = r − 1 pour tout n (le
développement est propre).
Soient k > 1 et b ∈ Ak . On pose

Nb,n (x) = Card({i ∈ [[1, n − k + 1]] / εi (x) = b1 , . . . , εi+k−1 (x) = bk }),

qui correspond au nombre d'occurrences du mot b dans les n premières positions de


l'écriture de x en base r.

Dénition. On dit que x est simplement normal en base r si, pour tout b ∈ A,

Nb,n (x) 1
−→ .
n n→∞ r

Dénition. On dit que x est normal en base r si, pour tout k > 1 et tout b ∈ Ak ,

Nb,n (x) 1
−→ k .
n n→∞ r

Dénition. On dit que x est normal s'il est normal en toute base r > 2.

Il est dicile de répondre à la question "existe-t-il des nombres normaux ?" car
on ne connaît la loi de développement en base r d'aucun irrationnel de [0, 1] donné
à l'avance. Les probabilités nous aident donc beaucoup.

Références :
 Zuily et Queélec - Eléments d'analyse (2ème édition) - Page 539.

191 || Romain Giuge


3.16. Polynômes de Bernstein

3.16 Polynômes de Bernstein


Proposition. Soit f : [0, 1] → C continue. Soit ω son module de continuité uni-
forme : ω(h) = sup|u−v|6h |f (u) − f (v)|. Pour n > 1, on note Bn le n-ième polynôme
de Bernstein de f déni sur [0, 1] par Bn (x) = nk=0 nk xk (1 − x)n−k f nk .
P  

Alors il existe C > 0 tel que kf −Bn k∞ 6 Cω √1n , en particulier (Bn ) converge
vers f uniformément. De plus, cette estimation est optimale.
Démonstration. Soit x ∈ [0, 1]. Soit (Xn )n>1 une suite de variables de Bernoulli de
Pn
paramètre x indépendantes et identiquement distribuées. On note Sn = k=1 Xk .
Alors Sn suit une loi binomiale de paramètres (n, x) et
   X n   
Sn k n k
E f = f x (1 − x)n−k = Bn (x).
n k=0
n k

Le module de continuité ω est sous-additif et vérie donc ω(λh) 6 (λ + 1)ω(h)


pour tout λ, h > 0. D'où :

Sn √ Sn √
     
1 1
ω √ x− n 6 x− n+1 ω √ .
n n n n

Donc
  
Sn
|f (x) − Bn (x)| = E[f (x)] − E f
n
  
Sn
6 E f (x) − f
n
  
Sn
6 E ω x−
n
Sn √
    
1
6 ω √ E x− n+1
n n

  
1 Sn
6 ω √ n x− +1 ,
n n 2
1
par l'inégalité de Hölder, où kXk2 = E[X 2 ] 2 . Or E x − Snn = 0, donc x − Snn 2 =
 
1 1
Var x − Snn 2 = n12 Var(Sn ) 2 . Et Var(Sn ) = ni=1 Var(Xi ) = nx(1 − x) car les Xi
P

sont indépendantes. D'où :


    r !  
1 p  1 1 3 1
|f (x)−Bn (x)| 6 ω √ x(1 − x) + 1 6 ω √ +1 = ω √ ,
n n 4 2 n

en notant que x(1 − x) 641 (par


 une étude variationnelle par exemple). En n de
compte, kf − Bn k∞ 6 2 ω √n .
3 1

192 || Romain Giuge


3.16. Polynômes de Bernstein

Pour montrer que l'estimation est optimale, on considère la fonction f : x 7→


x − 12 . Alors pour tout u, v ∈ [0, 1], on a |f (u) − f (v)| = u − 21 − v − 12 6
|u − v|. Donc ω(h) 6 h. D'autre part,
          
1 1 1 Sn Sn 1
kf − Bn k∞ > f − Bn = Bn =E f =E −
2 2 2 n n 2

en choisissant les Xk i .i .d . suivant une loi de Bernoulli de paramètre 12 , et Sn =


X1 + · · · + Xn . On pose ensuite Yk = 2Xk − 1 : les Yk sont i .i .d . de loi 21 δ−1 + 12 δ1 .
On obtient :
  " n # n
Sn 1 1 1 X 1 X
E − = E[|2Sn − n|] = E Yk > √ Yk
n 2 2n 2n k=1
2n e k=1 2

par l'inégalité de Khintchine. Or


 !2 
n 2 n n
X X X X
E Yk2 = n
 
Yk = E Yk  = E[Yi ] E[Yj ] +
k=1 2 k=1 i6=j k=1

car E[Yk ] = 0 et E[Yk2 ] = 1. Finalement :

1 √
 
1 1 1
kf − Bn k∞ > √ n= √ √ > √ ω √ .
2n e 2 n e 2 e n

On peut aussi démontrer que (Bn ) converge vers f uniformément ainsi :


  
Sn
|f (x) − Bn (x)| = E f (x) − f
n
  
Sn
6 E f (x) − f
n
h i h i
6 ω(δ) E 1l|x− Sn |6δ +2kf k∞ E 1l|x− Sn |>δ
| {zn } | {zn }
61 =P (|x− Snn |>δ )

Var(X1 )
6 ω(δ) + 2kf k∞ ,
nδ 2
par l'inégalité de Bienaymé-Tchebychev, en notant que E Snn = E[X1 ] = x. D'autre
 

part, Var(X1 ) = x(1 − x) 6 14 (par une étude variationnelle par exemple). Finale-
ment,
kf k∞
kf − Bn k∞ 6 ω(δ) + ,
2nδ 2

193 || Romain Giuge


3.16. Polynômes de Bernstein

ce qui permet de conclure facilement quant à la convergence uniforme de (Bn ) vers


f.

Dénition. On dénit Lp comme étant l'espace vectoriel des variables aléatoires X


telles que
1
kXkp = E[|X|p ] p < ∞.
On dit alors que X a un moment d'ordre p. On remarque que k·kp est une semi-norme
sur Lp .

Théorème (Inégalité de Hölder). Soit 1 < p, q < ∞ avec 1


p
+ 1q = 1. Soient X ∈ Lp
et Y ∈ Lq . On a alors :
E[|XY |] 6 kXkp kY kq .

Démonstration. Pour éviter de noter les valeurs absolues, on peut supposer X, Y >
0. Si E[X p ] = 0, alors E[XY ] = 0 et l'inégalité est vraie. On suppose maintenant
E[X p ] > 0. Quitte à considérer X ∧ n et Y ∧ n puis à passer à la limite quand n → ∞
par le théorème de convergence monotone, on peut supposer X et Y bornées. On
dénit une probabilité Q par

Xp
Q(dω) = P (dω)
E[X p ]

et une variable aléatoire Z par

Y
Z = 1lX>0 .
X p−1
On applique l'inégalité de Jensen à Z :

EQ [Z]q 6 EQ [Z q ].

Or Z Z
Y (ω) Y (ω)X(ω) E[XY ]
EQ [Z] = Q(dω) = P (dω) = .
Ω X(ω)p−1 Ω
p
E[X ] E[X p ]
E[Y q]
De même, EQ [Z q ] = E[X p ]
. D'où le résultat.

Proposition. Soit ω(h) = sup|u−v|6h |f (u) − f (v)| le module de continuité uniforme


de f : R → C. Alors ω est sous-additif, i .e. ω(s + t) 6 ω(s) + ω(t). En conséquence,
pour tout λ, h > 0, ω(λh) 6 (λ + 1)ω(h).

194 || Romain Giuge


3.16. Polynômes de Bernstein

Démonstration. Soient s, t > 0, et u, v tels que |u − v| 6 s + t. On a :

|f (u) − f (v)| 6 |f (u) − f (w)| + |f (w) − f (v)|


6 sup |f (u) − f (w)| + sup |f (w) − f (v)|.
|u−v|6s+t |u−v|6s+t

On choisit w = u + s |v−u|
v−u
. Alors |w − u| = s 6 s, donc

sup |f (u) − f (w)| 6 ω(s).


|u−v|6s+t

D'autre part,
 
v−u |v − u| − s
|w − v| = u + s − v = (u − v) = |v − u| − s .
|v − u| |v − u|

Or si |u − v| 6 s + t, alors
−s 6 |u − v| − s 6 t.
Quitte à inverser s et t, on peut supposer s 6 t. Alors −t 6 −s et on en déduit :

−t 6 |u − v| − s 6 t,

i .e. |w − v| 6 t. Il vient donc :

sup |f (w) − f (v)| 6 ω(t).


|u−v|6s+t

Finalement, pour tout u, v avec |u − v| 6 s + t, on a

|f (u) − f (v)| 6 ω(s) + ω(t),

d'où ω(s + t) 6 ω(s) + ω(t).


Pour montrer la conséquence, on commence par montrer que ω(nh) 6 nω(h)
pour tout n ∈ N et tout h > 0. C'est immédiat avec la sous-additivité de ω . Ensuite
on xe λ > 0 et on l'encadre par n 6 λ < n + 1 où n = bλc. Alors :

ω(λh) 6 ω((n + 1)h) 6 (n + 1)ω(h) 6 (λ + 1)ω(h).

Théorème (Inégalité de Khintchine). Soient X1 , . . . , Xn des variables i .i .d . de loi


1
δ
2 −1
+ 21 δ1 . Soit Y ∈ VectR (X1 , . . . , Xn ). Alors

kY k2 6 ekY k1 .

195 || Romain Giuge


3.16. Polynômes de Bernstein

Démonstration. On écrit Y =
Pn
k=1 ak Xk . Comme les Xk sont i .i .d . avec E[Xk ] = 0
n
et E[Xk2 ] = 1, on a kY k22 = k=1 a2k . On remarque qu'on peut supposer kY k2 = 1,
P

quitte à diviser Y par kY k2 .


On pose Z = nk=1 (1 + iak Xk ) variable aléatoire complexe. Alors
Q

n q n q n p
Y Y Y 2 1 2 √
|Z| = 1 + a2k Xk2 = 1 + a2k 6 eak = e 2 kY k2 = e.
k=1 k=1 k=1

Donc kZk∞ 6 e. De plus, pour j ∈ [[1, n]], on a :
" #
Y
E[Xj Z] = E Xj (1 + iaj Xj ) (1 + iak Xk )
k6=j
Y
= E Xj + iaj Xj2

E[1 + iak Xk ]
| {z } k6=j | {z }
=iaj =1

= iaj ,

en utilisant E[Xk ] = 0 et E[Xk2 ] = 1. Donc


n
X n
X
E[Y Z] = ak E[Xk Z] = i a2k = i.
k=1 k=1

On en déduit enn :

|E[Y Z] | = 1 = kY k2 6 kZk∞ kY k1 6 ekY k1 .

Références :
 Zuily et Queélec - Eléments d'analyse pour l'agrégation - Page 518.

196 || Romain Giuge


3.17. Preuve probabiliste de la formule de Stirling

3.17 Preuve probabiliste de la formule de Stirling


Théorème (Formule de Stirling). On a l'équivalent suivant :
 n n √
n! ∼ 2πn.
n→∞ e
Démonstration. Soit (Xn )n>1 une suite de v .a.i .i .d . de loi de Poisson de paramètre
1. On pose
n
X Sn − n
Sn = Xk et Zn = √ .
k=1
n
Une somme de v .a.i . de Poisson étant encore une v .a. de Poisson, on a
loi
Sn = P(n) , E[Sn ] = n, et Var(Sn ) = n.

La première étape est d'appliquer le théorème central limite pour avoir la conver-
gence en loi de (Zn ) vers une gaussienne centrée réduite. Les Xn sont bien i .i .d . de
carré intégrable, avec E[X1 ] = 1 et σ = Var(X1 ) = 1, donc le théorème s'applique
p

et nous donne :
  Z ∞
Sn − n 1 u2
P (Zn > t) = P √ > t −→ √ e− 2 du = P (Z > t),
n n→∞ 2π t
pour tout t ∈ R, où Z est une v .a. de loi gaussienne centrée réduite.

Soit maintenant t > 0. Comme {Zn > t} ⊂ {Zn2 > t2 }, on a

E[Zn2 ]
P (Zn > t) 6 P (Zn2 > t2 ) 6
t2
par l'inégalité de Markov (qui s'applique car Zn2 > 0). Ensuite

E[Zn2 ] Var(Zn ) + E[Zn ]2 1


= =
t2 t2 t2
   2
car Var(Zn ) = Var n −n
S√
n
= √1n Var(Sn ) = 1 et E[Zn ] = √1 (E[Sn ]
n
− n) = 0. En
n de compte, 
1 si t 6 1
P (Zn > t) 6
 12 si t > 1,
t

et on a ainsi majoré P (Zn > t) par une fonction intégrable sur R∗+ indépendante de
n. Par le théorème de convergence dominée, on obtient
Z ∞ Z ∞
P (Zn > t) dt −→ P (Z > t) dt.
0 n→∞ 0

197 || Romain Giuge


3.17. Preuve probabiliste de la formule de Stirling

On calcule d'une part


Z ∞ Z ∞  Z ∞ 
1 2
− u2
P (Z > t) dt = √ e du dt
0 0 2π t
Z ∞Z u
1 u2
= √ e− 2 dt du
2π Z0 0

1 u2
= √ ue− 2 du
2π 0
1 h − u2 i∞ 1
= √ −e 2 =√ ,
2π 0 2π
où le théorème de Fubini-Tonelli nous a permis d'intervertir les intégrales (tout est
positif). On calcule ensuite
Z ∞ Z ∞

P (Zn > t) dt = P (Sn > t n + n) dt
0 0
Z ∞
∞X
= P (Sn = k)1l{k>t√n+n} dt
0 k=0
∞ Z
X ∞
= P (Sn = k)1l{k>t√n+n} dt
k=0 0
∞ Z k−n

X n
= P (Sn = k) dt
k=n+1 0

X k−n
= √ P (Sn = k)
k=n+1
n

1 X nk
= √ (k − n)e−n
n k=n+1 k!
∞ ∞
!
1 X nk X nk+1
= √ n −
ne k=n+1
(k − 1)! k=n+1 k!
1 nn+1
= √ .
nen n!

D'où enn Z ∞  n n √ 1 1
P (Zn > t) dt = n −→ √ ,
0 e n! n→∞ 2π
ce qui nous donne la formule de Stirling.

Proposition. Soient X et Y deux v .a.i . de loi de Poisson de paramètres respectifs


λ > 0 et µ > 0. Alors X + Y suit une loi de Poisson de paramètre λ + µ.

198 || Romain Giuge


3.17. Preuve probabiliste de la formule de Stirling

Démonstration. On a
∞ k
k −λ λ
 X X
GX (t) = E t = t e = e−λ etλ = eλ(t−1) .
k=0
k!

Par indépendance, GX+Y (t) = GX (t)GY (t) = e(λ+µ)(t−1) . Donc GX+Y est la fonction
loi
génératrice d'une v .a. de loi P(λ + µ). Donc X + Y = P(λ + µ).
Rappel : On s'est servi du fait que la fonction génératrice caractérise entièrement
la loi d'une v .a.. En eet, si X et Y sont deux v .a. à valeurs entières telles que
GX (t) = GY (t) pour tout |t| < 1 (la série dénissant GX converge au moins pour
|t| < 1 puisque GX (1) = 1 < ∞), l'unicité du développement d'une fonction en série
entière montre que X et Y ont la même loi.

Théorème (Théorème central limite). Soit (Xi ) une suite de v .a.i .i.d . de carré
intégrable (et non constantes). On note µ = E[X1 ] et σ2 = Var(X1 ) avec σ > 0.
Alors en notant Sn = X1 + · · · + Xn , on a
Sn − nµ loi
√ −→ N (0, 1),
σ n n→∞

ce qui s'écrit encore


  x
Sn − nµ
Z
1 t2
P √ 6x −→ φ(x) = √ e− 2 dt,
σ n n→∞ 2π −∞

pour tout x ∈ R.

Références :
 Aucune.

199 || Romain Giuge


3.18. Projection sur un convexe fermé et représentation de Riesz

3.18 Projection sur un convexe fermé et représen-


tation de Riesz
Soient H un espace de Hilbert et C un convexe fermé non vide de H . Tout est
fait ici dans le cas d'un espace de Hilbert réel mais fonctionne exactement de la
même manière en adaptant avec un produit scalaire hermitien.

Théorème (Projection sur un convexe fermé). Pour tout x ∈ H , il existe un unique


vecteur y ∈ C tel que d(x, C) = kx − yk. On appelle y le projeté orthogonal de x sur
C.

Démonstration. On pose d = d(x, C) = inf h∈C kx − hk. Par dénition de la borne


inférieure, il existe une suite (hn ) d'éléments de C telle que pour tout n ∈ N,
khn − xk2 6 d2 + n1 . On utilise l'identité du parallélogramme

kz − z 0 k2 = 2kzk2 + 2kz 0 k2 − kz + z 0 k2

avec z = hn − x et z 0 = hp − x :

khn − hp k2 = 2khn − xk2 + 2khp − xk2 − khn + hp − 2xk2


2
2 hn + hp
2
= 2khn − xk + 2khp − xk − 4 −x
2
2 2 2 2
6 2d2 + + 2d2 + − 4d2 6 + ,
n p n p
h +h h +h
car C étant convexe, n 2 p ∈ C , donc n 2 p − x > d. Donc (hn ) est de Cauchy,
donc convergente dans H qui est complet. On note y sa limite. Comme C est fermé,
y ∈ C . Par continuité de la norme, ky − xk2 6 d2 , donc ky − xk = d et on a prouvé
l'existence du projeté orthogonal.
Unicité : supposons qu'il existe y, y 0 ∈ C tels que y 6= y 0 et d = ky−xk = ky 0 −xk.
Toujours par l'identité du parallélogramme, on a :
2 2
1 1 1
(y + y 0 ) − x = (y − x) + (y 0 − x)
2 2 2
1 1
= (ky − xk2 + ky 0 − xk2 ) − ky − y 0 k2
2 4
1
= d2 − ky − y 0 k2 < d2 ,
4
ce qui est absurde car C étant convexe, 21 (y+y 0 ) ∈ C , donc 1
2
(y + y 0 ) − x > d.

Proposition. Soient x ∈ H et y ∈ C . Alors y est le projeté orthogonal de x sur C


si et seulement si (y − x, y − z) 6 0 pour tout z ∈ C .

200 || Romain Giuge


3.18. Projection sur un convexe fermé et représentation de Riesz

Démonstration. Supposons que y est le projeté orthogonal de x sur C . Soit z ∈ C .


Pour tout λ ∈ [0, 1], (1 − λ)y + λz ∈ C , donc par dénition du projeté,

kx − (1 − λ)y − λzk = kx − y + λ(y − z)k > kx − yk.

En développant, on en déduit

kx − yk2 + 2λ(x − y, y − z) + λ2 ky − zk2 > kx − yk2 ,

soit encore, pour λ 6= 0,

2(x − y, y − z) + λky − zk2 > 0.

En faisant tendre λ vers 0, on obtient (y − x, y − z) 6 0.


Réciproquement, si cette condition est satisfaite, on a

kz − xk2 = k(y − x) − (y − z)k2 = ky − xk2 + ky − zk2 − 2(y − x, y − z) > ky − xk2

pour tout z ∈ C . Donc y est le projeté orthogonal de x sur C .

On note p l'application de H sur C qui à x ∈ H associe son projeté orthogonal


sur C .

Théorème. On suppose que C est un sous-espace vectoriel fermé de H . Alors H =


C ⊕ C ⊥ et p est une application linéaire continue.

Démonstration. Soient x ∈ H , y = p(x), z ∈ C . Alors t = y − z ∈ C (sous-espace


vectoriel), donc d'après la proposition, (y − x, y − t) = (y − x, z) 6 0. Comme
−z ∈ C , on a aussi (y − x, −z) 6 0. Donc (y − x, z) = 0. Comme ceci est vrai pour
tout z ∈ C , alors x − y = x − p(x) ∈ C ⊥ . On écrit x = p(x) + (x − p(x)) ∈ C + C ⊥ .
La somme est évidemment directe, donc H = C ⊕ C ⊥ .
On en déduit ensuite que p est linéaire car c'est la projection orthogonale sur
C au sens habituel. On peut vérier : si x = y + z et x0 = y 0 + z 0 avec y, y 0 ∈ C ,
z, z 0 ∈ C ⊥ , et si λ ∈ R, alors

p(λx + x0 ) = p(λy + y 0 + λz + z 0 ) = λy + y 0 = λp(x) + p(x0 ),


| {z } | {z }
=Y ∈C =Z∈C ⊥

car Y + Z = p(Y + Z) + (Y + Z − p(Y + Z)), et par unicité de la décomposition,


Y = p(Y + Z) ∈ C et Z = Y + Z − p(Y + Z) ∈ C ⊥ .
Montrons enn la continuité de p. Soit z ∈ H qu'on écrit z = x + y avec x ∈ C
et y ∈ C ⊥ . Alors

kp(z)k2 = kxk2 6 kxk2 + kyk2 = kx + yk2 = kzk2 .

Donc p est bien continue avec de plus kpk 6 1.

201 || Romain Giuge


3.18. Projection sur un convexe fermé et représentation de Riesz

Théorème (Représentation de Riesz-Fréchet). Soit f une forme linéaire continue


sur H . Alors il existe un unique vecteur a ∈ H tel que f (x) = (a, x) pour tout x ∈ H .
Démonstration. Si f est l'application nulle, a = 0 convient. Sinon, Ker(f ) est un
sous-espace vectoriel de H , fermé car f est continue. D'après le théorème précédent,
H = Ker(f ) ⊕ Ker(f )⊥ . Or Ker(f )⊥ 6= {0} car f 6= 0. Soit alors h ∈ Ker(f )⊥ , h 6= 0.
Pour x ∈ H , on a x − ff (h)
(x)
h ∈ Ker(f ), d'où
 
f (x)
h, x − h = 0.
f (h)
khk2
En développant, on obtient (h, x) = f (h)
f (x), soit encore
 
f (h)
f (x) = h, x .
khk2
f (h)
Le vecteur a = khk 2 h convient donc.

Montrons qu'il est unique : soit a0 ∈ H tel que pour tout x ∈ H , f (x) = (a, x) =
(a0 , x). Alors (a − a0 , x) = 0 pour tout x ∈ H , donc a − a0 = 0.

On pourrait admettre le premier théorème (projection sur un convexe fermé)


pour aboutir au théorème de représentation de Riesz-Fréchet (leçon sur les espaces
vectoriels normés et applications linéaires continues), ou inversement s'arrêter avant
le dernier théorème (représentation de Riesz-Fréchet) (leçon sur les espaces de Hil-
bert).

On peut utiliser le théorème de représentation de Riesz-Fréchet pour montrer


l'existence et l'unicité de l'adjoint d'une application linéaire continue entre espaces
de Hilbert.

Théorème. Soient E, F deux espaces de Hilbert et T ∈ L(E, F ). Alors il existe une


unique application T ∈ L(F, E) telle que pour tout x ∈ E et tout y ∈ F ,

(T (x), y) = (x, T ∗ (y)).

De plus, on a kT k = kT ∗ k.
Démonstration. Pour y ∈ F , on considère l'application

φy : x 7→ (T (x), y),

202 || Romain Giuge


3.18. Projection sur un convexe fermé et représentation de Riesz

qui est clairement linéaire. Elle est continue par l'inégalité de Cauchy-Schwarz :

|φy (x)| 6 kT (x)kkyk 6 kT kkxkkyk = Ckxk

en posant C = kT kkyk. Donc d'après le théorème de Riesz-Fréchet, il existe un


unique vecteur, qu'on note T ∗ (y), tel que

φy (x) = (T (x), y) = (x, T ∗ (y))

pour tout x ∈ E . On a ainsi déni une application T ∗ : F → E .


Montrons que T ∗ est linéaire. Soient y1 , y2 ∈ F et λ ∈ R. Alors pour tout x ∈ E ,
on a :

(x, T ∗ (λy1 + y2 )) = (T (x), λy1 + y2 )


= λ(T (x), y1 ) + (T (x), y2 )
= λ(x, T ∗ (y1 )) + (x, T ∗ (y2 ))
= (x, λT ∗ (y1 ) + T ∗ (y2 )).

On en déduit immédiatement la linéarité de T ∗ .


Montrons que T ∗ est continue. Pour x ∈ E et y ∈ F , on a

|(x, T ∗ (y))| = |(T (x), y)| 6 kT kkxkkyk.

Mais on a
kT ∗ (y)k = sup |(x, T ∗ (y))|,
kxk=1

ce qui se montre facilement avec l'inégalité de Cauchy-Schwarz en sachant que c'est


une égalité lorsque les deux vecteurs sont colinéaires. Ainsi

kT ∗ (y)k 6 kT kkyk,

i .e. T ∗ est continue et kT ∗ k 6 kT k. Par unicité de l'adjoint, on a (T ∗ )∗ = T , d'où :

kT k = k(T ∗ )∗ k 6 kT ∗ k,

et enn kT k = kT ∗ k.

Références :
 Francinou, Gianella, Nicolas - Oraux X-ENS, Analyse 3 - Page 152.
 Skandalis - Topologie et analyse, 3ème année - Page 252 (raccourci pour mon-
trer que la projection est continue), page 261 (pour l'application à l'existence
d'un adjoint).

203 || Romain Giuge


3.19. Sous-espaces vectoriels fermés de Lp (µ)

3.19 Sous-espaces vectoriels fermés de Lp(µ)


Théorème. Soit (X, F, µ) un espace mesuré de mesure positive nie, et soit 1 <
p < ∞. Si F est un sous-espace vectoriel fermé de Lp (µ) et F ⊂ L∞ (µ), alors
dimC (F ) < ∞.

Démonstration. Soit F un sous-espace vectoriel fermé de Lp (µ) avec F ⊂ L∞ (µ).


Par emboîtement décroissant (X est de mesure nie), on a F ⊂ L∞ ⊂ L2 . On va
montrer le résultat préliminaire suivant : il existe α > 0 tel que kf k∞ 6 αkf k2 , pour
tout f ∈ F .

Montrons que les normes k · kp et k · k∞ sont équivalentes sur F . D'abord, l'in-


jection L∞ ,→ Lp est continue car X est de mesure nie. On montre ensuite que
l'injection (F, k · kp ) ,→ L∞ est aussi continue grâce au théorème du graphe fermé :
(i ) L∞ est un Banach et (F, k · kp ) aussi car F est fermé dans Lp qui est complet,
donc complet.
(ii ) Ensuite si (fn ) est une suite de F (donc aussi une suite de L∞ ) telle que
fn −→ f ∈ F et fn −→ g ∈ L∞ , on sait qu'il existe une sous-suite de (fn ) qui
k·kp k·k∞
converge vers f presque partout (voir le développement sur la complétude de
Lp (µ)). Donc f = g presque partout, i .e. f = g dans L∞ .
Le graphe de l'injection est donc fermé et celle-ci est continue. La continuité des
deux injections prouve que les normes k · kp et k · k∞ sont équivalentes sur F .

L'injection (F, k · k2 ) ,→ Lp est continue : si p 6 2, c'est clair car X est de mesure


nie (emboîtement décroissant). Si p > 2, pour f ∈ F , on a kf kpp = X |f |p−2 |f |2 dµ,
R

et donc kf kpp 6 kf kp−2


∞ kf k2 . Mais les normes k · kp et k · k∞ sont équivalentes sur
2

F : il existe C > 0 tel que k · k∞ 6 Ck · kp . Donc

kf kpp 6 C p−2 kf kp−2 2


p kf k2 ,

p−2
et enn : kf kp 6 C 2 kf k2 .
Finalement, comme k · kp et k · k∞ sont équivalentes sur F , il existe α > 0 tel
que kf k∞ 6 αkf k2 , pour tout f ∈ F .

Soit (f1 , . . . , fn ) une famille libre de fonctions de F , qu'on peut supposer ortho-
normale dans L2 muni du produit scalaire induit par la norme k · k2 (quitte à utiliser
le procédé de Gram-Schmidt). On note B la boule unité fermée de Cn pour la norme
k · k2 . Pour c = (c1 , . . . , cn ) ∈ B , on pose
n
X
fc = ci f i .
i=1

204 || Romain Giuge


3.19. Sous-espaces vectoriels fermés de Lp (µ)

On peut noter que kfc k2 6 1 :


n
X n
X
kfc k22 = kci fi k22 = |ci |2 = kck22 6 1.
i=1 i=1

Sachant que B est séparable (car inclu dans Cn séparable), il existe une suite
(c(k))k∈N dense dans B . Pour tout k , il existe une partie mesurable Ωk de X , avec
µ(Ωk ) = µ(X), telle que kfc(k) k∞ = supx∈Ωk |fc(k) (x)|. Alors Ω = ∞ k=1 Ωk est encore
T

une partie mesurable avec µ(Ω) = µ(X) (le complémentaire de Ω est une réunion
dénombrable d'ensembles de mesure nulle, donc de mesure nulle).
Pour tout x ∈ Ω et tout k ∈ N, |fc(k) (x)| 6 kfc(k) k∞ . D'après le résultat prélimi-
naire,
|fc(k) (x)| 6 kfc(k) k∞ 6 αkfc(k) k2 6 α.
Par densité, il s'ensuit immédiatement que |fc (x)| 6 α pour tout c ∈ B et tout
x ∈ Ω (la convergence d'une suite (c(ki ))i∈N de Cn pour la norme k · k2 implique la
convergence composante par composante).
Pour x ∈ Ω, on pose :

 (f1 (x),...,fn (x)) s'il existe i tel que fi (x) 6= 0


c(x) = k(f1 (x),...,fn (x))k2


0 sinon.

Il vient alors
n
1 X
fc(x) (x) =   fi (x)fi (x) = k(f1 (x), . . . , fn (x))k2 .
f1 (x), . . . , fn (x) i=1
2

En élevant au carré, et sachant que |fc(x) (x)|2 6 α2 , on obtient :


n
X
|fi (x)|2 6 α2 .
i=1

L'inégalité ainsi obtenue étant vraie pour tout x ∈ Ω, on intégre sur Ω :


Xn Z
|fi |2 dµ 6 α2 µ(Ω) = α2 µ(X).
i=1 | Ω {z }
|fi |2 dµ=kfi k22 =1
R
= X

D'où nalement :
n 6 α2 µ(X),
et par conséquent F est de dimension nie.

205 || Romain Giuge


3.19. Sous-espaces vectoriels fermés de Lp (µ)

Remarque. L'intérêt de s'être ramené à L2 est que c'est le seul des espaces Lp à être
muni d'un produit scalaire hermitien :
Z
(f, g) = f g dµ
X

qui en fait un espace de Hilbert, i .e. un espace vectoriel complet pour sa norme
k · k2 induite par ce produit scalaire hermitien. On a pu ainsi dénir une famille
orthonormée dans L2 . On note également que ce produit scalaire est bien déni car
si f, g ∈ L2 , f g ∈ L1 grâce à Cauchy-Schwarz (ou l'inégalité de Hölder avec p = 2
et q = 2).
Remarque. Les hypothèses du théorème ne peuvent pas être diminuées. En eet, si
F 6⊂ L∞ ou si p = +∞, alors si on prend F = Lp , F est de dimension innie. Pour
voir que Lp est de dimension innie, par exemple lorsque le domaine X d'intégration
est X = [0, 1] (de mesure nie), on peut prendre la famille des indicatrices 1l[ 1 , 1 [
n n+1
pour n ∈ N∗ qui est libre dans Lp pour p 6 ∞.
Si on suppose maintenant F ⊂ L∞ et p < ∞, mais µ(X) = ∞, le théorème
est encore faux. On prend par exemple X = [0, ∞[ et F l'adhérence dans Lp de
l'espace vectoriel de Lp engendré par les fonctions indicatrices 1l[n,n+1[ . On vérie
que F ⊂ L∞ : si f ∈ F , il existe une suite de complexes (λi )i>1 telle que

X
f= λi 1l[i,i+1[ .
i=0

Comme f ∈ Lp , on a ∞ i=0 |λi | < ∞, donc λi → 0, donc la suite (λi ) est bornée, et
p
P

donc f est bornée, i .e. f ∈ L∞ . Pourtant, les 1l[n,n+1[ forment une famille libre de
F , qui est donc de dimension innie.

Dans ce qui suit, on désigne par X un espace mesuré quelconque muni d'une
mesure positive µ.
On rappelle que Lp (µ) est un espace vectoriel complexe. C'est immédiat avec
l'inégalité de Minkowski qui montre que si f, g ∈ Lp (µ), alors f + g ∈ Lp (µ), et
le fait que kαf kp = |α|kf kp . On peut donc bien sûr parler de la dimension de F
sous-espace vectoriel fermé de Lp (µ) comme C-espace vectoriel.

Théorème (Emboîtement décroissant). On suppose X de mesure ni : µ(X) < ∞.


Alors pour 1 6 p 6 q, on a Lq ⊂ Lp et l'injection est continue. On a de plus, pour
f ∈ Lp :
1 1
kf kp 6 µ(X) p − q kf kq .

Démonstration. On applique l'inégalité de Hölder avec 1


p0
= p
q
et 1
q0
=1− p
q
:
Z Z  10 Z  10
p q
p p p0
|f | dµ 6 (|f | ) dµ 1 dµ .
X X X

206 || Romain Giuge


3.19. Sous-espaces vectoriels fermés de Lp (µ)

On élève ensuite les deux membres à la puissance 1


p
et on a le résultat.

Remarque. On a donc L∞ ⊂ Lp . Par exemple si X = [0, 1], X est de mesure nie,


  p1
mais L 6⊂ L
p ∞
: prendre la fonction x 7→ √1
x
.
Théorème (Théorème du graphe fermé). Soient E et F deux espaces de Banach,
et f une application linéaire de E dans F . On suppose que pour toute suite (xn ) de
E telle que xn → x ∈ E et f (xn ) → y ∈ F , on a y = T (x) (i .e. le graphe de f est
fermé). Alors f est continue.
Démonstration. On note
Γf = {(x, f (x)), x ∈ E}
le graphe de f . Comme Γf est supposé fermé dans E × F complet, on a que Γf est
complet. Soient
p1 : Γf −→ E p2 : Γf −→ F
et
(x, f (x)) 7−→ x (x, f (x)) 7−→ f (x).
Ces deux applications sont continues. De plus, p1 est bijective, donc par le théorème
d'isomorphisme de Banach, p−11 est continue. Finalement, f = p2 ◦ p1 est continue.
−1

Théorème (Théorème d'isomorphisme de Banach). Soient E et F deux espaces de


Banach, et f une application linéaire continue bijective de E dans F . Alors f −1 est
continue.
Démonstration. f −1 est continue car f est ouverte par le théorème de l'application
ouverte.
Théorème (Théorème de l'application ouverte). Soient E et F deux espaces de
Banach, et f une application linéaire continue surjective de E dans F . Alors il
existe c > 0 tel que

BF (0, c) ⊂ f BE (0, 1) .
En particulier, f est une application ouverte.
Démonstration. Résulte du théorème de Baire.
Dénition. On dit qu'un espace topologique (X, T ) est séparable s'il contient une
partie A au plus dénombrable dense dans X .
Exemple. L'ensemble R des réels est séparable car il contient Q qui y est dense et
dénombrable. Par conséquent, Rn est séparable, et Cn = R2n aussi.

Références :
 Rudin - Analyse fonctionnelle.

207 || Romain Giuge


3.20. Théorème de Borel

3.20 Théorème de Borel


Proposition. Soient a, b, c, d quatre réels avec a < b < c < d. Alors il existe une
fonction f ∈ C ∞ (R) comprise entre 0 et 1, égale à 1 sur [b, c] et nulle en dehors de
[a, d].

Démonstration. Soit ψ la fonction dénie par



e− 1t si t > 0
ψ : t 7→
0 si t 6 0.

Alors ψ est de classe C ∞ sur R. En eet, elle est de classe C ∞ sur R∗ et on montre
par une récurrence facile que pour tout t > 0 et tout k ∈ N, il existe un polynôme
Pk tel que  
(k) 1 −1
ψ (t) = Pk e t.
t
On montre ensuite par récurrence sur k que ψ est k fois dérivable sur R avec ψ (k) (t) =
0 pour tout t 6 0 : c'est vrai pour k = 0 et si c'est vrai au rang k , alors
  1
ψ (t) − ψ (0)  1t Pk 1t e− t si t > 0
(k) (k)
=
t 0 si t < 0,

qui tend vers 0 quand t → 0, et donc ψ (k) est dérivable en 0 et ψ (k+1) (0) = 0. Ainsi
ψ est indéniment dérivable sur R, donc de classe C ∞ sur R.

Soit maintenant la fonction α : t 7→ ψ(t)ψ(1 − t) dénie sur R, qui est C ∞ sur R,


positive et nulle en dehors de [0, 1]. On dénit ensuite la fonction
Rt
α(s) ds
β : t 7→ R 01 ,
0
α(s) ds

qui est C ∞ sur R, strictement croissante, nulle pour t 6 0 et égale à 1 pour t > 1.
Enn, la fonction    
x−a d−x
f : x 7→ β β
b−a d−c
est C ∞ sur R, comprise entre 0 et 1, égale à 1 si x ∈ [b, c], nulle si x 6 a et x > d.

Théorème (Théorème de Borel). Soit (an )n∈N une suite quelconque de réels. Alors
il existe une fonction u ∈ C ∞ (R) telle que u(n) (0) = an pour tout n ∈ N.
Démonstration. D'après la proposition précédente, il existe une fonction f ∈ C ∞ (R)
k
égale à 1 pour |x| 6 1
2
et nulle pour |x| > 1. Notons fk (x) = f (λk x)ak xk! et montrons

208 || Romain Giuge


3.20. Théorème de Borel

que l'on peut choisir les λk > 0 pour assurer la convergence uniforme sur R de la
P (m)
série fk et de chaque série dérivée fk pour m ∈ N.
P

Soient m ∈ N et k > m. Par la formule de Leibniz de dérivation d'un produit,


on a : m  
xk−p

(m)
X m
λm−p f (m−p) (λk x) .

fk (x) = ak k
p=0
p (k − p)!

Comme f et toutes ses dérivées f (p) sont continues et nulles en dehors de [−1, 1],
on peut trouver un majorant Kp sur R pour chacune de ces fonctions. Soit Mm le
(m)
maximum des Kp pour p 6 m. Pour |x| > λ1k , fk (x) = 0 car f est nulle en dehors
de [−1, 1]. Pour |x| 6 λ1k , on a la majoration :
m  
(m)
X m m−p 1 1
fk (x) 6 |ak |Mm λk k−p
p=0
p (k − p)! λk
m  
1 1 X m
6 |ak |Mm
(k − m)! λk−m
k p=0
p
2m Mm |ak |
= .
(k − m)! λkk−m
On choisit alors
λk = max(1, |ak |)
de sorte que λk−m
k > λk > |ak | car k − m > 1. Ainsi :
(m) 2m Mm
fk (x) 6 ,
(k − m)!
(m)
pour tout x ∈ R (évidemment vrai aussi pour |x| > λ1k où fk (x) = 0). La série
(m) 2m Mm
de fonctions k>0 fk est donc normalement convergente (la série k>m (k−m)! est
P P

convergente et indépendante de x), donc uniformément convergente sur R. On en


déduit que u(x) = ∞ k=0 fk (x) est de classe C

sur R et que pour tout x ∈ R et tout
P

m ∈ N,
X∞
(m) (m)
u (x) = fk (x).
k=0
En particulier, pour tout m ∈ N,

X
(m) (m)
u (0) = fk (0) = am ,
k=0

xk
car fk (x) = ak k! pour tout x avec |x| 6 ,
et ainsi
1
2λk


x k (m)
 0 si k 6= m
(m)
fk (0) = ak (0) =
k! am si k = m.

209 || Romain Giuge


3.20. Théorème de Borel

Remarque. Si la série entière an xn avait un rayon de convergence ∞, le théorème


P

serait évident en prenant u(x) = ∞ n=0 an x . Si cette série entière avait un rayon de
n
P

convergence R > 0, on pourrait prendre



P∞ a f (x)xn si |x| 6 3R
n=0 n 4
u(x) =
0 si |x| > 3R ,
4

où f est C ∞ sur R, égale à 1 pour |x| 6 R


4
, nulle pour x > R
2
.
Remarque. Une conséquence du théorème de Borel est l'existence de fonctions dié-
rentes de la somme de leur série de Taylor sur tout voisinage de 0. En eet, soit la
suite (an ) dénie par an = (n!)2 pour tout n ∈ N. D'après le théorème de Borel, il
existe une fonction u ∈ C ∞ (R) telle que u(n) (0) = (n!)2 pour tout n ∈ N. S'il existait
un voisinage V de 0 tel que u soit égal à la somme de sa série de Taylor sur V , alors
on aurait ∞ ∞
X xn X
u(x) = u(n) (0) = n!xn ,
n=0
n! n=0

pour tout x ∈ V . Ceci est absurde car la série entière n!xn a un rayon de conver-
P

gence égal à 0.
Remarque. Le théorème de Borel se généralise aux fonctions de n variables : si
(aα )α∈Nn est une suite quelconque de réels, alors il existe une fonction u ∈ C ∞ (Rn )
telle que ∂ α u(0) = aα pour tout α (en notation multi-indice). Pour cela, on peut
prendre
X xα
u(x) = f (λα x)aα ,
α
α!

avec f ∈ C ∞ (Rn ), f (x) = 1 pour kxk 6 12 , f (x) = 0 pour kxk > 1, et les λα > 0
choisis convenablement par des calculs similaires aux précédents.

Références :
 Rouvière - Petit guide de calcul diérentiel à l'usage de la licence et de l'agré-
gation - Page 359.

210 || Romain Giuge


3.21. Théorème de Brouwer

3.21 Théorème de Brouwer


Version partielle à présenter :
Théorème (Version faible). On note B la boule unité fermée de Rn pour une norme
k · k quelconque. Alors toute application f : B → B de classe C 1 admet un point xe.
Démonstration. On peut supposer que la norme k·k est la norme euclidienne usuelle.
Soit f : B → B de classe C 1 . Raisonnons par l'absurde en supposant que f n'a pas
de point xe.
On note S la sphère unité de Rn . Pour x ∈ B , on dénit r(x) comme étant
le point d'intersection de S avec la demi-droite [f (x), x . En écrivant la formule


dénissant r, on obtient que r est de classe C 1 .


On pose maintenant Ft (x) = (1 − t)x + t r(x) pour t ∈ [0, 1]. Il est clair que Ft
est une application de classe C 1 de B dans B . En notant λ la mesure de Lebesgue
sur Rn , on dénit pour t ∈ [0, 1],
Z
P (t) = det (DFt (x)) dλ(x),

qui est polynomiale en t (car à x xé, t 7→ Ft (x) est polynomiale en t).


Nous allons montrer que P est constant et strictement positif pour t susamment
petit. Comme P est un polynôme, on aura alors que P est constant non nul et on
verra ensuite pourquoi c'est absurde.
Si on montre que, pour t susamment petit, Ft est un C 1 -diéomorphisme de B̊
sur B̊ , de jacobien JFt partout > 0, alors par le théorème de changement de variable,
on aura :
Z Z
P (t) = det (DFt (x)) dλ(x) = JFt (x) dλ(x)
ZB̊ Z B̊

= 1 |JFt (x)| dλ(x) = 1 dλ(x)


B̊ Ft (B̊ )
Z
= 1 dλ(x) = K,

où K > 0 est le volume de B̊ , et on aura montré ce qu'on voulait.

Appliquons le théorème d'inversion globale :


(i) Puisque Ft (x) = (1 − t)x + t r(x), on a

JFt (x) = an (x)tn + · · · + a1 (x)t + a0 (x)


avec a0 , . . . , an des fonctions continues de B dans R. Or F0 (x) = x, donc
DF0 (x) = IdRn et JF0 (x) = 1 = a0 (x). On pose
m = sup an (x)tn−1 + · · · + a1 (x) .
x∈B
t∈[0,1]

211 || Romain Giuge


3.21. Théorème de Brouwer

Alors pour tout t < 1


m
et tout x ∈ B , il vient :

t|an (x)tn−1 + · · · + a1 (x)| < 1,

d'où
JFt (x) = t an (x)tn−1 + · · · + a1 (x) + 1 > 0.


(ii) On montre que Ft est injective sur B̊ pour t susamment petit. Soient x, y ∈ B̊
tels que Ft (x) = Ft (y). On a donc :

(1 − t)(x − y) = t r(y) − r(x) .

Notons M = supx∈B kDr(x)k. L'inégalité de la moyenne donne :

kr(x) − r(y)k 6 M kx − yk,

d'où (1 − t)kx − yk 6 tM kx − yk. Pour t susamment petit, disons t < η , cela


implique x = y .
Le théorème d'inversion globale nous dit alors que pour t < min η, m 1
, Ft est un


C -diéomorphisme de B̊ sur Ft (B̊) qui est ouvert.


1

Il reste à montrer que Ft (B̊) = B̊ . On a déjà clairement Ft (B̊) ⊂ B̊ (car Ft (x) =


(1 − t)x + t r(x)). On va montrer que Ft (B̊) est à la fois ouvert et fermé dans B̊ ,
ce qui impliquera l'égalité par connexité de B̊ . L'ouverture est déjà acquise. Pour la
fermeture, prenons (yn ) suite de Ft (B̊) convergeant vers y ∈ B̊ . On écrit yn = Ft (xn )
avec xn ∈ B̊ et on extrait de (xn ) une sous-suite convergeant vers un élément x ∈ B
par compacité de B . On a alors y = Ft (x). Si x ∈ S , alors Ft (x) = x, et donc
y = x ∈ S , ce qui est absurde. Donc x ∈ B̊ , et y ∈ Ft (B̊). On a donc bien
Ft (B̊) = B̊ .

Montrons enn l'absurdité. Pour t = 1, on a F1 = r, et donc DF1 (x) = Dr(x),


qui n'est inversible en aucun point de B̊ . En eet, s'il existait x ∈ B̊ où Dr(x) est
inversible, par le théorème d'inversion locale, r induirait un C 1 -diéomorphisme d'un
ouvert V de Rn inclu dans B̊ contenant x sur un ouvert W de Rn contenu dans S
(car l'image de r est dans S ), ce qui est absurde car S̊ = ∅. Donc P (1) = 0, ce qui
contredit P (1) = K > 0.

Version complète :
Théorème. On note B la boule unité fermée de Rn pour une norme k·k quelconque.
Alors toute application continue f : B → B admet un point xe.

212 || Romain Giuge


3.21. Théorème de Brouwer

Démonstration. On peut supposer que la norme k·k est la norme euclidienne usuelle.
Soit f : B → B continue. Raisonnons par l'absurde en supposant que f n'a pas de
point xe.

Montrons d'abord qu'on peut supposer f de classe C 1 . Soit α = inf x∈B kf (x)−xk.
Par compacité de B , cette borne inférieure est atteinte, et comme f n'a pas de point
xe, α > 0. Soit g une fonction de classe C 1 telle que
α
kf − gk∞,B = sup kf (x) − g(x)k < ,
x∈B 2
que l'on obtient par le théorème de Stone-Weierstrass en raisonnant sur les compo-
santes de f : f = (f1 , . . . , fn ) et on pose g = (g1 , . . . , gn ) avec gi des fonctions de
classe C 1 telles que kfi − gi k∞ = supx∈B |fi (x) − gi (x)| < 2√α n . On a
α
kg(x)k 6 kg(x) − f (x)k + kf (x)k 6 kf − gk∞,B + kf (x)k < + 1,
2
pour tout x ∈ B . On pose alors h = 1
1+ α
g, qui est C 1 sur B et à valeurs dans B .
2
Enn, pour tout x ∈ B , on a

kh(x) − f (x)k 6 kh(x) − g(x)k + kg(x) − f (x)k


 
1
= 1− kg(x)k + kg(x) − f (x)k
1 + α2
< α.

Donc
kh(x) − xk > kf (x) − xk − kh(x) − f (x)k > 0,
i .e. h n'a pas de point xe. Ainsi, si on montre qu'il est absurde que toute fonction
C 1 de B dans B n'a pas de point xe, il sera aussi absurde que f n'a pas de point
xe.

On suppose alors f de classe C 1 . On note S la sphère unité de Rn . Pour x ∈ B , on


dénit r(x) comme étant le point d'intersection de S avec la demi-droite [f (x), x .


Montrons que r est de classe C 1 sur B . Pour x ∈ B , il existe λ(x) ∈ R+ tel que

r(x) = f (x) + λ(x)(x − f (x)).

Comme r(x) ∈ S , λ(x) est solution de kf (x) + λ(x)(x − f (x))k2 = 1, i .e. de

kf (x)k2 + 2λ(x) f (x), x − f (x) + λ(x)2 kx − f (x)k2 = 1.




Le discriminant de cette équation du second degré en λ(x) est clairement positif :


2
+ 4kx − f (x)k2 1 − kf (x)k2 > 0.

∆(x) = 2 f (x), x − f (x)
| {z }
>0

213 || Romain Giuge


3.21. Théorème de Brouwer

On a même ∆(x) > 0 car sinon il n'y aurait qu'un seul point d'intersection entre la
droite passant par x et f (x) et la sphère S , ce qui est absurde. Donc, λ(x) étant la
racine positive de l'équation, on obtient :
 p
−2 f (x), x − f (x) + ∆(x)
λ(x) = ,
2kx − f (x)k2
et il est clair que λ est de classe C 1 sur B . Donc r est de classe C 1 sur B .

On pose maintenant Ft (x) = (1 − t)x + t r(x) pour t ∈ [0, 1]. Il est clair que Ft
est une application de classe C 1 de B dans B . En notant λ la mesure de Lebesgue
sur Rn , on dénit pour t ∈ [0, 1],
Z
P (t) = det (DFt (x)) dλ(x),

qui est polynomiale en t (car à x xé, t 7→ Ft (x) est polynomiale en t).


Nous allons montrer que P est constant et strictement positif pour t susamment
petit. Comme P est un polynôme, on aura alors que P est constant non nul et on
verra ensuite pourquoi c'est absurde.
Si on montre que, pour t susamment petit, Ft est un C 1 -diéomorphisme de B̊
sur B̊ , de jacobien JFt partout > 0, alors par le théorème de changement de variable,
on aura :
Z Z
P (t) = det (DFt (x)) dλ(x) = JFt (x) dλ(x)
ZB̊ Z B̊

= 1 |JFt (x)| dλ(x) = 1 dλ(x)


B̊ Ft (B̊ )
Z
= 1 dλ(x) = K,

où K > 0 est le volume de B̊ , et on aura montré ce qu'on voulait.

Appliquons le théorème d'inversion globale :


(i) Puisque Ft (x) = (1 − t)x + t r(x), on a

JFt (x) = an (x)tn + · · · + a1 (x)t + a0 (x)

avec a0 , . . . , an des fonctions continues de B dans R. Or F0 (x) = x, donc


DF0 (x) = IdRn et JF0 (x) = 1 = a0 (x). On pose

m = sup an (x)tn−1 + · · · + a1 (x) .


x∈B
t∈[0,1]

Alors pour tout t < 1


m
et tout x ∈ B , il vient :

t|an (x)tn−1 + · · · + a1 (x)| < 1,

214 || Romain Giuge


3.21. Théorème de Brouwer

d'où
JFt (x) = t an (x)tn−1 + · · · + a1 (x) + 1 > 0.


(ii) On montre que Ft est injective sur B̊ pour t susamment petit. Soient x, y ∈ B̊
tels que Ft (x) = Ft (y). On a donc :

(1 − t)(x − y) = t r(y) − r(x) .

Notons M = supx∈B kDr(x)k. L'inégalité de la moyenne donne :

kr(x) − r(y)k 6 M kx − yk,

d'où (1 − t)kx − yk 6 tM kx − yk. Pour t susamment petit, disons t < η , cela


implique x = y .
Le théorème d'inversion globale nous dit alors que pour t < min η, m 1
, Ft est un


C 1 -diéomorphisme de B̊ sur Ft (B̊) qui est ouvert.


Il reste à montrer que Ft (B̊) = B̊ . On a déjà clairement Ft (B̊) ⊂ B̊ (car Ft (x) =
(1 − t)x + t r(x)). On va montrer que Ft (B̊) est à la fois ouvert et fermé dans B̊ ,
ce qui impliquera l'égalité par connexité de B̊ . L'ouverture est déjà acquise. Pour la
fermeture, prenons (yn ) suite de Ft (B̊) convergeant vers y ∈ B̊ . On écrit yn = Ft (xn )
avec xn ∈ B̊ et on extrait de (xn ) une sous-suite convergeant vers un élément x ∈ B
par compacité de B . On a alors y = Ft (x). Si x ∈ S , alors Ft (x) = x, et donc
y = x ∈ S , ce qui est absurde. Donc x ∈ B̊ , et y ∈ Ft (B̊). On a donc bien
Ft (B̊) = B̊ .

Montrons enn l'absurdité. Pour t = 1, on a F1 = r, et donc DF1 (x) = Dr(x),


qui n'est inversible en aucun point de B̊ . En eet, s'il existait x ∈ B̊ où Dr(x) est
inversible, par le théorème d'inversion locale, r induirait un C 1 -diéomorphisme d'un
ouvert V de Rn inclu dans B̊ contenant x sur un ouvert W de Rn contenu dans S
(car l'image de r est dans S ), ce qui est absurde car S̊ = ∅. Donc P (1) = 0, ce qui
contredit P (1) = K > 0.

Corollaire. Soit B(0, R) la boule fermée centrée en 0 de rayon R de Rn . Alors toute


application f : B(0, R) → B(0, R) continue admet un point xe.
Démonstration. Pour λ > 0, soit hλ l'homothétie de rapport λ :
hλ : Rn −→ Rn
x 7−→ λx.

215 || Romain Giuge


3.21. Théorème de Brouwer

Alors h 1 ◦ f ◦ hR : B(0, 1) → B(0, 1) est continue. Elle admet donc un point xe x :
R

1
h 1 ◦ f ◦ hR (x) = f (Rx) = x.
R R
Donc Rx ∈ B(0, R) est un point xe de f .

Corollaire. Soit C un ensemble convexe et compact de Rn . Alors toute application


f : C → C continue admet un point xe.

Démonstration. Soit f : C → C continue. Soit Π : Rn → C la projection de Rn sur


C qui existe et est continue d'après le théorème de projection sur un convexe fermé
dans un espace de Hilbert. Comme C est compact, il est borné, donc il existe R > 0
tel que C ⊂ B(0, R). On a donc une fonction f ◦ Π : B(0, R) → B(0, R) continue.
Il existe donc x ∈ B(0, R) tel que f ◦ Π(x) = x. Mais f ◦ Π(x) ∈ C car f : C → C .
Donc x ∈ C et Π(x) = x. Ainsi x est un point xe de f .

Théorème (Stone-Weierstrass). Soit X un espace compact et A une sous-algèbre de


l'algèbre C (X, R) des fonctions continues à valeurs réelles, muni de la norme inni.
On suppose que :
(i) A sépare les points de X , i.e. pour tout x, y ∈ X avec x 6= y, il existe f ∈ A
telle que f (x) 6= f (y).
(ii) A est unitaire, i .e. 1 appartient à A.
Alors A est dense dans C (X, R).

Références :
 Aucune.

216 || Romain Giuge


3.22. Théorème de Hardy-Littlewood

3.22 Théorème de Hardy-Littlewood


Théorème. Soit (an ) une suite de complexes. On suppose que :
(i) an = O n1 .


(ii) La fonction S dénie sur ] − 1, 1[ par S(x) = ∞


n=0 an x admet une limite l
n
P

lorsque x → 1− .
Alors la série an converge et sa somme vaut l.
P

Démonstration. On note que S est bien dénie pour |x| < 1 car la série entière
an z n a un rayon de convergence > 1 grâce à an = O n1 .
P 

Quitte à considérer la suite (bn ) dénie par b0 = a0 − l et bn = an pour n > 1,


on peut supposer que l = 0.
On considère la fonction f : [0, 1] → C telle que f (x) = 0jpour xk < 12 et f (x) = 1
ln(2)
pour x > 21 . Alors si x < 1, on a xn < 1
2
dès que n > Nx = − ln(x) . Donc
Nx
X ∞
X
SNx = an = an f (xn ).
n=0 n=0
P∞
Notre but est donc de montrer que limx→1− n=0 an f (xn ) = 0, car Nx → ∞ quand
x → 1− .

On considère l'ensemble E des fonctions ϕ : [0, 1] → R telles que an ϕ(xn )


P

converge pour 0 6 x < 1 et limx→1− ∞ n=0 an ϕ(x ) = 0. Pour montrer que f ∈ E ,


n
P

on va l'approcher par des polynômes nuls en 0 et valant f (1) = 1 en 1 (nécessaire si


on veut éviter des problèmes à la limite en 1− ). L'intérêt que les polynômes soient
nuls en 0 est qu'ainsi, ils sont bien dans E : si P = X k est un monôme, k > 1,
alors ∞ n=0 an P (x ) = S(x ) est bien dénie pour 0 6 x < 1 et converge vers 0 par
n k
P

hypothèse du théorème. Par linéarité, tout polynôme nul en 0 est dans E .

Pour approcher f ainsi, on l'écrit f (x) = x + x(1 − x)g(x) pour une bonne
fonction g , en réalité dénie par g(x) = fx(1−x)
(x)−x
si 0 < x < 1, et g(0) = −1, g(1) = 1.
Il existe deux fonctions continues g1 et g2 telles que g1 6 g 6 g2 et kg2 −g1 k1 6 ε (on
prend g1 égale à g partout sauf sur un petit voisinage à gauche de la discontinuité et
on relie les deux extrémités par une droite). Ensuite, comme g1 et g2 sont continues
sur le segment [0, 1], par le théorème de Stone-Weierstrass, il existe deux polynômes
Q1 et Q2 tels que −ε 6 gi − Qi 6 ε sur [0, 1]. Alors les polynômes R1 = Q1 − ε et
R2 = Q2 + ε vérient
R1 6 g1 6 g 6 g2 6 R2
et R2 − R1 = Q2 − Q1 + 2ε 6 g2 − g1 + 4ε. D'où :
Z 1 Z 1
(R2 (x) − R1 (x)) dx 6 (g2 (x) − g1 (x) + 4ε) dx = kg2 − g1 k1 + 4ε 6 5ε.
0 0

217 || Romain Giuge


3.22. Théorème de Hardy-Littlewood

On pose enn : Pi = X + X(1 − X)Ri . Les polynômes P1 et P2 sont nuls en 0, valent


1 en 1 et vérient P1 6 f 6 P2 . Si on note

P2 (x) − P1 (x)
Q(x) = = R2 (x) − R1 (x),
x(1 − x)

alors Q est un polynôme et vérie kQk1 6 5ε.


On utilise maintenant l'hypothèse an = O n1 : il existe M > 0 tel que |an | 6 M
.

n
Pour tout x ∈ [0, 1[, on a :

X ∞
X ∞
X
n n
an f (x ) − an P1 (x ) 6 |an |(P2 − P1 )(xn )
n=0 n=0 n=0

X xn (1 − xn )
6 M Q(xn )
n=1
n

X
6 M (1 − x) xn Q(xn ),
n=1

car (1 − xn ) = (1 − x)(1 + x + · · · + xn−1 ) 6 n(1 − x). D'où :



X ∞
X ∞
X
n n
an f (x ) 6 an P1 (x ) +M (1 − x) xn Q(xn ),
n=0
|n=0 {z } | n=1
{z }
=A(x) =B(x)

pour tout x ∈ [0, 1[. Comme P1 ∈ E , on a déjà A(x) −→− 0. Pour montrer que
x→1
B(x) → 0, par linéarité, on calcule la limite lorsque Q est un monôme : pour tout
x ∈ [0, 1[,
∞ 1
1−x
Z
X
n n k 1 1
(1 − x) x (x ) = k+1
= k
−→− = tk dt.
n=0
1−x 1 + x + · · · + x x→1 k + 1 0

D'où par linéarité : Z 1


B(x) −→− Q(t) dt = kQk1 .
x→1 0

Cela signie que B(x) = |B(x)| 6 kQk1 +ε pour x assez proche de 1− , i .e. B(x) 6 6ε.
Enn, il existe η < 1 tel que pour tout x ∈ [η, 1[,

X
an f (xn ) 6 (6M + 1)ε.
n=0

218 || Romain Giuge


3.22. Théorème de Hardy-Littlewood

Application. Soit an = (−1)n . Alors an = O et pour x ∈ [0, 1[,


n−1
1

n


X (−1)n−1
S(x) = xn = ln(1 + x).
n=1
n

La fonction S admet donc une limite quand x → 1− , qui vaut ln(2). Le théorème
s'applique : an converge et
P

X
an = ln(2).
n=1

Application. Soit an = (−1)n


. Alors an = O 1
et pour x ∈ [0, 1[,

2n+1 n


X (−1)n n
S(x) = x .
n=0
2n + 1

On sait que arctan(x) = ∞ (on peut dériver termes à termes pour le


(−1) n
2n+1
P
n=0 2n+1 x
démontrer). Donc xS(x ) = arctan(x) pour tout x ∈ [0, 1[. On en déduit :
2


arctan( x)
S(x) = √
x

pour tout x ∈ [0, 1[. La fonction S admet donc une limite quand x → 1− , qui vaut
arctan(1) = π4 . Le théorème s'applique : an converge et
P


X π
an = .
n=0
4

Références :
 Gourdon - Analyse - Page 289.

219 || Romain Giuge


3.23. Théorème de Le Cam

3.23 Théorème de Le Cam


Théorème. Soit Sn une variable aléatoire telle que Sn loi Xi où les Xi sont des
Pn
= i=1
loi P
v .a.i . de Bernoulli de paramètres pi ∈]0, 1[. Alors il existe une v .a. Z = P( ni=1 pi )
telle que
n
X
Sn Z
kP −P k6 p2i ,
i=1

où kP Sn − P Z k = supB∈B |P Sn (B) − P Z (B)|.


Démonstration. Soit B ∈ B. On commence par majorer, pour X et Y deux v .a.,
|P X (B) − P Y (B)|. On a :

{X ∈ B} = ({X ∈ B} ∩ {X = Y }) t ({X ∈ B} ∩ {X 6= Y }) .

Donc P (X ∈ B) = P ({X ∈ B} ∩ {X = Y }) + P ({X ∈ B} ∩ {X 6= Y }), et on a


pareil pour Y . Donc :

|P X (B) − P Y (B)| = P ({X ∈ B} ∩ {X 6= Y }) − P ({Y ∈ B} ∩ {X 6= Y })


6 max (P ({X ∈ B} ∩ {X 6= Y }), P ({Y ∈ B} ∩ {X 6= Y }))
6 P (X 6= Y ),

où pour la première inégalité, on a simplement remarqué que si 0 6 a 6 b, on a


|a − b| = b − a 6 b = max(a, b). En passant au sup, il vient :

kP X − P Y k 6 P (X 6= Y ).

On va d'abord prouver le résultat pour n = 1. Soient p ∈]0, 1[ et deux v .a.i . Y


loi loi
et W telles que Y = P(p) et W = Ber(1 − (1 − p)ep ). Soit X = 1 − 1l{Y =W =0} , v .a.
à valeurs dans {0, 1}. On cherche la loi de X :

P (X = 0) = P (Y = 0, W = 0) = P (Y = 0)P (W = 0) = (1 − p)ep e−p = 1 − p.


loi
Donc X = Ber(p).
Montrons que P (X 6= Y ) 6 p2 . On décompose :

{X 6= Y } = ({Y = 0} ∩ {X = 1}) t ({Y = 1} ∩ {X = 0}) t{Y > 2}.


| {z } | {z }
({Y =0}∩{W =1}) =∅

Donc

P (X 6= Y ) = P (Y = 0)P (W = 1) + P (Y > 2)
= e−p (1 − (1 − p)ep ) + (1 − e−p − pe−p )

220 || Romain Giuge


3.23. Théorème de Le Cam

= p(1 − e−p )
6 p2 ,
loi
car e−p > 1 − p. Finalement, si S1 = X , en posant Z = Y , on a le résultat annoncé
par le théorème :

kP S1 − P Z k = kP X − P Y k 6 P (X 6= Y ) 6 p2 .

On va maintenant étendre ce résultat à n entier > 1. On considère les v .a.


loi loi
Yi = P(pi ), Wi = Ber(1 − (1 − pi )epi ) avec Y1 , . . . , Yn , W1 , . . . Wn indépendantes.
loi
Soit Xi = 1 − 1l{Yi =Wi =0} . On a donc Xi = Ber(pi ) et les Xi sont indépendantes.
loi P
Enn, on suppose que Sn = ni=1 Xi et on pose Z = ni=1 Yi .
P
loi P
Comme les Yi sont indépendantes, on a Z = P( ni=1 pi ). En eet, si X et Y sont
deux v .a.i . de loi de Poisson de paramètres respectifs λ > 0 et µ > 0, alors

 X X λk
GX (t) = E t = tk e−λ = e−λ etλ = eλ(t−1) .
k=0
k!

Par indépendance, GX+Y (t) = GX (t)GY (t) = e(λ+µ)(t−1) . Donc GX+Y est la fonction
loi
génératrice d'une v .a. de loi P(λ + µ). Donc X + Y = P(λ + µ).
Enn, on a clairement ni=1 {Xi = Yi } ⊂ {Sn = Z}. Donc {Sn 6= Z} ⊂
T
Sn
i=1 {Xi 6= Yi }, et ainsi :

n
! n n
[ X X
P (Sn 6= Z) 6 P {Xi 6= Yi } 6 P (Xi 6= Yi ) 6 p2i .
i=1 i=1 i=1

On a donc trouvé la v .a. Z qu'on cherchait.

Application. Soient λ > 0 et n ∈ N∗ avec n > λ. On pose pi et Z = P(λ).


= λ
n
Alors (Sn ) converge en loi vers Z . On retrouve ainsi le résultat du théorème central
limite poissonien dans ce cas particulier.
Démonstration. Par le théorème de Le Cam, on a
n  2
Sn Z Sn Z
X λ λ2
|P (B) − P (B)| 6 kP −P k6 = ,
i=1
n n

pour tout B ∈ B . En particulier avec B = {k}, on obtient :

λk −λ λ2
P (Sn = k) − e 6 −→ 0,
k! n n→∞

et ceci prouve que (Sn ) converge en loi vers Z (voir compléments plus bas).

221 || Romain Giuge


3.23. Théorème de Le Cam

Dénition. Pour X v .a. entière et positive, on appelle fonction génératrice de X


la série entière : ∞
 X X
GX (t) = E t = P (X = k)tk ,
k=0

dont le rayon de convergence est clairement > 1.

Dénition. On appelle fonction de répartition de X , ou de sa loi P X , et on note


F X , la fonction dénie sur R par

F X (t) = P X (] − ∞, t]) = P ({ω / X(ω) 6 t}) = P (X 6 t).

Propriété. Une fonction de répartition admet au plus un nombre dénombrable de


points de discontinuité.
Démonstration. Soit Dn l'ensemble des points de discontinuité de F avec un saut
d'amplitude plus grande que n1 . En notant F (t− ) la limite à gauche de F en t, on a :
 
− 1
Dn = t ∈ R / F (t) − F (t ) > .
n

Comme F est croissante et 0 6 F 6 1, on a nécessairement Card(Dn ) 6 n. L'en-


semble des points de discontinuité de F est ∞n=1 Dn qui est au plus dénombrable.
S

Dénition. Soient Xn , n ∈ N, des variables aléatoires réelles, dénies sur (Ω, A, P ).


On dit que (Xn ) converge en loi vers X si l'une des conditions équivalentes suivantes
est vériée :
(i) limn→∞ F Xn (t) = F X (t) en tout point de continuité t de F X .
(ii) limn→∞ φ(Xn ) dP = φ(X) dP pour toute fonction φ : R → R continue
R R

bornée.
(iii) limn→∞ ϕXn (t) = ϕX (t) pour tout t ∈ R.

Proposition. Soient Xn , n ∈ N, des variables aléatoires à valeurs entières. Alors


(Xn ) converge en loi vers X si et seulement si limn→∞ P (Xn = k) = P (X = k),
pour tout k ∈ N.
Démonstration. On suppose que (Xn ) converge en loi vers X . Soit k ∈ N. D'après
la propriété précédente, toute fonction de répartition admet un nombre au plus
dénombrable de points de discontinuité. Donc il existe s et t avec

k−1<s<k <t<k+1

222 || Romain Giuge


3.23. Théorème de Le Cam

tels que F X soit continue en s et en t. Alors par dénition de la convergence en loi


de (Xn ) vers X , on a la limite suivante :

P (Xn = k) = F Xn (t) − F Xn (s) −→ F X (t) − F X (s) = P (X = k).


n→∞

Réciproquement, supposons que limn→∞ P (Xn = k) = P (X = k), pour tout


k ∈ N. Soit t ∈ [k, k + 1[. On a :
k
X k
X
F Xn (t) = P (Xn = l) −→ P (X = l) = F X (t),
n→∞
l=0 l=0

donc (Xn ) converge en loi vers X .

Théorème (Théorème limite central poissonien). Soit Sn une variable aléatoire de


loi B(n, pn ). Si limn→∞ npn = λ > 0, alors Sn converge en loi vers une variable
aléatoire de Poisson de paramètre λ.
Démonstration. D'après la proposition précédente, il sut de prouver que pour tout
k ∈ N,
λk
lim P (Sn = k) = e−λ .
n→∞ k!
On calcule donc la limite de P (Sn = k) = k pn (1 − pn )n−k , ce qui est facile.
n k


Références :
 Carrieu - Probabilités, exercices corrigés - Page 78.

223 || Romain Giuge


3.24. Théorème de Liapounov

3.24 Théorème de Liapounov


Lemme. Soit A ∈ Mn (R) dont on note λ1 , . . . , λr les valeurs propres distinctes.
Alors il existe C > 0 tel que pour tout t ∈ R et tout x ∈ Rn ,
r
!
X
ketA xk 6 C(1 + |t|)n−1 etRe(λi ) kxk.
i=1

En particulier, si Re(λi ) < 0 pour tout i et si a est tel que 0 < a < min(−Re(λi )),
alors ketA xk 6 Ke−at kxk pour tout t > 0.
Démonstration. On écrit x = x1 + · · · + xr avec xi ∈ Ei = Ker((A − λi In )mi ) (sous-
espace caractéristique de A associé à la valeur propre λi de multiplicité mi ). Chaque
Ei est stable par A et
i −1 k
m
!
X t
etA xi = etλi et(A−λi In ) xi = etλi (A − λi In )k xi .
k!
k=0

On majore :
i −1 k i −1
m m
!
X t X |t|k
(A − λi In )k 6 Ci 6 Ci (1 + |t|)mi −1 6 Ci (1 + |t|)n−1 ,
k=0
k! k=0
k!
k
car |t|k! 6 |t|k 6 mik−1 |t|k . Puis :


r
X
tA
ke xk 6 ketA xi k
i=1
r
!
X
6 max(Ci )(1 + |t|)n−1 etRe(λi ) max(kxi k).
i=1

Or N (x) = max(kxi k) est une norme et toutes les normes sur Rn sont équivalentes,
donc il existe C 0 tel que max(kxi k) 6 C 0 kxk, ce qui donne le résultat.
Enn, si Re(λi ) < 0 pour tout i et si a est tel que 0 < a < min(−Re(λi )), on a
r
!
tA
ke xk X
−at
6 C 0 max(Ci )(1 + |t|)n−1 et(Re(λi )+a) ,
e kxk i=1

et ce majorant est borné pour tout t > 0 car il tend vers 0 quand t → ∞, d'où la
deuxième assertion.
Théorème. On considère le système diérentiel
y 0 = f (y), y(0) = x0

avec f : Rn → Rn de classe C 1 telle que f (0) = 0. On suppose que la matrice


A = Df (0) a toutes ses valeurs propres de partie réelle strictement négative. Alors
pour x0 assez proche de 0, la solution y(t) tend exponentiellement vers 0 lorsque t
tend vers l'inni.

224 || Romain Giuge


3.24. Théorème de Liapounov

Démonstration. On pose, pour x, y ∈ Rn ,


Z ∞
b(x, y) = (etA x, etA y) dt.
0

Cette intégrale est absolument convergente par l'inégalité de Cauchy-Schwarz et


le lemme précédent. On dénit ainsi une forme bilinéaire symétrique. On pose en-
suite q(x) = b(x, x) qui dénit une forme quadratique dénie positive : q(x) =
R ∞ tA 2
0
ke xk dt > 0 et si q(x) = 0, alors etA x = 0 pour tout t (par continuité), donc
x = 0 en prenant t = 0.

On note k · kq = q la norme associée à q , qui est équivalente à k · k sur Rn de
dimension nie. On va étudier le comportement de kykq . Par la formule de Taylor-
Young, on a f (y) = f (0) + Df (0).y + o (kyk) = Ay + o (kyk). Pour la suite, on note
r(y) = f (y) − Ay = o (kyk).
On a q(y)0 = 2b(y, y 0 ) = 2b(y, Ay) + 2b(y, r(y)). Or pour x ∈ Rn ,
Z ∞
∞
2(etA x, etA Ax) dt = (etA x, etA x) 0 = −kxk2 ,

2b(x, Ax) =
0

encore d'après le lemme pour la limite du crochet à l'inni. On va maintenant


majorer b(y, r(y)) :
|b(y, r(y))| 6 kykq kr(y)kq
kr(y)k
par l'inégalité de Cauchy-Schwarz appliquée à la norme k·kq . Mais kykq q → 0 quand
y → 0 par dénition du reste. Soit ε > 0 : il existe α > 0 tel que q(y) = kyk2q 6 α
implique kr(y)kq 6 εkykq . Donc

|2b(y, r(y))| 6 2εkyk2q .

Par équivalence des normes, il existe C > 0 tel que Ckyk2q 6 kyk2 , d'où nalement :

q(y)0 = −kyk2 + 2b(y, r(y)) 6 −Ckyk2q + 2εkyk2q = −βq(y)

pour q(y) 6 α, avec β = C − 2ε > 0 si on choisit ε < C


2
.

On suppose maintenant que la condition initiale x0 vérie q(x0 ) = kx0 k2q < α.
Alors q(y(t)) = ky(t)k2q < α pour tout t > 0. En eet, sinon il existerait un plus
petit temps t0 > 0 tel que q(y(t0 )) > α. Par continuité de t 7→ q(y(t)), on a en
fait q(y(t0 )) = α, et alors q(y)0 (t0 ) 6 −βq(y(t0 )) < 0. Donc q(y(t)) décroît et est
strictement plus grand que α pour t légèrement inférieur à t0 , ce qui contredit la
dénition de t0 . Donc pour tout t > 0, q(y(t)) < α, ce qui implique

q(y)0 (t) 6 −βq(y(t)),

pour tout t > 0. On intègre cette inéquation diérentielle :


0
eβt q(y) = eβt (q(y)0 + βq(y)) 6 0,

225 || Romain Giuge


3.24. Théorème de Liapounov

et donc t 7→ eβt q(y(t)) est décroissante pour t > 0. Ainsi

q(y(t)) 6 e−βy q(y(0)) = e−βt q(x0 ),

pour tout t > 0. Ceci prouve la décroissance exponentielle de y(t) vers 0.

Compléments :
On a ainsi prouvé que les solutions de y 0 = f (y) se comportent de la même
façon que celles de z 0 = Az au voisinage de l'équilibre 0. L'origine est un point
d'équilibre attractif, propriété qui se transmet du système diérentiel linéaire au
système perturbé par le petit terme correctif r(y). La solution du système linéarisé
est en eet z(t) = etA x qui converge exponentiellement vers 0 d'après le lemme.

On n'a pas parlé de l'existence d'une solution y dénie pour tout t > 0. Pour
x ∈ Rn , on note y l'unique solution maximale de y 0 = f (y) telle que y(0) = x, dont
l'existence et l'unicité sont données par le théorème de Cauchy-Lipschitz.
On a ensuite prouvé à la n de la démonstration que lorsque kxkq < α, y(t)
reste dans la boule Bq (0, α). Cela empêche donc y d'exploser en temps ni, et donc
y solution maximale est nécessairement dénie pour tout t > 0. En eet, supposons
par l'absurde que y soit dénie sur I =]b, c[ intervalle ouvert maximal contenant
0 avec c ni. Alors comme f est continue, y 0 = f (y) est bornée sur I , par un réel
M > 0. Par l'inégalité de la moyenne, on a donc :

ky(t1 ) − y(t2 )k 6 M |t1 − t2 |

pour tout t1 , t2 ∈ I . Par le critère de Cauchy, on en déduit que y(t) admet une limite
nie l lorsque t tend vers c à gauche. De plus, y 0 (t) = f (y(t)) → f (l) quand t → c.
Par le théorème de prolongement de la dérivée, cela prouve que y 0 (c) existe et vaut
f (l). Si on pose
n
ϕ : ]b, c] −→ R 
y(t) si t 6= c
t 7−→
l si t = c,

alors ϕ est solution du système diérentiel sur ]b, c], ce qui contredit la maximalité
de y .
On peut prouver de la même façon le théorème suivant qui montre le phénomène
d'explosion en temps ni :

Théorème. Soit l'équation diérentielle y0 = F (t, y) avec F : I×Rn → Rn continue,


I étant un intervalle ouvert de R. On suppose F localement lipschitzienne par rapport
à sa deuxième variable. Soit y une solution maximale dénie sur J =]α, β[. Alors :

226 || Romain Giuge


3.24. Théorème de Liapounov

(i) Si α ∈ I , alors lim sup ky(t)k = ∞.


t→α
(ii) Si β ∈ I , alors lim sup ky(t)k = ∞.
t→β

Enn, on peut remarquer qu'on a eu seulement besoin que f soit localement


lipschitzienne (pour le théorème de Cauchy-Lipschitz et avoir la continuité) au voi-
sinage de 0 et diérentiable en 0, et pas que f soit C 1 , cette hypothèse impliquant
bien sûr les précédentes.

Références :
 Rouvière - Petit guide de calcul diérentiel à l'usage de la licence et de l'agré-
gation - Page 138.

227 || Romain Giuge


3.25. Théorème des extrema liés

3.25 Théorème des extrema liés


Théorème. Soient f, g1 , . . . , gr : U → R des fonctions de classe C 1 sur un ouvert
U de Rn . On pose :

Γ = {x ∈ U / g1 (x) = · · · = gr (x) = 0}.

Si f|Γ admet un extremum local en a ∈ Γ et si les formes linéaires Dg1 (a), . . . , Dgr (a)
sont linéairement indépendantes, alors il existe des réels λ1 , . . . , λr (appelés multi-
plicateurs de Lagrange) tels que

Df (a) = λ1 Dg1 (a) + · · · + λr Dgr (a).

Remarque. Les λi sont uniques car la famille (Dgi (a)) est libre.
Démonstration. D'abord, on remarque que nécessairement, r 6 n car la famille
(Dgi (a)) est libre dans (Rn )∗ de dimension n. Ensuite, si r = n, le théorème est
évident car la famille (Dgi (a)) devient une base de (Rn )∗ et donc Df (a) s'exprime
sur cette base. On suppose donc r 6 n − 1.
Soit s = n − r > 1. On identie Rn à Rs × Rr et on écrit les éléments de Rn sous
la forme (x, y) = (x1 , . . . , xs , y1 , . . . , yr ). On pose a = (α, β) ∈ Rs × Rr .
Comme la famille (Dgi (a)) est libre, la matrice
 ∂g ∂g1 ∂g1 ∂g1

1
∂x1
(a) . . . ∂x s
(a) ∂y 1
(a) . . . ∂y r
(a)
 . .. .. .. 
 .
. . . . 


∂gr ∂gr ∂gr ∂gr
∂x1
(a) . . . ∂x s
(a) ∂y 1
(a) . . . ∂y r
(a)

est de rang r. On peut alors en extraire une sous-matrice de taille


 r ∗ r inversible,
 et
quitte à changer le nom des variables, on peut supposer que det ∂yj (a)
∂gi
6= 0.
16i,j6r
D'après le théorème des fonctions implicites, en notant g = (g1 , . . . , gr ), on peut
donc trouver un voisinage ouvert U 0 de α dans Rs , un voisinage ouvert U 00 de β dans
Rr et une fonction ϕ = (ϕ1 , . . . , ϕr ) : U 0 → U 00 de classe C 1 tels que

x ∈ U 0 , y ∈ U 00 et g(x, y) = 0 ⇐⇒ x ∈ U 0 et y = ϕ(x).

Posons h(x) = f (x, ϕ(x)). La fonction h admet un extremum local en x = α car


f (α, ϕ(α)) = f (α, β) = f (a) et (x, ϕ(x)) ∈ Γ pour tout x ∈ U 0 . Par conséquent,
Dh(α) = 0, i .e. pour tout i ∈ [[1, s]],
r
∂h ∂f X ∂ϕj ∂f
(α) = (a) + (α) (a) = 0.
∂xi ∂xi j=1
∂x i ∂y j

228 || Romain Giuge


3.25. Théorème des extrema liés

D'autre part, pour tout k ∈ [[1, r]], gk (x, ϕ(x)) = 0, donc en dérivant par rapport à
xi , pour tout i ∈ [[1, s]], on obtient
r
∂gk X ∂ϕj ∂gk
(a) + (α) (a) = 0.
∂xi j=1
∂x i ∂y j

Ces deux dernières égalités impliquent que les s premiers vecteurs colonnes de la
matrice  ∂f ∂f ∂f ∂f

∂x1
(a) . . . ∂x s
(a) ∂y 1
(a) . . . ∂y r
(a)
 ∂g1 ∂g ∂g ∂g
 ∂x1 (a) . . . ∂x1s (a) ∂y11 (a) . . . ∂y1r (a)

M = .
 .. .. .. 
 . . . . . 

∂gr ∂gr ∂gr ∂gr
∂x1
(a) . . . ∂x s
(a) ∂y 1
(a) . . . ∂y r
(a)
s'expriment linéairement en fonction des r derniers. Donc rg(M ) 6 r. Or le rang
des vecteurs lignes est égal au rang des vecteurs colonnes, donc les r + 1 vecteurs
lignes de M forment une famille liée. Il existe donc µ0 , . . . , µr non tous nuls tels que
µ0 Df (a) + µ1 Dg1 (a) + · · · + µr Dgr (a) = 0. Comme la famille (Dgi (a)) est libre, on
a nécessairement µ0 6= 0, d'où le résultat en divisant l'égalité par µ0 .

Une application importante du théorème des extrema liés est le théorème suivant
concernant la diagonalisabilité des endomorphismes symétriques :

Théorème. Soit u un endomorphisme d'un espace euclidien E . Alors E possède


une base orthonormée de vecteurs propres pour u.
Démonstration. Considérons la fonction
f : E −→ R
x 7−→ (u(x), x),

qui est de classe C ∞ . Comme E est de dimension nie (car euclidien), la sphère unité
de E est compacte et donc f atteint son minimum sur cette sphère en un point v .
D'autre part, on peut considérer le problème de minimisation suivant : on cherche
à minimiser f sous la contrainte g(x) = kxk2 − 1 = 0. Le théorème des extrema
liés nous dit alors qu'il existe λ ∈ R tel que Df (v) = λDg(v). Or comme u est
symétrique, on a (u(x), h) = (x, u(h)), et on obtient en développant f (x + h) =
(u(x + h), x + h) :
Df (x).h = 2(u(x), h).
Enn, comme Dg(x).h = 2(x, h), on obtient

(u(v), h) = λ(v, h),

229 || Romain Giuge


3.25. Théorème des extrema liés

pour tout h ∈ E . On en déduit que u(v) = λv , i .e. que v est un vecteur propre de
u.
On pose maintenant e1 = v et E 0 = Vect(e1 )⊥ . Si x ∈ E 0 , alors

(u(x), e1 ) = (x, u(e1 )) = λ(x, e1 ) = 0,

i .e. E 0 est stable par u. On peut donc conclure par récurrence : E possède une base
orthonormée de vecteurs propres pour u.

Remarque : si µ est une autre valeur propre de u et qu'on note w un vecteur


propre unitaire associé, alors

f (w) = µkwk2 = µ > inf f (x) = λ,


kxk=1

et donc λ est la plus petite valeur propre de u.

Donnons deux autres applications du théorème des extrema liés :

Application (Inégalité arithmético-géométrique). Soit n ∈ N, n > 2. Alors pour


tout (x1 , . . . , xn ) ∈ (R+ )n ,
n
! n1 n
Y 1X
xi 6 xi .
i=1
n i=1

Démonstration. Soient s > 0, f : Rn → R, (x1 , . . . , xn ) 7→ ni=1 xi , g : Rn →


Q

R, (x1 , . . . , xn ) 7→ ni=1 xi − s et
P

Γ = {(x1 , . . . , xn ) ∈ Rn / g(x) = 0}.

La fonction f est continue sur le compact K = Γ∩(R+ )n (compact car fermé borné) :
soit a ∈ K le maximum global de f sur K . On a en réalité a ∈ U = Γ ∩ (R∗+ )n car
f (x) = 0 si l'un des xi est nul.
Donc f|U admet un extremum global en a, et comme U est un ouvert de Γ, f|Γ
atteint un extremum local en a. Clairement, Dg(a) 6= 0 (c'est même vrai pour tout
x ∈ Rn ), donc on peut appliquer le théorème des extrema liés : il existe λ ∈ R tel
que Df (a) = λDg(a), et donc pour tout i ∈ [[1, n]],
∂f f (a) ∂g
(a) = =λ (a) = λ.
∂xi ai ∂xi
Or f (a) 6= 0, donc tous les ai sont égaux. Comme ni=1 ai = s (car a ∈ Γ), on a
P

ai = ns . Finalement,
Yn  s n
f (x) = xi 6 f (a) = ,
i=1
n

230 || Romain Giuge


3.25. Théorème des extrema liés

Pn
pour tout x ∈ K . Mais pour x ∈ K , on a s = i=1 xi , donc on obtient
n  Pn n
Y
i=1 xi
xi 6 ,
i=1
n

et cette inégalité est vraie pour tout x ∈ (R+ )n car elle est vraie pour n'importe
quel s > 0.
1
Application. Soit n ∈ N∗ . On munit Mn (R) de la norme kM k =
P
i,j m2 2
ij .
Alors l'ensemble des éléments de SLn (R) = {M ∈ Mn (R), det(M ) = 1} de norme
minimale est SOn (R) = {M ∈ On (R), det(M ) = 1}.
Démonstration. On remarque que kM k2 = tr(t M M ). Il s'agit donc de minimiser
f (M ) = tr(t M M ) sous la contrainte g(M ) = 0 avec g(M ) = det(M ) − 1.
On vérie les hypothèses du théorème des extrema liés : f et g sont C 1 sur Mn (R)
(car f est une forme quadratique, et g est fonction du déterminant polynomial
en les coecients de la matrice). L'ensemble SLn (R) = g −1 ({0}) est un fermé de
Mn (R), donc le minimum de f sur SLn (R) est atteint en un point A ∈ SLn (R).
En eet, dans tout espace vectoriel de dimension nie, la distance d de 0 à un
fermé F est toujours atteinte puisqu'elle est atteinte sur le compact K des éléments
x de F tels que kxk 6 d + 1. La diérentielle de g est celle du déterminant, donc
Dg(A).H = tr(t com(A)H). Ainsi Dg(A) 6= 0. Le théorème s'applique donc : il existe
λ ∈ R tel que Df (A) = λDg(A).
En développant f (A + H), on trouve Df (A).H = 2tr(t AH). Donc

2tr(t AH) = λtr(t com(A)H),

pour tout H ∈ Mn (R). En prenant H = Eij , on trouve que 2A = λcom(A). Comme


A est inversible et det(A) = 1, on a com(A) = t A−1 (avec l'identité t com(A)A =
det(A)In ). Donc 2t AA = λIn . En prenant le déterminant, il vient 2n = λn , et comme
t
AA est une matrice symétrique dénie positive, on a λ > 0, donc λ = 2. D'où :
t
AA = In , i .e. A ∈ SOn (R).
On a donc démontré que le minimum de f sur SLn (R) était nécessairement
atteint en un point A ∈ SOn (R), et la valeur de cette distance minimale est égale
à tr(t AA) = tr(In ) = n. Réciproquement, tous les éléments M ∈ SOn (R) vérient
f (M ) = n, d'où le résultat.

Théorème (Théorème des fonctions implicites). Soient U un ouvert de Rn × Rp ,


(a, b) un point de U et f : (x, y) 7→ f (x, y) une application de classe C 1 de U dans

231 || Romain Giuge


3.25. Théorème des extrema liés

Rp . On suppose que f (a, b) = 0 et que la matrice jacobienne Dy f (a, b), formée des
dérivées partielles par rapport à y, est inversible, i.e. det(Dy f (a, b)) 6= 0.
Alors l'équation f (x, y) = 0 peut être résolue localement par rapport aux variables
y : il existe V voisinage ouvert de a dans Rn , W voisinage ouvert de b dans Rp ,
avec V × W ⊂ U et Dy f (x, y) inversible pour tout (x, y) ∈ V × W , et une unique
application ϕ : V → W telle que

x ∈ V, y ∈ W et f (x, y) = 0 x ∈ V et y = ϕ(x) .
   
⇐⇒

De plus, ϕ est de classe C 1 sur V .


Exemple. Dans R2 , on cherche le ou les points les plus proches de l'origine sur une
courbe C . Si la courbe C est dénie paramétriquement par x = x(t) et y = y(t) où
t parcourt un intervalle I , il s'agit de déterminer le minimum sur I de la fonction
f : t 7→ x(t)2 + y(t)2 (distance au carré de (x(t), y(t)) à l'origine). C'est un problème
d'extrema libres car x(t) et y(t) sont indépendants, et on le résout en sachant que
les extrema t sont des points critiques : nécessairement f 0 (t) = 0.
Si la courbe C est dénie implicitement par l'équation g(x, y) = 0, il s'agit de
déterminer le minimum de f : (x, y) 7→ x2 + y2 lorsque x et y sont liés par cette
relation g(x, y) = 0. Le théorème des extrema liés nous dit que Df (a, b) = λDg(a, b).
On résout alors le système de 3 équations en les 3 inconnues a, b, λ suivant :

∂f ∂g
 ∂x (a, b) = λ ∂x (a, b)



∂f ∂g
∂y
(a, b) = λ ∂y (a, b)


g(a, b) = 0.

Remarque. Si on suppose de plus Df (a) 6= 0, l'hypersurface S de niveau de f passant


par a, d'équation f (x) = f (a), est lisse en a (théorème 5.11 dans Rouvière page 200).
La condition nécessaire d'extrema liés signie alors que son espace vectoriel tangent
en a, qui est le noyau de Df (a), contient l'espace vectoriel tangent en Γ (i .e. tous
les vecteurs v tels que Dgi (a).v = 0 pour tout i). Donc Γ est tangent en a à S .
En reprenant l'exemple précédent, si on trace des cercles de centre O et de rayons
croissants jusqu'à rencontrer la courbe C , on voit sur un dessin que le ou les points
de C qui minimisent la distance à l'origine sont tels que C est tangente à un de ces
cercles. Les cercles sont en fait des niveaux de f (x, y) = x2 + y 2 , ceci est donc justié
par ce que l'on vient de dire.

Références :
232 || Romain Giuge
3.25. Théorème des extrema liés

 Gourdon - Analyse - Page 327 (le théorème), page 319 (la première applica-
tion), page 321 (la deuxième application).
 Benzoni-Gavage - Calcul diérentiel et équations diérentielles - Exercice 3.1
page 87 (l'application à la diagonalisabilité des endormorphismes symétriques).
 Rouvière - Petit guide de calcul diérentiel à l'usage de la licence et de l'agré-
gation - Page 192 (théorème des fonctions implicites) et page 372 (suppléments
sur le théorème des extrema liés).

233 || Romain Giuge


3.26. Théorème des quatre sommets

3.26 Théorème des quatre sommets


Théorème. Soit f : R → R2 un arc de classe C 3 paramétré par l'abscisse curvi-
ligne, τ -périodique, correspondant à une courbe C fermée, simple et convexe (i .e.
qui délimite une partie convexe). Alors la courbure γ de C admet au moins quatre
points critiques sur chaque période.
Démonstration. Comme f est de classe C 3 , sa tangente unitaire T est de classe C 2 ,
et sa normale unitaire N et sa courbure γ sont de classe C 1 . Ces fonctions sont
également τ -périodiques et on a
Z τ
γ 0 (s) ds = γ(τ ) − γ(0) = 0.
0

Par intégration par parties, on a de plus


Z τ Z τ
0
 τ
γ (s)f (s) ds = γ(s)f (s) 0 − γ(s)T (s) ds
0 | {z } 0
Z τ =0
= N 0 (s) ds = N (τ ) − N (0) = 0,
0

où l'on s'est servi de la deuxième formule de Frénet : N 0 (s) = −γ(s)T (s). En


écrivant f (s) = (x(s), y(s)), on a donc
Z τ Z τ Z τ
0 0
γ (s) ds = x(s)γ (s) ds = y(s)γ 0 (s) ds = 0. (∗)
0 0 0

Comme γ est continue, elle admet au moins un maximum et un minimum sur


chaque période. Ces extrema sont des points critiques, notons-les s1 et s2 avec s1 <
s2 < s1 + τ .
Si γ est constante, le résultat est immédiat. On suppose donc que γ 0 n'est pas
identiquement nulle, et étant d'intégrale nulle sur une période (par (∗)), γ 0 ne peut
être de signe constant sur [s1 , s1 + τ ].
On suppose que s1 et s2 sont les seuls points critiques de γ . Comme C délimite un
convexe, la droite (f (s1 )f (s2 )) sépare C en exactement deux arcs, et par continuité
de γ 0 , γ 0 ne s'annule pas et reste de signe constant sur [s1 , s2 ] et sur [s2 , s1 + τ ]. Soit
ax + by + c = 0 une équation de la droite (f (s1 )f (s2 )). Alors

g : s 7→ (ax(s) + by(s) + c)γ 0 (s)



doit être de signe constant sur [s1 , s1 + τ ]. Or par (∗), 0 g(s) ds = 0, donc comme
g est continue, cela implique g = 0, ce qui est absurde car alors toute la courbe C
serait incluse dans la droite (f (s1 )f (s2 )) et la courbure γ serait constante.

234 || Romain Giuge


3.26. Théorème des quatre sommets

Donc γ admet un troisième point critique s3 dans [s1 , s1 + τ [ et on peut supposer


pour se xer les idées que s1 < s3 < s2 < s1 + τ . Supposons à nouveau que ce sont
les seuls points critiques de γ . Alors γ 0 reste de signe constant sur [s1 , s3 ], [s3 , s2 ] et
sur [s2 , s1 + τ ]. Il y a donc nécessairement deux arcs adjacents où γ 0 reste de même
signe. S'il s'agit des arcs [s1 , s2 ] et [s2 , s1 + τ ], c'est absurde d'après le raisonnement
précédent. Les autres cas de gure se traitent de la même façon.
Finalement, γ admet au moins quatre points critiques sur [s1 , s1 + τ [.

Exemple. D'après le théorème des quatre sommets, une ellipse admet au moins
quatre sommets. Vérions-le.
On paramètre l'ellipse par f : t 7→ (a cos(t), b sin(t)), t ∈ [0, 2π], a, b > 0. On a
f 0 (t) = (−a sin(t), b cos(t)) et f 00 (t) = (−a cos(t), −b sin(t)),

d'où det(f 0 (t), f 00 (t)) = ab. De plus,


q
kf 0 (t)k = a2 sin2 (t) + b2 cos2 (t),

et donc la courbure vaut


det(f 0 (t), f 00 (t)) ab
γ(t) = = 3 .
kf 0 (t)k3 (a2 sin2 (t) + b2 cos2 (t)) 2
En la dérivant, on trouve
3ab(b2 − a2 ) cos(t) sin(t)
γ 0 (t) = 5 .
(a2 sin2 (t) + b2 cos2 (t)) 2
Il y a donc en réalité quatre annulations à γ 0 : en t = 0, π2 , π, et 3π
2
.

On peut également déterminer la développée de l'ellipse, i.e. le lieu de ses centres


de courbure. Le vecteur tangent T (t) vaut
f 0 (t) 1
T (t) = 0
=p (−a sin(t), b cos(t)),
kf (t)k a2 sin2 (t) + b2 cos2 (t)
et le vecteur normal correspondant est donc
1
N (t) = p (−b cos(t), −a sin(t)),
a2 sin2 (t) + b2 cos2 (t)
où pour éviter les calculs, on peut prendre un vecteur N (t) perpendiculaire à T (t)
tel que (T (t), N (t)) soit direct, puis le normaliser. Les coordonnées des centres de
courbure C(t) sont donc :
1
C(t) = f (t) + N (t)
γ(t)

235 || Romain Giuge


3.26. Théorème des quatre sommets

a2 sin2 (t) + b2 cos2 (t)


= (a cos(t), b sin(t)) + (−b cos(t), −a sin(t))
 2 ab
a − b2 b 2 − a2
= cos3 (t), sin3 (t) .
a b

En bleu la développée de l'ellipse :

Remarque. Soit C une courbe fermée simple. Le théorème de Jordan, très intuitif,
dit que le complémentaire de la courbe C dans le plan R2 est composé de deux
composantes connexes dont l'une seulement est bornée. On note A l'adhérence dans
R2 de la composante bornée. On dit que la courbe est convexe si pour tous points
P1 , P2 ∈ C , le segment [P1 P2 ] est inclu dans A.
Il est aussi intuitif qu'une courbe fermée simple est convexe si et seulement si
sa courbure reste de signe constant. Pour s'en convaincre, on peut aussi utiliser la
troisième formule de Frénet : γ(s) = θ0 (s). Si la courbure γ reste positive, alors le
paramètre angulaire θ (angle entre la tangente et l'axe des abscisse) est croissant.
On pourrait aussi décomposer la courbe en deux courbes : on note A le point le plus
à gauche, B le point le plus à droite, f1 : x 7→ y1 la courbe "du bas", et f2 : x 7→ y2
la courbe "du haut". Alors f1 est une fonction de R dans R convexe, qui reste donc
au-dessus de ses tangentes, et f2 concave, qui reste en-dessous de ses tangentes.

Dénition. Une courbe continue f : [a, b] → R2 est dite fermée si f (a) = f (b). Elle
est dite simple si f|[a,b[ est injective, i .e. si la courbe ne se recoupe pas elle-même.
Dénition. Soit f : I → R2 de classe C 1 . On dit que le paramétrage f est régulier
si f 0 (t) 6= 0 pour tout t ∈ I .

236 || Romain Giuge


3.26. Théorème des quatre sommets

Dénition. Soient (I, f ) et (J, g) deux arcs paramétrés. On dit qu'ils sont C k -
équivalents s'il existe un C k -diéomorphisme θ de I sur J tel que f = g ◦ θ. On dit
aussi que (J, g) est un paramétrage admissible de l'arc (I, f ).

Dénition. Soit (I, f ) un arc paramétré de classe C 1 . Un reparamétrage (J, g) de


l'arc est dit normal s'il vérie kg 0 (u)k = 1 pour tout u ∈ J .

Dénition. La longueur d'une courbe paramétrée f : [a, b] → R2 est donnée par


n−1
X
l(f ) = sup kf (ti+1 ) − f (ti )k
k=0

où le sup est pris sur toutes les subdivisions t0 = a < t1 < · · · < tn = b de l'intervalle
[a, b], n étant quelconque.

Théorème. Soit f : [a, b] → R2 une courbe paramétrée de classe C 1 . Alors


Z b
l(f ) = kf 0 (t)k dt.
a

Démonstration. Soit t0 = a < t1 < · · · < tn = b une subdivision de l'intervalle [a, b].
Pour i ∈ [[1, n − 1]], on a
Z ti+1 Z ti+1
0
kf (ti+1 ) − f (ti )k = f (t) dt 6 kf 0 (t)k dt.
ti ti

Cela implique, en sommant :


n−1
X Z b
kf (ti+1 ) − f (ti )k 6 kf 0 (t)k dt.
k=0 a

En passant au sup sur toutes les subdivisions, on obtient


Z b
l(f ) 6 kf 0 (t)k dt.
a

Pour montrer l'égalité, on introduit la fonction ϕ : [a, b] → R qui donne la


longueur de la courbe entre a et t. Soient t ∈ [a, b] et h ∈ R tel que t + h ∈ [a, b]. La
longueur de la courbe entre les paramètres t et t + h est plus grande que la longueur
du segment reliant f (t) à f (t + h) (le plus court chemin est la ligne droite), donc

kf (t + h) − f (t)k 6 ϕ(t + h) − ϕ(t).

On en déduit l'encadrement suivant :


t+h
kf (t + h) − f (t)k ϕ(t + h) − ϕ(t)
Z
1
6 6 kf 0 (u)k du,
h h h t

237 || Romain Giuge


3.26. Théorème des quatre sommets

la deuxième inégalité étant donnée par la majoration de l(f ) établie en premier. Les
membres de droite et de gauche tendent vers la même limite kf 0 (t)k quand h → 0,
donc par encadrement, ϕ est dérivable en t et ϕ0 (t) = kf 0 (t)k. Finalement
Z t
ϕ(t) = kf 0 (t)k dt
a

où l'on intègre à partir de a pour avoir ϕ(a) = 0, puis


Z b
l(f ) = ϕ(b) = kf 0 (t)k dt.
a

Dénition. On appelle abscisse curviligne de (I, f ) toute application s de I dans


R telle que si t1 , t2 ∈ I avec t1 < t2 , alors s(t2 ) − s(t1 ) est la longueur de l'arc
([t1 , t2 ], f ).

Proposition. Les abscisses curvilignes de l'arc orienté (I, f ) sont exactement les
primitives de la fonction t 7→ kf (t)k.
0

Démonstration. Cela découle de la dénition et du théorème précédent.


Théorème. Si (I, f ) est un arc paramétré de classe C 1 régulier, alors toute abscisse
curviligne est un paramétrage admissible de classe C 1 .
Démonstration. Soit s une abscisse curviligne. Pour tout t ∈ I , s0 (t) = kf 0 (t)k > 0
car l'arc est régulier. Donc s est strictement croissante sur I . Comme s est continue
(car C 1 ), s : I → J = s(I) est bijective. De plus, s0 ne s'annule pas sur I , donc s−1
est dérivable sur J et
1
(s−1 )0 = 0 −1
s ◦s
qui est continue sur J . Par conséquent, s est un C 1 -diéomorphisme, c'est donc un
paramétrage admissible de (I, f ) de classe C 1 .

Proposition. Si (I, f ) est un arc paramétré de classe C 1 régulier, alors toute abs-
cisse curviligne est un paramétrage normal de (I, f ).
Démonstration. On note J = s(I) et F = f ◦ s−1 . L'arc (J, F ) est un arc paramétré
équivalent à (I, f ). En dérivant f = F ◦ s, on obtient f 0 (t) = s0 (t)F 0 (s(t)), soit
encore
f 0 (t) f 0 (t)
F 0 (s(t)) = 0 = 0 ,
s (t) kf (t)k
car toute abscisse curviligne est une primitive de t 7→ kf 0 (t)k. On en déduit kF 0 (s)k =
1 et donc s dénit un paramétrage normal (J, F ) de (I, f ).

238 || Romain Giuge


3.26. Théorème des quatre sommets

Dénition. Soit f : I → R2 une courbe paramétrée de classe C 2 . On dit que la


courbe f est birégulière si f 0 (t) et f 00 (t) sont linéairement indépendants pour tout
t ∈ I.

Dénition. Soit f : I → R2 une courbe régulière. Le vecteur tangent unitaire à la


courbe à l'instant t est le vecteur
f 0 (t)
T (t) = .
kf 0 (t)k

Dénition. Soit f : I → R2 une courbe paramétrée birégulière. La première nor-


male ou normale principale en t ∈ I est le vecteur
T 0 (t)
N (t) = .
kT 0 (t)k

Dénition. Soit f : I → R2 une courbe régulière de classe C 2 paramétrée par


l'abscisse curviligne. Le nombre γ(s) = kf 00 (s)k = kT 0 (s)k est appelé courbure de la
courbe f en s ∈ I . C'est la norme du vecteur accélération d'un mobile parcourant
la courbe à vitesse constante égale à 1.

Théorème (Formules de Frénet). Soit f : I → R2 une courbe régulière de classe


C 2 paramétrée par l'abscisse curviligne. On note T le vecteur tangent unitaire, N le
vecteur normal unitaire, γ la courbure et θ le paramètre angulaire (que l'on dénira
dans la démonstration). On a alors les formules de Frénet :
T 0 (s) = γ(s)N (s), N 0 (s) = −γ(s)T (s), et θ0 (s) = γ(s).

Démonstration. Comme la courbe est paramétrée par l'abscisse curviligne, γ(s) =


0 0
kf 00 (s)k = kT 0 (s)k. Donc N (s) = kTT 0 (s)k
(s)
= Tγ(s)
(s)
, ce qui donne la première formule
de Frénet.
Ensuite, T est une fonction de classe C 1 de I vers le cercle unité de R2 , donc
d'après le théorème de relèvement, il existe une fonction θ : I → R de classe C 1
telle que T (s) = cos(θ(s)), sin(θ(s)) , pour tout s ∈ I . On appelle θ le paramètre


angulaire. On dérive :

T 0 (s) = θ0 (s) − sin(θ(s)), cos(θ(s)) .




Comme T 0 (s) = γ(s)N (s), en prenant la norme dans ces deux égalités, on obtient
θ0 (s) = γ(s). On en déduit ensuite que N (s) = − sin(θ(s)), cos(θ(s)) . On dérive


maintenant l'expression de N et on trouve :

N 0 (s) = −θ0 (s)T (s),

i .e. N 0 (s) = −γ(s)T (s).

239 || Romain Giuge


3.26. Théorème des quatre sommets

Proposition. Soit (I, f ) un arc paramétré de classe C 2 régulier. La courbure de


l'arc est donnée par la formule :
det(f 0 (t), f 00 (t))
γ(t) = .
kf 0 (t)k3

Démonstration. On prend s une abscisse curviligne de l'arc, et on note F = f ◦ s−1


et J = s(I). Alors (J, F ) est un reparamétrage de (I, f ) par l'abscisse curviligne.
On a donc les formules de Frénet : en particulier, dT
ds
(s) = γ(s)N (s).
On dérive t 7→ f (t) = F ◦ s(t) :

dF
f 0 (t) = s0 (t) (s(t)) = s0 (t)T (s(t)).
ds
On dérive une deuxième fois :
dT
f 00 (t) = s00 (t)T (s(t)) + s0 (t)2 (s(t)) .
|ds {z }
=γ(s(t))N (s(t))

Comme (T, N ) est une base directe, on a det(T, N ) = 1, donc :

det(f 0 (t), f 00 (t)) = det s0 (t)T, s0 (t)2 γ(s(t))N = s0 (t)3 γ(s(t)).




Enn, s étant une abscisse curviligne, c'est une primitive de kf 0 (t)k, donc s0 (t) =
kf 0 (t)k. On remarque alors que la courbure γ(s(t)) ne dépend pas de l'abscisse
curviligne s choisie, et on la note γ(t). On a donc démontré ce qu'on voulait.

Références :
 Francinou, Gianella, Nicolas - Oraux X-ENS, Analyse 4 - Page 335.

240 || Romain Giuge


Chapitre 4
Développements bonus

241
4.1. Diérentielle d'une limite et application exponentielle

4.1 Diérentielle d'une limite et application expo-


nentielle
Théorème. Soient E et F deux espaces normés, U un ouvert de E et une suite
d'applications fk : U → F diérentiables sur U . On suppose que, pour k → ∞ :
(i) La suite (fk ) converge simplement sur U vers une application f .
(ii) La suite des diérentielles Dfk (x) converge dans L(E, F ) uniformément pour
x ∈ U vers une application g(x).
Alors l'application limk→∞ fk est diérentiable sur U et

D(lim fk ) = lim Dfk .


k k

De plus si les fk sont de classe C 1 sur U , il en est de même de leur limite.


Démonstration. Soit ε > 0. L'hypothèse (ii) donne l'existence d'un entier N tel que
pour tout k > N et tout x ∈ U ,

kDfk (x) − g(x)k = sup kDfk (x).h − g(x).hk 6 ε.


khk=1

D'où, pour tout j, k > N ,

kDfj (x) − Dfk (x)k 6 2ε.

Soit maintenant a ∈ U . Pour r > 0 assez petit, la boule de centre a et de rayon r est
un convexe contenu dans U . On applique l'inégalité de la moyenne à fj − fk entre a
et a + h, pour khk 6 r :
 
fj (a + h) − fj (a) − fk (a + h) − fk (a) 6 2εkhk.

Fixons k > N . Comme fk est diérentiable en a, il existe α < r tel que

kfk (a + h) − fk (a) − Dfk (a).hk = o (khk) 6 εkhk

pour khk 6 α. Par ailleurs, par dénition de la norme d'application, et d'après la


toute première inégalité, on a :

kDfk (a).h − g(a).hk 6 kDfk (x) − g(x)kkhk 6 εkhk.

Enn, par l'inégalité triangulaire et les trois inégalités précédentes, on obtient :

kfj (a + h) − fj (a) − g(a).hk 6 4εkhk,

242 || Romain Giuge


4.1. Diérentielle d'une limite et application exponentielle

pour tout j > N et tout khk 6 α. On fait maintenant tendre j vers l'inni :

kf (a + h) − f (a) − g(a).hk 6 4εkhk,

ce qui établit la diérentiabilité de f en a, avec Df (a) = g(a).


Si les fk sont de classe C 1 , les Dfk sont continues sur U , donc Df = limk→∞ Dfk
aussi par convergence uniforme, ce qui prouve que f est C 1 .

Application. L'application exponentielle est de classe C 1 sur Mn (C).


Démonstration. Soit la suite d'applications (fk )k∈N dénie par :
fk : Mn (C) −→ Mn (C)
Pk M p
M 7−→ p=0 p! .

Pour tout p > 1, l'application M 7→ M p est de classe C 1 sur Mn (C) car polyno-
miale en les coecients de la matrice M . On développe ensuite :

(M + H)p = (M + H)(M + H) . . . (M + H)
= M p + (M p−1 H + M p−2 HM + · · · + HM p−1 ) + o (kHk) ,

où l'on a bien sûr pris une norme d'algèbre sur Mn (C) (par exemple la norme
p
d'application linéaire). Ainsi, pour p > 1, l'application up : M 7→ Mp! a pour dié-
rentielle :
1
Dup (M ).H = (M p−1 H + M p−2 HM + · · · + HM p−1 ).
p!
Alors kDup (M ).Hk 6 1
p!
pkM kp−1 kHk, ce qui nous donne :

kM kp−1
kDup (M )k 6 .
(p − 1)!
Par conséquent, la série p>1 Dup (M ) est absolument convergente dans l'espace
P

complet L(Mn (C), Mn (C)), et la convergence est uniforme sur toute boule kM k 6
R. Comme les
Xk
fk (M ) = up (M )
p=0

tendent vers exp(M ) lorsque k → ∞, en appliquant le théorème, on obtient que


l'application exponentielle est de classe C 1 sur toute boule, donc sur Mn (C), et

X
D exp(M ).H = Dup (M ).H
p=1

X 1
= (M p−1 H + M p−2 HM + · · · + HM p−1 ).
p=1
p!

243 || Romain Giuge


4.1. Diérentielle d'une limite et application exponentielle

Remarque. On peut en fait montrer que l'application exponentielle est de classe C ∞ .


Remarque. L'expression de la diérentielle obtenue ici n'est pas très élégante. On
peut montrer par une autre méthode que

!
X 1
D exp(M ).H = exp(M ) (−ϕM )k−1 (H)
k=1
k!

où ϕM (H) = M H − HM . On peut déduire cette expression de la notre de la façon


suivante : on considère la série double
∞ ∞
! ∞ !
q
−1
X X (−M ) X
eM

Dup (M ).H = Dup (M ).H
p=1 q=0
q! p=1

!
X X (−M )q
= Dup (M ).H .
k=1 p+q=k
q!

On montre ensuite par récurrence sur k que


X (−M )q 1
Dup (M ).H = (−ϕM )k−1 (H).
p+q=k
q! k!

Le calcul est élémentaire mais un peu long.

Théorème (Inégalité de la moyenne). Soient E et F deux espaces normés sur R ou


C, U un ouvert de E et f : U → F une application diérentiable en tout point de
U . Soient [a, b] un segment de droite tout entier contenu dans U et k une constante
positive. On suppose que pour tout x ∈ [a, b], on a

kDf (x)kL(E,F ) = sup kDf (x).hkF 6 k.


khkE =1

Alors on a l'inégalité de la moyenne :

kf (b) − f (a)kF 6 kkb − akE .

Références :
 Rouvière - Petit guide de calcul diérentiel à l'usage de la licence et de l'agré-
gation - Page 117.

244 || Romain Giuge


4.2. Points extrémaux de la boule unité de Mn (R)

4.2 Points extrémaux de la boule unité de Mn(R)


On note B la boule unité fermée de Mn (R) pour la norme

kM k = sup kM Xk,
kXk=1

où kM Xk est le norme euclienne de M X sur Rn .

Théorème. L'ensemble des points extrémaux de B est le groupe orthogonal On (R).


Démonstration. Soit P ∈ On (R). Montrons que P est un point extrémal de B . On
remarque d'abord que P ∈ B :

kP k = sup kP Xk = 1
kXk=1

car les matrices orthogonales conservent la norme. On suppose maintenant que P =


1
2
(U + V ) avec U, V ∈ B . Soit X un vecteur colonne unitaire. Alors :
1 1 1
kXk = 1 = kP Xk = kU X + V Xk 6 (kU Xk + kV Xk) 6 (kU k + kV k) 6 1.
2 2 2
On en déduit que toutes les inégalités écrites sont en fait des égalités. Cela implique
que kU k = kV k = 1, kU Xk = kV Xk = 1 et de plus les vecteurs U X et V X sont
positivement liés. Pour ce dernier point, il s'agit du cas d'égalité dans l'inégalité
triangulaire pour une norme euclidienne. Par conséquent, on a U X = V X , et cela
pour tout vecteur unitaire X , donc par linéarité, U = V . La matrice P est donc bien
un point extrémal de B .

Inversement, soit A ∈ B avec A 6∈ On (R). On va montrer que A n'est pas


extrémal.
On écrit la décomposition polaire de A : il existe O ∈ On (R) et S ∈ Sn+ tels
que A = OS . La matrice S est orthogonalement semblable à une matrice diagonale
D = Diag(d1 , . . . , dn ) avec les di > 0, et qu'on peut supposer rangés par ordre
croissant : d1 6 · · · 6 dn . On écrit donc S = t P DP avec P ∈ On (R). Comme
S = O−1 A et que O−1 ∈ On (R) préserve la norme, on en déduit immédiatement que

kSk = sup kO−1 AXk = sup kAXk = kAk 6 1.


kXk=1 kXk=1

Or :
kSk = sup kt P DP Xk = sup kDP Xk = sup kDY k,
kXk=1 kXk=1 kY k=1

la dernière égalité étant justiée par le changement de variable X = t P Y possible


car t P est inversible et conserve la norme. Donc kSk 6 1 implique que di 6 1 pour
tout i (sinon kDei k = di > 1, ce qui contredit kDk 6 1).

245 || Romain Giuge


4.2. Points extrémaux de la boule unité de Mn (R)

Si d1 = 1, alors D = In , et donc S = In et A = O ∈ On (R). Donc nécessairement,


d1 < 1. On écrit alors d1 = α+β 2
avec −1 6 α < β 6 1, car d1 peut être vu comme
le milieu de deux points de [−1, 1]. On pose alors

D0 = Diag(α, d2 , . . . , dn ) et D00 = Diag(β, d2 , . . . , dn ).

On a ainsi D = 21 (D0 + D00 ) avec D0 6= D00 , et


1
A = (Ot P D0 P + Ot P D00 P ).
2
On vérie que les matrices Ot P D0 P et Ot P D00 P sont dans B :

kOt P D0 P k = sup kOt P D0 P Xk = sup kD0 P Xk = sup kD0 Y k 6 1


kXk=1 kXk=1 kY k=1

car les coecients diagonaux de D0 sont compris entre −1 et 1.


On a donc écrit A comme milieu de deux points distincts de B , ce qui signie
que A n'est pas un point extrémal de B .

Admettons le théorème suivant :


Théorème (Krein-Milman). Tout convexe compact d'un espace ane de dimension
nie est enveloppe convexe de l'ensemble de ses points extrémaux.
On déduit immédiatement des deux théorèmes précédents :
Théorème. L'enveloppe convexe de On (R) est B .

Dénition. Un point x d'un convexe X est dit extrémal si X\{x} est encore
convexe. Cela équivaut à dire que x ne peut pas s'écrire comme milieu de deux
points distincts de X .
Exemple. Les points extrémaux d'un carré plein de R2 sont ses quatre sommets.
Proposition (Cas d'égalité dans l'inégalité triangulaire). Soient E un espace pré-
hilbertien et u, v ∈ E . Si ku + vk = kuk + kvk, alors il existe λ, µ ∈ R+ tels que
λu = µv (i .e. u et v sont positivement liés).
Démonstration. Pour montrer l'inégalité triangulaire, on écrit :
ku + vk2 = kuk2 + kvk2 + 2Re(u|v),

puis Re(u|v) 6 |(u|v)| 6 kukkvk par l'inégalité de Cauchy-Schwarz. Donc l'égalité


ku + vk = kuk + kvk implique que toutes les inégalités précédentes sont en fait des
égalités. L'égalité dans Cauchy-Schwarz implique l'existence de λ ∈ C tel que v = λu
(si on suppose par exemple u 6= 0). D'où (u|v) = λkuk2 et comme Re(u|v) = |(u|v)|,
on a que (u|v) est un réel positif. Donc λ est un réel positif.

246 || Romain Giuge


4.2. Points extrémaux de la boule unité de Mn (R)

Références :
 Francinou, Gianella, Nicolas - Oraux X-ENS, Algèbre 3 - Page 130.

247 || Romain Giuge


4.3. Sous-espaces de dimension nie de C (R, C) stables par translations

4.3 Sous-espaces de dimension nie de C(R, C) stables


par translations
Théorème. On note E = C (R, C) et F un sous-espace vectoriel de E de dimension
nie. Pour a ∈ R, on dénit l'endomorphisme τa de E par τa f (x) = f (x − a).
Alors F est de dimension n et est stable par tous les τa , a ∈ R, si et seulement si
F est l'espace des solutions d'une équations diérentielle linéaire homogène d'ordre
n à coecients constants.

Démonstration. Si F est l'espace des solutions d'une équations diérentielle linéaire


homogène d'ordre n à coecients constants, alors F est un sous-espace vectoriel de
E . De plus, F est de dimension n d'après le théorème de Cauchy-Lipschitz linéaire
(qui nous donne un isomorphisme entre les solutions de l'équation et les conditions
initiales). De plus, il est clair qu'un tel sous-espace est stable par translations.
Réciproquement, supposons que F est de dimension n et est stable par transla-
tions. Soit (f1 , . . . , fn ) une base de F . Pour a ∈ R et i ∈ [[1, n]], on a τ−a fi ∈ F , donc
il existe des scalaires λi1 (a), . . . , λin (a) tels que
n
X
fi (x + a) = λik (a)fk (x) (∗),
k=1
Rx
pour tout x ∈ R. Pour x ∈ R, notons Fk (x) = 0 fk (t) dt. En intégrant (∗), on
obtient : Z x n
X
fi (t + a) dt = λik (a)Fk (x).
|0 {z } k=1
=Fi (x+a)−Fi (a)

Les fi étant linéairement indépendantes, les Fi le sont aussi (sinon on obtien-


drait par dérivation une relation entre les fi ). Nous démontrerons dans le lemme
ci-après que cela implique l'existence de réels x1 , . . . , xn tels que la matrice A =
(Fi (xj ))16i,j6n soit inversible. En évaluant (∗) en xj , on obtient :
n
X
Fi (xj + a) − Fi (a) = λik (a)Fk (xj ),
k=1

pour tout i, j , soit encore B(a) = Λ(a)A en notant B(a) = (Fi (xj + a) − Fi (a))16i,j6n
et Λ(a) = (λij (a))16i,j6n . On en déduit que Λ(a) = B(a)A−1 pour tout a ∈ R. Les fi
étant continues, les Fi sont de classe C 1 et donc aussi l'application a 7→ B(a). Ainsi
a 7→ Λ(a) est de classe C 1 , et donc les λij sont de classe C 1 . En évaluant en x = 0
dans (∗), on trouve
n
X
fi (a) = fk (0)λik (a),
k=1

248 || Romain Giuge


4.3. Sous-espaces de dimension nie de C (R, C) stables par translations

pour tout a ∈ R, ce qui montre que les fi sont de classe C 1 . Par une récurrence
immédiate, les fi sont en fait de classe C ∞ et on obtient F ⊂ C ∞ (R, C).
On dérive maintenant (∗) par rapport à a et on prend a = 0, ce qui nous donne :
n
X
fi0 (x) = λ0ik (0)fk (x),
k=1

pour tout x ∈ R. D'où ∈ F et F est donc stable par l'endomorphisme de dérivation


fi0
D. Comme F est de dimension nie n et que D|F est un endomorphisme de F , D|F
admet un polynôme minimal qu'on note µ, de degré d 6 n. Comme µ(D) = 0
sur F , on a F ⊂ Ker(µ(D)) = {f ∈ E / µ(D)(f ) = 0} qui est un sous-espace
vectoriel de dimension d = deg(µ) d'après le théorème de Cauchy-Lipschitz linéaire.
Donc n 6 d, et nalement d = n, ce qui implique F = Ker(µ(D)) et termine la
démonstration.
Lemme. Soient h1 , . . . , hn des fonctions de R dans C linéairement indépendantes.
Alors il existe des réels x1 , . . . , xn tels que la matrice (hi (xj ))16i,j6n soit inversible.
Démonstration. On note K = Vect(h1 , . . . , hn ). Pour x ∈ R, on note δx la forme
linéaire f 7→ f (x). Soient Γ = {δx , x ∈ R} et G = Vect(Γ) ⊂ K ∗ . On note ensuite

G0 = {f ∈ K / g(f ) = 0, pour tout g ∈ G}.


Alors on vérie facilement que G0 = Γ0 = {0}. D'autre part, on a dim(G) +
dim(G0 ) = dim(K ∗ ). En eet, soit (g1∗ , . . . , gq∗ ) une base de G. On dénit l'ap-
plication linéaire v par :
v : K −→ K ∗
x 7−→ g1∗ (x)g1∗ + · · · + gq∗ (x)gq∗ .
Alors x ∈ Ker(v) si et seulement si gi∗ (x) = 0 pour tout i, i .e. si et seulement si
ϕ(x) = 0 pour tout ϕ ∈ G. Donc Ker(v) = G0 . Si on note (g1 , . . . , gq ) la base anté-
duale de (g1∗ , . . . , gq∗ ), alors pour tout i, v(gi ) = gi∗ . On en déduit que Im(v) = G.
Finalement, par le théorème du rang, dim(G) + dim(G0 ) = dim(K) = dim(K ∗ ).
Donc dim(G) = dim(K ∗ ), d'où G = K ∗ . Il existe donc des réels x1 , . . . , xn tels
que (δx1 , . . . , δxn ) soit une base de K ∗ . On décompose δxj sur la base (h∗i )i :

δxi = λ1 h∗1 + · · · + λn h∗n ,


et en évaluant en hi , on trouve λi = δxj (hi ) = hi (xj ). Finalement, (hi (xj ))16i,j6n est
la matrice de passage de la base duale (h∗i ) à la base (δxi ), elle est donc inversible.

Références :
 Aucune.

249 || Romain Giuge


4.4. Théorème de Brauer

4.4 Théorème de Brauer


Théorème. Soit K un corps de caractéristique quelconque. Pour toute permutation
σ ∈ Sn , on note P (σ) ∈ GLn (K) la matrice associée à la permutation de la base
canonique de K n par σ. Alors deux permutations σ et τ sont conjuguées dans Sn si
et seulement si P (σ) et P (τ ) sont conjuguées dans GLn (K) (i.e. semblables sur K ).
Démonstration. Le sens direct est immédiat : si τ = ϕσϕ−1 , alors
P (τ ) = P (ϕσϕ−1 ) = P (ϕ)P (σ)P (ϕ)−1 ,

car on peut vérier à la main que P (σ1 σ2 ) = P (σ1 )P (σ2 ) pour tout σ1 , σ2 ∈ Sn .
Supposons maintenant qu'il existe M ∈ GLn (K) telle que

P (τ ) = M P (σ)M −1 .

Pour montrer que σ et τ sont conjuguées, on va montrer que leurs décompositions


en produits de cycles à supports disjoints comportent le même nombre de cycles
de chaque longueur. On note alors ck (σ) le nombre de cycles de longueur k dans la
décomposition de σ , et ck (τ ) celui de τ .
On remarque que

P (τ m ) = P (τ ) . . . P (τ ) = M P (σ) . . . P (σ)M −1 = M P (σ m )M −1 .

On va alors s'intéresser aux cycles de τ m et σ m .


Lemme. Si ϕ est un cycle de longueur k , alors ϕm est le produit de d cycles à
supports disjoints de longueurs kd où d = pgcd(k, m).
Démonstration. Si m divise k, c'est clair : on écrit ϕ = (1, 2, . . . , k) et on constate
que

ϕm = (1, m + 1, 2m + 1, . . . , k − m + 1)(2, m + 2, . . . , k − m + 2) . . . (m, 2m, . . . , k).

Sinon, soit d = pgcd(k, m). Alors les permutations ϕm et ϕd engendrent le même


m
sous-groupe H de Sn . En eet, ϕm = (ϕd ) d et le théorème de Bézout donne d =
mu + kv qui implique ϕd = (ϕm )u . On considère, pour x ∈ [[1, n]], les orbites

Ox = {ψ(x), ψ ∈ H} = {(ϕm )i (x), i ∈ N} = {(ϕd )i (x), i ∈ N},

orbites de l'action de H sur [[1, n]]. Comme la décomposition en cycles de σ ∈ Sn


est l'ensemble des orbites de l'action de <σ> sur [[1, n]], on en déduit que ϕm et ϕd
se décomposent en cycles de la même façon. Comme d divise k , d'après le premier
cas, ϕd est le produit de d cycles à supports disjoints de longueur kd , d'où le résultat
pour ϕm .

250 || Romain Giuge


4.4. Théorème de Brauer

On applique ce lemme : chaque cycle de longueur k composant σ se décompose


en pgcd(k, m) cycles dans σ m . Ainsi, le nombre de cycles de σ m vaut
n
X
pgcd(k, m)ck (σ).
k=1

De même pour τ m .
On pose V = K n . En notant (e1 , . . . , en ) la base canonique de K n , on dénit
une action de Sn sur K n par (ϕ, ei ) 7→ eϕ(i) . Un élément v = (v1 , . . . , vn ) ∈ V est
invariant sous une permutation ϕ ∈ Sn lorsque ses coordonnées vérient vi = vϕ(i)
pour tout i, i .e. lorsqu'elles sont constantes sur les orbites de ϕ. En notant

V ϕ = {v ∈ V / ϕ(v) = v},

qui est clairement un sous-espace vectoriel de V , on a donc que dimK (V ϕ ) est égal
au nombre d'orbites de ϕ (y compris celles réduites à un point). Donc
n
σm
X
dimK (V )= pgcd(k, m)ck (σ),
k=1

et de même pour τ m . Enn, comme P (τ m ) = M P (σ m )M −1 , on a clairement l'iso-


morphisme
m m
f : V σ −→ V τ
v 7−→ M v,
(injectivité immédiate car M inversible, on vérie la surjectivité à la main), donc
m m
dimK (V σ ) = dimK (V τ ). D'où :
n
X n
X
pgcd(k, m)ck (σ) = pgcd(k, m)ck (τ ),
k=1 k=1

et cette égalité est vraie pour tout entier m > 1. On note C(σ) le vecteur colonne
constitué par les ck (σ) pour 1 6 k 6 n. De même pour τ . On note ensuite A = (aij )
la matrice telle que aij = pgcd(i, j). Alors

AC(σ) = AC(τ ).

Il ne reste plus qu'à prouver que la matrice A est inversible pour avoir les égalités
ck (σ) = ck (τ ) pour tout k . On va montrer que le déterminant de A est non nul. Il
s'agit du déterminant de Smith. Pour le calculer, on se rappelle que pour tout entier
d > 1, on a d = k|d ϕ(k) où ϕ est l'indicatrice d'Euler. Ainsi,
P

X n
X n
X
pgcd(i, j) = ϕ(k) = ϕ(k) = rik skj ,
k|pgcd(i,j) k=1 k=1
k|i, k|j

251 || Romain Giuge


4.4. Théorème de Brauer

où rik = ϕ(k) si k|i et 0 sinon, skj = 1 si k|j et 0 sinon. En notant R = (rij ) et


S = (sij ), on obtient que A = RS . Mais R est S sont des matrices triangulaires (l'une
inférieure, l'autre supérieure) de déterminants évidents : det(R) = ϕ(1)ϕ(2) . . . ϕ(n)
et det(S) = 1. D'où
det(A) = det(R) det(S) = ϕ(1)ϕ(2) . . . ϕ(n) 6= 0.

Enoncé du théorème adapté pour la leçon Exemples d'actions de groupes sur les
espaces de matrices :
Théorème. Soit K un corps de caractéristique quelconque. Pour toute permuta-
tion σ ∈ Sn , on note P (σ) ∈ GLn (K) la matrice associée à la permutation de la
base canonique de K n par σ. On considère l'action de GLn (K) sur lui-même par
conjugaison :
(P, Q) 7→ QP Q−1 .
Alors deux permutations σ et τ sont conjuguées dans Sn si et seulement si P (σ) et
P (τ ) sont dans la même orbite.

Proposition. Deux permutations sont conjuguées si et seulement si leurs décom-


positions en produits de cycles à supports disjoints comportent le même nombre de
cycles de chaque longueur.
Démonstration. Sens direct : on suppose σ = ϕτ ϕ−1 . On décompose τ en produit
de cycles à supports disjoints : τ = c1 . . . ck . Alors σ = (ϕc1 ϕ−1 ) . . . (ϕck ϕ−1 ) et les
ϕci ϕ−1 sont des cycles de même longueur que ci et à supports disjoints. En eet :
ϕci ϕ−1 = ϕ(α1 . . . αp )ϕ−1 = (ϕ(α1 ) . . . ϕ(αp )).
Sens indirect : si σ = (a1 . . . ak ) et τ = (b1 . . . bk ) sont deux cycles de longueur k ,
alors toute permutation ϕ telle que ϕ(ai ) = bi vérie τ = ϕσϕ−1 . On en déduit sans
problème le résultat pour σ et τ lorsque leurs décompositions en produits de cycles
à supports disjoints comportent le même nombre de cycles de chaque longueur.

Références :
 Ferrand et Raoult - Sur des matrices de permutations conjuguées (document
PDF).

252 || Romain Giuge


Chapitre 5
Quelques résultats intéressants

253
5.1. Application du théorème de Chevalley-Warning

5.1 Application du théorème de Chevalley-Warning


Théorème (Erdös-Ginzburg-Ziv). Soient n > 1 et a1 , . . . , a2n−1 des entiers. Alors
il existe des indices i1 , . . . , in tels que

ai1 + · · · + ain ≡ 0 [n].

Démonstration. Supposons n premier, qu'on note n = p. On considère :


2p−1 2p−1
X X
P1 = ai Xip−1 et P2 = Xip−1 .
i=1 i=1

Alors deg(P1 ) + deg(P2 ) = 2p − 2 < 2p − 1 où 2p − 1 est le nombre d'indéterminées.


On peut donc appliquer le théorème de Chevalley-Warning : le nombre N de zéros
communs à P1 et P2 est divisible par p. Or (0, . . . , 0) est un zéro commun, donc N >
p > 2. Donc il existe (x1 , . . . , x2p−1 ) ∈ Fp2p−1 non nul tel que Pi (x1 , . . . , x2p−1 ) = 0
pour i ∈ {1, 2}. Mais si x 6= 0, xp−1 = 1 dans Fp . Donc

P2 (x1 , . . . , x2p−1 ) = Card ({i / xi 6= 0}) 1Fp = 0.

Mais 1 6 Card ({i / xi 6= 0}) 6 2p − 1, donc nécessairement, Card ({i / xi 6= 0}) = p.


D'où l'existence de i1 , . . . , ip tels que xk = 1 si k est l'un des ij et 0 sinon, puis :
2p−1 p
X X
P1 (x1 , . . . , x2p−1 ) = ai xp−1
i = aij = 0.
i=1 j=1

Pour montrer que le théorème est vrai pour n entier > 1 quelconque, on va
montrer que s'il est vrai pour deux entiers m et n, il est vrai pour mn. Le résultat
s'en suivra immédiatement en décomposant n en produit de facteurs premiers.
Supposons donc que le théorème est vrai pour deux entiers m, n > 1, et prenons
des entiers a1 , . . . , a2mn−1 . On applique le théorème avec les 2n − 1 premiers entiers
a1 , . . . , a2n−1 : il existe un sous-ensemble I1 de [[1, 2n − 1]] tel que Card(I1 ) = n et
X
ai ≡ 0 [n].
i∈I1

On applique à nouveau le théorème avec les 2n − 1 premiers entiers ai pour i ∈


[[1, 2mn − 1]]\I1 : il existe I2 tel que Card(I2 ) = n et
X
ai ≡ 0 [n].
i∈I2

On recommence ainsi jusqu'à avoir eectué 2m − 1 étapes au total : en eet, au


bout de 2m − 2 étapes, il reste 2mn − 1 − (2m − 2)n = 2n − 1 entiers, et au bout

254 || Romain Giuge


5.1. Application du théorème de Chevalley-Warning

de 2m − 2 étapes, il n'en reste plus que n − 1, ce qui n'est plus susant. En n de


compte, pour tout j ∈ [[1, 2m − 1]], il existe cj ∈ Z tel que
X
ai = ncj .
i∈Ij

Comme on a 2m − 1 entiers cj , on peut appliquer le théorème pour extraire un


sous-ensemble J de [[1, 2m − 1]] tel que Card(J) = m et
X
cj ≡ 0 [m].
j∈J

Finalement,
XX X
ai =n cj = nmk ≡ 0 [mn],
j∈J i∈Ij j∈J

somme de mn entiers ai
| {z }

ce qui termine la démonstration.

Références :
 Nathanson - Additive number theory - Page 50.

255 || Romain Giuge


5.2. Cyclicité du groupe multiplicatif d'un corps ni

5.2 Cyclicité du groupe multiplicatif d'un corps ni


Dénition. Soit G un groupe ni. On appelle exposant de G le plus petit entier
strictement positif n tel que xn = e pour tout x ∈ G. L'exposant est aussi le PPCM
des ordres des éléments de G.

Proposition. Soit G un groupe abélien ni. On note p l'exposant de G. Alors il


existe un élément de G d'ordre p.
Démonstration. On va montrer que l'ensemble des ordres des éléments de G est
stable par PPCM. Ainsi le PPCM de tous les ordres des éléments de G, qui est égal
en fait à l'exposant de G, est l'ordre d'un élément de G.
Soient x, y ∈ G, m l'ordre de x et n l'ordre de y .
Montrons que si m et n sont premiers entre eux, xy est d'ordre mn. On a
d'une part (xy)mn = e, et d'autre part, si l > 0 vérie (xy)l = e, alors (xy)lm =
(xm )l (y lm ) = y lm = e. Donc lm est un multiple de n, et comme m et n sont premiers
entre eux, l est un multiple de n. De la même façon, l est un multiple de m, et donc
l est un multiple de mn. Cela prouve que l'ordre de xy vaut mn.
Soit maintenant l = PPCM(m, n). On va écrire l = m0 n0 avec m0 et n0 dénis
ainsi : si la décomposition en produit de puissances de nombres premiers de m
contient pm i et celle de n contient pi , on mettra dans la décomposition de m , pi si
i ni 0 mi

mi > ni et p0i sinon, et dans celle de n0 , p0i si mi > ni et pni i sinon. Alors m0 et n0 sont
m n
premiers entre eux, m0 divise m, n0 divise n, x m0 est d'ordre m0 et y n0 est d'ordre
m n
n0 . D'après ce qui précède, x m0 y n0 est d'ordre m0 n0 = l, i .e. il existe un élément de
G d'ordre l = PPCM(m, n).
L'ensemble des ordres des éléments de G est donc bien stable par PPCM.

Proposition. Le groupe multiplicatif d'un corps ni est cyclique.


Démonstration. Soit Fq un corps ni à q éléments. Alors Card(F∗q ) = q − 1. Soit r
l'exposant de F∗q . D'après le théorème de Lagrange, xq−1 = 1 pour tout x ∈ F∗q , donc
r 6 q − 1.
Par dénition de l'exposant, le polynôme X r − 1 s'annule sur F∗q donc possède
q − 1 racines distinctes, donc r > q − 1. Finalement, r = q − 1.
Comme r est l'exposant de F∗q , d'après la proposition précédente, il existe x ∈ F∗q
d'ordre r, i .e. d'ordre q − 1, et donc F∗q =<x>.

256 || Romain Giuge


5.3. Groupes d'ordre p2

5.3 Groupes d'ordre p2


Proposition. Soit G un groupe qui agit sur un ensemble E . On note Stab(x) =
{g ∈ G / g.x = x} le stabilisateur d'un élément x de E , et Ox = {g.x, g ∈ G}
l'orbite de x. Alors l'application
ϕ : G/Stab(x) −→ Ox
g 7−→ g.x

est bien dénie et est une bijection. En particulier, si G est ni, Card(Ox ) divise
Card(G).

Remarque. L'application ϕ est une bijection ensembliste, on ne parle pas d'isomor-


phisme car G/Stab(x) n'est pas nécessairement un groupe. En eet, Stab(x) n'est
en général pas distingué dans G.

Démonstration. Soient g, g 0 ∈ G tels que g = g0 . Alors il existe h ∈ Stab(x) tel que


g 0 = gh. Ainsi,
g 0 .x = (gh).x = g.(h.x) = g.x,
ce qui prouve que ϕ est bien dénie.
La surjectivité de ϕ est immédiate par dénition d'une orbite.
Montrons l'injectivité : soient g, g 0 ∈ G tels que g.x = g 0 .x. Alors

(g 0−1 g).x = g 0−1 .(g.x) = g 0−1 .(g 0 .x) = (g 0−1 g 0 ).x = e.x = x.

Donc g 0−1 g ∈ Stab(x), et donc g 0 = g .

Proposition. Soit G un p-groupe (p premier) et Z son centre :


Z = {x ∈ G / gx = xg, ∀g ∈ G}.

Alors Z n'est pas réduit au neutre.


Démonstration. On fait agir G sur lui-même par conjugaison. Soit x ∈ G. L'orbite
de x est :
Ox = {gxg −1 , g ∈ G}.
On a alors clairement :
x ∈ Z ⇐⇒ Ox = {x}.
D'après la proposition précédente, le cardinal d'une orbite divise le cardinal de G,
il vaut donc soit 1, soit p, soit p2 . L'ensemble des orbites réalisant une partition de
G, on a :
Xk
Card(G) = Card(Z) + Card(Oi ),
i=1

257 || Romain Giuge


5.3. Groupes d'ordre p2

où les Oi désignent les orbites de cardinaux p ou p2 . Comme p divise Card(G) et


Card(Oi ) pour tout i, on obtient que p divise Card(Z). En particulier, Card(Z) > p
et donc Z n'est pas réduit au neutre.

Proposition. Tout groupe d'ordre p2 est commutatif.


Démonstration. Comme Z est un sous-groupe de G, Card(Z) divise Card(G) = p2 ,
donc vaut soit p, soit p2 (il ne peut pas valoir 1 car Z est non réduit au neutre d'après
la proposition précédente). Supposons que Card(Z) = p et prenons x ∈ G\Z . On
fait agir G sur lui-même par conjugaison et on considère le stabilisateur de x :

Stab(x) = {g ∈ G / gxg −1 = x}.

Alors de façon évidente, Z ⊂ Stab(x) et x ∈ Stab(x). Donc Card(Stab(x)) > p. Mais


Stab(x) est un sous-groupe de G, donc son cardinal divise p2 , donc Card(Stab(x)) =
p2 , i .e.
Stab(x) = G.
Ceci signie que pour tout g ∈ G, gxg −1 = x, soit encore que x ∈ Z . C'est absurde
et cela prouve que Card(Z) = p2 , i .e. Z = G et G est commutatif.

258 || Romain Giuge


5.4. Réunion de sous-espaces stricts

5.4 Réunion de sous-espaces stricts


Proposition. Soit E un K -espace vectoriel de dimension nie. Alors si K est inni,
E ne peut pas s'écrire comme réunion de sous-espaces stricts.

Démonstration. Supposons que E = V1 ∪ · · · ∪ VN où les Vi sont des sous-espaces


stricts de E . On a nécessairement N > 2 car sinon E = V1 . Quitte à retirer un
certain nombre de sous-espaces, on peut supposer qu'aucun n'est contenu dans la
réunion des autres. Il existe donc x ∈ VN tel que x 6∈ V1 ∪ · · · ∪ VN −1 . D'autre part,
on n'a pas V1 ∪ · · · ∪ VN −1 ⊂ VN car sinon E = VN . Donc il existe y ∈ V1 ∪ · · · ∪ VN −1
tel que y 6∈ VN .
On considère maintenant le vecteur y + λx pour λ ∈ K . Il n'appartient pas à VN
car sinon y ∈ VN . Donc il existe iλ ∈ [[1, N − 1]] tel que y + λx ∈ Viλ . On obtient
ainsi une application
ϕ : K −→ [[1, N − 1]]
λ 7−→ iλ .
Cette application est injective : en eet, si λ et µ sont tels que iλ = iµ , alors y + λx
et y + µx sont dans Viλ , donc leur diérence (λ − µ)x aussi. Comme x 6∈ Viλ , on
obtient λ = µ.
Par conséquent, K ne peut être inni et on a Card(K) 6 N − 1.

Corollaire. Soit E un K -espace vectoriel de dimension nie avec K corps inni.


Soient F1 , . . . , Fp des sous-espaces vectoriels de E de même dimension r. Alors il
existe un supplémentaire G commun à tous les Fi .
Démonstration. Il existe des sous-espaces G tels que Fi ∩ G = {0} pour tout i : le
sous-espace {0} en est un. On en considère un de dimension maximale, que l'on note
G. Si r + dim(G) < dim(E), les sous-espaces Fi ⊕ G sont des sous-espaces stricts
de E . D'après la proposition, il existe un vecteur x n'appartenant à aucun de ces
sous-espaces. Mais alors le sous-espace G0 = G ⊕ Kx est en somme directe avec tous
les Fi , ce qui contredit la maximalité de G. On a donc r + dim(G) = dim(E) et G
est un supplémentaire commun à tous les Fi .

259 || Romain Giuge


5.5. Sous-groupes à un paramètre de GLn (K)

5.5 Sous-groupes à un paramètre de GLn(K)


Proposition. Soit ϕ : R → GLn (K) une application continue telle que pour tout
s, t ∈ R, ϕ(t + s) = ϕ(t)ϕ(s). Alors il existe A ∈ Mn (K) telle que pour tout t ∈ R,
ϕ(t) = etA .

Démonstration. L'hypothèse ϕ(t + s) = ϕ(t)ϕ(s) entraîne ϕ(0) = ϕ(0)2 , et comme


ϕ(0) est inversible, on obtient ϕ(0) = In .
Comme ϕ est continue, on peut l'intégrer et on a :

1 t
Z
ϕ(s) ds −→ ϕ(0) = In .
2t −t t→0


Mais GLn (K) est ouvert, donc il existe ε > 0 tel que −ε ϕ(s) ds ∈ GLn (K). On
intègre maintenant l'équation ϕ(t + s) = ϕ(t)ϕ(s) à t xé pour s ∈ [−ε, ε] :
Z ε Z ε
ϕ(t + s) ds = ϕ(t) ϕ(s) ds,
−ε −ε

soit encore −1


Z t+ε  Z ε
ϕ(t) = ϕ(s) ds ϕ(s) ds .
t−ε −ε

Cette écriture montre que ϕ est dérivable et on a

ϕ0 (t + s) = ϕ0 (t)ϕ(s)

pour tout t, s ∈ R. En particulier, on a ϕ0 (s) = ϕ0 (0)ϕ(s) pour tout s ∈ R. En


posant A = ϕ0 (0) et en résolvant l'équation diérentielle, on obtient

ϕ(s) = ϕ(0)esA

pour tout s ∈ R, d'où le résultat car ϕ(0) = In .

260 || Romain Giuge


5.6. Tout hyperplan de Mn (K) rencontre GLn (K)

5.6 Tout hyperplan de Mn(K) rencontre GLn(K)


Proposition. Soit n > 2. Alors tout hyperplan de Mn (K) rencontre GLn (K).
Démonstration. On sait qu'il existe une forme linéaire ϕ sur Mn (K) telle que H =
Ker(ϕ).
On note Eij les matrices élémentaires ayant un 1 en position (i, j) et des zéros
ailleurs.
ϕ(In )
S'il existe i, j avec i 6= j tels que ϕ(Eij ) 6= 0, alors A = In − ϕ(Eij )
Eij est inversible
et ϕ(A) = 0. Donc H rencontre GLn (K).
Sinon, la matrice
 
0 ... ... 1
 .
1 . . .. 
.
A = E2,1 + E3,2 + · · · + En−1,n + E1,n =  .
 
. .
. .. .. . . 
 . . 
0 ... 1 0

est clairement inversible avec ϕ(A) = 0 et on obtient encore que H rencontre


GLn (K).

261 || Romain Giuge


5.7. Un polynôme irréductible

5.7 Un polynôme irréductible


Proposition. Le polynôme P = X p − X − 1 est irréductible sur Fp .

Démonstration. Soit K un corps de décomposition de P sur Fp . Soit α ∈ K une


racine de P . Alors pour tout i ∈ [[0, p − 1]], α + i est aussi racine de P . En eet :

P (α + i) = (α + i)p − (α + i) − 1 = (αp + ip ) − (α + i) − 1 = ip − i,

où l'on a utilisé Frobenius pour dire que (α + i)p = αp + ip . Enn, comme i ∈ Fp ,


on a ip − i = 0, d'où
P (α + i) = 0.
Supposons maintenant P réductible sur Fp : on écrit P = QR avec Q, R ∈ Fp [X],
deg(Q), deg(R) < p. Dans K[X], on a
d
Y
Q= (X − α − ik ),
k=1

où d = deg(Q) et les ik ∈ [[0, p − 1]]. On regarde le coecient de X d−1 dans Q, il


vaut :

− (α + i1 ) + (α + i2 ) + · · · + (α + ik ) = −(dα + i1 + · · · + ik ).

Comme Q ∈ Fp [X], ce coecient appartient à Fp . Donc dα ∈ Fp . Mais comme d < p,


on a d ∈ F∗p , donc α ∈ Fp . Et le fait que α ∈ Fp implique αp = α, ce qui contredit
αp − α − 1 = 0.

Rappelons le théorème suivant donnant un critère d'irréductibilité pour un po-


lynôme (on regarde son irréductibilité modulo un idéal premier) :

Théorème. On note K = Frac(A). Soient I un idéal premier de A et B = A/I :


B est un anneau intègre de corps de fractions L. Soit P = an X n + · · · + a0 ∈ A[X]
tel que an 6= 0 dans B . Alors si P est irréductible sur B ou L, P est irréductible sur
K (donc aussi dans A[X] si c(P ) = 1).

Proposition. Le polynôme P = X p − X − 1 est irréductible sur Z.

Démonstration. On a prouvé que P est irréductible sur Fp = Z/pZ. Le théorème


implique alors qu'il est irréductible sur Q, et puisque son contenu vaut 1 (il est
unitaire), il est irréductible sur Z.

262 || Romain Giuge


5.8. Une fonction donnant tous les nombres premiers

5.8 Une fonction donnant tous les nombres premiers


Rappelons le théorème de Wilson qui va nous servir à démontrer la proposition
qui suit :

Théorème (Wilson). Un entier p > 1 est un nombre premier si et seulement si


(p − 1)! + 1 ≡ 0 [p].

Proposition. Soit la fonction


f : N −→ N
n 7−→ 2 + 2n! [n + 1],

où la congruence est à comprendre ici comme l'unique entier congru à 2+2n! modulo
n + 1 et compris entre 1 et n + 1. Alors f est à valeurs dans l'ensemble des nombres
premiers et elle les atteint tous.
Démonstration. Distinguons deux cas :
(i) Si n + 1 est premier, alors par le théorème de Wilson, n! ≡ −1 [n + 1], et donc
2 + 2n! ≡ 0 [n + 1]. Ainsi f (n) = n + 1.
(ii) Si n + 1 n'est pas premier, on écrit n + 1 = ab avec a, b > 1. Si a 6= b, alors
n! = (ab − 1)! est divisible par ab car il contient a et b. Donc n + 1 divise n! et
2 + 2n! ≡ 2 [n + 1].
Si on ne peut pas écrire n + 1 = ab avec a, b > 1 et a 6= b, c'est que n + 1 est le
carré d'un nombre premier : n+1 = p2 . Si p > 2, alors p et 2p apparaissent dans
n!, donc n! ≡ 0 [n+1]. Si p = 2, alors n+1 = 4 et on a 2+2n! = 14 ≡ 2 [n+1].
Finalement, dans tous les cas, si n + 1 n'est pas premier, f (n) = 2.

263 || Romain Giuge

Vous aimerez peut-être aussi