Introduction à la géométrie différentielle
Introduction à la géométrie différentielle
juin 2005
5 cours sur la géométrie différentielle
Alain Chenciner
Université Paris 7 & IMCCE
[email protected]
5 juillet 2005
Résumé
Introduire à des techniques en si peu de temps serait une illusion ; on
a cherché plutôt à mettre en évidence le caractère “naturel” de certaines
notions de base de la géométrie différentielle. Seuls les 5 premiers chapitres
ont été traités dans le cours oral.
k
Figure 1 : L(C = sup) i=1 ||Ai − Ai−1 ||
Remarque. Aussi naturelle que soit cette définition, elle ne se généralise pas
en une définition de l’aire d’une surface. Le contre-exemple classique est celui
de la lanterne vénitienne, représentée dans la figure 6.5.4 de [BG]).
On déduit de la définition que, quel que soit le paramétrage monotone (i.e.
sans retour en arrière) γ : [a, b] → R3 de C,
b
L(C) = ||γ̇(t)||dt,
a
où, comme les mécaniciens, on a noté avec un point la dérivée par rapport au
paramètre t (t est pensé comme étant un temps et γ̇(t) comme étant une vitesse).
On parlera indifféremment de longueur de C ou de longueur de γ.
1
Cette formule vaut en particulier si γ est absolument continue, c’est-à-dire si
sa dérivée γ̇ au sens des distributions est une fonction (définie presque partout)
t
intégrable et si γ(t) = γ(a) + a γ̇(s)ds.
Remarque. Attention, la longueur n’est pas une fonctionnelle continue sur
l’ensemble des γ : [a, b] → R absolument continues, muni de la topologie de la
convergence uniforme : elle n’est que semi-continue inférieurement : une pertur-
bation arbitrairement petite de la courbe peut faire augmenter brusquement√sa
longueur. La figure 2, classique, montre une famille de courbes de longueur 2
qui converge uniformément vers un segment de longueur 1.
2
Deuxième démontration. C’est la même en coordonnées polaires
dont les extrémales (i.e. les courbes γ telles que “dE”(γ) = 0) sont maintenant
les droites paramétrées à vitesse constante, c’est-à-dire les courbes γ qui vérifient
γ̈ ≡ 0.
3
Considérons en effet une petite variation γ + X de γ, représentée par le champ
de vecteurs X le long de γ s’annulant aux extrémités a et b (figure 6).
qu’une intégration par parties (l’une des mamelles de l’analyse, aurait dit Boby
Lapointe) transforme en la formule de la variation première
b
dE(γ) · X = − γ̈(t), X(t) − ∆γ̇(ti ), X(ti ),
a ti
où les ti sont les instants de discontinuité de γ̇(t), instants qu’on a supposés en
nombre fini pour simplifier. Ceci vient de ce que, si γ n’est dérivable que par
morceaux, la différence [γ̇, X]ba = γ̇(b), X(b) − γ̇(a), X(a) est la somme
de l’intégrale sur [a, b] de la dérivée de la fonction continue par morceaux
γ̇(t), X(t) et de ses sauts aux points ti de discontinuité. Une extrémale γ
devant, par définition, annuler dE(γ) · X pour tout champ X le long de γ nul
aux extrémités, on en déduit que γ est régulière (la vitesse n’a pas de sauts)
et que γ̈ est identiquement nulle. Notons que fixer la longueur L ou l’énergie E
d’une extrémale revient au même puisque, si γ̈ ≡ 0, on a évidemment
1
E(γ) = L2 (γ).
2(b − a)
L’assertion fondamentale découle alors du même calcul, à ceci près que l’on
considère maintenant une famille à un paramètre u d’extrémales (i.e. de droites)
γu et que l’on n’exige plus que les extrémités soient fixées (figure 7).
4
Il vient pour tout u,
d
E(γu ) = dE(γu ) · Xu = γ̇u (b), Xu (b) − γ̇u (a), Xu (a) ,
du
donc l’énergie de chaque segment γu (][a, b]) est la même, on en déduit que
5
γ(t) au plan Pγ(t) . L’existence de surfaces intégrales contredirait cette propriété
car une courbe intégrale habiterait nécessairement dans une surface intégrale.
On trouve dans le beau livre de Max Born On the nature of cause and chance,
une description très claire de la caractérisation locale du deuxième principe de
la thermodynamique donnée en ces termes par Caratheodory : l’existence d’une
entropie S et d’une température absolue T qui vérifient T1 dQ = dS équivaut
à l’intégrabilité du champ des noyaux de la 1-forme dQ (les surfaces intégrales
ont pour équation S = constante) et est donc conséquence de l’existence au
voisinage d’un état donné d’un état arbitrairement proche que l’on ne peut
atteindre adiabatiquement (i.e. avec dQ = 0).
Lecture. Le premier paragraphe du bel article de J. Lützen Interactions between
Mechanics and Differential Geometry in the 19th century, Archives for History
of Exact Sciences, vol. 49, Number 1, pp. 1à 72, 1995, commence ainsi : “In
1828 Carl Friedrich Gauss (1777-1855) published his Disquisitiones generales
circa superficies curvas and William Rowan Hamilton (1805-1865) published
his Theory of Systems of Rays. There are good reasons for considering this
double event the beginning of our history. Indeed Gauss’s paper marked the
start of the development of intrinsic differential geometry and Hamilton’s paper
became the basis for his subsequent works on mechanics. Moreover Gauss’s
and Hamilton’s papers contained ideas that strike a modern reader as being
highly similar. In a sense one might consider the present paper as the story of
how intrinsic differential geometry and Hamiltonian mechanics after a start on
common grounds first went in different directions, and only gradually came back
together around 1870 on a higher (dimensional) level.”
Ce qui précède est une parfaite illustration de ce texte : l’orthogonalité des
fronts d’onde aux rayons est connue sous le nom de lemme de Gauss en géométrie
riemannienne et sous celuide théorie de Hamilton-Jacobi ou encore préservation
de la forme de Liouville i pi dqi en mécanique (voir [A]).
A suivre... par le principe de Huyghens, les caustiques (développées en géométrie,
fig. 9), les singularités génériques des fronts d’onde,... et aussi par l’étude de l’op-
tique géométrique dans un milieu homogène mais non isotrope comme premier
exemple de métrique riemannienne et prélude à ce qui suit.
6
2 Des métriques induites aux structures rieman-
niennes
Considérons une surface paramétrée M dans R3 (ou, plus généralement
une sous-variété paramétrée de dimension n de RN ). Le paramétrage fournit
des coordonnées curvilignes sur M . C’est une application régulière – disons
indéfiniment dérivable, définie sur un domaine Ω du plan R2 ,
f : Ω → R3 ,
qui est une immersion (la dérivée en chaque point est de rang maximum, i.e.
de rang 2) et même un plongement (elle est injective et propre). Rappelons
que la dérivée df (q) de f au point q = (q1 , q2 ) ∈ Ω est l’application qui, au
vecteur vitesse d’un mobile t → c(t) passant par q à l’instant t fait correspondre
le vecteur vitesse du mobile t → f ◦ c(t) au même instant. L’image de cette
application est par définition le plan tangent Tf (q) M à M au point f (q) (figure
10). Une excellente référence pour ces notions est le livre [P]
ouvert du plan
(carte de M)
7
habitant dans R3 ; sa longueur (euclidienne) est donc définie et vaut
b b
L(γ) = ||γ̇(t)||dt = ||df c(t) ċ(t)||dt.
a a
où le produit scalaire , et la norme ||.|| qui s’en déduit sont ceux de l’espace
euclidien R3 . En chaque point q de Ω, g(q) est une norme (et même un produit
scalaire) sur les vecteurs q̇ tangents en q à Ω (i.e. sur les vecteurs d’origine q).
Définition. Une métrique riemannienne sur un ouvert Ω de Rn est la donnée
en chaque point q ∈ Ω d’un produit scalaire défini positif (i.e. d’une matrice
symétrique n × n) dont les coefficients gij (q) dépendent de manière C ∞ de q :
n
||q̇||2g(q) = q̇, q̇g(q) = g(q)(q̇, q̇) = gij (q)q̇i q̇j .
i,j=1
b
Une géodésique est une extrémale de l’intégrale d’énergie Eg (γ) = 12 a ||γ̇||2g dt.
∂f ∂f
Dans notre cas, gij (q) = ∂q i
(q), ∂qj
(q) . Une métrique euclidienne sur
R est caractérisée par le fait que ses coefficients sont indépendants de q ; la
n
métrique canonique est définie par la matrice identité : gij (q) = δij (symbole de
Kronecker).
Ceci conduit directement à la notion générale de métrique riemannienne et
de géodésique sur une variété, la seule difficulté étant de donner un sens à la
différentiabilité du produit scalaire g(x) sur Tx M comme fonction du point x
sur la variété (le problème est que l’espace vectoriel Tx M sur lequel est défini
g(x) dépend lui-même de x). Notons cependant qu’un théorème célèbre (exis-
tence d’un plongement isométrique : Cartan, Nash, Gromov) dit que le gain en
généralité n’est qu’illusoire.
Remarque. L’exemple de la sphère, dont les géodésiques sont les grands cer-
cles, montre qu’une géodésique ne minimise pas nécessairement la longueur ou
l’énergie entre deux de ses points. Elle ne le fait que si les deux points sont
suffisamment proches l’un de l’autre.
8
à une courbe t → c(t) ∈ Ω, associent l’intégrale
b
dc
S(c) = L((c(t), (t))dt
a dt
d’un Lagrangien L(q, q̇). L est une fonction définie sur l’ensemble des vecteurs
tangents à Ω (penser à (q, q̇) comme définissant un vecteur q̇ d’origine q). On
b
note brièvement l’action S = a L(q, q̇)dt.
Reprenons le calcul ayant conduit en 1.2 à la démonstration de l’assertion fon-
damentale : cu (t) = q(u, t) est une famille de courbes (supposées régulières pour
simplifier mais on pourrait traiter les sauts de la dérivée comme précédemment),
la famille des vitesses est ċu (t) = ∂q
∂t (u, t), et finalement celles des variations est
∂q
Xu (t) = ∂u (u, t). Un calcul en tous points identiques à celui effectué dans le cas
euclidien, donc basé sur l’intégration par parties, donne
b
b
dS ∂L d ∂L ∂L
= − · Xu dt + · Xu ,
du a ∂q dt ∂ q̇ ∂ q̇ a
où la notation [Y ]ba signifie Y (b)−Y (a). Pour une famille d’extrémales de L dt,
le premier terme de la somme s’annule identiquement et le deuxième membre
se réduit aux termes qui proviennent de la variation des extrémités :
b
dS ∂q
= p· , ou encore dS = [p · dq]ba ,
du ∂u a
où p désigne la variable conjuguée de q, définie par p(q, q̇, t) = ∂L
∂ q̇ (q, q̇, t).
Pour le Lagrangien L(q, q̇) = Eg (q, q̇) = 12 ||q̇||2g(q) d’une métrique riemanni-
enne (celui qui correspond à l’intégrale d’énergie), cela devient
ce qui implique l’orthogonalité des rayons (= géodésiques) aux fronts d’onde pour
une métrique arbitraire (lemme de Gauss en géométrie, théorie de Hamilton-
Jacobi en mécanique). Dans le cas général, ce simple calcul est à la base de
la théorie des invariants intégraux (Poincaré, Cartan) et de la structure sym-
plectique (Lagrange, Hamilton) des équations de la mécanique conservative (i.e.
sans frottement).
9
ou encore, avec une notation raccourcie mais non ambiguë,
n
1 ∂gjk
n
∂gij
gij q̈j = −2 q̇j q̇k , i = 1, 2 · · · n.
j=1
2 ∂qi ∂qk
j,k=1
On écrit classiquement ces équations sous une forme plus symétrique en égalant
les coefficients de q̇j q̇k et q̇k q̇j :
n
1 ∂gjk
n
∂gij ∂gik
gij q̈j = − − q̇j q̇k , i = 1, 2 · · · n.
j=1
2 ∂qi ∂qk ∂qj
j,k=1
La matrice G(q) des gij (q) étant inversible pour tout q, on obtient une équation
différentielle du second ordre sur Ω qui généralise l’équation q̈i = 0, i = 1, . . . n :
n
q̈i + Γijk (q)q̇j q̇k = 0 , i = 1, 2 · · · n,
j,k=1
dans laquelle les symboles de Christoffel Γijk (q) = Γikj (q) sont définis par
1 ∂g1k ∂g1j ∂gjk
Γ1jk 2 ( ∂qj + ∂qk − ∂q1 )
Γ2jk 1 ( ∂g2k + ∂g2j − ∂gjk )
2 ∂qj ∂q2
. = G−1 ,
∂qk
∀j, k, .
.. ..
Γnjk 1 ∂gnk
( +
∂gnj
−
∂gjk
)
2 ∂qj ∂qk ∂qn
c’est-à-dire
1 il ∂gkl
n
∂glj ∂gjk
Γijk
= g + − ,
2 ∂qj ∂qk ∂ql
l=1
où la matrice des g ij (q) est l’inverse G−1 (q) de G(q).
Remarques.
1 - Si f : Ω → RN est un paramétrage d’une sous-variété de RN , les symboles
de Christoffel s’écrivent
2
1
∂qj ∂qk · ∂q1
∂ f ∂f
Γjk ∂2f
Γ2jk ∂f
· ∂q
∀j, k, . = G−1
∂q ∂q
.
j k 2
.. ..
n
.
Γjk 2
∂ f
· ∂f
∂qj ∂qk ∂qn
10
sont joints par un unique segment de géodésique (extrémum de Eg ) qui est
l’unique courbe réalisant le min de la longueur entre ces deux points, ce qui
montre qu’un min de Lg est un segment de géodésique. Réciproquement, un
min de Eg n’a pas de point conjugué et appartient donc à un champ, c’est-à-dire
à un système de coordonnées ondes-rayons (c’est le théorème de Weierstrass).
Le raisonnement de 1.2 montre alors qu’il minimise la longueur Lg .
3 - Dans des “coordonnées normales de Riemann” en un point q0 , c’est-à-dire
dans des coordonnées ondes sphériques-rayons comme sur la figure 4, centrées
en q0 , les symboles de Christoffel Γijk (q0 ) sont tous nuls ! Si on remplace la
métrique riemannienne par une “métrique lorentzienne” (i.e. un produit scalaire
défini positif en tout point par un produit scalaire de signature (− + ++) dans
l’espace-temps), les coordonnées normales de Riemann sont la réalisation d’un
“repère localement inertiel”, tel celui qu’on obtient dans un ascenseur en chute
libre (voir [MTW], par. 11.6)
11
Chemins et fonctions, vecteurs et covecteurs, champs de vecteurs et
1-formes différentielles, métriques riemanniennes
Chemins et fonctions sont les outils premiers de l’analyse des variétés ; leurs
versions infinitésimales sont les vecteurs et covecteurs tangents (vitesse, dérivée),
d’où les notions de champs de vecteurs et 1-formes différentielles.
12
Enfin, une métrique riemannienne (resp. lorentzienne) sur une variété M est
la donnée dans chaque espace tangent Tx M d’un produit scalaire défini positif
(resp. de signature −, + + · · · ) qui varie “de fçon régulière” avec le point x. Ici
encore, la seule difficulté est de définir la “régularité”, par exemple en le faisant
dans une carte (c’est une propriété locale) puis en montrant l’iindépendance du
choix de la carte.
Nous avons déjà mentionné une différence fondamentale entre champs et 1-
formes, à savoir l’intégrabilité locale de tout champ assez régulier (lipschitzien
suffit) et la non-intégrabilité en général du champ d’hyperplans tangents à M
défini par les noyaux d’une 1-forme différentielle : tout champ régulier est le
champ des vitesses d’une famille de courbes paramétrées qui remplissent M alors
qu’il n’existe en général pas de famille de surfaces p-dimensionnelles tangente à
un champ de p-plans donné sur M , même très régulier (et même si M = R3 ).
Nous reviendrons sur ce fait, à l’origine de l’existence de la courbure. Cependant,
la donnée d’une métrique riemannienne fournit une identification entre champs
et 1-formes ; en particulier le gradient d’une fonction f est le champ de vecteurs
défini à partir de la 1-forme différentielle df , dérivée de f , par la formule
df · X = g(gradf, X).
13
3 Du voisinage d’un point au voisinage d’un autre :
transport parallèle et dérivation covariante
Venant en amont de la notion de métrique, la notion de connexion (Levi-
Civita, Cartan, Schouten, Ehresmann, ...) est l’une des plus fondamentales de
la physique et des mathématiques. C’est elle qui permet aux différentes mon-
ades que sont les voisinages infinitésimaux des divers points d’une variété de se
parler. Une nouvelle définition des géodésiques d’une surface va nous conduire
à la notion de développement, puis à celle de transport parallèle, de dérivée
covariante et enfin à celle de connexion.
Dans ce qui suit, géodésique signifie extrémale de l’intégrale d’énergie Eg ; en
particulier, une géodésique est paramétrée de façon à ce que sa vitesse soit cons-
tante.
14
Le roulement
est dit sans glissement en t0 si la dérivée de l’application t →
Ft γ(t0 ) s’annule en t0 (figure 15). Il est dit sans pivotement en t0 si la rotation
instantanée se fait autour d’un axe ω(t0 ) parallèle au plan tangent à M en γ (t0 ).
On peut montrer qu’il existe un unique roulement sans glissement ni pivotement
de M sur M le long de γ , donc une unique trace γ laissée par γ sur M (on
doit bien entendu admettre que M et M puissent se traverser l’une l’autre). De
plus, on déduit de la caractérisation ci-dessus des géodésiques, le
Théorème. Soient M et M deux surfaces de R3 et γ : [a, b] → M une
géodésique de M pour la métrique induite par la métrique euclidienne de R3 . Si
γ : [a, b] → M est la trace laissée sur M par
γ lorsque M roule sans glissement
ni pivotement sur M le long de γ [a, b] , γ est une géodésique de M pour la
métrique induite par la métrique euclidienne de R3 . En effet, si Y (t) = γ̇(t) est
le champ des vitesses de γ et Y (t) = γ̇ (t) celui de γ , la condition de roulement
sans glissement ni pivotement implique l’équivalence de l’orthogonalité de dY dt (t)
à M avec celle de dY
dt (t) à M .
15
par la droite D .
16
point γ(t). Il suit du calcul des symboles de Christoffel donné dans la remarque
5 que, quels que soient j, k,
∂2f n
∂f
= Γijk jk ,
+N
∂qj ∂qk i=1
∂q i
où Njk est normal à M . On en déduit que, si Y (t) = df (c(t))·(y1 (c(t)), . . . , yn (c(t))),
dY n n
∂f
(t) = ẏi + Γijk (c(t))ċj (t)yk (t) (c(t)) + Z(t),
dt i=1
∂qi
j,k=1
17
Une méthode commode de construction du transport parallèle le long d’une
courbe est de remarquer que l’on peut remplacer la surface M par le cône C
obtenu en prenant l’enveloppe des plans tangents à M le long de C (figure 18).
18
Suivant l’expression de Do Carmo, DY dY
dt est la dérivée dt vue de M (figure
20). La définition est manifestement faite pour qu’un champ de vecteurs tangent
à une surface M le long d’une courbe γ soit parallèle si et seulement si sa dérivée
covariante est le champ identiquement nul le long de γ.
2
∂f
γ(t) = f ◦ c(t), Y (t) = c(t) yi (t).
i=1
∂qi
19
4 Connexion
4.1 Aspect algébrique (Koszul, Nomizu)
On peut utiliser la formule donnée dans le paragraphe précédent pour définir
dérivée covariante et parallélisme d’un champ de vecteurs le long d’une courbe
tracée sur une variété riemannienne quelconque : si, dans une carte, la courbe
γ est représentée par c = (c1 , · · · , cn ) et le champ Y le long de γ par y =
(y1 , · · · , yn ), DY
dt est le champ le long de γ représenté dans la carte par
Dy
n
(t) = . . . , ẏi (t) + Γijk c(t) ċj (t)yk (t), . . . .
dt
j,k=1
Les géodésiques sont toujours les courbes dont le champ des vitesses est parallèle,
c’est-à-dire de dérivée covariante identiquement nulle. Il resterait à vérifier (ex-
ercice pour les courageux) que cette définition de la dérivée covariante ne dépend
pas du choix de la carte mais cette façon de procéder manque d’élégance et le
besoin naı̂t d’une définition un peu plus intrinsèque.
La formule ci-dessus montre que, comme pour la dérivée usuelle, DY dt (t0 ), s’il
dépend de Y (t) au voisinage de t = t0 , ne dépend que de la valeur en t0 de γ̇(t).
Nous le noterons ∇γ̇(t0 ) Y . A deux champs de vecteurs X et Y de classe C ∞ sur
M , on peut alors associer un nouveau champ de vecteurs ∇X Y , également de
classe C ∞ , par la formule
(∇X Y )(m) = ∇X(m) Y (m).
∇ : Γ∞ (T M ) × Γ∞ (T M ) → Γ∞ (T M ),
possédant les propriétés suivantes : quels que soient les fonctions f, g de classe
C ∞ et les champs de vecteurs X, Y, Z sur M , on a
1) ∇f X+gY Z = f ∇X Z + g∇Y Z,
2) ∇X (Y + Z) = ∇X Y + ∇X Z,
3) ∇X (f Y ) = f ∇X Y + (∂X f )Y.
20
n
∂
n
∂
X = (X1 , . . . , Xn ) = Xi , Y = (Y1 , . . . , Yn ) = Yi ,
i=1
∂qi i=1
∂qi
(les Xi et les Yi sont des fonctions de q), on déduit des propriétés de ∇ que
n
n n ∂Yi ∂ n
∂
∇X Y = Xj ∇ ∂ Y = Xj + Yk ∇ ∂ ,
j=1
∂qj
j=1 i=1
∂qj ∂qi ∂qi ∂q
k
k=1
donc
n
∂
∇X Y = ∂X Y + ∇ijk Xj Yk ,
∂qi
j,k=1
Réciproquement, on vérifie que quelles que soient les fonctions ∇ijk de classe C ∞
à valeurs réelles définies sur le domaine de la carte, la formule ci-dessus définit
une connexion ∇ sur ce domaine.
On en déduit que la dérivée covariante de la restriction
à γ du champ Y ,
représentée dans la carte locale par y(t) = Y c(t) , est
Dy
n
(t) = . . . , ẏi (t) + ∇ijk c(t) ċj (t)yk (t), . . . .
dt
j,k=1
∇ijk = Γijk .
21
assure la validité du Lemme de Gauss (orthogonalité des rayons aux cercles
riemanniens), c’est-à-dire la préservation par le flot géodésique de la forme de
Liouville.
De nouveau l’équation des géodésiques. La compatibilité avec la métrique
de la connexion de Levi-Civita se traduit par la propriété suivante de la dérivée
covariante : pour tout couple de champs de vecteurs Y, Z le long d’une même
courbe γ, on a
d DY DZ
Y (t), Z(t)g(γ(t)) = (t), Z(t) + Y (t), (t) .
dt dt g(γ(t)) dt g(γ(t))
Obtenue par projection sur l’espace tangent dans le cas d’une surface de R3 ,
la formule se démontre dans le cas général à l’aide d’un champ parallèle de
repères orthonormés le long de γ puisqu’alors la dérivation covariante se ramène
à la dérivation ordinaire des coordonnées. On peut alors reprendre intrinsèque-
ment le calcul de la variation première de l’intégrale d’énergie. Soit u → γu
une variation à extrémités fixées de γ = γ0 à travers des courbes régulières et
Xu = ∂γ ∂u la variation infinitésimale correspondante ; utilisant maintenant la
u
22
Un champ de vecteurs sur le cercle (i.e. un champ de vecteurs tangents au cercle)
s’interprète maintenant comme une application X : S 1 → T S 1 ≡ S 1 × R qui fait
correspondre à x un vecteur X(x) tangent au point x, que l’on peut représenter
par le couple du point x et d’une longueur algébrique portée sur la tangente
orientée en x. On dit que X est une section de π. Ce qu’on a gagné est la
possibilité de définir sans peine ce que signifie un champ de vecteurs dérivable,
deux fois dérivable, etc...
23
par un difféomorphisme linéaire sur le fibres) au fibré tangent (resp. cotangent)
d’un ouvert Ω de Rn . Mais ce dernier est canoniquement isomorphe au produit
Ω × Rn (resp Ω × (Rn )∗ ) car la translation de x identifie canoniquement Tx Ω à
Rn .
L’exemple caractéristique de fibré tangent non trivial est le fibré tangent de la
sphère de dimension deux : la non-trivialité se traduit par l’impossibilité d’en
trouver une section qui ne s’annule pas, c’est-à-dire un champ de vecteurs sur
la sphère partout non nul : on ne peut pas peigner une sphère, il reste toujours
un épi. La figure 22 donne un exemple plus simple et bien connu, le ruban de
Mœbius ; comme dans le cas de T S 1 , les fibres sont de dimension 1
24
sous-espace vertical, défini par les équations linéaires
n
Q̇i + ∇ijk (q)q̇k Qj = 0 , i = 1, · · · , n.
j,k=1
25
dt (t) = ċ1 (t), · · · , ċm (t), ẏ1 (t), · · · , ẏm (t) est la “dérivée ordinaire” de
où dY
l’application Y : R → E = T M . La dérivée covariante DY dt (t) de Y ap-
dY
paraı̂t ainsi comme la composition de la dérivée ordinaire dt (t) de l’application
Y : R → E = T M avec le projecteur Φ : TY (t) E → VY (t) ⊂ TY (t) E sur le
sous-espace vertical VY (t) parallèlement au sous-espace horizontal HY (t) , suivie
de l’identification canonique par translation de VY (t) à Eγ(t) = Tγ (t)M (figure
22).
En résumé : le transport parallèle sur une variété riemannienne n’est que la
manifestation intégrée d’une structure géométrique infinitésimale – un champ de
sous-espaces horizontaux – sur le fibré tangent de la variété considérée, structure
dont la donnée équivaut à celle de la connexion de Levi-Civita. La dérivation
covariante qui lui est associée s’obtient en composant la dérivation ordinaire
d’un champ de vecteurs, considéré comme une application de M dans T M ,
avec la projection sur les sous-espaces verticaux (i.e. sur les espaces tangents
aux fibres de T M ) parallèlement aux sous-espaces horizontaux (figure 24).
26
notée (X, σ) → (∇X σ), C ∞ (M, R)-linéaire en X et telle que ∇X σ soit, pour
chaque champ de vecteurs X, une dérivation de Γ∞ (E), ce qui est une façon
sophistiquée de nommer les propriétés que nous avons décrites dans le cas où E
est le fibré tangent.
Une définition géométrique équivalente est la donnée d’un champ horizontal
e → He de sous-espaces vectoriels tangents à E, qui équivaut comme on vient
de le voir à celle d’une opération de relèvement horizontal.
En conclusion, si l’on prend E pour ce qu’il est, une famille d’espaces vectoriels
Em dépendant de façon C ∞ d’un paramètre m ∈ M , une connexion apparaı̂t
comme une manière naturelle de généraliser la notion de dérivée aux applica-
tions à valeurs dans une famille d’espaces vectoriels, c’est-à-dire de définir dans
cette situation une dérivée qui, comme la dérivée usuelle, soit à valeurs dans E.
Une bonne référence pour ce point de vue est [D]
Généralisation aux fibrés différentiables. La notion de connexion comme
champ de sous-espaces tangents horizontaux garde un sens dans un fibré diffé-
rentiable quelconque (les fibres sont maintenant des variétés et n’ont pas en
général de structure vectorielle). La dérivée covariante est encore définie à
valeurs dans Ve = Te E mais on ne dispose plus de l’identification de ce dernier
espace à la fibre Em de E. C’est la même situation que lorsqu’on définit la
dérivée en un point n d’une application Y d’une variété N dans une autre E
(cas où M est réduit à un point) comme étant à valeurs dans l’espace tangent
TY (n) E, seule une structure vectorielle sur E permettant de définir une dérivée
à valeurs dans E.
27
suivante, due à Jacobi : de la donnée du triangle orienté ABC, on ne retient que
−→ −→
les deux vecteurs AB et GC, où G est le milieu du segment AB..
L’espace des triangles orientés du plan à translation et rotation près peut être
identifié à R3 par l’application de Hopf de R4 sur R3 définie, après identification
de R4 à C2 et de R3 à R × C, par H(z1 , z2 ) = (|z1 |2 − |z2 |2 , 2z̄1 z2 ). On vérifie
en effet que deux points (z1 , z2 ) et (ζ1 , ζ2 ) de C2 ont même image par H si et
seulement s’il existe θ tel que ζ1 = eiθ z1 et ζ2 = eiθ z2 .
Définissons la taille d’un triangle comme étant le tiers de la somme des
carrés des longueurs de ses côtés (c’est-à-dire le moment d’inertie par rapport
à son centre de gravité du solide formé par trois masses unité concentrées aux
sommets). Les triangles orientés du plan à translation et rotation près et de
taille fixée forment une sphère S 2 et la formule montre que cette sphère est
l’image par H de la sphère S 3 de C2 d’équation |z1 |2 + |z2 |2 = 1, c’est-à-dire
de l’espace des triangles orientés du plan à translation près et de taille fixée. La
restriction de H à S 3 est la célèbre fibration de Hopf dont les fibres sont des
cercles deux à deux enlacés dans S 3 : chaque cercle est l’ensemble des triangles
qui se déduisent d’un triangle fixe par une rotation. On définit une connexion
sur S 3 de la manière suivante : le relèvement horizontal d’un chemin de triangles
est un mouvement A(t), B(t), C(t) des trois masses unité A, B, C dans le plan
dont le moment cinétique est identiquement nul : si O est le centre de gravité
(supposé fixe),
−→ ˙ −→ ˙ −→ ˙
OA ∧ A + OB ∧ B + OC ∧ C = 0.
Le plan horizontal en chaque point n’est autre que le plan orthogonal à la fibre
passant par ce point, pour le produit scalaire euclidien et le champ de plans ainsi
obtenu est la forme de contact standard sur la sphère S 3 . La figure 25 illustre le
revêtement horizontal d’un lacet de S 2 . Le chemin obtenu dans S 3 ne se ferme
pas et le défaut de fermeture s’interprète comme une rotation du triangle de
départ : une déformation a remplacé une rotation. L’angle de la rotation est
proportionnel à l’aire entourée sur S 2 par le lacet.
Figure 25 : bien connue des chats qui tombent d’un toit, la figure illustre l’holonomie
de la connexion naturelle de l’espace des triangles orientés du plan.
28
5 Courbures : du théorème de Frobenius au tenseur
de Riemann
The curvature tensor of a riemannian manifold is a lit-
tle monster of (multilinear) algebra whose full geometric
meaning remains obscure.
M. Gromov, Sign and geometric mean-
ing of curvature, 1990.
Spacetime curvature manifests itself as gravitation,
by means of the deviation of one geodesic from a nearby
geodesic (relative acceleration of test particles).
C.Misner, K.Thorne, J.A.Wheeler, Grav-
itation, 1973.
La citation de Misha Gromov n’est là que pour effrayer le lecteur ; au niveau
élémentaire auquel nous nous plaçons, le monstre s’apprivoise aisément. Par
l’autre citation, il s’agit de rappeler l’importance fondamentale de la géométrie
riemannienne dans les théories relativistes de la gravitation.
Soit π : E → M un fibré vectoriel sur une variété M de dimension n, par
exemple le fibré tangent E = T M . Nous avons vu qu’une connexion ∇ sur
E pouvait être définie par un champ de sous-espaces horizontaux (Hζ )ζ∈E de
dimension n tangents à E transverses aux fibres. Un tel champ n’est en général
pas intégrable : il n’existe pas de de sous-variétés de dimension n tangentes
aux sous-espaces horizontaux. La traduction de cette non-intégrabilité est que
le relèvement horizontal d’un lacet de M n’est en général pas un lacet. Pour la
connexion de Levi-Civita, cela signifie que par transport parallèle d’un vecteur
le long d’un lacet de M , un vecteur ne revient pas sur lui-même. On dit alors que
la connexion ∇ a de la courbure. Techniquement, la courbure est une mesure de
la non-intégrabilité, basée sur la notion de crochet de deux champs de vecteurs.
29
intégrale) de donnée initiale x. Une bonne référence pour la notion de flot est
le livre [M].
n
∂f
∂X f = df.X = LX f = Xi .
i=1
∂qi
Un tel opérateur est une dérivation de l’algèbre C ∞ (Ω, R). Autrement dit, ∂X f
est C ∞ (Ω, R)-linéaire en X, R-linéaire en f , et vérifie
30
n n
En coordonnées locales, si X = i=1 Xi ∂q∂ i et Y = i=1 Yi ∂q∂ i , on trouve que
n n
∂Y i ∂X i ∂
[X, Y ] = Xj − Yj .
i=1 j=1
∂qj ∂qj ∂qi
31
5.2 La courbure de Riemann
Le théorème de Frobenius montre que la non-intégrabilité d’une connexion
sur un fibré vectoriel est complètement caractérisée par la projection
[X̃, Ỹ ] − [X,˜Y ]
sur l’espace vertical (i.e. l’espace tangent la fibre, que l’on peut identifier à la
fibre elle-même par translation) du crochet des relèvements horizontaux X̃ et Ỹ
de deux champs de vecteurs X et Y dans la base M .
Dans la pratique, on peut choisir des champs X et Y qui commutent, ce qui
implique que le crochet [X̃, Ỹ ] est vertical et qu’aucune projection n’est plus
nécessaire. De plus, on peut montrer que la valeur de cette projection en un
point ζ de Em = π −1 (m) ne dépend de X et Y que par l’intermédiaire de leurs
valeurs ξ = X(m) et η = Y (m) au point m, à l’exclusion de toute dérivée. Cela
signifie que ce que l’on définit ci-dessous est un tenseur : après identification à
Em de l’espace tangent Tζ Em en l’un quelconque de ses points ζ, on associe à
ξ, η ∈Tm M une application linéaire R(ξ, η) : Em → Em :
ζ → R(ξ, η)ζ.
Tout ce ci vaut dans un fibré vectoriel sur M muni d’une connexion. Le tenseur
(trois fois covariant et une fois contravariant) R qui à un triplet ξ, η, ζ de vecteurs
tangents à M en un même point fait correspondre le vecteur R(ξ, η)ζ tangent
en ce point.
Dans le cas riemannien où la connexion est celle de Levi-Civita, on définit sou-
vent la courbure de Riemann comme le tenseur (quatre fois covariant) qui, à
quatre vecteurs ξ, η, ζ, τ tangents à M au même point m associe
R(ξ, η, ζ, τ ) = R(ξ, η, ζ), τ g(m) ∈ R.
choisissons des coordonnées locales (q1 , q2 ) centrées sur m, telles que les deux
champs de vecteurs X = ∂q∂ 1 et Y = ∂q∂ 2 vérifient X(m) = ξ et Y (m) =
η. Puisque [X, Y ] = 0, on a par définition R(ξ, η)ζ = [X̃, Ỹ ](ζ), où X̃ et Ỹ
sont les relèvements horizontaux de X et Y . Pour calculer ce crochet, relevons
horizontalement le vecteur ζ le long du bord du “carré”
A = {(q1 , q2 ), 0 ≤ q1 ≤ , 0 ≤ q2 ≤ } .
32
Cela revient à transporter parallèlement le vecteur ζ le long du bord de A . Le
résultat de ce transport parallèle est un vecteur ζ̂ de norme 1 qui se déduit de
ζ par une rotation d’un angle (riemannien) ∆θ dans le plan tangent Tm M . On
a donc
ζ̂ − ζ = 2 [X̃, Ỹ ](ζ) + O(3 ) = ∆θ + o(∆θ ).
La préservation de la métrique par transport parallèle a pour conséquence que
l’angle ∆θ ne dépend pas du choix de ζ. Choisissant ζ = ξ et divisant par l’aire
(riemannienne) 2 + O(3 ) du carré, on obtient que
∆θ
R(ξ, η, ξ, η) = lim .
→0 aire de A
Avec un peu d’algèbre linéaire on en déduit que, quels que soient les vecteurs
linéairement indépendants ξ, ηm M ,
∆θ R(ξ, η, ξ, η)
K(m) := lim =
→0 aire de A ||ξ ∧ η||2
33
5.3 Le theorema egregium de Gauss
Il est surprenant que la quantité ci-dessus, attachée à la seule métrique de la
surface M coı̈ncide, lorsque cette métrique est induite de la métrique euclidienne
par un plongement de M dans R3 , avec le produit des rayons de courbure
principaux, quantité éminemment extrinsèque déjà introduite par Euler mais
dont il revient à Gauss d’avoir montré le caractère intrinsèque.
Définition extrinsèque de la courbure. La courbure de Gauss extrinsèque
en un point m de M est définie par
aire N (A)
Ke (m) = lim (m) ,
A→m aire A
où N : M → S 2 est l’application de Gauss qui, à un point de M , fait correspon-
dre la normale en ce point et l’aire sur S 2 est définie par la métrique induite par
R3 et (m) vaut +1 ou −1 suivant que N préserve ou non l’orientation au voisi-
nage de m. [si Ke (m) = 0 il faut prendre l’aire algébrique de N (A) qui, lorsque
N n’est pas trop dégénérée, s’interprète géométriquement comme la somme avec
signes des aires des images par N des parties de A où le déterminant de dN
ne s’annule pas].
Gauss appelle courbure totale de A l’aire algébrique de N (A).
34
centrée en son sommet, on obtient un cercle. Développant le cône sur le plan,
on voit que la variation d’angle ∆θ par déplacement parallèle le long de ce
cercle vaut ∆θ = 2π − L. Soit A l’angle solide défini par le cône dual M ∗ , défini
comme enveloppe des plans orthogonaux au cône M . A n’est autre que la surface
découpée sur la sphère par l’un des demi-cônes définis par M ∗ (figure 27). Le
théorème de Gauss affirme l’égalité
2π − L = A.
Remarque. Même dans le cas polyédral ce théorème reste non évident : un
polyèdre peut avoir beaucoup de déformations isométriques provenant de piv-
otements des faces autour des arêtes (penser à une pyramide de base carrée que
l’on peut aplatir en passant par des pyramides à base un losange de plus en
plus plat), ce qui montre que l’angle solide intérieur, dont la définition est claire
dans le cas convexe, n’est pas intrinsèquement défini ; il peut varier et même
s’annuler sans que les angles des faces varient !
35
6 De la courbure à la forme : le théorème de
Gauss-Bonnet
6.1 Triangles géodésiques et formule locale
Généralisant les formules classiques de trigonométrie sphérique ou hyper-
bolique, la formule de Gauss-Bonnet est le parangon des théorèmes faisant le
lien entre propriétés globales et propriétés locales. Pour l’établir, décomposons
une surface M en “triangles géodésiques” suffisamment petits pour être chacun
contenu dans un domaine de carte ; “géodésiques” veut dire que les côtés sont
des segments de géodésiques. Remarquons que la courbure totale T K(m)dσ(m)
d’un tel triangle T n’est autre que la variation d’angle ∆θ définie par le trans-
port parallèle le long de son bord orienté. Puisque ce bord est formé de segments
de géodésiques, le transport parallèle d’un vecteur le longd’un côté conserve
3
l’angle qu’il fait avec ce côté ; on constate alors que ∆θ + i=1 βi = 2π, où les
angles extérieurs βi = π − αi du triangle sont définis sur la figure 31.
36
6.2 Caractéristique d’Euler-Poincaré et formule globale
Pour une subdivision de la surface compacte sans bord M en petits triangles
géodésiques, notons S, A, F respectivement le nombre de sommets, le nombre
de côtés (arêtes), le nombre de triangles (faces), et
X (M ) = S − A + F
la caractéristique d’Euler de M . Ajoutant les courbures totales de chaque trian-
gle, on obtient pour la courbure totale de M la somme
(2π)F − βi = (2π)F − (π − αi ) = (2π)F − (2A)π − S(2π) ,
car chaque arête appartient à deux triangles et la somme des angles en un
sommet vaut 2π. On vient de démontrer la Formule de Gauss-Bonnet :
K(m)dσ(m) = 2πX (M ) .
M
Le lecteur devra se convaincre de l’invariance par subdivision de la carac-
téristique d’Euler (voir [H]). En fait, celle-ci ne dépend que de la topologie de
M . La bonne démonstration passe par la théorie de l’homologie ; on la trouvera
dans tout livre élémentaire de Topologie algébrique ou dans le premier volume
du traité de Spivak. Pour les surfaces compactes orientables sans bord, la carac-
téristique d’Euler est un invariant complet : elle suffit à les distinguer. Une
telle surface M est une “sphère avec g anses” (g est le genre de M ) et sa
caractéristique vaut X (M ) = 2 − 2g. Si g > 0, on parle encore d’un “tore à
g trous” ou de la “somme connexe” de g tores (figure 32). Quant aux surfaces
comapctes sans bord non orientables, qui ne peuvent se représenter dans R3
sans auto-intersections, elles s’obtiennent en attachant à la sphère q rubans
de Moebius (q = 1 pour le plan projectif, q = 2 pour la bouteille de Klein,
etc...) et sont également distinguées par leur caractéristique d’Euler-Poincaré
X (M ) = 2 − q.
Figure 32 : surfaces
37
Considérons le cas où M est une surface compacte sans bord de R3 (donc
orientable) munie de la métrique induite par la métrique euclidienne. Si on
remplace la courbure totale par son interprétation extrinsèque, à savoir l’aire
algébrique de l’image de M par l’application de Gauss, et si on se rappelle que
l’aire de la sphère unité de R3 est 4π, on constate que la formule de Gauss-
Bonnet équivaut à l’affirmation que l’image d’une surface compacte sans bord
de R3 de genre g par son application de Gauss “enveloppe (1 − g) fois” la sphère
S2.
Remarque. L’identité de Gauss-Bonnet interdit qu’on puisse “écraser” une
famille de sphères riemanniennes S 2 sur un point tout en maintenant la courbure
de Gauss bornée inférieurement. C’est au contraire très facile avec une famille
de tores plats : il n’y a pas de contradiction puisque la caractéristique d’un tore
est nulle.
Lecture. On trouvera dans [L] une autre interprétation de la formule 2π =
L + A des cônes duaux dans laquelle L représente l’intégrale sur le cercle qui
borde le cône de la courbure géodésique kg de celui-ci (cette courbure s’annule
identiquement si la courbe est une géodésique). La formule devient alors un cas
particulier (M = S 2 , D = A) de la formule générale de Gauss-Bonnet pour un
domaine à bord D d’une surface riemannienne orientée M :
K(m) dσ(m) + kg (m) ds(m) + βi = 2πX (D) ,
D ∂D i
Références
[A] V.I. Arnold, Méthodes mathématiques pour la mécanique classique, Edi-
tions Mir 1976
[Ba] Banchoff, Critical points and curvature for embedded polyedral surfaces,
American Mathematical Monthly, may 1970
[BG] M. Berger & B. Gostiaux, Géométrie différentielle : variétés, courbes et
surfaces, P.U.F. 1987
[C] A. Chenciner, Géométrie et mécanique, livre en préparation
[D] J. Dieudonné, Eléments d’Analyse, chapitre XVII (tome troisième)
[G] F. Gramain, Topologie des surfaces, P.U.F. 1971
[H] H. Hopf, Differential geometry in the large, Lecture Notes in Mathematics
1000, Springer-Verlag 1983
[HCV] Hilbert & Cohn-Vossen, Geometry and the imagination, chapitre IV,
paragraphe 29, pages 194,195
38
[L] M. Levi, Lectures on Geometrical Methods in Mechanics, in “Classical
and Celestial Mechanics, the Recife lectures”, H. Cabral and F. Diacu
ed., Princeton University Press 2002
[LS] D. Lehmann & C. Sacré, Géométrie et topologie des surfaces, PUF 1982
[M] J. Milnor, Morse theory, Princeton University press, 1963
[MTW] C.W. Misner, K.S. Thorne & J.A. Wheeler, Gravitation, Freeman 1970
[Mi] E. Miller, Metric combinatorics of convex polyhedra : cut loci and nonover-
lapping unfoldings, preprint 2003
[P] F. Pham, Géométrie et Calcul différentiel sur les variétés, InterEditions
1992
[P1] Pham, Fonctions d’une ou deux variables, Dunod 2003
[S] M. Spivak, A comprehensive introduction to differential geometry, vol-
umes 1 and 2, Publish or Perish 1970
[S1] M. Spivak, Calculus on manifolds, Benjamin 1965
39