0% ont trouvé ce document utile (0 vote)
10 vues27 pages

Cours de Calcul Diff New Version

Ce document présente des rappels et compléments sur le calcul différentiel, en se concentrant sur la notion de dérivée pour des fonctions à plusieurs variables dans un espace vectoriel. Il définit la dérivabilité, introduit les chemins différentiables, et établit des résultats fondamentaux comme le théorème fondamental du calcul infinitésimal et la formule de Taylor. Le texte aborde également des concepts tels que l'intégrale des fonctions continues et la longueur d'un arc dans un espace vectoriel.

Transféré par

walidboutaghou39
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
10 vues27 pages

Cours de Calcul Diff New Version

Ce document présente des rappels et compléments sur le calcul différentiel, en se concentrant sur la notion de dérivée pour des fonctions à plusieurs variables dans un espace vectoriel. Il définit la dérivabilité, introduit les chemins différentiables, et établit des résultats fondamentaux comme le théorème fondamental du calcul infinitésimal et la formule de Taylor. Le texte aborde également des concepts tels que l'intégrale des fonctions continues et la longueur d'un arc dans un espace vectoriel.

Transféré par

walidboutaghou39
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Calcul différentiel, rappels et compléments.

Brahim ABBACI
5 décembre 2022

1 Introduction.
Le but de ce cours est de donner une notion pertinente de “dérivée” en a ∈ U , pour les
applications à variables dans l’espace vectoriel Rn de dimension > 1 définies dans un ouvert
U à valeurs dans l’espace vectoriel Rp . Nous commençons d’abord par des rappels sur la
notion de dérivée des fonctions à variables et valeurs réelles.

Définition 1.1 (fonction réelle dérivable) Soit I un intervalle ouvert de R et f : I → R


une fonction réelle. On dit que f est dérivable en a ∈ I si, et seulement si, le rapport
f (a+h)−f (a)
h
, admet une limite lorsque h tend vers 0 dans R. Cette limite, comme toute limite
de fonction si elle existe est alors unique ; on la note f 0 (a). Il s’agit d’un nombre réel. On dit
que f 0 (a) est la dérivée de f en a. Si f est dérivable en tout point a de I, on en déduit une
fonction I 3 a 7→ f 0 (a) ∈ R, appelée la fonction dérivée de f .

Cette définition signifie aussi que la fonction  définie dans un voisinage de 0 dans R à valeurs
dans R par 
 f (a+h)−f (a) − f 0 (a) si h 6= 0
h
(h) =
0 si h = 0

est continue en 0. On peut ré-exprimer cette définition comme ceci : f est dérivable en a
s’il existe un nombre f 0 (a) et une fonction  définie dans un voisinage de 0, continue en 0 et
satisfaisant (0) = 0, tels que

f (a + h) = f (a) + f 0 (a)h + |h|(h)

pour tout h dans un voisinage de 0. En effet, d’une part, si f est dérivable en a, on peut
écrire pour tout h 6= 0 dans un voisinage de l’origine

f (a + h) − f (a)
= f 0 (a) + η(h)
h
où η(h) → 0 lorsque h → 0. Dès lors, la fonction  définie dans un voisinage de l’origine par

h η(h) si h 6= 0
(h) =  |h|
0 si h = 0

1
est bien continue en 0, satisfait (0) = 0, et on a bien f (a + h) = f (a) + f 0 (a)h + |h|(h).
Réciproquement, (h) → 0 lorsque h → 0 implique (|h|/h)(h) → 0 lorsque h → 0.
Remarque. Si f est dérivable en a et si on note h = x − a, on obtient au voisinage de a :
f (x) − f (a) − f 0 (a)(x − a) = (x − a)(x). (∗)
Concentrons-nous sur l’aspect géométrique de la définition de la dérivabilité : le graphe de
l’application I 3 x 7→ f (a) + f 0 (a)(x − a) est la partie de la droite ∆ de R2 (au-dessus
des abscisses x ∈ I) de pente f 0 (a) et passant par (a, f (a)). Ce que nous apprend l’égalité
(*) sur la géométrie du graphe Γ de f au voisinage de (a, f (a)) est que la distance δx =
|f (x) − f (a) − f 0 (a)(x − a)| entre Γ et ∆ est de l’ordre de |(x − a)(x)|, et donc tend vers
0 plus vite que |x − a|, ce que l’on note δx = o(|x − a|) 1 . Autrement dit le graphe Γ vient
“s’écraser” sur la droite ∆ au point (a, f (a)).

2 Calcul différentiel à une variable.


2.1 Chemins différentiables.
Un chemin ou courbe paramétrée (les mécaniciens parleraient plutôt de mouvement) dans
un espace métrique (ou topologique) X est une application continue γ d’un intervalle réel J
dans X. Lorsque J est un intervalle compact [a, b], on dit que γ est un arc, d’origine γ(a) et
d’extrémité γ(b) (ou arc joignant γ(a) à γ(b) dans X). La courbe (non paramétrée) associée
à γ est l’image γ(J) ⊂ X de l’application γ. Réciproquement, γ s’appelle un paramétrage de
son image.
Considérons donc le cas d’un chemin c : I → Rp ; t 7→ c(t) d’un intervalle ouvert I de R à
valeurs dans Rp . La définition ci-dessus de la dérivée d’une application réelle est transposable
à la lettre dans ce nouveau contexte, puisque l’on dispose bien de la notion de limite dans
l’espace normé Rp .
Définition 2.1 La dérivée de c en t ∈ I est la limite dans Rp , si elle existe
1
c0 (t) = lim (c(t + τ ) − c(t)) ∈ Rp .
τ →0 τ

Il est équivalent de dire que


1
c0 (t) = (c(t + τ ) − c(t)) + o(1),
τ
ou que
c(t + τ ) = c(t) + c0 (t)τ + o(τ ), (∗)
quand τ tend vers 0, c’est-à-dire que c possède un développement limité du premier ordre en
t, et que le coefficient dans le terme linéaire est c0 (t).
— La notation o(τ k ) désigne une fonction négligeable devant τ k quand τ tend vers 0, c’est-
à-dire telle que o(τ k )/τ k → 0.
— La caractérisation (*) a le mérite de garder un sens si τ est un vecteur, à condition que
c0 (τ ) soit une application linéaire et que o(τ ) soit pris au sens de o(kτ k) ; c’est celle-ci qui
nous permettra de généraliser la notion de dérivée au cas de plusieurs variables.
1. Soient u1 et u2 deux fonctions définies sur un intervalle I, a ∈ I et supposons que u2 ne s’annule pas
dans I \ {a} et que limx→a u1 (x) = limx→a u2 (x) = 0. On dit alors que u1 tend vers 0 plus vite que u2 lorsque
x tend vers a ssi le rapport u1 /u2 tend vers 0 en a. On dit aussi que u1 est un o(u2 ).

2
Définition 2.2 — Chemins différentiables. Un chemin γ : J → Rp est dit différentiable
(ou dérivable) quand il l’est en tout t ∈ J. Si J est de la forme [a, +∞[, ] − ∞, b] ou [a, b], la
dérivée en a est une dérivée à droite et la dérivée en b est une dérivée à gauche. Si de plus sa
dérivée (ou vitesse) γ 0 : t 7→ γ 0 (t) est continue, alors γ est un chemin (de classe) C 1 .
— Chemins C 1 par morceaux. On dit qu’une application γ : [a, b] → Rp est C 1 par
morceaux lorsqu’il existe une subdivision t0 = a < t1 < · · · < tn+1 = b telle que γ soit C 1
sur chacun des intervalles [tj , tj+1 ]. L’application γ est donc continue, c’est-à-dire que γ est
un arc. La dérivée γ 0 est alors bien définie et continue, sauf éventuellement aux points tj . On
notera γ 0 toute application de [a, b] dans Rp qui est la dérivée de γ sur chacun des ]tj , tj+1 [
(et prenant des valeurs arbitraires aux points où γ n’est pas dérivable). Plus généralement,
on dit qu’un chemin γ : J → Rp est C 1 par morceaux lorsque c’est le cas de sa restriction à
tout [a, b] ⊂ J.
Proposition 2.1 Soient γ : J → Rp un chemin différentiable et f : J → R une fonction
différentiable vérifiant kγ 0 (t)k ≤ f 0 (t) pour tout t ∈ J. On a alors kγ(b) − γ(a)k ≤ f (b) − f (a)
pour tous a < b ∈ J. En particulier, γ est constant si et seulement si γ 0 : J → Rp est
identiquement nulle.

Preuve. f étant croissante. Si γ(b) = γ(a), il n’y a rien à prouver ; sinon, le théorème de
Hahn-Banach affirme l’existence de u ∈ L(Rp , R), de norme 1, telle que kγ(b) − γ(a)k =
u(γ(b) − γ(a)) ; comme u est de norme 1, on a (u ◦ γ)0 (t) = uγ 0 (t) ≤ |uγ 0 (t)| ≤ kγ 0 (t)k ≤ f 0 (t)
pour tout t ; la fonction différentiable réelle f − u ◦ γ étant donc croissante, on a bien

kγ(b) − γ(a)k = u ◦ γ(b) − u ◦ γ(a) ≤ f (b) − f (a).

Si γ 0 est identiquement nulle, f ≡ 0 conduit donc au résultat cherché.

2.2 Intégrale des fonctions continues


Si f : [a, b] → R est en escalier (constante sur chaque intervalle d’une subdivision finie de
[a, b]), on définit de façon évidente l’intégrale de f . Si f est seulement continue (éventuelle-
ment par morceaux), il existe une suite (fn ) de fonctions en escalier qui converge uniformé-
ment vers f , et Rb
l’on montre que :
1) l’intégrale a fn (t)dt de fn converge,
2) la limite ne dépend pas du choix de la suite. On pose donc ab f (t)dt = ab fn (t)dt.
R R

Si maintenant c = (c1 , . . . , cp ) est un chemin de [a, b] dans Rp , on pose


Z b Z b Z b
c(t)dt = ( c1 (t)dt, . . . , cp (t)dt).
a a a

2.3 Le théorème fondamental du calcul infinitésimal.


Théorème 2.1 1. Si c : [a, b] → Rp est un chemin (continu), la fonction C(t) = at c(s)ds
R

définit un chemin de classe C 1 et C 0 (t) = c(t), i.e. C est une solution de l’équation différentielle
C 0 = c de donnée c.
2. Si γ : I → Rp est un chemin C 1 par morceaux ; quels que soient a < b ∈ I,
Z b
γ(b) − γ(a) = γ 0 (t)dt (formule de la moyenne).
a

3
Preuve du théorème. 1. Pour tout t ∈]a, b[, il existe η > 0 tel que Iη := [a, b] ∩ [t − η, t + η]
soit un intervalle compact. Comme c est continue au point t, alors, pour t+h ∈ Iη , l’intervalle
I|h| := [a, b] ∩ [t − |h|, t + |h|] est compact et on a

C(t + h) − C(t) Z t+h


c(s) − c(t)
− c(t) = ds ≤ sup kc(s) − c(t)k,
h t h s∈I|h|

qui tend vers 0 quand h tend vers 0 parce Rque c est continue au point t.
2. D’après 1, le chemin γ1 : t 7→ γ(a) + at γ 0 (s)ds est continu, de classe C 1 en dehors de
l’ensemble Σ des discontinuités de γ 0 , et sa restriction à I\Σ a pour dérivée γ 0 |I\Σ . En d’autres
termes, γ − γ1 est continue, de classe C 1 en dehors de Σ, et sa restriction à I\Σ a une dérivée
nulle. En appliquant la proposition 1.1 à chacun des intervalles ouverts J joignant deux points
successifs de Σ, on en déduit que γ − γ1 est constante ; comme elle est nulle au point a, on a
donc bien γ = γ1 .
Proposition 2.2 (Changement de variable dans les intégrales) Soient I et J deux in-
tervalles. Pour toute application continue f : J → Rp et toute fonction g : I → J de classe
C 1 par morceaux, on a
Z g(b) Z b
f (t)dt = g 0 (u)f (g(u))du (∗)
g(a) a

quels que soient a, b ∈ I.


x
Preuve. Le chemin γ : x 7→ g(a) f (t)dt étant C 1 , de dérivée f , la formule ci-dessus n’est
R

autre que la formule de la moyenne pour γ ◦ g.


Proposition 2.3 (Longueur d’un arc) La longueur d’un arc C 1 par morceaux γ : [a, b] →
Rp est Z b
`(γ) := kγ 0 (t)kdt.
a
Elle est invariante par changement de variable monotone : si g : [α, β] → R est une application
C 1 par morceaux monotone (soit croissante au sens large, soit décroissante au sens large) telle
que g([α, β]) = [a, b], alors `(γ ◦ g) = `(γ).
Preuve. L’image réciproque par l’application monotone g de chaque intervalle de continuité
de γ 0 est un intervalle ; en se restreignant à chacun d’entre eux, on se ramène au cas où
γ est C 1 . Il ne reste plus alors qu’à appliquer la formule (*) ci-dessus à f (t) = kγ 0 (t)k en
remarquant que,

k(γ ◦ g)0 (t)k si g est croissante
g 0 (t)kγ 0 (g(t))k =  0
−k(γ ◦ g) (t)k si g est décroissante

ce signe moins compensant le fait qu’alors g(α) = b et g(β) = a.

2.4 Dérivées d’ordre supérieur.


Définissons inductivement un chemin C k+1 , k ≥ 1, comme un chemin C 1 dont la dérivée
est de classe C k . Pour 0 ≤ j ≤ k, la dérivée (j + 1)-ème γ (j+1) d’un tel chemin γ est γ 0 si
j = 0 et (γ (j) )0 sinon. Quand γ est C k pour tout k, il est dit C ∞ , ou lisse. En posant γ (0) = γ,
on obtient la

4
Théorème 2.2 (Formule de Taylor avec reste intégral) Soit γ : J → Rp un chemin
C k+1 , k ∈ N. Pour x et x + h ∈ J
k
hj (j) Z 1
(1 − t)k (k+1)
γ (x) + hk+1
X
γ(x + h) = γ (x + th)dt.
j=0 j! 0 k!

Preuve. Pour k = 0, cela résulte immédiatement de la formule de la moyenne appliquée au


chemin [0, 1] → Rp ; t 7→ γ(x + th),
Z 1 Z 1
d
γ(x + h) = γ(x) + γ(x + th)dt = γ(x) + h γ 0 (x + th)dt;
0 dt 0

on en déduit le cas général en remarquant que, d’après la formule d’intégration par parties,
pour 0 < j ≤ k, on a
Z 1
(1 − t)j−1 (j) 1 Z 1
(1 − t)j (j+1)
γ (x + th)dt = γ (j) (x) + h γ (x + th)dt.
0 (j − 1)! j! 0 j!

3 Différentiabilité d’une application de Rn dans Rp.


On note c : (R, t) → Rp un chemin défini dans un certain voisinage de t dans R. Cette
notation permet de ne pas donner de nom à ce voisinage. On peut aussi noter c : (R, t) →
(Rp , a) si de plus c(t) = a. On a défini la dérivée en t d’un tel chemin c comme étant le
vecteur
1
c0 (t) = lim (c(t + τ ) − c(t)) ∈ Rp .
τ →0 τ

Cette égalité équivaut au développement limité

c(t + τ ) = c(t) + c0 (t)τ + o(τ ),


c01 (t)
 

où le vecteur c0 (t) = 
 .. 
 .  peut aussi être vu comme une matrice-colonne, c’est-à-dire une

c0p (t)
application linéaire (élément de L(R, Rp )), et le scalaire τ comme une vecteur 1-dimensionnel,
de sorte que c0 (t)τ s’interprète comme un produit matrice-vecteur, à valeurs dans Rp . Cette
formulation se généralise directement au cas où l’espace de départ est multi-dimensionnel.
Soit donc f : (Rn , x) → Rp une application.
Définition 3.1 On dit que f est dérivable en x si il existe une application f 0 (x) ∈ L(Rn , Rp )
(linéaire) telle que
f (x + ξ) = f (x) + f 0 (x) · ξ + o(ξ)
quand ξ tend vers 0. L’application f 0 (x) ∈ L(Rn , Rp ) s’appelle la dérivée de f en x, 2 et pour
tout ξ ∈ Rn , le vecteur
1
f 0 (x) · ξ = lim (f (x + tξ) − f (x))
t→0 t

s’appelle la dérivée directionnelle de f en x dans la direction de ξ.


2. La dérivée s’appelle aussi la différentielle, la jacobienne, l’application linéaire tangente, etc., et se note
df (x), dx f , Df (x), Jf (x), Tx f , f∗ (x), etc. Dans le cas où n = 1, le produit matrice-vecteur f 0 (x) · ξ se réduit
au produit d’un vecteur par un scalaire.

5
L’expression de la dérivée directionnelle montre que la dérivée, si elle existe, est unique. Mais
attention, il ne suffit pas que la dérivée directionnelle de f existe dans toute direction pour
que f soit dérivable.
La notation f 0 (x) · ξ fait ressortir le fait que f 0 (x) est une matrice, élément de Mp,n (R), que
l’on multiplie matriciellement par ξ ∈ Rn , pour obtenir un vecteur de Rp . La i-ième ligne de
f 0 (x) est la dérivée de fi , la i-ième composante de f .
Exemple. Si f est une application linéaire,
1
f 0 (x) · ξ = lim (f (x + tξ) − f (x)) = f (ξ).
t→0 t

La dérivée en un point x d’une fonction d’une variable f: (R, x) → Rp (chemin) était
0

f1 (x)
0
 . 
p . 
 .  et non comme une application
auparavant définie comme un vecteur de R , f (x) = 
fp0 (x)
p
linéaire de R dans R . Mais ce vecteur peut aussi bien être vu comme une matrice colonne de
f10 (x)τ
 
 . 
Mn,1 (R), c’est-à-dire justement comme l’application linéaire de R dans Rp , τ 7→ 
 . ,
. 
fp0 (x)τ
conformément à la définition 1.4 si-dessus.

Définition 3.2 (Dérivées partielles) Soient e1 , . . . , en les vecteurs de la base canonique


de Rn . La dérivée directionnelle de f dans la direction de ei s’appelle la i-ième dérivée partielle
∂f
de f en x et se note ∂x i
(x) = f 0 (x) · ei = limt→0 1t (f (x + tei ) − f (x)) ; c’est la dérivée du
p
chemin de R obtenu en figeant toutes les coordonnées de x sauf la i-ième. On la note aussi
∂xi f (x) ou ∂i f (x).

Attention, contrairement à ce que cette notation suggère, la i-ème dérivée partielle de f en


x dépend de toutes les coordonnées utilisées, et non seulement de la i-ième. En effet, la
courbe, paramétrée par xi , le long de laquelle la i-ième dérivée partielle de f se calcule, a
pour équations xj = cte j (j 6= i). La forme de cette courbe dépend donc des coordonnées xj
(tandis que xi ne détermine que son paramétrage).
La matrice de f 0 (x) dans les bases canoniques de Rn et de Rp . est donnée par

Lemme 3.1 Si f (Rn , x) → Rp est dérivable en x, on a


 
! ∂1 f1 (x) · · · ∂n f1 (x)
∂f ∂f
f 0 (x) = (x) =  ... .. .. 

(x), . . . , . .   ∈ Mp,n (R).

∂x1 ∂xn
∂1 fp (x) · · · ∂n fp (x)

Par ailleurs, il est commode de savoir écrire directement la formule développée :

f 0 (x) · ξ =
X
∂fi (x)ξi
i

sans passer par la matrice. Cette formule est intuitive : la variation infinitésimale de f (“infi-
nitésimal” signifie : la variation f (x + ξ) − f (x), au premier ordre en ξ quand ξ tend vers 0)

6
est la somme des ξi pondérés par les dérivées partielles de f .
Preuve du lemme. On a
f 0 (x) · ξ = f 0 (x) · i ξei
P

ξi f 0 (x) · ei
P
= (linéarité)
Pi ∂f
= i ξi ∂xi (x) (notation)
 
ξ
  1
= ∂x1 (x), . . . , ∂xn (x)  ... 

∂f ∂f
 (produit matrice-vecteur).

ξn
Le lemme précédent se généralise : par exemple, si f : (Rn × Rm , (x, y)) → Rp est dérivable,
la dérivée de f se décompose naturellement en deux blocs horizontaux :

f 0 (x, y) = (∂x f (x, y), ∂y f (x, y))

où par exemple le premier bloc ∂x f (x, y) ∈ L(Rn , Rp ) désigne la dérivée de f par rapport à
la variable x, obtenue en figeant y.
Notations et langage «de physiciens». Si f est une application linéaire de Rn dans
Rp , on a vu qu’elle est égale à sa propre différentielle en tout point. Comme l’application
linéaire f 0 (x) ne dépend pas dans se cas du point x où on la calcule, il est d’usage de la noter
alors df au lieu de f 0 (x) ou de df (x). En particulier avec les omniprésentes “applications
coordonnées” xi : Rn → R; u 7→ xi (u) = ui , la dérivée dxi : Rn → R; v 7→ vi est la i-ième
projection canonique de Rn sur R et pour toute application f : (Rn , x) → R on a

f 0 (x) = ∂1 f (x)dx1 + · · · + ∂n f (x)dxn .

Cette écriture est intuitive : la variation de f est la somme des contributions de dérivées
partielles par rapport à chacune des variables. En outre comme Rn est euclidien, on dispose de
l’isométrie canonique [ : x 7→ x[ de Rn sur son dual Rn∗ , définie par x[ (v) := x, v [comme

c’est une isométrie linéaire, elle est injective et donc surjective]. L’isomorphisme réciproque ∨
] := [−1 de Rn∗ sur Rn permet de transformer chaque «covecteur» (forme linéaire) p ∈ Rn∗ en
un vecteur p] ∈ Rn , objet jugé plus concret puisqu’on peut le dessiner ; c’est l’unique v ∈ Rn
tel que v, w = p(w) pour tout w ∈ Rn . Si (u1 , . . . , un ) est une base orthonormée de

R , alors p = p(uj )uj : en effet on a p] =


n ]
p] , uj uj et p] , uj
P P
= p(uj ) pour

n 1 n∗
tout j. Si f : U (ouvert) ⊂ R → R est C , sa différentielle Df : U → R est un «champ de
covecteurs», on lui associe le champ de vecteurs, appelé gradient de f , noté ∇f , et est défini
par ∇f (x) := Df (x)] . On a alors ∇f = (∂1 f, . . . , ∂n f ).
Théorème 3.1 («chain rule») Si f : (Rn , x) → (Rp , y) et g : ((Rp , y) → Rq sont deux
applications dérivables respectivement en x et en y, alors g ◦ f est dérivable en x et sa dérivée
est le produit matriciel des dérivées de f et de g :

(g ◦ f )0 (x) = g 0 (f (x)) · f 0 (x).

Preuve. La formule découle du développement limité suivant :


g ◦ f (x + h) = g(f (x) + f 0 (x) · h + o(h))
= g(y) + g 0 (y) · (f 0 (x) · h + o(h)) + o(f 0 (x) · h + o(h))
= g(y) + g 0 (y) · f 0 (x) · h + o(h).

7
Corollaire 3.1 Si c : (R, t) → (Rn , x) est dérivable au temps t et f : (Rn , x) → (Rp , y) est
différentiable en x, alors f ◦ c est dérivable au temps t et (f ◦ c)0 (t) = f 0 (x) · c0 (t). Cette
formule peut être utilisée pour définir de façon cinématique la dérivée de f dans la direction
de c0 (t) : f 0 (x) · c0 (t) n’est autre que la vitesse du chemin f ◦ c ; il est ici important que cette
quantité ne dépend de c qu’à travers c0 (t).
Proposition 3.1 1. La dérivation est linéaire : si f , g : (Rn , x) → Rp sont dérivables en x
et si α, β ∈ R,
(αf + βg)0 (x) = αf 0 (x) + βg 0 (x).
2. Si f : (Rn , x) → (Rn , y) est localement inversible et si f et f −1 sont dérivables (respecti-
vement en x et en y), alors f 0 (x) est un automorphisme de Rn et
(f −1 )0 (y) = f 0 (x)−1 .
Preuve. 1. Trivial en utilisant l’unicité de la dérivée.
2. « chain rule » appliquée à f ◦ f −1 = Id et à f −1 ◦ f = Id donne respectivement
f 0 (x) · (f −1 )0 (y) = Id et (f −1 )0 (y) · f 0 (x) = Id,
donc l’opérateur (f −1 )0 (y) est inversible d’inverse f 0 (x).

4 Applications différentiables, applications de classe C 1.


Définition 4.1 i) On dit que f : U (ouvert) ⊂ Rn → Rp est différentiable quand elle l’est en
tout point de U ; sa différentielle (ou dérivée) est alors l’application f 0 : x 7→ f 0 (x) de U dans
L(Rn , Rp ) ' Rnp .
ii) Lorsque f est différentiable et f 0 continue, f est dite continûment différentiable, ou (de
classe) C 1 .
Proposition 4.1 (Composition d’applications C 1 ) Si f : U (ouvert) ⊂ Rn → Rp et
g : V (ouvert) ⊂ Rp → Rq sont de classe C 1 , alors l’application g ◦ f : U ∩ f −1 (V ) → Rq est
C 1 (rappelons que sa dérivée est x 7→ g 0 (f (x)) · f 0 (x)).
Preuve. Sa dérivée est continue puisqu’elle s’obtient en composant l’application continue
x 7→ (g 0 (f (x)), f 0 (x)) de U ∩ g −1 (V ) dans L(Rp , Rq ) × L(Rn , Rp ) avec le produit matriciel
(u, v) 7→ u · v qui est bilinéaire (donc continu) de L(Rp , Rq ) × L(Rn , Rp ) dans L(Rn , Rq ).

4.1 La formule de la moyenne (« plusieurs » variables).


Théorème 4.1 Soit γ : [α, β] → U un arc C 1 par morceaux joignant deux points a et b d’un
ouvert U de Rn : si f : U → Rp est C 1 , elle vérifie la formule de la moyenne
Z Z β
f 0 := f 0 (γ(t)) · γ 0 (t)dt = f (b) − f (a);
γ α

on dit que γ f 0 est l’intégrale de f 0 le long de γ. En particulier Si U contient le segment


R

[a, b] := {a + t(b − a), 0 ≤ t ≤ 1},


Z 1 Z 1 
f (b) − f (a) = f 0 (a + t(b − a)) · (b − a)dt = f 0 (a + t(b − a))dt · (b − a).
0 0

8
Preuve. D’après la proposition précédente, le chemin f ◦ γ est C 1 sur chaque intervalle I où
γ l’est, donc C 1 par morceaux ; il suffit de lui appliquer la formule de la moyenne, puisque
(f ◦ γ)0 (t) = f 0 (γ(t)) · γ 0 (t). Pour [a, b] ⊂ U , on prend γ(t) = a + t(b − a).

Théorème 4.2 (L’inégalité des accroissements finis) Si f : U (ouvert) ⊂ Rn → Rp est


différentiable, on a
kf (b) − f (a)k ≤ `(γ)kf 0 ◦ γk∞
pour tout arc C 1 par morceaux γ joignant a à b dans U , d’où, pour [a, b] ⊂ U ,

kf (b) − f (a)k ≤ kb − ak sup kf 0 (x)k.


x∈[a,b]

Lorsque U est connexe, f est constante si et seulement si f 0 est partout nulle.

Preuve. Si f est C 1 , la seconde inégalité s’obtient si γ(t) = a + t(b − a) dans la première ;


celle-ci se déduit de la formule de la moyenne :
β 0 0
kf (b) − f (a)k = α f (γ(t)) · γ (t)dt
R

≤ α kf 0 (γ(t)) · γ 0 (t)kdt ≤ αβ kf 0 (γ(t))kkγ 0 (t)kdt


Rβ R

≤ maxα≤t≤β kf 0 (γ(t))k αβ kγ 0 (t)kdt = k(f 0 ◦ γ)k∞ `(γ).


R

Quand U est connexe, deux de ses points a et b peuvent toujours être joints par un arc lisse
γ dans U ; si f 0 est partout nulle, la première inégalité entraîne donc que f est constante.

Théorème 4.3 (Critères pour que f soit C 1 ) Soit f : U (ouvert) ⊂ Rn → Rp . Les points
suivants sont équivalents :
(i) f est C 1 ;
(ii) il existe α : U → L(Rn , Rp ) continue telle que, pour tout chemin γ de classe C 1 dans U ,
le chemin f ◦ γ soit dérivable et ait pour dérivée (f ◦ γ)0 (t) = α(γ(t)) · γ 0 (t) ;
(iii) f est C 1 au sens de Gâteaux : il existe α : U → L(Rn , Rp ) continue telle que, pour tout
x ∈ U et tout ξ ∈ Rn , la dérivée directionnelle ∂ξ f (x) existe et soit égale à α(x) · ξ ;
(iv) Les dérivées partielles ∂ei f : U → Rp ; x 7→ ∂ei f (x) = 1t (f (x + tei ) − f (x)), 1 ≤ j ≤ n
existent et sont continues.
Dans (ii) et (iii), α est la dérivée de f ; dans (iv), celle-ci est donnée par
n n
f 0 (x)(
X X
ξj ej ) = ξj ∂ej f (x) pour tous ξ1 , . . . , ξn ∈ R
i=1 i=1
.

Preuve. (i) entraîne (ii), qui implique (iii) (en prenant γ(t) = x + tξ), lequel entraîne (iv)
parce que, pour tout i = 1 à n, on a ∂ei f (x) = f 0 (x) · ei . Il ne reste donc qu’à montrer que
(iv) entraîne (i). Si (iv) est satisfaite, soit x ∈ U . Notons α(x) ∈ L(Rn , Rp ) l’application
linéaire donnée par α(x) · ξ = ∂e1 f (x)ξ1 + · · · + ∂en f (x)ξn ; il n y a qu’à montrer que l’on a le
développement de Taylor à l’ordre un f (x + ξ) − f (x) − α(x) · ξ = o(ξ), puisque α(x) dépend
continûment de x par hypothèse. Pour un vecteur ξ donné assez petit, considérons la courbe
c : [0, 1] → U ; t 7→ c(t) = f (x + tξ). Elle a pour dérivée c0 (t) = α(x + tξ) · ξ. En effet,
1
(f (x + (t + τ )ξ) − f (x + tξ))
τ

9
peut se décomposer comme
n
X 1
(f (x + tξ + τ (ξ1 , . . . , ξi , 0, . . . , 0)) − f (x + tξ + τ (ξ1 , . . . , ξi−1 , 0, . . . , 0))
i=1 τ

(de façon à ne faire apparaître que des variations parallèles aux axes de coordonnées), qui,
par hypothèse quand τ tend vers 0, tend vers
n
∂f
c0 (t) =
X
(x + tξ)ξi = α(x + tξ) · ξ.
i=1 ∂xi

D’après cette expression de la dérivée, c0 est


R1
continue, donc c est de classe C 1 . D’après la
formule de la moyenne, f (x + ξ) − f (x) = 0 α(x + tξ) · ξdt, d’où
Z 1
kf (x + ξ) − f (x) − α(x) · ξk ≤ kα(x + tξ) − α(x)kdtkξk.
0

Or, cette dernière intégrale tend vers 0 avec t, puisque t 7→ α(x + tξ) est continue sur
l’intervalle compact [0, 1], donc uniformément continue. Donc, comme voulu
kf (x + ξ) − f (x) − α(x) · ξk = o(ξ).

4.2 Applications lipschitziennes.


Rappelons qu’une application g : X → Y entre espaces métriques est dite lipschitzienne
s’il existe une constante k ≥ 0 tel que d(g(x), g(y)) ≤ kd(x.y) quels que soient x, y ∈ X (g est
donc continue). Le plus petit de ces k est la constante de Lipschitz Lip(g) (ou Lip g) de g. Il
est commode de dire que Lip(g) = +∞ lorsque g n’est pas lipschitzienne, ce qui permet de
parler de constante de Lipschitz dans tous les cas. On dit que g est localement lipschitzienne
quand tout point de X est le centre d’une boule ouverte B telle que g|B soit lipschitzienne.
Une application lipschitzienne est donc localement lipschitzienne. On dit de même que g est
localement bornée quand tout point de X est le centre d’une boule ouverte B telle que g|B
soit bornée. Par exemple, une application continue est localement bornée. Enfin une partie
de Rn est convexe quand elle est « connexe par arcs affines » , c’est-à-dire quand elle ne peut
pas contenir deux points sans contenir le segment qui les joint.
Théorème 4.4 Soit f : U (ouvert) ⊂ Rn → Rp .
(i) Si f est différentiable au point x, on a kf 0 (x)k ≤ Lip(f ).
(ii) Si U est convexe et f différentiable, alors Lip(f ) = kf 0 k∞ .
(iii) Si f est différentiable et f 0 localement bornée, alors f est localement lipschitzienne.
Preuve. (i) On a kf (x + tξ) − f (x)k ≤ ktξkLip(f ) et donc, pour ξ 6= 0,
ξ kf (x + tξ) − f (x)k
f 0 (x) · = lim ≤ Lip(f ).
kξk t→0 ktξk
(ii) D’après (i), on a kf 0 k∞ ≤ Lip(f ). Étant donnés a, b ∈ U , l’inégalité des accroissements
finis donne kf (b) − f (a)k ≤ supx∈[a,b] kf 0 (x)kkb − ak ≤ kf 0 k∞ kb − ak ; donc Lip(f ) ≤ kf 0 k∞ ,
d’où (ii).
(iii) en résulte car f 0 est localement bornée et une boule ouverte est convexe.
Une application continue étant localement bornée, le point (iii) du théorème admet le
Corollaire 4.1 Une application C 1 est localement lipschitzienne.

10
5 Dérivées d’ordre supérieur.
5.1 Application k-fois différentiable, classe C k .
Nous avons vu qu’à toute fonction f : U (ouvert) ⊂ Rn → Rp différentiable sur U on pou-
vait associer sa différentielle f 0 qui est une fonction f 0 : U → L(Rn , Rp ). Comme L(Rn , Rp )
est lui-même un espace vectoriel normé de dimension finie, on peut s’interroger sur la conti-
nuité ou la différentiabilité de f 0 en tant que fonction de U vers L(Rn , Rp ), ce qui conduit
naturellement à la définition suivante :
Définition 5.1 On dit que f : U (ouvert) ⊂ Rn → Rp est deux fois différentiable au point
x ∈ U lorsqu’elle est différentiable dans un ouvert x ∈ V ⊂ U et que f 0 : V → L(Rn , Rp ) est
elle-même différentiable au point x. On dit que f est deux fois différentiable sur U si f est
deux fois différentiable en tout point de U .
Remarque. La différentielle seconde [(f 0 )0 ](x) est donc une application linéaire de Rn dans
L(Rn , Rp ). Par conséquent, pour tout ξ ∈ Rn , [(f 0 )0 ](x) · ξ est une application linéaire de Rn
dans Rp . Notons L2 (Rn , Rp ) := L(Rn , Rn ; Rp ) l’espace des applications bilinéaires de Rn × Rn
dans Rp ; grâce à l’isométrie canonique de L(Rn , L(Rn , Rp )) sur L2 (Rn , Rp ), il est d’usage de
confondre [(f 0 )0 ](x) avec l’application bilinéaire de Rn × Rn dans Rp notée f 00 (x) et définie
par la formule : f 00 (x)(ξ, η) := [[(f 0 )0 ](x) · ξ] · η, pour tout (ξ, η) ∈ Rn × Rn .
Définition 5.2 Si x 7→ f 00 (x) est une fonction continue de U vers L2 (Rn , Rp ), on dit que f
est C 2 . Si la différentielle seconde d’une fonction f est elle-même différentiable, on dit que
f est trois fois différentiable. Il est d’usage d’identifier la différentielle troisième avec une
application trilinéaire de Rn × Rn × Rn dans Rp notée f 000 (x) ou d3 f (x). En suivant le même
procédé, on peut définir la différentielle d’ordre k, dk f (x) qui est assimilée à une application
de Lk (Rn , Rp ). Si de plus x 7→ dk f (x) est continue, on dit que f est de classe C k . Si f est de
classe C k pour tout k, on dit que f est C ∞ .
exemples. 1. Pour une fonction f : (R, x) → Rp l’existence de la différentielle seconde
au point x est équivalente à l’existence de la dérivée seconde f 00 (x) ∈ Rp . On a de plus la
formule :
d2 f (x)(ξ, η) = ξηf 00 (x) pour tout (ξ, η) ∈ R2 .
2. Soit B une application bilinéaire de Rn × Rn dans Rp . Il est facile de voir que
B 0 (x, y)(ξ, η) = B(x, η) + B(ξ, y) pour tous (x, y), (ξ, η) ∈ Rn × Rn .
Pour (ξ, η) ∈ Rn × Rn fixé, la différentielle de l’application φ : (x, y) 7→ B(x, η) + B(ξ, y) est
φ0 (x, y)(δx, δy) = B(δx, η) + B(ξ, δy).
On conclut que pour tout (x, y) ∈ Rn × Rn ,
d2 B(x, y)((ξ1 , η1 ), (ξ2 , η2 )) = B(ξ2 , η1 ) + B(ξ1 , η2 ).
On retiendra que la différentielle seconde d’une application bilinéaire est constante (ne dépend
pas du point (x, y)), et donc ses différentielles d’ordre supérieur ou égal à 3 sont nulles.
3. Toute u ∈ L(Rn , Rp ) est C 1 , et u0 (x) ≡ u. Donc, u0 est de classe C 1 et (u0 )0 ≡ 0. Une
application linéaire (ou plus généralement affine) continue est donc lisse, c’est-à-dire de classe
C ∞.

11
Théorème 5.1 (de Schwarz) Si f est deux fois différentiable au point a, sa dérivée seconde
f 00 (a) appartient à l’espace L2s (Rn , Rp ) des applications bilinéaires (continues) et symétriques
de Rn × Rn dans Rp .
Preuve. Il s’agit de montrer que d2 f (a)(h, k) = d2 f (a)(k, h) pour tout (h, k) ∈ Rn × Rn .
Pour cela, on définit la quantité ∆(h, k) = f (a + h + k) − f (a + h) − f (a + k) + f (a) qui peut
être interprétée comme une différence finie d’ordre deux autour de a et l’on cherche à établir
que ∆(h, k) ∼ d2 f (a)(h, k) pour (h, k) → (0, 0). En utilisant le fait que ∆(h, k) = ∆(k, h),
nous obtiendrons alors d2 f (a)(h, k) = d2 f (a)(k, h).
Fixons un  > 0. Par définition de la différentiabilité de df en a, il existe η > 0 tel que
kdf (a + h) − df (a) − [d(df )](a)(h)k 6 |h| pour tout h ∈ B(0, 2η).
On a donc par définition de la norme d’une application linéaire,
|df (a + h)(k) − df (a)(k) − d2 f (a)(h, k)| 6 |h||k| pour tout h ∈ B(0, η) et k ∈ Rn .
Fixons (h, k) ∈ B(0, η) × B(0, η). Pour t ∈ [0, 1], posons
ψ(t) = f (a + h + tk) − f (a + tk) − td2 f (a)(h, k).
La fonction ψ est dérivable sur [0, 1] et un calcul facile montre que
ψ 0 (t) = [(df (a + h + tk) − df (a))(k) − d2 f (a)(h + tk, k)]
− [(df (a + tk) − df (a))(k) − d2 f (a)(tk, k)] .
En conséquence, on a
|ψ 0 (t)| 6 (|h| + 2|k|)|k| pour tout t ∈ [0, 1].
En appliquant le théorème des accroissements finis à ψ entre 0 et 1 et en remarquant que
ψ(1) − ψ(0) = ∆(h, k) − d2 f (a)(h, k), on conclut donc que
|∆(h, k) − d2 f (a)(h, k)| 6 2(|h| + |k|)2 .
En échangeant les rôles de h et k et en utilisant la symétrie de ∆, on obtient également
|∆(h, k) − d2 f (a)(k, h)| 6 2(|h| + |k|)2 .
Donc, en vertu de la deuxième inégalité triangulaire,
|d2 f (a)(h, k) − d2 f (a)(k, h)| 6 4(|h| + |k|)2 pour tout (h, k) ∈ B(0, η) × B(0, η).
Comme d2 f (a) est bilinéaire, l’inégalité ci-dessus est en fait valable pour tout (h, k) ∈ Rn ×Rn .
Il ne reste plus qu’à faire tendre  vers 0 pour conclure à l’égalité de d2 f (a)(h, k) et de
d2 f (a)(k, h).
Théorème 5.2 (Symétrie des dérivées successives) Si f est k + 1 fois différentiable au
point x ∈ U , k ∈ N, alors dk+1 (x) appartient à l’espace Lk+1
s (Rn , Rp ) des applications (k + 1)-
linéaires symétriques de Rn × · · · × Rn (k + 1 facteurs) dans Rp .
Preuve. Si k = 0, il n’y a rien à prouver ; sinon, on peut (donc) faire l’hypothèse de récurrence
que dk f à valeurs dans Lks (Rn , Rp ), et il suffit de remarquer que dk+1 f (x) est à la fois égal à
d(dk f )(x) (d’où la symétrie par rapport aux k dernières variables) et à d2 (dk−1 f )(x) (d’où,
d’après le lemme de Schwarz, la symétrie par rapport aux deux premières variables et donc
par rapport à l’ensemble des k + 1 variables).
En termes de dérivées directionnelles, on a dk f (x)(X1 , . . . , Xk ) = ∂X1 · · · ∂Xk f (x).

12
6 Formule de Taylor.
La formule de Taylor généralise le théorème fondamental du calcul infinitésimal Commen-
çons par un lemme dont la démonstration est évidente.

Lemme 6.1 Soit f une fonction d’un intervalle ouvert I contenant 0 et 1, à valeurs dans Rp
et de classe C k+1 . On a alors
f 00 (0) f (k) (0) Z 1 (1 − t)k (k+1)
f (1) − f (0) − f 0 (0) − − ··· − = f (t)dt.
2! k! 0 k!
Preuve. Il suffit d’appliquer le théorème fondamental du calcul infinitésimal à la fonction
j k
g(t) = kj=0 (1−t) f (j) (t) qui est de classe C 1 , en remarquant que g 0 (t) = (1−t) f (k+1) (t).
P
j! k!
On peut affaiblir les hypothèses de ce lemme et obtenir

Lemme 6.2 Soit f une fonction d’un intervalle ouvert I contenant 0 et 1, à valeurs dans Rp
et (k+1)-fois différentiable. Supposons de plus que pour tout t ∈ [0, 1], on ait kf (k+1) (t)k ≤ M
pour une certaine constante M > 0. On a alors

f 00 (0) f (k) (0) M


f (1) − f (0) − f 0 (0) − − ··· − ≤ ·
2! k! (k + 1)!
k+1
Preuve. On applique la proposition 2.1 avec γ := g et f := −M (1−t)
(k+1)!
. En effet on a
k
|g 0 (t)| ≤ f 0 (t) = M (1−t)
k!
.

Théorème 6.1 (Taylor avec reste intégral) Soit f : U (ouvert) ⊂ Rn → Rp une applica-
tion de classe C k+1 . Soient a ∈ U et h ∈ Rn tels que le segment [a, h] soit inclus dans U . On
a alors
1 2 1 k k
Z 1
(1 − t)k k+1
2
f (a+h) = f (a)+Df (a)h+ D f (a)h +· · ·+ D f (a)h + D f (a+th)hk+1 dt;
2! k! 0 k!
où Dj f (a)hj est égale à l’évaluation de l’application j-linéaire Dj f (a) ∈ Ljs (Rn , Rp ) sur le
vecteur (h, . . . , h) ∈ Rn × · · · × Rn (j-facteurs).

Preuve. On applique le lemme 6.1 à la fonction g(t) = f (a + th), en remarquant que


g (j) (t) = Dj f (a + th)hj , pour j = 1 à k + 1.
En utilisant le lemme 6.2, on obtient la version suivante :

Théorème 6.2 (Taylor-Lagrange) Soit f : U (ouvert) ⊂ Rn → Rp une application k + 1


fois différentiable. On suppose que pour tout x ∈ U on ait kDk+1 f (x)k ≤ M , pour une
certaine constante M > 0. Soient a ∈ U et h ∈ E tels que le segment [a, h] soit inclus dans
U . On a alors
1 2 1 M
f (a + h) − f (a) − Df (a)h − D f (a)h2 − · · · − Dk f (a)hk ≤ khkk+1 .
2! k! (k + 1)!

Voyons une dernière version de la formule de Taylor, valable sous des hypothèses encore moins
fortes, et qui pour cette raison donne un résultat local seulement.

13
Théorème 6.3 (Taylor-Young) Soit f : U (ouvert) ⊂ Rn → Rp une application k fois
différentiable en un point a ∈ U . On a alors pour khk suffisamment petit,
1 2 1
f (a + h) − f (a) − Df (a)h − D f (a)h2 − · · · − Dk f (a)hk = o(khkk ).
2! k!
Preuve. On procède par récurrence, pour k = 1, c’est la définition de la différentiabilité
en a. On suppose le théorème démontré pour les applications k − 1 fois différentiables en a
(k ≥ 2). Si f est k fois différentiable en a, considérons l’application
k
1 j
D f (a)hj .
X
g : h 7→ g(h) = f (a + h) − f (a) −
j=1 j!

Alors g est différentiable au voisinage de 0 ∈ Rn et


k
j j
D f (a)(hj−1 , ξ),
X
Dg(h)ξ = Df (a + h)ξ − Df (a)ξ −
j=2 j!

d’où
k−1
1 j
D (Df )(a)(hj )(ξ)
X
Dg(h)ξ = Df (a + h)ξ − Df (a)ξ −
j=1 j!
quel que soit ξ ∈ Rn . L’hypothèse de récurrence appliquée à la différentielle de f montre que

kDg(h)k = o(khkk−1 )

Ceci signifie que que pour tout  > 0, il existe η > 0 tel que khk ≤ η implique

kDg(h)k ≤ khkk−1 .

Ainsi kDg(x)k ≤ khkk−1 pour tout x appartenant au segment [0, h]. Grâce au théorème des
accroissements finis on en déduit :

kg(h)k = kg(h) − g(0)k ≤ khkk−1 khk,

c’est-à-dire kg(h)k = o(khkk ).

7 Inversion locale et fonctions implicites.


7.1 Inversion locale.
Le problème de l’inversion est de résoudre en x une équation de la forme f (x) = y. Dans
le cas linéaire, ce problème est bien connu : si A ∈ Mn (R) est inversible (i.e. det A 6= 0), la
solution dans Rn de Ax = y est donnée par x = A−1 y. Quand f est différentiable un résultat
semblable est vrai localement, c’est le théorème d’inversion locale. Il est valable même dans
le cadre des espaces de Banach, mais on se contente d’une version en dimension finie dans la
suite de cette section.
Définition 7.1 Une application f d’un ouvert U de Rn dans un ouvert V de Rp est un
difféomorphisme de classe C k si elle admet une application réciproque de classe C k . On dit
alors que U et V sont difféomorphes.

14
Notons g l’application réciproque. Le théorème des fonctions composées appliqué à f ◦ g et
g ◦ f nous dit que si a ∈ U , les applications linéaires f 0 (a) et g 0 (f (a)) sont inverses l’une de
l’autre. En particulier, nécessairement n = p.

Proposition 7.1 Soit f un homéomorphisme d’un ouvert U sur un ouvert V de Rn . Si f


est de classe C k et si f 0 est inversible en tout point, alors f est un difféomorphisme (de classe
0
C k ) et (f −1 ) (f (x)) = (f 0 (x))−1

Pour la preuve on a besoin du lemme suivant.

Lemme 7.1 Si A est une application linéaire bijective entre espaces vectoriels normés de
dimension finie, il existe des constantes strictement positives m et M telles que

mkxk kA · xk M kxk pour tout x 6= 0.



Preuve de la proposition. Posons g = f −1 . Soit x ∈ U et y = f (x). Montrons d’abord que
g est différentiable en y. Comme g est continue,

g(y + h) = g(y) + ∆(h) où k∆(h)k = o(1).

En appliquant f aux deux membres, on obtient

y + h = y + f 0 (x) · ∆(h) + o(∆(h)),

puis
∆(h) = (f 0 (x))−1 · h + (f 0 (x))−1 · o(∆(h)).
Mais d’après le lemme, ∆(h) = O(h) donc la relation ci-dessus donne

∆(h) = (f 0 (x))−1 · h + o(h).

Donc g est différentiable en y, et g 0 (y) = (f 0 (x))−1 . Le fait que g est C k si f l’est vient alors
du théorème des fonctions composées. En effet Si de plus f est de classe C k , on a encore
(f −1 )0 (y) = (f 0 (f −1 (y)))−1 pour tout y ∈ V . Par ailleurs, pour m ∈ N, cette même formule
montre que si f −1 et f 0 sont de classe C m , (f −1 )0 l’est aussi, comme composée de f −1 , de f 0
et de l’application analytique Gln (R) → Gln (R), A 7→ A−1 ; il en résulte que f −1 est de classe
C m+1 . Ceci montre par récurrence que f −1 est de classe C k .

Théorème 7.1 (dit d’inversion locale) Soit f une application C k (k ≥ 1) d’un ouvert U
de Rn dans Rn , et a un point de U où la différentielle f 0 (a) est inversible. Alors il existe un
ouvert a ∈ V ⊂ U tel que f : V → W = f (V ) soit un difféomorphisme de classe C k .

Remarque. L’application f −1 : W → V n’est pas la réciproque de f , mais la réciproque de


la restriction de f à V . Il aurait donc été plus rigoureux de la noter (f|V )−1 . La preuve repose
sur le théorème du point fixe à paramètre qui suit :

Théorème 7.2 Soient (X, d) un espace métrique complet, Y un espace topologique et F :


X × Y → X une application continue. On suppose que F est une contraction uniforme : il
existe une constante α 1 telle que d(F (x1 , y), F (x2 , y)) ≤ αd(x1 , x2 ) pour tous x1 , x2 ∈ X

et y ∈ Y . Alors l’ équation F (x, y) = x admet une unique solution ϕ(y) pour tout y ∈ Y et
l’application y 7→ ϕ(y) est continue.

15
Preuve du théorème 7.1. En composant avec des translations à la source et au but et
éventuellement avec f 0 (a)−1 , on se ramène au cas où a = f (a) = 0 et f 0 (a) = Id. Par
continuité de la différentielle x 7→ f 0 (x), il existe une boule fermée B̄(0, r) ⊂ U dans laquelle
on a kId − f 0 (x)k ≤ 12 . Du théorème de la moyenne, on déduit que
– la restriction de f à B̄(0, r) est lipschitzienne de rapport ≤ 23 ;
– l’application continue F (x, y) = x − f (x) + y envoie B̄(0, r) × B̄(0, r/2) sur B̄(0, r) ;
– pour tous x1 , x2 ∈ B̄(0, r), on a kF (x1 , y) − F (x2 , y)k ≤ 12 kx1 − x2 k.
Ainsi, par le théorème du point fixe, pour tout y ∈ B̄(0, r/2), il existe un unique x ∈ B̄(0, r)
tel que F (x, y) = x, c’est-à-dire f (x) = y et l’application g ainsi définie est continue. Il existe
donc deux ouverts U 0 et V 0 contenant 0 tels que g ◦ f|U 0 = Id|U 0 et f ◦ g|V 0 = Id|V 0 . Il en résulte
que f est un homéomorphisme de U 0 ∩ g −1 (V 0 ) sur V 0 ∩ f −1 (U 0 ). En appliquant la proposition
7.1, on voit que f est un difféomorphisme C k .

Définition 7.2 Une application f : (Rn , a) → Rp de classe C k (k ≥ 1) est un difféomor-


phisme local en a, par définition, si et seulement si il existe un voisinage ouvert U de a, assez
petit, tel que la restriction de f à U soit un difféomorphisme sur son image. Un difféomor-
phisme local est un difféomorphisme local en tout point de son domaine de définition.

Par le théorème d’inversion local, un difféomorphisme local est une application de classe C k
(k ≥ 1) d’un ouvert U ⊂ Rn dans Rn ayant une différentielle inversible en tout point de U .

7.2 Fonctions implicites.


Théorème 7.3 (des fonctions implicites) Soient f : U (ouvert) ⊂ Rn × Rp → Rp une
application de classe C k (k ≥ 1) et (a, b) ∈ U tel que f (a, b) = 0. On suppose que la
différentielle partielle Dy f (a, b) ∈ L(Rp ) soit inversible. Alors il existe un ouvert V 3 a de
Rn , un ouvert W 3 b de Rp tels que V × W ⊂ U , et une unique application φ : V → W de
classe C k telle que

[(x, y) ∈ V × W et f (x, y) = 0] ⇐⇒ [x ∈ V et y = φ(x)] .

Quitte à réduire les voisinages V et W , on peut supposer que Dy f (x, y) est inversible pour
tout (x, y) ∈ V × W . Ceci permet de calculer la différentielle de φ. En effet, pour tout x ∈ V ,
on a f (x, φ(x)) = 0. En prenant la différentielle de cette identité, on obtient

Dx f (x, φ(x)) + Dy f (x, φ(x)) ◦ Dx φ(x) = 0,

et donc, puisque Dy f (x, φ(x)) est inversible,

Dφ(x) = − [Dy f (x, φ(x))]−1 Dx f (x, φ(x)).

Remarques. 1. L’équation f (x, y) = 0 est un système de p équations



f (x , . . . , xn , y1 , . . . , yp )
=0
 1 1



..
 .

f (x , . . . , x , y , . . . , y ) = 0

p 1 n 1 p

16
à p inconnues, les xi étant considérés comme des paramètres. Pour résoudre ce système sous
la forme 
y = φ1 (x1 , . . . , xn )
 1



..
 .

y = φp (x1 , . . . , xn )

p

au voisinage de (a, b), les hypothèses à vérifier sont f (a, b) = 0 et


∂f1 ∂f1
 
(a, b)
... (a, b)
 ∂y1 ∂yp
. .. ..

det Dy f (a, b) = det 
 .. . .  6= 0.

 
∂fp ∂fp
∂y1
(a, b) . . . ∂yp
(a, b)

2. D’un point de vue géométrique, le théorème des fonctions implicites donne un critère pour
que l’ensemble défini par l’équation f (x, y) = 0 puisse, localement, être vu comme le graphe
d’une fonction φ.
Preuve du théorème. On applique le théorème d’inversion locale à l’application Φ de classe
C k définie dans un voisinage de (a, b) ∈ Rn × Rp par Φ(x, y) = (x, f (x, y)), qui prend ses
valeurs dans un voisinage de (a, 0) ∈ Rn ×Rp . Calculons sa différentielle DΦ(a, b) ∈ L(Rn ×Rp )
en (a, b). Pour tout (δx, δy) ∈ Rn × Rp , en utilisant une notation matricielle, on a
! !
IdRn 0 δx
DΦ(a, b) · (δx, δy) = ,
Dx f (a, b) Dy f (a, b) δy

qui a une forme triangulaire et qui est inversible puisque par hypothèse Dy f (a, b) ∈ L(Rp )
l’est. On peut donc appliquer le théorème d’inversion locale : Φ réalise un difféomorphisme
de classe C k d’un voisinage de (a, b) dans un voisinage de (a, 0) et, vue la forme de Φ, le
difféomorphisme inverse Φ−1 est de la forme

Φ−1 (x, z) = (x, g(x, z)),

où g est de classe C k d’un voisinage de (a, 0) ∈ Rn ×Rp à valeurs dans un voisinage de b ∈ Rp .


On a donc
(x, y) = (x, g(x, f (x, y))) ,
pour tout (x, y) dans un voisinage de (a, b) et par conséquent, pour (x, y) dans ce voisinage,

f (x, y) = 0 ⇐⇒ y = g(x, 0).

8 Variantes géométriques.
Nous allons donner des “variantes géométriques” des théorèmes d’inversion locale, des
fonctions implicites, des submersions et immersions. Pour cela nous rappelons d’abord la
notion de forme normale d’une application linéaire.

8.1 Forme normale d’une application linéaire.


Soient E et F deux espaces vectoriels de dimension finie, respectivement n et p, et φ une
application linéaire de E dans F .

17
Définition 8.1 Une application linéaire φ̃ : Ẽ → F̃ est équivalente à φ s’il existe des isomor-
phismes P : E → Ẽ et Q : F → F̃ tels que φ̃ = Q ◦ φ ◦ P −1 . C’est-à-dire que le diagramme
suivant commute :
φ
E /F .

P Q
 
φ̃
Ẽ / F̃
Une forme normale de φ est une application linéaire Jr : Rn → Rp équivalente à φ et de la
forme ! ! !
IdRr 0 x x
Jr = : 7→
0 0 y 0
pour un certain entier r ≤ min(n, p).
Proposition 8.1 (Théorème du rang) La forme normale de φ est Jr , où r = dim Im φ
(rang de φ). En particulier, dim ker φ + rang φ = n.
Preuve. Soit (es+1 , . . . , en ) une base de ker φ (où l’on a noté s la codimension de ker φ),
que l’on complète en une base (e1 , . . . , en ) de E. La restriction de φ Vect(e1 , . . . , es ) est
injective, et réalise donc un isomorphisme sur l’image de φ. Donc r = s (c’est-à-dire que dim
ker φ + rang φ = n). Soit maintenant (f1 , . . . , fq ) la base de Im φ définie par fi = φ(ei ) pour
i = 1, . . . , r ; on la complète en une base (f1 , . . . , fp ) de F . Alors Jr est la matrice de φ dans
les bases (e1 , . . . , en ) et (f1 , . . . , fp ).
Autrement dit, toutes les matrices de rang r ont pour matrice Jr dans des bases bien choisies.
Cas particuliers. Si φ est surjective, r = p ≤ n et la forme normale de φ est la surjection
Jp = (IdRp | 0) .
Si φ est injective, r = n ≤ p et la forme normale de φ est l’injection
!
IdRn
Jn = .
0

8.2 Forme normale d’une application différentiable.


La notion d’applications équivalentes que nous introduisons ici permet de simplifier l’énoncé
de diverses variantes géométriques du théorème d’inversion locale.
Soit une application f : (Rn , a) → (Rn , b) de classe C k (k ≥ 1). Réinterprétons la conclusion
du théorème d’inversion locale de la façon suivante. Si f 0 (a) est inversible, f est un difféo-
morphisme local donc on peut voir l’application f : x 7→ y = f (x) comme un “changement
de coordonnées” ; au lieu de repérer un point x ∈ Rn par la collection de ses coordonnées
(x1 , . . . , xn ), on le repère par une autre collection de nombres (y1 , . . . , yn ). Alors, tautologi-
quement, l’application f vue dans les coordonnées y n’est autre que l’identité :
f
x ∈ (Rn , a) / y ∈ (Rn , b) .
5
f
 Id=f ◦f −1
n
y ∈ (R , b = f (a))
On a trouvé des coordonnées locales y dans lesquelles f prend la forme de l’identité, qu’on
appelle sa forme normale.

18
Définition 8.2 Une application f˜ : (Rn , ã) → (Rp , b̃) de classe C k (k ≥ 1) est équivalente
à une application f : (Rn , a) → (Rp , b) de classe C k (k ≥ 1) s’il existe des difféomorphismes
α : (Rn , a) → (Rn , ã) et β : (Rp , b) → (Rp , b̃) de classe C k (k ≥ 1) tels que f˜ = β ◦ f ◦ α−1 .
Une forme normale de f est une application linéaire Jr : (Rn , 0) → (Rp , 0) équivalente à f . 3
Autrement dit le diagramme d’applications suivant commute :
f
(Rn , a) / (Rp , b) .
α β
 

(Rn , ã) / (Rp , b̃)
Les difféomorphismes “verticaux” sont vus comme des changements de variables, tandis que
l’application qui nous intéresse est horizontale : c’est f dans les coordonnées initiales, et sa
réincarnation f˜ dans les nouvelles coordonnées.
Par exemple, f est toujours équivalente à une application f˜ : (Rn , 0) → (Rp , 0), à laquelle on
se ramène par de simples translations :
f
(Rn , a) / (Rp , b)

·−a ·−b
 f˜

(Rn , 0) / (Rp , 0)

Soit f˜(x̃) = f (x̃ + a) − b.

8.3 Théorème des fonctions implicites : version géométrique.


Théorème 8.1 Soit f : (Rn × Rp , (a, b)) → (Rp , c), (x, y) 7→ f (x, y) une application de
classe C k (k ≥ 1). Si ∂y f (a, b) ∈ L(Rp ) est un isomorphisme, f est équivalente à la projection
canonique
Jp : Rn × Rp → Rp , (u, v) 7→ v.
Preuve. L’application α : (Rn × Rp , (a, b)) → (Rn × Rp , (a, c)), (x, y) 7→ (x, z) = (x, f (x, y))
admet pour dérivée en (a, b)
!
0 IdRn 0
α (a, b) = ,
∂x f (a, b) ∂y f (a, b)
où cette dernière matrice carrée est de rang maximum n + p. Donc, d’après le théorème
d’inversion locale, α est un difféomorphisme local, qu’on peut utiliser comme changement de
coordonnées à la source de f . Donc f est équivalente à la projection canonique
Jp = f ◦ α−1 : Rn × Rp → Rp , (u, v) 7→ v.
Exercice (Théorème des fonctions implicites). Déduire de la version géométrique
du théorème des fonctions implicites, l’existence d’une unique fonction Y : (Rn , a) → (Rp , b)
telle que, localement,
f (x, y) = 0 ⇐⇒ y = Y (x).
3. Quand aucune application Jr n’est équivalente à f , on peut chercher des formes normales de f plus
compliquées, par exemple polynomiales.

19
8.4 Immersion, submersion.
Théorème 8.2 (Forme normale des immersions) Soit f : (Rn , a) → (Rp , b) une appli-
cation C k , (k ≥ 1). Si la différentielle f 0 (a) est injective (donc n ≤ p), alors une forme
normale de f est l’injection canonique
!
I
Jn = n : Rn → Rp = Rn × Rp−n , x 7→ (x, 0Rp−n );
0
on dit alors que f est une immersion en a.

Preuve. On se ramène au cas f : (Rn , 0) → (Rp , 0) comme expliqué plus haut. Soient
f1 , . . . , fp les composantes de f . L’hypothèse signifie que la matrice jacobienne de f est de
rang n. Après permutation des coordonnées dans l’espace d’arrivée si nécessaire, on peut
donc supposer que la matrice
A = (∂j fi (0))1≤i,j≤n
est inversible. On définit alors une application g : (Rn × Rp−n , (0, 0)) → (Rn × Rp−n , (0, 0))
en posant
g(x, y) = (f1 (x), . . . , fn (x), y1 + fn+1 (x), . . . , yp−n + fp (x)).
La matrice jacobienne Jg(0) de g en 0 est de la forme
!
A 0
,
∗ I

elle est inversible, donc il existe un ouvert W 3 (0, 0) de Rn × Rp−n tel que g|W soit un
difféomorphisme sur son image. Le difféomorphisme φ = (g|W )−1 vérifie φ ◦ f = Jn .
Théorème 8.3 (Forme normale des submersions) Soit f : (Rn , a) → (Rp , b) une ap-
plication C k , (k ≥ 1). Si la différentielle f 0 (a) est surjective (donc n ≥ p), alors une forme
normale de f est la surjection canonique

Jp = (Ip | 0) : Rn = Rp × Rn−p → Rp , (x, y) 7→ x;

on dit alors que f est une submersion en a.


Comme f 0 (a) est elle-même équivalente (comme application linéaire) à Jp , le théorème dit
que f est équivalente à sa partie linéaire f 0 (a), autrement dit que f est linéarisable.
Preuve. On se ramène encore une fois au cas f : (Rn , 0) → (Rp , 0) comme expliqué plus
haut. L’hypothèse signifie que la matrice jacobienne de f est de rang p. Après permutation
des coordonnées, cette fois à la source, si nécessaire, on peut supposer que la matrice

B = (∂j fi (0))1≤i,j≤p

est inversible. On définit alors une application h : (Rp × Rn−p , (0, 0)) → (Rp × Rn−p , (0, 0))
en posant
h(x, y) = (f1 (x, y), . . . , fp (x, y), y1 , . . . , yn−p ).
La matrice jacobienne Jh(0) de h en zéro est de la forme
!
B ∗
,
0 I

20
elle est donc inversible. II existe donc un ouvert V 3 (0, 0) de Rp × Rn−p tel que h|V soit un
difféomorphisme sur son image. Le difféomorphisme ψ = (h|V )−1 vérifie f ◦ ψ = Jp . En effet,
si (x, y) = h(u, v) = (f (u, v), v), on a ψ(x, y) = (u, v), donc f (ψ(x, y)) = f (u, v) = x.
Le fait que f 0 (a) soit surjective dit que, dans la matrice
 
∂1 f1 (a) . . . ∂n f1 (a)
 .. .. .. 

 . . .  
∂1 fp (a) . . . ∂n fp (a)

on peut trouver une sous-matrice carrée inversible d’ordre p. Le théorème des fonctions im-
plicites est donc un cas particulier du théorème de submersion, où la sous-matrice carrée
inversible est simplement constituée des p dernières colonnes.

Définition 8.3 Une immersion de classe C k , (k ≥ 1) d’un ouvert U de Rn dans Rp est


une application (C k ) de U dans Rp dont la différentielle en tout point est injective. Une
submersion est de même une application (C k ) de U dans Rp dont la différentielle en tout
point est surjective. Bien entendu, une application qui est a la fois une immersion et une
submersion est un difféomorphisme local.

Les applications des théorèmes des submersions et immersions viendront dans le chapitre
suivant, portant sur les sous-variétés.

8.5 Subimmersion.
Le théorème du rang constant ci-dessous englobe les théorèmes de submersion et d’im-
mersion. La complication est que, si le rang n’est pas maximal en un point, il peut ne pas
être constant.

Définition 8.4 Le rang en a d’une application f : (Rn , a) → Rp de classe C k , (k ≥ 1) est le


rang de f 0 (a) (≤ min(n, p)). L’application f est de rang maximal en a si son rang en a vaut
min(n, p). Le point a est régulier ou critique selon que le rang est maximal ou pas.

Théorème 8.4 (du rang constant) Soit f : (Rn , a) → Rp une application de classe C k ,
(k ≥ 1). Si le rang de f 0 (x) ∈ L(Rn , Rp ) est localement constant égale à r au voisinage de a,
une forme normale de f est
!
I 0
Jr = r : Rn = Rr × Rn−r → Rp = Rr × Rp−r , (x, y) 7→ (x, 0Rp−r ).
0 0

on dit alors que f est une subimmersion.

Exercice. Démontrer le théorème. Indication : Cf Exercice No 74 du livre de F. Rouvière :


Petit guide de calcul différentiel.

9 Sous-variétés.
Intuitivement, une sous-variété de dimension p de Rn est une réunion de petits morceaux
qui peuvent chacun être “redressé” de façon à former des ouverts de Rp .

21
Exemples. 1. Considérons la parabole P := {(x, x2 ); x ∈ R} et l’application ϕ : R2 → R2
donnée par ϕ(x, y) = (x, y − x2 ). Il est clair que ϕ est un C ∞ -difféomorphisme de R2 et
satisfait ϕ(P) = R × {0}. Le redressement ici est globale.
2. Considérons la sphère sphère S 2 := {(x, y, z) ∈ R3 ; x2 + y 2 + z 2 = 1}. pour z 6= 0,
l’application ϕ(x, y, z) = (x, y, x2 + y 2 + z 2 − 1) est, par le théorème d’inversion local, un
C ∞ -difféomorphisme local de R3 qui redresse la sphère aux voisinage des points ayant la
coordonnée z non nulle sur R2 × {0}. Pour y 6= 0, on prend ϕ(x, y, z) = (x, x2 + y 2 + z 2 − 1, z).
Pour x 6= 0, on prend ϕ(x, y, z) = (x2 + y 2 + z 2 − 1, y, z). Contrairement à la parabole, les
“cartes” sont ici locales : la première carte ne permet pas de conclure sur l’équateur {z = 0}.

Définition 9.1 Une partie M ⊂ Rn est une sous-variété de classe C k et de dimension p


de Rn si pour tout point x de M , il existe un voisinages ouvert U de x dans Rn et un
C k -difféomorphisme f : U → f (U ) ⊂ Rn tel que f (U ∩ M ) = f (U ) ∩ Rp × {0}.
On dit alors que M est de codimension n − p dans Rn . On peut bien entendu dans cette
définition remplacer Rp × {0} par un sous-espace affine de dimension p. Dans la pratique,
une sous-variété peut être définie localement par des équations, ou par des représentations
paramétriques. Le nombre de paramètres réels est égal à la dimension, et le nombre d’équa-
tions, égal à n − p si p est la dimension, s’appelle la codimension, comme en algèbre linéaire.
Ce qui suit est une mise en forme de cette remarque.
Théorème 9.1 Soit M une partie de Rn . Les propriétés suivantes sont équivalentes :
(i) M est une sous-variété de classe C k et de dimension p de Rn .
(ii) Pour tout point a de M , il existe un ouvert U 3 a de Rn et une submersion g : U → Rn−p
de classe C k telle que U ∩ M = g −1 (0).
(iii) Pour tout point a de M , il existe un ouvert U 3 a de Rn , un ouvert Ω 3 0 de Rp et une
application h : Ω → Rn de classe C k qui est a la fois une immersion et un homéomorphisme
de Ω sur U ∩ M .
(iv) Pour tout point a de M , il existe un ouvert U 3 a de Rn , un ouvert V de Rp contenant
(a1 , . . . , ap ) et une application G : V → Rn−p de classe C k tels que, après permutation
éventuelle des coordonnées, U ∩ M soit égal au graphe de G.
Preuve. Montrons d’abord que (i) implique (ii) et (iii). Soit f le difféomorphisme défini sur
un ouvert U 3 a de Rn , dont (i) affirme l’existence. Alors f −1 est un difféomorphisme de f (U )
sur U . Sa restriction à Rp × {0} ∩ f (U ) est une immersion de cet ouvert de Rp dans Rn , et un
homéomorphisme sur U ∩M , d’ou (iii). Pour voir que (i) implique (ii), considérons les compo-
santes (fi )1≤i≤n de f . Par hypothèse, leurs différentielles sont linéairement indépendantes en
tout point de U . Posons g = (fp+1 , . . . , fn ). On a bien une submersion de U dans Rn−p telle
que M ∩ U = g −1 (0). Supposons maintenant que (iii) soit vérifiée. D’après le théorème de la
forme normale des immersions, on peut, quitte a remplacer Ω par un sous-ouvert, trouver un
difféomorphisme φ d’un ouvert U contenant h(0) = a dans Rn tel que
φ ◦ h(x1 , . . . , xp ) = (x1 , . . . , xp , 0 . . . , 0).
Alors
φ(U ∩ M ) = φ(h(Ω)) = φ(U ) ∩ (Rp × {0}).
(ii) =⇒ (i) se montre de la même façon en utilisant cette fois le théorème de la forme
normale des submersions. Montrons maintenant l’équivalence de (ii) et (iv). Le fait que (iv)

22
implique (ii) est élémentaire : si M est localement le graphe d’une application G : V → Rn−p
comme dans l’énoncé, de composantes G1 , . . . , Gn−p , l’application

g : x 7→ (xi+p − Gi (x1 , . . . , xp ))1≤i≤n−p

est une submersion qui convient, quitte a restreindre son ouvert de définition. Inversement,
une telle submersion étant donnée, on peut supposer comme dans la preuve du théorème de
la forme normale des submersions, quitte à permuter les coordonnées, que la matrice

(∂i+p gj (a))1≤i,j≤n−p

est inversible. On applique alors le théorème d’inversion locale a la fonction

F : x 7→ (x1 , . . . , xp , g1 (x), . . . , gn−p (x)) .

Son inverse locale est aussi de la forme

F −1 : x 7→ (x1 , . . . , xp , γ1 (x), . . . , γn−p (x)) ,

ce qui fait apparaitre M localement comme le graphe de

G : (x1 , . . . , xp ) 7→ (γj (x1 , . . . , xp , 0, . . . , 0))1≤j≤n−p .

Exemple. La sphère S n = {x = (x1 , . . . , xn+1 ) ∈ Rn+1 ; f (x) = x21 + · · · + x2n+1 − 1 = 0}


est une sous-variété de classe C ∞ et de dimension n de Rn+1 . L’application f : Rn+1 → R
précédente est une submersion en tout point de S n , et sa différentiel en tout point x est
Df (x) = (2x1 , . . . , 2xn+1 ).

9.1 Paramétrisation, paramétrisation locale.


Définition 9.2 (i) Une paramétrisation C k d’une sous-variété M de dimension p de Rn est
une application φ : Ω → Rn d’un ouvert Ω ⊂ Rp dans Rn qui est à la fois une immersion C k
et un homéomorphisme de Ω sur un ouvert de M .
(ii) Une paramétrisation locale C k de M est une application φ : Ω → Rn d’un ouvert Ω ⊂ Rp
dans Rn qui induit une paramétrisation de M au voisinage de tout point de Ω.

D’après le théorème précédent, toute sous-variété peut être recouverte par des ouverts qui
sont les images de paramétrisations.

9.2 Vecteurs tangents, espace tangent.


Définition 9.3 Soient A une partie de Rp et a un point de A. On dit qu’un vecteurs v ∈ Rp
est tangent à A en a s’il existe une courbe différentiable c :] − , [→ Rp tracé sur A i.e.
c(] − , +[) ⊂ A telle que c(0) = a et c0 (0) = v.

Proposition 9.1 Les vecteurs tangents à une sous variété M de classe C k et de dimension
p de Rn en un point a ∈ M , forment un espace vectoriel de dimension p qu’on note Ta M .

23
Preuve. Soient a ∈ M et f : U → Rn un C k -difféomorphisme d’un ouvert U 3 a de Rn sur
son image tel que f (U ∩ M ) = f (U ) ∩ (Rp × {0}). On peut supposer que f (a) = 0. Si v est
un vecteur tangent à M en a, on a Df (a) · v ∈ Rp × {0}. Réciproquement si w ∈ Rp × {0},
en choisissant  assez petit pour que tw ∈ f (U ) pour tout |t| , on voit que la courbe


t 7→ f −1 (tw) définit un vecteur tangent à M en a : il s’agit de Df (0)−1 · w. Dis autrement,
l’ensemble des vecteurs tangents à M en a s’identifie à l’image du sous-espace Rp × {0} de
Rn par l’application linéaire Df (0)−1 .
D’un point de vue pratique,
(1) si M est définie localement comme l’image par un plongement h d’un ouvert Ω de Rp ,
avec h(0) = a, on a Ta M = Im(Dh(0)).
(2) si M est définie localement comme le lieu des zéros d’une submersion g : U → Rn−p , alors
Ta M = KerDg(a).
(3) si M est définie localement comme le graphe d’une application G : V → Rn−p , alors
Ta M = {(v, DG(a1 , . . . , ap ) · v); v ∈ Rp }, où a = (a1 , . . . , ap , G(a1 , . . . , ap )).

9.3 Points critiques.


Définition 9.4 Soient f : U ⊂ Rm → Rn une application de classe C k (k ≥ 1) d’un ouvert
U de Rm dans Rn et a un point de U . On dit que a est un point critique de f si le rang de f
en a qui est par définition le rang de Df (a) est strictement inférieur à n. Un point qui n’est
pas critique est dit régulier.

Si m = n, les points réguliers sont ceux où la différentielle de f est inversible, i.e., ceux où
le théorème d’inversion locale s’applique. Si n = 1, un point a est critique si et seulement si
Df (a) = 0. Voici un important exemple :

Proposition 9.2 Soit f : U ⊂ Rm → R une fonction de classe C k (k ≥ 1) définie dans d’un


ouvert U de Rm . Si f admet un maximum (resp. minimum) local en a ∈ U i.e., il existe un
ouvert a ∈ V ⊂ U tel que f (x) ≤ f (a) (resp. f (x) ≥ f (a)) pour tout x ∈ V , alors a est un
point critique de f .

Preuve. Par l’absurde, soit v ∈ Rm tel que Df (a) · v 6= 0. Si t ∈ R est suffisamment petit,
f (a + tv) − f (a) = Df (a) · v + o(tv) est non nul et de même signe que Df (a) · v. Avec le choix
d’un tel t et de −t, on obtient une contradiction.

Proposition 9.3 Soient M une sous-variété de classe C k (k ≥ 1) et de dimension p de Rm


et f : V ⊂ Rm → R une fonction de classe C k définie dans un ouvert V ⊃ M de Rm .
Si la restriction f|M de f à M admet un minimum ou maximum local en a ∈ M , alors
Ta M ⊂ KerDf (a).

Preuve. Soit U 3 a un ouvert de Rm tel qu’il existe un C k -difféomorphisme g : U → g(U )


sur un ouvert g(U ) 3 0 de Rm tel que g(U ∩ M ) = g(U ) ∩ (Rp × {0}). Alors g −1 envoie
un voisinage W de 0 de Rp sur un voisinage de a dans M , et h = f ◦ g|−1 W
a un extremum
local en 0 si et seulement si f|M en a un en a. D’après la proposition précédente, la condition
nécessaire d’extremum local, Dh(0) = 0 devient Df (a) ◦ Dg −1 (0)(Rp × {0}) = 0. Or on a
justement Dg −1 (0)(Rp × {0}) = Ta M .
Voyons comment s’exprime cette condition lorsque M est définie localement comme nappe,
comme graphe ou par une équation :

24
(1) Si M est donnée localement comme image d’une paramétrisation φ : Ω ⊂ Rp → Rm ,
puisque Ta M = ImDφ(0), on doit vérifier que Df (a) ◦ Dφ(0) = 0.
(2) Si M est donnée localement comme le graphe d’une application G : Ω ⊂ Rp → Rm−p ,
puisque Ta M = {(v, DG(x) · v); v ∈ Rp }, où a = (x, G(x)), il faut vérifier que l’on a l’égalité
∂1 f (x, G(x)) + ∂2 f (x, G(x))DG(x) = 0.
(3) si M est donnée comme le lieu des zéros d’une submersion locale ψ : (Rm , a) → Rm−p ,
puisque Ta M = KerDψ(a), on obtient le théorème des extréma liés. La condition KerDψ(a) ⊂
KerDf (a) signifie que la forme linéaire Df (a) doit s’annuler sur le noyaux de Dψ(a) ce qui
oblige Df (a) à s’écrire comme combinaison linéaire Df (a) = m−p
P
j=0 λj Dψj (a). Les λj sont les
multiplicateurs de Lagrange.

9.4 Applications différentiables entre sous variétés.


On notera f : (M, x0 ) → (N, y0 ) une application de M dans N telle que f (x0 ) = y0 . On
utilisera aussi cette notation lorsque f n’est définie que dans un voisinage de x0 .
Proposition 9.4 Soit M une sous variété de classe C k ; k ≥ 1 et de dimension p de Rn . Une
application f : (M, x0 ) → R est dite différentiable (resp. de classe C r ; 1 ≤ r ≤ k) en x0 si
l’une des trois conditions équivalentes suivantes est satisfaite :
(1) Il existe une paramétrisation locale φ : (Rp , 0) → (M, x0 ) de classe C k telle que f ◦ φ est
différentiable en 0 (resp. de classe C r ).
(2) Il existe une fonction f˜ : (Rn , x0 ) → R différentiable en x0 (resp. C r ) telle que f = f˜|M
au voisinage de x0 .
(3) Pour toute paramétrisation locale φ : (Rp , 0) → (M, x0 ) de classe C k , la composée f ◦ φ
est différentiable en 0 (resp. de classe C r ).
Preuve. Pour montrer que (1) implique (2), on utilise le théorème de la forme normale des
immersions qui donne l’existence d’un difféomorphisme local ψ : (Rn , x0 ) → (Rp ×Rn−p (0, 0))
de classe C k tel que ψ ◦ φ(x) = (x, 0). (ψ est donc un redressement local de M au voisinage
de x0 ). On étend alors f par f˜ = f ◦ ψ −1 ◦ pr1 , où pr1 est la projection sur le premier facteur
de Rp × Rn−p . Pour montrer l’équivalence entre (1) et (3) lorsque 1 ≤ r ≤ k, on utilise :
Lemme 9.1 Si φ̃ et φ : (Rp , 0) → (Rn , x0 ) sont deux paramétrisations locales C k de M en
x0 , alors l’application φ−1 ◦ φ̃ : (Rp , 0) → (Rp , 0) est un difféomorphisme local de classe C k .
Preuve du lemme. On redresse chacune de ces applications injectives (et donc la sous
variété M ) par des difféomorphismes locaux ψ et ψ̃ tels que ψ ◦ φ(x) = (x, 0) = ψ̃ ◦ φ̃(x). On
a donc (φ−1 , 0) = ψ|M et φ̃(x) = (ψ̃|Rp ×{0} )−1 (x, 0). Finalement pour x ∈ Rp proche de 0,

(φ−1 ◦ φ̃, 0)(x) = ψ|M ◦ ψ̃ −1 (x, 0) = (ψ ◦ ψ̃ −1 )(x, 0)

donc φ−1 ◦ φ̃ qui est la première composante de (ψ ◦ ψ̃ −1 )|Rp ×{0} , est un difféomorphisme local.

Définition 9.5 (1) Une application f : (M, x0 ) → Rd est dite différentiable (resp. C r ,
1 ≤ r ≤ k) si chacune de ses coordonnées l’est.
(2) Si N ⊂ Rm est une sous-variété de classe C k et de dimension q, une application f :
(M, x0 ) → N est dite différentiable (resp. C r , 1 ≤ r ≤ k) si elle l’est en tant qu’application
à valeurs dans Rm .

25
Proposition 9.5 Une application f : (M, x0 ) → (N, y0 ) est différentiable en x0 (resp C r ,
1 ≤ r ≤ k) si et seulement si φ−1 ◦ f l’est pour toute paramétrisation locale φ de N en y0 .

Preuve. En effet, si φ est une paramétrisation locale de N en y0 , il existe un redressement


ψ tel que φ−1 = ψ|N , et donc φ−1 ◦ f = ψ ◦ f . Comme ψ est un difféomorphisme, f est
différentiable en x0 (resp C r , 1 ≤ r ≤ k) si et seulement si ψ ◦ f l’est, et donc si et seulement
si φ−1 ◦ f l’est.

Proposition 9.6 (Définition) Soit f : (M, x0 ) → N une application différentiable en x0 . Il


existe alors une unique application linéaire L : Tx0 M → Rm qui est la restriction à Tx0 M de
Df˜(x0 ) pour n’importe quel prolongement différentiable f˜ : (Rn , x0 ) → Rm . Cette application
prend ses valeurs dans Tf (x0 ) N . C’est la différentielle de f en x0 , on la note Df (x0 ) ∈
L(Tx0 M, Tf (x0 ) N ). Elle est aussi caractérisée par la propriété Df (x0 ) ◦ Dφ(0) = D(f ◦ φ)(0)
pour toute paramétrisation local φ : (Rp , 0) → (M, x0 ).

Preuve. Soit f˜ un prolongement de f et φ une paramétrisation locale de M . On a alors


Df˜(x0 ) ◦ Dφ(0) = D(f˜ ◦ φ)(0) = D(f ◦ φ)(0). Comme Dφ(0) est un isomorphisme linéaire
entre Rp et Tx0 M , on obtient Df˜(x0 )|Tx M = D(f ◦ φ)(0) ◦ (Dφ(0))−1 . Cette application
0
linéaire ne dépend donc pas du prolongement f˜. Pour montrer qu’elle prend ses valeurs dans
Tf (x0 ) N , on considère une équation locale ψ : (N, f (x0 )) → (Rm−q , 0). On a alors ψ ◦ f = 0
au voisinage de x0 , donc ψ ◦ f ◦ φ = 0 au voisinage de 0, donc Dψ(f (x0 )) ◦ D(f ◦ φ)(0) = 0.
L’application linéaire D(f ◦ φ)(0) prend donc ses valeurs dans KerDψ(f (x0 )) = Tf (x0 ) N , il
en est donc de même de Df˜(x0 )|Tx M = D(f ◦ φ)(0) ◦ (Dφ(0))−1 .
0
La définition par prolongement local implique directement la règle de composition

Proposition 9.7 Si f : (M, x0 ) → (N, y0 ) et g : (N, y0 ) → (Z, z0 ) sont différentiable en x0


et y0 (resp. C r , 1 ≤ r ≤ k) alors g ◦ f est différentiable en x0 (resp C r ) et

D(g ◦ f )(x0 ) = Dg(y0 ) ◦ Df (x0 ).

Si φ : (Rp , 0) → (M, x0 ) est une paramétrisation locale de M , alors son inverse locale φ−1 :
(M, x0 ) → (Rp , 0) est C k (puisque φ−1 ◦ φ = Id est C k ). La paramétrisation φ peut donc être
vue comme un C k -difféomorphisme local de (Rp , 0) dans (M, x0 ), c’est-à-dire une application
C k admettant une inverse C k . On appellera carte de M en x0 l’inverse d’une paramétrisation,
c’est-à-dire un C k -difféomorphisme local de (M, x0 ) dans (Rp , 0).

Théorème 9.2 (Inversion locale entre sous variétés) f : (M, x0 ) → (N, y0 ) est un C k -
difféomorphisme local si et seulement si l’une des deux propriétés équivalentes suivantes est
satisfaite :
(1) La différentielle Df (x0 ) est un isomorphisme de Tx0 M sur Ty0 N .
(2) Pour toutes paramétrisations locales φM : (Rp , 0) → (M, x0 ) et φN : (Rq , 0) → (N, y0 ),
la composée φ−1 p q k
N ◦ f ◦ φM : (R , 0) → (R , 0) est un C -difféomorphisme local.

Preuve. La règle de composition implique que Df (x0 ) est un isomorphisme si et seulement


si D(φ−1 p
N ◦ f ◦ φM )(0) en est un. Au vu du théorème d’inversion locale dans R les deux
propriétés sont donc équivalentes. Il est clair aussi que la seconde propriété est satisfaite si
et seulement si f est un difféomorphisme local.
On étend naturellement les notions d’immersions et submersions aux sous variétés :

26
Définition 9.6 (Immersion) On dit qu’une application f : (M, x0 ) → (N, y0 ) est une
immersion si l’une des trois propriétés équivalentes suivantes est satisfaite :
(1) La différentielle Df (x0 ) est injective de Tx0 M dans Ty0 N .
(2) Pour toutes paramétrisations locales φM : (Rp , 0) → (M, x0 ) et φN : (Rq , 0) → (N, y0 ),
la composée φ−1 p q
N ◦ f ◦ φM : (R , 0) → (R , 0) est une immersion.
(3) Il existe des paramétrisations locales φM : (Rp , 0) → (M, x0 ) et φN : (Rq , 0) → (N, y0 )
telles que la composée φ−1 p q
N ◦ f ◦ φM : (R , 0) → (R , 0) est localement une injection
linéaire (que l’on peut mettre sous la forme x 7→ (x, 0)).

Définition 9.7 (Submersion) On dit qu’une application f : (M, x0 ) → (N, y0 ) est une
submersion si l’une des trois propriétés équivalentes suivantes est satisfaite :
(1) La différentielle Df (x0 ) est surjective de Tx0 M sur Ty0 N .
(2) Pour toutes paramétrisations locales φM : (Rp , 0) → (M, x0 ) et φN : (Rq , 0) → (N, y0 ),
la composée φ−1 p q
N ◦ f ◦ φM : (R , 0) → (R , 0) est une submersion.
(3) Il existe des paramétrisations locales φM : (Rp , 0) → (M, x0 ) et φN : (Rq , 0) → (N, y0 )
telles que la composée φ−1 p q
N ◦ f ◦ φM : (R , 0) → (R , 0) est localement une surjection
linéaire (que l’on peut mettre sous la forme (x, y) 7→ x).

27

Vous aimerez peut-être aussi