0% ont trouvé ce document utile (0 vote)
50 vues25 pages

Fdiff

Ce document est un cours sur le calcul différentiel, axé sur les fonctions différentiables, comprenant des définitions, des théorèmes et des applications. Il aborde des concepts tels que la différentiabilité, les fonctions composées, le théorème d'inversion locale, et les théorèmes des fonctions implicites. Le contenu est structuré en chapitres avec des exemples et des propositions pour illustrer les concepts mathématiques discutés.

Transféré par

chedracdandjinou
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
50 vues25 pages

Fdiff

Ce document est un cours sur le calcul différentiel, axé sur les fonctions différentiables, comprenant des définitions, des théorèmes et des applications. Il aborde des concepts tels que la différentiabilité, les fonctions composées, le théorème d'inversion locale, et les théorèmes des fonctions implicites. Le contenu est structuré en chapitres avec des exemples et des propositions pour illustrer les concepts mathématiques discutés.

Transféré par

chedracdandjinou
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Faculté des sciences et techniques

Département de mathématiques

Licence de Mathématiques
Filière Mathématiques classiques

Calcul différentiel

II. Fonctions différentiables

Laurent Guillopé

[Link]/~guillope/LC4

1
TABLE DES MATIÈRES

1. Applications différentiables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Différentiabilité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Fonctions composées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Fonctions de classe C 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4. Accroissements finis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2. Le théorème d’inversion locale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1. L’énoncé du théorème. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Le théorème du point fixe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3. La preuve du théorème. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.4. Changement de variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3. Le théorème des fonctions implicites. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.1. Le théorème et sa preuve. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.2. Racines d’équations polynomiales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4. Courbes et surfaces régulières. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.1. Équations régulières. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.2. Courbes régulières. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4.3. Surfaces régulières. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
5. Applications C k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.1. La version C k des théorèmes classiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.2. Théorème de Schwarz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.3. Formules de Taylor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
6. Points critiques et extrema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
6.1. Extrema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
6.2. Extrema liés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
6.3. Appendice : rappels sur les formes quadratiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
CHAPITRE 1

APPLICATIONS DIFFÉRENTIABLES

On note par o(h) toute fonction définie pour h dans un voisinage de 0 dans Rn et à
valeurs dans Rp , telle que
lim o(h)/khk = 0.
h→0

Si h est dans R, il suffit de considérer la limite de o(h)/h lorsque h → 0.


De manière analogue on notera ε(h) toute quantité telle que limh→0 ε(h) = 0. Ainsi, on
remplacera parfois un o(h) par khkε(h).
Vu que toutes les normes de Rk sont équivalentes, ces définitions sont indépendantes des
normes choisies dans Rn et Rp .

1.1. Différentiabilité
Une fonction d’une variable réelle f : (x0 − r, x0 + r) → R est dite dérivable en x0 , avec
pour dérivée le nombre réel f˙(x0 ) si
f (x0 + h) = f (x0 ) + f˙(x0 )h + o(h).
La dérivabilité est équivalente à l’approximation locale par une fonction affine, autrement
dit à l’existence d’une développement limité à l’ordre 1.
L’existence d’un développement limité à l’ordre 2
f (x0 + h) = f (x0 ) + Ah + Bh2 + o(h2 )
au voisinage d’un point x0 = 0 ne dit pas nécessairement l’existence d’une dérivée seconde
four f , comme la fonction x → x3 sin(1/x) = o(x2 ) pour x0 = 0 le confirme.
Pour une fonction de deux variables (on généralisera aisément pour f de n variables,
avec n ≥ 3) f : m = (x, y) ∈ B(m0 , r) → f (m) = f (x, y) ∈ R, les dérivées directionnelles
s’obtiennent en considérant les restrictions de f à des droites passant par m0 : les dérivées
partielles ∂f
∂x
(m0 ) et ∂f
∂y
(m0 ) (notées parfois ∂x f (m0 ), ∂y f (m0 )) sont, si elles existent, les
dérivées des fonctions t → f (x0 + t, y0 ) et s → f (x0 , y0 + s) en t = 0 et s = 0 resp. De
manière plus générale, on a la notion de dérivée directionnelle.

Définition 1.1. — Soit f : B(m0 , r) ⊂ Rn → R. Pour h vecteur non nul de Rn , la dérivée


directionnelle Dh f (m0 ) est, si elle existe, la dérivée en t = 0 de la fonction définie sur
(−r/khk, r/khk) qui à t associe f (m0 + th).
∂f
On a donc f (m0 + th) = f (m0 ) + Dh f (m0 )t + o(t) et on retrouve ∂x
(m0 ) = De1 f (m0 ) :
par ailleurs, on a D2e1 f (m0 ) = 2 ∂f
∂x
(m0 ).

Exemples 1.1. —
1. Si f (x, y) = sin(x + y), on a D(u,v) f (0, 0) = u + v .
2. Si f (x, y) = r sin 2θ = 2xy(x + y ) où on a utilisé les coordonnées polaires (x, y) =
(r cos θ, r sin θ), on a f (t(u, v)) = |t|f (u, v) pour t ∈ R. Ainsi, la restriction de f ,
nulle en t = 0, à une droite R(u, v) n’est pas approchée par une expression linéaire au
voisinage de t = 0 : les dérivées directionnelles D(u,v) f (0, 0) n’existent pas.
Définition 1.2. — Soit f : B(m0 , r) ⊂ Rn → R. La fonction f est dite différentiable en
m0 s’il existe une application linéaire L : Rn → R telle que
(1) f (m0 + h) = f (m0 ) + L(h) + o(h).
L’application linéaire L est appelée différentielle de f en m0 et notée Df (m0 ).
4 La différentielle est notée parfois f 0 (m0 ) (voire f˙(m0 )) : on l’évitera dans un premier
temps, pour bien distinguer dérivée (d’une fonction d’une variable réelle) et différentielle.
Si f est à valeurs numériques, on note souvent sa différentielle df suivant Leibniz, qui écrit
df = fx0 dx + fy0 dy + fz0 dz ; il faut y interpréter dx comme la différentielle de la fonction
coordonnée x. 5

Proposition 1.1. — Soit f une fonction différentiable en m0 .


– L’application L de la définition 1.2 est unique.
– La fonction f est continue en m0 .
– La fonction f admet des dérivées directionnelles suivant toute direction en m0 et
Dh f (m0 ) = Df (m0 )(h). En particulier, f admet des dérivées partielles.
Démonstration. — Soient L1 et L2 deux formes linéaires vérifiant (1). Alors pour, h assez
petit,
f (x + h) − f (x) = L1 (h) + o(h) = L2 (h) + o(h)
ainsi (L1 − L2 )(h/khk) = o(h)/khk et donc la nullité de
kL1 − L2 k = sup k(L1 − L2 )(v)k = sup k(L1 − L2 )(h/khk)k.
kvk=1 khk≤α

La continuité de f en m0 est équivalente à f (m0 +h) = f (m0 )+ε(h) : si f est différentiable,


c’est bien le cas, vu que f (m0 + h) = f (m0 ) + [Df (m0 )(h) + o(h)].
Enfin si f est différentiable, pour h fixé non nul, on a
f (m0 + th) = f (m0 ) + Df (m0 )(th) + o(th) = f (m0 ) + Df (m0 )(h)t + o(t),
ce qui indique la dérivabilité de f dans la direction h ∈ R, avec Dh f (m0 ) = Df (m0 )(h).
Exemple 1.2. — Il se peut que f admette des dérivées directionnelles sans être
différentiable. Ainsi de f (m) = r sin 3θ = 3y − 4y 3 (x2 + y 2 )−1 en m0 = (0, 0) : les
dérivées directionnelles sont D(cos θ,sin θ) f (m0 ) = sin 3θ = 3 sin θ − 2 sin3 θ , non linéaire en
sin θ .
Pour une fonction f : B(m0 , r) ⊂ Rn → Rp , on définit de manière analogue la
différentiabilité de f par l’existence d’une application linéaire L : Rn → Rp telles que
f (m0 + h) = f (m0 ) + L(h) + o(h)
4 Si f = (f1 , . . . , fp ), la différentiabilité de f en m0 est équivalente à celle des applications
fi , i = 1, . . . , p (exercice !). 5

Exemples 1.3. —
1. Soit f : I ⊂ R → Rn différentiable en t0 . L’application linéaire Df (t0 ) : R → Rn est
habituellement identifiée à sa valeur sur le vecteur générateur h = 1, autrement dit la
dérivée de la fonction f en t0 . On a
f (t0 + h) = f (t0 ) + Df (t0 )h + o(h).
2. Soit A : R → R linéaire et B ∈ R . Alors l’application f : x ∈ R → Ax + B ∈ R
est différentiable en tout x ∈ Rn , avec Df (x) = A. En effet,
f (x + h) = A(x + h) + B = Ax + B + Ah = f (x) + Ah.

Définition 1.3. — Soit f = (f1 , . . . , fp ) : B(m0 , r) ⊂ Rn → Rp une application


différentiable en m0 . Sa matrice jacobienne est la matrice
 ∂f1 ∂f1

∂x1
(m0 ) . . . ∂xn
(m0 )
Jac(f )(m0 ) =  .. ..
.
 
. .
∂fp ∂fp
∂x1
(m0 ) ... ∂xn
(m0 )
C’est la représentation matricielle de la différentielle Df (m0 ) dans les bases canoniques de
Rn et Rp .

Exemple 1.4. — Les « coordonnées polaires » (r, θ) ∈ R+∗ × R → (r cos θ, r sin θ) ont pour
matrice jacobienne
 
cos θ −r sin θ
.
sin θ r cos θ

Lemme 1.1. — L’ensemble D(m0 ) des fonctions numériques f définies sur B(m0 , rf )
(rf > 0 dépendant de f ) et différentiables en m0 est un espace vectoriel, l’application
différentielle f ∈ D(m0 ) → Df (m0 ) ∈ L(Rn , R) étant linéaire, i. e.
D(α1 f1 + α2 f2 )(m0 ) = α1 Df1 (m0 ) + α2 Df2 (m0 ),
avec stabilité par le produit
D(f1 f2 )(m0 ) = f1 (m0 )Df2 (m0 ) + f2 (m0 )Df1 (m0 ).

Démonstration. — Que D(m0 ) soit un espace vectoriel et l’application f → Df (m0 ) est


linéaire résulte de l’écriture
(αf + βg)(m0 + h) = (αf + βg)(m0 ) + (αDf (m0 ) + βDg(m0 ))(h) + o(h), khk < inf(rf , rg )
obtenue par combinaison linéaire de
f (m0 + h) = f (m0 ) + Df (m0 )(h) + o(h), khk < rf ,
g(m0 + h) = g(m0 ) + Dg(m0 )(h) + o(h), khk < rg .
Pour le produit, on a
(f1 f2 )(m0 + h) = (f1 (m0 ) + Df1 (m0 )(h) + khkε1 (h))(f2 (m0 ) + Df2 (m0 )(h) + khkε2 (h))
= f1 (m0 )f2 (m0 ) + [f2 (m0 )Df1 (m0 )(h) + f1 (m0 )Df2 (m0 )(h)]
+ khk[ε1 (h)(f2 (m0 ) + Df2 (m0 )(h) + khkε2 (h)) + ε2 (h)(f1 (m0 ) + Df1 (m0 )(h))]
où le dernier terme est un o(h).
La fonction Inv : A ∈ GL(n, R) = {A ∈ Mn (R), A inversible} → A−1 est différentiable de
différentielle D Inv(A)(h) = −A−1 hA−1 , h ∈ Mn (R). En effet
(A + h)−1 = A−1 (1 + hA−1 )−1 = A−1 + A−1 ((1 + hA−1 )−1 − 1)
= A−1 − A−1 (1 + hA−1 )−1 hA−1 = A−1 − A−1 hA−1 + A−1 ((1 + hA−1 )−1 − 1)hA−1
= A−1 − A−1 hA−1 + A−1 (1 + hA−1 )−1 hA−1 hA−1
P∞
où le dernier terme est borné par khk2 vu que le facteur (1 + hA−1 )−1 = k=0 (−hA)
k
est
borné au voisinage de h = 0.
1.2. Fonctions composées
Théorème 1.1. — Soit U un ouvert de Rn , V un ouvert de Rp , f : U → Rp et g : V →
Rq . On suppose f (U ) ⊂ V , f différentiable en m0 ∈ U et g différentiable en f (m0 ). Alors
g ◦ f est différentiable en m0 et
D(g ◦ f )(m0 ) = Dg(f (m0 )) ◦ Df (m0 ),
Jac(g ◦ f )(m0 ) = Jac(g)(f (m0 )) Jac(f )(m0 ).

Démonstration. — On compose les développements limités


f (m0 + h) = f (m0 ) + Df (m0 )(h) + o(h),
g(f (m0 ) + k) = g(f (m0 )) + Dg(f (m0 ))(k) + o(k),
de telle sorte que
(g ◦ f )(m0 + h) = g(f (m0 + h)) = g(f (m0 ) + Df (m0 )(h) + o(h))
= g(f (m0 )) + Dg(f (m0 ))(Df (m0 )(h) + o(h)) + o(Df (m0 )(h) + o(h))
= (g ◦ f )(m0 )) + (Dg(f (m0 )) ◦ Df (m0 ))(h)
+ (Dg(f (m0 ))(o(h)) + o(Df (m0 )(h) + o(h)).
Le terme Dg(f (m0 ))(o(h)) = Dg(f (m0 ))(ε(h))khk est un o(h), alors que le dernier terme,
noté δ(h) est majoré en norme par
kδ(h)k ≤ kDf (m0 )(h) + o(h)k kε(Df (m0 )(h) + o(h))k
≤ [kDf (m0 )k + kε(h)k] khk kε(Df (m0 )(h) + o(h))k
et est donc un o(h).

Exemples 1.5. —
1. Soit f : (r, θ) ∈ R+∗ × R → (x, y) = (r cos θ, r sin θ) ∈ R2 et g : R2 → R différentiables.
Alors G = g ◦ f l’est aussi et, avec m0 = (r0 cos θ0 , r0 sin θ0 )
Jac(G)(r0 , θ0 ) = Jac(g)(m0 ) Jac(f )(r0 , θ0 )
  
∂g ∂g cos θ0 −r0 sin θ0
= (m0 ) (m0 )
∂x ∂y sin θ0 r0 cos θ0 )
 
∂g ∂g ∂g ∂g
= cos θ0 (m0 ) + sin θ0 (m0 ) −r0 sin θ0 (m0 ) + r0 cos θ0 (m0 )
∂x ∂y ∂x ∂y
2. Soit h ∈ Rn et f : B(m0 , r) → R. La dérivée directionnelle Dh f (m0 ) apparaı̂t comme
la dérivée de l’application composée F = f ◦ γ où γ : t ∈ R → m0 + th ∈ Rn . On a en
effet
DF (t0 ) = Df (m0 + t0 h) ◦ Dγ(t0 ).
La dérivée Dγ(t0 ) s’identifie au vecteur h.
3. Si f et g sont différentiables en m0 et f (m0 ) resp. avec g ◦ f = Id, alors Dg(f (m0 )) ◦
Df (m0 ) = Id. Ainsi, si les dimensions des espaces d’arrivée et de départ de f et g sont
égales, Df (m0 ) et Dg(f (m0 )) sont inversibles.

1.3. Fonctions de classe C 1


Définition 1.4. — Soit U un ouvert de Rn et f : U → Rp . Si f est différentiable en tout
point m ∈ U et l’application Df : m ∈ U → Df (m) ∈ L(Rn , Rp ) est continue, l’application
f est dite de classe C 1 sur U .
Théorème 1.2. — Soit U un ouvert de R et f : U → R . Si les dérivées partielles
∂x1 f, . . . , ∂xn f existent en tout point de U et définissent des fonctions continues sur U ,
alors f est de classe C 1 .

Démonstration. — Pour h = (h1 , . . . , hn ), on écrit


f (m0 + h) − f (m0 ) = [f (m0 + h) − f (m0 + (h1 , . . . , hn−1 , 0))] + . . .
+ [f (m0 + (h1 , . . . , hi , hi+1 , . . . ) − f (m0 + (h1 , . . . , hi , 0, . . . ))]
+ . . . + [f (m0 + (h1 , 0, . . . , 0)) − f (m0 )]
Dans chaque terme, on applique l’inégalité des accroissements finis pour des fonctions d’une
variable à chaque fonction coordonnée : il existe θij (h) ∈ [0, 1]
fi (m0 + (h1 , . . . , hj , 0, . . . , 0)) − fi (m0 + (h1 , . . . , hj−1 , 0, . . . , 0))
= ∂xj fi (m0 + (h1 , . . . , hj−1 , θij (h)hj , 0, . . . , 0))hj
= [∂xj fi (m0 ) + εij (h)]hj
où εij (h) → 0 lorsque h → 0. On a donc
f (m0 + (h1 , . . . , hj , 0, . . . , 0)) − f (m0 + (h1 , . . . , hj−1 , 0, . . . , 0)) = [∂xj f (m0 ) + εj (h)]hj
et par suite
n
X
f (m0 + h) = f (m0 ) + Jac(f )(m0 )h + εj (h)hj ,
j=1

où la somme est du type o(h) vu que


n
" n
#
X X n
εj (h)hj ≤ kεj (h)k sup |hj |.
j=1
j=1 j=1

La jacobienne Jac(f ), dont les coordonnées sont les dérivées partielles de f , est continue ; il
en est de même pour la dérivée m ∈ U → Df (m) ∈ L(Rn , Rp ).

Exemple 1.6. — L’expression de l’inverse d’une matrice A ∈ GL(n, R)) en terme de


déterminants
A−1 = (dét A)−1 Comat A
où Comat A est la comatrice de A, matrice transposée des déterminants des cofacteurs
de A, indique que les fonctions coordonnées a1ij , 1 ≤ i, j ≤ n, de A−1 sont des fractions
rationnelles des coordonnées (ak` ), 1 ≤ k, ` ≤ n, admettant des dérivées partielles continues
sur {dét[ak` ] 6= 0} : on retrouve ainsi la différentiabilité de l’application Inv de l’exemple
1.3.

Une fonction continue est dite de classe C 0 . La définition des fonctions de classe C 1 est
complétée par celle des fonctions de classe C k de manière récursive.

Définition 1.5. — Pour k ≥ 1, une fonction est de dite de classe C k si elle est
différentiable et sa différentielle Df est de classe C k−1 . Elle est dite de classe C ∞ si elle est
C k pour tout entier k .

Les fonctions de classe C k seront étudiées au chapitre 5 : on verra notamment qu’une


fonction est de classe C k si elle admet des dérivées partielles continues jusqu’à l’ordre k .

Exemple 1.7. — Les fonctions polynômes sont de classe C ∞ .


La fonction exponentielle sur C est de classe C ∞ .
1.4. Accroissements finis
La formule des accroissements finis pour une fonction numérique dérivable sur [a, b] donne
l’existence d’un c ∈ [a, b] tel que f (b) − f (a) = f 0 (c)(b − a). Pour une fonction à valeurs
vectorielles, il n’y a pas de telle formule des accroissements finis : ainsi de la fonction f :
t ∈ R → (cos t, sin t) ∈ R2 , dont la dérivée Df (t) = (− sin t, cos t) ne s’annule jamais, alors
que f (2π) − f (0) = 0 ne peut être de la forme Df (θ)2π . Néanmoins, il existe une égalité
des accroissements finis pour les fonctions différentiables sur des ouverts de Rn et à valeurs
vectorielles, source de nombreuses applications.
Théorème 1.3 (Inégalité des accroissements finis). — Soit U un ouvert de Rn , f :
U → Rp de classe C 1 et m0 , m1 deux points de U tel que le segment [m0 , m1 ] = {m0 +
t(m1 − m0 ), t ∈ [0, 1]} soit inclus dans U . Alors
!
kf (m1 ) − f (m0 )k ≤ sup kDf (m)k km1 − m0 k.
m∈[m0 ,m1 ]

Première démonstration. — La fonction g : t ∈ [0, 1] → f (m0 + t(m1 − m0 )) est dérivable,


de dérivée ġ(t) = Df (m0 + t(m1 − m0 ))(m1 − m0 ) continue. On a(1)
Z 1
(2) g(1) − g(0) = ġ(s)ds
0
et par suite
Z 1 Z 1 Z 1
kg(1) − g(0)k = ġ(s)ds ≤ kġ(s)kds ≤ kDf (m0 + s(m1 − m0 ))k km1 − m0 kds,
0 0 0
ce qui donne l’inégalité annoncée.
Seconde démonstration. — Soit x la fonction définie sur [0, 1] par
x(t) = f (m0 + t(m1 − m0 )) − f (m0 ), t ∈ [0, 1].
Elle vérifie l’équation différentielle ẋ(t) = Df (m0 + t(m1 − m0 ))(m1 − m0 ), avec membre
de droite majorée par la constante M donnée par le majorant de l’inégalité du théorème.
L’inégalité kx(1)k ≤ kx(0)k+M résulte de la remarque suivant le corollaire I.4.2 de l’inégalité
de Grönwall, c’est l’inégalité annoncée.
Troisième démonstration. — Soit g la fonction définie par g(t) = f (m0 + t(m1 − m0 )) pour
t ∈ [0, 1], qui est dérivable de dérivée ġ(t) = Df (m0 + t(m1 − m0 ))(m1 − m0 ). Considérons
l’inégalité
!
(3) kg(t) − g(0)k ≤ sup kġ(s)k + ε t.
s∈[0,t]

et, pour ε > 0, la partie Aε définie par


Aε = {T ∈ [0, 1] : l’inégalité (3) est vérifiée pour t dans [0, T ]}.

(1)
Pour montrer qu’une fonction d’une variable, à valeurs numériques et continûment dérivable, est l’intégrale
de sa dérivée, on utilise l’identité des dérivées des deux membres de cette égalité et l’identité des accrois-
sements finis f (b) − f (a) = (b − a)f 0 (c) en une variable, prouvée comme corollaire du théorème de Rolle.
L’identité intégrale (2) pour une fonction d’une variable à valeurs vectorielles dans un espace de dimension
finie en résulte, et donc par suite l’inégalité des accroissements finis : en dimension 1 et pour une fonc-
tion à valeurs numériques, on évitera l’argument de calcul intégral pour utiliser directement l’égalité des
accroissements finis ; pour des fonctions à valeurs vectorielles, on vérifie bien qu’on démontre l’inégalité des
accroissements finis sans l’utiliser subrepticement (même si on peut utiliser l’inégalité des accroissements
finis pour montrer qu’une fonction est l’intégrale de sa dérivée). Les démonstrations suivantes de l’inégalité
des accroissements finis n’utilisent pas cette égalité des accroissements finis en dimension 1 .
La partie Aε contient T = 0 et est un intervalle fermé : les inégalités avec des fonctions
continues sont stables par passage à la limite. Soit Tε la borne supérieure de Aε et supposons
Tε < 1. La fonction f étant différentiable en Tε , il existe η > 0 tel que Tε + η < 1 et
kg(Tε + h) − g(Tε ) − ġ(Tε )hk ≤ εh, h ∈ [0, η].
Alors, pour h ∈ [0, η],
kg(Tε + h) − g(0)k ≤ kg(Tε + h) − g(Tε ) − ġ(Tε )hk + kġ(Tε )kh + kg(Tε ) − g(0)k
" #
≤ εh + kġ(Tε )kh + sup kġ(s)k + ε Tε
s∈[0,Tε ]
" #
≤ sup kġ(s)k + ε (Tε + h),
s∈[0,Tε +h]

inégalité qui exprime l’appartenance de Tε + η à Aε : l’hypothèse Tε < 1 est donc erronée.


Ainsi, faisant tendre ε vers 0 dans (3) avec t = 1, on obtient l’inégalité du théorème, en
remarquant la majoration |ġ(t)| ≤ kDf (m0 + t(m1 − m0 ))k km1 − m0 k.
Corollaire 1.1. — Soit U ⊂ Rn un ouvert connexe. Si f : U → Rp différentiable a une
différentielle nulle, la fonction f est constante.
Démonstration. — Soit m0 ∈ U et V0 = {m ∈ U : f (m) = f (m0 )}. Cette partie V0 de U
est non vide, fermée, comme image réciproque d’un fermé par une fonction continue. Elle
est ouverte, puisque si m ∈ V0 , il existe une boule B(m, r) incluse dans U sur laquelle f
est constante : pour tout point de m e de B(m, r), le segment [m, m]
e est inclus dans la boule
e = f (m), ainsi B(m0 , r) ⊂ U .
B(m, r) et d’après l’inégalité des accroissements finis f (m)
Par connexité de U , V0 = U et la fonction est constante sur U .
Corollaire 1.2. — Si f : U → Rp est de classe C 1 , la fonction f est localement lipschit-
zienne.
Démonstration. — Soit m ∈ U et r > 0 telle que la boule fermée B(m, r) soit incluse dans
U . Alors si Mm,r = supx∈B(m,r) kDf (x)k, d’après le théorème des accroissements finis, on a
kf (x) − f (y)k ≤ 2Mm,r r, x, y ∈ B(m, r),
ce qui est le caractère localement lipschitzien de f .

CHAPITRE 2

LE THÉORÈME D’INVERSION LOCALE

2.1. L’énoncé du théorème


Pour les fonctions d’une variable réelle, les homéomorphismes sont caractérisées comme
les applications continues monotones. D’autre part, un homéomorphisme f : U → V avec
f, f −1 différentiables, a une différentielle inversible.
Exemples 2.1. —
1. La fonction tg : (−π/2, π/2) → R est une application bijective différentiable, de dérivée
1 + tg2 et d’application inverse arctg dérivable : arctg0 (y) = (1 + y 2 )−1 .
2. La fonction f (t) = t3 est une bijection de R sur lui même, de dérivée f˙(t) = 3t2
inversible si et seulement si t non nul. La bijection réciproque t → t1/3 n’est pas
différentiable en t = 0.
3. La fonction f (t) = t + t2 sin(1/t) est dérivable sur R : si t est non nul, sa dérivée est
f˙(t) = 1 − cos(1/t) + 2t sin(1/t) et en t = 0 elle vaut 1. La dérivée f˙ n’est pas continue
en t = 0 et, pour k entier non nul, la dérivée
f˙(1/(2kπ + u)) = 1 − cos u + 2(2kπ + u)−1 sin u ∼k→+∞,u→0 (kπ)−1 u
change de signe au voisinage de u = 0 : la fonction f n’est pas monotone au voisinage
de t = 0.
4. La fonction exponentielle de C est différentiable,
ez+h = ez eh = ez (1 + h + o(h))
avec pour différentielle D exp(z) l’application linéaire induite par la multiplication par
ez : bien que la différentielle D exp(z) soit inversible pour tout z , l’application exp :
C → C n’est pas injective (e2iπ = e0 ).
Définition 2.1. — f : U → V est un difféomorphisme de classe C 1 si f est une bijection
de U sur V , f est de classe C 1 , de différentielle Df (m) inversible pour tout m ∈ U et il
en est de même pour f −1 : V → U .
Théorème 2.1. — Soit U un ouvert de Rn , f : U → Rn une fonction de classe C 1 ,
m0 ∈ U tel que Df (m0 ) soit inversible. Alors il existe un voisinage ouvert U 0 de m0 dans
U , V 0 de f (m0 ) dans Rn tels que f|U 0 soit un difféomorphisme de classe C 1 de U 0 sur V 0 .
 
1+t t
Exemple 2.2. — Soit f : (s, t) → (s + st, t + st). Sa jacobienne est , inver-
s 1+s
sible au voisinage de (s, t) = (0, 0).

2.2. Le théorème du point fixe


On se place dans un espace métrique (X, d).
Définition 2.2. — Une contraction de X est une application T : X → X telle qu’il existe
k ∈ [0, 1) avec
d(T x, T y) ≤ kd(x, y), x, y ∈ X.
T est dit k -contractante.
n
Exemple 2.3. — Une application affine x → Ax + b est une contraction de  (R , k k)

1/2 ε
dès que kAk < 1. Le choix de la norme k k importe. Par exemple, Aε =
0 1/3
est de norme sup(1/2 + ε, 1/3) pour la norme matricielle dérivée de la norme k k∞ sur
Rn et sup(1/2, ε + 1/3) pour celle dérivée de k k1 : si ε = 1/2, A n’est pas contractante
relativement à la première, mais l’est pour la seconde.
Les contractions sont très utiles à travers le théorème du point fixe dit de Picard.
Théorème 2.2 (Picard). — Si (X, d) est complet, toute contraction T de X a un unique
point fixe.
Le théorème de Picard 2.2 a une version avec paramètre.
Théorème 2.3. — Soit X, Y des espaces métriques, avec X complet et T : X × Y → X
continue, avec les applications partielles Ty : x ∈ X → T (x, y) ∈ X k -contractantes de
même constante k ∈ [0, 1)1 pour tout y ∈ Y . L’application Ty a un point fixe unique ay et
l’application y ∈ Y → ay ∈ X est continue.
Démonstration. — Si Ty a un point fixe, il est unique : sinon, avec deux points fixes x1 , x2
on aurait
d(x1 , x2 ) = d(Ty (x1 ), Ty (x2 )) ≤ kd(x1 , x2 ) < d(x1 , x2 )
ce qui est absurde.
Soit x0 ∈ X . La suite (xn (y))n≥0 définie par x0 (y) = x0 et xn (y) = Ty (xn−1 (y)) si n ≥ 1
est de Cauchy :
d(xp+` (y), xp (y)) ≤ d(xp+` (y), xp+`−1 (y)) + . . . + d(xp+1 (y), xp (y))
≤ d(Typ+`−1 (x1 (y)), Typ+`−1 (x0 (y))) + . . . + d(Typ (x1 (y)), Typ (x0 (y)))
k p−1
≤ (k p+`−1 + . . . + k p−1 )d(x1 (y), x0 (y)) ≤ d(x1 (y), x0 (y))
1−k
Sa limite x∞ (y) est un point fixe de Ty :
x∞ (y) = lim Typ (x) = Ty (lim Typ−1 (x)) = Ty (x∞ (y))
c’est l’unique point fixe, noté a(y) et indépendant du point x0 , de Ty .
On a alors
d(a(y), a(y 0 )) ≤ d(a(y), Ty0 (a(y)) + d(Ty0 (a(y)), a(y 0 ))
≤ d(a(y), Ty0 (a(y)) + d(Ty0 (a(y)), Ty0 (a(y 0 )))
≤ d(a(y), Ty0 (a(y))) + kd(a(y), a(y 0 ))
d’où
(1 − k)d(a(y), a(y 0 )) ≤ d(a(y), T (a(y), y 0 ))
et la continuité de l’application y → a(y).
4 La preuve d’existence du point fixe avec paramètre est celle du théorème de Picard :
la convergence uniforme de la suite (xn (y))n≥0 , qui apparaı̂t dans la démonstration de la
convergence, aurait pu être invoquée pour la continuité du point fixe. 5

2.3. La preuve du théorème


Par composition par des translations τv (τv (m) = m + v, m ∈ Rn ) et d’une application
linéaire, on remplace f par l’application fe = Df (0)−1 ◦ τ−f (m0 ) ◦ f ◦ τm0 qui permet de se
ramener au cas où m0 = 0, f (m0 ) = 0 et Df (m0 ) = Id, ce qui sera supposé désormais.
L’équation f (x) = y est remplacée par la recherche du point fixe pour Ty définie par
Ty (x) = y − f (x) + x, soit Ty = y − ϕ avec ϕ(x) = f (x) − x, x ∈ U .
Vu sur Dϕ(0) = 0 et ϕ est C 1 , il est possible de choisir r > 0 tel que B(0, r) ⊂ U et
kDϕ(x)k ≤ 1/2 pour x ∈ B(0, r). Par l’inégalité des accroissements finis, ϕ, et par suite
Ty , est 1/2-contractante sur B(0, r). Par ailleurs, en prenant y avec kyk < r/2, on a
kTy (x)k = ky − ϕ(x)k ≤ kyk + kϕ(x)k < r/2 + r/2 = r
si kxk ≤ r , i. e. Ty laisse invariante la boule fermée B(0, r), qui est un espace complet.
D’après le théorème du point fixe avec paramètre, Ty admet un point fixe unique, noté g(y),
dans B(0, r) et l’application y ∈ B(0, r/2) → g(y) ∈ B(0, r) est continue. On pose alors
V 0 = B(0, r/2), U 0 = {x, kf (x)k < r/2 et kxk < r} = f −1 (V 0 ) ∩ B(0, r).
L’application f : U 0 → V 0 , d’inverse g : V 0 → U 0 continue, est un homéomorphisme.
Pour montrer que g est dérivable sur V , soit y ∈ V , x = g(y), k tel que y + k ∈ V et
h = g(y + k) − g(y). Tout d’abord, la différentielle Df (x) = 1 + Dϕ(x) est inversible, avec
inverse donné par la série convergente ∞ k
P
k=0 (−Dϕ(x)) puisque kDϕ(x)k ≤ 1/2. Alors, vu
x + h = g(y + k), soit
k = f (x + h) − f (x) = f (x + h) − y = Df (x)(h) + o(h),
on a
h = Df (x)−1 (k) + Df (x)−1 (o(h)) = Df (x)−1 (k) + o(h),
et donc, pour h assez petit
khk ≤ kDf (x)−1 k kkk + o(khk) ≤ kDf (x)−1 k kkk + khk/2
et par suite khk ≤ 2kDf (x)−1 k kkk. Si k → 0, un o(h) est ainsi un o(k) et
g(y + k) − g(y) = h = (Df (x))−1 (k) + o(k)
c’est la différentiabilité de g en y , avec comme différentielle (Df (x))−1 = (Df (g(y)))−1 .
Pour conclure, remarquons que la différentielle Dg(y) = [Df (g(y))]−1 est la composée
d’applications continues et est donc est continue.

2.4. Changement de variables


L’exemple le plus simple de difféomorphisme est donné par une matrice inversible A.
L’interprétation géométrique d’une matrice A est double : soit c’est une transformation
bijective de Rn , soit elle permet un changement de coordonnées de l’espace Rn en appa-
raissant comme la matrice d’un changement de bases. Pour préciser ce deuxième point de
vue, soit b = (b1 , . . . , bn ) une base et X = (x1 , . . . , xn ) les coordonnées de m ∈ Rn ; en
fait si (x1 , . . . , xn ) note la base de formes linéaires sur Rn duale de la base b (i. e. telle
xi (bj ) = δij ), on a la i-ème coordonnée de m donnée par l’évaluation de xi sur m. Si
c = (c1 , . . . , cn ) est la base image de b par P , i. e. ci = P bi , le vecteur des coordonnées
Y = (yi ) de m relativement à la base c est donné par Y = AX avec A = P −1 . En effet,
" #
X X X X X X X
m= x i bi = yj cj = yj P bj = yj Pij bi = Pij yj bi
i j j j i i j
P
soit xi = j Pij yj ou encore X = P Y . En dimension n = 2, les droites yi = yi (0), i = 1, 2
correspondent aux droites P (y1 (0), u), u ∈ R (parallèles au vecteur c2 ) et P (v, y2 (0)), v ∈ R
(parallèles au vecteur c1 ).
Un difféomorphisme f : U → V est simplement une application bijective, différentiable
ainsi que son inverse. Il peut être vu comme un changement de coordonnées : un point m
au voisinage de a ∈ U est repéré par les coordonnées (y1 , . . . , yn ) de f (m) au voisinage
de f (a). Autrement dit, en dimension n = 2, le tissu des droites yi = yi (0), i = 1, 2 au
voisinage de f (a) correspond au tissu de courbes (x1 (y1 (0), u), x2 (y1 (0), u)), u ∼ y2 (0) et
(x1 (v, y2 (0)), x2 (v, y2 (0))), v ∼ y1 (0).
Définition 2.3. — Soient f1 , . . . , fn des fonctions numériques sur U ⊂ Rn . On dit que
(f1 , . . . , fn ) est un changement de coordonnées au voisinage de a si l’application F =
(f1 , . . . , fn ) est un difféomorphisme local au voisinage de a.
Exemple 2.4. — Les coordonnées polaires (x, y) → (r, θ) avec (x, y) = (r cos θ, r sin θ),
soit r = qrtx2 + y 2 , θ = arctg(y/x) ou θ = π/2 − arctg(x/y), donnent un changement de
variable.
Avec ce concept de changement de variables, on va pouvoir considérer localement toute
fonction non critique comme une forme linéaire.
Définition 2.4. — Soit h : U → R une fonction différentiable. Le point m0 ∈ U est dit
critique si la différentielle Dh(m0 ) est nulle.

Exemple 2.5. — Soit A une matrice symétrique et hA la fonction définie sur Rn \ {0} par
hAx, xi
hA (x) = , x ∈ Rn \ {0}.
hx, xi
La différentielle de hA est donnée par
2hAx, Xi 2hAx, xihx, Xi
dhA (x)(X) = − , X ∈ Rn .
hx, xi hx, xi2
Soit (v1 , . . . , vn ) une base orthonormée de vecteurs propres de A, avec valeurs Ppropres as-
sociées λ1 , . . . , λn ordonnées de manière croissante : λ1 ≤ . . . ≤ λn . Si v = ni=1 xi vi est
un point critique de hA et I le premier indice tel que xi soit non nul, alors l’annulation de
dhA (x)(vI ) donne
n
" 1 #
X X
2 2
λI x I xi = λi x i x I ,
i=I i=I

ce qui implique xi = 0 pour tous les i tels que λi > λI : le vecteur v est donc dans l’espace
propre de la valeur propre λi . Les points critiques de hA sont les vecteurs propres de la
matrice A.

Théorème 2.4. — Soit h : U (⊂ Rn ) → R une fonction de classe C 1 . Alors, pour tout


m0 ∈ U non critique pour h, il existe un voisinage U 0 de m0 et des fonctions coordonnées
f = (f1 , . . . , fn ) : U 0 → R avec f1 = h.

Démonstration. — La forme linéaire Dh(m0 ) étant non nulle, le théorème de la base


incomplète appliquée dans le dual de Rn affirme l’existence de n − 1 formes linéaire
L2 , . . . , Ln telles que (Dh(a), L2 , . . . , Ln ) soit une base de ce dual. Alors l’application
F = (h, L2 , . . . , Ln ) de U dans Rn a pour matrice jacobienne en m0
Dh(m0 )
 
 L2 
JF (m0 ) =  .. 
 . 
Ln

qui est inversible puisque les formes linéaires Dh(m0 ), L2 , . . . , Ln sont linéairement
indépendantes. Ainsi (h, L2 , . . . , Ln ) est un système de coordonnées au voisinage de
m0 .

Exemple 2.6. — Soit h définie sur R2 par h(x, y) = x3 −y 2 . Sa différentielle est Dh(x, y) =
(3x2 , −2y) et son seul point critique est l’origine (0, 0). Au point (x0 , y0 ) avec x0 6= 0, on
peut prendre comme seconde fonction coordonnée L2 la forme linéaire y , vu que la matrice
jacobienne de Φ : (x, y) → (h(x, y), y) valant
 2 
3x0 −2y0
JΦ(x0 , y0 ) =
0 1

est inversible. Pour un point (0, y0 ) distinct de l’origine, on peut prendre la forme linéaire
L2 définie par L2 (x, y) = x.
CHAPITRE 3

LE THÉORÈME DES FONCTIONS IMPLICITES

Le théorème des fonctions implicites a pour objet d’exprimer la relation entre x et y im-
posée par l’équation f (x, y) = 0 sous la forme d’une relation y = ϕ(x) ou x = ψ(y) : toute
courbe est un graphe. Les exemples suivants sont particuliers puisqu’on peut y donner ces
fonctions ϕ ou ψ par des formules explicites utilisant des fonctions usuelles. Le théorème
des fonctions implicites, avec ses hypothèses minimales qui sont exactement les conditions
linéarisées telles qu’elles apparaissent dans le troisième exemple de l’algèbre linéaire ci-
dessous, affirme que c’est toujours le cas.
Exemples 3.1. —
p
2 2 2
√ C d’équation x + y = 1 est l’union d’arcs paramétrés x = ± 1 − y et
1. Le cercle
y = ± 1 − x2 . Le cercle C n’est pas un graphe globalement.
2. L’écriture de l’équation y − ϕ(x) = 0 sous la forme x = ψ(y) revient exactement au
problème de l’inversion de la fonction ϕ. On a vu que le théorème d’inversion locale
donnait une solution satisfaisante à ce problème d’inversion.
3. Soit SV = 0 un système linéaire à p équations et p + n inconnues V = (x1 , . . . , xn+p ).
On suppose S de rang p avec les p dernières colonnes indépendantes et on écrit S =
(A B) avec A ∈ Mpn et B ∈ Mp . À cette décomposition correspond celle de V en
V = (x, y) avec les variables libres x ∈ Rn et les variables principales y ∈ Rp . Alors
SV = 0 s’écrit Ax + By = 0, résolu suivant y = −B −1 Ax.

3.1. Le théorème et sa preuve


Théorème 3.1. — Soit U un ouvert de Rn , V un ouvert de Rp et f : U × V → Rp
de classe C 1 . On considère un point m0 = (x0 , y0 ) de U × V tel que f (m0 ) = 0 avec la
différentielle partielle Dy f (m0 ) inversible. Alors il existe un voisinage U0 de x0 inclus dans
U , V0 de y0 inclus dans V et une application ϕ : U0 → V0 telle que Dy f (m) soit inversible
pour m ∈ U0 ×V0 et que dans U0 ×V0 l’équation f (x, y) = 0 soit équivalente à y = ϕ(x). De
plus, la différentielle Dϕ est donnée par Dϕ(x) = −[Dy f (x, ϕ(x))]−1 Dx f (x, ϕ(x)), x ∈ U0 .
Exemple 3.2. — La fonction f (x, y) = y 3 /3 − y − x est C 1 sur le plan R2 , avec pour
différentielle Df (x, y) = (−1 y 2 − 1). Alors, le lieu C d’équation f = 0 est au voisinage
de tout point m ∈ C localement un graphe de la forme y = ϕ(x), sauf les deux points
(x = 2/3, y = ±1). Pour x 6= 2/3, on a la différentielle Dϕ donnée par 1/(ϕ2 (x) − 1).
Démonstration. — Soit g : U × V → Rn × Rp définie par g(x, y) = (x, f (x, y)). La fonction
g est C 1 , de matrice jacobienne  
Id 0
,
Jx f Jy f
inversible en m0 . Ainsi, d’après le théorème d’inversion locale, il existe une boule B contenant
(x0 , 0) = g(x0 , y0 ), W un voisinage de (x0 , y0 ) tel que g soit un difféomorphisme de W sur
B avec l’inverse h = g vérifiant h(X, Z) = (X, ϕ(X, Z)). On a donc
f (x, y) = 0, (x, y) ∈ W ⇐⇒ g(x, y) ∈ B ∩ {z = 0} ⇐⇒ (x, y) ∈ g −1 (B ∩ {z = 0}
⇐⇒ (x, y) = (x, Φ(x, 0)) ⇐⇒ y = ϕ(x)
où on a posé ϕ(x) = Φ(x, 0).
Soient U1 et V1 des ouverts contenant x0 et y0 resp. et tels que R1 = U0 × V1 soit inclus
dans W . Il n’est pas sûr que R1 ∩{f (x, y) = 0} soit un graphe : il se peut que la fibre {x}×V1
ne contienne pas de points de f = 0. Néanmoins, du fait que ϕ est continue, il existe un
ouvert U0 tel que ϕ(U0 ) ⊂ V1 . Alors, posant V0 = V1 , on a un rectangle R0 = U0 × V0 tel
que R0 ∩ {f = 0} soit un graphe.
La fonction Φ étant C 1 , la fonction ϕ l’est aussi. Différentiant f (x, ϕ(x)) = 0, on obtient
Dx f (x, ϕ(x)) + Dy f (x, ϕ(x))Dx ϕ(x) = 0, x ∈ U0 ,
d’où la formule pour la différentielle de ϕ au point x.

3.2. Racines d’équations polynomiales


3.2.1. Variation de racines simples. — Soit Pλ (Y ) = Y 3 +a2 (λ)Y 2 +a1 (λ)Y +a0 (λ) un
polynôme dépendant d’un paramètre λ parcourant un ouvert Λ ⊂ R` , avec les coefficients
ai , i = 1, 2, 3 des fonctions de classe C 1 sur Λ. On note p(λ, y) la fonction définie sur
Λ × R associée : le polynôme dérivé Pλ0 (Y ) est identifié pareillement avec la dérivée partielle
∂y p(λ, y). On suppose y0 ∈ R racine simple du polynôme P (λ, Y ), i. e. ∂y p(λ0 , y0 ) 6= 0.
Le théorème des fonctions implicites assure l’existence de r > 0, δ > 0, tels que pour tout
λ ∈ B(λ0 , r), le polynôme Pλ (Y ) a une unique racine simple y = ϕ(λ) dans (y0 − δ, y0 + δ),
avec dépendance C 1 en λ.

3.2.2. Le théorème fondamental de l’algèbre. —


Théorème 3.2. — Tout polynôme complexe P de degré n > 0 admet au moins une racine
dans C.
Démonstration. — Soit P (Z) = pn Z n + pn−1 Z n−1 + . . . + p1 Z + p0 un polynôme de degré
n ; on peut supposer sans restriction pn = 1. On raisonne par l’absurde, i. e. on suppose que
P n’a pas de zéro dans C. On notera p la fonction polynomiale associée au polynôme P :
c’est une fonction de C ' R2 dans lui-même.
Lorsque |z| tend vers ∞, il en est de même de |p(z)|, vu
p(z) = z n (1 + pn−1 z −1 + . . . + p1 z 1−n + p0 z −n ),
où le facteur de droite tend vers 1 lorsque |z| → ∞. Ainsi, il existe R > 0 tel que pour
|z| > R, on a |p(z)| > |p(0)| + 1 et la borne inférieure mp = inf z∈C |p(z)|, infimum de |p| sur
la boule compacte {|z| ≤ R}, est atteinte en un z0 : d’après l’hypothèse p(z0 ) 6= 0 et donc
mp > 0.
Lemme 3.1. — L’application p est ouverte.
Admettons un instant le lemme : l’image p(C) est incluse dans {|z| ≥ mp } et p(z0 ) avec
|p(z0 )| = mp ne peut avoir de voisinage ouvert inclus dans p(C), ce qui est contradictoire
avec le caractère ouvert de p(C).
Preuve du lemme. — Il s’agit de montrer que pour tout complexe z , l’image d’un voisinage
de z par p est un voisinage de p(z). Remarquons tout d’abord que la formule de Taylor
(algébrique)
P 00 (Z) 2 P (n) (Z) n
P (Z + H) = P (Z) + P 0 (Z)H + H + ... + H
2! n!
permet d’écrire, pour z, h ∈ C et en notant p la fonction polynomiale sur C associé au
polynôme dérivé P (k) ,
p00 (z) 2 p(n) (z) n
p(z + h) = p(z) + p0 (z)h + h + ... + h
2! n!
= p(z) + p0 (z)h + o(h), h → 0,
Ainsi l’application p est une application différentiable avec comme différentielle la multi-
plication par p0 (z). Ainsi, si p0 (z) est non nul, l’application linéaire de multiplication par
p0 (z) est un isomorphisme et donc p est un difféomorphisme local d’un voisinage de z sur
un voisinage de p(z) : l’application est donc ouverte sur le complémentaire des zéros de P 0 .
En un zéro z de P 0 , on reprend l’expression précédente, où N est le minimum des k tels
que p(k) (z) 6= 0,
p(N ) (z) N N !p(N +1) (z)
 
N !p(z) n−N
p(z + h) = p(z) + h 1+ h + . . . + (N ) h
N! (N + 1)!p(N ) (z) p (z)
Notant qz,N (h) le dernier facteur, soit fz,N la fonction définie sur C2 ' R4 par fz,N (h, y) =
y N − qz,N (h), (h, y) ∈ C2 . La différentielle partielle Dy fz,N (h, y) est, comme précédemment,
l’application linéaire induite par la multiplication par N y N −1 , non nulle en (h0 , y0 ) = (0, 1).
D’après le théorème des fonctions implicites, il existe une fonction différentiable ϕz,N , définie
sur un voisinage de h0 = 0 dans C et à valeurs dans C, telle que ϕz,N (h)N = qz,N (h) et
ϕz,N (0) = 1. Ainsi, si rz,N est une racine N ième de P (N ) (z)/N !, on a pour h petit
p(z + h) = p(z) + [rz,N ϕz,N (h)h]N .
L’application h → rz,N ϕz,N (h)h est inversible au voisinage de h = 0 puisque sa différentielle
est la multiplication par le complexe non nul rz,N . Ainsi, au voisinage d’un zéro de P 0 ,
l’application p est la composée d’une application inversible et de la fonction puissance ζ →
ζ N : l’application p envoie un voisinage du zéro z de P 0 sur un voisinage de p(z). On a
donc terminé de montrer que l’application p est ouverte sur C.

CHAPITRE 4

COURBES ET SURFACES RÉGULIÈRES

4.1. Équations régulières


Définition 4.1. — Soit f : U ⊂ Rn → R une fonction de classe C 1 . L’équation f = 0 est
dite régulière, et le lieu {f = 0} régulier, si la fonction f est non critique en tout point m
vérifiant f (m) = 0.
Exemple 4.1. — L’équation x2 + y 2 + z 2 − 1 = 0 est régulière, même si la fonction
f (x, y, z) = x2 + y 2 + z 2 − 1 a l’origine comme point critique.
Soit f une fonction à valeurs numériques définie sur un ouvert de Rn telle que f = 0
soit régulière et m0 tel que f (m0 ) = 0. En numérotant convenablement les coordonnées,
∂f
on peut supposer ∂x n
(m0 ) non nul. Ainsi, d’après le théorème des fonctions implicites, si
m0 = (a1 , a2 , . . . , an ) il existe une boule B centrée en (a1 , a2 , . . . , an−1 ), un δ > 0 et une
∂f
application ϕ : B → (an − δ, an + δ) tel que ∂x n
(m) soit non nul sur B × (an − δ, an + δ) et
que, pour m = (x1 , x2 , . . . , xn ) ∈ B × (an − δ, an + δ), l’équation f (m) = 0 soit équivalente
à xn = ϕ(x1 , x2 , . . . , xn−1 ).

4.2. Courbes régulières


Définition 4.2. — Une partie C du plan R2 est dite courbe régulière si pour tout point
m0 de C , il existe un voisinage ouvert U0 de m0 et une fonction f : U0 → R de classe C 1
telle que C ∩ U0 = {m ∈ U0 , f (m) = 0} et l’équation f (m) = 0, m ∈ U0 soit régulière.
Exemple 4.2. — Le cercle x2 + y 2 − 1 = 0, l’hyperbole x2 − y 2 − 1 = 0 sont des courbes
régulières, mais pas le lieu x2 − y 2 = 0.
Proposition 4.1. — Soit une courbe régulière C d’équation f = 0 au voisinage de m =
(x, y). La tangente à C au point m a pour équation
∂f ∂f
(4) (m)(X − x) + (m)(Y − y) = 0, (X, Y ) ∈ R2 .
∂x ∂y
Démonstration. — Si ∂f ∂y
(m) est non nul, le lieu C est localement le graphe {(x, ϕ(x)), x ∈ I}
pour une fonction ϕ. La tangente est la droite passant par (x, y) = (x, ϕ(x)) de pente ϕ0 (x),
elle a donc pour équation (Y − y)/(X − x) = ϕ0 (x), soit (4) après avoir remplacé ϕ0 (x) par
son expression ϕ0 (x) = − ∂f ∂x
(x, ϕ(x))/ ∂f
∂y
(x, ϕ(x)) au point m = (x, ϕ(x)).
∂f
Si ∂x (m) est non nul, le lieu C est localement la courbe paramétrée {(ψ(y), y), y ∈ I}
pour une fonction ψ . La tangente τm C au point m = (x, y) de C est la droite passant
X − x ψ 0 (y)
par (x, y) = (ψ(y), y) de direction (ψ 0 (y), 1), elle a donc pour équation =0
Y −y 1
ou (X − x) − ψ 0 (y)(Y − y) = 0, soit (4) après avoir remplacé ψ 0 (y) par son expression
ψ 0 (y) = − ∂f
∂y
(ψ(y), y)/ ∂f
∂x
(ψ(y), y) au point m = (ψ(y), y).

4.3. Surfaces régulières


Définition 4.3. — Une partie S de l’espace R3 est dite surface régulière si pour tout point
m0 de S , il existe un voisinage ouvert U0 de m0 et une fonction f : U0 → R de classe C 1
telle que S ∩ U0 = {m ∈ U0 , f (m) = 0} et l’équation f (m) = 0, m ∈ U0 soit régulière.
Exemples 4.3. —
1. Soit g : V (⊂ R2 ) → R une fonction de classe C 1 . Le graphe Γg = {(x, y, g(x, y)), (x, y) ∈
V } est une surface régulière. Une équation régulière de Γg est z −g(x, y) = 0, (x, y, z) ∈
V × R. Si g est donnée par g(x, y) = x2 − y 2 , (x, y) ∈ R2 , le graphe Γg est une surface
régulière, même si son intersection Γg ∩ {z = 0} avec le plan z = 0 n’est pas une
courbe régulière.
2. La sphère x2 + y 2 + z 2 − 1 = 0, l’hyperboloı̈de x2 − y 2 − z 2 − ε = 0 avec ε 6= 0 sont des
surfaces régulières, mais pas le cône x2 − y 2 − z 2 = 0.
Théorème 4.1. — Soit S une partie de R3 . Sont équivalentes
1. S est une surface régulière.
2. Pour tout m0 ∈ S , il existe un voisinage U0 de m0 tel que U0 ∩ S soit un graphe
au-dessus d’un ouvert d’un des plans de coordonnées.
3. Pour tout m0 de S , il existe un voisinage U0 et un difféomorphisme C 1 Φ de U0 sur
Φ(U0 ) ⊂ R3 tel que Φ(S ∩ U0 ) = (R2 × {0}) ∩ Φ(U0 ).
4 Le difféomorphisme local Φ de la troisième description est dit difféomorphisme de
linéarisation de la surface S au point m0 . 5

Exemple 4.4. — Soit S la sphère x2 +y 2 +z 2 = 1. Sur le voisinage


p U− = {x < 0} du point
(−1, 0, 0), la sphère S est le graphe de la fonction g(y, z) = − 1 − y 2 − zp
2 définie sur D =
1
2 2 2 2
{(y, z), y + z < 1}. Le difféomorphisme Φ défini par Φ(x, y, z) = (x + 1 − y − z , y, z)
défini sur U = R × D1 applique S ∩ U sur ({0} × R2 ) ∩ Φ(U ).
Démonstration. — La définition de surface régulière et le théorème des fonctions implicites
donnent immédiatement l’implication de (2) à partir de (1). Si Γg = {(x, y, g(x, y)), (x, y) ∈
V } est une présentation locale de S sous forme de graphe, alors le difféomorphisme Φ défini
sur U = V × R par Φ(x, y, z) = (x, y, z − g(x, y))} répond aux spécifications de (3). Si
l’assertion (3) est vérifiée pour Φ d’applications coordonnées Φ1 , Φ2 , Φ3 , alors Φ3 = 0 est
une équation de S , régulière puisque Φ étant un difféomorphisme, DΦ est inversible et DΦ3
est non nulle, i. e. Φ3 est non critique sur S .
Pour S une partie de R3 et m0 ∈ S , on note par Cm (S) l’ensemble des arcs de courbe
γ définis comme application de (−ε, ε) (pour un ε > 0 dépendant de γ ) dans R3 de classe
C 1 telle que γ(0) = m0 et γ(−ε, ε) ⊂ S .
Définition 4.4. — L’espace tangent Tm0 S à S est l’ensemble des vecteurs dérivés γ̇(0) où
γ est un arc de Cm0 (S).
Théorème 4.2. — Si S est une surface régulière d’équation régulière f = 0 et m0 un
point de S , l’espace tangent Tm0 S est le plan vectoriel Ker Df (m0 ). Le plan Tm0 S a pour
équation
∂f ∂f ∂f
(5) (m0 )X + (m0 )Y + (m0 )Z = 0, (X, Y, Z) ∈ R3 .
∂x ∂y ∂z
Exemple 4.5. — Le cône C = {x2 +y 2 −z 2 } est une surface régulière en dehors de l’origine
(0, 0, 0). L’espace tangent à ce cône au point m = (x, y, z) 6= (0, 0, 0) est le plan d’équation
xX + yY − zZ = 0.
La partie T(0,0,0) C contient les vecteurs v± = (0, ±1, 1}, vecteurs dérivés en t = 0 des
droites v(t) = (0, ±t, t) incluses dans C . Mais le vecteur v+ + v− n’est pas dans T(0,0,0) C .
En effet, si c’était le cas, il existerait une courbe γ telle que γ(t) = t(v+ + v− ) + tε(t) au
voisinage de t = 0 incluse dans C : t2 εx (t)2 +t2 εy (t)2 −(2t+tεz (t))2 = 0 soit εx (t)2 +εy (t)2 −
(2 + εz (t))2 = 0 pour t 6= 0 et en passant à la limite −4 = 0, ce qui n’est pas. On peut aussi
remarquer que, w étant le vecteur w = (1, 0, 1) qui est dans T(0,0,0) C comme dérivée en t = 0
de la droite paramétrée t → (t, 0, t) contenue dans C , les vecteurs v+ , v− , w , linéairement
indépendants, engendreraient un espace vectoriel tangent de dimension 3. . .
Démonstration. — Si γ ∈ Cm0 S , alors f (γ(t)) = 0 pour t voisin de 0. La dérivée
d
dt
f (γ(t)) = Df (γ(t))γ̇(t) est nulle, soit pour t = 0, Df (m0 )γ̇(0) et donc l’inclusion
Tm0 S ⊂ Ker Df (m0 ).
Soit par ailleurs Φ un difféomorphisme de linéarisation sur un voisinage U0 de m0 :
Φ(U0 ∩ S) = P ∩ Φ(U0 ) pour un plan P . Pour v ∈ P et ε assez petit, l’image de la portion
de droite Φ(m0 ) + tv, t ∈ (−ε, ε) par Φ−1 est une courbe de Cm0 S : γ : t ∈ (−ε, ε) →
Φ−1 (Φ(m0 ) + tv) et donc le vecteur γ̇(0) = DΦ−1 (Φ(m0 ))(v) est dans Tm0 S . Vu que Φ−1 est
un difféomorphisme, DΦ−1 (Φ(m0 )) est un isomorphisme linéaire et DΦ−1 (Φ(m0 ))(P ) est
un plan vectoriel. Ainsi, l’espace tangent Tm0 S est inclus dans le plan vectoriel Ker Df (m0 )
en même temps qu’il contient le plan DΦ−1 (Φ(m0 ))(P ) : ces deux plans sont égaux et Tm0 S
est le sous-espace vectoriel Ker Df (m0 ), dont l’équation est bien (5).
Terminons par une définition, qui a une version en dimension n = 2 (ou n quelconque
bien sûr).
Définition 4.5. — Soit f différentiable sur U et m un point de U . Le gradient de f en
m, noté grad f (m) ou ∇f (m), est le vecteur défini par
 
∂f ∂f ∂f
grad f (m) = ∇f (m) = (m), (m), (m) .
∂x ∂y ∂z
Ainsi, si h , i désigne le produit scalaire standard sur R3 , l’équation du plan tangent
Tm0 S d’une surface d’équation régulière f = 0 est
hgrad f (m0 ), vi = 0, v ∈ R3 .
L’espace tangent τm0 S passant par m0 est l’espace affine contenant m0 de direction Tm0 S ,
il a pour équation
hgrad f (m0 ), m − m0 i = 0, m ∈ R3 .

CHAPITRE 5

APPLICATIONS C k

Pour k entier, la définition 1.5 d’une fonction de classe C k se fait par récurrence sur l’entier
k , comme se feront les démonstrations des versions C k des théorèmes établis précédemment
en régularité C 1 . Commençons par un lemme.
Lemme 5.1. — Soit U un ouvert de Rn . Une fonction f : U → Rp est de classe C k (resp.
C ∞ ) si et seulement si ses fonctions coordonnées fi , i = 1, . . . , p le sont.
Démonstration. — On le démontre par récurrence. Pour k = 1, c’est la remarque précédant
l’exemple 1.3. Supposons le lemme montré pour la régularité C k et soit f de classe C k+1 .
Ainsi f est différentiable et sa différentielle Df est de classe C k . Les fonctions coordonnées
∂fi
de Df sont ∂x j
, i = 1, . . . , p, j = 1, . . . , n, elles sont de classe C k d’après l’hypothèse de
récurrence. Par suite, pour i = 1, . . . , p, la fonction fi est différentiable et, à nouveau
∂fi
d’après l’hypothèse de récurrence, Dfi , avec fonctions de coordonnées ∂x j
, j = 1, . . . , n est
k k+1
de classe C . Ainsi fi est de classe C . Pour la réciproque, il suffit de remarquer que tous
les arguments précédents sont en fait des équivalences.
Exemple 5.1. — L’application Pnpq : (A, B) ∈ L(Rn , Rp )×L(Rp , Rq ) → B ◦A ∈ L(Rn , Rq )
est de classe C ∞ , vu que ses fonctions coefficients sont polynomiales. On calcule facilement
sa différentielle au point (A, B)
dPnpq (A, B)(H, K) = B ◦ H + K ◦ A, (H, K) ∈ L(Rn , Rp ) × L(Rp , Rq ),
et l’application dPnpq est une application linéaire (qui est C ∞ ).
Corollaire 5.1. — Soient P, Q polynômes à n variables et UQ l’ouvert UQ = Q−1 (R∗ ).
Alors l’application R : (x1 , . . . , xn ) ∈ UQ → P (x1 , . . . , xn )/Q(x1 , . . . , xn ) est de classe C ∞ .
Démonstration. — La fraction rationnelle R = P/Q est différentiable et ses dérivées par-
tielles ∂xi R, fonctions coordonnées de la différentielle DR, sont des fractions rationnelles
bien définies sur UQ . On fait alors une récurrence sur k .
Exemple 5.2. — L’application A ∈ GL(n, R) → A ∈ Mn a des fonctions coordonnées
rationnelles comme il résulte de l’expression de l’inverse d’une matrice par sa comatrice et
son déterminant : elle est donc C ∞ .

5.1. La version C k des théorèmes classiques


Théorème 5.1. — Si f et g sont de classe C k (resp. C ∞ ), la composée g ◦ f l’est aussi.
Démonstration. — Une récurrence démarre par le cas C 1 : c’est le théorème 1.1 de com-
position de fonctions différentiables. Supposons la proposition vraie en rang k et soient f
et g de classe C k+1 . La différentielle de g ◦ f est [Dg ◦ f ] ◦ Df : d’après l’hypothèse de
récurrence, Dg ◦ f est de classe C k , comme composée de deux fonctions de classe C k ,
et aussi D(g ◦ f ) vu comme composée des applications précédentes et de l’application
(A, B) ∈ L(Rn , Rp ) × L(Rp , Rq ) → B ◦ A ∈ L(Rn , Rq ). Ainsi D(g ◦ f ) est de classe C k ,
et g ◦ f de classe C k+1 .
Théorème 5.2. — Si f est C k (resp. C ∞ ) et f est un difféomorphisme C 1 , alors f −1 est
de classe C k (resp. C ∞ ).
Démonstration. — Pour la régularité C 1 , c’est le théorème 2.1 d’inversion locale. On passe
de C k à C k+1 via la formule de l’inverse D(f −1 ) = [Df ◦ f −1 ]−1 , le théorème de composition
C k et le caractère C ∞ de l’application A ∈ Gl(n, R) → A−1 .

5.2. Théorème de Schwarz


Théorème 5.3 (Schwarz). — Soit f : U ⊂ Rn → R de classe C 2 . Alors ∂xi (∂xj f ) =
∂xj (∂xi f ). Plus généralement, si f est de classe C k , l’ordre des dérivées partielles n’importe
pas pour les dérivées d’ordre au plus k .
Démonstration. — Il suffit de le montrer pour une fonction f de deux variables x, y
différentiable à l’origine (0, 0). Soient F et H1 définies au voisinage de l’origine par
F (x, y) = f (x, y) − f (x, 0) − f (0, y) + f (0, 0), H1 (x, y) = F (x, y) − xy∂y ∂x F (0, 0).
On a ∂x H1 (x, y) = ∂x F (x, y) − y∂y ∂x F (0, 0). Par ailleurs, la différentiabilité de ∂x F à
l’origine permet d’écrire
∂x F (s, t) = ∂x F (0, 0) + ∂x ∂x F (0, 0)s + ∂y ∂x F (0, 0)t + (|s| + |t|)ε(s, t)
On a ∂x F (x, y) = ∂x f (x, y) − ∂x f (x, 0), ∂x F (x, 0) = 0 et ∂x ∂x F (0, 0) = 0. Ainsi la formule
précédente se réduit à
∂x F (s, t) = t∂y ∂x F (0, 0) + (|s| + |t|)ε(s, t)
On en déduit par l’inégalité des accroissements finis avec y fixé, et ε1 (x, y) = sups∈[0,x] |ε(s, y)|,
|H1 (x, y)| ≤ sup |∂x F (s, y) − y∂y ∂x F (0, 0)| |x| ≤ (|x| + |y|)ε1 (x, y)|x|
s∈[0,x]

soit
|F (x, y) − xy∂y ∂x F (0, 0)| ≤ (|x| + |y|)ε1 (x, y) |x|.
On a une inégalité analogue en échangeant x et y
|F (x, y) − yx∂x ∂y F (0, 0)| ≤ (|x| + |y|)ε2 (x, y) |y|,
d’où en additionnant, et en prenant t = x = y ,
|t2 ∂x ∂y F (0, 0) − t2 ∂y ∂x F (0, 0)| ≤ 2t2 (ε1 (x, y) + ε2 (x, y))
soit
|∂x ∂y F (0, 0) − ∂y ∂x F (0, 0)| ≤ 2(ε1 (x, y) + ε2 (x, y)),
et donc l’annulation du membre de gauche en faisant tendre (x, y) vers (0, 0), ce qu’il fallait
démontrer.

5.3. Formules de Taylor


Théorème 5.4 (Formule de Taylor à l’ordre 2). — Soit f de classe C 2 . Alors
f (m0 + h) = f (m0 ) + Df (m0 )h + D2 f (m0 )(h, h) + o(khk2 )

Démonstration. — On considère la fonction g d’une variable définie par g(t) = f (m0 + th)
pour t dans un voisinage de [0, 1].
Z 1 Z 1
0 0
f (m0 + h) = g(1) = g(0) + g (s)ds = g(0) + g (0) + (1 − s)g 00 (s)ds
0 0
00 Z 1
g (0)
= g(0) + g 0 (0) + + (1 − s)[g 00 (s) − g 00 (0)]ds
2 0
2 Z 1
D f (m0 )(h, h)
= f (m0 ) + DF (m0 )h + + (1 − s)[g 00 (s) − g 00 (0)]ds
2 0
D2 f (m0 )(h, h)
= f (m0 ) + DF (m0 )h + + o(||h||2 ).
2
4 On a des formules de Taylor à l’ordre n : si f est de classe C n au voisinage de m0
D2 f (m0 )(h, h) Dn f (m0 )(h, h, . . . , h)
f (m0 + h) = f (m0 ) + Df (m0 )h + + ... + + o(khkn ).
2 n!
On aura identifié Dn f a une forme n-linéaire sur Rn , symétrique d’après le théorème de
Schwarz, avec en coordonnées locales pour h = (h1 , . . . , hn )
X ∂ nf
Dn f (h, . . . , h) = hi . . . hin .
n
∂xci1 . . . ∂xin 1
(i1 ,i2 ,...,in )∈N∗

Par la suite, seul le développement limité à l’ordre 2 sera utilisé, c’est pourquoi les dérivées
Dn f pour n ≥ 3 n’ont pas été étudiées. 5

CHAPITRE 6

POINTS CRITIQUES ET EXTREMA

6.1. Extrema
Définition 6.1 (maximum/minimum local). — Soit f : U (⊂ Rn ) → R. Le point
m0 ∈ U est un maximum (resp. minimum) local pour f s’il existe r > 0 tel que f (m0 ) ≥
f (m) (resp. f (m0 ) ≤ f (m)) si km − m0 k ≤ r . On dira que m0 est un extremum (local) de
f si c’est un minimum ou un maximum (local) pour f . L’extremum est dit strict si il y a
inégalité stricte pour m 6= m0 ; il est global sur U si les inégalités valent sur U .
4 Si m0 est un maximum local de f , m0 est un minimum local de −f . On se limitera au
possible à donner les preuves pour m maximum. 5

Proposition 6.1. — Si f est différentiable en m0 et m0 est un extremum local pour f ,


alors m0 est un point critique de f .
Démonstration. — Supposons Df (m0 ) non nulle. Il existe une direction h telle que
Df (m0 )h soit non nulle. Alors
f (m0 + th) = f (m0 ) + tDf (m0 )h + o(t) = f (m0 ) + t(Df (m0 )h + ε(t)),
où le dernier terme, équivalent à tDf (m0 )h au voisinage de t = 0, change de signe : m0 ne
peut être un extremum local.
Théorème 6.1. — Soit f de classe C 2 , m0 un point critique de f avec hessienne
Hess f (m0 ) de rang r et d’indice i.
Si m0 est un maximum (resp. minimum) local de f , alors Hess(f )(m0 ) est une forme
quadratique négative (resp. positive).
Si r = n et i = n (resp. i = 0), m0 est un maximum (resp. minimum) local strict. Si
0 < i < r , m0 n’est pas un extremum. Si r < n et i ∈ {0, r}, on ne peut rien dire.
Exemple 6.1. — Les fonctions définies sur Rn
F0 (x, y) = αx2 + βy 2 , f1 (x, y) = xy, f2,k,± (x, y) = x2 ± y k
avec α, β non nuls et k = 3, 4, ont m0 = (0, 0) comme point critique et illustrent les
différentes assertions du théorème. En particulier, la fonction f2,k,± montre que dans le cas
de hessienne dégénérée (r < n), on ne peut conclure en général si m0 est (ou n’est pas) un
extremum.
Démonstration. — Soient (vi , αi ), i = 1, . . . , n les éléments propres de la hessienne
Hess(f )(m0 ) avec (vi )i=1,...,n une base orthonormée de Rn : Hess(f )(m0 )(vi , vi ) = αi .
On Pécrit alors le développement limité au voisinage de v = 0 pour f (mo + v) avec
v = ni=1 yi vi
n
! n
! n
X X X
f m0 + yi vi = f (m0 )+Hess f (m0 ) yi vi +o(kvk2 ) = f (m0 )+ αi yi2 +o(kvk2 ).
i=1 i=1 i=1

Si m0 est un maximum local, on a en prenant v = tvj dans l’expression précédente,


0 ≥ f (m0 + tvj ) − f (m0 ) = αj t2 + o(t2 ) = t2 (αj + ε(t))
au voisinage de t = 0, d’où en divisant par t et passant à la limite t → 0, l’inégalité 0 ≥ αj :
la hessienne Hess f (m0 ) est négative.
Supposons la hessienne Hess f (m0 ) non dégénérée. Si elle est définie négative (i. e. i =
n), soit
P α le maximum des αi , i = 1, . . . , n, qui est donc strictement négatif. On a, pour
v = ni=1 yi vi ,
n
X n
X
f (m0 + v) − f (m0 ) = αi yi2 2
+ o(kvk ) ≤ α yi2 + o(kvk2 ) = kvk2 (α + ε(v))
i=1 i=1

et donc f (m0 + v) < f (m0 ) pour v voisin de zéro non nul : m0 est un maximum local strict
de f .
Si Hess f (m0 ) est non dégénérée, de signe non constant, à ordre près on peut supposer
α1 < 0 et α2 > 0 : f restreinte à la droite passant par m0 et de direction v1 (resp. v2 ) a un
maximum (resp. minimum) local strict en m0 : m0 n’est ni maximum, ni minimum local de
la fonction f .
6.2. Extrema liés
Soit h une fonction définie sur un ouvert U de Rn et L un lieu géométrique inclus dans
U . On s’intéresse à l’étude des extrema (locaux ou globaux) de la restriction de f à L. Si
L est régulier (surface dans R3 , courbe dans R2 ou R3 ) et la fonction h différentiable (ce
qui sera supposé dans la suite), le théorème des fonctions implicites permet d’établir une
condition nécessaire pour que m0 ∈ C soit un extrema local : c’est cette condition qui sera
établie dans cette section pour des cas particuliers pour n = 2 ou 3.
Exemple 6.2. — On considère le cas où L est un sous-espace affine, de direction vectorielle
V (sous-espace vectoriel de Rn ). La restriction de h à L est différentiable, avec différentielle
D(h|L ) donnée par la restriction (Dh)|V de Dh à V . Ainsi, si m0 ∈ L est un extremum
local de h|L , alors on a (Dh(m0 ))|V = 0.
Si L est un hyperplan affine d’équation `(m) = `(m0 ) avec ` une forme linéaire sur Rn , la
condition précédente (Dh(m0 ))| Ker ` = 0 est l’inclusion V = Ker ` ⊂ Ker Dh(m0 ) : il existe
λ ∈ R tel que Dh(m0 ) = λ`. En fait, λ est non nul si Ker ` = Ker Dh(m0 ), nul si m0 est
un point critique de h.
Si L est l’intersection de deux hyperplans affines distincts d’équations `1 (m) = `1 (m0 ) et
`2 (m) = `2 (m0 ) (i. e. une droite dans R3 ), alors V = Ker `1 ∩ Ker `2 et la condition énonce
que tout v annulé par `1 et `2 annule Dh(m0 ). On en déduit l’existence de réels λ1 , λ2 tels
que Dh(m0 ) = λ1 `1 +λ2 `2 . En effet, si (`i )i=1,...,n est une base de formes linéairesP
complétant
les deux formes indépendantes `1 , `2 , de base duale (vi )i=1,...,n , on a Dh(m0 ) = ni=1 λi `i et
les λi = Dh(m0 )(vi ) sont tous nuls pour i ≥ 3 puisque vi ∈ V .
Le scalaire λ, ou les scalaires λ1 , λ2 , sont appelés multiplicateur(s) de Lagrange.
Si on applique la condition précédente à la fonction h(x, y, z) = x2 + y 2 + z 2 sur l’hy-
perplan Hn,C d’équation hn, mi = C avec n ∈ R3 , C ∈ R, on a, en exprimant la condition
(Dh(m0 ))|V = 0 sur le gradient de h, l’existence de λ tel que 2m0 = λn : la distance

h = d(0, m) d’un point m de H à l’origine 0 est minimale au projeté m0 de l’origine sur
Hn,C .
Commençons par traiter le cas des extrema de fonctions restreintes à des surfaces
régulières.
Proposition 6.2. — Soit S = {f = 0} une surface régulière dans R3 . Le point m0 ∈ S
est un extrema local de h|S s’il existe λ tel que Dh(m0 ) = λDf (m0 ).
Démonstration. — Supposons Dx f (m0 ) non nul. Alors, d’après le théorème des fonctions
implicites, il existe une fonction ϕ définie sur un voisinage V0 de (y0 , z0 ) telle que dans
un voisinage de m0 la surface S soit le graphe {(ϕ(y, z), y, z), (y, z) ∈ V0 }. La fonction H
définie par H(y, z) = h(ϕ(y, z), y, z), (y, z) ∈ V0 a donc (y0 , z0 ) comme point critique : la
nullité de la différentielle DH(y0 , z0 ) en terme de dérivées partielles donne
∂h ∂ϕ ∂h ∂h ∂ϕ ∂h
(m0 ) (y0 , z0 ) + (m0 ) = 0, (m0 ) (y0 , z0 ) + (m0 ) = 0
∂x ∂y ∂y ∂x ∂z ∂z
On a par ailleurs, vu f (ϕ(y, z), y, z) = 0,
∂f ∂ϕ ∂f ∂f ∂ϕ ∂f
(m0 ) (y0 , z0 ) + (m0 ) = 0, (m0 ) (y0 , z0 ) + (m0 ) = 0,
∂x ∂y ∂y ∂x ∂z ∂z
et donc
∂h ∂h
∂h ∂x
(m0 ) ∂f ∂h ∂x
(m0 ) ∂f
(m0 ) = ∂f (m0 ), (m0 ) = ∂f (m0 ).
∂y ∂x
(m 0 ) ∂y ∂z ∂x
(m 0 ) ∂z
On en déduit grad h = λ grad f ou Dh(m0 ) = λDf (m0 ) avec λ = ∂h
∂x
(m0 )/ ∂f
∂x
(m0 ).
On a évidemment une proposition analogue dans le cas d’une courbe dans le plan, dont
on laisse la démonstration au lecteur.
Proposition 6.3. — Soit C = {f = 0} une courbe régulière dans R . Le point m0 ∈ S
est un extrema local de h|S s’il existe λ tel que Dh(m0 ) = λDf (m0 ).
Exemple 6.3. — Soient a, b, c, d des constantes positives non nulles et f la fonction définie
sur Q+ = {(x, y) ∈ R2 , x > 0, y > 0} par f (x, y) = cx − d log x + by − a log y . Vu que les
constantes a, b, c, d sont positives, la valeur f (m) tend vers +∞ lorsque m tend vers le bord
∂Q+ = {(x, y), x = 0 ou y = 0} de Q+ . La fonction f est indéfiniment différentiable sur Q+ ,
de différentielle Df (x, y) = (c − d/x b − a/y) : son seul point critique y est m− = (d/c, a/b),
qui est nécessairement un minimum  pour f , puisque f → +∞ au bord de Q+ , minimum
−c 0
strict vu que Hess(f )(m− ) = . L’image f (Q+ ) est l’intervalle [v− , +∞) avec
0 −b
v− = f (m− ).
Pour v ∈ (v− , +∞), l’ensemble de niveau Cv = {m ∈ Q+ , f (m) = v} est une courbe
régulière, bornée dans Q+ , donc compacte, puisque f est infinie au bord de Q+ .
La hauteur h(x, y) = y est extremum aux points où la condition d’extrema liés Dh = λDf
est réalisée, i. e. x = d/c : au voisinage d’un tel point, Cv est le graphe d’une fonction y(x)
qui vérifie c − d/x + by 0 (x) − ay 0 (x)/y = 0, soit y 0 (x) = c−d/x
a/y−b
. Évaluant la dérivée de la
2
c /d
relation précédente en x = d/c où y 0 (d/c) = 0, on a y 00 (d/c) = a/y(d/c)−b : les extrema sont
stricts. De plus sur la droite x = d/c privée du point m− , la fonction f est strictement
monotone, ainsi Cv intersecte cette droite en au plus deux points : il n’y a qu’un maximum
et un minimum possibles, et ils existent bien sur le compact Cv . Il en est de même pour
l’abscisse x qui est extremum le long de Cv en deux points de la droite y = a/b, de part et
d’autre du point m− . Les courbes Cv sont donc des courbes fermées qui entourent le point
critique m− .
On remarquera que la fonction f est intégrale première du système proies/prédateurs
(
ẋ = ax − bxy,
ẏ = cxy − dy.
puisque le long d’une trajectoire
d
f (x(t), y(t)) = cẋ − dẋ/x + bẏ − aẏ/y = (c − d/x)(ax − bxy) + (b − a/y)(cxy − dy) = 0
dt
Les trajectoires de ce système sont donc toutes bornées et périodiques.
Proposition 6.4. — Soit C = {f1 = 0, f2 = 0} une courbe régulière dans R3 . Le point
m0 ∈ S est une extrema local de h|S s’il existe λ1 , λ2 tels que Dh(m0 ) = λ1 Df1 (m0 ) +
λ2 Df2 (m0 ).
Démonstration. — On peut supposer que Dy,z (f1 , f2 )(m0 ) est inversible. Il existe des
fonctions ϕ1 , ϕ2 définies au voisinage de x0 telle que C soit localement donnée par
{(x, ϕ1 (x), ϕ2 (x))}. L’espace tangent à la courbe C est de direction (1, ϕ01 (x0 ), ϕ02 (x0 )),
égale à l’intersection Ker Df1 (m0 ) ∩ Ker Df2 (m0 ). L’extrémalité de m0 dit que x0 est un
point critique de la fonction H(x) = h(x, ϕ1 (x), ϕ2 (x)). L’annulation de la dérivée H 0 (x0 )
donne
∂h ∂h ∂ϕ1 ∂h ∂ϕ2
(m0 ) + (m0 ) (x0 ) + (m0 ) (x0 ) = 0,
∂x ∂y ∂x ∂z ∂x
ainsi Ker Df1 (m0 ) ∩ Ker Df2 (m0 ) est inclus dans Ker Dh(m0 ) et donc il existe λ1 , λ2 tels
que Dh(m0 ) = λ1 Df1 (m0 ) + λ2 Df2 (m0 ).
Exemple 6.4. — Soit f1 définie sur R3 par f1 (x, y, z) = 3x2 +2y 2 −1 et f2 par f2 (x, y, z) =
x2 + y 2 + z 2 − 1. La surface cylindrique S1 = {3x2 + 2y 2 = 1} de base l’ellipse dans le plan
{z = 0} et la sphère S2 = {x2 + y 2 + z 2 = 1} s’intersectent suivant la courbe C : la courbe
C ne rencontre pas le plan z = 0 (les sections par le plan z = 0 de S1 et S2 sont une ellipse
et un cercle resp. qui ne s’intersectent pas) et est symétrique par rapport au plan {z = 0} :
on notera C± les parties C± = C ∩ {±z > 0}.  
6x 4y 0
Les courbes C± sont régulières. En effet, la différentielle D(f1 , f2 )(x, y, z) =
2x 2y 2z
est de rang 2 le long de C± : si y 6= 0, la différentielle partielle Dy,z (f1 , f2 ) est inversible et
le théorème des fonctions implicites assure l’existence d’un paramétrage local (x, y(x), z(x))
de C , alors que si x 6= 0, il existe un paramétrage local (x(y), y, z(y)) de C± .
Considérons la fonction hauteur h : (x, y, z) → z sur C+ . La fonction h atteint ses
extrema en des points m = (x, y, z) où les formes linéaires Dh, Df1 , Df2 sont linéairement
dépendantes : la matrice
   
Dh 0 0 1
Df1  (x, y, z) = 6x 4y 0 
Df2 2x 2y 2z
est non régulière
p sipet seulement si xy = 0. Les points critiques
p deph sur C sont donc
m± = (0, ± 1/2, 1/2) (minimum de h|C+ ) et M± = (± 1/3, 0, 2/3) (maximum de
h|C+ ). Au voisinage de m± , en utilisant le paramétrage en x, on a le long de C
6x + 4y 0 (x)y(x) = 0, 2x + 2y 0 (x)y(x) + 2z 0 (x)z(x) = 0
d’où z 0 (x) = x/(2z(x)) et z 00 (x(m± )) = 1/(2z(x(m± =)) : m± est un minimum. Au voisinage
de M± on utilisera un paramétrage en y et on aura z 0 (y) = −y/(3z(y)), d’où z 00 (M± ) =
−1/(3z(M± )) : M± est un maximum local de z|C+ .

6.3. Appendice : rappels sur les formes quadratiques


Soit E un espace vectoriel. Une forme quadratique q sur E est associée à une forme
bilinéaire symétrique S suivant q(v) = S(v, v), v ∈ E . La forme quadratique q détermine la
forme bilinéaire symétrique S
2S(v, w) = q(v + w) − q(v) − q(w), v, w ∈ E.
Une forme quadratique q est dite positive (resp. négative) si q(v) ≥ 0 (resp. ≤ 0) pour tout
vecteur v ; elle est dite définie si l’inégalité est stricte pour tout vecteur v non nul.
Dans l’espace euclidien Rn muni du produit scalaire canonique h , i, la donnée de la
forme bilinéaire symétrique S est équivalente à celle d’un opérateur (ou d’une matrice)
symétrique A : hAv, wi = S(v, w), v, w ∈ Rn . Une matrice symétrique A est diagonalisable
dans une base orthonormée (vi )i=1,...,n . Ainsi, si αi est la valeur propre du vecteur propre vi
de la matrice A, associée à la forme bilinéaire déterminée par q , on a
n
! n
X X
q yi vi = αi yi2 .
i=1 i=1
Le nombre de αi non nuls est égal au rang de A : c’est le rang de la forme quadratique q .
Le nombre de valeurs propres positives (resp. négatives) est noté n+ (resp. n− ) : le couple
(n+ , n− ) est appelé la signature de la forme quadratique et l’entier n− son indice.
Le rang r est égal à la somme des entiers de signature (r = n+ + n− ). L’indice n− de
la forme quadratique q sur Rn est caractérisé comme étant le maximum de la dimension
d’un sous-espace E de Rn tel que q|E soit définie négative. C’est aussi le nombre de carrés
négatifs dans toute écriture
q(v) = ±`1 (v)2 ± `2 (v)2 ± . . . ± `m (v)2 ,
où les `k , k = 1, . . . , m sont des formes linéaires indépendantes : m est alors le rang de q .

Vous aimerez peut-être aussi