0% ont trouvé ce document utile (0 vote)
81 vues44 pages

Chapitre 2 (Calcul Diff)

Le document présente le cours de Calcul Différentiel dans les espaces de Banach, abordant des concepts clés tels que la dérivabilité, les applications différentiables, et les théorèmes fondamentaux du calcul différentiel. Il explore également les notions de différentielle d'ordre supérieur et les formules de Taylor. Ce chapitre vise à généraliser le calcul différentiel traditionnel à des espaces vectoriels normés, en mettant l'accent sur les propriétés spécifiques des espaces de Banach.

Transféré par

Simo FadiLi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
81 vues44 pages

Chapitre 2 (Calcul Diff)

Le document présente le cours de Calcul Différentiel dans les espaces de Banach, abordant des concepts clés tels que la dérivabilité, les applications différentiables, et les théorèmes fondamentaux du calcul différentiel. Il explore également les notions de différentielle d'ordre supérieur et les formules de Taylor. Ce chapitre vise à généraliser le calcul différentiel traditionnel à des espaces vectoriels normés, en mettant l'accent sur les propriétés spécifiques des espaces de Banach.

Transféré par

Simo FadiLi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Département de Mathématiques et Informatique

LE-EM-S6
Cours de Calcul Différentiel
Chapitre II
∗ Calcul différentiel dans les espaces de Banach ∗

SMBA
- U -
S F
N

è
E

SF
F

Prof. Med SHIMI


F
F

S
E

N
è

S F
- U -
SMBA

Q [email protected] Q

Année universitaire : 2023-2024


2 Calcul différentiel dans les espaces de Banach 2
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.1 Applications différentiables - Différentielle . . . . . . . . . . . . . . . . . . . . . 2
2.1.1 Définitions et Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.2 Opérations sur les applications différentiables . . . . . . . . . . . . . . . . . . 9
2.2 Théorème des accroissements finis . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.1 Cas des fonctions d’une variable réelle . . . . . . . . . . . . . . . . . . . . . . 13
2.2.2 Cas général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Applications de classe C 1 et différentielles partielles . . . . . . . . . . . . . . . 15
2.4 Différentielle d’ordre supérieur . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.1 Différentielle seconde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.2 Différentielle d’ordre supérieur . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5 Formules de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.5.1 Intégration des fonctions à valeurs dans un espace de Banach . . . . . . . . . . 23
2.5.2 Formules de Taylor dans le cas E = R . . . . . . . . . . . . . . . . . . . . . . 25
2.5.3 Formules de Taylor dans le cas général . . . . . . . . . . . . . . . . . . . . . . 26
2.6 Théorèmes des fonctions implicites et d’inversion locale . . . . . . . . . . . . 28
2.6.1 Théorème du point fixe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.6.2 Théorème d’inversion locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.6.3 Théorème des fonctions implicites . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.7 Extremums . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.7.1 Notions de bases d’optimisation . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.7.2 Extremas d’une fonction réelle (f : E 7→ R) . . . . . . . . . . . . . . . . . . . 39
2.7.3 Convexité, différentiabilité et minimisation . . . . . . . . . . . . . . . . . . . . 42

1
Chapitre
Calcul différentiel dans

2 les espaces de Banach

Introduction
Le calcul différentiel est une branche fondamentale de l’analyse mathématique qui étudie le com-
portement local des fonctions, notamment leur dérivabilité, leur continuité et leurs propriétés relatives
à la variation. Il fournit aussi des outils pour l’étude des problèmes d’optimisation, des équations dif-
férentielles, des équations aux dérivées partielles. Traditionnellement, le calcul différentiel est étudié
dans le cadre des espaces euclidiens, tels que Rp , où les concepts de dérivée et de gradient sont bien
définis.

Le calcul différentiel des "fonctions à plusieurs variables", c’est-à-dire des fonctions d’un ouvert de
R à valeurs dans Rq , p, q ∈ N∗ (voir Analyse 5), se généralise en remplaçant les espaces de dimension
p

finie Rp et Rq par des espaces vectoriels normés, de dimension pouvant être infinie. Si les résultats en
dimension finie ne dépendent pas pour l’essentiel du choix des normes sur Rp et Rq , parce que toutes
les normes sur un même espace Rp sont équivalentes, il n’en est pas de même en dimension infinie.
En particulier, beaucoup d’énoncés se placent dans le cadre des espaces de Banach, c’est-à-dire des
espaces vectoriels normés complets.

Après les résultats traités dans le chapitre I sur les espaces vectoriels normés, en particulier les
espaces de Banach, nous introduisons dans ce chapitre la notion de différentielle en un point d’une
application f : U → F d’un ouvert U d’un espace vectoriel normé E et à valeurs dans un espace
vectoriel normé F . Ceci permet d’introduire les notions d’application différentiable, puis de classe
C 1 , puis par la suite, les différentielles d’ordre supérieur et les applications de classe C k , k ≥ 1. On
redémontre dans ce cadre les résultats du calcul différentiel : propriété de linéarité de la différentielle,
formule pour la différentielle d’une application composée, théorème des accroissement finis, théorème
fondamental du calcul différentiel, lemme de Schwarz, formule de Taylor, etc.

La fin du chapitre est consacrée à la démonstration de trois théorèmes fondamentaux du calcul


différentiel dans les espaces de Banach : le théorème de point fixe (attribué à S. Banach ou à E.
Picard), le théorème des fonctions implicites et le théorème d’inversion locale.

−−−−∗∗∗−−−−

2.1 Applications différentiables - Différentielle


Nous commençons par des rappels sur la notion de dérivée dans le cas le plus simple des fonctions
à variables réelles et valeurs réelles.

Fonction réelle dérivable : Soit I un intervalle ouvert de R et f : I → R une fonction réelle. On


f (x) − f (a)
dit que f est dérivable en a ∈ I si et seulement si le rapport , admet une limite lorsque
x−a
x tend vers a. Cette limite, comme toute limite de fonction si elle existe est alors unique ; on la note

2
Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

f ′ (a). Il s’agit ici d’un nombre réel. On dit que f ′ (a) est la dérivée de f en a. Si f est dérivable en
tout point a de I, on en déduit une fonction I ∋ a → f ′ (a) ∈ R, appelée fonction dérivée de f .
Remarquons que, dire que f est dérivable en a, équivaut à dire qu’il existe un réel f ′ (a), tel que la
fonction
1
I\{a} ∋ x 7−→ [f (x) − f (a) − f ′ (a)(x − a)] ∈ R
x−a
tend vers 0 lorsque x tend vers a. Ceci revient encore à dire qu’il existe un réel f ′ (a) et une fonction
εa : I → R qui tend vers 0 lorsque x tend vers a tels que :

∀x ∈ I : f (x) − f (a) − f ′ (a)(x − a) = (x − a)εa (x). (2.1)

Interprétation géométrique : f ′ (a) est la pente de la tangente au graphe de f au point (a, f (a)).

Considérons maintenant le cas un peu plus général (par des fonctions à variables dans le corps K = R
(ou C ) et à valeurs dans R2 ). Soit Ω un ouvert de K (i.e par exemple un intervalle ouvert si K = R,
ou un disque ouvert si K = C) et a ∈ Ω. La définition ci-dessus de la dérivée d’une application réelle
est transposable à la lettre dans ce nouveau contexte, puisque l’on dispose bien de la notion de limite
dans R2 .

Fonction à valeurs dans R2 : On dit que l’application f : Ω → R2 est dérivable en a si et seulement


1
si la fonction Ω\{a} ∋ a 7→ [f (x) − f (a)] ∈ R2 admet une limite en a dans R2 (nécessairement
x−a

− →

unique et noté f ′ (a) ), ou de façon équivalente si et seulement si il existe un vecteur f ′ (a) ∈ R2 et
une application εa : Ω → R2 de limite nulle en a, tel que :


∀x ∈ Ω : f (x) − f (a) = f ′ (a)(x − a) + |x − a|εa (x). (2.2)

Remarque 2.1.1

• Dans cette définition, la norme de R2 intervient (la notion de limite dépend a priori de la norme
choisie sur R2 ), la notion de dérivabilité et de dérivée en un point dépend donc a priori de la
norme que l’on se donne sur R2 . Mais dans le cas de R2 toutes les normes étant équivalentes,
la dérivabilité et la dérivée de f en un point sont indépendantes de la norme choisie.

• La définition de dérivabilité (2.2) n’a plus de sens dès que f est définie sur un espace vectoriel


quelconque E, puisque dans ce cas le produit (x − a) · f ′ n’a plus de sens !

• Le but de ce cours est de donner une notion pertinente de "dérivée", pour les applications à
variables dans un espace vectoriel normé E de dimension > 1. Pour cela, on remarquera que


l’application L : K ∋ x 7→ x. f ′ ∈ R2 est linéaire, sur ce modèle on remplacera donc dans le
cas générale la définition (2.2) par : "il existe une application linéaire La : E → F , et une

Prof. Mohammed SHIMI 3 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

application pa : Ω → F qui tend vers 0F lorsque sa variable tend vers 0E , telles que :

∀x ∈ Ω : f (x) − f (a) = La (x − a) + ∥x − a∥pa (x − a).

Cependant, lorsque la dimension de E est infinie, il se peut qu’une telle application linéaire
La ne soit pas continue en 0E . On réclamera alors, dans la définition ci-dessus, afin qu’elle soit
plus forte que la continuité de f en a, que l’application linéaire La soit continue.

2.1.1 Définitions et Exemples


Pour une fonction f : R → R d’une seule variable, une autre façon d’écrire (2.1) est qu’il existe
ℓ ∈ R tel que
f a + h) − f (a) − ℓ · h
lim = 0,
h→0 h
et on note ce ℓ par f ′ (a). De sorte que l’on a f (a + h) ≃ f (a) + f ′ (a) · h (pour h réel, assez petit).
Autrement dit, on approche l’application h 7→ f (a + h) − f (a) par une fonction linéaire h 7→ f ′ (a) · h.
Nous allons faire ce même travail en dimension supérieure.

Dans ce qui suit, on se donne deux espaces de Banach E et F , et un ouvert non vide U ⊂ E. On
considère une application f : U → F .
Le fait que U soit ouvert permettra de considérer les valeurs de f au voisinage de tout point de U .
Si cela n’était pas le cas, il faudrait restreindre la définition qui suit aux points intérieurs à U .

Définition 2.1.1 (Différentiabilité)


Soient f : U → F et a ∈ U . On dit que f est différentiable en a s’il existe L ∈ L (E, F ) telle
que

∀ε > 0, ∃η > 0, ∀h ∈ E, ∥h∥E < η =⇒ ∥f (a + h) − f (a) − L(h)∥F < ε∥h∥E .

De façon équivalente, f est différentiable en a s’il existe L ∈ L (E, F ) telle que

1
lim (f (a + h) − f (a) − L(h)) = 0. (2.3)
h→0E ∥h∥E

On écrira encore f (a + h) = f (a) + L(h) + o(h).

Remarque 2.1.2
Puisque a ∈ U qui est ouvert, la fonction h 7→ f (a + h) est bien définie sur un voisinage de 0,
i.e. pour ∥h∥E est assez petite.

Proposition 2.1.1 (Différentielle)


Soient f : U → F et a ∈ U . Si f est différentiable en a alors l’application L est unique. Elle
est appelée différentielle de f en a et est notée df (a), ou encore Df (a) , da f ou Da f .

à Preuve. Soient L1 et L2 dans L (E, F ) telles que


1 1
lim (f (a + h) − f (a) − L1 (h)) = lim (f (a + h) − f (a) − L2 (h)) = 0.
h→0E ∥h∥E h→0E ∥h∥E

1
Par différence on a donc lim (L1 (h) − L2 (h)) = 0.
h→0E ∥h∥E

Prof. Mohammed SHIMI 4 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

x
Soit x ∈ E \ {0}. On a xn := −→
n n→+∞
0 et donc

1 1 1
0 = lim (L1 (h) − L2 (h)) = lim (L1 (xn ) − L2 (xn )) = (L1 (x) − L2 (x)) ,
h→0E ∥h∥E n→+∞ ∥xn ∥E ∥x∥E

Ainsi, pour tout x ∈ E, on a : L1 (x) = L2 (x). ✓


Remarque 2.1.3
La notion de différentiabilité (et de différentielle) fait intervenir la notion de limite. Tout comme
pour la continuité, elle dépend donc du choix des normes sur E et sur F . Lorsqu’il peut y
avoir ambiguïté sur le choix de celle(s)-ci on précisera bien pour quelle norme la fonction est
différentiable.

Définition 2.1.2 (La différentielle)


Soit f : U → R. On dit que f est différentiable sur U si f est différentiable en tout x ∈ U . On
appelle alors la différentielle de f l’application

df : U −→ L (E, F )
x 7−→ df (x) = dx f.

↬ Lorsque f est différentiable, la différentielle da f de f en chaque point a ∈ U est une application


linéaire de E dans F (alors que f est définie sur un ouvert U ⊂ E à valeurs dans F ), et la différentielle
de f est l’application définie sur U qui à a ∈ U associe da f ∈ L (E, F ). On fera également bien
attention au fait que dans la définition de différentiabilité on impose à l’application linéaire L d’être
continue.

Proposition 2.1.2
Soit f : U → F et a ∈ U . Si f est différentiable en a alors f est continue en a.

à Preuve. Si f est différentiable en x, alors on a

f (x + h) = f (x) + dx f (h) + ∥h∥E ε(h)

où ε(h) → 0 quand ∥h∥E → 0, et donc

∥f (x + h) − f (x)∥F ⩽ ∥ dx f ∥ ∥h∥E + ∥h∥E ∥ε(h)∥F

car dx f est linéaire continue, donc f (x + h) − f (x) tend bien vers 0 quand ∥h∥E → 0. ✓
Remarque 2.1.4
Si on avait f (a + h) = f (a)+L(h)+o(h) avec L qui n’est pas continue, en particulier elle ne serait
pas continue en 0 et donc f ne serait pas continue en x0 . Mais, si E est de dimension finie alors,
d’après la Proposition 1.2.1, L est d’office continue, ce qui simplifie l’étude de la différentiabilité.

Exemple 2.1.1

① Lorsque E = R (resp. Rn ) et F = R, on retrouve évidemment les notions de fonctions dérivables


(resp. différentiables), telles que vue auparavant. (Dans ces deux cas on est en dimension finie
donc toutes les normes sont équivalentes et toutes les applications linéaires sont continues.)

② Les applications constantes sont différentiables, de différentielle nulle. En effet, pour une fonc-
tion constante f , on a pour tout (x, h) ∈ U × E (avec ∥h∥ assez petit pour que x + h ∈ U ),
f (x + h) − f (x) = 0.

Prof. Mohammed SHIMI 5 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

③ Une application linéaire est différentiable ssi elle est continue. En particulier, si E est de di-
mension finie, toutes les applications linéaires L : E → F sont continues et donc différentiables.
De plus la différentielle d’une application linéaire continue est l’application linéaire elle-même.

④ Plus généralement, toute application multi-linéaire continue est différentiable. De plus, si φ ∈


L (E1 , . . . , En ; F ) alors sa différentielle est donnée par
n
X
dφ (x1 , · · · , xn ) · (h1 , · · · , hn ) = φ (x1 , · · · , xj−1 , hj , xj+1 , · · · , xn ) .
j=1

Dans cette écriture légèrement abusive, le premier terme de la somme est évidemment φ (h1 , x2 , · · · , xn )
et le dernier φ (x1 , · · · , xn−1 , hn ). Le cas n = 1 est celui des applications linéaires continues !
Voyons le cas n = 2. Pour une application φ bilinéaire :

φ (x1 + h1 , x2 + h2 ) − φ (x1 , x2 ) − [φ (h1 , x2 ) + φ (x1 , h2 )] = φ (h1 , h2 ) .

Si de plus φ est continue, il existe C > 0 tel que


C
∥φ (h1 , h2 )∥F ≤ C ∥h1 ∥E1 ∥h2 ∥E2 ≤ ∥(h1 , h2 )∥2E .
2
(On a utilisé ici l’inégalité 2ab ≤ a2 + b2 , se déduisant de l’identité remarquable (a − b)2 =
a2 + b2 − 2ab.) On en déduit que

∥φ (x1 + h1 , x2 + h2 ) − φ (x1 , x2 ) − φ (h1 , x2 ) − φ (x1 , h2 )∥F


−−−−−−−−−−−→ 0
∥(h1 , h2 )∥E (h1 ,h2 )→(0E1 ,0E2 )

De plus, la différentielle de φ est

dφ : E1 × E2 → L (E1 × E2 ; F )
(x1 , x2 ) 7→ dφ (x1 , x2 ) : (h1 , h2 ) 7→ φ (h1 , x2 ) + φ (x1 , h2 )

est continue : c’est même une application linéaire continue, de norme inférieure ou égale à 2∥φ∥.
Le cas général se traite par récurrence sur n.

⑤ Si E = R et F est un espace vectoriel normé quelconque, alors tout élément L ∈ L (E, F ) est
de la forme x 7→ xℓ où ℓ ∈ F . En effet, si on pose L(1) = ℓ, alors L(x) = xL(1) = xℓ, pour tout
x ∈ R. La fonction f est donc différentiable en x0 s’il existe ℓ ∈ F tel que
f (x0 +h)−f (x0 )
lim 1 (f (x0 + h) − f (x0 ) − ℓh) = 0 ⇐⇒ lim =ℓ
h→0 |h| h→0 h

ce qui est précisément la définition de dérivabilité en x0 , dans le cas où E = F = R. Par


abus de langage, on étendra cette définition de dérivabilité au cas où F est un espace vectoriel
normé quelconque, en disant que f : R → F est dérivable en x0 s’il existe ℓ ∈ F tel que
lim f (x0 +h)−f
h
(x0 )
= ℓ, et on note ℓ = f ′ (x0 ), qu’on appelle dérivée de f en x0 . Ainsi f : R → F
h→0
est différentiable en un point x0 ∈ R si et seulement si elle dérivable en x0 . On fera juste
attention au fait que ℓ = f ′ (x0 ) est le vecteur dérivé de f en x0 tandis que dx0 f ∈ L (R, R) est
l’application h 7→ hf ′ (x0 ).

⑥ Soient E, F des K-espaces vectoriels normés quelconques. On considère f : x 7→ u0 + L(x) où


L est une application linéaire continue. (On dit que f est une application affine). Alors en tout
point x ∈ E, on a

f (x + h) = u0 + L(x + h) = u0 + L(x) + L(h) = f (x) + L(h)

et donc f est différentiable en x : on a dx f (h) = L(h).

Prof. Mohammed SHIMI 6 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

⑦ E = R2 et F = R. On définit f sur E par la relation f : (x, y) 7→ f (x, y) = xy. On munit E de


la norme ∥·∥2 par exemple (sur R2 , toutes les normes sont équivalentes). Pour tout (h1 , h2 ) ∈ E,
on a
f (x0 + h1 , y0 + h2 ) = (x0 + h1 ) (y0 + h2 )
= x0 y0 + y0 h1 + x0 h2 + h1 h2
= f (x0 , y0 ) + L (h1 , h2 ) + h1 h2 ,
où l’on a posé L (h1 , h2 ) := y0 h1 + x0 h2 . L’application L est bien linéaire continue, et on
remarque que
|h1 h2 | ⩽ 21 h21 + h22 = 12 ∥(h1 , h2 )∥22 = o (∥(h1 , h2 )∥2 ) ,


donc f est différentiable en (x0 , y0 ) et pour tout (h1 , h2 ) ∈ E, on a

d(x0 ,y0 ) f (h1 , h2 ) = y0 h1 + x0 h2 .

⑧ E = Rn et F = R. La définition classique de la différentiabilité dans ce cas est la suivante : f


est différentiable en a = (a1 , . . . , an ) si toutes les dérivées partielles de f au point a existent et
si !
n
1 X ∂f
lim f (a + h) − f (a) − (a)hi = 0.
h→0 ∥h∥ ∂x i
i=1

Si f vérifie la propriété ci-dessus, alors elle est différentiable au sens de la Définition 2.1.1,
n
X ∂f
avec L(h) := (a)hi . Inversement, si f est différentiable au sens de la Définition 2.1.1, en
i=1
∂xi
prenant h = (0, . . . , 0, hi , 0, . . . , 0) on en déduit que f admet une dérivée partielle par rapport
∂f
à la ième variable en a, avec ∂x i
(a) = da f (ei ), puis que

n
!
1 X ∂f 1
f (a + h) − f (a) − (a)hi = (f (a + h) − f (a) − da f (h)) −→ 0.
∥h∥ i=1
∂x i ∥h∥ h→0

n
X ∂f
En particulier da f (h) = (a)hi .
i=1
∂x i

↬ Dans Rn , le calcul des dérivées partielles nous donne le candidat pour la différentielle si f est
différentiable. Pour un espace E général, la Définition 2.1.1 semble difficile à appliquer puisqu’il faut
trouver une application linéaire continue L qui satisfasse (2.3). La notion suivante généralise celle de
dérivée partielle et sera utile dans la pratique pour trouver l’application linéaire L candidate à être
la différentielle (voir Exemple 2.1.2).

Définition 2.1.3 (Dérivées directionnelles)


Soient f : U → F, a ∈ U et v ∈ E. On dit que f est dérivable en a dans la direction v si
la fonction d’une variable réelle fv : t 7→ f (a + tv), définie au voisinage de 0, est dérivable en
0. Elle est notée f ′ (a; v)

Remarque 2.1.5
Si E = Rn , F = R et (e1 , . . . , en ) désigne la base canonique de Rn , dire que f est dérivable en a
dans la direction ei signifie que f admet une dérivée partielle par rapport à la ième variable en a.

Prof. Mohammed SHIMI 7 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Définition 2.1.4 (Différentielle de Gâteaux )


Soit E et F deux espaces vectoriels normés et f une application d’un ouvert U de E à valeurs
dans F . On dit que f est différentiable au sens de Gâteaux au point a ∈ U s’il existe une
application linéaire continue L : E → F telle que, pour tout v ∈ E,

1
lim (f (a + tv) − f (a)) = L(v).
t→0 t

L est alors appelée la différentielle de Gâteaux de f en a.

↬ Nous allons maintenant vérifier que cette notion est plus faible que la notion usuelle de différen-
tiabilité (aussi appelée différentiabilité au sens de Fréchet). C’est-à-dire la différentiabilité est une
notion plus forte que l’existence des dérivées directionnelles suivant toutes les directions.

Proposition 2.1.3
Si f : U → F, a ∈ U et f est différentiable en a, alors f est dérivable en a dans n’importe
quelle direction v et on a : fv′ (0) = da f (v).

à Preuve. Puisque f est différentiable en a, pour t assez petit on a

f (a + tv) = f (a) + da f (tv) + o(tv) = f (a) + tda f (v) + o(t).

fv (t) − fv (0)
Donc − da f (v) = o(1) −−→ 0. ✓
t t→0

Remarque 2.1.6
Une fonction peut être dérivable en un point x0 dans toutes les directions sans être différentiable.
Par exemple, Soit f : R2 → R définie par
( 2
y
si x ̸= 0
f (x, y) = x
0 si x = 0

On peut montrer que f est dérivable en (0, 0) dans toutes les directions mais qu’elle n’y est pas
différentiable.
2
Eb effet : pour h = (a, b), on a f (th)−f
t
(0,0)
= ba si a est non nul, f (th)−f
t
(0,0)
= 0 sinon. f admet
donc bien une dérivée suivant h. Mais f n12 , n1 = 1 ne tend pas vers 0 , alors que f (0, 0) = 0, ce
qui prouve que f n’est pas continue en (0, 0).

➥ Dans la pratique, pour voir si une fonction est différentiable en a et calculer da f on pourra suivre
le schéma suivant :

❶ Étant donné v ∈ E, montrer que f est dérivable dans la direction v en a, i.e. fv′ (0) existe. (Si
f est différentiable elle doit être dérivable dans toutes les directions.)

❷ Montrer que l’application L : v 7→ fv′ (0) est linéaire continue (si f est différentiable on doit
avoir fv′ (0) = da f (v)).

❸ Montrer que f (a + h) − f (a) − L(h) = o(h).


Exemple 2.1.2
Soit f : Mn (R) ∋ M 7→ M 2 ∈ Mn (R). On veut montrer que f est différentiable sur Mn (R) et
calculer dM f .

• On est en dimension finie donc toutes les normes sont équivalentes et la différentiabilité de

Prof. Mohammed SHIMI 8 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

f ne dépendra de la norme choisie.

• Afin d’avoir le maximum de propriétés on munit Mn (R) d’une norme d’application linéaire
n
X
(on parlera aussi de norme matricielle), par exemple ∥M ∥ = max |aij |, pour M = (aij ).
j
i=1

• L’avantage de choisir une norme de ce type est qu’en plus de l’inégalité triangulaire on a
aussi la propriété de norme d’algèbre : si M, N ∈ Mn (R) on a ∥M N ∥ ≤ ∥M ∥ ∥N ∥.

• Soit M ∈ Mn (R), pour étudier la différentiabilité de f en M on va suivre le schéma ci-


dessus.

(i)- Pour H ∈ Mn (R), on étudie la dérivabilité en t = 0 de fH (t) = (M + tH)2 . On a


1
(fH (t) − fH (0)) = 1t M 2 + tM H + tHM + t2 H 2 − M 2 = M H+HM +tH 2 −→ M H+HM.

t t→0

(ii)- Soit L : Mn (R) → Mn (R) définie par L(H) = M H + HM . On vérifie facilement que
L est une application linéaire. Par ailleurs, Mn (R) est de dimension finie donc L est
continue.
(iii)- On regarde si f (M + H) − f (M ) − L(H) = o(H). En effet

1 ∥H∥2
(M + H)2 − M 2 − L(H) = = ∥H∥ −→ 0.
∥H∥ ∥H∥ H→0

En conclusion, f est différentiable en M et dM : H 7→ M H + HM .

2.1.2 Opérations sur les applications différentiables


On a bien sûr les propriétés usuelles de somme, de produit et de composition pour les fonctions
différentiables sur des espaces vectoriels normés quelconques.

Proposition 2.1.4 (Différentielle d’une combinaison linéaire)


Soient E et F des espaces vectoriels normés, U un ouvert de E, f et g deux applications de U
dans F , soient a ∈ U et λ ∈ R. Si f et g sont différentiables en a, alors (λf +g) est différentiable
en a, et da (λf + g) = λda f + da g.

à Preuve. La preuve se fait directement en écrivant la définition de la différentiabilité. ✓


Remarque 2.1.7
On en conclut que l’ensemble des applications différentiables en un point de E est un sous-
espace vectoriel de l’espace des applications continues en a, on le note D(a) . De plus, l’application
Da : D(a) → L (E; F ) qui à f associe da f est une application linéaire.

Avec la structure d’algèbre normé, (voir Chapitre 1), on dispose de la structure nécessaire pour définir
la différentielle d’un produit.

Proposition 2.1.5 (Produit d’applications différentiables)


Soient (E, ∥ · ∥E ) un espace vectoriel normé, (F, ∥ · ∥F ) une algèbre normée, U un ensemble
ouvert dans (E, ∥ · ∥E ) et f et g deux applications de U dans F . Si les applications f et g
sont différentiables en a ∈ U alors le produit f × g est différentiable en a et la différentielle de
(f × g) en a est l’application da (f × g) définie par
∀h ∈ E, da (f × g)(h) = da f (h) × g(a) + f (a) × da g(h).

Prof. Mohammed SHIMI 9 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

à Preuve. Pour montrer que f × g est différentiable en a ∈ U , de différentielle l’application


da (f × g) : h ∈ E 7→ da f (h) × g(a) + f (a) × da g(h), nous allons montrer que pour tout h ∈ E, on a

(f × g)(a + h) = (f × g)(a) + da (f × g)(h) + o (∥h∥E ) .

On peut remarquer que comme les applications da f et da g sont des applications linéaires continues,
l’application da (f × g) est une application linéaire continue.
Puisque les applications f et g sont différentiables en a, pour tout h au voisinage de 0 dans E on a

f (a + h) = f (a) + da f (h) + o (∥h∥E ) ,


(2.4)
g(a + h) = g(a) + da g(h) + o (∥h∥E ) = g(a) + o(1).

Or :

(f × g)(a + h) − (f × g)(a) = (f (a + h) − f (a)) × g(a + h) + f (a) × (g(a + h) − g(a)).

En utilisant les relations (2.4), on en déduit que

(f × g)(a + h) − (f × g)(a) = (da f (h) + o (∥h∥E )) × (g(a) + o(1)) + f (a) × (da g(h) + o (∥h∥E ))
=da f (h) × g(a) + f (a) × da g(h) + o (∥h∥E )
=da (f × g)(h) + o (∥h∥E ) .

Le résultat est démontré. ✓

Exemple 2.1.3
En utilisant la proposition précédente, on retrouve le résultat de l’exemple 2.1.2. En effet.

• L’application id : Mn (R) ∋ M 7→ M étant une application linéaire, elle est différentiable


sur Mn (R) et
∀M ∈ Mn (R), dM id : Mn (R) ∋ H 7−→ H.

• L’espace d’arrivée Mn (R) pouvant être muni d’une structure d’algèbre, on peut s’intéresser
à l’application f = id × id : Mn (R) ∋ M 7→ M 2 . D’après la Proposition 2.1.5, cette
application est différentiable sur Mn (R) et on a

∀M ∈ Mn (R), dM f : Mn (R) ∋ H 7−→ HM + MH.

↬ Dans le cas des applications de variables et de valeurs réelles, f : I → R, g : J → R, (I et J étant


deux intervalles ouverts de R) lorsque la composée g ◦ f a un sens, c’est-à-dire lorsque f (I) ⊂ J, on
sait que la dérivabilité de f en un point a de I et celle de g en f (a) = b impliquent, la dérivabilité
de g ◦ f en a et que de plus (g ◦ f )′ (a) = g ′ (f (a)) × f ′ (a).

On dispose, dans le cas des applications définies sur un espace vectoriel normé quelconque, d’une
généralisation de ce résultat. Il s’agit d’un résultat qualitatif (existence de la différentielle de la
composée) aussi bien que quantitatif (expression de cette différentielle en fonction des différentielles
des applications qui entrent dans la composition). À ce double titre, le Théorème des applications
composées s’avère extrêmement pratique.

Théorème 2.1.1 (Différentielle des applications composées )


Soient E, F et G trois espaces vectoriels normés. Soient U ⊂ E, V ⊂ F des ouverts, f : U → F
telle que f (U ) ⊂ V , g : V → G et a ∈ U . Si f est différentiable en a et g est différentiable en
f (a), alors la fonction g ◦ f : U → G est différentiable en a et on a da (g ◦ f ) = df (a) g ◦ da f.

Prof. Mohammed SHIMI 10 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

à Preuve. Notons

φ(h) =f (x + h) − f (x) − dx f · h, pour tout h ∈ E,


ψ(k) =g(y + k) − g(y) − dy g · k, pour tout k ∈ F avec, y = f (x).

Par définition de la différentiabilité de f et de g,

∥φ(h)∥F ∥ψ(k)∥G
lim =0 et lim = 0,
h̸=0E ∥h∥E k̸=0F ∥k∥F

ce que l’on peut aussi exprimer sous la forme

∥ψ(k)∥G = ε(k)∥k∥F avec lim ε(k) = 0.


k→0F

On a
g(f (x + h)) − g(f (x)) = g(f (x) + dx f · h + φ(h)) − g(f (x))
= dy g · (dx f · h + φ(h)) + ψ(dx f · h + φ(h)).
Par conséquent, pour h ̸= 0E ,
∥g(f (x+h))−g(f (x))−dy g·(dx f ·h)∥G ∥dy g·φ(h)+ψ(dx f ·h+φ(h))∥G
∥h∥E
= ∥h∥E
 
≤ ∥dy g∥ ∥φ(h)∥
∥h∥E
F
+ ∥dx f ∥ + ∥φ(h)∥F
∥h∥E
ε(dx f · h + φ(h)).

Les deux derniers terme ci-dessus tendent bien vers 0 lorsque h tend vers 0E puisque c’est le cas de
∥φ(h)∥F
∥h∥E
, que dx f · h + φ(h) tend vers 0F et que ε(k) tend vers 0 lorsque k tend vers 0F .
On en conclut que g ◦ f est différentiable en a, de différentielle en a l’application da (g ◦ f ) : E ∋
h 7−→ df (a) g (da f (h)). ✓
On termine cette section avec un cas particulier de différentiabilité, celle de l’application inversion
des isomorphismes linéaires.

Théorème 2.1.2 (Différentielle de l’application inversion)


Soient E et F deux espaces de Banach tels que l’ensemble Isom(E, F ) des isomorphismes est
non vide et Ψ : Isom(E, F ) → Isom(F, E) l’application u 7→ u−1 . Alors Ψ est différentiable et
sa différentielle est donnée par

du Ψ(h) = −u−1 ◦ h ◦ u−1 , pour tout h ∈ L (E, F ).

à Preuve. Soit u ∈ Isom(E, F ). L’application L : h 7→ −u−1 ◦ h ◦ u−1 est visiblement linéaire et


2
vérifie, (d’après la Proposition 1.3.2 du Chapitre 1), ∥L(h)∥ ≤ u−1 ∥h∥, de telle sorte que L soit
−1 −1
continue, i.e. L ∈ L (E, F ). Par ailleurs,

pour tout h ∈ B u; u , on a u + h soit inversible.
En effet, on a u + h = u ◦ I + u−1 ◦ h , et puisque u est inversible, u + h est aussi inversible si et


seulement si I +u−1 ◦h l’est. D’après le Lemme 1.4.2 du Chapitre 1 c’est le cas dès que u−1 ◦ h < 1.
−1
Comme u−1 ◦ h ≤ u−1 ∥h∥, on en déduit que si ∥h∥ < u−1 alors u + h est inversible. De
plus, on a

Ψ(u + h) − Ψ(u) − L(h) = (u + h)−1 − u−1 + u−1 ◦ h ◦ u−1


−1 −1
= I + u−1 ◦ h u − u−1 + u−1 ◦ h ◦ u−1
!
X
−1
k
= −u ◦ h u−1 − u−1 + u−1 ◦ h ◦ u−1
k≥0
X k
= −u−1 ◦ h u−1 ,
k≥2

Prof. Mohammed SHIMI 11 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

où on a utilisé le Lemme 1.4.2 du Chapitre 1 pour passer de la deuxième à la troisième ligne. Ainsi
3
−1 −1
X
−1 k+1 k ∥u−1 ∥ ∥h∥2
Ψ(u + h) − Ψ(u) + u ◦h◦u ≤ u ∥h∥ = ,
k≥2
1 − ∥u−1 ∥ ∥h∥

et donc Ψ(u + h) − Ψ(u) + u−1 ◦ h ◦ u−1 = o(h). ✓

↬ En identifiant Mn (R) et L (Rn , Rn ) (une matrice A est associée à l’application linéaire dont elle
est la matrice représentative dans la base canonique) et en prenant sur Mn (R) une norme matricielle,
on obtient le corollaire suivant :

Corollaire 2.1.1
L’application f : GLn (R) ∋ A 7−→ A−1 ∈ Mn (R) est différentiable et pour tous A ∈ GLn (R)
et H ∈ Mn (R), on a : dA (H) = −A−1 HA−1 .

Exemple 2.1.4
Considérons l’application Φ : M ∈ GLn (R) 7→ Tr M−1 qui est la composée de l’application trace


avec l’application «inversion de matrice». Schématiquement on a :

GLn (R) −→ GLn (R) −→ R


M 7−→ M−1 7−→ Tr M−1 .


L’application trace étant linéaire, alors sa différentielle en tout point est égale à elle-même, i.e.

∀M ∈ GLn (R), dM Tr : Mn (R) ∋ H 7−→ Tr(H).

D’autre part, d’après le corollaire précédent, la différentielle de f : M ∈ GLn (R) 7→ M−1 est :

∀M ∈ GLn (R), dM f : Mn (R) ∋ H 7−→ −M−1 HM−1 .

Le Théorème 2.1.2 indique que

dM Φ = df (M) Tr ◦ dM f, pour tout M ∈ GLn (R).

Autrement dit, on a

dM Φ : Mn (R) ∋ H 7−→ − Tr M−1 HM−1 .



∀M ∈ GLn (R),

Nous arrivons maintenant à l’un des résultats fondamentaux du calcul différentiel.

2.2 Théorème des accroissements finis


Pour une fonction de variable réelle et à valeurs réelles, on connaît la formule des accroissements
finis donnée par :

Théorème 2.2.1
Soit f : [a, b] → R continue sur [a, b], dérivable sur ]a, b[. Alors il existe c ∈]a, b[ tel que

f (b) − f (a) = f ′ (c)(b − a).

L’inégalité des accroissements finis en découle alors directement

Prof. Mohammed SHIMI 12 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Théorème 2.2.2
Soient I un intervalle et f : I → R dérivable. Alors pour tous a, b ∈ I on a :

|f (b) − f (a)| ≤ sup |f ′ (x)| × |b − a|.


x∈I

↬ Pour rappel, ces théorèmes sont fondamentaux dans l’étude des fonctions d’une variable. Par
exemple, le fait qu’une fonction dont la dérivée est nulle (resp. positive/négative) sur un intervalle soit
constante (resp. croissante/décroissante) en est une conséquence. Il est donc naturel de se demander
ce que deviennent ces théorèmes pour des fonctions d’un espace vectoriel normé dans un espace
vectoriel normé.

2.2.1 Cas des fonctions d’une variable réelle


On va commencer par le résultat général suivant

Théorème 2.2.3
Soient [a, b] ⊂ R, F un espace vectoriel normé et f : [a, b] → F et g : [a, b] → R deux
applications continues sur [a, b] et différentiables sur ]a, b [. Si ∥f ′ (t)∥F ≤ g ′ (t), pour tout
t ∈] a, b[, alors ∥f (b) − f (a)∥F ≤ g(b) − g(a).

à Preuve. Remarquons tout d’abord que puisque ∥f ′ (t)∥F ≤ g ′ (t), pour tout t ∈ [a, b], alors
g ′ (t) ≥ 0, pour tout t ∈ [a, b], et par suite g est croissante. Soit ε > 0. On définit le sous-ensemble de
[a, b]
Aε := {x ∈ [a, b] | ∀y ∈ [a, x], ∥f (y) − f (a)∥F ≤ g(y) − g(a) + ε(y − a)} .
Il est clair que a ∈ Aε et que si x ∈ Aε et x̄ ∈ [a, x], alors x̄ ∈ Aε , ce qui veut dire que Aε est un
intervalle. Soit c = sup Aε et on va montrer que c ∈ Aε . Si c = a alors on n’a rien à démontrer.
Par suite, on va supposer que c ̸= a. Si x ∈]a, c [, alors x ∈ Aε , i.e. ∥f (x)−f (a)∥F ≤ g(x)−g(a)+ε(x−
a). Quand x → c, on obtient, par continuité de f et g, l’inégalité ∥f (c)−f (a)∥F ≤ g(c)−g(a)+ε(c−a),
i.e. c ∈ Aε . Afin de compléter la preuve, on va montrer maintenant que c = b. On raisonne par
l’absurde.
Si c < b, pour tout h > 0 tel que c + h < b on a

f (c + h) − f (c) = f ′ (c)h + o1 (h) et g(c + h) − g(c) = g ′ (c)h + o2 (h).

On en déduit, en utilisant l’hypothèse ∥f ′ (c)∥F ≤ g ′ (c), que

∥f (c + h) − f (c)∥F = ∥f ′ (c)h + o1 (h)∥F ≤ ∥f ′ (c)∥F h + o1 (h) ≤ g ′ (c) + o1 (h)


≤ g(c + h) − g(c) − o2 (h) + o1 (h) = g(c + h) − g(c) − o(h).

Il en découle qu’il existe η ∈]0, b − c[ tel que ∀0 ≤ h ≤ η, ∥f (c + h) − f (c)∥ ≤ g(c + h) − g(c) + εh. On
en déduit que c + h ∈ Aε , pour tout 0 ≤ h ≤ η, ce qui contredit le fait que c = sup Aε . On conclut
que c = b, ce qui achève la démonstration. ✓

Théorème 2.2.4
Soit f : [a, b] → F une fonction différentiable, alors ∥f (b) − f (a)∥ ≤ sup ∥f ′ (x)∥F × (b − a).
x∈I

à Preuve. Il suffit d’appliquer le Théorème 2.2.3, en considérant la fonction g : [a, b] → R définie


∥dx f (h)∥F ∥hf ′ (x)∥F
par g(t) = t sup ∥f ′ (x)∥F . Notons que ∥dx f ∥ = sup = sup = ∥f ′ (x)∥F . ✓
x∈I h̸=0 |h| h̸=0 |h|

Prof. Mohammed SHIMI 13 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

2.2.2 Cas général

Définition 2.2.1 (Ensemble convexe)


Soient a et b sont deux éléments d’un espace vectoriel E. On appelle segment d’extrémités a
et b l’ensemble noté [a, b] défini par

[a, b] = {c ∈ E | ∃t ∈ [0, 1] c = ta + (1 − t)b} .

Un sous-ensemble X de Rn est dit convexe si

∀(a, b) ∈ X 2 [a, b] ⊂ X.

Comme précédemment, E et F désignent des R-espaces vectoriels normés.

Théorème 2.2.5 (Inégalité des accroissements finis)


Soient U un ouvert de E et f : U → F différentiable sur U , alors pour tous a, b ∈ U tels que
[a, b] ⊂ U on a
∥f (b) − f (a)∥F ≤ sup ∥dx f ∥ × ∥b − a∥E .
x∈[a,b]

à Preuve. Soit g : [0, 1] → F définie par g(t) = f ( (1 − t)a + tb ). La fonction g est différentiable
| {z }
x
(dérivable) et dt g(h) = dx f (h)(b − a). D’où

∥dt g∥ = ∥dx f (b − a)∥ ≤ ∥dx f ∥ × ∥b − a∥E ≤ sup ∥dx f ∥ × ∥b − a∥E .


x∈[a,b]

D’après le Théorème 2.2.4 on a donc

∥f (b) − f (a)∥F = ∥g(1) − g(0)∥F ≤ sup ∥dt g∥ ⩽ sup ∥dx f ∥∥b − a∥E .
t∈[0,1] x∈[a,b]


En appliquant le théorème précédent à la fonction g(x) := f (x) − da f (x − a), dont la différentielle
est dx g = dx f − da f on obtient :

Corollaire 2.2.1
Soit U un ouvert de E et f : U → F différentiable sur U , alors pour tous a, b ∈ U tels que
[a, b] ⊂ U on a :

∥f (b) − f (a) − da f (b − a)∥F ≤ sup ∥dx f − da f ∥ × ∥b − a∥E .


x∈[a,b]

↬ Si la fonction f est à valeurs dans un espace vectoriel normé quelconque, on voit donc que l’inégalité
des accroissements finis est toujours vraie. Par contre le Théorème 2.2.1 ne l’est plus, dans le sens
où il n’existe pas forcément c ∈ [a, b] tel que f (b) − f (a) = dc f × (b − a). Il reste vrai si f est définie
sur un espace vectoriel normé et à valeurs réelles.

Proposition 2.2.1
Soient U un ouvert de E et f : U → R différentiable sur U , alors pour tous a, b ∈ U tels que
[a, b] ⊂ U il existe c ∈]a, b[ tel que f (b) − f (a) = dc f × (b − a).

Prof. Mohammed SHIMI 14 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

à Preuve. Comme dans le théorème précédent on se ramène en fait aux fonctions de R dans R.
Soit g : [0, 1] → R définie par g(t) = f ( (1 − t)a + tb ). La fonction g est dérivable et
| {z }
x

g ′ (t) = dx f × (b − a).
D’après le Théorème 2.2.1 il existe r ∈]0, 1[ tel que g(1) − g(0) = g ′ (r), c’est-à-dire
f (b) − f (a) = dc f × (b − a) où c = (1 − r)a + rb.

Exemple 2.2.1
Soit f : [0, 2π] → C définie par f (t) = eit . La fonction f est différentiable et on a dt f (h) = ieit h
d’où ∥dt f ∥ = 1 pour tout t. On peut vérifier qu’on a bien

|f (t) − f (s)| ≤ t − s, pour tous 0 ≤ s ≤ t ≤ 2π.

Par contre le Théorème 2.2.1 n’est plus vrai ! En effet, f (2π) − f (0) = 0 mais pour tout t ∈ [0, 2π]
on a dt f (2π) = 2iπeit ̸= 0.

2.3 Applications de classe C 1 et différentielles partielles


Si f est une fonction différentiable sur un ouvert U , sa différentielle df est une application définie
sur U ⊂ E et à valeurs dans L (E, F ). Muni de ∥ · ∥, ce dernier est un espace vectoriel normé, on
peut donc s’intéresser à la continuité (ou à la différentiabilité de df , voir Section 2.4).

Définition 2.3.1 (Applications de classe C 1 )


Soit f : U → F une application différentiable. On dira que f est de classe C 1 si df : U →
L (E, F ) est continue.

Remarque 2.3.1
Tout comme pour la continuité et la différentiabilité, la somme et la composée de fonctions de
classe C 1 est aussi de classe C 1 .
Exemple 2.3.1
On reprend l’Exemple 2.1.2. La fonction f (M ) = M 2 est différentiable sur Mn (R) et sa différen-
tielle au point M est dM f : H 7→ M H + HM . Soit M ∈ Mn (R) et (Mk )k une suite de Mn (R)
telle que Mk → M dans Mn (R). On a

∥dMk f − dM f ∥ = sup ∥(dMk f − dM f ) (H)∥


H∈Mn (R),∥H∥=1

= sup ∥Mk H + HMk − M H − HM ∥


H∈Mn (R),∥H∥=1

≤ sup ∥(Mk − M ) H∥ + ∥H (Mk − M )∥


H∈Mn (R),∥H∥=1

≤ sup 2 ∥Mk − M ∥ ∥H∥ = 2 ∥Mk − M ∥ ,


H∈Mn (R),∥H∥−1

et donc dMk f → dM f , quand k → +∞, dans L (Mn (R)), ce qui prouve que df est continue en
M . La fonction f est bien de classe C 1 .

↬ Lorsque E1 , . . . , En sont des espaces vectoriels normés, U ⊂ E := E1 × . . . × En et f : U → F on


a une notion de différentielle partielle comme on a des dérivées partielles pour les fonctions
définies sur Rn . Celle-ci jouera un rôle important dans le Théorème des fonctions implicites.

Prof. Mohammed SHIMI 15 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Définition 2.3.2 (Différentielle partielle)


Soient U ⊂ E = E1 × . . . × En , f : U −→ F et x = (x1 , . . . , xn ) ∈ U . On dit que f admet une
différentielle partielle en x par rapport à la iième variable si l’application

fi (t) := f (x1 , . . . , xi−1 , t, xi+1 , . . . , xn ) = f (x + (t − xi ) ei )

définie au voisinage de xi ∈ Ei est différentiable au point xi .


✎ On note dix f = dxi fi ∈ L (Ei , F ) sa différentielle et elle est appelée différentielle
partielle de f en x par rapport à la iième variable.

Proposition 2.3.1
Soient U ⊂ E = E1 × . . . × En , f : U −→ F et x = (x1 , . . . , xn ) ∈ U . Si f est différentiable en
x alors f admet une différentielle partielle en x par rapport à chacune des variables et on a

dix f (hi ) = dx f (0, . . . , 0, hi , 0, . . . , 0) .

à Preuve. L’application hi 7→ dx f (0, . . . , 0, hi , 0, . . . , 0) est clairement linéaire continue. Par


ailleurs, en notant h = (0, . . . , 0, hi , 0, . . . , 0) on a

fi (xi + hi ) − fi (xi ) − dix f (hi ) = f (x + h) − f (x) − dx f (h) = o(h) = o (hi ) .


↬ Tout comme l’existence de dérivées partielles n’entraine pas la différentiabilité dans Rn , l’existence
de différentielle partielle par rapport à chacune des variables n’entraine pas la différentiabilité (Rn
est le cas particulier où E1 = · · · = En = R ), i.e. la réciproque de la proposition ci-dessus est fausse.
Cependant, si on suppose qu’en plus les différentielles partielles sont continues on a alors

Proposition 2.3.2
Si f admet une différentielle partielle par rapport à chaque variable et si pour tout i
l’application U ∋ x 7→ dix f ∈ L (Ei , F ) est continue, alors f est de classe C 1 .

à Preuve. On fait la démonstration dans le cas de f : E1 × E2 → F . On commence par montrer


que f est différentiable. Soient x = (x1 , x2 ) et V1 × V2 un voisinage ouvert convexe de x dans U , de
telle sorte que, pour tout h = (h1 , h2 ) tel que x + h ∈ V1 × V2 , on a [xi , xi + hi ] ⊂ Vi , pour i = 1, 2.
On définit les fonctions fi : Vi → F définies par

f1 (y1 ) := f (y1 , x2 + h2 ) − d1x f (y1 ) et f2 (y2 ) := f (x1 , y2 ) − d2x f (y2 ),

et on applique ensuite l’inégalité des accroissements finis à f1 entre x1 et x1 + h1 et à f2 entre x2 et


x2 + h2 (ces fonctions sont bien différentiables et même de classe C 1 et on a aussi [xi , xi + hi ] ⊂ Vi ,
pour i = 1, 2). On a
dy1 f1 (k1 ) = d1(y1 ,x2 +h2 ) f (k1 ) − d1x f (k1 ) et dy2 f2 (k2 ) = d2(x1 ,y2 ) f (k2 ) − d2x f (k2 ) .

D’où
f (x + h) − f (x) − d1x f (h1 ) − d2x f (h2 )
≤ f (x + h) − f (x1 , x2 + h2 ) − d1x f (h1 ) + f (x1 , x2 + h2 ) − f (x) − d2x f (h2 )
≤ sup d1(y1 ,x2 +h2 ) f − d1(x1 ,x2 ) × ∥h1 ∥ + sup d2(x1 ,y2 ) f − d2(x1 ,x2 ) f × ∥h2 ∥ .
y1 ∈[x1 ,x1 +h1 ] y2 ∈[x2 ,x2 +h2 ]

Puisque d1x f et d2x f sont continues en x, on en déduit que f (x + h) − f (x) − d1x f (h1 ) − d2x f (h2 ) =
o(h). Comme l’application h = (h , h ) 7−→ d1 f (h ) + d2 f (h )
1 2 x 1 x 2

Prof. Mohammed SHIMI 16 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

est linéaire continue, cela prouve que f est différentiable en x telle que :

dx f (h) = d1x f (h1 ) + d2x f (h2 ) .

La continuité de d1 f et d2 f entraine finalement celle de df . ✓

Corollaire 2.3.1
Soit f : E1 × . . . × En → F une application n-linéaire continue. Alors f est différentiable sur
E1 × . . . × En et
n
X
d(x1 ,...,xn ) f (h1 , . . . , hn ) = f (x1 , . . . , xi−1 , hi , xi+1 , . . . , xn ) .
i=1

En particulier, f admet des différentielles partielles par rapport à chaque variable et

dix f (hi ) = f (x1 , . . . , xi−1 , hi , xi+1 , . . . , xn ).

à Preuve. Voir l’Exemple 2.1.1-④. ✓

2.4 Différentielle d’ordre supérieur


Comme dans la section précédente, on considère (E, ∥ · ∥E ) et (F, ∥ · ∥F ) deux espaces vectoriels
normés sur K(= R ou C) et f une application définie sur un ouvert U de E à valeurs dans F .

2.4.1 Différentielle seconde

Définition 2.4.1 (Différentielle seconde)


Soit f : U → F une application différentiable. On dira que f est deux fois différentiable si
sa différentielle df : U → L (E, F ) est différentiable.
La différentielle de df au point x ∈ U est appelée différentielle seconde de f au point x,
c’est un élément de L (E, L (E, F )) et elle est notée d2 f (x).

Remarque 2.4.1
① Comme précédemment, la somme et la composée de fonctions deux fois différentiables est
aussi deux fois différentiable.
② Il ne semble pas forcément évident de manipuler un objet tel que la différentielle seconde :
c’est une application linéaire (continue) définie sur E mais à valeurs dans l’espace des ap-
plications linéaires (continues) de E dans F . La Proposition 1.3.3 du Chapitre 1 permet en
fait d’identifier cet espace avec celui L2 (E, F ) = L (E × E, F ) des applications bilinéaires
(continues) de E dans F , via l’isométrie Φ : L (E, L (E, F )) −→ L2 (E, F ) définie par
(Φ(u))(x, y) := (u(x))(y), pour tous u ∈ L (E, L (E, F )), (x, y) ∈ E 2 .
L’isométrie inverse Φ−1 : L2 (E, F ) → L (E, L (E, F )) est donnée par
Φ−1 (v)(x) (y) := v(x, y), pour tous v ∈ L2 (E, F ), (x, y) ∈ E 2 .

(2.5)
Selon l’identification (2.5), la différentielle seconde d’une application f : U ⊂ E → F deux
fois différentiable est l’application
d2 f : U −→ L2 (E; F )
x 7−→ d2 f (x),
telle que : d2 f (x) · (h, k) = d(df )(x) · h · k, pour tout (h, k) ∈ E × E.

Prof. Mohammed SHIMI 17 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Exemple 2.4.1
Soit f : Mn (R) → R définie par f (A) = Tr A3 . On montre alors que pour tout A ∈ Mn (R),


dA f : K 7→ 3 Tr A2 K .


Pour calculer la différentielle seconde de f en A on écrit

(d(A+tH) f − dA f )(K) = 3 Tr (A + tH)2 K − 3 Tr A2 K


 

= 3t Tr(AHK) + 3t Tr(HAK) + 3t2 Tr H 2 K .




d(A+tH) f −dA f
Donc lim t
= L(H), où L(H)(K) = 3 Tr(AHK + HAK).
t→0
On vérifie que L est une application linéaire de Mn (R) dans L (Mn (R), R). Elle
 est continue
2

(car dim (Mn (R)) < ∞). Finalement, d(A+H) f − dA f − L(H) (K) = 3 Tr H K . Et on a
n
X
2
H 2K ≤ n sup H 2 K ≤ n H 2 K ≤ n∥H∥2 × ∥K∥.
  
Tr H K = ii ii
i
i=1

D’où ∥d(A+H) f − dA f − L(H)∥ ≤ 3n∥H∥2 = o(H).


Conclusion : f est deux fois différentiable et d2A f (H, K) = 3 Tr(AHK + HAK).

↬ Cas des fonctions de Rn dans R : Si f : U ⊂ Rn → R est différentiable, sa différentielle est


n
X
∂f
dx f : (h1 , . . . , hn ) 7−→ ∂xi
(x)hi .
i=1

On montre alors que si f est deux fois différentiable alors f admet des dérivées partielles secondes
et que pour h = (h1 , . . . , hn ) et k = (k1 , . . . , kn ), via l’isomorphisme (2.5), on a
∂2f
X
d2x f (h, k) = ∂xi ∂xj
(x)hi kj .
i,j=1,...,n
 n
∂2f
La matrice Hf (x) := ∂xi ∂xj
(x) est la matrice associée à la forme bilinéaire d2x f dans la base
i,j=1
canonique et est appelée matrice hessienne de f au point x, i.e. pour tous h, k ∈ Rn on a

d2x f (h, k) = t h · Hf (x) · k.

On sait que si f est deux fois différentiable en x alors


∂2f ∂2f
∂xi ∂xj
(x) = ∂xj ∂xi
(x),

c’est le Théorème de Schwarz . Cela se traduit par le fait que la différentielle seconde de f au point
x est une forme bilinéaire symétrique, ou encore que la matrice Hf (x) est symétrique. C’est en
fait vrai dans un cadre plus général.

Théorème 2.4.1 (Théorème de Schwarz )


Si f : U → F est deux fois différentiable en x ∈ U alors d2x f , vue comme application bilinéaire,
est symétrique, c’est-à-dire, pour tous h, k ∈ E on a d2x f (h, k) = d2x f (k, h).

à Preuve. Pour h, k ∈ E assez petits, on définit

∆(h, k) = f (x + h + k) − f (x + h) − f (x + k) + f (x).

On donne d’abord l’idée de la preuve. On pose, pour y ∈ [0, h], g(y) := f (x + y + k) − f (x + y) de


sorte que ∆(h, k) = g(h) − g(0) = d0 g(h) + o(h).

Prof. Mohammed SHIMI 18 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Par ailleurs, par définition de g, on a d0 g(h) = d(x+k) f (h) − dx f (h) = d2x f (k, h) + reste. D’où
∆(h, k) = d2x f (k, h) + reste. En intervertissant les rôles de h et k (∆ est symétrique en h, k) on
montre de même que ∆(h, k) = d2x f (h, k) + reste. Toute la difficulté est alors de montrer que les
restes se "compensent".
Soit donc g comme ci-dessus. En appliquant l’inégalité des accroissements finis (Corollaire 2.2.1),
On a alors
∥∆(h, k) − d0 g(h)∥ = ∥g(h) − g(0) − d0 g(h)∥ ≤ sup ∥dy g − d0 g∥ × ∥h∥. (2.6)
y∈[0,h]

Pour tout y ∈ [0, h], on écrit


dy g − d2x f (k) = d(x+y+k) f − d(x+y) f − d2x f (k)
= d(x+y+k) f − dx f − d2x f (y + k) − d(x+y) − dx f − d2x f (y) .
 

Puisque f est deux fois différentiable en x, pour tout ε > 0, si h et k sont assez petits on a donc
pour tout y ∈ [0, h]
dy g − d2x f (k) ≤ ε(∥y + k∥ + ∥y∥) ≤ ε(2∥y∥ + ∥k∥) ≤ ε(2∥h∥ + ∥k∥). (2.7)
En combinant (2.6) et (2.7), on obtient
∆(h, k) − d2x f (k, h) ≤ ∥∆(h, k) − d0 g(h)∥ + d0 g(h) − d2x f (k, h)
≤ sup ∥dy g − d0 g∥ × ∥h∥ + d0 g − d2x f (k) × ∥h∥
y∈[0,h]

≤ (2ε(2∥h∥ + ∥k∥))∥h∥ + ε(2∥h∥ + ∥k∥)∥h∥


≤ ε 6∥h∥2 + 3∥h∥∥k∥


≤ 9ε∥(h, k)∥2E×E .
En intervertissant les rôles de h et k on montre de même que pour h, k assez petits on a
∥∆(h, k) − d2x f (h, k)∥ ≤ 9ε∥(h, k)∥2E×E .
Ainsi
d2x f (h, k) − d2x f (k, h) ≤ 18ε∥(h, k)∥2E×E .
Puisque d2x f est bilinéaire, l’inégalité ci-dessus est vraie pour tous h, k dans E. Si on note B(h, k) :=
d2x f (h, k) − d2x f (k, h) on obtient ainsi que
∥B∥L2 (E,F ) ≤ 18ε.
En faisant tendre ε vers 0 on conclut que B ≡ 0 et donc que d2x f (h, k) = d2x f (k, h). ✓
Exemple 2.4.2
On reprend l’application f (A) = Tr A3 définie sur Mn (R). On a montré qu’elle était deux fois


différentiable et que d2A f (H, K) = 3 Tr(AHK + HAK).


En utilisant la propriété Tr(AB) = Tr(BA), on a d2A f (H, K) = 3 Tr(KAH + HAK) et on vérifie
ainsi que d2A f est bien symétrique.

2.4.2 Différentielle d’ordre supérieur


On note Ln (E, F ) l’espace vectoriel normé des applications n-linéaires de E n dans F muni de la
norme usuelle :
∥f (x1 ,...,xn )∥F
∥f ∥ = sup ∥x1 ∥ ...∥xn ∥
,
E E
(x1 ,...,xn )∈(E\{0})n

pour tout f ∈ Ln (E, F ). Par induction sur n, on peut identifier L (E, Ln (E, F )) à Ln+1 (E, F ).

Par récurrence, on définit les fonctions n fois différentiables ainsi que la différentielle d’ordre n que
l’on identifie, de la même façon que pour le cas n = 2, à une application n-linéaire continue de E n
dans F . Supposons ces notions déjà définies pour n − 1.

Prof. Mohammed SHIMI 19 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Définition 2.4.2 (Différentielle d’ordre supérieur )


On dira que f est n fois différentiable en x0 ∈ E s’il existe un voisinage ouvert V de x0 tel
que f soit (n − 1) fois différentiable en chaque point de V et si l’application x 7−→ dxn−1 f de V
dans Ln−1 (E, F ) est différentiable en x0 . Dans ce cas, la différentielle de dn−1 f au point x0 se
note dnx0 f et s’appelle différentielle nième de f au point x0 . C’est un élément de Ln (E, F ).

Définition 2.4.3 (Application de classe C n )


• On dit que f : U ⊂ E → F est de classe C n dans U (ou encore que f est n fois conti-
nûment différentiable dans U ) si f est n-fois différentiable en tout point de U et si
l’application
dn f : U → Ln (E, F )
est continue.

• On convient de poser d0 f = f et de dire que f est de classe C 0 si elle est continue.

• f est dite de classe C ∞ si elle est de classe C n pour tout n ∈ N.

Définition 2.4.4 (Difféomorphisme)


Soient E et F deux espaces de Banach, U ⊂ E et V ⊂ F deux ouverts et f : U → V une
application.

• f est dite difféomorphisme si f est bijective et différentiable et f −1 est aussi différentiable.

• f est dite C n -difféomorphisme, n ∈ N, (resp. C ∞ -difféomorphisme) si f est bijective


et de classe C n (resp. C ∞ ) et f −1 est aussi de classe C n (resp. C ∞ ).

Exemple 2.4.3

① Si f ∈ L (E, F ), on a vu que df = f est constante, d’où d2 f = 0, ceci entraîne que pour


tout n ≥ 2, dn f = 0. Donc f est de classe C ∞ .

② Si φ : E1 × E2 −→ F est bilinéaire continue, alors d’après l’Exemple 2.1.1-④, on a la


différentielle de φ est

dφ : E1 × E2 −→ L (E1 × E2 ; F )
(x1 , x2 ) 7−→ dφ (x1 , x2 ) : (h1 , h2 ) 7→ φ (h1 , x2 ) + φ (x1 , h2 )

est continue : c’est même une application linéaire continue, donc en tout point (a, b) ∈ E1 ×
E2 , d2(a,b) φ est une application linéaire, par suite, d2 ψ est constante et dn ψ = dn−1 (dφ) = 0
si n ≥ 3. Donc φ est de classe C ∞ .

③ Plus généralement, pour tout entier n ≥ 1, toute application n-linéaire continue est de classe
C ∞ et ses différentielles d’ordre ≥ n + 1 sont nulles.

Théorème 2.4.2 (Cas général du théoréme de Schwarz )


Si f est n fois différentiable en un point x0 , alors la différentielle dnx0 f ∈ Ln (E, F ) est une
application multilinéaire symétrique E×. . .×E −→ F , c’est-à-dire, pour tous h1 , . . . , hn ∈

Prof. Mohammed SHIMI 20 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

E et toute permutation σ sur {1, . . . , n}, on a

dnx0 f hσ(1) , . . . , hσ(n) = dnx0 f (h1 , . . . , hn ) .




à Preuve. Le cas n = 2 n’est autre que le théorème de Schwarz 2.4.1 déjà démontré.
On va procéder par récurrence sur n : Soit n ≥ 3 et supposons le théorème démontré pour n − 1.
Alors dn f est la différentielle de l’application dn−1 f : E −→ Ln−1 (E, F ) qui, par hypothèse, existe
dans un voisinage V de x0 .
Par l’hypothèse de récurrence, dn−1 f prend ses valeurs dans le sous-espace de Ln−1 (E, F ) formé des
applications (n − 1)-linéaires symétriques. Donc, pour h1 ∈ E, dnx0 f (h1 ) est un élément de cet espace,
i.e.
dnx0 f (h1 , . . . , hn ) := dnx0 f (h1 ) (h2 , . . . , hn )


est une application symétrique de h2 , . . . , hn , ou en d’autres termes, l’application n-linéaire dnx0 f :


E n → F est une fonction symétrique des (n − 1) dernières variables.
Soit σ une permutation sur {1, . . . , n}. On sait que σ peut s’écrire comme composée d’un nombre
fini de transpositions (i j), i, j ∈ {1, . . . , n}. Puisque dnx0 f (h1 , . . . , hn ) est une application symétrique
de h2 , . . . , hn , alors elle ne change pas de valeur si on lui applique n’importe quelle transposition
(i j), i, j ∈ {2, . . . , n}.
Pour montrer que dnx0 f hσ(1) , . . . , hσ(n) = dnx0 f (h1 , . . . , hn ), pour toute permutation σ sur {1, . . . , n},


il suffit de montrer que dnx0 f (h1 , . . . , hn ) ne change pas de valeur si on lui applique la transposition
(1 2). On sait que dnx0 f est la différentielle seconde de dn−2 f , et par  suite, en appliquant le théorème
de Schwarz 2.4.1 à l’application d f ; on déduit que dx0 f (h1 ) (h2 ) ∈ Ln−2 (E, F ) est symétrique
n−2 n

en h1 et h2 , d’où le résultat. ✓
Remarque 2.4.2
Pour vérifier qu’une application n-linéaire est symétrique, il suffit de vérifier son invariance par
les transpositions qui échangent i et i + 1 avec i ≤ n − 1 et par celle qui échange 1 et n.

Proposition 2.4.1 (Composée de deux application de classe C n )


Soient U ⊂ E et V ⊂ F deux ouverts et f : U → V et g : V → G deux applications continues.

❶ Si f est n-fois différentiable en un point x0 ∈ U et g est n-fois différentiable au point


y0 := f (x0 ), alors h := g ◦ f : U → G est n-fois différentiable au point x0 .

❷ Si f et g sont de classe C n , alors h = g ◦ f est aussi de classe C n .

à Preuve. L’assertion ❶ pour n = 1 n’est autre que le Théorème 2.1.1 qui donne

da (g ◦ f ) = df (a) g ◦ da f, (2.8)

formule qui montre que, si dg et df sont continues, alors dh est continue, d’où la seconde assertion
pour n = 1.
On va prouver les deux assertions par récurrence sur n. Les démonstrations des deux assertions étant
les mêmes, on va montrer seulement la seconde assertion.
Supposons donc que la seconde assertion est vrai pour n − 1 (n ≥ 2). On veut montrer que h est de
classe C n , ce qui revient à montrer que dh est de classe C n−1 . Or, d’après (2.8), dh est composée de
deux applications, i.e. dh = σ ◦ ϱ où
ϱ : U −→ L (F, G) × L (E, F ) σ : L (F, G) × L (E, F ) −→ L (E, G)
x 7−→ (df (x) g, dx f ) (u, v) 7−→ u ◦ v
σ étant bilinéaire continue, elle est donc de classe C ∞ , d’après l’Exemple 2.4.3, et donc a fortiori de
classe C n−1 . Quant à ϱ, elle prend ses valeurs dans un espace produit et a pour composantes dg et

Prof. Mohammed SHIMI 21 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

df qui sont toutes les deux de classe C n−1 par hypothèse de récurrence. Ainsi ϱ est aussi de classe
C n−1 . En appliquant un seconde fois l’hypothèse de récurrence, la composée dh = σ ◦ ϱ est de classe
C n−1 . On en déduit que h est de classe C n . ✓

Proposition 2.4.2
Soient E est F deux espaces de Banach. Si Isom(E, F ) ̸= ∅, alors l’application Ψ :
Isom(E, F ) → Isom(F, E), définie par Ψ(u) = u−1 , est de classe C ∞ .

à Preuve. D’après le Théorème 2.1.2, Ψ est différentiable et, pour tous u ∈ Isom(E, F ) et h ∈
L (E, F ), on a du Ψ(h) = −u−1 ◦ h ◦ u−1 , ce qui implique que l’application du Ψ est composée de trois
applications : du Ψ = µ ◦ Ψ ◦ λ, où
µ : L (F, E) × L (F, E) −→ L (L (E, F ), L (F, E))
(u, v) 7−→ µ(u, v)(h) = −u ◦ h ◦ v, pour tout h ∈ L (E, F )

λ : L (F, F ) −→ L (F, E) × L (F, E)


u 7−→ (u, u).
Il est facile de vérifier que µ est une application bilinéaire et qu’elle vérifie ∥µ(u, v)∥ ≤ ∥u∥∥v∥, pour
tout (u, v) ∈ L (F, E) × L (F, E). µ est donc continue, d’après le Théorème 1.3.1 du Chapitre 1.
D’autre part, l’application λ est visiblement linéaire et vérifie (en considérant par exemple la norme
∥ · ∥∞ sur L (F, E) × L (F, E)) ∥λ(u)∥ = ∥(u, u)∥ = ∥u∥. D’où, d’après le Théorème 1.2.1 du Chapitre
1, λ est continue. Enfin, Ψ est différentiable, donc continue. On en déduit que dΨ est continue et,
par suite, Ψ est de classe C 1 .
On va montrer, par récurrence sur n, que Ψ est de classe C n . Supposons que Ψ est de classe C n−1
(n ≥ 2). Pour montrer que Ψ est de classe C n , il suffit de montrer que dΨ est de classe C n−1 . Or,
d’après l’Exemple 2.4.3 (① et ②), λ et µ sont C ∞ , donc C n−1 . Aussi l’application Ψ est de classe
C n−1 , par hypothèse de récurrence, et par suite la composée dΨ = µ ◦ Ψ ◦ λ est de classe C n−1 et,
par conséquent, Ψ est de classe C n . ✓

Corollaire 2.4.1
L’application f : GLn (R) ∋ A → A−1 ∈ Mn (R) est de classe C ∞ .

Théorème 2.4.3
Soient E et F deux espaces de Banach, U ⊂ E et V ⊂ F deux ouverts et f : U → V
un C 1 -difféomorphisme. Si f est de classe C n (n ≥ 2) (resp. C ∞ ), alors l’homéomorphisme
réciproque g = f −1 est aussi de classe C n (resp., C ∞ ), i.e. f est un C n -difféomorphisme (resp.
C ∞ difféomorphisme).

à Preuve. Similaire à celle de la Proposition 2.4.2, en remarquant que dg est la composée de trois
applications :
g : V → U, df : U → L (E, F ), et Isom(E, F ) → Isom(F, E), u 7→ u−1 .

2.5 Formules de Taylor


Soient E et F deux espaces vectoriels normés, U un ouvert de E et f : U → F une application.
Dans ce chapitre, on va généraliser, au cas des applications entre espaces vectoriels normés, les
formules connues sous le nom de "formules de Taylor" dans le contexte des applications numériques
à valeurs réelles. On va tout d’abord introduire l’intégration des fonctions à valeurs dans un espace
de Banach et certaines de leurs propriétés élémentaires.

Prof. Mohammed SHIMI 22 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

2.5.1 Intégration des fonctions à valeurs dans un espace de Banach


On va tout d’abord rappeler la définition de l’intégrale de Riemann. Soient [a, b] un inter-
valle fermé borné de R et f : [a, b] → R une fonction bornée. On considère une subdivision
σ = (a = x0 < x1 < . . . < xn = b) = (xi )ni=0 de [a, b]. Pour tout i = 1, . . . , n, on définit les quan-
tités
mi = inf f (x) et Mi = sup f (x),
x∈[xi−1 ,xi ] x∈[xi−1 ,xi ]

et aussi les sommes de Darboux inférieure et supérieure


n
X n
X
S− (f, σ) = mi (xi − xi−1 ) et S+ (f, σ) = Mi (xi − xi−1 ) .
i=1 i=1

On pose alors
I− (f ) = sup S− (f, σ) et I+ (f ) = inf S+ (f, σ),
σ σ

où le sup et l’inf sont pris parmi toutes les subdivisions de [a, b]. Ces expressions sont dites, respec-
tivement les intégrales inférieure et supérieure de f . Si ces deux intégrales sont égales, alors
on dit que f est (Riemann-)intégrable et on écrit
Z b Z b
f ou f (x)dx
a a

pour la valeur commune des intégrales supérieure et inférieure. Cette valeur commune est dite
l’intégrale (de Riemann) de f .

↬ La définition de l’intégrale ne peut pas se généraliser directement si on remplace l’ensemble d’ar-


rivée de la fonction f par un espace vectoriel normé arbitraire E, car il n’existe pas de notion d’inf et
de sup dans de tels espaces. Cependant, si (fn ) est une suite de fonctions à valeurs réelles intégrable
convergeant
 Z b Z vers une fonction à valeurs réelles f , alors f est intégrable et la suite
uniformément
b
fn converge vers f . C’est cette propriété qui va nous permettre de généraliser l’intégrale.
a a

↬ Soient E un espace de Banach et B([a, b], E) l’ensemble des fonctions bornées définies sur [a, b] à
valeurs dans E muni de la norme ∥f ∥ = sup ∥f (x)∥E . L’espace vectoriel normé B([a, b], E) est alors
x∈[a,b]
un espace de Banach.

• On dit que f : [a, b] → E est une fonction en escalier s’il existe une subdivision σ = (xi )ni=0
de [a, b] et des éléments c1 , . . . , cn ∈ E tels que f (x) = ci sur l’intervalle ∀x ∈]xi−1 , xi [.

• L’ensemble des fonctions en escalier sur [a, b], qu’on note E([a, b], E), est un sous-espace vectoriel
de B([a, b], E). L’adhérence R([a, b], E) de E([a, b], E) est aussi un sous-espace vectoriel de
B([a, b], E), et ses éléments sont appelés fonctions réglées.

• Ainsi une fonction réglée est limite uniforme d’une suite de fonctions en escalier.

On peut caractériser les fonctions réglées par la propriété suivante :

Proposition 2.5.1
Une fonction bornée f : [a, b] → E est réglée si et seulement si f admet une limite à gauche
en tout point x ∈]a, b] et une limite à droite en tout point x ∈ [a, b[.

↬ Toute fonction réglée est intégrable et, d’après la proposition précédente, les fonctions continues
par morceaux et les fonctions monotones sont réglées et donc intégrables. Cependant, il existe des

Prof. Mohammed SHIMI 23 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

fonctions intégrables qui ne sont pas nécessairement réglées.

On va maintenant prouver qu’il est possible de définir l’intégrale d’un fonction réglée à valeurs dans
un espace de Banach E. On considère tout d’abord les fonctions en escalier.
• Si f : [a, b] → E est une fonction en escalier. Alors il existe une subdivision σ = (xi )ni=0 de [a, b] et
des éléments c1 , . . . , cn de E tels que f = ci sur ] xi , xi−1 [. On définit l’intégrale de f par
Z b Xn
I(f ) = f= (xi − xi−1 ) ci .
a i=1

L’application I : E([a, b], E) −→ E est linéaire et on a :


n
X
∥I(f )∥E ≤ (xi − xi−1 ) ∥ci ∥E ≤ (b − a)∥f ∥,
i=1

de telle sorte que I soit aussi continue.


• Si a < c < b, alors f : [a, c] → E et f : [c, b] → E sont des fonctions en escalier et
Z b Z c Z b
f= f+ f.
a a c

• Pour a ≤ c ≤ d ≤ b, on pose
Z c Z d Z c
f =0 et f =− f.
c c d

• Avec ces conventions, pour tous c, d, r ∈ [a, b], on a la relation suivante dite relation de Chasles
Z d Z r Z r
f+ f= f.
c d c

↬ Supposons maintenant que f est une fonction réglée. Alors f est limite uniforme d’un suite de
fonctions en escalier (fn ). Puisque I est linéaire et continue, la suite (I (fn )) est une suite de Cauchy
et par suite possède une limite ℓ, puisque E est un espace de Banach. Si (gn ) est une autre suite de
fonctions en escalier convergeant vers f , alors

∥fn − gn ∥ ≤ ∥fn − f ∥ + ∥f − gn ∥ ,

d’où la suite (fn − gn ) converge vers 0 lorsque n tend vers l’infini. On en déduit que la suite (I (gn ))
possède ℓ comme limite, et par suite on peut définir sans ambiguïté l’intégrale de f par
Z b Z b
I(f ) = f = lim fn ,
a n→+∞ a

où (fn ) est une suite quelconque de fonctions en escalier qui converge uniformément vers f .
Z b
On utilise aussi la notation f (s)ds pour cette intégrale. Il est facile de voir que l’application
a
I : R([a, b], E) → E est linéaire et que

∥I(f )∥E ≤ (b − a)∥f ∥,

d’où I est continue sur R([a, b], E). Fixons maintenant que c ∈ [a, b]. Pour tout x ∈ [a, b], on pose
Z x
H(x) := f.
c

On a alors

Prof. Mohammed SHIMI 24 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Théorème 2.5.1
H est une fonction continue. Si, de plus, f est continue en un point x ∈ [a, b] alors H est
différentiable en x et H ′ (x) = f (x).

Remarque 2.5.1
Si l’application H est telle que H ′ = f , on dit que H est une primitive de f . D’où on a

Corollaire 2.5.1
Si f : [a, b] → E est continue, alors elle admet une primitive.

Si H est une primitive de f et c ∈ E, alors H + c est aussi une primitive de f . Le résultat suivant
montre que ce sont les seules :

Proposition 2.5.2
Si H et G sont des primitives d’une fonction f : [a, b] → E, alors il existe une constante c ∈ E
telle que G = H + c.

↬ On en déduit alors la généralisation suivante du Théorème fondamental de l’analyse :


Z b
G(b) − G(a) = H(b) − H(a) = f.
a

2.5.2 Formules de Taylor dans le cas E = R


On va tout d’abord considérer le cas où E = R :

Proposition 2.5.3
❶ Si v : R ⊃ U → F est (n + 1)-fois différentiable, alors
 
d ′ 1 1
v(t) + (1 − t)v (t) + . . . + (1 − t) v (t) = (1 − t)n v (n+1) (t).
n (n)
(2.9)
dt n! n!

❷ Si, de plus, F est un espace de Banach, U ⊃ [0, 1] et l’application v (n+1) est continue sur U ,
alors
Z 0
′ 1 ′′ 1 (n) (1 − t)n (n+1)
v(1) − v(0) − v (0) − v (0) − . . . − v (0) = v (t)dt. (2.10)
2 n! 1 n!

❸ S’il existe M > 0 tel que v (n+1) (t) ≤ M , pour tout t ∈ [0, 1], alors

1 1 M
v(1) − v(0) − v ′ (0) − v ′′ (0) − . . . − v (n) (0) ≤ . (2.11)
2 n! (n + 1)!

à Preuve. ❶ La preuve de la première assertion de la Proposition découle du lemme suivant, dont


la démonstration est laissée en exercice :

Lemme 2.5.1
Soient U un ouvert de R, E, F et G trois espaces vectoriels normés, u : U → E et v : U → F
deux applications (n + 1)-fois différentiables et φ : E × F → G une application bilinéaire

Prof. Mohammed SHIMI 25 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

continue. Alors l’application


n
X
(−1)k φ u(k) (t), v (n−k) (t)

t 7→
k=0

de U dans G a pour dérivée

t 7→ φ u(t), v (n+1) (t) + (−1)n φ u(n+1) (t), v(t) .


 

Ainsi, posant dans le lemme E = R, G = F et φ : R × F → F la multiplication d’un vecteur de F par


un scalaire de R et considérant u l’application t 7→ n!1 (1 − t)n , qui est de classe C n avec u(n+1) = 0,
on trouve la formule (2.9).

❷ Pour prouver la seconde assertion de la proposition, on considère l’application f : U → F définie


par
1
f (t) = v(t) + (1 − t)v ′ (t) + . . . + (1 − t)n v (n) (t)
n!
n
qui est différentiable et la formule (2.9) peut s’écrire sous la forme f ′ (t) = (1−t)
n!
v (n+1) (t). En intégrant
entre 0 et 1, on trouve (2.10).
❸ Afin de démontrer la troisième assertion de la proposition, on va appliquer le Théorème 2.2.3 à la
fonction f définie auparavant et à la fonction g : [0.1] → R définie par
n+1
g(t) = −M (1−t)
(n+1)!
.

D’après la relation (2.9), on a


(1−t)n
∥f ′ (t)∥F ≤ n!
v (n+1) (t) F
,
n
de telle sorte que, d’après l’hypothèse, on obtient ∥f ′ (t)∥F ≤ M (1−t)
n!
= g ′ (t). Le Théorème 2.2.3
permet de conclure que ∥f (1) − f (0)∥F ≤ g(1) − g(0), ce qui est exactement la relation désirée. ✓

2.5.3 Formules de Taylor dans le cas général


On va donner les formules de Taylor dans le cas général, i.e. lorsque E et F sont deux espaces
vectoriels normés quelconques :

Théorème 2.5.2 (Formule de Taylor avec reste intégral )


Soient E et F deux espaces vectoriels normés tels que F est un espace de Banach, U un ouvert
de E et f : U → F une application de classe C n+1 . Si le segment [a, a + h] est contenu dans
U , alors on a :
Z 1
1 2 1 n (1−t)n n+1
f (a + h) = f (a) + da f (h) + 2 da f (h, h) + · · · + n! da f (h, . . . , h) + n!
da+th f (h, . . . , h)dt.
0
(2.12)

à Preuve. Considérons la fonction v : [0, 1] → F , définie par v(t) = f (a + th). f étant de classe
C n+1 , v l’est aussi et de plus on montre par récurrence que

v (n) (t) = dna+th f (h, . . . , h). (2.13)

Appliquant la seconde assertion de la Proposition 2.5.3 à la fonction v qu’on vient de construire, on


obtient le résultat. ✓

Prof. Mohammed SHIMI 26 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Théorème 2.5.3 (Inégalité de Taylor-Lagrange)


Soient E et F deux espaces vectoriels normés, U un ouvert de E et f : U → F une application
(n + 1)-fois différentiable. Supposons que dn+1
x f ≤ M , pour tout x ∈ U . Alors on a

 1 n
 ∥h∥n+1
E
f (a + h) − f (a) + da f (h) + · · · + d f (h, . . . , h)
n! a F
≤M , (2.14)
(n + 1)!

pour tous a ∈ U et h tel que [a, a + h] ⊂ U .

à Preuve. En considérant la fonction v définie dans la démonstration du Théorème 2.5.2, on a v


est (n + 1)-fois différentiable et, en utilisant (2.13) et l’hypothèse de majoration, on a
v (n+1) (t) F
= dn+1
a+th f (h, · · · , h) F
≤ dn+1 n+1
a+th f ∥h∥E ≤ M ∥h∥n+1
E .

On applique la troisième assertion de la Proposition 2.5.3 pour trouver le résultat. ✓

↬ Si, dans (2.14), on fait tendre h vers 0 , le second terme est un o (∥h∥nE ), et par suite le premier
terme l’est aussi. Quoique ce résultat a été obtenu sous la condition forte que dn+1 f est bornée au
voisinage de a, on peut avoir un résultat similaire sous des conditions plus faibles :

Théorème 2.5.4 (Formule de Taylor-Young (cas général))


Soient E et F deux espaces vectoriels normés, U un ouvert de E et f : U → F une application
(n − 1)-fois différentiable sur U et n fois différentiable en un point a ∈ U . Alors on a

1 n
f (a + h) − f (a) − da f (h) − . . . − d f (h, . . . , h) F
n! a
= o (∥h∥nE ) , (2.15)

pour tout h tel que [a, a + h] ⊂ U .

↬ Cette formule (2.15) exprime seulement une propriété asymptotique, puisqu’elle exprime ce qui
se passe quand h tend vers 0.
à Preuve. Pour n = 1, (2.15) n’est autre que la définition de la différentiabilité en a. On va
procéder par récurrence sur n, en supposant que (2.15) est vraie pour n − 1 (n ≥ 2). Soit V un
voisinage de 0 dans E tel que a + V ⊂ U et considérons l’application φ : V → F définie par
1 n
φ(h) = f (a + h) − f (a) − da f (h) − · · · − d f (h, · · ·
n! a
, h). (2.16)
L’application φ est différentiable et sa différentielle est donnée par
dφ(h) = d(a+h) f − da f − d2a f (h) − · · · − 1
dn f (h, · · ·
(n−1)! a
, h), (2.17)

où chaque dia f présent dans le terme de droite de la formule s’applique au (i − 1)-uplet (h, · · · , h) et
la quantité dia f (h, · · · , h) est considérée comme une application linéaire E → F . En effet, il suffit de
calculer la différentielle de l’application gi : E → L (E, F ), h 7→ dia f (h, . . . , h) (avec le h qui apparait
i fois). On remarque que gi = dia f ◦ λ, 2 ≤ i ≤ n, où λ : E → E i , h 7→ (h, . . . , h) qui est linaire.
dia f : E i → F étant multilinéaire, on déduit que
dgi (h)(k) = dia f (k, h, . . . , h) + dia f (h, k, h, . . . , h) + . . . + dia f (h, . . . , h, k),
pour tous h, k ∈ E. Comme dia f est symétrique, alors
dgi (h)(k) = idia f (h, h, . . . , k) = i dia f (h, . . . , h) (k).


On en déduit que dgi (h) = idia f (h, . . . , h), où dia f est considérée ici comme la différentielle (i − 1)ième
de l’application df : U → L (E, F ). En différentiant (2.16), on trouve (2.17). Appliquant l’hypothèse
de récurrence à l’application df , on obtient grâce à (2.17),
n−1

∥dφ(h)∥ = o ∥h∥E .

Prof. Mohammed SHIMI 27 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Autrement dit, pour tout ε > 0, il existe η > 0 tel que ∥h∥E ≤ η entraine que ∥dφ(h)∥ ≤ ε∥h∥n−1
E .
Utilisant l’inégalité des accroissements finis (Corollaire 2.2.1), on trouve

∥φ(h) − φ(0)∥ ≤ ε∥h∥nE ,

pour ∥h∥E ≤ η. Puisque φ(0) = 0, alors

∥φ(h)∥ = o (∥h∥nE ) ,

ce qui est justement la relation (2.15). ✓

2.6 Théorèmes des fonctions implicites et d’inversion locale


Dans cette section on va s’intéresser à deux théorèmes importants : le théorème d’inversion
locale et le théorème des fonctions implicites. On peut résumer grossièrement ces deux théo-
rèmes de la façon suivante : étant donnés une fonction f : U → F et b ∈ F , peut-on résoudre
l’équation f (x) = b ?
Pour comprendre la philosophie de ce que l’on va faire, prenons le cas de la dimension finie et sup-
posons que f : Rn → Rm est linéaire, autrement dit on cherche à résoudre un système linéaire de m
équations à n inconnus (si A est la matrice de f dans une base choisie, l’équation s’écrit Ax = b).
On peut distinguer 3 cas :
• si m = n, on a autant d’équations que d’inconnues et pourvu que A (et donc f ) soit inversible
on aura alors une unique solution pour tout b donné par x = f −1 (b) (ou encore x = A−1 b).
• si m < n, on a moins d’équations que d’inconnues et on s’attend typiquement à avoir une
infinité de solutions. Si on écrit x = (x1 , x2 ) ∈ Rn−m × Rm et A = (A1 , A2 ) où A1 ∈ Mm,n−m (R)
et A2 ∈ Mm (R), pourvu que A2 soit inversible, on pourra exprimer x2 en fonction de x1 :
x2 = A−12 (b − A1 x1 ), i.e. on exprime m variables en fonction des (n − m)-autres, pour chaque
choix des (n − m)-premières variables (ici de x1 ∈ Rn−m ) on trouve les valeurs des m autres
(ici de x2 ∈ Rm ).
• si m > n, on a plus d’équations que d’inconnues et dans ce cas on résout en général n d’entre
elles (on se ramène au 1er cas) et on regarde si la solution trouvée est compatible avec les
équations restantes.
On voudrait savoir ce qui reste de cela si f : Rn → Rm n’est plus linéaire mais seulement différentiable.
L’idée est alors que pour x proche de x0 on écrira

f (x) = f (x0 ) + dx0 f (x − x0 ) + o (x − x0 ) ≃ f (x0 ) + dx0 f (x − x0 ) ,

c’est-à-dire de se ramener à un système linéaire (et de contrôler les termes de reste, c’est là toute la
difficulté !). On ne pourra bien sûr pas résoudre l’équation sur tout U mais seulement au voisinage
d’un point x0 et pourvu que l’on ait une information sur dx0 f :
• si n = m et dx0 f est inversible on pourra trouver une fonction réciproque f −1 au voisinage de
x0 , c’est le Théorème d’inversion locale.
• si m < n, on décompose comme ci-dessus x ∈ Rn en (x1 , x2 ) ∈ Rn−m × Rm et on écrit
dx f (h1 , h2 ) = (dx )1 f (h1 ) + (dx )2 f (h2 ). Si (dx0 )2 f est inversible on pourra exprimer x2 en
fonction de x1 au voisinage de x0 , c’est le Théorème des fonctions implicites.
Par exemple, dans le cas de f : R2 → R on s’intéresse à des équations du type f (x, y) = 0.
Typiquement l’ensemble des solutions forme une courbe dans le plan et la question est de
savoir si on peut décrire celle-ci comme le graphe d’une fonction y = φ(x) ou alors x = ψ(y)
(au moins localement). L’équation f (x, y) = 0 définit y en fonction de x de façon implicite alors
que y = φ(x) est explicite.

Prof. Mohammed SHIMI 28 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

2.6.1 Théorème du point fixe


Chercher la réciproque d’une fonction f revient à résoudre une équation de la forme f (x) = y où y
est donné. On souhaite alors montrer qu’il y a une unique solution (f est bijective) et éventuellement
à trouver celle-ci (trouver f −1 ). Le théorème suivant sera l’outil clé de la preuve du théorème
d’inversion locale :

Théorème 2.6.1 (Théorème du point fixe de Picard )


Soient E un espace de Banach et F ⊂ E un fermé (non-vide). Soit φ : F → E telle que
φ(F ) ⊂ F et φ soit contractante, i.e. il existe ℓ ∈ [0, 1[ tel que pour tous x, y ∈ F on ait

∥φ(y) − φ(x)∥ ≤ ℓ∥y − x∥. (2.18)

Alors φ admet un unique point fixe dans F , i.e. il existe un unique x ∈ F tel que φ(x) = x.

à Preuve. Soit x0 ∈ F . On considère la suite (xn )n définie par la relation de récurrence xn+1 =
φ (xn ). L’hypothèse φ(F ) ⊂ F assure que cette suite est bien définie pour tout n. On va montrer
qu’elle converge, sa limite x sera la solution cherchée. D’après (2.18), pour tout n ∈ N on a

∥xn+2 − xn+1 ∥ = ∥φ (xn+1 ) − φ (xn )∥ ≤ ℓ ∥xn+1 − xn ∥ .

On va montrer alors par récurrence que pour tout n ∈ N on a

∥xn+1 − xn ∥ ≤ ℓn ∥x1 − x0 ∥ . (2.19)

Le résultat étant immédiat pour n = 0, on suppose que ∥xn+1 − xn ∥ ≤ ℓn ∥x1 − x0 ∥, pour n ∈ N. On


a alors
∥xn+2 − xn+1 ∥ ≤ ℓ ∥xn+1 − xn ∥ ≤ ℓn+1 ∥x1 − x0 ∥ .

X ℓ ∈ [0, 1[, on déduit de (2.19) par X


Comme comparaison des séries à termes positifs que la sé-
rie ∥xn+1 − xn ∥ est convergente. La série (xn+1 − xn ) est ainsi normalement convergente et
n n
donc convergente puisque E est un espace de Banach. Cela signifie que la suite de terme général
XN
(xn+1 − xn ) = xN +1 − x0 converge, autrement dit la suite (xn )n converge. On note x sa limite.
n=0
Comme F est un fermé on a bien x ∈ F . Par ailleurs, la propriété (2.18) implique que φ est continue
et en passant à la limite dans l’égalité xn+1 = φ (xn ) on obtient donc x = φ(x).
Finalement, si x et y sont deux points fixes on a

∥x − y∥ = ∥φ(x) − φ(y)∥ ≤ ℓ∥x − y∥.

Comme ℓ < 1 on en déduit que nécessairement x = y ce qui prouve l’unicité. ✓


Remarque 2.6.1

① Pour montrer que la suite (xn )n converge on est passé par la notion de série normalement
convergente. On peut aussi montrer directement à partir de (2.19) que la suite (xn )n est de
Cauchy et donc converge puisque E est un espace de Banach.

② Dans la preuve, on a construit le point fixe comme limite d’une suite définie par récurrence
dont le point de départ est arbitraire. L’unicité du point fixe montre que, quelque soit le choix
de x0 , la suite (xn )n convergera vers celui-ci. Cela donne un algorithme pour trouver des valeurs
approchées de ce dernier. Par ailleurs on a

X X X ∥x1 − x0 ∥
∥x − xN ∥ = (xn+1 − xn ) ≤ ∥xn+1 − xn ∥ ≤ ℓn ∥x1 − x0 ∥ = ℓN ,
n≥N n≥N n≥N
1−ℓ

Prof. Mohammed SHIMI 29 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

ce qui permet d’estimer l’erreur entre la valeur approchée xN et x.

③ Un moyen pratique pour montrer que φ est contractante est de calculer sa différentielle (dérivée)
et d’utiliser l’inégalité des accroissements finis.

Exemple 2.6.1
Soit E = C 0 ([0, 1]) muni de la norme ∥ · ∥∞ . On considère φ : E → E définie par

1 x
Z
1
(φ(f ))(x) = f (t)dt + cos(f (x))
2 0 4

On veut montrer que φ possède un unique point fixe. Soient f, g ∈ E, pour tout x ∈ [0, 1] on a

1 x
Z
1
|(φ(f ))(x) − (φ(g))(x)| ≤ |f (t) − g(t)|dt + | cos(f (x)) − cos(g(x))|
2 0 4
Z x
1 1
≤ ∥f − g∥∞ dt + |f (x) − g(x)|
2 0 4
3
≤ ∥f − g∥∞
4
(Pour passer de la première à la deuxième ligne on a utilisé l’inégalité des accroissements finis
pour la fonction cos : R → R). La fonction φ est donc contractante avec ℓ = 34 . Comme E muni
de la norme ∥ · ∥∞ est un espace de Banach, on peut appliquer le théorème du point fixe, ce qui
prouve que φ possède un unique point fixe.

2.6.2 Théorème d’inversion locale


Si f : I → R est une fonction continue d’une variable, on sait que f est bijective de I sur f (I)
si et seulement si elle est strictement monotone. Si de plus f est dérivable
′ il suffit donc de s’assurer
que f ′ > 0 ou bien f ′ < 0. Dans ce cas f −1 est dérivable et on a f −1 (y) = f ′ (f −1
1
(y))
.

↬ Supposons maintenant f non seulement dérivable mais de classe C 1 . Si on a f ′ (x) ̸= 0, alors comme
f ′ est continue il existe η > 0 tel que f ′ soit de signe constant sur l’intervalle ]x−η; x+η[ (théorème des
valeurs intermédiaires). Ainsi f sera bijective de ]x−η; x+η[ dans f (]x − η; x + η[), on dira que f est
localement inversible au voisinage de x. Par ailleurs la fonction f −1 : f (]x − η; x + η[) →]x − η; x + η[
sera aussi de classe C 1 . C’est ce genre de résultat que l’on va généraliser à des fonctions d’un espace
vectoriel normé dans un espace vectoriel normé.

Définition 2.6.1 (Homéomorphisme)


Une application f : E → F est un homéomorphisme si elle est continue, bijective et si
son inverse est continue.

Théorème 2.6.2 (Thoérème d’inversion locale)


Soient E, F deux espaces de Banach, U ⊂ E un ouvert et f : U → F de classe C 1 . Soit x0 ∈ U
tel que dx0 f soit un homéomorphisme. Alors il existe un voisinage V ⊂ U de x0 , un voisinage
W de f (x0 ) et g : W → V de classe C 1 telle que

f ◦ g = idW et g ◦ f = idV .

Autrement dit, la fonction f : V → W est un C 1 -difféomorphisme de V dans W . Par


ailleurs, pour tout y ∈ W on a : dy g = dy f −1 = (dg(y) f )−1 .


Prof. Mohammed SHIMI 30 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Remarque 2.6.2

① L’hypothèse que f soit de classe C 1 et pas seulement différentiable est


( nécessaire. C’est déjà vrai
x 2 1

+ x sin x si x ̸= 0,
pour les fonctions d’une variable. La fonction f définie par f (x) = 2
0 si x = 0
′ 1
est dérivable sur R et on a f (0) = 2 ̸= 0.
Cependant f n’est bijective sur aucun voisinage de 0 : sa dérivée f ′ (x) = 12 +2x sin x1 −cos x1
 
′ 1 1
n’est  constant sur aucun voisinage de 0 (pour tout entier n on a f 2nπ = − 2 < 0 et
 de signe
f′ 1
(2n+1)π
= 3
2
> 0).

② Si dans le Théorème 2.6.2, on suppose que f est non seulement de classe C 1 , mais de classe
C n , (n ≥ 2) (resp. de classe C ∞ ), alors f : V → W est un C n -difféomorphisme (resp. C ∞ -
difféomorphisme), d’après le Théorème 2.4.3.

Corollaire 2.6.1 (Thoérème d’inversion globale)


Soient E et F deux espaces de Banach. Soit U ⊂ E un ouvert et f : U → F une application de
classe C n . On suppose que f est injective et que ∀x ∈ U, dx f ∈ Isom(E, F ). Alors f : U → f (U )
est un difféomorphisme de classe C n .

à D’après le théorème d’inversion locale f est un difféomorphisme local de classe C n . Ceci implique
en particulier que V = f (U ) est voisinage de tout ses points, donc un ouvert de F .
L’hypothèse d’injectivité de f c-à-d la bijectivité de f : U → f (U ), permet de définir un inverse f −1 .
Comme localement, l’inverse de f coïncident avec f −1 , alors f −1 est de classe C n . Donc f est un
difféomorphisme "global" de classe C n . ✓

↬ Avant de démontrer ce le Théorème 2.6.2, regardons ce qu’il devient en dimension finie, i.e. pour f :
Rn → Rd . On a bien sûr Rn et Rd qui sont des espaces de Banach. Par ailleurs, si f est différentiable,
pour que dx f : Rn → Rd soit inversible il faut que n = d (théorème du rang) et, si on note
Jf (x) sa matrice dans la base canonique
 (matrice jacobienne), i.e. si f (x) = (f1 (x), . . . , fn (x)) avec
∂fi
x = (x1 , . . . , xn ) on a Jf (x) = ∂xj
(x) , alors dx f est inversible si et seulement det (Jf (x)) ̸= 0
1≤i,j≤n
(c’est le jacobien de f au point x). Dans ce cas son inverse est automatiquement continue puisqu’on
est en dimension finie. Autrement dit on a la version suivante du théorème d’inversion locale

Théorème 2.6.3
Soient U ⊂ Rn un ouvert et f : U → Rn de classe C 1 . Soit x0 ∈ U tel que Jf (x0 ) soit inversible.
Alors il existe un voisinage V ⊂ U de x0 , un voisinage W de f (x0 ) et g : W → V de classe C 1
telle que
f ◦ g = idW et g ◦ f = idV .
Autrement dit, la fonction f : V → W est un C 1 -difféomorphisme de V dans W . Par ailleurs,
dy g = dy f −1 = (dg(y) f )−1 .

pour tout y ∈ W on a :

Exemple 2.6.2
Soit f : R2 → R2 définie par f (x, y) = sin y2 + x, sin x2 + y . La fonction f est de classe C 1
  

et pour tout (x, y) ∈ R2 on a


1  21 cos y2
  
=⇒ donc det (Jf (x, y)) = 1 − 41 cos x2 cos y2 ̸= 0.
 
Jf (x, y) = 1 x
2
cos 2 1
La fonction f est donc localement inversible en tout point de R2 .

Prof. Mohammed SHIMI 31 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Remarque 2.6.3

① f est un homéomorphisme de classe C r n’entraîne pas que f −1 est différentiable. Par


exemple : f : R → R, x 7→ x3 .

② Contrairement au cas des fonctions d’une variable, le fait que dx f soit un homéomorphisme
pour tout x ∈ U n’implique pas que f est bijective de U sur f (U ).
Par exemple : la fonction f : R2 ∋ (x, y) 7→ (ex cos(y), ex sin(y)) ∈ R2 est de classe C 1 . Pour
tout (x, y) ∈ R2 on a  x
e cos(y) −ex sin(y)

Jf (x, y) =
ex sin(y) ex cos(y)
Donc Jf (x, y) est inversible puisque det (Jf (x, y)) = e2x ̸= 0.
Cependant f n’est pas injective (elle est 2π-périodique relativement à la variable y, par
exemple on f (0, 0) = f (0, 2π)).

à Preuve du Théorème 2.6.2. On note y0 = f (x0 ). On souhaite montrer que si y est proche de
y0 (y est dans un voisinage W de y0 ) alors il admet un unique antécédent proche de x0 (unique dans
un voisinage V de x0 ). Étant donné x ∈ U , l’application

φ : z 7→ f (x) + dx0 f (z − x)

est une approximation de f , au moins si x est proche de x0 (on écrit f (z) ≃ f (x) + dx f (z − x) ≃
f (x) + dx0 f (z − x) où on a utilisé la différentiabilité de f en x puis la continuité de df en x0 ).
Pour trouver un antécédent de y par f on va d’abord en chercher un par φ. Puisque dx0 f est inversible,
pour tout y ∈ F il existe un unique z ∈ E tel que φ(z) = y. On note Gy (x) cet antécédent. On a en
fait
Gy (x) = x + (dx0 f )−1 (y − f (x)). (2.20)
On remarque alors que y = f (x) si et seulement si Gy (x) = x. Autrement dit, trouver un antécédent
de y par f revient en fait à trouver un point fixe de Gy . On va montrer que si y est suffisamment
proche de f (x0 ) l’application Gy sera contractante sur un voisinage fermé bien choisi de x0 et aura
donc un unique point fixe dans ce fermé, y aura un unique antécédent par f au voisinage de x0 .
Pour montrer que Gy est contractante il suffit de montrer qu’elle est différentiable et de majorer
la norme de sa différentielle par ℓ ∈ [0, 1 [ . La fonction Gy est bien différentiable pour tout y comme
composée de fonctions différentiables, et on a

dx Gy = I − (dx0 f )−1 ◦ dx f = (dx0 f )−1 ◦ (dx0 f − dx f ) . (2.21)

Comme df est continue, il existe ε > 0 tel que pour tout x ∈ B (x0 , ε) on ait
1
∥dx f − dx0 f ∥ < −1
2 (dx0 f )
et donc,
∀x ∈ B̄ (x0 , ε) , ∀y ∈ F, ∥dx Gy∥ < 21 .
Pour affirmer que Gy est contractante sur B̄ (x0 , ε) et pouvoir utiliser le théorème du point fixe
il faut encore s’assurer que 
Gy B̄ (x0 , ε) ⊂ B̄ (x0 , ε) .
D’après l’inégalité des accroissements finis, si x ∈ B (x0 , ε), on a

∥Gy (x) − Gy (x0 )∥ < 21 ∥x − x0 ∥ ≤ 2ε .

Pour s’assurer que Gy (x) ∈ B (x0 , ε), en utilisant inégalité triangulaire, il suffit que
ε
∥Gy (x0 ) − x0 ∥ < ,
2
Prof. Mohammed SHIMI 32 Département MI-ENS-Fès
Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

c’est-à-dire, d’après (2.20), on a : (dx0 f )−1 (y − y0 ) < 2ε . On définit donc

W := y ∈ F, y − y0 ∈ dx0 f B 0, 2ε
 
et V := {x ∈ B (x0 , ε) , f (x) ∈ W } .

Puisque f et dx0 f sont continues, V et W sont des ouverts contenant respectivement x0 et y0 , et


pour tout y ∈ W l’application Gy est une contraction de B (x0 , ε) dans B (x0 , ε) ⊂ B (x0 , ε).
D’après le théorème du point fixe, il existe un unique x ∈ B (x0 , ε) tel que Gy (x) = x ⇐⇒ y = f (x).
Comme Gy est à valeurs dans B (x0 , ε) on a nécessairement x ∈ B (x0 , ε) et donc x ∈ V .
En résumé, pour tout y ∈ W il existe un unique x = g(y) ∈ V tel que f (x) = y ce qui montre que f
est bijective de V dans W de réciproque g : W −→ V .
Il faut maintenant montrer que g est de classe C 1 et que dy g = (dg(y) f )−1 . On montre d’abord que
g est continue. Soient y, y0 ∈ W , on note x = g(y) et x0 = g (y0 ). On a

∥x − x̄∥ = ∥Gy (x) − Gȳ (x̄)∥


≤ ∥Gy (x) − Gy (x̄)∥ + ∥Gy (x̄) − Gȳ (x̄)∥
≤ 21 ∥x − x̄∥ + (dx0 f )−1 (y − ȳ)
≤ 21 ∥x − x̄∥ + (dx0 f )−1 × ∥y − ȳ∥ .

On a donc
∥g(y) − g (x̄)∥ = ∥x − x̄∥ ≤ 2 (dx0 f )−1 × ∥y − ȳ∥ , (2.22)
ce qui prouve que g est continue.
Pour montrer que g est différentiable sur
−1W , on va montrer que dx f est inversible d’inverse continue
pour tout x ∈ V et que L = df −1 (y) f vérifie (2.3) pour la fonction g. Soit x ∈ V et y = f (x),
d’après (2.21), on a
dx f = dx0 f ◦ (I − dGy ) .
dx0 f est inversible d’inverse continue par hypothèse et (I − dGy ) aussi d’après le Lemme 1.4.2 du
Chapitre I, puisque ∥dGy ∥ < 21 < 1 (y ∈ W ). Ainsi dx f est inversible et son inverse est continue.
Soient maintenant y ∈ W et k ∈ F tel que y + k ∈ W . On note x = g(y) et h tel que x + h = g(y + k),
i.e. f (x + h) = y + k. On a g(y + k) − g(y) = h et par ailleurs, puisque f est différentiable

k = f (x + h) − f (x) = dx f (x) + ∥h∥ε(h)

avec lim ε(h) = 0. Donc h = (dx f )−1 (k) − ∥h∥(dx f )−1 (ε(h)) et ainsi
h→0

g(y + k) − g(y) − (dx f )−1 (k) = −∥h∥(dx f )−1 (ε(h)).

On en déduit que

g(y + k) − g(y) − (dx f )−1 (k) ≤ ∥h∥ × (dx f )−1 (ε(h))


≤ 2 (dx0 f )−1 × ∥k∥ × (dx f )−1 × ∥ε(g(y + k) − g(y))∥ ,
 

où on a utilisé (2.22) avec ȳ = y + k pour majorer ∥h∥ en terme de ∥k∥ (autrement dit pour montrer
qu’un o(h) est aussi un o(k)). Comme g est continue on a

lim ε(g(y + k) − g(y)) = 0


k→0

et donc
g(y + k) − g(y) − (dx f )−1 (k) = o(k)
−1
ce qui prouve que g est différentiable en y avec dy g = (dx f )−1 = df −1 (y) f .
Finalement, comme f −1 = g, df et L 7→ L−1 sont continues cela prouve que dg est continue et donc
g est de classe C 1 . ✓

Prof. Mohammed SHIMI 33 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Exemple 2.6.3
On va utiliser le théorème d’inversion locale pour résoudre l’équation différentielle

f ′ (x) + f 2 (x) = g(x) sur [0, 1] (Eq1 )

avec condition initiale f (0) = 0 où g est une fonction continue donnée suffisamment petite dans
un sens à préciser.

On note E = C01 ([0, 1]) l’ensemble des fonctions f de classe C 1 (si f est solution elle est dérivable
et donc continue, on a alors f ′ = g − f 2 qui est continue donc f est C 1 ) telles que f (0) = 0.
On le munit de la norme ∥f ∥E = sup |f ′ (x)| (vérifier que c’est bien une norme). Soit F =
x∈[0,1]
C 0 ([0, 1]) muni de la norme ∥ · ∥∞ .
On définit φ : E → F par φ(f ) = f ′ + f 2 . Résoudre l’équation (Eq1 ) revient à trouver f ∈ E
tel que φ(f ) = g. On peut noter que φ(0) = 0, donc on va chercher à appliquer le Théorème
d’inversion locale à la fonction φ au point 0 ∈ E (g petit signifie alors g est dans un voisinage
de 0 ∈ F pour ∥ · ∥∞ ).

• On sait que (F, ∥ · ∥∞ ) est un espace de Banach. On peut montrer que (E, ∥ · ∥E ) l’est aussi
(en exercice). Pour pouvoir appliquer le Théorème d’inversion locale il faut montrer que φ
est de classe C 1 et que d0 φ est un homéomorphisme.

• On montre que φ est différentiable et que pour tout f ∈ E on a df φ(h) = hZ′ + 2f h (pour
x
montrer la continuité de df φ on pourra remarquer que si f ∈ E on a |f (x)| ≤ |f ′ (t)| dt ≤
0
∥f ∥E et donc ∥f ∥∞ ≤ ∥f ∥E ). On a alors

∥df φ − dg φ∥ = sup ∥df φ(h) − dg φ(h)∥ ≤ sup 2∥f − g∥∞ ∥h∥∞ ≤ 2∥f − g∥E ,
∥h∥E ≤1 ∥h∥E ≤1

ce qui prouve que dφ est continue et donc φ est de classe C 1 .

• Finalement on a d0 φ :ZE ∋ h 7→ h′ ∈ F . Tout k ∈ F possède exactement un antécédent par


x
d0 φ, la fonction x 7→ k(t)dt, donc d0 φ est inversible. Par ailleurs on a pour tout k ∈ F
0

′
(d0 φ)−1 (k) E
= (d0 φ)−1 (k) = ∥k∥∞ ,

ce qui prouve que (d0 φ)−1 est continue (de norme égale 1) et donc d0 φ est bien un homéo-
morphisme.

D’après le Théorème d’inversion locale, il existe un voisinage V de 0 dans E et un voisinage W


de 0 dans F tels que φ : V → W soit bijective, i.e. pour tout g ∈ W il existe un unique f ∈ V
tel que f ′ + f 2 = g.

Il est à noter que cela montre l’existence d’une unique solution f seulement au voisinage de 0 (on
peut en fait montrer qu’il n’y en a pas d’autre du tout).

2.6.3 Théorème des fonctions implicites


Parmi les conséquences fondamentales du théorème d’inversion locale, on trouve un résultat
tout aussi important, connu sous le nom de théorème des fonctions implicites (en fait ces deux
théorèmes sont équivalents, car on peut aussi déduire le premier du second). Il concerne la résolution

Prof. Mohammed SHIMI 34 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

d’équations non-linéaires de la forme :

f (x, y) = 0,

et doit son nom au fait que, sous les hypothèses que l’on va préciser, on peut en tirer y comme
fonction de x : on dit alors que f (x, y) = 0 définit implicitement y, ou encore y comme fonction
implicite de x.
Dans le cas linéaire, le théorème des fonctions implicites se représente en deux forme :

(i) version algébrique : un système de p équations linéairement indépendantes en m+p variables


définit p des ces variables comme fonctions linéaires des m variables restantes.

(ii) version géométrique : le noyau d’une application linéaire L : Rm+p → Rp de rang p (i.e.
surjective) est le graphe d’une application l : Rm → Rp i.e. ker(L) = {(x, l(x)) | x ∈ Rm }.

Considérons maintenant une fonction f : U → R où U ⊂ R2 . Étant donné λ ∈ R, on considère


l’ensemble Eλ = {(x, y) ∈ U, f (x, y) = λ}. De façon générique, l’ensemble Eλ est une "courbe",
appelée courbe de niveau de la fonction f (pour le niveau λ ).
Exemple 2.6.4
Soit f : R2 → R définie par f (x, y) = x2 + y 2 . Si√λ < 0 alors Eλ = ∅, E0 = {(0, 0)}, et si λ > 0
alors Eλ est le cercle de centre (0, 0) et de rayon λ.

↬ L’objectif ici est de "savoir" si on peut trouver une fonction d’une variable dont cette courbe (ou
au moins une partie de cette courbe) serait le graphe, c’est-à-dire, existe-t-il une fonction φλ telle
que (x, y) ∈ Eλ si et seulement si y = φλ (x) ?
Dans le cas de l’exemple précédent, on sait que l’on ne peut pas décrire toute la courbe à l’aide d’une
fonction. Si par exemple λ = 1, les deux points (0, 1) et (0, −1) sont sur le cercle, mais on ne peut
pas trouver de fonction φ(x) telle que φ(0)  soit égal à la fois à 1 et à −1. On pourra par contre
décrire (par exemple) le demi-cercle C + = (x, y) ∈ R × R+ , x2 + y 2 = 1 comme étant le graphe de

la fonction φ(x) = 1 − x2 définie sur l’intervalle [−1, 1].

↬ De façon plus précise, la question que l’on se pose est la suivante : Étant donnés une fonction
f (x, y), un nombre réel λ et un point (x0 , y0 ) tel que f (x0 , y0 ) = λ, peut-on trouver un intervalle
(ouvert) I contenant x0 , un intervalle (ouvert) J contenant y0 et une fonction x 7→ φλ (x) définie sur
I tels que pour tout (x, y) ∈ I × J on ait f (x, y) = λ si et seulement si y = φλ (x) ?

On reprend l’exemple précédent, et on fixe λ = r2 > 0 (il n’y a rien à faire sinon). On se donne un
point (x0 , y0 ) sur le cercle de centre (0, 0) et de rayon r, en particulier x0 ∈ [−r, r]. On peut alors
distinguer 3 cas :

① x0 ∈] − r, r[ et y0 > 0. Le point (x0 , y√0 ) est sur le demi-cercle "supérieur". On peut alors choisir
I =] − r, r[, J =]0, +∞[ et φλ (x) = r2 − x2 .

② x0 ∈] − r, r [ et y0 < 0. Le point (x0 , y0 )√est sur le demi-cercle "inférieur". On peut alors choisir
I =] − r, r[, J =] − ∞, 0 [ et φλ (x) = − r2 − x2 .

③ x0 = ±r et alors y0 = 0. On considère par exemple x0 = r. Si I est un intervalle ouvert qui


contient x0 , il existe ε > 0 tel que [r − ε, r]
 ⊂ I, et de même il existe
 η > 0 tel que [−η, η] ⊂ J.
 
p p
2 2
Quitte à diminuer un peu ε, les points r − ε, r − (r − ε) et r − ε, − r − (r − ε) 2 2
p p
sont sur le cercle et les nombres r2 − (r − ε)2 et − r2 − (r − ε)2 sont dans J. On devrait
alors avoir en même temps
p p
φλ (r − ε) = r2 − (r − ε)2 et φλ (r − ε) = − r2 − (r − ε)2 ,

Prof. Mohammed SHIMI 35 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

ce qui est impossible.


Quelle différence y a-t-il entre les points tels que x0 = ±r et les autres ? Graphiquement, ce-là se voit
très bien : ce sont les points où la courbe possède des tangentes verticales. En termes de la fonction
f cela se traduit par ∂f∂y
(x, y) = 0.

Théorème 2.6.4 (Théorème des fonctions implicites)


Soient E, F, G des espaces de Banach, U ⊂ E × F un ouvert et f : U → G de classe C 1 . Soit
(x0 , y0 ) ∈ U tel que la différentielle partielle de f par rapport à y, dy(x0 ,y0 ) f ∈ L (F, G) soit un
homéomorphisme. Alors il existe des voisinages V de x0 , W de y0 et une unique application
φ : V → W de classe C 1 tels que

∀(x, y) ∈ V × W, f (x, y) = f (x0 , y0 ) ⇐⇒ y = φ(x).

De plus, pour tout x ∈ V on a


 −1
dx φ = − dy(x,φ(x)) f ◦ dx(x,φ(x)) f. (2.23)
 −1
En particulier en x0 on obtient dx0 φ = − dy(x0 ,y0 ) f ◦ dx(x0 ,y0 ) f .

à Preuve. L’idée de la démonstration est d’appliquer le théorème d’inversion locale. Pour ça on


définit Φ : U → E × G par Φ(x, y) = (x, f (x, y)). La fonction Φ est de classe C 1 sur U et on a
 
d(x,y) Φ(h, k) = (h, d(x,y) f (h, k)) = h, dx(x,φ(x)) f (h) + dy(x,φ(x)) f (k) . (2.24)
Montrons que d(x0 ,y0 Φ est un homéomorphisme. Si (h0 , k0 ) ∈ E × G on a

′ ′ h̄ = h
d(x0 ,y0 ) Φ(h, k)(h, k) = (h , k ) ⇐⇒
k̄ = dx(x0 ,y0 ) f (h) + dy(x0 ,y0 ) f (k)
(
h = h̄
⇐⇒ 
y
−1
k̄ − dx(x0 ,y0 ) f h̄ .

k = d(x0 ,y0 ) f
d(x0 ,y0 ) Φ est donc inversible et on a
  −1 
−1 ′ ′ y x
−1
d(x0 ,y0 ) Φ (h , k ) = h̄, d(x0 ,y0 ) f k̄ − d(x0 ,y0 ) f h̄

qui est continue par composition d’applications linéaires continues. d(x0 ,y0 ) Φ est donc bien un homéo-
morphisme.
D’après le théorème d’inversion locale il existe des voisinages U1 de (x0 , y0 ) et U2 de Φ (x0 , y0 ) =
(x0 , f (x0 , y0 )) et Ψ : U2 → V2 de classe C 1 inverse de F . Quitte à diminuer U2 on peut de plus
supposer que U1 est de la forme U1 = V × W (on remplace U2 par Φ(U × V ) = Ψ−1 (U × V ) qui est
ouvert puisque Ψ est continue). Si (a, b) ∈ U2 on a
(x, y) = Ψ(a, b) ⇐⇒ (a, b) = Φ(x, y) = (x, f (x, y)),
autrement dit nécessairement x = a et donc Ψ est de la forme Ψ(a, b) = (a, ψ(a, b)). Quitte à
restreindre V , pour tout x ∈ V on a (x, f (x0 , y0 )) ∈ U2 donc il existe un unique y = ψ (x, f (x0 , y0 )) ∈
W tel que Φ(x, y) = (x, f (x0 , y0 )) c’est-à-dire f (x, y) = f (x0 , y0 ). On définit alors φ : V → W par
φ(x) = ψ (x, f (x0 , y0 )) qui est bien de classe C 1 .
Il reste à montrer (2.23). Pour tout x ∈ V, σ(x) = f (x, φ(x)) = f (x0 , y0 ), i.e. σ est constante, sa
différentielle est donc nulle. Or, par différentiation de fonctions composées on a
dx(x,φ(x)) f + dy(x,φ(x)) f ◦ dx φ = dx σ = 0.
D’autre part, d’après le Théorème d’inversion locale on sait que d(x,y) Φ est inversible sur V × W et
donc d’après (2.24), on a dy(x,φ(x)) est inversible. On en déduit (2.23). ✓

Prof. Mohammed SHIMI 36 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Remarque 2.6.4
Si dans le Théorème 2.6.4, on suppose que f est non seulement de classe C 1 , mais de classe C n
où n ≥ 2 (resp. de classe C ∞ ), alors l’application φ : V → W est un C n -difféomorphisme (resp.
C ∞ -difféomorphisme), d’après le Théorème 2.4.3.

Comme pour l’inversion locale, lorsqu’on est en dimension finie on peut voir ce que devient ce
théorème. On considère donc f : U → Rm avec U ⊂ Rn ≃ Rn−m × Rm (pour que dy(x0 ,y0 ) f soit
inversible il faut que F et G aient même dimension). On notera p = n − m et x = (x1 , . . . , xp ) ∈ Rp
et y = (y1 , . . . , ym ) ∈ Rm .

Théorème 2.6.5
Soient U ⊂ Rp × Rm un ouvert et f := (f1 , . . . , fm ) : U → Rm de classe C 1 . Soit (a, b) ∈ U tel
que
∂f1 ∂f1
 
 ∂y1 (a, b) · · · (a, b)
∂ym 
 .. .. 

 . . 

 ∂fm ∂fm 
(a, b) · · · (a, b)
∂y1 ∂ym
soit inversible. Alors il existe des voisinages V de a et W de b et une unique application
φ : V → W de classe C 1 tels que

∀(x, y) ∈ V × W, f (x, y) = f (a, b) ⇐⇒ y = φ(x).

De plus on a :
−1 
∂f1 ∂f1 ∂f1 ∂f1
 
(a, b) · · · (a, b) (a, b) · · · (a, b)
 ∂y1 ∂ym   ∂x1 ∂xp 

Jφ (a) = −  .. ..   .. .. 
.
 . . 


 . . 
 ∂fm ∂fm   ∂fm ∂fm 
(a, b) · · · (a, b) (a, b) · · · (a, b)
∂y1 ∂ym ∂x1 ∂xp

Remarque 2.6.5
∂f
Dans le cas p = m = 1, on retrouve bien l’hypothèse (a, b) ̸= 0, et on a alors
∂y
∂f
(x, φ(x))
φ′ (x) = − ∂f
∂x
. (2.25)
∂y
(x, φ(x))

En particulier,
∂f
(a, b)
φ′ (a) = − ∂f
∂x
.
∂y
(a, b)

Dans le cas où ∂f
∂y
(a, b) = 0 mais ∂f
∂x
(a, b) ̸= 0 on peut intervertir les rôles de x et y et exprimer x
en fonction de y au lieu de y en fonction de x.

Exemple 2.6.5
❶ On considère la courbe du plan définie par l’équation f (x, y) := y 3 − xy − 1 = 0.
• Le point (0, 1) est sur la courbe. On montre qu’au voisinage de ce point, la courbe est le
graphe d’une fonction y = φ(x). La fonction f est bien de classe C 1 .
• Par ailleurs ∂f
∂y
(x, y) = 3y 2 − x d’où ∂f
∂y
(0, 1) = 3 ̸= 0 et on peut donc appliquer le Théorème
des fonctions implicites et exprimer y en fonction de x au voisinage de (0, 1).

Prof. Mohammed SHIMI 37 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

• Le théorème ne donne, par contre, aucune expression de φ. En utilisant (2.25) la fonction


φ vérifie
φ(x)
φ′ (x) = 3φ(x) ′ 2

2 −x ⇐⇒ φ (x) 3φ(x) − x − φ(x) = 0, (2.26)
qui est une équation différentielle pas plus facile à résoudre que f (x, y) = 0.

• On peut cependant utiliser cette dernière pour obtenir un DL de φ en 0 à tout ordre. On


sait que φ est C 1 donc, en utilisant (2.26), φ′ aussi donc φ est de classe C 2 .

• Par récurrence on en déduit que φ est de classe C ∞ et admet donc un DL à tout ordre. Par
ailleurs on a φ(0) = 1 par définition de φ et donc φ′ (0) = 31 d’après (2.26), d’où on obtient
x
φ(x) = 1 + + o(x).
3
• En dérivant la deuxième expression de (2.26) on a

φ′′ (x) × 3φ(x)2 − x + φ′ (x) × (6φ(x)φ′ (x) − 1) − φ′ (x) = 0.




On en déduit que φ′′ (0) = 0 et donc


x
+ o x2 .

φ(x) = 1 + 3

• En continuant ainsi on peut calculer les dérivées successives de φ en 0 et ainsi obtenir un


DL à tout ordre.

❷ On considère l’équation f (x, y, z) = y + (x + y + z)2 + x4 + y 4 + z 4 − 2 = 0.

• C’est l’équation d’une surface S dans R3 (si f (x, y, z) = ax+by+cz est linéaire, f (x, y, z) = 0
est l’équation d’un plan, pas d’une droite).

• Le point P0 = (x0 , y0 , z0 ) = (0, 0, 1) est sur S. On a une équation et trois variables, on va


chercher à exprimer une variable en fonction des deux autres au voisinage de ce point. La
fonction f est bien de classe C 1 , on a
∂f
∂z
(x, y, z) = 2(x + y + z) + 4z 3
∂f
et donc ∂z
(0, 0, 1) = 6 ̸= 0.

• Il existe donc des voisinages V ⊂ R2 de (0, 0), W ⊂ R de 1 et φ : V → W tels que pour


tout (x, y, z) ∈ V × W on ait f (x, y, z) = 0 si et seulement si z = φ(x, y).

• On a exprimé, au voisinage de P0 , la surface S comme le graphe de la fonction φ. On a


φ(0, 0) = 1 et par ailleurs

∂f
−1 ∂f
d(0,0) φ = − ∂z
(0, 0, 1) (0, 0, 1).
∂x
C’est-à-dire
∂f ∂f
∂φ ∂x
(0, 0, 1) 1 ∂φ ∂y
(0, 0, 1) 1
(0, 0) = − ∂f =− et (0, 0) = − ∂f =− .
∂x ∂z
(0, 0, 1) 3 ∂y ∂z
(0, 0, 1) 2

D’où, au voisinage de (0, 0) on a :


x y
φ(x, y) = 1 − − + o(|x| + |y|).
3 2

Prof. Mohammed SHIMI 38 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

2.7 Extremums
Dans cette section on considère des fonctions à valeurs réelles, et l’on s’intéresse à leurs extrema,
c’est-à-dire à leurs minima et maxima. On parlera en fait essentiellement de minima, les maxima
d’une fonction f pouvant toujours être vus comme les minima de −f .

2.7.1 Notions de bases d’optimisation


Dans un espace vectoriel normé E, on se donne une fonction f : E → R et un sous-ensemble
C ⊂ E, généralement fermé dans E et l’on étudie le problème

(P) inf f (x).


x∈C

• La fonction f est le critère, la fonction objectif, le coût.

• L’ensemble C est l’ensemble des contraintes ; la variable x est la variable de décision.

• Lorsque x ∈ C, on dit que x est réalisable ou encore admissible.

• On dit que x∗ est solution de (P) si f (x∗ ) = inf f (x) et x∗ ∈ C autrement dit si
x∈C

f (x∗ ) ≤ f (x), ∀x ∈ C.

• On dit que x∗ est une solution locale de (P) si x∗ est dans C et s’il existe r > 0 tel que

f (x∗ ) ≤ f (x), ∀x ∈ C ∩ B (x∗ , r) .

Par la suite, nous écrirons indifféremment

inf f (x) = inf{f (x) : x ∈ C} = inf f.


x∈C C

2.7.2 Extremas d’une fonction réelle (f : E 7→ R)


↬ L’objectif ici est de dégager des conditions nécessaires et/ou suffisantes pour avoir un minimal
local selon le degré de différentiabilité de f . En particulier, la différentielle seconde est utile pour
étudier les extremas d’une fonction à valeurs réelles.
On rappelle la définition de maximum/minimum local/global d’une fonction à valeurs réelles.

Définition 2.7.1
Soient E un espace de Banach, U un ouvert de E et Soit f : U → R.
• On dit que f possède un minimum (resp. maximum) local en x0 s’il existe un voisinage
V de x0 tel que pour tout x ∈ V on ait

f (x) ≥ f (x0 ) (resp. f (x) ≤ f (x0 )).

• De façon équivalente, il existe ε > 0 tel que si ∥x − x0 ∥ < ε alors

f (x) ≥ f (x0 ) (resp. f (x) ≤ f (x0 )).

• On dira que x0 est un minimum (resp. maximum) global de f si


f (x) ≥ f (x0 ) pour tout x ∈ U.

• Un minimum (resp. maximum) est dit strict si l’inégalité est stricte pour x ̸= x0 .
Dans chacun des cas, on dit que f possède un extremum local (resp. global ) en x0 .

Prof. Mohammed SHIMI 39 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Proposition 2.7.1
Soit f : U → R. Si f possède un extremum local (resp. global ) en x0 ∈ U alors dx0 f = 0,
i.e. c’est l’application nulle de E dans R (on dit que x0 est un point critique de f ).

à Preuve. Soit h ∈ E. La fonction g(t) := f (x0 + th) définie au voisinage de t = 0 admet un


extremum local en 0 et y est dérivable donc g ′ (0) = 0. Or g ′ (0) = dx0 f (h). On a donc dx0 f (h) = 0
pour tout h ∈ E, i.e. dx0 f = 0. ✓
Remarque 2.7.1
Si E = Rn alors dx0 f = ∇f (x0 ) = 0 si et seulement si toutes les dérivées partielles de f s’annulent
en x0 .

Si E = R, on rappelle que, pour une fonction f : I → R, où I est un intervalle ouvert.

✔ Si f possède un minimum (resp. maximum) local en x0 alors f ′ (x0 ) = 0 et f ′′ (x0 ) ≥ 0 (resp.


f ′′ (x0 ) ≤ 0).

✔ Réciproquement si x0 est tel que f ′ (x0 ) = 0 et f ′′ (x0 ) > 0 (resp. f ′′ (x0 ) < 0), alors f possède
un minimum (resp. maximum) local strict en x0 .

Ces résultats découlent de la formule de Taylor à l’ordre 2 :


h2 ′′
f (x0 + h) = f (x0 ) + hf ′ (x0 ) + (x0 ) + o h2 .

2
f

En effet, si x0 est un minimum local on sait que f ′ (x0 ) = 0, et on a donc pour h assez petit
2
0 ≤ f (x0 + h) − f (x0 ) = h2 f ′′ (x0 ) + o h2 .


En divisant par h2 et en faisant tendre h vers 0 on obtient bien f ′′ (x0 ) ≥ 0.


Réciproquement, si f ′ (x0 ) = 0 et f ′′ (x0 ) > 0 on a
 
2 f ′′ (x0 )
f (x0 + h) − f (x0 ) = h 2
+ o(1)

et il existe h0 > 0 tel que pour |h| < h0 le terme dans la parenthèse est strictement positif ce qui
prouve que f (x0 + h) > f (x0 ) pour h ∈] − h0 , h0 [ et non nul.

Pour une fonction f : U → R, on a vu que si f possède un extremum local en x0 alors dx0 f = 0. On


rappelle également la notion de forme bilinéaire (définie) positive (resp. négative).

Définition 2.7.2
Soit L : E × E → R une forme bilinéaire.

• On dit que L est positive (resp. négative) si, pour tout h ∈ E, on a L(h, h) ≥ 0 (resp.
L(h, h) ≤ 0).

• Si L(h, h) > 0 ( resp. L(h, h) < 0), pour tout h ∈ E\{0}, on dit que L est définie positive
(resp. définie négative).

Remarque 2.7.2
Si E = R, on a d2x f f (h, k) = f ′′ (x)hk donc d2x0 f est (définie) positive (resp. négative) si et
seulement si f ′′ (x0 ) est (strictement) positif (resp. négatif).

On a alors le résultat suivant dans Rn (et donc dans n’importe quel espace E de dimension finie).

Prof. Mohammed SHIMI 40 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

Proposition 2.7.2
Soient U un ouvert de Rn et f : U → R une fonction deux fois différentiable.

❶ Si x0 est un minimum (resp. maximum) local de f alors dx0 f = 0 et d2x0 f est positive
(resp. négative).

❷ Si x0 est tel que dx0 f = 0 et d2x0 f est définie positive (resp. définie négative), alors x0 est
un minimum (resp. maximum) local strict de f .

Attention : La différentielle seconde (Hessienne) en un point x0 peut n’être ni positive ni


négative. Par exemple la matrice A = ( 10 −1
0
) vérifie t ( 10 ) A ( 10 ) = 1 > 0, mais t ( 01 ) A ( 01 ) = −1 < 0.
Un point critique x0 dont la hessienne n’est ni positive ni négative est appelé point selle ou point
col .

Lemme 2.7.1
Soit A ∈ Mn (R) une matrice symétrique. A est définie positive si et seulement si il existe m > 0
tel que pour tout h ∈ Rn on ait t hAh ≥ mt hh = m∥h∥22 .

à Preuve. On note S = {h ∈ Rn , ∥h∥2 = 1} la  sphère


 unité
 de Rn pour la norme ∥∥2 . En particulier

t
S est compact. Pour tout h ̸= 0 on a thAh
hh
= t ∥h∥
h
2
h
A ∥h∥ 2
et donc

t hAh
   
t
m := inf t hh = inf h
∥h∥2
A h
∥h∥2
= inf t hAh = min t hAh,
h̸=0 h̸=0 h∈S h∈S

où, pour la dernière égalité, on a utilisé la compacité de S et la continuité de h 7→ t hAh. Comme A


est définie positive on a donc m > 0. ✓

↬ Ce lemme affirme que si A est définie positive non seulement h 7→ t hAh > 0 mais qu’il est minoré
par une fonction quadratique (on dit que A est coercive).

à Preuve de la Proposition 2.7.2.

❶ Étant donné h ∈ E, pour t dans un voisinage de 0 , on définit gh (t) = f (x0 + th) (gh est une
fonction d’une variable). On suppose que x0 est un minimum local de f . On en déduit que 0 est
un minimum local de gh et donc gh′′ (0) ≥ 0. Or gh′ (t) = d(x0 +th) f (h) donc gh′′ (0) = d2(x0 ) f (h, h).
Pour tout h, on a d2(x0 ) f (h, h) ≥ 0 et donc d2(x0 ) f est positive.

❷ Réciproquement, si d(x0 ) f = 0 et. d2(x0 ) f est définie positive. Soit m > 0 tel que d2(x0 ) f (h, h) ≥
m∥h∥22 . D’après la formule de Taylor à l’ordre 2, pour tout ε > 0 il existe δ > 0 tel que si
∥h∥2 < δ (on est en dimension finie donc toutes les normes sont équivalentes) alors

f (x0 + h) − f (x0 ) − dx0 f (h) − 21 d2x0 f (h, h) ≤ ε∥h∥22 .

En posant R(h) := f (x0 + h) − f (x0 ) − dx0 f (h) − 21 d2x0 f (h, h) et en prenant ε = m


4
, on a, pour
∥h∥ < δ
1
f (x0 + h) = f (x0 ) + dx0 f (h) + d2x0 f (h, h) + R(h)
2
≥ f (x0 ) + 2 m∥h∥2 − m4 ∥h∥22 = f (x0 ) + m4 ∥h∥22
1 2

et donc x0 est bien un minimum local strict. ✓


Remarque 2.7.3
Pour chercher les extremas d’une fonction de n variables il faut donc

Prof. Mohammed SHIMI 41 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

(i)- chercher ses points critiques,

(ii)- en chaque point critique, étudier si sa hessienne (différentielle seconde) est définie positive
ou négative.

Pour étudier si la hessienne est positive ou négative on pourra utiliser le résultat suivant

Proposition 2.7.3
Soit A une matrice symétrique. Elle est diagonalisable dans R. De plus, A est (définie) positive
(resp. négative) si toutes ses valeurs propres sont (strictement) positives (resp. négatives).

En particulier en dimension 2, puisque la somme des valeurs propres est la trace de A et leur produit
le déterminant de A, une matrice symétrique A est définie positive (resp. négative) si et seulement
si det(A) > 0 et Tr(A) > 0 (resp. Tr(A) < 0).
Exemple 2.7.1
Soit f (x, y) = 2(x−y)2 −x4 −y 4 définie sur R2 . La fonction f est clairement deux fois différentiable.
On a
∂f
∂x
(x, y) = 4(x − y) − 4x3 , ∂f ∂x
(x, y) = 4(y − x) − 4y 3 .
Si (x, y) est un point critique, en additionnant les deux dérivées partielles on en déduit que
x3 + y 3 = 0 et donc x = −y. Ainsi (x, y) est point critique
√ √ √ si x = −y et
√ si et seulement
3
8x − 4x = 0. On trouve ainsi 3 points critiques : (0, 0), ( 2, − 2) et (− 2, 2).
 2

−4
On calcule ensuite Hf (x, y) = 4−12x
−4 4−12y 2 et on étudie cette dernière en chacun des points
critiques :
√ √ √ √
• En ( 2, − 2) on a Hf ( 2, − 2) = −20 −4

qui a pour déterminant 384 > 0 et pour
−4 −20 , √ √
trace −40 < 0. Elle est donc définie négative et ( 2, − 2) est un maximum local strict.
√ √ √ √ √ √ √ √
• En (− 2, 2) on a Hf (− 2, 2) = Hf ( 2, − 2), et donc (− 2, 2) est aussi un maxi-
mum local strict.
4 −4

• En (0, 0) on a Hf (0, 0) = −4 4 , qui a pour déterminant 0 et pour trace 8 . Elle a donc
une valeur propre positive et une valeur propre nulle. Si (0, 0) est un extremum c’est un
minimum local. Or f (0, 0) = 0 et pour tout x on a f (x, x) = −2x4 < 0 donc (0, 0) ne peut
pas être un minimum, ce n’est donc pas un extremum de f .

Remarque 2.7.4
On fera bien attention que la Proposition 2.7.2 n’est a priori valable qu’en dimension finie. En
dimension quelconque, seule la première partie est vraie (voir la preuve). Pour la réciproque il
faut des hypothèses un peu plus fortes.

2.7.3 Convexité, différentiabilité et minimisation


N.B. Ce paragraphe est hors programme. Les résultats ci-dessous sont données entant que complé-
ment.

Définition 2.7.3 (Fonction convexe)


Soit E un espace vectoriel, C un convexe de E et f : C → R.

Prof. Mohammed SHIMI 42 Département MI-ENS-Fès


Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6

❶ On dit que f est convexe si ∀(λ, x, y) ∈ [0, 1] × C × C,

f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y).

❶ On dit que f est strictement convexe si ∀λ ∈]0, 1[, ∀x ̸= y ∈ C,

f (λx + (1 − λ)y) < λf (x) + (1 − λ)f (y).

Exemple 2.7.2
On vérifie facilement que les formes affines et les normes sont convexes et qu’elles ne sont jamais
strictement convexes. Le carré d’une norme Hilbertienne est convexe :

H ∋ x → ∥x∥2 .

La preuve peut se faire directement (exercice) ou en usant de remarque 2.7.5.

De façon générale le moyen le plus simple d’établir la convexité n’est pas l’utilisation de la définition
mais plutôt celui de la caractérisation via la différentielle seconde (voir Proposition . ? ?).

Proposition 2.7.4 (Caractérisation de la convexité)


Soit E un espace vectoriel normé. On suppose f : C → R différentiable sur un convexe ouvert
non vide C de E. Les propriétés suivantes sont équivalentes :

❶ f est convexe

❷ f est au dessus de toutes ses tangentes, i.e.

f (y) ≥ f (x) + dx f (y − x), ∀x, y ∈ C.

Elle est strictement convexe si l’inégalité ci-dessus est stricte pour x ̸= y.

Remarque 2.7.5
En supposant en outre que f est deux fois différentiable, f est convexe si et seulement si pour
tous x, y ∈ C,
d2x f · (y − x, y − x) ≥ 0.
Elle est strictement convexe si l’inégalité ci-dessus est stricte pour x ̸= y.

Une conséquence quasi-immédiate du résultat ci-dessus est :

Théorème 2.7.1 (Minima des fonctions convexes)


Soient E un espace vectoriel normé et f : E → R une application différentiable convexe. Soit
x dans E. Alors :

x∗ est un minimum global de f ⇐⇒ dx∗ f = 0.

Prof. Mohammed SHIMI 43 Département MI-ENS-Fès

Vous aimerez peut-être aussi