Chapitre 2 (Calcul Diff)
Chapitre 2 (Calcul Diff)
LE-EM-S6
Cours de Calcul Différentiel
Chapitre II
∗ Calcul différentiel dans les espaces de Banach ∗
SMBA
- U -
S F
N
è
E
SF
F
S
E
N
è
S F
- U -
SMBA
1
Chapitre
Calcul différentiel dans
Introduction
Le calcul différentiel est une branche fondamentale de l’analyse mathématique qui étudie le com-
portement local des fonctions, notamment leur dérivabilité, leur continuité et leurs propriétés relatives
à la variation. Il fournit aussi des outils pour l’étude des problèmes d’optimisation, des équations dif-
férentielles, des équations aux dérivées partielles. Traditionnellement, le calcul différentiel est étudié
dans le cadre des espaces euclidiens, tels que Rp , où les concepts de dérivée et de gradient sont bien
définis.
Le calcul différentiel des "fonctions à plusieurs variables", c’est-à-dire des fonctions d’un ouvert de
R à valeurs dans Rq , p, q ∈ N∗ (voir Analyse 5), se généralise en remplaçant les espaces de dimension
p
finie Rp et Rq par des espaces vectoriels normés, de dimension pouvant être infinie. Si les résultats en
dimension finie ne dépendent pas pour l’essentiel du choix des normes sur Rp et Rq , parce que toutes
les normes sur un même espace Rp sont équivalentes, il n’en est pas de même en dimension infinie.
En particulier, beaucoup d’énoncés se placent dans le cadre des espaces de Banach, c’est-à-dire des
espaces vectoriels normés complets.
Après les résultats traités dans le chapitre I sur les espaces vectoriels normés, en particulier les
espaces de Banach, nous introduisons dans ce chapitre la notion de différentielle en un point d’une
application f : U → F d’un ouvert U d’un espace vectoriel normé E et à valeurs dans un espace
vectoriel normé F . Ceci permet d’introduire les notions d’application différentiable, puis de classe
C 1 , puis par la suite, les différentielles d’ordre supérieur et les applications de classe C k , k ≥ 1. On
redémontre dans ce cadre les résultats du calcul différentiel : propriété de linéarité de la différentielle,
formule pour la différentielle d’une application composée, théorème des accroissement finis, théorème
fondamental du calcul différentiel, lemme de Schwarz, formule de Taylor, etc.
−−−−∗∗∗−−−−
2
Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6
f ′ (a). Il s’agit ici d’un nombre réel. On dit que f ′ (a) est la dérivée de f en a. Si f est dérivable en
tout point a de I, on en déduit une fonction I ∋ a → f ′ (a) ∈ R, appelée fonction dérivée de f .
Remarquons que, dire que f est dérivable en a, équivaut à dire qu’il existe un réel f ′ (a), tel que la
fonction
1
I\{a} ∋ x 7−→ [f (x) − f (a) − f ′ (a)(x − a)] ∈ R
x−a
tend vers 0 lorsque x tend vers a. Ceci revient encore à dire qu’il existe un réel f ′ (a) et une fonction
εa : I → R qui tend vers 0 lorsque x tend vers a tels que :
Interprétation géométrique : f ′ (a) est la pente de la tangente au graphe de f au point (a, f (a)).
Considérons maintenant le cas un peu plus général (par des fonctions à variables dans le corps K = R
(ou C ) et à valeurs dans R2 ). Soit Ω un ouvert de K (i.e par exemple un intervalle ouvert si K = R,
ou un disque ouvert si K = C) et a ∈ Ω. La définition ci-dessus de la dérivée d’une application réelle
est transposable à la lettre dans ce nouveau contexte, puisque l’on dispose bien de la notion de limite
dans R2 .
Remarque 2.1.1
• Dans cette définition, la norme de R2 intervient (la notion de limite dépend a priori de la norme
choisie sur R2 ), la notion de dérivabilité et de dérivée en un point dépend donc a priori de la
norme que l’on se donne sur R2 . Mais dans le cas de R2 toutes les normes étant équivalentes,
la dérivabilité et la dérivée de f en un point sont indépendantes de la norme choisie.
• La définition de dérivabilité (2.2) n’a plus de sens dès que f est définie sur un espace vectoriel
→
−
quelconque E, puisque dans ce cas le produit (x − a) · f ′ n’a plus de sens !
• Le but de ce cours est de donner une notion pertinente de "dérivée", pour les applications à
variables dans un espace vectoriel normé E de dimension > 1. Pour cela, on remarquera que
→
−
l’application L : K ∋ x 7→ x. f ′ ∈ R2 est linéaire, sur ce modèle on remplacera donc dans le
cas générale la définition (2.2) par : "il existe une application linéaire La : E → F , et une
application pa : Ω → F qui tend vers 0F lorsque sa variable tend vers 0E , telles que :
Cependant, lorsque la dimension de E est infinie, il se peut qu’une telle application linéaire
La ne soit pas continue en 0E . On réclamera alors, dans la définition ci-dessus, afin qu’elle soit
plus forte que la continuité de f en a, que l’application linéaire La soit continue.
Dans ce qui suit, on se donne deux espaces de Banach E et F , et un ouvert non vide U ⊂ E. On
considère une application f : U → F .
Le fait que U soit ouvert permettra de considérer les valeurs de f au voisinage de tout point de U .
Si cela n’était pas le cas, il faudrait restreindre la définition qui suit aux points intérieurs à U .
1
lim (f (a + h) − f (a) − L(h)) = 0. (2.3)
h→0E ∥h∥E
Remarque 2.1.2
Puisque a ∈ U qui est ouvert, la fonction h 7→ f (a + h) est bien définie sur un voisinage de 0,
i.e. pour ∥h∥E est assez petite.
1
Par différence on a donc lim (L1 (h) − L2 (h)) = 0.
h→0E ∥h∥E
x
Soit x ∈ E \ {0}. On a xn := −→
n n→+∞
0 et donc
1 1 1
0 = lim (L1 (h) − L2 (h)) = lim (L1 (xn ) − L2 (xn )) = (L1 (x) − L2 (x)) ,
h→0E ∥h∥E n→+∞ ∥xn ∥E ∥x∥E
df : U −→ L (E, F )
x 7−→ df (x) = dx f.
Proposition 2.1.2
Soit f : U → F et a ∈ U . Si f est différentiable en a alors f est continue en a.
car dx f est linéaire continue, donc f (x + h) − f (x) tend bien vers 0 quand ∥h∥E → 0. ✓
Remarque 2.1.4
Si on avait f (a + h) = f (a)+L(h)+o(h) avec L qui n’est pas continue, en particulier elle ne serait
pas continue en 0 et donc f ne serait pas continue en x0 . Mais, si E est de dimension finie alors,
d’après la Proposition 1.2.1, L est d’office continue, ce qui simplifie l’étude de la différentiabilité.
Exemple 2.1.1
② Les applications constantes sont différentiables, de différentielle nulle. En effet, pour une fonc-
tion constante f , on a pour tout (x, h) ∈ U × E (avec ∥h∥ assez petit pour que x + h ∈ U ),
f (x + h) − f (x) = 0.
③ Une application linéaire est différentiable ssi elle est continue. En particulier, si E est de di-
mension finie, toutes les applications linéaires L : E → F sont continues et donc différentiables.
De plus la différentielle d’une application linéaire continue est l’application linéaire elle-même.
Dans cette écriture légèrement abusive, le premier terme de la somme est évidemment φ (h1 , x2 , · · · , xn )
et le dernier φ (x1 , · · · , xn−1 , hn ). Le cas n = 1 est celui des applications linéaires continues !
Voyons le cas n = 2. Pour une application φ bilinéaire :
dφ : E1 × E2 → L (E1 × E2 ; F )
(x1 , x2 ) 7→ dφ (x1 , x2 ) : (h1 , h2 ) 7→ φ (h1 , x2 ) + φ (x1 , h2 )
est continue : c’est même une application linéaire continue, de norme inférieure ou égale à 2∥φ∥.
Le cas général se traite par récurrence sur n.
⑤ Si E = R et F est un espace vectoriel normé quelconque, alors tout élément L ∈ L (E, F ) est
de la forme x 7→ xℓ où ℓ ∈ F . En effet, si on pose L(1) = ℓ, alors L(x) = xL(1) = xℓ, pour tout
x ∈ R. La fonction f est donc différentiable en x0 s’il existe ℓ ∈ F tel que
f (x0 +h)−f (x0 )
lim 1 (f (x0 + h) − f (x0 ) − ℓh) = 0 ⇐⇒ lim =ℓ
h→0 |h| h→0 h
Si f vérifie la propriété ci-dessus, alors elle est différentiable au sens de la Définition 2.1.1,
n
X ∂f
avec L(h) := (a)hi . Inversement, si f est différentiable au sens de la Définition 2.1.1, en
i=1
∂xi
prenant h = (0, . . . , 0, hi , 0, . . . , 0) on en déduit que f admet une dérivée partielle par rapport
∂f
à la ième variable en a, avec ∂x i
(a) = da f (ei ), puis que
n
!
1 X ∂f 1
f (a + h) − f (a) − (a)hi = (f (a + h) − f (a) − da f (h)) −→ 0.
∥h∥ i=1
∂x i ∥h∥ h→0
n
X ∂f
En particulier da f (h) = (a)hi .
i=1
∂x i
↬ Dans Rn , le calcul des dérivées partielles nous donne le candidat pour la différentielle si f est
différentiable. Pour un espace E général, la Définition 2.1.1 semble difficile à appliquer puisqu’il faut
trouver une application linéaire continue L qui satisfasse (2.3). La notion suivante généralise celle de
dérivée partielle et sera utile dans la pratique pour trouver l’application linéaire L candidate à être
la différentielle (voir Exemple 2.1.2).
Remarque 2.1.5
Si E = Rn , F = R et (e1 , . . . , en ) désigne la base canonique de Rn , dire que f est dérivable en a
dans la direction ei signifie que f admet une dérivée partielle par rapport à la ième variable en a.
1
lim (f (a + tv) − f (a)) = L(v).
t→0 t
↬ Nous allons maintenant vérifier que cette notion est plus faible que la notion usuelle de différen-
tiabilité (aussi appelée différentiabilité au sens de Fréchet). C’est-à-dire la différentiabilité est une
notion plus forte que l’existence des dérivées directionnelles suivant toutes les directions.
Proposition 2.1.3
Si f : U → F, a ∈ U et f est différentiable en a, alors f est dérivable en a dans n’importe
quelle direction v et on a : fv′ (0) = da f (v).
fv (t) − fv (0)
Donc − da f (v) = o(1) −−→ 0. ✓
t t→0
Remarque 2.1.6
Une fonction peut être dérivable en un point x0 dans toutes les directions sans être différentiable.
Par exemple, Soit f : R2 → R définie par
( 2
y
si x ̸= 0
f (x, y) = x
0 si x = 0
On peut montrer que f est dérivable en (0, 0) dans toutes les directions mais qu’elle n’y est pas
différentiable.
2
Eb effet : pour h = (a, b), on a f (th)−f
t
(0,0)
= ba si a est non nul, f (th)−f
t
(0,0)
= 0 sinon. f admet
donc bien une dérivée suivant h. Mais f n12 , n1 = 1 ne tend pas vers 0 , alors que f (0, 0) = 0, ce
qui prouve que f n’est pas continue en (0, 0).
➥ Dans la pratique, pour voir si une fonction est différentiable en a et calculer da f on pourra suivre
le schéma suivant :
❶ Étant donné v ∈ E, montrer que f est dérivable dans la direction v en a, i.e. fv′ (0) existe. (Si
f est différentiable elle doit être dérivable dans toutes les directions.)
❷ Montrer que l’application L : v 7→ fv′ (0) est linéaire continue (si f est différentiable on doit
avoir fv′ (0) = da f (v)).
• On est en dimension finie donc toutes les normes sont équivalentes et la différentiabilité de
• Afin d’avoir le maximum de propriétés on munit Mn (R) d’une norme d’application linéaire
n
X
(on parlera aussi de norme matricielle), par exemple ∥M ∥ = max |aij |, pour M = (aij ).
j
i=1
• L’avantage de choisir une norme de ce type est qu’en plus de l’inégalité triangulaire on a
aussi la propriété de norme d’algèbre : si M, N ∈ Mn (R) on a ∥M N ∥ ≤ ∥M ∥ ∥N ∥.
(ii)- Soit L : Mn (R) → Mn (R) définie par L(H) = M H + HM . On vérifie facilement que
L est une application linéaire. Par ailleurs, Mn (R) est de dimension finie donc L est
continue.
(iii)- On regarde si f (M + H) − f (M ) − L(H) = o(H). En effet
1 ∥H∥2
(M + H)2 − M 2 − L(H) = = ∥H∥ −→ 0.
∥H∥ ∥H∥ H→0
Avec la structure d’algèbre normé, (voir Chapitre 1), on dispose de la structure nécessaire pour définir
la différentielle d’un produit.
On peut remarquer que comme les applications da f et da g sont des applications linéaires continues,
l’application da (f × g) est une application linéaire continue.
Puisque les applications f et g sont différentiables en a, pour tout h au voisinage de 0 dans E on a
Or :
(f × g)(a + h) − (f × g)(a) = (da f (h) + o (∥h∥E )) × (g(a) + o(1)) + f (a) × (da g(h) + o (∥h∥E ))
=da f (h) × g(a) + f (a) × da g(h) + o (∥h∥E )
=da (f × g)(h) + o (∥h∥E ) .
Exemple 2.1.3
En utilisant la proposition précédente, on retrouve le résultat de l’exemple 2.1.2. En effet.
• L’espace d’arrivée Mn (R) pouvant être muni d’une structure d’algèbre, on peut s’intéresser
à l’application f = id × id : Mn (R) ∋ M 7→ M 2 . D’après la Proposition 2.1.5, cette
application est différentiable sur Mn (R) et on a
On dispose, dans le cas des applications définies sur un espace vectoriel normé quelconque, d’une
généralisation de ce résultat. Il s’agit d’un résultat qualitatif (existence de la différentielle de la
composée) aussi bien que quantitatif (expression de cette différentielle en fonction des différentielles
des applications qui entrent dans la composition). À ce double titre, le Théorème des applications
composées s’avère extrêmement pratique.
à Preuve. Notons
∥φ(h)∥F ∥ψ(k)∥G
lim =0 et lim = 0,
h̸=0E ∥h∥E k̸=0F ∥k∥F
On a
g(f (x + h)) − g(f (x)) = g(f (x) + dx f · h + φ(h)) − g(f (x))
= dy g · (dx f · h + φ(h)) + ψ(dx f · h + φ(h)).
Par conséquent, pour h ̸= 0E ,
∥g(f (x+h))−g(f (x))−dy g·(dx f ·h)∥G ∥dy g·φ(h)+ψ(dx f ·h+φ(h))∥G
∥h∥E
= ∥h∥E
≤ ∥dy g∥ ∥φ(h)∥
∥h∥E
F
+ ∥dx f ∥ + ∥φ(h)∥F
∥h∥E
ε(dx f · h + φ(h)).
Les deux derniers terme ci-dessus tendent bien vers 0 lorsque h tend vers 0E puisque c’est le cas de
∥φ(h)∥F
∥h∥E
, que dx f · h + φ(h) tend vers 0F et que ε(k) tend vers 0 lorsque k tend vers 0F .
On en conclut que g ◦ f est différentiable en a, de différentielle en a l’application da (g ◦ f ) : E ∋
h 7−→ df (a) g (da f (h)). ✓
On termine cette section avec un cas particulier de différentiabilité, celle de l’application inversion
des isomorphismes linéaires.
seulement si I +u−1 ◦h l’est. D’après le Lemme 1.4.2 du Chapitre 1 c’est le cas dès que u−1 ◦ h < 1.
−1
Comme u−1 ◦ h ≤ u−1 ∥h∥, on en déduit que si ∥h∥ < u−1 alors u + h est inversible. De
plus, on a
où on a utilisé le Lemme 1.4.2 du Chapitre 1 pour passer de la deuxième à la troisième ligne. Ainsi
3
−1 −1
X
−1 k+1 k ∥u−1 ∥ ∥h∥2
Ψ(u + h) − Ψ(u) + u ◦h◦u ≤ u ∥h∥ = ,
k≥2
1 − ∥u−1 ∥ ∥h∥
↬ En identifiant Mn (R) et L (Rn , Rn ) (une matrice A est associée à l’application linéaire dont elle
est la matrice représentative dans la base canonique) et en prenant sur Mn (R) une norme matricielle,
on obtient le corollaire suivant :
Corollaire 2.1.1
L’application f : GLn (R) ∋ A 7−→ A−1 ∈ Mn (R) est différentiable et pour tous A ∈ GLn (R)
et H ∈ Mn (R), on a : dA (H) = −A−1 HA−1 .
Exemple 2.1.4
Considérons l’application Φ : M ∈ GLn (R) 7→ Tr M−1 qui est la composée de l’application trace
L’application trace étant linéaire, alors sa différentielle en tout point est égale à elle-même, i.e.
D’autre part, d’après le corollaire précédent, la différentielle de f : M ∈ GLn (R) 7→ M−1 est :
Autrement dit, on a
Théorème 2.2.1
Soit f : [a, b] → R continue sur [a, b], dérivable sur ]a, b[. Alors il existe c ∈]a, b[ tel que
Théorème 2.2.2
Soient I un intervalle et f : I → R dérivable. Alors pour tous a, b ∈ I on a :
↬ Pour rappel, ces théorèmes sont fondamentaux dans l’étude des fonctions d’une variable. Par
exemple, le fait qu’une fonction dont la dérivée est nulle (resp. positive/négative) sur un intervalle soit
constante (resp. croissante/décroissante) en est une conséquence. Il est donc naturel de se demander
ce que deviennent ces théorèmes pour des fonctions d’un espace vectoriel normé dans un espace
vectoriel normé.
Théorème 2.2.3
Soient [a, b] ⊂ R, F un espace vectoriel normé et f : [a, b] → F et g : [a, b] → R deux
applications continues sur [a, b] et différentiables sur ]a, b [. Si ∥f ′ (t)∥F ≤ g ′ (t), pour tout
t ∈] a, b[, alors ∥f (b) − f (a)∥F ≤ g(b) − g(a).
à Preuve. Remarquons tout d’abord que puisque ∥f ′ (t)∥F ≤ g ′ (t), pour tout t ∈ [a, b], alors
g ′ (t) ≥ 0, pour tout t ∈ [a, b], et par suite g est croissante. Soit ε > 0. On définit le sous-ensemble de
[a, b]
Aε := {x ∈ [a, b] | ∀y ∈ [a, x], ∥f (y) − f (a)∥F ≤ g(y) − g(a) + ε(y − a)} .
Il est clair que a ∈ Aε et que si x ∈ Aε et x̄ ∈ [a, x], alors x̄ ∈ Aε , ce qui veut dire que Aε est un
intervalle. Soit c = sup Aε et on va montrer que c ∈ Aε . Si c = a alors on n’a rien à démontrer.
Par suite, on va supposer que c ̸= a. Si x ∈]a, c [, alors x ∈ Aε , i.e. ∥f (x)−f (a)∥F ≤ g(x)−g(a)+ε(x−
a). Quand x → c, on obtient, par continuité de f et g, l’inégalité ∥f (c)−f (a)∥F ≤ g(c)−g(a)+ε(c−a),
i.e. c ∈ Aε . Afin de compléter la preuve, on va montrer maintenant que c = b. On raisonne par
l’absurde.
Si c < b, pour tout h > 0 tel que c + h < b on a
Il en découle qu’il existe η ∈]0, b − c[ tel que ∀0 ≤ h ≤ η, ∥f (c + h) − f (c)∥ ≤ g(c + h) − g(c) + εh. On
en déduit que c + h ∈ Aε , pour tout 0 ≤ h ≤ η, ce qui contredit le fait que c = sup Aε . On conclut
que c = b, ce qui achève la démonstration. ✓
Théorème 2.2.4
Soit f : [a, b] → F une fonction différentiable, alors ∥f (b) − f (a)∥ ≤ sup ∥f ′ (x)∥F × (b − a).
x∈I
∀(a, b) ∈ X 2 [a, b] ⊂ X.
à Preuve. Soit g : [0, 1] → F définie par g(t) = f ( (1 − t)a + tb ). La fonction g est différentiable
| {z }
x
(dérivable) et dt g(h) = dx f (h)(b − a). D’où
∥f (b) − f (a)∥F = ∥g(1) − g(0)∥F ≤ sup ∥dt g∥ ⩽ sup ∥dx f ∥∥b − a∥E .
t∈[0,1] x∈[a,b]
✓
En appliquant le théorème précédent à la fonction g(x) := f (x) − da f (x − a), dont la différentielle
est dx g = dx f − da f on obtient :
Corollaire 2.2.1
Soit U un ouvert de E et f : U → F différentiable sur U , alors pour tous a, b ∈ U tels que
[a, b] ⊂ U on a :
↬ Si la fonction f est à valeurs dans un espace vectoriel normé quelconque, on voit donc que l’inégalité
des accroissements finis est toujours vraie. Par contre le Théorème 2.2.1 ne l’est plus, dans le sens
où il n’existe pas forcément c ∈ [a, b] tel que f (b) − f (a) = dc f × (b − a). Il reste vrai si f est définie
sur un espace vectoriel normé et à valeurs réelles.
Proposition 2.2.1
Soient U un ouvert de E et f : U → R différentiable sur U , alors pour tous a, b ∈ U tels que
[a, b] ⊂ U il existe c ∈]a, b[ tel que f (b) − f (a) = dc f × (b − a).
à Preuve. Comme dans le théorème précédent on se ramène en fait aux fonctions de R dans R.
Soit g : [0, 1] → R définie par g(t) = f ( (1 − t)a + tb ). La fonction g est dérivable et
| {z }
x
g ′ (t) = dx f × (b − a).
D’après le Théorème 2.2.1 il existe r ∈]0, 1[ tel que g(1) − g(0) = g ′ (r), c’est-à-dire
f (b) − f (a) = dc f × (b − a) où c = (1 − r)a + rb.
✓
Exemple 2.2.1
Soit f : [0, 2π] → C définie par f (t) = eit . La fonction f est différentiable et on a dt f (h) = ieit h
d’où ∥dt f ∥ = 1 pour tout t. On peut vérifier qu’on a bien
Par contre le Théorème 2.2.1 n’est plus vrai ! En effet, f (2π) − f (0) = 0 mais pour tout t ∈ [0, 2π]
on a dt f (2π) = 2iπeit ̸= 0.
Remarque 2.3.1
Tout comme pour la continuité et la différentiabilité, la somme et la composée de fonctions de
classe C 1 est aussi de classe C 1 .
Exemple 2.3.1
On reprend l’Exemple 2.1.2. La fonction f (M ) = M 2 est différentiable sur Mn (R) et sa différen-
tielle au point M est dM f : H 7→ M H + HM . Soit M ∈ Mn (R) et (Mk )k une suite de Mn (R)
telle que Mk → M dans Mn (R). On a
et donc dMk f → dM f , quand k → +∞, dans L (Mn (R)), ce qui prouve que df est continue en
M . La fonction f est bien de classe C 1 .
Proposition 2.3.1
Soient U ⊂ E = E1 × . . . × En , f : U −→ F et x = (x1 , . . . , xn ) ∈ U . Si f est différentiable en
x alors f admet une différentielle partielle en x par rapport à chacune des variables et on a
✓
↬ Tout comme l’existence de dérivées partielles n’entraine pas la différentiabilité dans Rn , l’existence
de différentielle partielle par rapport à chacune des variables n’entraine pas la différentiabilité (Rn
est le cas particulier où E1 = · · · = En = R ), i.e. la réciproque de la proposition ci-dessus est fausse.
Cependant, si on suppose qu’en plus les différentielles partielles sont continues on a alors
Proposition 2.3.2
Si f admet une différentielle partielle par rapport à chaque variable et si pour tout i
l’application U ∋ x 7→ dix f ∈ L (Ei , F ) est continue, alors f est de classe C 1 .
D’où
f (x + h) − f (x) − d1x f (h1 ) − d2x f (h2 )
≤ f (x + h) − f (x1 , x2 + h2 ) − d1x f (h1 ) + f (x1 , x2 + h2 ) − f (x) − d2x f (h2 )
≤ sup d1(y1 ,x2 +h2 ) f − d1(x1 ,x2 ) × ∥h1 ∥ + sup d2(x1 ,y2 ) f − d2(x1 ,x2 ) f × ∥h2 ∥ .
y1 ∈[x1 ,x1 +h1 ] y2 ∈[x2 ,x2 +h2 ]
Puisque d1x f et d2x f sont continues en x, on en déduit que f (x + h) − f (x) − d1x f (h1 ) − d2x f (h2 ) =
o(h). Comme l’application h = (h , h ) 7−→ d1 f (h ) + d2 f (h )
1 2 x 1 x 2
est linéaire continue, cela prouve que f est différentiable en x telle que :
Corollaire 2.3.1
Soit f : E1 × . . . × En → F une application n-linéaire continue. Alors f est différentiable sur
E1 × . . . × En et
n
X
d(x1 ,...,xn ) f (h1 , . . . , hn ) = f (x1 , . . . , xi−1 , hi , xi+1 , . . . , xn ) .
i=1
Remarque 2.4.1
① Comme précédemment, la somme et la composée de fonctions deux fois différentiables est
aussi deux fois différentiable.
② Il ne semble pas forcément évident de manipuler un objet tel que la différentielle seconde :
c’est une application linéaire (continue) définie sur E mais à valeurs dans l’espace des ap-
plications linéaires (continues) de E dans F . La Proposition 1.3.3 du Chapitre 1 permet en
fait d’identifier cet espace avec celui L2 (E, F ) = L (E × E, F ) des applications bilinéaires
(continues) de E dans F , via l’isométrie Φ : L (E, L (E, F )) −→ L2 (E, F ) définie par
(Φ(u))(x, y) := (u(x))(y), pour tous u ∈ L (E, L (E, F )), (x, y) ∈ E 2 .
L’isométrie inverse Φ−1 : L2 (E, F ) → L (E, L (E, F )) est donnée par
Φ−1 (v)(x) (y) := v(x, y), pour tous v ∈ L2 (E, F ), (x, y) ∈ E 2 .
(2.5)
Selon l’identification (2.5), la différentielle seconde d’une application f : U ⊂ E → F deux
fois différentiable est l’application
d2 f : U −→ L2 (E; F )
x 7−→ d2 f (x),
telle que : d2 f (x) · (h, k) = d(df )(x) · h · k, pour tout (h, k) ∈ E × E.
Exemple 2.4.1
Soit f : Mn (R) → R définie par f (A) = Tr A3 . On montre alors que pour tout A ∈ Mn (R),
dA f : K 7→ 3 Tr A2 K .
d(A+tH) f −dA f
Donc lim t
= L(H), où L(H)(K) = 3 Tr(AHK + HAK).
t→0
On vérifie que L est une application linéaire de Mn (R) dans L (Mn (R), R). Elle
est continue
2
(car dim (Mn (R)) < ∞). Finalement, d(A+H) f − dA f − L(H) (K) = 3 Tr H K . Et on a
n
X
2
H 2K ≤ n sup H 2 K ≤ n H 2 K ≤ n∥H∥2 × ∥K∥.
Tr H K = ii ii
i
i=1
On montre alors que si f est deux fois différentiable alors f admet des dérivées partielles secondes
et que pour h = (h1 , . . . , hn ) et k = (k1 , . . . , kn ), via l’isomorphisme (2.5), on a
∂2f
X
d2x f (h, k) = ∂xi ∂xj
(x)hi kj .
i,j=1,...,n
n
∂2f
La matrice Hf (x) := ∂xi ∂xj
(x) est la matrice associée à la forme bilinéaire d2x f dans la base
i,j=1
canonique et est appelée matrice hessienne de f au point x, i.e. pour tous h, k ∈ Rn on a
c’est le Théorème de Schwarz . Cela se traduit par le fait que la différentielle seconde de f au point
x est une forme bilinéaire symétrique, ou encore que la matrice Hf (x) est symétrique. C’est en
fait vrai dans un cadre plus général.
∆(h, k) = f (x + h + k) − f (x + h) − f (x + k) + f (x).
Par ailleurs, par définition de g, on a d0 g(h) = d(x+k) f (h) − dx f (h) = d2x f (k, h) + reste. D’où
∆(h, k) = d2x f (k, h) + reste. En intervertissant les rôles de h et k (∆ est symétrique en h, k) on
montre de même que ∆(h, k) = d2x f (h, k) + reste. Toute la difficulté est alors de montrer que les
restes se "compensent".
Soit donc g comme ci-dessus. En appliquant l’inégalité des accroissements finis (Corollaire 2.2.1),
On a alors
∥∆(h, k) − d0 g(h)∥ = ∥g(h) − g(0) − d0 g(h)∥ ≤ sup ∥dy g − d0 g∥ × ∥h∥. (2.6)
y∈[0,h]
Puisque f est deux fois différentiable en x, pour tout ε > 0, si h et k sont assez petits on a donc
pour tout y ∈ [0, h]
dy g − d2x f (k) ≤ ε(∥y + k∥ + ∥y∥) ≤ ε(2∥y∥ + ∥k∥) ≤ ε(2∥h∥ + ∥k∥). (2.7)
En combinant (2.6) et (2.7), on obtient
∆(h, k) − d2x f (k, h) ≤ ∥∆(h, k) − d0 g(h)∥ + d0 g(h) − d2x f (k, h)
≤ sup ∥dy g − d0 g∥ × ∥h∥ + d0 g − d2x f (k) × ∥h∥
y∈[0,h]
≤ 9ε∥(h, k)∥2E×E .
En intervertissant les rôles de h et k on montre de même que pour h, k assez petits on a
∥∆(h, k) − d2x f (h, k)∥ ≤ 9ε∥(h, k)∥2E×E .
Ainsi
d2x f (h, k) − d2x f (k, h) ≤ 18ε∥(h, k)∥2E×E .
Puisque d2x f est bilinéaire, l’inégalité ci-dessus est vraie pour tous h, k dans E. Si on note B(h, k) :=
d2x f (h, k) − d2x f (k, h) on obtient ainsi que
∥B∥L2 (E,F ) ≤ 18ε.
En faisant tendre ε vers 0 on conclut que B ≡ 0 et donc que d2x f (h, k) = d2x f (k, h). ✓
Exemple 2.4.2
On reprend l’application f (A) = Tr A3 définie sur Mn (R). On a montré qu’elle était deux fois
pour tout f ∈ Ln (E, F ). Par induction sur n, on peut identifier L (E, Ln (E, F )) à Ln+1 (E, F ).
Par récurrence, on définit les fonctions n fois différentiables ainsi que la différentielle d’ordre n que
l’on identifie, de la même façon que pour le cas n = 2, à une application n-linéaire continue de E n
dans F . Supposons ces notions déjà définies pour n − 1.
Exemple 2.4.3
dφ : E1 × E2 −→ L (E1 × E2 ; F )
(x1 , x2 ) 7−→ dφ (x1 , x2 ) : (h1 , h2 ) 7→ φ (h1 , x2 ) + φ (x1 , h2 )
est continue : c’est même une application linéaire continue, donc en tout point (a, b) ∈ E1 ×
E2 , d2(a,b) φ est une application linéaire, par suite, d2 ψ est constante et dn ψ = dn−1 (dφ) = 0
si n ≥ 3. Donc φ est de classe C ∞ .
③ Plus généralement, pour tout entier n ≥ 1, toute application n-linéaire continue est de classe
C ∞ et ses différentielles d’ordre ≥ n + 1 sont nulles.
à Preuve. Le cas n = 2 n’est autre que le théorème de Schwarz 2.4.1 déjà démontré.
On va procéder par récurrence sur n : Soit n ≥ 3 et supposons le théorème démontré pour n − 1.
Alors dn f est la différentielle de l’application dn−1 f : E −→ Ln−1 (E, F ) qui, par hypothèse, existe
dans un voisinage V de x0 .
Par l’hypothèse de récurrence, dn−1 f prend ses valeurs dans le sous-espace de Ln−1 (E, F ) formé des
applications (n − 1)-linéaires symétriques. Donc, pour h1 ∈ E, dnx0 f (h1 ) est un élément de cet espace,
i.e.
dnx0 f (h1 , . . . , hn ) := dnx0 f (h1 ) (h2 , . . . , hn )
il suffit de montrer que dnx0 f (h1 , . . . , hn ) ne change pas de valeur si on lui applique la transposition
(1 2). On sait que dnx0 f est la différentielle seconde de dn−2 f , et par suite, en appliquant le théorème
de Schwarz 2.4.1 à l’application d f ; on déduit que dx0 f (h1 ) (h2 ) ∈ Ln−2 (E, F ) est symétrique
n−2 n
en h1 et h2 , d’où le résultat. ✓
Remarque 2.4.2
Pour vérifier qu’une application n-linéaire est symétrique, il suffit de vérifier son invariance par
les transpositions qui échangent i et i + 1 avec i ≤ n − 1 et par celle qui échange 1 et n.
à Preuve. L’assertion ❶ pour n = 1 n’est autre que le Théorème 2.1.1 qui donne
da (g ◦ f ) = df (a) g ◦ da f, (2.8)
formule qui montre que, si dg et df sont continues, alors dh est continue, d’où la seconde assertion
pour n = 1.
On va prouver les deux assertions par récurrence sur n. Les démonstrations des deux assertions étant
les mêmes, on va montrer seulement la seconde assertion.
Supposons donc que la seconde assertion est vrai pour n − 1 (n ≥ 2). On veut montrer que h est de
classe C n , ce qui revient à montrer que dh est de classe C n−1 . Or, d’après (2.8), dh est composée de
deux applications, i.e. dh = σ ◦ ϱ où
ϱ : U −→ L (F, G) × L (E, F ) σ : L (F, G) × L (E, F ) −→ L (E, G)
x 7−→ (df (x) g, dx f ) (u, v) 7−→ u ◦ v
σ étant bilinéaire continue, elle est donc de classe C ∞ , d’après l’Exemple 2.4.3, et donc a fortiori de
classe C n−1 . Quant à ϱ, elle prend ses valeurs dans un espace produit et a pour composantes dg et
df qui sont toutes les deux de classe C n−1 par hypothèse de récurrence. Ainsi ϱ est aussi de classe
C n−1 . En appliquant un seconde fois l’hypothèse de récurrence, la composée dh = σ ◦ ϱ est de classe
C n−1 . On en déduit que h est de classe C n . ✓
Proposition 2.4.2
Soient E est F deux espaces de Banach. Si Isom(E, F ) ̸= ∅, alors l’application Ψ :
Isom(E, F ) → Isom(F, E), définie par Ψ(u) = u−1 , est de classe C ∞ .
à Preuve. D’après le Théorème 2.1.2, Ψ est différentiable et, pour tous u ∈ Isom(E, F ) et h ∈
L (E, F ), on a du Ψ(h) = −u−1 ◦ h ◦ u−1 , ce qui implique que l’application du Ψ est composée de trois
applications : du Ψ = µ ◦ Ψ ◦ λ, où
µ : L (F, E) × L (F, E) −→ L (L (E, F ), L (F, E))
(u, v) 7−→ µ(u, v)(h) = −u ◦ h ◦ v, pour tout h ∈ L (E, F )
Corollaire 2.4.1
L’application f : GLn (R) ∋ A → A−1 ∈ Mn (R) est de classe C ∞ .
Théorème 2.4.3
Soient E et F deux espaces de Banach, U ⊂ E et V ⊂ F deux ouverts et f : U → V
un C 1 -difféomorphisme. Si f est de classe C n (n ≥ 2) (resp. C ∞ ), alors l’homéomorphisme
réciproque g = f −1 est aussi de classe C n (resp., C ∞ ), i.e. f est un C n -difféomorphisme (resp.
C ∞ difféomorphisme).
à Preuve. Similaire à celle de la Proposition 2.4.2, en remarquant que dg est la composée de trois
applications :
g : V → U, df : U → L (E, F ), et Isom(E, F ) → Isom(F, E), u 7→ u−1 .
✓
On pose alors
I− (f ) = sup S− (f, σ) et I+ (f ) = inf S+ (f, σ),
σ σ
où le sup et l’inf sont pris parmi toutes les subdivisions de [a, b]. Ces expressions sont dites, respec-
tivement les intégrales inférieure et supérieure de f . Si ces deux intégrales sont égales, alors
on dit que f est (Riemann-)intégrable et on écrit
Z b Z b
f ou f (x)dx
a a
pour la valeur commune des intégrales supérieure et inférieure. Cette valeur commune est dite
l’intégrale (de Riemann) de f .
↬ Soient E un espace de Banach et B([a, b], E) l’ensemble des fonctions bornées définies sur [a, b] à
valeurs dans E muni de la norme ∥f ∥ = sup ∥f (x)∥E . L’espace vectoriel normé B([a, b], E) est alors
x∈[a,b]
un espace de Banach.
• On dit que f : [a, b] → E est une fonction en escalier s’il existe une subdivision σ = (xi )ni=0
de [a, b] et des éléments c1 , . . . , cn ∈ E tels que f (x) = ci sur l’intervalle ∀x ∈]xi−1 , xi [.
• L’ensemble des fonctions en escalier sur [a, b], qu’on note E([a, b], E), est un sous-espace vectoriel
de B([a, b], E). L’adhérence R([a, b], E) de E([a, b], E) est aussi un sous-espace vectoriel de
B([a, b], E), et ses éléments sont appelés fonctions réglées.
• Ainsi une fonction réglée est limite uniforme d’une suite de fonctions en escalier.
Proposition 2.5.1
Une fonction bornée f : [a, b] → E est réglée si et seulement si f admet une limite à gauche
en tout point x ∈]a, b] et une limite à droite en tout point x ∈ [a, b[.
↬ Toute fonction réglée est intégrable et, d’après la proposition précédente, les fonctions continues
par morceaux et les fonctions monotones sont réglées et donc intégrables. Cependant, il existe des
On va maintenant prouver qu’il est possible de définir l’intégrale d’un fonction réglée à valeurs dans
un espace de Banach E. On considère tout d’abord les fonctions en escalier.
• Si f : [a, b] → E est une fonction en escalier. Alors il existe une subdivision σ = (xi )ni=0 de [a, b] et
des éléments c1 , . . . , cn de E tels que f = ci sur ] xi , xi−1 [. On définit l’intégrale de f par
Z b Xn
I(f ) = f= (xi − xi−1 ) ci .
a i=1
• Pour a ≤ c ≤ d ≤ b, on pose
Z c Z d Z c
f =0 et f =− f.
c c d
• Avec ces conventions, pour tous c, d, r ∈ [a, b], on a la relation suivante dite relation de Chasles
Z d Z r Z r
f+ f= f.
c d c
↬ Supposons maintenant que f est une fonction réglée. Alors f est limite uniforme d’un suite de
fonctions en escalier (fn ). Puisque I est linéaire et continue, la suite (I (fn )) est une suite de Cauchy
et par suite possède une limite ℓ, puisque E est un espace de Banach. Si (gn ) est une autre suite de
fonctions en escalier convergeant vers f , alors
∥fn − gn ∥ ≤ ∥fn − f ∥ + ∥f − gn ∥ ,
d’où la suite (fn − gn ) converge vers 0 lorsque n tend vers l’infini. On en déduit que la suite (I (gn ))
possède ℓ comme limite, et par suite on peut définir sans ambiguïté l’intégrale de f par
Z b Z b
I(f ) = f = lim fn ,
a n→+∞ a
où (fn ) est une suite quelconque de fonctions en escalier qui converge uniformément vers f .
Z b
On utilise aussi la notation f (s)ds pour cette intégrale. Il est facile de voir que l’application
a
I : R([a, b], E) → E est linéaire et que
d’où I est continue sur R([a, b], E). Fixons maintenant que c ∈ [a, b]. Pour tout x ∈ [a, b], on pose
Z x
H(x) := f.
c
On a alors
Théorème 2.5.1
H est une fonction continue. Si, de plus, f est continue en un point x ∈ [a, b] alors H est
différentiable en x et H ′ (x) = f (x).
Remarque 2.5.1
Si l’application H est telle que H ′ = f , on dit que H est une primitive de f . D’où on a
Corollaire 2.5.1
Si f : [a, b] → E est continue, alors elle admet une primitive.
Si H est une primitive de f et c ∈ E, alors H + c est aussi une primitive de f . Le résultat suivant
montre que ce sont les seules :
Proposition 2.5.2
Si H et G sont des primitives d’une fonction f : [a, b] → E, alors il existe une constante c ∈ E
telle que G = H + c.
Proposition 2.5.3
❶ Si v : R ⊃ U → F est (n + 1)-fois différentiable, alors
d ′ 1 1
v(t) + (1 − t)v (t) + . . . + (1 − t) v (t) = (1 − t)n v (n+1) (t).
n (n)
(2.9)
dt n! n!
❷ Si, de plus, F est un espace de Banach, U ⊃ [0, 1] et l’application v (n+1) est continue sur U ,
alors
Z 0
′ 1 ′′ 1 (n) (1 − t)n (n+1)
v(1) − v(0) − v (0) − v (0) − . . . − v (0) = v (t)dt. (2.10)
2 n! 1 n!
❸ S’il existe M > 0 tel que v (n+1) (t) ≤ M , pour tout t ∈ [0, 1], alors
1 1 M
v(1) − v(0) − v ′ (0) − v ′′ (0) − . . . − v (n) (0) ≤ . (2.11)
2 n! (n + 1)!
Lemme 2.5.1
Soient U un ouvert de R, E, F et G trois espaces vectoriels normés, u : U → E et v : U → F
deux applications (n + 1)-fois différentiables et φ : E × F → G une application bilinéaire
à Preuve. Considérons la fonction v : [0, 1] → F , définie par v(t) = f (a + th). f étant de classe
C n+1 , v l’est aussi et de plus on montre par récurrence que
1 n
∥h∥n+1
E
f (a + h) − f (a) + da f (h) + · · · + d f (h, . . . , h)
n! a F
≤M , (2.14)
(n + 1)!
↬ Si, dans (2.14), on fait tendre h vers 0 , le second terme est un o (∥h∥nE ), et par suite le premier
terme l’est aussi. Quoique ce résultat a été obtenu sous la condition forte que dn+1 f est bornée au
voisinage de a, on peut avoir un résultat similaire sous des conditions plus faibles :
1 n
f (a + h) − f (a) − da f (h) − . . . − d f (h, . . . , h) F
n! a
= o (∥h∥nE ) , (2.15)
↬ Cette formule (2.15) exprime seulement une propriété asymptotique, puisqu’elle exprime ce qui
se passe quand h tend vers 0.
à Preuve. Pour n = 1, (2.15) n’est autre que la définition de la différentiabilité en a. On va
procéder par récurrence sur n, en supposant que (2.15) est vraie pour n − 1 (n ≥ 2). Soit V un
voisinage de 0 dans E tel que a + V ⊂ U et considérons l’application φ : V → F définie par
1 n
φ(h) = f (a + h) − f (a) − da f (h) − · · · − d f (h, · · ·
n! a
, h). (2.16)
L’application φ est différentiable et sa différentielle est donnée par
dφ(h) = d(a+h) f − da f − d2a f (h) − · · · − 1
dn f (h, · · ·
(n−1)! a
, h), (2.17)
où chaque dia f présent dans le terme de droite de la formule s’applique au (i − 1)-uplet (h, · · · , h) et
la quantité dia f (h, · · · , h) est considérée comme une application linéaire E → F . En effet, il suffit de
calculer la différentielle de l’application gi : E → L (E, F ), h 7→ dia f (h, . . . , h) (avec le h qui apparait
i fois). On remarque que gi = dia f ◦ λ, 2 ≤ i ≤ n, où λ : E → E i , h 7→ (h, . . . , h) qui est linaire.
dia f : E i → F étant multilinéaire, on déduit que
dgi (h)(k) = dia f (k, h, . . . , h) + dia f (h, k, h, . . . , h) + . . . + dia f (h, . . . , h, k),
pour tous h, k ∈ E. Comme dia f est symétrique, alors
dgi (h)(k) = idia f (h, h, . . . , k) = i dia f (h, . . . , h) (k).
On en déduit que dgi (h) = idia f (h, . . . , h), où dia f est considérée ici comme la différentielle (i − 1)ième
de l’application df : U → L (E, F ). En différentiant (2.16), on trouve (2.17). Appliquant l’hypothèse
de récurrence à l’application df , on obtient grâce à (2.17),
n−1
∥dφ(h)∥ = o ∥h∥E .
Autrement dit, pour tout ε > 0, il existe η > 0 tel que ∥h∥E ≤ η entraine que ∥dφ(h)∥ ≤ ε∥h∥n−1
E .
Utilisant l’inégalité des accroissements finis (Corollaire 2.2.1), on trouve
∥φ(h)∥ = o (∥h∥nE ) ,
c’est-à-dire de se ramener à un système linéaire (et de contrôler les termes de reste, c’est là toute la
difficulté !). On ne pourra bien sûr pas résoudre l’équation sur tout U mais seulement au voisinage
d’un point x0 et pourvu que l’on ait une information sur dx0 f :
• si n = m et dx0 f est inversible on pourra trouver une fonction réciproque f −1 au voisinage de
x0 , c’est le Théorème d’inversion locale.
• si m < n, on décompose comme ci-dessus x ∈ Rn en (x1 , x2 ) ∈ Rn−m × Rm et on écrit
dx f (h1 , h2 ) = (dx )1 f (h1 ) + (dx )2 f (h2 ). Si (dx0 )2 f est inversible on pourra exprimer x2 en
fonction de x1 au voisinage de x0 , c’est le Théorème des fonctions implicites.
Par exemple, dans le cas de f : R2 → R on s’intéresse à des équations du type f (x, y) = 0.
Typiquement l’ensemble des solutions forme une courbe dans le plan et la question est de
savoir si on peut décrire celle-ci comme le graphe d’une fonction y = φ(x) ou alors x = ψ(y)
(au moins localement). L’équation f (x, y) = 0 définit y en fonction de x de façon implicite alors
que y = φ(x) est explicite.
Alors φ admet un unique point fixe dans F , i.e. il existe un unique x ∈ F tel que φ(x) = x.
à Preuve. Soit x0 ∈ F . On considère la suite (xn )n définie par la relation de récurrence xn+1 =
φ (xn ). L’hypothèse φ(F ) ⊂ F assure que cette suite est bien définie pour tout n. On va montrer
qu’elle converge, sa limite x sera la solution cherchée. D’après (2.18), pour tout n ∈ N on a
① Pour montrer que la suite (xn )n converge on est passé par la notion de série normalement
convergente. On peut aussi montrer directement à partir de (2.19) que la suite (xn )n est de
Cauchy et donc converge puisque E est un espace de Banach.
② Dans la preuve, on a construit le point fixe comme limite d’une suite définie par récurrence
dont le point de départ est arbitraire. L’unicité du point fixe montre que, quelque soit le choix
de x0 , la suite (xn )n convergera vers celui-ci. Cela donne un algorithme pour trouver des valeurs
approchées de ce dernier. Par ailleurs on a
X X X ∥x1 − x0 ∥
∥x − xN ∥ = (xn+1 − xn ) ≤ ∥xn+1 − xn ∥ ≤ ℓn ∥x1 − x0 ∥ = ℓN ,
n≥N n≥N n≥N
1−ℓ
③ Un moyen pratique pour montrer que φ est contractante est de calculer sa différentielle (dérivée)
et d’utiliser l’inégalité des accroissements finis.
Exemple 2.6.1
Soit E = C 0 ([0, 1]) muni de la norme ∥ · ∥∞ . On considère φ : E → E définie par
1 x
Z
1
(φ(f ))(x) = f (t)dt + cos(f (x))
2 0 4
On veut montrer que φ possède un unique point fixe. Soient f, g ∈ E, pour tout x ∈ [0, 1] on a
1 x
Z
1
|(φ(f ))(x) − (φ(g))(x)| ≤ |f (t) − g(t)|dt + | cos(f (x)) − cos(g(x))|
2 0 4
Z x
1 1
≤ ∥f − g∥∞ dt + |f (x) − g(x)|
2 0 4
3
≤ ∥f − g∥∞
4
(Pour passer de la première à la deuxième ligne on a utilisé l’inégalité des accroissements finis
pour la fonction cos : R → R). La fonction φ est donc contractante avec ℓ = 34 . Comme E muni
de la norme ∥ · ∥∞ est un espace de Banach, on peut appliquer le théorème du point fixe, ce qui
prouve que φ possède un unique point fixe.
↬ Supposons maintenant f non seulement dérivable mais de classe C 1 . Si on a f ′ (x) ̸= 0, alors comme
f ′ est continue il existe η > 0 tel que f ′ soit de signe constant sur l’intervalle ]x−η; x+η[ (théorème des
valeurs intermédiaires). Ainsi f sera bijective de ]x−η; x+η[ dans f (]x − η; x + η[), on dira que f est
localement inversible au voisinage de x. Par ailleurs la fonction f −1 : f (]x − η; x + η[) →]x − η; x + η[
sera aussi de classe C 1 . C’est ce genre de résultat que l’on va généraliser à des fonctions d’un espace
vectoriel normé dans un espace vectoriel normé.
f ◦ g = idW et g ◦ f = idV .
Remarque 2.6.2
② Si dans le Théorème 2.6.2, on suppose que f est non seulement de classe C 1 , mais de classe
C n , (n ≥ 2) (resp. de classe C ∞ ), alors f : V → W est un C n -difféomorphisme (resp. C ∞ -
difféomorphisme), d’après le Théorème 2.4.3.
à D’après le théorème d’inversion locale f est un difféomorphisme local de classe C n . Ceci implique
en particulier que V = f (U ) est voisinage de tout ses points, donc un ouvert de F .
L’hypothèse d’injectivité de f c-à-d la bijectivité de f : U → f (U ), permet de définir un inverse f −1 .
Comme localement, l’inverse de f coïncident avec f −1 , alors f −1 est de classe C n . Donc f est un
difféomorphisme "global" de classe C n . ✓
↬ Avant de démontrer ce le Théorème 2.6.2, regardons ce qu’il devient en dimension finie, i.e. pour f :
Rn → Rd . On a bien sûr Rn et Rd qui sont des espaces de Banach. Par ailleurs, si f est différentiable,
pour que dx f : Rn → Rd soit inversible il faut que n = d (théorème du rang) et, si on note
Jf (x) sa matrice dans la base canonique
(matrice jacobienne), i.e. si f (x) = (f1 (x), . . . , fn (x)) avec
∂fi
x = (x1 , . . . , xn ) on a Jf (x) = ∂xj
(x) , alors dx f est inversible si et seulement det (Jf (x)) ̸= 0
1≤i,j≤n
(c’est le jacobien de f au point x). Dans ce cas son inverse est automatiquement continue puisqu’on
est en dimension finie. Autrement dit on a la version suivante du théorème d’inversion locale
Théorème 2.6.3
Soient U ⊂ Rn un ouvert et f : U → Rn de classe C 1 . Soit x0 ∈ U tel que Jf (x0 ) soit inversible.
Alors il existe un voisinage V ⊂ U de x0 , un voisinage W de f (x0 ) et g : W → V de classe C 1
telle que
f ◦ g = idW et g ◦ f = idV .
Autrement dit, la fonction f : V → W est un C 1 -difféomorphisme de V dans W . Par ailleurs,
dy g = dy f −1 = (dg(y) f )−1 .
pour tout y ∈ W on a :
Exemple 2.6.2
Soit f : R2 → R2 définie par f (x, y) = sin y2 + x, sin x2 + y . La fonction f est de classe C 1
Remarque 2.6.3
② Contrairement au cas des fonctions d’une variable, le fait que dx f soit un homéomorphisme
pour tout x ∈ U n’implique pas que f est bijective de U sur f (U ).
Par exemple : la fonction f : R2 ∋ (x, y) 7→ (ex cos(y), ex sin(y)) ∈ R2 est de classe C 1 . Pour
tout (x, y) ∈ R2 on a x
e cos(y) −ex sin(y)
Jf (x, y) =
ex sin(y) ex cos(y)
Donc Jf (x, y) est inversible puisque det (Jf (x, y)) = e2x ̸= 0.
Cependant f n’est pas injective (elle est 2π-périodique relativement à la variable y, par
exemple on f (0, 0) = f (0, 2π)).
à Preuve du Théorème 2.6.2. On note y0 = f (x0 ). On souhaite montrer que si y est proche de
y0 (y est dans un voisinage W de y0 ) alors il admet un unique antécédent proche de x0 (unique dans
un voisinage V de x0 ). Étant donné x ∈ U , l’application
φ : z 7→ f (x) + dx0 f (z − x)
est une approximation de f , au moins si x est proche de x0 (on écrit f (z) ≃ f (x) + dx f (z − x) ≃
f (x) + dx0 f (z − x) où on a utilisé la différentiabilité de f en x puis la continuité de df en x0 ).
Pour trouver un antécédent de y par f on va d’abord en chercher un par φ. Puisque dx0 f est inversible,
pour tout y ∈ F il existe un unique z ∈ E tel que φ(z) = y. On note Gy (x) cet antécédent. On a en
fait
Gy (x) = x + (dx0 f )−1 (y − f (x)). (2.20)
On remarque alors que y = f (x) si et seulement si Gy (x) = x. Autrement dit, trouver un antécédent
de y par f revient en fait à trouver un point fixe de Gy . On va montrer que si y est suffisamment
proche de f (x0 ) l’application Gy sera contractante sur un voisinage fermé bien choisi de x0 et aura
donc un unique point fixe dans ce fermé, y aura un unique antécédent par f au voisinage de x0 .
Pour montrer que Gy est contractante il suffit de montrer qu’elle est différentiable et de majorer
la norme de sa différentielle par ℓ ∈ [0, 1 [ . La fonction Gy est bien différentiable pour tout y comme
composée de fonctions différentiables, et on a
Comme df est continue, il existe ε > 0 tel que pour tout x ∈ B (x0 , ε) on ait
1
∥dx f − dx0 f ∥ < −1
2 (dx0 f )
et donc,
∀x ∈ B̄ (x0 , ε) , ∀y ∈ F, ∥dx Gy∥ < 21 .
Pour affirmer que Gy est contractante sur B̄ (x0 , ε) et pouvoir utiliser le théorème du point fixe
il faut encore s’assurer que
Gy B̄ (x0 , ε) ⊂ B̄ (x0 , ε) .
D’après l’inégalité des accroissements finis, si x ∈ B (x0 , ε), on a
Pour s’assurer que Gy (x) ∈ B (x0 , ε), en utilisant inégalité triangulaire, il suffit que
ε
∥Gy (x0 ) − x0 ∥ < ,
2
Prof. Mohammed SHIMI 32 Département MI-ENS-Fès
Chapitre II : Calcul Diff dans les Espaces de Banach LE-EM-S6
W := y ∈ F, y − y0 ∈ dx0 f B 0, 2ε
et V := {x ∈ B (x0 , ε) , f (x) ∈ W } .
On a donc
∥g(y) − g (x̄)∥ = ∥x − x̄∥ ≤ 2 (dx0 f )−1 × ∥y − ȳ∥ , (2.22)
ce qui prouve que g est continue.
Pour montrer que g est différentiable sur
−1W , on va montrer que dx f est inversible d’inverse continue
pour tout x ∈ V et que L = df −1 (y) f vérifie (2.3) pour la fonction g. Soit x ∈ V et y = f (x),
d’après (2.21), on a
dx f = dx0 f ◦ (I − dGy ) .
dx0 f est inversible d’inverse continue par hypothèse et (I − dGy ) aussi d’après le Lemme 1.4.2 du
Chapitre I, puisque ∥dGy ∥ < 21 < 1 (y ∈ W ). Ainsi dx f est inversible et son inverse est continue.
Soient maintenant y ∈ W et k ∈ F tel que y + k ∈ W . On note x = g(y) et h tel que x + h = g(y + k),
i.e. f (x + h) = y + k. On a g(y + k) − g(y) = h et par ailleurs, puisque f est différentiable
avec lim ε(h) = 0. Donc h = (dx f )−1 (k) − ∥h∥(dx f )−1 (ε(h)) et ainsi
h→0
On en déduit que
où on a utilisé (2.22) avec ȳ = y + k pour majorer ∥h∥ en terme de ∥k∥ (autrement dit pour montrer
qu’un o(h) est aussi un o(k)). Comme g est continue on a
et donc
g(y + k) − g(y) − (dx f )−1 (k) = o(k)
−1
ce qui prouve que g est différentiable en y avec dy g = (dx f )−1 = df −1 (y) f .
Finalement, comme f −1 = g, df et L 7→ L−1 sont continues cela prouve que dg est continue et donc
g est de classe C 1 . ✓
Exemple 2.6.3
On va utiliser le théorème d’inversion locale pour résoudre l’équation différentielle
avec condition initiale f (0) = 0 où g est une fonction continue donnée suffisamment petite dans
un sens à préciser.
On note E = C01 ([0, 1]) l’ensemble des fonctions f de classe C 1 (si f est solution elle est dérivable
et donc continue, on a alors f ′ = g − f 2 qui est continue donc f est C 1 ) telles que f (0) = 0.
On le munit de la norme ∥f ∥E = sup |f ′ (x)| (vérifier que c’est bien une norme). Soit F =
x∈[0,1]
C 0 ([0, 1]) muni de la norme ∥ · ∥∞ .
On définit φ : E → F par φ(f ) = f ′ + f 2 . Résoudre l’équation (Eq1 ) revient à trouver f ∈ E
tel que φ(f ) = g. On peut noter que φ(0) = 0, donc on va chercher à appliquer le Théorème
d’inversion locale à la fonction φ au point 0 ∈ E (g petit signifie alors g est dans un voisinage
de 0 ∈ F pour ∥ · ∥∞ ).
• On sait que (F, ∥ · ∥∞ ) est un espace de Banach. On peut montrer que (E, ∥ · ∥E ) l’est aussi
(en exercice). Pour pouvoir appliquer le Théorème d’inversion locale il faut montrer que φ
est de classe C 1 et que d0 φ est un homéomorphisme.
• On montre que φ est différentiable et que pour tout f ∈ E on a df φ(h) = hZ′ + 2f h (pour
x
montrer la continuité de df φ on pourra remarquer que si f ∈ E on a |f (x)| ≤ |f ′ (t)| dt ≤
0
∥f ∥E et donc ∥f ∥∞ ≤ ∥f ∥E ). On a alors
∥df φ − dg φ∥ = sup ∥df φ(h) − dg φ(h)∥ ≤ sup 2∥f − g∥∞ ∥h∥∞ ≤ 2∥f − g∥E ,
∥h∥E ≤1 ∥h∥E ≤1
′
(d0 φ)−1 (k) E
= (d0 φ)−1 (k) = ∥k∥∞ ,
∞
ce qui prouve que (d0 φ)−1 est continue (de norme égale 1) et donc d0 φ est bien un homéo-
morphisme.
Il est à noter que cela montre l’existence d’une unique solution f seulement au voisinage de 0 (on
peut en fait montrer qu’il n’y en a pas d’autre du tout).
f (x, y) = 0,
et doit son nom au fait que, sous les hypothèses que l’on va préciser, on peut en tirer y comme
fonction de x : on dit alors que f (x, y) = 0 définit implicitement y, ou encore y comme fonction
implicite de x.
Dans le cas linéaire, le théorème des fonctions implicites se représente en deux forme :
(ii) version géométrique : le noyau d’une application linéaire L : Rm+p → Rp de rang p (i.e.
surjective) est le graphe d’une application l : Rm → Rp i.e. ker(L) = {(x, l(x)) | x ∈ Rm }.
↬ L’objectif ici est de "savoir" si on peut trouver une fonction d’une variable dont cette courbe (ou
au moins une partie de cette courbe) serait le graphe, c’est-à-dire, existe-t-il une fonction φλ telle
que (x, y) ∈ Eλ si et seulement si y = φλ (x) ?
Dans le cas de l’exemple précédent, on sait que l’on ne peut pas décrire toute la courbe à l’aide d’une
fonction. Si par exemple λ = 1, les deux points (0, 1) et (0, −1) sont sur le cercle, mais on ne peut
pas trouver de fonction φ(x) telle que φ(0) soit égal à la fois à 1 et à −1. On pourra par contre
décrire (par exemple) le demi-cercle C + = (x, y) ∈ R × R+ , x2 + y 2 = 1 comme étant le graphe de
√
la fonction φ(x) = 1 − x2 définie sur l’intervalle [−1, 1].
↬ De façon plus précise, la question que l’on se pose est la suivante : Étant donnés une fonction
f (x, y), un nombre réel λ et un point (x0 , y0 ) tel que f (x0 , y0 ) = λ, peut-on trouver un intervalle
(ouvert) I contenant x0 , un intervalle (ouvert) J contenant y0 et une fonction x 7→ φλ (x) définie sur
I tels que pour tout (x, y) ∈ I × J on ait f (x, y) = λ si et seulement si y = φλ (x) ?
On reprend l’exemple précédent, et on fixe λ = r2 > 0 (il n’y a rien à faire sinon). On se donne un
point (x0 , y0 ) sur le cercle de centre (0, 0) et de rayon r, en particulier x0 ∈ [−r, r]. On peut alors
distinguer 3 cas :
① x0 ∈] − r, r[ et y0 > 0. Le point (x0 , y√0 ) est sur le demi-cercle "supérieur". On peut alors choisir
I =] − r, r[, J =]0, +∞[ et φλ (x) = r2 − x2 .
② x0 ∈] − r, r [ et y0 < 0. Le point (x0 , y0 )√est sur le demi-cercle "inférieur". On peut alors choisir
I =] − r, r[, J =] − ∞, 0 [ et φλ (x) = − r2 − x2 .
qui est continue par composition d’applications linéaires continues. d(x0 ,y0 ) Φ est donc bien un homéo-
morphisme.
D’après le théorème d’inversion locale il existe des voisinages U1 de (x0 , y0 ) et U2 de Φ (x0 , y0 ) =
(x0 , f (x0 , y0 )) et Ψ : U2 → V2 de classe C 1 inverse de F . Quitte à diminuer U2 on peut de plus
supposer que U1 est de la forme U1 = V × W (on remplace U2 par Φ(U × V ) = Ψ−1 (U × V ) qui est
ouvert puisque Ψ est continue). Si (a, b) ∈ U2 on a
(x, y) = Ψ(a, b) ⇐⇒ (a, b) = Φ(x, y) = (x, f (x, y)),
autrement dit nécessairement x = a et donc Ψ est de la forme Ψ(a, b) = (a, ψ(a, b)). Quitte à
restreindre V , pour tout x ∈ V on a (x, f (x0 , y0 )) ∈ U2 donc il existe un unique y = ψ (x, f (x0 , y0 )) ∈
W tel que Φ(x, y) = (x, f (x0 , y0 )) c’est-à-dire f (x, y) = f (x0 , y0 ). On définit alors φ : V → W par
φ(x) = ψ (x, f (x0 , y0 )) qui est bien de classe C 1 .
Il reste à montrer (2.23). Pour tout x ∈ V, σ(x) = f (x, φ(x)) = f (x0 , y0 ), i.e. σ est constante, sa
différentielle est donc nulle. Or, par différentiation de fonctions composées on a
dx(x,φ(x)) f + dy(x,φ(x)) f ◦ dx φ = dx σ = 0.
D’autre part, d’après le Théorème d’inversion locale on sait que d(x,y) Φ est inversible sur V × W et
donc d’après (2.24), on a dy(x,φ(x)) est inversible. On en déduit (2.23). ✓
Remarque 2.6.4
Si dans le Théorème 2.6.4, on suppose que f est non seulement de classe C 1 , mais de classe C n
où n ≥ 2 (resp. de classe C ∞ ), alors l’application φ : V → W est un C n -difféomorphisme (resp.
C ∞ -difféomorphisme), d’après le Théorème 2.4.3.
Comme pour l’inversion locale, lorsqu’on est en dimension finie on peut voir ce que devient ce
théorème. On considère donc f : U → Rm avec U ⊂ Rn ≃ Rn−m × Rm (pour que dy(x0 ,y0 ) f soit
inversible il faut que F et G aient même dimension). On notera p = n − m et x = (x1 , . . . , xp ) ∈ Rp
et y = (y1 , . . . , ym ) ∈ Rm .
Théorème 2.6.5
Soient U ⊂ Rp × Rm un ouvert et f := (f1 , . . . , fm ) : U → Rm de classe C 1 . Soit (a, b) ∈ U tel
que
∂f1 ∂f1
∂y1 (a, b) · · · (a, b)
∂ym
.. ..
. .
∂fm ∂fm
(a, b) · · · (a, b)
∂y1 ∂ym
soit inversible. Alors il existe des voisinages V de a et W de b et une unique application
φ : V → W de classe C 1 tels que
De plus on a :
−1
∂f1 ∂f1 ∂f1 ∂f1
(a, b) · · · (a, b) (a, b) · · · (a, b)
∂y1 ∂ym ∂x1 ∂xp
Jφ (a) = − .. .. .. ..
.
. .
. .
∂fm ∂fm ∂fm ∂fm
(a, b) · · · (a, b) (a, b) · · · (a, b)
∂y1 ∂ym ∂x1 ∂xp
Remarque 2.6.5
∂f
Dans le cas p = m = 1, on retrouve bien l’hypothèse (a, b) ̸= 0, et on a alors
∂y
∂f
(x, φ(x))
φ′ (x) = − ∂f
∂x
. (2.25)
∂y
(x, φ(x))
En particulier,
∂f
(a, b)
φ′ (a) = − ∂f
∂x
.
∂y
(a, b)
Dans le cas où ∂f
∂y
(a, b) = 0 mais ∂f
∂x
(a, b) ̸= 0 on peut intervertir les rôles de x et y et exprimer x
en fonction de y au lieu de y en fonction de x.
Exemple 2.6.5
❶ On considère la courbe du plan définie par l’équation f (x, y) := y 3 − xy − 1 = 0.
• Le point (0, 1) est sur la courbe. On montre qu’au voisinage de ce point, la courbe est le
graphe d’une fonction y = φ(x). La fonction f est bien de classe C 1 .
• Par ailleurs ∂f
∂y
(x, y) = 3y 2 − x d’où ∂f
∂y
(0, 1) = 3 ̸= 0 et on peut donc appliquer le Théorème
des fonctions implicites et exprimer y en fonction de x au voisinage de (0, 1).
• Par récurrence on en déduit que φ est de classe C ∞ et admet donc un DL à tout ordre. Par
ailleurs on a φ(0) = 1 par définition de φ et donc φ′ (0) = 31 d’après (2.26), d’où on obtient
x
φ(x) = 1 + + o(x).
3
• En dérivant la deuxième expression de (2.26) on a
• C’est l’équation d’une surface S dans R3 (si f (x, y, z) = ax+by+cz est linéaire, f (x, y, z) = 0
est l’équation d’un plan, pas d’une droite).
∂f
−1 ∂f
d(0,0) φ = − ∂z
(0, 0, 1) (0, 0, 1).
∂x
C’est-à-dire
∂f ∂f
∂φ ∂x
(0, 0, 1) 1 ∂φ ∂y
(0, 0, 1) 1
(0, 0) = − ∂f =− et (0, 0) = − ∂f =− .
∂x ∂z
(0, 0, 1) 3 ∂y ∂z
(0, 0, 1) 2
2.7 Extremums
Dans cette section on considère des fonctions à valeurs réelles, et l’on s’intéresse à leurs extrema,
c’est-à-dire à leurs minima et maxima. On parlera en fait essentiellement de minima, les maxima
d’une fonction f pouvant toujours être vus comme les minima de −f .
• On dit que x∗ est solution de (P) si f (x∗ ) = inf f (x) et x∗ ∈ C autrement dit si
x∈C
f (x∗ ) ≤ f (x), ∀x ∈ C.
• On dit que x∗ est une solution locale de (P) si x∗ est dans C et s’il existe r > 0 tel que
Définition 2.7.1
Soient E un espace de Banach, U un ouvert de E et Soit f : U → R.
• On dit que f possède un minimum (resp. maximum) local en x0 s’il existe un voisinage
V de x0 tel que pour tout x ∈ V on ait
• Un minimum (resp. maximum) est dit strict si l’inégalité est stricte pour x ̸= x0 .
Dans chacun des cas, on dit que f possède un extremum local (resp. global ) en x0 .
Proposition 2.7.1
Soit f : U → R. Si f possède un extremum local (resp. global ) en x0 ∈ U alors dx0 f = 0,
i.e. c’est l’application nulle de E dans R (on dit que x0 est un point critique de f ).
✔ Réciproquement si x0 est tel que f ′ (x0 ) = 0 et f ′′ (x0 ) > 0 (resp. f ′′ (x0 ) < 0), alors f possède
un minimum (resp. maximum) local strict en x0 .
En effet, si x0 est un minimum local on sait que f ′ (x0 ) = 0, et on a donc pour h assez petit
2
0 ≤ f (x0 + h) − f (x0 ) = h2 f ′′ (x0 ) + o h2 .
et il existe h0 > 0 tel que pour |h| < h0 le terme dans la parenthèse est strictement positif ce qui
prouve que f (x0 + h) > f (x0 ) pour h ∈] − h0 , h0 [ et non nul.
Définition 2.7.2
Soit L : E × E → R une forme bilinéaire.
• On dit que L est positive (resp. négative) si, pour tout h ∈ E, on a L(h, h) ≥ 0 (resp.
L(h, h) ≤ 0).
• Si L(h, h) > 0 ( resp. L(h, h) < 0), pour tout h ∈ E\{0}, on dit que L est définie positive
(resp. définie négative).
Remarque 2.7.2
Si E = R, on a d2x f f (h, k) = f ′′ (x)hk donc d2x0 f est (définie) positive (resp. négative) si et
seulement si f ′′ (x0 ) est (strictement) positif (resp. négatif).
On a alors le résultat suivant dans Rn (et donc dans n’importe quel espace E de dimension finie).
Proposition 2.7.2
Soient U un ouvert de Rn et f : U → R une fonction deux fois différentiable.
❶ Si x0 est un minimum (resp. maximum) local de f alors dx0 f = 0 et d2x0 f est positive
(resp. négative).
❷ Si x0 est tel que dx0 f = 0 et d2x0 f est définie positive (resp. définie négative), alors x0 est
un minimum (resp. maximum) local strict de f .
Lemme 2.7.1
Soit A ∈ Mn (R) une matrice symétrique. A est définie positive si et seulement si il existe m > 0
tel que pour tout h ∈ Rn on ait t hAh ≥ mt hh = m∥h∥22 .
t hAh
t
m := inf t hh = inf h
∥h∥2
A h
∥h∥2
= inf t hAh = min t hAh,
h̸=0 h̸=0 h∈S h∈S
↬ Ce lemme affirme que si A est définie positive non seulement h 7→ t hAh > 0 mais qu’il est minoré
par une fonction quadratique (on dit que A est coercive).
❶ Étant donné h ∈ E, pour t dans un voisinage de 0 , on définit gh (t) = f (x0 + th) (gh est une
fonction d’une variable). On suppose que x0 est un minimum local de f . On en déduit que 0 est
un minimum local de gh et donc gh′′ (0) ≥ 0. Or gh′ (t) = d(x0 +th) f (h) donc gh′′ (0) = d2(x0 ) f (h, h).
Pour tout h, on a d2(x0 ) f (h, h) ≥ 0 et donc d2(x0 ) f est positive.
❷ Réciproquement, si d(x0 ) f = 0 et. d2(x0 ) f est définie positive. Soit m > 0 tel que d2(x0 ) f (h, h) ≥
m∥h∥22 . D’après la formule de Taylor à l’ordre 2, pour tout ε > 0 il existe δ > 0 tel que si
∥h∥2 < δ (on est en dimension finie donc toutes les normes sont équivalentes) alors
(ii)- en chaque point critique, étudier si sa hessienne (différentielle seconde) est définie positive
ou négative.
Pour étudier si la hessienne est positive ou négative on pourra utiliser le résultat suivant
Proposition 2.7.3
Soit A une matrice symétrique. Elle est diagonalisable dans R. De plus, A est (définie) positive
(resp. négative) si toutes ses valeurs propres sont (strictement) positives (resp. négatives).
En particulier en dimension 2, puisque la somme des valeurs propres est la trace de A et leur produit
le déterminant de A, une matrice symétrique A est définie positive (resp. négative) si et seulement
si det(A) > 0 et Tr(A) > 0 (resp. Tr(A) < 0).
Exemple 2.7.1
Soit f (x, y) = 2(x−y)2 −x4 −y 4 définie sur R2 . La fonction f est clairement deux fois différentiable.
On a
∂f
∂x
(x, y) = 4(x − y) − 4x3 , ∂f ∂x
(x, y) = 4(y − x) − 4y 3 .
Si (x, y) est un point critique, en additionnant les deux dérivées partielles on en déduit que
x3 + y 3 = 0 et donc x = −y. Ainsi (x, y) est point critique
√ √ √ si x = −y et
√ si et seulement
3
8x − 4x = 0. On trouve ainsi 3 points critiques : (0, 0), ( 2, − 2) et (− 2, 2).
2
−4
On calcule ensuite Hf (x, y) = 4−12x
−4 4−12y 2 et on étudie cette dernière en chacun des points
critiques :
√ √ √ √
• En ( 2, − 2) on a Hf ( 2, − 2) = −20 −4
qui a pour déterminant 384 > 0 et pour
−4 −20 , √ √
trace −40 < 0. Elle est donc définie négative et ( 2, − 2) est un maximum local strict.
√ √ √ √ √ √ √ √
• En (− 2, 2) on a Hf (− 2, 2) = Hf ( 2, − 2), et donc (− 2, 2) est aussi un maxi-
mum local strict.
4 −4
• En (0, 0) on a Hf (0, 0) = −4 4 , qui a pour déterminant 0 et pour trace 8 . Elle a donc
une valeur propre positive et une valeur propre nulle. Si (0, 0) est un extremum c’est un
minimum local. Or f (0, 0) = 0 et pour tout x on a f (x, x) = −2x4 < 0 donc (0, 0) ne peut
pas être un minimum, ce n’est donc pas un extremum de f .
Remarque 2.7.4
On fera bien attention que la Proposition 2.7.2 n’est a priori valable qu’en dimension finie. En
dimension quelconque, seule la première partie est vraie (voir la preuve). Pour la réciproque il
faut des hypothèses un peu plus fortes.
Exemple 2.7.2
On vérifie facilement que les formes affines et les normes sont convexes et qu’elles ne sont jamais
strictement convexes. Le carré d’une norme Hilbertienne est convexe :
H ∋ x → ∥x∥2 .
De façon générale le moyen le plus simple d’établir la convexité n’est pas l’utilisation de la définition
mais plutôt celui de la caractérisation via la différentielle seconde (voir Proposition . ? ?).
❶ f est convexe
Remarque 2.7.5
En supposant en outre que f est deux fois différentiable, f est convexe si et seulement si pour
tous x, y ∈ C,
d2x f · (y − x, y − x) ≥ 0.
Elle est strictement convexe si l’inégalité ci-dessus est stricte pour x ̸= y.