0% ont trouvé ce document utile (0 vote)
51 vues14 pages

Cours - Fonctions de Deux Variables

Ce document traite des fonctions de deux variables dans le cadre des mathématiques, en présentant leur représentation graphique et les concepts de limites et de continuité. Il aborde également la dérivation directionnelle des fonctions de plusieurs variables, en soulignant les différences avec la dérivation des fonctions à une seule variable. Des exemples illustratifs sont fournis pour clarifier ces notions.

Transféré par

haythemkhtaiwan14
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
51 vues14 pages

Cours - Fonctions de Deux Variables

Ce document traite des fonctions de deux variables dans le cadre des mathématiques, en présentant leur représentation graphique et les concepts de limites et de continuité. Il aborde également la dérivation directionnelle des fonctions de plusieurs variables, en soulignant les différences avec la dérivation des fonctions à une seule variable. Des exemples illustratifs sont fournis pour clarifier ces notions.

Transféré par

haythemkhtaiwan14
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Christophe Bertault — Mathématiques en MPSI

FONCTIONS DE DEUX VARIABLES

Dans ce chapitre, R2 et R3 sont munis de leur structure euclidienne canonique. On identifiera R2 au plan d’équation z = 0
de R3 , ce qui revient à identifier tout couple (x, y) de R2 au triplet (x, y, 0) de R3 . On notera (e1 , e2 ) la base canonique de
R2 et (e1 , e2 , e3 ) celle de R3 .

1 GRAPHE D’UNE FONCTION DE DEUX VARIABLES


Nous avons l’habitude de représenter toute fonction f : R −→ R comme une courbe dans le plan R2 , précisément la courbe
d’équation y = f (x). Une fonction f : R2 −→ R sera quant à elle représentée comme la surface d’équation z = f (x, y).
f
Intéressons-nous par exemple à la fonction (x, y) 7−→ x 2 + sin(3 y). Pour construire son graphe S , on étudie souvent
l’intersection de celui-ci avec une collection de plans parallèles qui balaient l’espace R3 tout entier. Ainsi, pour tout λ ∈ R :
— l’intersection de S et du plan d’équation x = λ est la courbe d’équation z = λ2 + sin(3 y) dans ce plan,
— l’intersection de S et du plan d’équation y = λ est la courbe d’équation z = x 2 + sin(3λ) dans ce plan,
— l’intersection de S et du plan d’équation z = λ est la courbe d’équation x 2 + sin(3 y) = λ dans ce plan et on l’appelle
la ligne de niveau λ de f .

Intersection de S avec x = −3 Intersection de S avec y = 3

10 10

0 0
−4 −4 −4
−2 −2 −2 −4
0 0 0 −2
2 2 2 0
4 4 2
y x y 4 4 x

Intersection de S avec z = 10

10

0
−4 −4
−2 −2
0 0
2 2
y 4 4 x

Faites l’effort de réfléchir en les mêmes termes aux exemples qui suivent et assurez-vous que vous les comprenez bien.

1
Christophe Bertault — Mathématiques en MPSI

z = x2 + y2 z = x2 − y2
p
z= x2 + y2

10
4
0
10
2
−10
0 0
−2
−2 −2 −2 −2 0
0 0 0 0 −2
2 2 2 2 2 2 0
y y
y x x x

z = sin x + sin y z = sin x

2 2

0 0

−2 −2
−5 −5
−5 −5
0 1 1 0
0 z= + 0
|x| | y|
y 5 5 x
y 5 5 x

0
−2
−2
0 0
y 2 2 x

2 LIMITES ET CONTINUITÉ D’UNE FONCTION DE R2 DANS R


La topologie de C a été étudiée au chapitre « Topologie de R et C » à travers les notions de boule, de voisinage et d’ouvert
notamment. L’identification de tout nombre complexe x + i y ∈ C au couple (x, y) ∈ R2 transporte p à présent naturellement
ces notions dans R2 . Les modules |x +i y| sont simplement remplacés par des normes (x, y) = x 2 + y 2 . Pour tout a ∈ R2 ,
on notera VR2 (a) l’ensemble des voisinages de a dans R2 , mais la notation n’est pas universelle.

Définition (Limite (finie) en un point) Soient E une partie de R2 , f : E −→ R une fonction, a ∈ E et ℓ ∈ R. On dit
que f admet ℓ pour limite en a si :
∀Vℓ ∈ VR (ℓ), ∃ Va ∈ VR2 (a), ∀p ∈ E ∩ Va , f (p) ∈ Vℓ ,
i.e. si : ∀ǫ > 0, ∃ α > 0, ∀p ∈ E, kp − ak < α =⇒ f (p) − ℓ < ǫ.

La plupart des résultats qu’on a démontrés pour les fonctions de R dans R sont conservés : unicité et notation lim f (p),
p→a
caractère localement borné, opérations (combinaison linéaire, produit, inverse, composition avec une fonction de R dans R),
interaction avec les inégalités larges/strictes, théorème d’encadrement. . . Les preuves sont immédiates, il suffit de remplacer
les valeurs absolues dans l’ensemble de départ par des distances dans R2 .

2
Christophe Bertault — Mathématiques en MPSI

$contraire.
Attention ! Faire tendre p = (x, y) vers a = (x , y ) ne revient pas à faire tendre x vers x puis y vers y ou le
a a a
Le point p peut se rapprocher de a de bien des manières, il n’est pas obligé d’y aller en ligne droite selon e = (1, 0)
a
1
ou e2 = (0, 1).
f 2x y 2

Intéressons-nous par exemple à la fonction (x, y) 7−→ 2 sur R \ (0, 0) .
x + y2
Clairement : 1
2x y 2x y
lim lim 2 2
= lim 0 = 0 et lim lim 2 = lim 0 = 0,
x→0 y→0 x + y x→0 y→0 x→0 x + y 2 y→0
0
mais nous allons voir que f n’a pas de limite en (0, 0). La figure ci-contre en
témoigne et c’est facile à prouver en coordonnées polaires.
−1
Tout point p = (x, y) de R2 peut être écrit (r cos θ , r sin θ ) pour un certain
(r, θ ) ∈ R+ ×R dit couple de coordonnées polaires de p. Par 2π-périodicité du cosi- −5
nus et du sinus, un tel couple n’est pas jamais unique, attention ! Trois relations
p 0
méritent d’être comprises : x = r cos θ , y = r sin θ et r = x 2 + y 2 .
Le point (0, 0) a la particularité d’admettre le couple (0, θ ) pour coordonnées x 5 −5 0 5
polaires pour tout θ ∈ R. y

Mais revenons à notre exemple. Pour tout (x, y) ∈ R2 \ (0, 0) de coordonnées polaires (r, θ ) :
2x y 2 . r cos θ . r sin θ
f (x, y) = = = sin(2θ ), donc f ne dépend que de la variable θ .
x2+y 2 r2
Par conséquent, si (x, y) tend vers (0, 0) en maintenant l’angle θ constant, f (x, y) tend vers sin(2θ ) pour ce θ fixé. On
obtient ainsi des limites différentes selon la manière dont on fait tendre (x, y) vers (0, 0), donc f n’a pas de limite en (0, 0).
La figure ci-dessus illustre bien l’indépendance de f vis-à-vis de r. Son graphe peut être construit comme un « faisceau
tournant » de demi-droites orthogonales à l’axe Vect(e3 ).

Définition (Continuité en un point ou sur une partie) Soient E une partie de R2 , f : E −→ R une fonction et a ∈ E.
On dit que f est continue en a si f (p) −−−→ f (a), i.e. si :
p→a

∀ǫ > 0, ∃ α > 0, ∀p ∈ E, kp − ak < α =⇒ f (p) − f (a) < ǫ.


L’ensemble des fonctions sur E et à valeurs dans R, i.e. continues en tout point de E, est noté C (E, R).

Toute combinaison linéaire de fonctions continues est une fonction continue. Même chose avec le produit, l’inverse et la
composition avec une fonction de R dans R.

$suffitAttention ! Pour montrer qu’une fonction de


pas de montrer que les fonctions d’
variables (x, y) 7−→ f (x, y) est continue en a = (x , y ), il ne
DEUX
variable x 7−→ f (x, y ) et y 7−→ f (x , y) sont continues respectivement en
UNE
a a
a a
x a et ya . De nouveau, (x, y) peut s’approcher de a de bien des manières, il n’est pas obligé de le faire en fixant x ou y.
f 2x y
La fonction (x, y) 7−→ 2 de l’exemple précédent n’est pas prolongeable par continuité en (0, 0), mais pourtant les
x + y2
fonctions x 7−→ f (x, 0) et y 7−→ f (0, y), identiquement nulles, le sont en 0.

Exemple Les fonctions (x, y) 7−→ x et (x, y) 7−→ y sont continues sur R2 . A fortiori, par produit et combinaison linéaire,
toute fonction polynomiale de deux variables est continue sur R2 .
f
Démonstration Démontrons-le pour (x, y) 7−→ x. Soient a = (x a , ya ) ∈ R2 et ǫ > 0.
p
Pour tout p = (x, y) ∈ R2 : f (p) − f (a) = |x − x a | ¶ (x − x a )2 + ( y − ya )2 = kp − ak.
Posons donc α = ǫ. Pour tout point p ∈ R2 : kp − ak < α =⇒ f (p) − f (a) < ǫ.

Exemple La norme v 7−→ kvk est continue sur R2 .


Démonstration Simple composition
p de la fonction polynomiale (x, y) 7−→ x 2 + y 2 continue sur R2 à valeurs
dans R+ et de la fonction t 7−→ t continue sur R+ .

Exemple Soient I et J deux intervalles, ϕ ∈ C (I , R) et ψ ∈ C (J , R). Les deux fonctions (x, y) 7−→ ϕ(x) + ψ( y) et
(x, y) 7−→ ϕ(x) ψ( y) sont continues sur I × J .
Démonstration (x, y) 7−→ x est continue sur I × J à valeurs dans I et ϕ l’est sur I , donc (x, y) 7−→ ϕ(x) est
continue sur I × J par composition. Même raisonnement pour (x, y) 7−→ ψ( y). On conclut par somme et produit.

$et (x,
Attention ! Dans les exemples qui précèdent, on a soigneusement fait appel aux fonctions élémentaires (x, y) 7−→ x
y) 7−→ y, même pour justifier la continuité d’une fonction aussi simple que (x, y) 7−→ ϕ(x).

3
Christophe Bertault — Mathématiques en MPSI

3 COMMENT « DÉRIVER » UNE FONCTION DE R2 DANS R ?


La théorie de la « dérivation » des fonctions en général, pas forcément de R dans R, est appelée calcul différentiel. Je mets
des guillemets parce que, comme nous allons le voir, il est beaucoup plus compliqué et subtil de « dériver » une fonction de
plusieurs variables qu’une fonction d’une seule variable.

Définition (Dérivée directionnelle) Soient Ω un ouvert de R2 , f : Ω −→ R une fonction, a ∈ Ω et v ∈ R2 . On


F
dit que f est dérivable en a dans la direction v si la fonction t 7−→ f (a + t v) est dérivable en 0, i.e. si la fonction
f (a + t v) − f (a)
t 7−→ possède une limite finie en 0..
t f (a + t v) − f (a)
Le cas échéant, on appelle dérivée de f en a dans la direction v le réel Dv f (a) = F ′ (0) = lim .
t→0 t

Si v = (0, 0), la fonction t 7−→ f (a + t v) = f (a) est définie et constante sur R tout entier, donc
dérivable en 0 avec D(0,0) f (a) = 0.
Pour v non nul, la définition précédente n’a de sens que parce que la fonction t 7−→ f (a + t v)

est définie au voisinage de 0. Cela découle du caractère ouvert de Ω, qui contient B(a, r) pour un r
r b
a
certain r > 0. Posons en effet α = . Pour tout t ∈ ] − α, α[ : a + t v ∈ B(a, r) ⊂ Ω car
kvk
d(a, a + t v) = kt vk = |t| . kvk < α kvk = r. La fonction t 7−→ f (a + t v) est ainsi définie sur ] − α, α[. v
b

Et maintenant, que représente géométriquement la dérivée de f en a dans la direction v ? Droite affine


¦ © a + Vect(v)
1) Considérez dans R3 le graphe S de f : S = (x, y, z) ∈ R3 | (x, y) ∈ Ω et z = f (x, y) .
2) Coupez-le sans ménagement par le plan « vertical » Pa,v passant par a dirigé par les deux vecteurs orthogonaux v et
e3 . En toute rigueur, v appartient à R2 , mais nous avons identifié R2 au plan d’équation z = 0 de R3 . L’intersection
S ∩ Pa,v est une courbe C du plan Pa,v .
3) Oubliez désormais le reste de l’espace et concentrez-vous sur Pa,v et C . Munissez Pa,v du repère (a, v, e3 ). La courbe
C n’est alors rien de plus que le graphe de la fonction t 7−→ f (a + t v) et, s’il existe, Dv f (a) est son nombre dérivé en
0, i.e. la pente de sa tangente en 0. Notez bien ici que v n’est pas forcément unitaire, il faut en tenir compte quand
on se représente la pente.

Pa,v
Pa,v

e3

b
e3
S f (a) v v
b

f (a)
C
C

a
z=0 b

a
z=0 b

La définition suivante n’est qu’un cas particulier de la précédente.

Définition (Dérivées partielles) Soient Ω un ouvert de R2 , f : Ω −→ R une fonction et a ∈ Ω. S’il existe, le réel
De1 f (a) est appelé première dérivée partielle de f en a et noté ∂1 f (a).
Même chose pour la notion de deuxième dérivée partielle. Le cas échéant, le réel De2 f (a) est noté ∂2 f (a).

4
Christophe Bertault — Mathématiques en MPSI

df
Une fonction f d’UNE SEULE variable possède UNE SEULE dérivée f ′ quand elle est dérivable. Il arrive qu’on note
dx
cette dérivée, mais cela signifie qu’on a choisi une fois pour toutes de voir f comme une fonction de la variable x. Après un
df
tel choix, il n’est pas possible de noter la dérivée de f .
dt
La situation est la même avec les fonctions de deux variables. Une fonction f de DEUX variables possède DEUX dérivées
partielles quand elle en possède. On peut les noter ∂1 f et ∂2 f , mais il est courant qu’on choisisse de voir f comme une
∂f ∂f
fonction du couple (x, y). Le cas échéant, ∂1 f est notée et ∂2 f est notée . Dans certains contextes, on préférera voir
∂x ∂y ∂f ∂f
f comme une fonction du couple (u, v), auquel cas ses dérivées partielles sont notées et . Tous les choix sont permis,
∂u ∂v
mais une fois qu’on a choisi une convention de notation, on s’y tient et on n’accorde pas plus de deux dérivées partielles à f .

$ Attention ! Pour une fonction d’une seule variable, la notation


∂f ∂f
df
dx
s’écrit avec des « d » droits. Pour une fonction de

deux variables, les notations et s’écrivent au contraire avec des « d » ronds. C’est comme ça. . .
∂x ∂y
∂f ∂f ∂ f (x, y)
Par ailleurs, quand on évalue en (x, y), le résultat se note (x, y) ET NON PAS .
∂x ∂x ∂x
Le calcul concret des dérivées partielles est très facile. En effet, avec des notations évidentes :
∂f f (a + t e1 ) − f (a) f (x a + t, ya ) − f (x a , ya )
(a) = lim = lim ,
∂x t→0 t t→0 t
∂f
donc calculer (a) revient à fixer y à la valeur ya dans f (x, y) et à dériver par rapport à x au sens usuel. Pour la même
∂x
∂f
raison, on obtient en dérivant f (x, y) par rapport à y à x fixé.
∂y

f 2
Exemple La fonction (x, y) 7−→ e x y possède des dérivées partielles sur R2 et pour tout (x, y) ∈ R2 :
∂f 2 ∂f 2
(x, y) = y 2 e x y et (x, y) = 2x y e x y .
∂x ∂y

Le résultat qui suit n’est qu’une adaptation au cas des fonctions de deux variables de résultats bien connus pour les
fonctions d’une seule variable. Nous n’avons rien à démontrer car les dérivées partielles ne sont jamais que des dérivées par
rapport à une seule variable, l’autre étant gelée.

Théorème (Opérations sur les dérivées partielles)


• Combinaison linéaire, produit, inverse : Soient Ω un ouvert de R2 et f : Ω −→ R et g : Ω −→ R deux fonctions.
Si f et g possèdent des dérivées partielles sur Ω, il en va de même de toute combinaison linéaire de f et g et du
1 
produit f g, mais aussi de l’inverse si f ne s’annule pas. En outre, pour tous i ∈ 1, 2 et λ, µ ∈ R :
f
∂i f
 ‹
1
∂i (λ f + µg) = λ∂i f + µ∂i g, ∂i ( f g) = g ∂i f + f ∂i g et ∂i =− 2 .
f f
• Composition : Soient Ω un ouvert de R2 , I un intervalle, f : Ω −→ I et ϕ : I −→ R deux fonctions avec f (Ω) ⊂ I .
Si f possède desdérivées partielles sur Ω et si ϕ est dérivable sur I , ϕ ◦ f possède des dérivées partielles sur Ω
et pour tout i ∈ 1, 2 : ∂i (ϕ ◦ f ) = ∂i f × ϕ ′ ◦ f .

Alors que les dérivées partielles sont. . . justement partielles, le gradient d’une fonction f collecte des informations sur les
variations de f dans les deux directions e1 et e2 et constitue de ce point de vue notre première définition de ce qu’on pourrait
avoir envie d’appeler « la dérivée de f ». Nous en donnerons bientôt une interprétation géométrique.

Définition (Gradient) Soient Ω un ouvert de R2 , f : Ω −→ R une fonction et a ∈ Ω. Si f possède des dérivées


partielles en a, on appelle gradient de f en a le VECTEUR de R2 :

∇ f (a) = grad f (a) = ∂1 f (a) , ∂2 f (a) = ∂1 f (a) e1 + ∂2 f (a) e2 . Le symbole ∇ se lit « nabla » !
Opérations sur les gradients : ∇(λ f + µg) = λ∇ f + µ∇g, ∇( f g) = g∇ f + f ∇g,
 ‹
1 1
∇ = − 2 ∇f et ∇(ϕ ◦ f ) = ϕ ′ ◦ f × ∇ f .
f f

∂f ∂f
Par exemple, si les variables de f sont notées x et y : ∇ f (A) = (A) e1 + (A) e2 .
∂x ∂y

5
Christophe Bertault — Mathématiques en MPSI

4 FONCTIONS DE CLASSE C 1

4.1 DÉFINITION ET PREMIÈRES PROPRIÉTÉS

Définition (Fonction de classe C 1 ) Soient Ω un ouvert de R2 et f : Ω −→ R une fonction. On dit que f est de classe
C 1 sur Ω si f possède des dérivées partielles sur Ω et si celles-ci sont continues sur Ω.
L’ensemble des fonctions de classe C 1 sur Ω à valeurs dans R est noté C 1 (Ω, R).

Toute combinaison linéaire et tout produit de fonctions de classe C 1 est bien sûr de classe C 1 . L’inverse d’une fonction
de classe C 1 qui ne s’annule pas aussi. Enfin, pour tout ouvert Ω de R2 et tout intervalle I , la composée ϕ ◦ f d’une fonction
f ∈ C 1 (Ω, R) avec f (Ω) ⊂ I et d’une fonction ϕ ∈ C 1 (I , R) est une fonction de classe C 1 sur Ω.

Exemple Les fonctions (x, y) 7−→ x et (x, y) 7−→ y sont de classe C 1 sur R2 . A fortiori, par produit et combinaison linéaire,
toute fonction polynomiale de deux variables est de classe C 1 sur R2 .
f
Démonstration Montrons-le pour (x, y) 7−→ x. Pour tout y ∈ R (variable gelée), la fonction x 7−→ f (x, y) = x
∂f
est dérivable sur R, donc f possède une première dérivée partielle sur R2 et (x, y) = 1 pour tout (x, y) ∈ R2 .
∂x
De même, pour tout x ∈ R (variable gelée), la fonction y 7−→ f (x, y) = x est dérivable sur R, donc f possède
∂f ∂f ∂f
une deuxième dérivée partielle sur R2 et (x, y) = 0 pour tout (x, y) ∈ R2 . Finalement, et étant
∂y ∂x ∂y
continues sur R2 car constantes, f est de classe C 1 sur R2 .

Exemple La norme v 7−→ kvk est de classe C 1 sur R2 \ (0, 0) — attention, pas en (0, 0) !

Démonstration D’abord, R2 \ (0, 0) est bien ouvert. Ensuite, la fonction polynomiale (x, y) 7−→ x 2 + y 2
 p
est de classe C 1 sur R2 \ (0, 0) à valeurs dans R∗+ et la fonction t 7−→ t est de classe C 1 sur R∗+ , donc par

composition, v 7−→ kvk est de classe C 1 sur R2 \ (0, 0) .
(0, 0) + t e1 − (0, 0) |t|
Et en (0, 0) ? Pour tout t ∈ R∗ : = et bien sûr, cette quantité n’a pas de limite
t t
quand t tend vers 0, donc v 7−→ kvk n’a pas de première dérivée partielle en (0, 0).

Exemple La fonction (x, y) 7−→ e−x ln( y) est de classe C 1 sur R × R∗+ .
Démonstration D’abord, R×R∗+ est ouvert en tant que produit de deux intervalles ouverts. Ensuite, (x, y) 7−→ x
est de classe C 1 sur R × R∗+ et x 7−→ e−x de classe C 1 sur R, donc (x, y) 7−→ e−x est de classe C 1 sur R × R∗+ par
composition. De même, (x, y) 7−→ ln y est de classe C 1 sur R × R∗+ par composition via les fonctions (x, y) 7−→ y
et y 7−→ ln y. On conclut par produit.

$et (x,
Attention ! Dans les exemples qui précèdent, on a soigneusement fait appel aux fonctions élémentaires (x, y) 7−→ x
−x
y) 7−→ y, même pour justifier qu’une fonction aussi simple que (x, y) 7−→ e est de classe C . 1

4.2 EXISTENCE DE DÉVELOPPEMENTS LIMITÉS À L’ORDRE 1

La suite du chapitre repose en grande partie sur le résultat que voici dont la preuve est explicitement hors programme.

Théorème (Existence de développements limités à l’ordre 1 pour les fonctions de classe C 1 ) Soient Ω un ouvert
de R2 , f ∈ C 1 (Ω, R) et a ∈ Ω. Alors f possède un développement limité à l’ordre 1 au voisinage de a :
 
f (a + v) = f (a) + ∇ f (a) , v + o kvk , ou encore : f (p) = f (a) + ∇ f (a) , p − a + o kp − ak .
v → (0, 0) p→a

Si les variables de f sont notées x et y et si a = (x a , ya ), il est équivalent d’affirmer que :


∂f ∂f € Š
f (x a + h, ya + k) = f (a) + (a) h + (a) k + o (h, k) .
(h, k) → (0, 0) ∂x ∂y

Démonstration Quitte à remplacer f par (x, y) 7−→ f (x a + x, ya + y), on peut supposer sans perte de généralité
que a = (0, 0).

6
Christophe Bertault — Mathématiques en MPSI

Soit ǫ > 0. Comme Ω est ouvert, nous pouvons nous donner un réel r > 0 pour lequel B(a, r) ⊂ Ω. En outre,
∂f ∂f
les fonctions et étant continues en (0, 0) par hypothèse, il existe des réels α x > 0 et α y > 0, que nous
∂x ∂y
pouvons choisir inférieurs à r, pour lesquels pour tout (h, k) ∈ R2 :
∂f ∂f ǫ ∂f ∂f ǫ
(h, k) < α x =⇒ (h, k) − (0, 0) < et (h, k) < α y =⇒ (h, k) − (0, 0) < .
∂x ∂x 2 ∂y ∂y 2

Posons α = min α x , α y . Soit ensuite v = (h, k) ∈ R2 un vecteur pour lequel kvk < α.
∂f ∂f
f (v) − f (0, 0) − ∇ f (0, 0) , v = f (h, k) − f (0, 0) − (0, 0) h − (0, 0) k
∂x ∂y
€ Š ∂f € Š ∂f
= f (h, k) − f (0, k) − (0, 0) h + f (0, k) − f (0, 0) − (0, 0) k
∂x ∂y
Zh Zh Zk Zk
∂f ∂f ∂f ∂f
= (s, k) ds − (0, 0) ds + (0, t) dt − (0, 0) dt d’après le théorème
∂ x ∂ x ∂ y ∂ y
0 0 0 0 fondamental de l’analyse
Z h ‹ Z k ‹
∂f ∂f ∂f ∂f
¶ (s, k) − (0, 0) ds + (0, t) − (0, 0) dt .
0
∂x ∂x 0
∂y ∂y
p p
Or pour tout s compris entre 0 et h : (s, k) = s2 + k2 ¶ h2 + k2 = kvk < α ¶ α x et pour tout t compris
p
entre 0 et k : (0, t) = |t| ¶ |k| ¶ h2 + k2 = kvk < α ¶ α y , donc :
ǫ ǫ ǫ ǫ
f (v) − f (0, 0) − ∇ f (0, 0) , v ¶ |h| + |k| ¶ kvk + kvk = ǫ kvk.
2 2 2 2

En résumé, nous avons trouvé un réel α > 0 pour lequel pour tout v ∈ R2 \ (0, 0) :

kvk < α =⇒ f (v) − f (0, 0) − ∇ f (0, 0) , v ¶ ǫ kvk.



Comme voulu : f (v) − f (0, 0) − ∇ f (0, 0) , v = o kvk .
v → (0, 0)

Théorème (Continuité d’une fonction de classe C 1 ) Soient Ω un ouvert de R2 et f ∈ C 1 (Ω, R). Alors f ∈ C (Ω, R).

Démonstration Pour tout a ∈ Ω, par simple troncature du développement limité à l’ordre 1 de f en a :


f (p) −−−→ f (a).
p→a

Il peut sembler curieux qu’on dispose d’une notion de continuité et d’une notion de classe C 1 , mais pas d’une notion
intermédiaire de dérivabilité. Le chaînon manquant s’appelle la différentiabilité et ne figure pas au programme de MPSI, mais
je lui consacrerai un petit paragraphe hors programme en fin de chapitre.

Définition (Plan tangent) Soient Ω un ouvert de R2 , f ∈ C 1 (Ω, R) et a = (x a , ya ) ∈ Ω. Le plan de R3 d’équation :


∂f ∂f
z = f (a) + (a) (x − x a ) + (a) ( y − ya ) est appelé le plan tangent de f en a.
∂x ∂y

Nous savons depuis longtemps qu’une courbe suffisamment régulière ressemble lo-
calement à une droite. Sans surprise, toute surface suffisamment régulière ressemble
localement à un plan. Pour une fonction ϕ d’une seule variable, l’équation de la tan-
gente en a s’exprimait naturellement en termes de développement limité à l’ordre 1 :
ϕ(x) = ϕ(a) + ϕ ′ (a) (x − a) + o(x − a). La situation est la même avec les fonctions
x→a
de deux variables.
A

f
Exemple La fonction (x, y) 7−→ sin(x +2 y) est de classe C 1 sur R2 et son plan tangent en (0, 0) a pour équation z = x +2 y.
Démonstration Polynomiale, la fonction (x, y) 7−→ x + 2 y est de classe C 1 sur R2 et la fonction t 7−→ sin t
l’est sur R, donc f est de classe C 1 sur R2 par composition.
∂f ∂f
Ensuite, pour tout (x, y) ∈ R2 : (x, y) = cos(x + 2 y) et (x, y) = 2 cos(x + y), donc le plan
∂x ∂y
∂f ∂f
tangent de f en (0, 0) a donc pour équation z = f (0, 0) + (0, 0) x + (0, 0) y = x + 2 y.
∂x ∂y

7
Christophe Bertault — Mathématiques en MPSI

4.3 RÈGLE DE LA CHAÎNE

La maîtrise pratique du résultat qui suit est plus ou moins l’objectif majeur de ce chapitre. C’est très facile !

Théorème (Règle de la chaîne) Soient Ω un ouvert de R2 , I un intervalle, f ∈ C 1 (Ω, R) et enfin x, y ∈ C 1 (I , R)


deux fonctions pour lesquelles pour tout t ∈ I : x(t), y(t) ∈ Ω.
F 
La fonction t 7−→ f x(t), y(t) est de classe C 1 sur I et pour tout t ∈ I :
d € Š ∂f  ∂f 
F ′ (t) = f x(t), y(t) = x ′ (t) x(t), y(t) + y ′ (t) x(t), y(t) .
dt ∂x ∂y

Dans cet énoncé, f est perçue comme une fonction des variables x et y, mais attention, ce x et ce y ne sont pas les
∂f ∂f
fonctions t 7−→ x(t) et t 7−→ y(t) de l’énoncé, ce sont juste des noms de variables qui fixent la notation et des
∂x ∂y
dérivées partielles.

Démonstration Notons γ la fonction t 7−→ x(t), y(t) , de sorte que F = f ◦ γ. Soit t ∈ I . Composons le

développement limité de f au voisinage de γ(t) à l’ordre 1 avec la limite lim γ(t + h) − γ(t) = (0, 0).
 € Š h→0
F (t + h) = f γ(t + h) = f γ(t) + γ(t + h) − γ(t)
   € Š
= f γ(t) + ∇ f γ(t) , γ(t + h) − γ(t) + o γ(t + h) − γ(t) .
h→0
Ç 2 2 p
Or : γ(t + h) − γ(t) = x(t + h) − x(t) + y(t + h) − y(t) = |h| x ′ (t)2 + y ′ (t)2 + o(h), donc on
€ Š h→0

peut remplacer le o γ(t + h) − γ(t) par un o(h) :


∂f   ∂f  
F (t + h) = F (t) + γ(t) x(t + h) − x(t) + γ(t) y(t + h) − y(t) + o(h)
h→0 ∂x ∂y
∂f   ∂ f  
= F (t) + γ(t) hx ′ (t) + o(h) + γ(t) h y ′ (t) + o(h) + o(h)
h→0 ∂x ∂y
 ‹
∂ f  ∂ f
= F (t) + x ′ (t) γ(t) + y ′ (t) γ(t) h + o(h).
h→0 ∂x ∂y
∂f  ∂f 
Ce développement limité prouve que F est dérivable en t et que F ′ (t) = x ′ (t) γ(t) + y ′ (t) γ(t) . Pour
∂x ∂y
finir, l’expression de F ′ ainsi obtenue est continue sur I , donc F y est de classe C 1 . La petite subtilité de l’affaire,
c’est que γ est à valeurs dans R2 et non pas R, mais ses composantes x et y sont continues toutes les deux.
 F 
Exemple Soit f ∈ C 1 R2 , R . La fonction t 7−→ f t 2 , sin t est de classe C 1 sur R car t 7−→ t 2 et t 7−→ sin t le sont sur R,
∂f 2  ∂f 2 
et pour tout t ∈ R : F ′ (t) = 2t t , sin t + cos t t , sin t .
∂x ∂y

L’exemple qui suit mérite une lecture très attentive.

Exemple Pour tout α ∈ R et toute fonction f : R2 −→ R, on dit que f est homogène de degré α si pour tous (x, y) ∈ R2 et
λ > 0 : f (λx, λ y) = λα f (x, y) Æ.

Fixons une fois pour toutes α ∈ R et f ∈ C 1 R2 , R homogène de degré α. Nous noterons par convention x et y les variables
∂f ∂f
de f . Les dérivées partielles de f sont donc les deux fonctions ∂1 f = et ∂2 f = et f n’a pas d’autre dérivée partielle.
∂x ∂y
La relation Æ fait pourtant appel à trois variables x, y et λ et on peut la dériver par rapport à chacune de ces variables.
∂f
ATTENTION, on va dériver par rapport à λ, mais la notation n’a aucun sens !
∂λ
• Dérivation par rapport à x : Pour dériver
 f (λx, λ y) par rapport à x, on adapte ce qu’on sait faire pour dériver les
expressions de la forme f x(t), y(t) par rapport à t. Cela donne :
∂f ∂f ∂f ∂f ∂f
λ× (λx, λ y) + 0 × (λx, λ y) = λα (x, y), i.e. (λx, λ y) = λα−1 (x, y).
∂x ∂y ∂x ∂x ∂x
∂f
Cette égalité vraie pour tous (x, y) ∈ R2 et λ > 0 montre que est homogène de degré α − 1.
∂x
• Dérivation par rapport à y : Même calcul qu’à l’instant, x et y jouant des rôles symétriques dans la relation Æ :
∂f ∂f ∂f
(λx, λ y) = λα−1 (x, y), donc est homogène de degré α − 1.
∂y ∂y ∂y

8
Christophe Bertault — Mathématiques en MPSI

• Dérivation par rapport à λ : Pour dériver


 f (λx, λ y) par rapport à λ, on adapte ce qu’on sait faire pour dériver les
expressions de la forme f x(t), y(t) par rapport à t. Cela donne :
∂f ∂f
x (λx, λ y) + y (λx, λ y) = αλα−1 f (x, y),
∂x ∂y
∂f ∂f ∂f ∂f
mais et sont homogènes de degré α − 1, donc on peut simplifier un peu : x +y = α f . Une telle
∂x ∂y ∂x ∂y
relation qui lie f à ses dérivées partielles est appelée une équation aux dérivées partielles. Les équations aux dérivées
partielles sont aux fonctions de plusieurs variables ce que les équations différentielles sont aux fonctions d’une seule
variable et la physique en est truffée.

La règle de la chaîne est maintenant acquise, mais que raconte-t-elle géométriquement ? C’est γ′ (t)
γ(t)
l’objet du théorème que voici, qui éclaire de plus les notions de dérivée directionnelle et gradient.
Mais d’abord, un détail technique. Nous avons travaillé avec des fonctions à valeurs dans R
jusqu’ici, mais rien n’empêche qu’on utilise à l’occasion des fonctions à valeurs dans R2 . Pour
tout intervalle I et toutes fonctions x, y ∈ C 1 (I , R), on considèrera par définition que la fonction
γ  
t 7−→ x(t), y(t) est de classe C 1 sur I et on notera γ′ sa dérivée, i.e. la fonction t 7−→ x ′ (t), y ′ (t) .
Géométriquement, γ est ce qu’on appelle une courbe paramétrée ou un arc paramétré tracé dans le
plan R2 et γ′ est en tout point le vecteur vitesse du mobile γ.

Théorème (Règle de la chaîne, dérivées directionnelles et gradient pour les fonctions de classe C 1 ) Soient Ω
un ouvert de R2 et f ∈ C 1 (Ω, R).

(i) Règle de la chaîne deuxième version : Soient I un intervalle et γ ∈ C 1 I , R2 une fonction pour laquelle

γ(I ) ⊂ Ω. La fonction f ◦ γ est de classe C 1 sur I et pour tout t ∈ I : ( f ◦ γ)′ (t) = ∇ f γ(t) , γ′ (t) .
(ii) Dérivées directionnelles : La fonction f possède une dérivée en tout point de Ω dans toutes les directions.
Plus précisément, pour tous a ∈ Ω et v = (h, k) ∈ R2 :
∂f ∂f
Dv f (a) = ∇ f (a) , v = (a) h + (a) k.
∂x ∂y
(iii) Interprétation géométrique du gradient : Le gradient de f est orthogonal aux lignes de niveau de f et dirigé
dans le sens des pentes croissantes.

Par définition, une fonction de deux variables est de classe C 1 quand elle possède des dérivées CONTINUES dans les deux
directions privilégiées e1 et e2 . D’après l’assertion (ii), cette hypothèse garantit en fait l’existence de dérivées dans TOUTES
les directions que l’on peut calculer facilement à partir des dérivées partielles ou du gradient.
Pour une fonction f d’une seule variable, vous savez depuis longtemps que le réel f ′ (a) est la pente de la tangente de f
en a. Pour vous le faire comprendre, on vous a sans doute dit que « quand on avance de 1 vers la droite en abscisse, on monte
de f ′ (a) en ordonnée sur la tangente ». La situation est la même pour une fonction f de deux variables. Au voisinage de a,
le graphe de f a l’allure de son plan tangent et Dv f (a) n’est jamais que la pente de ce plan dans la direction v. L’assertion
∂f ∂f
(ii) énoncé que quand on avance de h dans la direction e1 et de k dans la direction e2 , on monte de (a) h + (a) k
dans la direction e sur le plan tangent. ∂ x ∂ y
3

L’assertion (ii) nous permet en retour d’interpréter


 géométriquement la règle de la
chaîne. La relation ( f ◦ γ)′ (t) = Dγ′ (t) f γ(t) montre que ( f ◦ γ)′ (t) est une dérivée direc-
tionnelle de f , en l’occurrence la dérivée de f en γ(t) dans la direction γ′ (t). La figure
ci-contre illustre le phénomène. Le mobile γ évolue dans le plan R2 , mais on peut s’intéres-
ser à sa projection verticale sur le graphe de f . Le résultat est un nouvel arc paramétré,
à trois dimensions cette fois et entièrement contenu dans le graphe de f. Sur la figure
proposée, la pente de la droite en pointillé dans le repère γ(t), γ′ (t), e3 vaut à la fois γ′ (t)

( f ◦ γ)′ (t) et Dγ′ (t) f γ(t) . γ(t)

Pour finir, l’assertion (iii) se visualise très


§ bien et les figures ci-dessous
ª vaudront mieux qu’un long discours. On y a
1 3 3 1
représenté les lignes de niveau λ pour λ ∈ 2, 1, , , 0, − , − , −1, −2 . ATTENTION CEPENDANT, les gradients ont été
2 10 10 2
ramenés de force à la même norme sur la figure de droite pour une raison esthétique.

9
Christophe Bertault — Mathématiques en MPSI

y
y
z=p b b b b

b b
b b b b

1 + x2 y2 b b
b
b b
b
b b

b b b b
b b
b b
b b
b b
b b
b b
b b
b b

b b
b b b b

b b
b
b b
b b

b b
b b
b b b b

4 b b b

b
b b

b
b b b
x
b b
b b
b b

2 b b

4 b
b
b
b
b

0 2 b
b
b b
b
b

−2
b b

0 b
b

b
b b
b
b
b

b b

−4−4 −2 y
b
b
b b b b
b
b

−2 0 2 b b

4 −4 b b
b
b b
b
b b

x b b b b b b b b

Démonstration
(i) Simple réécriture de la règle de la chaîne.
F
(ii) Comme Ω est ouvert, la fonction t 7−→ f (a + t v) est définie sur ] − α, α[ pour un certain α > 0 et elle y
∂f ∂f
est de classe C 1 d’après la règle de la chaîne avec F ′ (0) = (a) h + (a) k. Le résultat en découle car
∂x ∂y

F (0) = Dv f (a) par définition des dérivées directionnelles.
¦ ©
(iii) Fixons λ ∈ R et notons Cλ la courbe de niveau λ de f : Cλ = (x, y) ∈ R2 | f (x, y) = λ . Pour
montrer que ∇ f est orthogonal à Cλ , nous pouvons supposer Cλ non vide. Faisons aussi l’hypothèse — pas
vraie en toute généralité sous cette forme, mais passons — que Cλ peut être paramétrée par une courbe
paramétrée γ = (x, y) de classe C 1 sur un intervalle I dont la dérivée ne s’annule pas. Dans ces conditions,
pour tout point p ∈ R2 : p ∈ Cλ ⇐⇒ ∃ t ∈ I , p = γ(t), donc f ◦ γ(t) = λ pour tout t ∈ I .
En retour, d’après la règle de la chaîne : ∇ f γ(t) , γ′ (t) = 0. En d’autres termes, ∇ f γ(t) est

orthogonal au vecteur γ (t) qui dirige la tangente de γ en t. C’est cela qu’on veut dire quand on affirme
que le gradient est orthogonal aux lignes de niveau.

Le théorème qui suit n’est rien de plus qu’une nouvelle application de la règle de la chaîne. On y manipule cette fois des
fonctions de R2 dans R2 et, de nouveau, la dérivée d’une telle fonction se calcule composante par composante.

Théorème (Composition d’une fonction de R2 dans R2 suivie d’une fonction de R2 dans R) Soient U et Ω deux
ouverts de R2 , x, y ∈ C 1 (U, R) et f ∈ C 1 (Ω, R). On suppose que x(u, v), y(u, v) ∈ Ω pour tout (u, v) ∈ U et on pose

F (u, v) = f x(u, v), y(u, v) . La fonction F est de classe C 1 sur U et pour tout (u, v) ∈ U :
∂F ∂ € Š ∂ x ∂f  ∂y ∂f 
(u, v) = f x(u, v), y(u, v) = (u, v) x(u, v), y(u, v) + (u, v) x(u, v), y(u, v)
∂u ∂u ∂u ∂x ∂u ∂y
∂F ∂ € Š ∂ x ∂f  ∂y ∂f 
et : (u, v) = f x(u, v), y(u, v) = (u, v) x(u, v), y(u, v) + (u, v) x(u, v), y(u, v) .
∂v ∂v ∂v ∂x ∂v ∂y
∂F ∂x ∂f ∂y ∂f ∂F ∂x ∂f ∂y ∂f
En résumé : = + et = + .
∂u ∂u ∂ x ∂u ∂ y ∂v ∂v ∂x ∂v ∂ y

Dans cet énoncé, les fonctions x et y sont perçues comme des fonctions des variables u et v et f comme une fonction
de x et y, mais attention, ce x et ce y sont juste des noms de variables et non pas les fonctions (u, v) 7−→ x(u, v) et
(u, v) 7−→ y(u, v).

Démonstration La règle de la chaîne nous permet de dériver la fonction u 7−→ F (u, v) à v fixé et la fonction
∂F ∂F
v 7−→ F (u, v) à u fixé. Il se trouve enfin que les expressions obtenues de et sont continues sur U, donc F
∂ u ∂v
y est de classe C 1 .
 
Exemple Soit f ∈ C 1 R2 , R . On pose pour tout (u, v) ∈ R2 : F (u, v) = f u2 + v, uv − v 2 . La fonction F est de classe
C 1 sur R2 car les fonctions (u, v) 7−→ u2 + v et (u, v) 7−→ uv − v 2 le sont et pour tout (u, v) ∈ R2 :
∂F ∂f 2  ∂f 2  ∂F ∂f 2  ∂f 2 
(u, v) = 2u u +v, uv−v 2 +v u +v, uv−v 2 et (u, v) = u +v, uv−v 2 +(u−2v) u +v, uv−v 2 .
∂u ∂x ∂y ∂v ∂x ∂y

10
Christophe Bertault — Mathématiques en MPSI

Le passage d’un problème posé en termes de coordonnées cartésiennes à un problème posé en termes de coordonnées
polaires est particulièrement courant. Rappelons donc que tout point (x, y) de R2 peut être écrit sous la formep
(r cos θ , r sin θ )
pour un certain couple (r, θ ) ∈ R+ × R. Trois relations à connaître : x = r cos θ , y = r sin θ et r = x 2 + y 2 . On
sait aussi exprimer θ en fonction de x et y à l’aide des arctangente, arcsinus et arccosinus, mais cela demande plus de doigté.
En réalité, on autorise souvent r à être négatif quand on parle de coordonnées polaires. Ainsi, si (r, θ ) est un couple de
coordonnées polaires de (x, y) avec r ¾ 0 : x = r cos θ = (−r) cos(θ + π) et y = r sin θ = (−r) sin(θ + π), donc
(−r, θ + π) est un autre couple de coordonnées polaires de (x, y). Faites un dessin !
Notons à présent x la fonction (r, θ ) 7−→ r cos θ et y la fonction (r, θ ) 7−→ r sin θ , toutes deux de classe C 1 sur R2 . La
ϕ 
fonction (r, θ ) 7−→ x(r, θ ), y(r, θ ) = (r cos θ , r sin θ ) est alors de classe C 1 de R2 dans R2 et c’est grâce à elle qu’on passe
d’une expression en coordonnées cartésiennes à une expression en coordonnées polaires. Par exemple, en notant O le point
(0, 0), ϕ transforme :
— la bande horizontale Ωpol = ] − ρ, ρ[ × R en la boule ouverte Ωcart = B(O, ρ) pour tout θ′
ρ > 0,
θ
— le rectangle Ωpol = ]ρ, ρ ′ [ × ]θ , θ ′ [ en la portion de disque Ωcart représentée ci-contre
pour tous ρ, ρ ′ , θ , θ ′ ∈ R pour lesquels 0 < ρ < ρ ′ et θ < θ ′ . b

O ρ ρ′

Donnons-nous à présent une fonction f ∈ C 1 de variables x et y sur un ouvert Ωcart de R2 . Notons ensuite Ωpol l’image
réciproque de Ωcart par ϕ — on peut montrer que Ωpol est un ouvert de R2 . L’ouvert Ωpol est la version polaire de l’ouvert
Ωcart . Posons enfin F (r, θ ) = f (r cos θ , r sin θ ) pour tout (r, θ ) ∈ Ωpol . La fonction F ainsi définie est la version polaire de f .
Les physiciens donneraient le même nom aux deux fonctions car elles représentent pour eux le même phénomène physique
— force, température, champ magnétique. . . — exprimé simplement de deux façons différentes. Pour nous autres matheux,
f et F sont bel et bien deux fonctions différentes définies sur des ensembles différents — mais de même image.
La fonction F est de classe C 1 sur Ωpol et pour tous (x, y) ∈ Ωcart et (r, θ ) ∈ Ωpol liés par la relation (x, y) = ϕ(r, θ ) :
∂F ∂f ∂f ∂f ∂f
(r, θ ) = cos θ (r cos θ , r sin θ ) + sin θ (r cos θ , r sin θ ) = cos θ (x, y) + sin θ (x, y)
∂r ∂x ∂y ∂x ∂y

∂F ∂f ∂f
donc : r (r, θ ) = x (x, y) + y (x, y) après multiplication par r. De même :
∂r ∂x ∂y

∂F ∂f ∂f ∂F ∂f ∂f
(r, θ ) = −r sin θ (r cos θ , r sin θ ) + r cos θ (r cos θ , r sin θ ), donc : (r, θ ) = − y (x, y) + x (x, y).
∂θ ∂x ∂y ∂θ ∂x ∂y

∂f ∂f 
Exemple On s’intéresse à l’équation aux dérivées partielles y =x d’inconnue f ∈ C 1 (Ω, R) où Ω = R2 \ (0, 0) ,
∂x ∂y
avec la condition aux limites f (x, 0) = e−x pour tout x > 0. Ce type de condition joue le même rôle que les conditions initiales
d’une équation différentielle.
• Analyse : Soit f ∈ C 1 (Ω, R). Posons F (r, θ ) = f (r cos θ , r sin θ ) pour tout (r, θ ) ∈ R∗+ × R. La fonction F ainsi définie
est de classe C 1 sur R∗+ × R et pour tous (x, y) ∈ Ω et (r, θ ) ∈ R∗+ × R liés par la relation (x, y) = (r cos θ , r sin θ ),
∂F ∂f ∂f
d’après les calculs qui précèdent : (r, θ ) = − y (x, y) + x (x, y) = 0. Ainsi, POUR TOUT r > 0, la
∂θ ∂x ∂y
fonction θ 7−→ F (r, θ ) est constante sur R, disons de valeur ϕ(r) DÉPENDANTE DE r. Cela dit, F est de classe C 1 en
tant que fonction de deux variables, elle l’est donc aussi par rapport à r quand on gèle la variable θ — c’est pfaux dans
l’autre sens, ATTENTION. Conclusion : ϕ est de classe C 1 sur R∗+ . Et pour tout (x, y) ∈ Ω : f (x, y) = ϕ x 2 + y 2 ,
p 
donc pour tout x > 0 : ϕ(x) = ϕ x 2 + 02 = f (x, 0) = e−x .
p 2 2
• Synthèse : Notons f la fonction (x, y) 7−→ e− x + y sur 2 2
p Ω. La fonction polynomiale (x, y) 7−→ x + y est de classe
1 ∗ − t ∗
C sur Ω et à valeurs dans R+ et la fonction t 7−→ e est de classe C sur R+ , donc f est de classe C 1 sur Ω et
1

∂f −x p 2 2 −y p 2 2 ∂f
pour tout (x, y) ∈ Ω : y (x, y) = y × p e− x + y = x × p e− x + y = x (x, y). Enfin,
∂x p x2 + y2 x2 + y2 ∂y
2 2
pour tout x > 0 : f (x, 0) = e− x +0 = e−x .
p 2 2
La fonction (x, y) 7−→ e− x + y est donc la seule solution du problème étudié, mais notez p bien que  sans condition aux limites,
le problème aurait eu ÉNORMÉMENT de solutions — toutes les fonctions (x, y) 7−→ ϕ x 2 + y 2 , ϕ décrivant C 1 (R∗+ , R).

11
Christophe Bertault — Mathématiques en MPSI

4.4 EXTREMA LOCAUX

Définition (Extremum local) Soient E une partie de R2 , f : E −→ R une fonction et a ∈ E. On dit que f possède un
maximum local en a si f est majorée par f (a) au voisinage de a, et un minimum local en a si elle est minorée par f (a)
au voisinage de a.

Théorème (Extrema locaux d’une fonction de classe C 1 ) Soient Ω un ouvert de R2 , f ∈ C 1 (Ω, R) et a ∈ Ω. Si


f possède un extremum local en a, alors a est un point critique de f , autrement dit ∇ f (a) = (0, 0). A fortiori, le plan
tangent de f en a est parallèle au plan abscisse et les dérivées directionnelles de f en a sont toutes nulles.

$rivées
Attention ! R ÉCIPROQUE FAUSSE ! La nullité du gradient ou de toutes les dé-
directionnelles n’est pas le signe d’un extremum local. Vous n’en serez pas
surpris, la réciproque était déjà fausse pour les fonctions d’une seule variable. Par
exemple, en notant f la fonction (x, y) 7−→ x 3 : ∇ f (0, 0) = (0, 0), donc pour tout
v = (h, k) ∈ R2 : D(0,0) f (v) = ∇ f (0, 0) , v = 0, donc les dérivées directionnelles 20
de f en (0, 0) sont toutes nulles, mais pourtant f n’a pas d’extremum local en (0, 0).
0
Démonstration Faisons l’hypothèse que f a un maximum local en a. Pour −20
F
tout v ∈ R2 , la fonction d’une variable t 7−→ f (a + t v) est de classe C 1 et −2
2 0
majorée par F (0) = f (a) au voisinage de 0, donc possède un maximum 0 2
−2
local en 0. Comme voulu : Dv f (a) = F ′ (0) = 0. x
y

Mais comment détermine-t-on concrètement les extrema locaux d’une fonction de deux variables ? Nous nous contente-
rons d’exploiter nos connaissances sur les polynômes du second degré et de raisonner par analyse-synthèse.
ϕ
Pour a, b, c ∈ R fixés avec (a, c) 6= (0, 0), le signe de la‹fonction (h, k) 7−→ ah2 + bhk + ck2 est facile à déterminer. Si on
h
note P le polynôme aX 2 + bX + c, alors ϕ(h, k) = k2 P pour tous h ∈ R et k ∈ R∗ .
k
— Cas où b2 − 4ac ¶ 0 : Les réels a et c sont de même signe et P est de signe constant, celui de a ou c selon que a ou
c est non nul, donc ϕ est elle aussi de signe constant.
— Cas où b2 − 4ac > 0 : Le polynôme P prend à la fois des valeurs strictement positives et des valeurs strictement
h
négatives, donc la fonction ϕ aussi. Le signe de ϕ(h, k) dépend du rapport , i.e. de l’angle que le vecteur (h, k) forme
k
avec le vecteur e1 .

f
Exemple La fonction (x, y) 7−→ x 2 − 3x + x y + y 2 possède un et un seul extremum local, en l’occurrence un minimum
local en (2, −1).
Démonstration Tout d’abord, f est de classe C 1 sur R2 .
∂f ∂f
• Analyse : Soit (x, y) ∈ R2 . Si f possède un extremum local en (x, y) : (x, y) = (x, y) = 0,
∂x ∂y
donc 2x + y = 3 et x + 2 y = 0, donc x = 2 et y = −1.
• Synthèse : Le point (2, −1) est-il bel et bien un extremum local de f ? Pour trancher, nous devons comparer
f (2 + h, −1 + k) et f (2, −1) pour (h, k) choisi dans un voisinage de (0, 0). — Il vaut mieux se ramener au
point (0, 0), on y voit plus clair. — Or pour tout (h, k) ∈ R2 :
k 2 3k2
 ‹
f (2+h, −1+k)− f (2, −1) = (2+h)2 −3(2+h)+(2+h)(−1+k)+(−1+k)2 +3 = h2 +hk+k2 = h + + ¾ 0,
2 4
donc f possède un minimum local en (2, −1). J’ai privilégié ici une mise sous forme canonique, bien pra-
tique, mais on aurait pu s’intéresser au discriminant du polynôme X 2 + X + 1.

g y2
Exemple La fonction (x, y) 7−→ x 2 − x − x y − + 2 y ne possède aucun extremum local sur R2 .
2
Démonstration Tout d’abord, g est de classe C 1 sur R2 .
∂g ∂g
• Analyse : Soit (x, y) ∈ R2 . Si g possède un extremum local en (x, y) : (x, y) = (x, y) = 0,
∂x ∂y
donc 2x − y = 1 et x + y = 2, donc x = 1 et y = 1.

12
Christophe Bertault — Mathématiques en MPSI

• Synthèse : Le point (1, 1) est-il bel et bien un extremum local de g ? Pour tout (h, k) ∈ R2 :
(1 + k)2 1 k2
g(1 + h, 1 + k) − g(1, 1) = (1 + h)2 − (1 + h) − (1 + h)(1 + k) − + 2 (1 + k) − = h2 − hk − .
2 2 2
1
Le discriminant du polynôme X 2 − X − étant strictement positif, cette expression n’a pas un signe constant
2
au voisinage de (0, 0), mais soyons précis. Pour tout h ∈ R∗ : g(1+ h, 1)− g(1, 1) = h2 > 0, donc g n’est
k2
majorée par g(1, 1) sur aucun voisinage de (1, 1), et pour tout k ∈ R∗ : g(1, 1 + k) − g(1, 1) = − < 0,
2
donc f n’est minorée par g(1, 1) sur aucun voisinage de (1, 1). Ainsi, g n’a pas d’extremum local en (1, 1).

z = f (x, y) z = g(x, y)

10 5

5
0

0
0 0
2 2 0
−3 −2 −1 0 1 4 y 2
x x
y

5 FONCTION DIFFÉRENTIABLE ET DIFFÉRENTIELLE


Vous avez rencontré plusieurs infiniment petits en physique, notés dx, d f , dT , dt. . . mais la nature exacte de ces objets
vous a sans doute paru mystérieuse. Comment les mathématiciens les définissent-ils formellement ? La notion de différentielle
est hors programme en MPSI, vous la découvrirez l’année prochaine et je me contenterai de lever un coin du voile.
La différentielle est aux fonctions de deux variables ce que la dérivée est aux fonctions d’une seule variable. Et de même
qu’on dispose d’un concept de dérivabilité pour les fonctions d’une seule variable, on définit d’un concept de différentiabilité
pour les fonctions de deux variables. Mais rappelons d’abord qu’une fonction d’une seule variable est dérivable en un point
si et seulement si elle y possède un développement limité à l’ordre 1.

Définition (Fonction différentiable et différentielle) Soient Ω un ouvert de R2 et f : Ω −→ R une fonction.



• En un point : Soit a ∈ Ω. On dit que f est différentiable en a s’il existe une forme linéaire ϕ ∈ L R2 , R pour
 
laquelle : f (a + v) = f (a) + ϕ(v) + o kvk , ou encore : f (p) = f (a) + ϕ(p − a) + o kp − ak .
v → (0, 0) p→a

Dans ces conditions, l’application ϕ est unique, appelée la différentielle de f en a et notée d f a . Ainsi :

f (a + v) = f (a) + d f a (v) + o kvk .
v → (0, 0)

• Sur un ouvert : On dit que f est différentiable sur Ω si elle l’est en tout point de Ω.
 
Ω −→ L R2 , R
L’application est appelée dans ce cas la différentielle de f sur Ω et notée d f .
a 7−→ d fa

Le réel d f a (v) est une approximation à l’ordre 1 de la variation de f au point a en ordonnée induite par une variation de
vecteur v en abscisse. En d’autres termes, quand on passe de a à a + v, f varie approximativement de d f a (v).
La différentielle d f elle-même est un objet relativement abstrait quand on le découvre. L’application d f associe à tout
point de Ω une forme linéaire de R2 .

f
Exemple Les fonctions (x, y) 7−→ x et (x, y) 7−→ y sont différentiables sur R2 et coïncident chacune avec sa différentielle.
On les note respectivement dx et d y.
Ce résultat n’est guère étonnant. Quand on passe de a = (x a , ya ) à a + v = (x a + h, ya + k), la fonction f varie de h = f (v).
Démonstration La fonction f a une propriété importante, elle est linéaire ! Soient
 a = (x a , ya ) ∈ R2 . Pour tout
2
v = (h, k) ∈ R : f (a + v) = x a + h = f (a) + f (v) = f (a) + f (v) + o kvk , donc comme annoncé, f est
v → (0, 0)
différentiable en a et d f a = f .

13
Christophe Bertault — Mathématiques en MPSI

Définition (Différentielle d’une fonction de classe C 1 ) Soient Ω un ouvert de R2 et f ∈ C 1 (Ω, R). Alors f est
∂f ∂f
différentiable sur Ω et pour tous a ∈ Ω et v ∈ R2 : d f a (v) = (a) dx(v) + (a) d y(v).
∂x ∂y
∂f ∂f ∂f ∂f
En résumé : d f a = (a) dx + (a) d y, et même : d f = dx + d y.
∂x ∂y ∂x ∂y

Démonstration De classe C 1 , f possède un développement limité à l’ordre 1 en tout point a ∈ Ω :



f (a + v) = f (a) + ∇ f (a) , v + o kvk .
v → (0, 0)

La différentiabilité de f en a découle ainsi de la linéarité du produit scalaire v 7−→ ∇ f (a) , v . Enfin, pour tout
∂f ∂f ∂f ∂f
v = (h, k) ∈ R2 : d f a (v) = ∇ f (a) , v = (a) h + (a) k = (a) dx(v) + (a) d y(v).
∂x ∂y ∂x ∂y

Et les physiciens dans tout ça ? Ils identifient généralement les fonctions qu’ils manipulent et leurs valeurs, et quand ils
écrivent d f , c’est de d f a (v) qu’ils parlent. Quand on passe du point a au point a + v, f varie à l’ordre 1 de d f a (v), mais les
physiciens auront tendance à considérer que f a varié de d f .

14

Vous aimerez peut-être aussi