Cours - Fonctions de Deux Variables
Cours - Fonctions de Deux Variables
Dans tout ce chapitre, R2 et R3 sont munis de leur structure euclidienne canonique. On identifiera R2au plan d’équation
z = 0 de R3 , ce qui revient à identifier tout couple (x, y) de R2 au triplet (x, y, 0) de R3 . On notera #”
ı , #”
la base canonique
2 #” #” #” 3
de R et ı , , k celle de R , et enfin O le point (0, 0) ou (0, 0, 0).
10 10
0 0
−4 −4 −4
−2 −2 −2 −4
0 0 0 −2
2 2 2 0
4 4 2
y x y 4 4 x
Intersection de S avec z = 10
10
0
−4 −4
−2 −2
0 0
2 2
y 4 4 x
Faites l’effort de réfléchir en les mêmes termes aux exemples qui suivent et assurez-vous que vous les comprenez bien.
1
Christophe Bertault — Mathématiques en MPSI
z = x2 + y2 z = x2 − y2
p
z= x2 + y2
10
4
0
10
2
−10
0 0
−2
−2 −2 −2 −2 0
0 0 0 0 −2
2 2 2 2 2 2 0
y y
y x x x
2 2
0 0
−2 −2
−5 −5
−5 −5
0 1 1 0
0 z= + 0
|x| | y|
y 5 5 x
y 5 5 x
0
−2
−2
0 0
y 2 2 x
B(A, r)
2.1 VOISINAGES ET OUVERTS
B(A, r)
r
2 A b
Dans le plan R2 , on gagnerait bien sûr à parler de disques et de cercles, mais la théorie développée dans ce chapitre
s’étend sans difficulté majeure à Rn pour tout n ¾ 3, alors autant parler tout de suite de boules et de sphères.
La définition qui suit ne devrait pas trop vous dépayser.
Définition (Voisinage d’un point) Soit A ∈ R2 . On appelle voisinage de A toute partie de R2 contenant une boule
ouverte de centre A. On notera dans ce cours VA R2 l’ensemble des voisinages de A.
2
Christophe Bertault — Mathématiques en MPSI
Définition-théorème (Ouvert) Soit Ω une partie de R2 . On dit que Ω est (un) ouvert si :
∀A ∈ Ω, ∃ r > 0, B(A, r) ⊂ Ω, b Ω
autrement dit si Ω est un voisinage de chacun de ses points. b
Exemples d’ouverts :
(i) Toute boule ouverte est un ouvert.
(ii) Le complémentaire de toute boule fermée est un ouvert. En particulier, R2 \ A est un ouvert pour tout A ∈ R2 .
(iii) Tout produit de deux intervalles ouverts est un ouvert.
Démonstration Les assertions (i), (ii) et (iii) se prouvent de la même manière. On se donne un point A dans
l’ouvert candidat Ω étudié et on cherche un réel r > 0 pour lequel B(A, r) ⊂ Ω. Je me contenterai ici d’une preuve
graphique, mais au fond tout y est.
ρ − AB AB − ρ
Ici r = . Ici r = . Ici r = min ρ, ρ ′ .
2 2
A
b
ρ r
r
2r b
A
ρ
A
ρ ρ′
B b b
b
B
r 2r
Définition (Limite (finie) en un point) Soient D une partie de R2 , f : D −→ R une fonction, A ∈ D et ℓ ∈ R. On dit
que f admet ℓ pour limite en A si :
∀Vℓ ∈ Vℓ (R), ∃ VA ∈ VA R2 , ∀M ∈ D ∩ VA, f (M ) ∈ Vℓ ,
i.e. si : ∀ǫ > 0, ∃ α > 0, ∀M ∈ D, AM < α =⇒ f (M ) − ℓ < ǫ.
La plupart des résultats qu’on a démontrés pour les fonctions de R dans R sont conservés : unicité et notation lim f (M )
M →A
ou lim f , caractère localement borné, opérations (combinaison linéaire, produit, inverse, composition avec une fonction de
A
R dans R), interaction avec les inégalités larges/strictes, théorème d’encadrement. . . Les preuves sont faciles à faire, il suffit
de remplacer les valeurs absolues dans l’ensemble de départ par des distances dans R2 .
On aurait pu définir aussi des limites de valeur +∞ ou −∞, mais nous n’en aurons pas dans ce chapitre.
$ Attention ! Faire tendre M = (x, y) vers A = (x A, yA) ne revient pas à faire tendre x vers x A puis y vers yA ou le
contraire. Le point M peut se rapprocher de A de bien des manières, il n’est pas obligé d’y aller en ligne droite selon #”
ı ou #”
.
f 2x y
Intéressons-nous par exemple à la fonction (x, y) 7−→ 2 sur R2 \ (0, 0) .
x + y2
Clairement : 1
2x y 2x y
lim lim = lim 0 = 0 et lim lim = lim 0 = 0,
x→0 y→0 x 2 + y 2 x→0 y→0 x→0 x 2 + y 2 y→0
0
mais nous allons voir que f N’a PAS de limite en (0, 0). Cela se visualise assez bien,
mais cela se montre aussi assez bien en coordonnées polaires (r, θ ).
−1
Tout point M = (x, y) de R2 peut être écrit sous la forme (r cos θ , r sin θ ) pour un
certain (r, θ ) ∈ R+ × R dit couple de coordonnées polaires de M . Par 2π-périodicité −5
du cosinus et du sinus, un tel couple n’est pas jamais unique, attention ! Trois re-
0
p méritent d’être parfaitement comprises : x = r cos θ , y = r sin θ et
lations
2 2
r = x + y . Le point (0, 0) a la particularité d’admettre le couple (0, θ ) pour x 5 −5 0 5
coordonnées polaires pour tout θ ∈ R. y
3
Christophe Bertault — Mathématiques en MPSI
Mais revenons à notre exemple. Pour tout (x, y) ∈ R2 \ (0, 0) de coordonnées polaires (r, θ ) :
2x y 2 × r cos θ × r sin θ
f (x, y) = = = sin(2θ ), donc f NE dépend QUE de la variable θ .
x2
+y 2 r2
Par conséquent, si (x, y) tend vers (0, 0) en maintenant constant l’angle θ , f (x, y) tend vers le réel sin(2θ ) pour ce θ fixé.
On obtient ainsi des limites différentes selon la manière dont on fait tendre (x, y) vers (0, 0), donc en effet, f n’a pas de
limite en (0, 0). La figure ci-dessus illustre bien l’indépendance de f vis-à-vis de r. Son graphe peut être construit comme un
#”
« faisceau tournant » de demi-droites orthogonales à l’axe Vect k .
Définition (Continuité en un point ou sur une partie) Soient D une partie de R2 , f : D −→ R une fonction et A ∈ D.
On dit que f est continue en A si lim f (M ) = f (A), i.e. si :
M →A
∀ǫ > 0, ∃ α > 0, ∀M ∈ D, AM < α =⇒ f (M ) − f (A) < ǫ.
L’ensemble des fonctions sur D et à valeurs dans R, i.e. continues en tout point de D, est noté C (D, R).
Toute combinaison linéaire de fonctions continues est une fonction continue. Même chose avec le produit, l’inverse et la
composition avec une fonction de R dans R.
$ Attention ! Pour montrer qu’une fonction de DEUX variables (x, y) 7−→ f (x, y) est continue en A = (x A, yA), il ne suffit
pas de montrer que les fonctions d’UNE variable x 7−→ f (x, yA) et y 7−→ f (x A, y) sont continues respectivement en x A et
yA. De nouveau, (x, y) peut s’approcher de A de bien des manières, il n’est pas obligé de le faire « à x fixé » ou « à y fixé ».
f 2x y
La fonction (x, y) 7−→ 2 de l’exemple précédent N’est PAS prolongeable par continuité en (0, 0), mais pourtant les
x + y2
fonctions x 7−→ f (x, 0) et y 7−→ f (0, y), identiquement nulles, le sont en 0.
Exemple Les fonctions (x, y) 7−→ x et (x, y) 7−→ y sont continues sur R2 . A fortiori, par produit et combinaison linéaire,
toute fonction polynomiale de deux variables est continue sur R2 .
f
Démonstration Démontrons-le pour (x, y) 7−→ x. Soient A = (x A, yA) ∈ R2 et ǫ > 0.
p
Pour tout M = (x, y) ∈ R2 : f (M ) − f (A) = |x − x A| ¶ (x − x A)2 + ( y − yA)2 = AM .
Posons donc α = ǫ. Pour tout point M : AM < α =⇒ f (M ) − f (A) < ǫ.
Exemple Soient I et J deux intervalles, ϕ ∈ C (I , R) et ψ ∈ C (J , R). Les deux fonctions (x, y) 7−→ ϕ(x) + ψ( y) et
(x, y) 7−→ ϕ(x) ψ( y) sont continues sur I × J .
Démonstration (x, y) 7−→ x est continue sur I × J à valeurs dans I et ϕ l’est sur I , donc (x, y) 7−→ ϕ(x) est
continue sur I × J par composition. Même raisonnement pour (x, y) 7−→ ψ( y). On conclut par somme et produit.
$ Attention ! Dans les exemples qui précèdent, on a soigneusement fait appel aux fonctions élémentaires (x, y) 7−→ x
et (x, y) 7−→ y, même pour justifier la continuité d’une fonction aussi simple que (x, y) 7−→ ϕ(x).
4
Christophe Bertault — Mathématiques en MPSI
#”
Si #”
v = 0 = (0, 0), la fonction t 7−→ f A + t #”
v = f (A) est définie et constante sur R tout entier,
0 f (A) = 0.
donc dérivable en 0 avec D #”
Pour v non nul, la définition précédente n’a de sens que parce que la fonction t 7−→ f A + t #”
#” v
Ω
est DÉFINIE AU VOISINAGE DE 0. Cela découle du caractère OUVERT de Ω, qui contient B(A, r) pour r
r b
A
un certain r > 0. Posons en effet α = #” . Pour tout t ∈ ] − α, α[ : A + t v ∈ B(A, r) ⊂ Ω car
k v k
d A, A + t #”
v = kt #”
v k = |t|.k #”
v k < α k #”
v k = r. La fonction t 7−→ f A + t #”
v est ainsi définie sur #”
v
] − α, α[. b
Droite affine
Et maintenant, que représente géométriquement la dérivée de f en A dans la direction #”
v? A + Vect #”
v
¦ ©
1) Considérez dans R3 le graphe S de f : S = (x, y, z) ∈ R3 | (x, y) ∈ Ω et z = f (x, y) .
2) Coupez-le sans ménagement par le plan « vertical » PA, #” #”
v passant par A dirigé par les deux vecteurs orthogonaux v
#” #” 2 2 3
et k . En toute rigueur, v appartient à R , mais nous avons identifié R au plan d’équation z = 0 de R . L’intersection
S ∩ PA, #”v est une courbe C du plan PA, #”v.
PA, #”
v
PA, #”
v
#”
k
#”
b k
S f (A) #”
v #”
v
b
f (A)
C
C
A
z=0 b
A
z=0 b
Définition (Dérivées partielles) Soient Ω un ouvert de R2 , f : Ω −→ R une fonction et A ∈ Ω. S’il existe, le réel
D#”ı f (A) est appelé première dérivée partielle de f en A et noté ∂1 f (A).
Même chose pour la notion de deuxième dérivée partielle. Le cas échéant, le réel D#” f (A) est noté ∂2 f (A).
df
Une fonction f d’UNE SEULE variable possède UNE SEULE dérivée f ′ quand elle est dérivable. Il arrive qu’on note
dx
cette dérivée, mais cela signifie qu’on a choisi UNE FOIS POUR TOUTES de voir f comme une fonction de la variable x. Après
df
un tel choix, il n’est pas possible de noter la dérivée de f .
dt
La situation est la même avec les fonctions de deux variables. Une fonction f de DEUX variables possède DEUX dérivées
partielles quand elle en possède. On peut les noter ∂1 f et ∂2 f , mais il est courant qu’on choisisse de voir f comme une
∂f ∂f
fonction du couple (x, y). Le cas échéant, ∂1 f est notée et ∂2 f est notée . Dans certains contextes, on préférera voir
∂x ∂y ∂f ∂f
f comme une fonction du couple (u, v), auquel cas ses dérivées partielles sont notées et . Tous les choix sont permis,
∂u ∂v
MAIS une fois qu’on a choisi une convention de notation, on s’y tient et on n’accorde pas plus de deux dérivées partielles à f .
5
Christophe Bertault — Mathématiques en MPSI
df
$ Attention ! Pour une fonction d’une seule variable, la notation s’écrit avec des « d » droits. Pour une fonction de
dx
∂f ∂f
deux variables, les notations et s’écrivent au contraire avec des « d » ronds. C’est comme ça. . .
∂x ∂y
∂f ∂f ∂ f (x, y)
Par ailleurs, quand on évalue en (x, y), le résultat se note (x, y) ET NON PAS .
∂x ∂x ∂x
Le calcul concret des dérivées partielles est très facile. En effet, avec des notations évidentes :
∂f f A + t #”
ı − f (A) f (x A + t, yA) − f (x A, yA)
(A) = lim = lim ,
∂x t→0 t t→0 t
∂f
donc calculer (A) revient à fixer y à la valeur yA dans f (x, y) et à dériver par rapport à x au sens usuel. Pour la même
∂x
∂f
raison, on obtient en dérivant f (x, y) par rapport à y à x fixé.
∂y
f 2
Exemple La fonction (x, y) 7−→ e x y possède des dérivées partielles sur R2 et pour tout (x, y) ∈ R2 :
∂f 2 ∂f 2
(x, y) = y 2 e x y et (x, y) = 2x y e x y .
∂x ∂y
Le résultat qui suit n’est qu’une adaptation au cas des fonctions de deux variables de résultats bien connus pour les
fonctions d’une seule variable. Nous n’avons rien à démontrer car les dérivées partielles ne sont jamais que des dérivées par
rapport à une seule variable, l’autre étant gelée.
Alors que les dérivées partielles sont. . . justement partielles, le gradient d’une fonction f collecte des informations sur
les variations de f dans les deux directions #” ı et #”
et constitue de ce point de vue notre première définition de ce qu’on
pourrait avoir envie d’appeler « la dérivée de f ». Nous en donnerons bientôt une interprétation géométrique.
∂f ∂f
Par exemple, si les variables de f sont notées x et y : ∇ f (A) = (A) #”
ı + (A) #”
.
∂x ∂y
6
Christophe Bertault — Mathématiques en MPSI
4 FONCTIONS DE CLASSE C 1
Définition (Fonction de classe C 1 ) Soient Ω un ouvert de R2 et f : Ω −→ R une fonction. On dit que f est de classe
C 1 sur Ω si f possède des dérivées partielles sur Ω et si celles-ci sont continues sur Ω.
L’ensemble des fonctions de classe C 1 sur Ω à valeurs dans R est noté C 1 (Ω, R).
Toute combinaison linéaire et tout produit de fonctions de classe C 1 est bien sûr de classe C 1 . L’inverse d’une fonction
de classe C 1 qui ne s’annule pas aussi. Enfin, pour tout ouvert Ω de R2 et tout intervalle I , la composée ϕ ◦ f d’une fonction
f ∈ C 1 (Ω, R) avec f (Ω) ⊂ I et d’une fonction ϕ ∈ C 1 (I , R) est une fonction de classe C 1 sur Ω.
Exemple Les fonctions (x, y) 7−→ x et (x, y) 7−→ y sont de classe C 1 sur R2 . A fortiori, par produit et combinaison linéaire,
toute fonction polynomiale de deux variables est de classe C 1 sur R2 .
f
Démonstration Montrons-le pour (x, y) 7−→ x. Pour tout y ∈ R (variable gelée), la fonction x 7−→ f (x, y) = x
∂f
est dérivable sur R, donc f possède une première dérivée partielle sur R2 et (x, y) = 1 pour tout (x, y) ∈ R2 .
∂x
De même, pour tout x ∈ R (variable gelée), la fonction y 7−→ f (x, y) = x est dérivable sur R, donc f possède
∂f ∂f ∂f
une deuxième dérivée partielle sur R2 et (x, y) = 0 pour tout (x, y) ∈ R2 . Finalement, et étant
∂y ∂x ∂y
2 1 2
continues sur R car constantes, f est de classe C sur R .
#” #”
Exemple La norme #” v k est de classe C 1 sur R2 \ 0 — attention, pas en 0 !
7 → k #”
v −
#”
Démonstration D’abord, R2 \ 0 est bien ouvert. Ensuite, la fonction polynomiale (x, y) 7−→ x 2 + y 2 est de
#” p
classe C 1 sur R2 \ 0 à valeurs dans R∗+ et la fonction t 7−→ t est de classe C 1 sur R∗+ , donc par composition,
#”
#” v k est de classe C 1 sur R2 \ 0 .
v 7−→ k #”
#”
#”
0 + t #”ı
−
0
|t|
#” ∗
Et en 0 ? Pour tout t ∈ R : = et bien sûr, cette quantité n’a pas de limite quand t tend
t t #”
#” #”
vers 0, donc v 7−→ k v k n’a pas de première dérivée partielle en 0 .
Exemple La fonction (x, y) 7−→ e−x ln( y) est de classe C 1 sur R × R∗+ .
Démonstration D’abord, R×R∗+ est ouvert en tant que produit de deux intervalles ouverts. Ensuite, (x, y) 7−→ x
est de classe C 1 sur R × R∗+ et x 7−→ e−x de classe C 1 sur R, donc (x, y) 7−→ e−x est de classe C 1 sur R × R∗+ par
composition. De même, (x, y) 7−→ ln y est de classe C 1 sur R × R∗+ par composition via les fonctions (x, y) 7−→ y
et y 7−→ ln y. On conclut par produit.
$ Attention ! Dans les exemples qui précèdent, on a soigneusement fait appel aux fonctions élémentaires (x, y) 7−→ x
et (x, y) 7−→ y, même pour justifier qu’une fonction aussi simple que (x, y) 7−→ e−x est de classe C 1 .
La suite du chapitre repose en grande partie sur le résultat que voici dont la preuve est explicitement hors programme.
Théorème (Existence de développements limités à l’ordre 1 pour les fonctions de classe C 1 ) Soient Ω un ouvert
de R2 , f ∈ C 1 (Ω, R) et A ∈ Ω. Alors f possède un développement limité à l’ordre 1 au voisinage de A :
# ”
# ”
f A + #”
v #”
= f (A) + 〈∇ f (A) , #”
#”
v 〉 + o k #”
vk , ou encore : f (M ) = f (A) + ∇ f (A) , AM + o
AM
.
v → 0 M→A
Démonstration On peut supposer sans perte de généralité que A est le point (0, 0) quitte à remplacer f par
(x, y) 7−→ f (x A + x, yA + y).
7
Christophe Bertault — Mathématiques en MPSI
Soit ǫ > 0. Comme Ω est ouvert, nous pouvons nous donner un réel r > 0 pour lequel B(A, r) ⊂ Ω. En outre,
∂f ∂f
les fonctions et étant continues en (0, 0) par hypothèse, il existe des réels α x > 0 et α y > 0, que nous
∂x ∂y
pouvons choisir inférieurs à r, pour lesquels pour tout #” v = (h, k) ∈ R2 :
∂ f ∂f ǫ ∂ f ∂f ǫ
k #”
v k < α x =⇒ (h, k) − (0, 0) < et k #”
v k < α y =⇒ (h, k) − (0, 0) < .
∂x ∂x 2 ∂y ∂y 2
Posons α = min α x , α y . Soit ensuite #” v = (h, k) ∈ R2 un vecteur pour lequel k #” v k < α.
∂f ∂f
#”
#”
f v − f (0, 0) − ∇ f (0, 0) , v = f (h, k) − f (0, 0) −
(0, 0) h − (0, 0) k
∂x ∂y
∂f ∂f
= f (h, k) − f (0, k) −
(0, 0) h + f (0, k) − f (0, 0) − (0, 0) k
∂x ∂y
Z h Zh Zk Zk
∂f ∂f ∂f ∂f
= (s, k) ds − (0, 0) ds + (0, t) dt − (0, 0) dt d’après le théorème
∂x ∂x ∂y ∂y
0 0 0 0 fondamental de l’analyse
Z h Z k
∂f ∂f ∂f ∂f
¶ (s, k) − (0, 0) ds + (0, t) − (0, 0) dt .
0
∂x ∂x 0
∂y ∂y
p p
Or pour tout s compris entre 0 et h :
(s, k)
= s2 + k2 ¶ h2 + k2 = k #” v k < α ¶ α x et pour tout t compris
p #”
entre 0 et k :
2 2
(0, t) = |t| ¶ |k| ¶ h + k = k v k < α ¶ α y , donc :
#”
ǫ ǫ ǫ ǫ
f v − f (0, 0) − ∇ f (0, 0) , #” v ¶ |h| + |k| ¶ k #” v k + k #” v k = ǫ k #”
v k.
2 2 2 2
#”
En résumé, nous avons trouvé un réel α > 0 pour lequel pour tout #” v ∈ R2 \ 0 :
k #”
v k < α =⇒ f #” v − f (0, 0) − ∇ f (0, 0) , #” v ¶ ǫ k #” v k.
Comme voulu : f #” v − f (0, 0) − ∇ f (0, 0) , #” v #”= #” o k #” vk .
v → 0
Théorème (Continuité d’une fonction de classe C 1 ) Soient Ω un ouvert de R2 et f ∈ C 1 (Ω, R). Alors f ∈ C (Ω, R).
Il peut sembler curieux qu’on dispose d’une notion de continuité et d’une notion de classe C 1 , mais pas d’une notion
intermédiaire de dérivabilité. Le chaînon manquant s’appelle la différentiabilité et ne figure pas au programme de MPSI, mais
je lui consacrerai un petit paragraphe hors programme en fin de chapitre.
Nous savons depuis longtemps qu’une courbe suffisamment régulière ressemble lo-
calement à une droite. Sans surprise, toute surface suffisamment régulière ressemble
localement à un plan. Pour une fonction ϕ d’une seule variable, l’équation de la tan-
gente en a s’exprimait naturellement en termes de développement limité à l’ordre 1 :
ϕ(x) = ϕ(a) + ϕ ′ (a) (x − a) + o(x − a). La situation est finalement la même pour les
x→a
fonctions de deux variables.
A
f
Exemple La fonction (x, y) 7−→ sin(x +2 y) est de classe C 1 sur R2 et son plan tangent en (0, 0) a pour équation z = x +2 y.
Démonstration Polynomiale, la fonction (x, y) 7−→ x + 2 y est de classe C 1 sur R2 et la fonction t 7−→ sin t
l’est sur R, donc f est de classe C 1 sur R2 par composition.
∂f ∂f
Ensuite, pour tout (x, y) ∈ R2 : (x, y) = cos(x + 2 y) et (x, y) = 2 cos(x + y), donc le plan
∂x ∂y
∂f ∂f
tangent de f en (0, 0) a donc pour équation z = f (0, 0) + (0, 0) x + (0, 0) y = x + 2 y.
∂x ∂y
8
Christophe Bertault — Mathématiques en MPSI
La maîtrise pratique du résultat qui suit est l’un des objectifs majeurs de ce chapitre.
Dans cet énoncé, f est perçue comme une fonction des variables x et y, mais attention, ce x et ce y ne sont pas les
∂f ∂f
fonctions t 7−→ x(t) et t 7−→ y(t) de l’énoncé, ce sont juste des noms de variables qui fixent la notation et des
∂x ∂y
dérivées partielles.
Démonstration Notons γ la fonction t 7−→ x(t), y(t) , de sorte que F = f ◦ γ. Soit t ∈ I . Composons le
développement limité de f au voisinage de γ(t) à l’ordre 1 avec la limite lim γ(t + h) − γ(t) = (0, 0).
h→0
F (t + h) = f γ(t + h) = f γ(t) + γ(t + h) − γ(t)
= f γ(t) + ∇ f γ(t) , γ(t + h) − γ(t) + o
γ(t + h) − γ(t)
.
h→0
Ç 2 2 p
Or :
γ(t + h) − γ(t)
= x(t + h) − x(t) + y(t + h) − y(t) = |h| x ′ (t)2 + y ′ (t)2 + o(h), donc on
h→0
peut remplacer le o
γ(t + h) − γ(t)
par un o(h) :
∂f ∂f
F (t + h) = F (t) + γ(t) x(t + h) − x(t) + γ(t) y(t + h) − y(t) + o(h)
h→0 ∂x ∂y
∂f ∂ f
= F (t) + γ(t) hx ′ (t) + o(h) + γ(t) h y ′ (t) + o(h) + o(h)
h→0 ∂x ∂y
∂ f ∂ f
= F (t) + x ′ (t) γ(t) + y ′ (t) γ(t) h + o(h).
h→0 ∂x ∂y
∂f ∂f
Ce développement limité prouve que F est dérivable en t et que F ′ (t) = x ′ (t) γ(t) + y ′ (t) γ(t) . Pour
∂x ∂y
finir, l’expression de F ′ ainsi obtenue est continue sur I , donc F y est de classe C 1 . La petite subtilité de l’affaire,
c’est que γ est à valeurs dans R2 et non pas R, mais ses composantes x et y sont continues toutes les deux.
F
Exemple Soit f ∈ C 1 R2 , R . La fonction t 7−→ f t 2 , sin t est de classe C 1 sur R car t 7−→ t 2 et t 7−→ sin t le sont sur R,
∂f 2 ∂f 2
et pour tout t ∈ R : F ′ (t) = 2t t , sin t + cos t t , sin t .
∂x ∂y
Exemple Pour tout α ∈ R et toute fonction f : R2 −→ R, on dit que f est homogène de degré α si pour tous (x, y) ∈ R2 et
λ > 0 : f (λx, λ y) = λα f (x, y) Æ.
Fixons une fois pour toutes α ∈ R et f ∈ C 1 R2 , R homogène de degré α. Nous noterons par convention x et y les variables
∂f ∂f
de f . Les dérivées partielles de f sont donc les deux fonctions ∂1 f = et ∂2 f = et f n’a pas d’autre dérivée partielle.
∂x ∂y
La relation Æ fait pourtant appel à trois variables x, y et λ et on peut la dériver par rapport à chacune de ces variables.
∂f
ATTENTION, on va dériver par rapport à λ, mais la notation n’a aucun sens !
∂λ
• Dérivation par rapport à x : Pour dériver
f (λx, λ y) par rapport à x, on adapte ce qu’on sait faire pour dériver les
expressions de la forme f x(t), y(t) par rapport à t. Cela donne :
∂f ∂f ∂f ∂f ∂f
λ× (λx, λ y) + 0 × (λx, λ y) = λα (x, y), i.e. (λx, λ y) = λα−1 (x, y).
∂x ∂y ∂x ∂x ∂x
∂f
Cette égalité vraie pour tous (x, y) ∈ R2 et λ > 0 montre que est homogène de degré α − 1.
∂x
• Dérivation par rapport à y : Même calcul qu’à l’instant, x et y jouant des rôles symétriques dans la relation Æ :
∂f ∂f ∂f
(λx, λ y) = λα−1 (x, y), donc est homogène de degré α − 1.
∂y ∂y ∂y
9
Christophe Bertault — Mathématiques en MPSI
La règle de la chaîne est maintenant acquise, mais que raconte-t-elle géométriquement ? C’est γ′ (t)
γ(t)
l’objet du théorème que voici, qui éclaire de plus les notions de dérivée directionnelle et gradient.
Mais d’abord, un détail technique. Nous avons travaillé avec des fonctions à valeurs dans R
jusqu’ici, mais rien n’empêche qu’on utilise à l’occasion des fonctions à valeurs dans R2 . Pour
tout intervalle I et toutes fonctions x, y ∈ C 1 (I , R), on considèrera par définition que la fonction
γ
t 7−→ x(t), y(t) est de classe C 1 sur I et on notera γ′ sa dérivée, i.e. la fonction t 7−→ x ′ (t), y ′ (t) .
Géométriquement, γ est ce qu’on appelle une courbe paramétrée ou un arc paramétré tracé dans le
plan R2 et γ′ est en tout point le vecteur vitesse du mobile γ.
Théorème (Règle de la chaîne, dérivées directionnelles et gradient pour les fonctions de classe C 1 ) Soient Ω
un ouvert de R2 et f ∈ C 1 (Ω, R).
(i) Règle de la chaîne deuxième version : Soient I un intervalle et γ ∈ C 1 I , R2 une fonction pour laquelle
γ(I ) ⊂ Ω. La fonction f ◦ γ est de classe C 1 sur I et pour tout t ∈ I : ( f ◦ γ)′ (t) = ∇ f γ(t) , γ′ (t) .
(ii) Dérivées directionnelles : La fonction f possède une dérivée en tout point de Ω dans toutes les directions.
v = (h, k) ∈ R2 :
Plus précisément, pour tous A ∈ Ω et #”
#” ∂f ∂f
v f (A) = 〈∇ f (A) , v 〉 =
D#” (A) h + (A) k.
∂x ∂y
(iii) Interprétation géométrique du gradient : Le gradient de f est orthogonal aux lignes de niveau de f et dirigé
dans le sens des pentes croissantes.
Par définition, une fonction de deux variables est de classe C 1 quand elle possède des dérivées CONTINUES dans les deux
directions privilégiées #”
ı et #”
. D’après l’assertion (ii), cette hypothèse garantit en fait l’existence de dérivées dans TOUTES
les directions que l’on peut calculer facilement à partir des dérivées partielles ou du gradient.
Pour une fonction f d’une seule variable, vous savez depuis longtemps que le réel f ′ (a) est la pente de la tangente de f
en a. Pour vous le faire comprendre, on vous a sans doute dit que « quand on avance de 1 vers la droite en abscisse, on monte
de f ′ (a) en ordonnée sur la tangente ». La situation est la même pour une fonction f de deux variables. Au voisinage de A,
#”
le graphe de f a l’allure de son plan tangent et D#”v f (A) n’est jamais que la pente de ce plan dans la direction v . L’assertion
∂f ∂f
(ii) énoncé que quand on avance de h dans la direction #” ı et de k dans la direction #”
, on monte de (A) h + (A) k
#” ∂x ∂y
dans la direction k sur le plan tangent.
L’assertion (ii) nous permet en retour d’interpréter
géométriquement la règle de la
chaîne. La relation : ( f ◦ γ)′ (t) = Dγ′ (t) f γ(t) montre que ( f ◦ γ)′ (t) est une dérivée
directionnelle de f , en l’occurrence la dérivée de f en γ(t) dans la direction γ′ (t). La
figure ci-contre illustre le phénomène. Le mobile γ évolue dans le plan R2 , mais on peut
s’intéresser à sa projection verticale sur le graphe de f . Le résultat est un nouvel arc
paramétré, à trois dimensions cette fois et entièrement contenu dans le graphe de f . Sur
#”
la figure proposée, la pente de la droite en pointillé dans le repère γ(t), γ′ (t), k vaut à γ′ (t)
la fois ( f ◦ γ)′ (t) et Dγ′ (t) f γ(t) . γ(t)
10
Christophe Bertault — Mathématiques en MPSI
y
y
z=p b b b b
b b
b b b b
1 + x2 y2 b b
b
b b
b
b b
b b b b
b b
b b
b b
b b
b b
b b
b b
b b
b b
b b b b
b b
b
b b
b b
b b
b b
b b b b
4 b b b
b
b b
b
b b b
x
b b
b b
b b
2 b b
4 b
b
b
b
b
0 2 b
b
b b
b
b
b b
−2 0 b
b
b
b b
b
b
b
b b
−4−4 −2 y
b
b
b b b b
b
b
−2 0 2 b b b b
4 −4 b
b
b b
b
b
x b b b b b b b b
Démonstration
(i) Simple réécriture de la règle de la chaîne.
F
(ii) Comme Ω est ouvert, la fonction t 7−→ f A + t #” v est définie sur ] − α, α[ pour un certain α > 0 et elle y
∂f ∂f
est de classe C 1 d’après la règle de la chaîne avec F ′ (0) = (A) h + (A) k. Le résultat en découle car
∂x ∂y
F ′ (0) = D#”
v f (A) par définition des dérivées directionnelles.
¦ ©
(iii) Fixons λ ∈ R et notons Cλ la courbe de niveau λ de f : Cλ = (x, y) ∈ R2 | f (x, y) = λ . Pour
montrer que ∇ f est orthogonal à Cλ , nous pouvons supposer Cλ non vide. Faisons aussi l’hypothèse — pas
vraie en toute généralité sous cette forme, mais passons — que Cλ peut être paramétrée par une courbe
paramétrée γ = (x, y) de classe C 1 sur un intervalle I dont la dérivée ne s’annule pas. Dans ces conditions,
pour tout M ∈ R2 : M ∈ Cλ ⇐⇒
∃ t ∈I , M = γ(t), donc f ◦ γ(t) = λ pour tout t ∈ I .
En retour, d’après la règle de la chaîne : ∇ f γ(t) , γ′ (t) = 0. Cette égalité signifie que ∇ f γ(t) est
orthogonal au vecteur γ′ (t) qui dirige la tangente de γ en t. C’est cela qu’on veut dire quand on affirme
que le gradient est orthogonal aux lignes de niveau.
Le théorème qui suit n’est rien de plus qu’une nouvelle application de la règle de la chaîne. On y manipule cette fois des
fonctions de R2 dans R2 et, de nouveau, la dérivée d’une telle fonction se calcule composante par composante.
Théorème (Composition d’une fonction de R2 dans R2 suivie d’une fonction de R2 dans R) Soient U et Ω deux
ouverts de R2 , x, y ∈ C 1 (U, R) et f ∈ C 1 (Ω, R). On suppose que x(u, v), y(u, v) ∈ Ω pour tout (u, v) ∈ U et on pose
F (u, v) = f x(u, v), y(u, v) . La fonction F est de classe C 1 sur U et pour tout (u, v) ∈ U :
∂F ∂ ∂ x ∂f ∂y ∂f
(u, v) = f x(u, v), y(u, v) = (u, v) x(u, v), y(u, v) + (u, v) x(u, v), y(u, v)
∂u ∂u ∂u ∂x ∂u ∂y
∂F ∂ ∂x ∂f ∂y ∂f
et : (u, v) = f x(u, v), y(u, v) = (u, v) x(u, v), y(u, v) + (u, v) x(u, v), y(u, v) .
∂v ∂v ∂v ∂x ∂v ∂y
∂F ∂x ∂f ∂y ∂f ∂F ∂x ∂f ∂y ∂f
En résumé : = + et = + .
∂u ∂u ∂ x ∂v ∂ y ∂v ∂v ∂x ∂v ∂ y
Dans cet énoncé, les fonctions x et y sont perçues comme des fonctions des variables u et v et f comme une fonction
de x et y, mais attention, ce x et ce y sont juste des noms de variables et non pas les fonctions (u, v) 7−→ x(u, v) et
(u, v) 7−→ y(u, v).
Démonstration La règle de la chaîne nous permet de dériver la fonction u 7−→ F (u, v) à v fixé et la fonction
∂F ∂F
v 7−→ F (u, v) à u fixé. Il se trouve enfin que les expressions obtenues de et sont continues sur U, donc F
1 ∂u ∂v
y est de classe C .
Exemple Soit f ∈ C 1 R2 , R . On pose pour tout (u, v) ∈ R2 : F (u, v) = f u2 + v, uv − v 2 . La fonction F est de classe
C 1 sur R2 car les fonctions (u, v) 7−→ u2 + v et (u, v) 7−→ uv − v 2 le sont et pour tout (u, v) ∈ R2 :
∂F ∂f 2 ∂f 2 ∂F ∂f 2 ∂f 2
(u, v) = 2u u +v, uv−v 2 +v u +v, uv−v 2 et (u, v) = u +v, uv−v 2 +(u−2v) u +v, uv−v 2 .
∂u ∂x ∂y ∂v ∂x ∂y
11
Christophe Bertault — Mathématiques en MPSI
Le passage d’un problème posé en termes de coordonnées cartésiennes à un problème posé en termes de coordonnées
polaires est particulièrement courant. Rappelons donc que tout point (x, y) de R2 peut être écrit sous la formep
(r cos θ , r sin θ )
pour un certain couple (r, θ ) ∈ R+ × R. Trois relations à connaître : x = r cos θ , y = r sin θ et r = x 2 + y 2 . On
sait aussi exprimer θ en fonction de x et y à l’aide des arctangente, arcsinus et arccosinus, mais cela demande plus de doigté.
La plupart du temps, on autorise en réalité r à être négatif quand on parle de coordonnées polaires. Ainsi, si (r, θ ) est un
couple de coordonnées polaires de (x, y) avec r ¾ 0 : x = r cos θ = (−r) cos(θ + π) et y = r sin θ = (−r) sin(θ + π),
donc (−r, θ + π) est un autre couple de coordonnées polaires de (x, y). Faites un dessin !
Notons à présent x la fonction (r, θ ) 7−→ r cos θ et y la fonction (r, θ ) 7−→ r sin θ , toutes deux de classe C 1 sur R2 . La
ϕ
fonction (r, θ ) 7−→ x(r, θ ), y(r, θ ) = (r cos θ , r sin θ ) est quant à elle de classe C 1 de R2 dans R2 et c’est grâce à elle qu’on
passe d’une expression en coordonnées cartésiennes à une expression en coordonnées polaires. Par exemple, en notant O le
point (0, 0), ϕ transforme :
— la bande horizontale Ωpol = ] − ρ, ρ[ × R en la boule ouverte Ωcart = B(O, ρ) pour tout θ′
ρ > 0,
θ
— le rectangle Ωpol = ]ρ, ρ ′ [ × ]θ , θ ′ [ en la portion de disque Ωcart représentée ci-contre
pour tous ρ, ρ ′ , θ , θ ′ ∈ R pour lesquels 0 < ρ < ρ ′ et θ < θ ′ . b
O ρ ρ′
Donnons-nous à présent une fonction f ∈ C 1 de variables x et y sur un ouvert Ωcart de R2 . Notons ensuite Ωpol l’image
réciproque de Ωcart par ϕ — on peut montrer que Ωpol est un ouvert de R2 . L’ouvert Ωpol est la version polaire de l’ouvert
Ωcart . Posons enfin pour tout (r, θ ) ∈ Ωpol : F (r, θ ) = f (r cos θ , r sin θ ). La fonction F ainsi définie est la version polaire
de f . Un(e) physicien(ne) donnerait le même nom aux deux fonctions car elles représentent pour lui le même phénomène
physique — force, température, champ magnétique. . . — exprimé simplement de deux façons différentes. Pour nous autres
matheux, f et F sont bel et bien deux fonctions différentes définies sur des ensembles différents — mais de même image.
La fonction F est de classe C 1 sur Ωpol et pour tous (x, y) ∈ Ωcart et (r, θ ) ∈ Ωpol liés par la relation (x, y) = ϕ(r, θ ) :
∂F ∂f ∂f ∂f ∂f
(r, θ ) = cos θ (r cos θ , r sin θ ) + sin θ (r cos θ , r sin θ ) = cos θ (x, y) + sin θ (x, y)
∂r ∂x ∂y ∂x ∂y
∂F ∂f ∂f
donc : r (r, θ ) = x (x, y) + y (x, y) après multiplication par r. De même :
∂r ∂x ∂y
∂F ∂f ∂f ∂F ∂f ∂f
(r, θ ) = −r sin θ (r cos θ , r sin θ ) + r cos θ (r cos θ , r sin θ ), donc : (r, θ ) = − y (x, y) + x (x, y).
∂θ ∂x ∂y ∂θ ∂x ∂y
∂f ∂f
Exemple On s’intéresse à l’équation aux dérivées partielles y =x d’inconnue f ∈ C 1 (Ω, R) où Ω = R2 \ (0, 0) ,
∂x ∂y
avec la condition aux limites f (x, 0) = e−x pour tout x > 0. Ce type de condition joue le même rôle que les conditions initiales
d’une équation différentielle.
• Analyse : Soit f ∈ C 1 (Ω, R). Posons pour tout (r, θ ) ∈ R∗+ × R : F (r, θ ) = f (r cos θ , r sin θ ). La fonction F ainsi
définie est de classe C 1 sur R∗+ ×R et pour tous (x, y) ∈ Ω et (r, θ ) ∈ R∗+ ×R liés par la relation (x, y) = (r cos θ , r sin θ ),
∂F ∂f ∂f
d’après les calculs qui précèdent : (r, θ ) = − y (x, y)+x (x, y) = 0. Ainsi, POUR TOUT r > 0, la fonction
∂θ ∂x ∂y
θ 7−→ F (r, θ ) est constante sur R, disons de valeur ϕ(r) DÉPENDANTE DE r. Cela dit, F est de classe C 1 en tant que
fonction de deux variables, elle l’est donc aussi par rapport à r quand on gèle la variable θ — c’est p faux dans l’autre
sens, ATTENTION. Conclusion : ϕ est de classe C 1 sur R∗+ . Et pour tout (x, y) ∈ Ω : f (x, y) = ϕ x 2 + y 2 , donc
p
pour tout x > 0 : ϕ(x) = ϕ x 2 + 02 = f (x, 0) = e−x .
p 2 2
• Synthèse : Notons f la fonction (x, y) 7−→ e− x + y sur 2 2
p Ω. La fonction polynomiale (x, y) 7−→ x + y est de classe
1 ∗ − t ∗
C sur Ω et à valeurs dans R+ et la fonction t 7−→ e est de classe C sur R+ , donc f est de classe C 1 sur Ω et
1
∂f −x p 2 2 −y p 2 2 ∂f
pour tout (x, y) ∈ Ω : y (x, y) = y × p e− x + y = x × p e− x + y = x (x, y). Enfin,
∂x x2 + y2 x2 + y2 ∂y
p
x 2 +02
pour tout x > 0 : f (x, 0) = e− = e−x .
p 2 2
La fonction (x, y) 7−→ e− x + y est donc la seule solution du problème étudié, mais notez
p bien que
sans condition aux limites,
le problème aurait eu ÉNORMÉMENT de solutions — toutes les fonctions (x, y) 7−→ ϕ x 2 + y 2 , ϕ décrivant C 1 (R∗+ , R).
12
Christophe Bertault — Mathématiques en MPSI
Définition (Extremum local) Soient D une partie de R2 , f : D −→ R une fonction et A ∈ D. On dit que f possède un
maximum local en A si f est majorée par f (A) au voisinage de A, et un minimum local en A si elle est minorée par f (A)
au voisinage de A.
Mais comment détermine-t-on concrètement les extrema locaux d’une fonction de deux variables ? Nous nous contente-
rons d’exploiter nos connaissances sur les polynômes du second degré et de raisonner par analyse-synthèse.
ϕ
Pour a, b, c ∈ R fixés avec (a, c) 6= (0, 0), le signe de la fonction (h, k) 7−→ ah2 + bhk + ck2 est facile à déterminer. En
h
notant P le polynôme aX 2 + bX + c : ϕ(h, k) = k2 P pour tous h ∈ R et k ∈ R∗ .
k
— Cas où b2 − 4ac ¶ 0 : Les réels a et c sont de même signe et P est de signe constant, celui de a ou c selon que a ou
c est non nul, donc ϕ est elle aussi de signe constant.
— Cas où b2 − 4ac > 0 : Le polynôme P prend à la fois des valeurs strictement positives et des valeurs strictement
h
négatives, donc la fonction ϕ aussi. Le signe de ϕ(h, k) dépend du rapport , i.e. de l’angle que le vecteur (h, k) forme
k
avec le vecteur #”
ı.
f
Exemple La fonction (x, y) 7−→ x 2 − 3x + x y + y 2 possède un et un seul extremum local, en l’occurrence un minimum
local en (2, −1).
Démonstration Tout d’abord, f est de classe C 1 sur R2 .
∂f ∂f
• Analyse : Soit (x, y) ∈ R2 . Si f possède un extremum local en (x, y) : (x, y) = (x, y) = 0,
∂x ∂y
donc 2x + y = 3 et x + 2 y = 0, donc x = 2 et y = −1.
• Synthèse : Le point (2, −1) est-il bel et bien un extremum local de f ? Pour trancher, nous devons comparer
f (2 + h, −1 + k) et f (2, −1) pour (h, k) choisi dans un voisinage de (0, 0). — Il vaut mieux se ramener au
point (0, 0), on y voit plus clair. — Or pour tout (h, k) ∈ R2 :
k 2 3k2
2 2 2 2
f (2+h, −1+k)− f (2, −1) = (2+h) −3(2+h)+(2+h)(−1+k)+(−1+k) +3 = h +hk+k = h + + ¾ 0,
2 4
donc f possède un minimum local en (2, −1). J’ai privilégié ici une mise sous forme canonique, bien pra-
tique, mais on aurait pu s’intéresser au discriminant du polynôme X 2 + X + 1.
g y2
Exemple La fonction (x, y) 7−→ x 2 − x − x y − + 2 y ne possède aucun extremum local sur R2 .
2
Démonstration Tout d’abord, g est de classe C 1 sur R2 .
∂g ∂g
• Analyse : Soit (x, y) ∈ R2 . Si g possède un extremum local en (x, y) : (x, y) = (x, y) = 0,
∂x ∂y
donc 2x − y = 1 et x + y = 2, donc x = 1 et y = 1.
13
Christophe Bertault — Mathématiques en MPSI
• Synthèse : Le point (1, 1) est-il bel et bien un extremum local de g ? Pour tout (h, k) ∈ R2 :
(1 + k)2 1 k2
g(1 + h, 1 + k) − g(1, 1) = (1 + h)2 − (1 + h) − (1 + h)(1 + k) − + 2 (1 + k) − = h2 − hk − .
2 2 2
1
Le discriminant du polynôme X 2 − X − étant strictement positif, cette expression n’a pas un signe constant
2
au voisinage de (0, 0), mais soyons précis. Pour tout h ∈ R∗ : g(1+ h, 1)− g(1, 1) = h2 > 0, donc g n’est
k2
majorée par g(1, 1) sur aucun voisinage de (1, 1), et pour tout k ∈ R∗ : g(1, 1 + k) − g(1, 1) = − < 0,
2
donc f n’est minorée par g(1, 1) sur aucun voisinage de (1, 1). Ainsi, g n’a pas d’extremum local en (1, 1).
z = f (x, y) z = g(x, y)
10 5
5
0
0
0 0
2 2 0
−3 −2 −1 0 1 4 y 2
x x
y
Dans ces conditions, l’application ϕ est unique, appelée la différentielle de f en A et notée d fA. Ainsi :
f A + #”
v = f (A) + d f #”
#” #” Av + o k #”vk .
v → 0
• Sur un ouvert : On dit que f est différentiable sur Ω si elle l’est en tout point de Ω.
Ω −→ L R2 , R
L’application est appelée dans ce cas la différentielle de f sur Ω et notée d f .
A 7−→ d fA
Le réel d fA #”
v est une approximation à l’ordre 1 de la variation de f au point A en ordonnée induite par une variation
de vecteur #” v , f varie approximativement de d fA #”
v en abscisse. En d’autres termes, quand on passe de A à A + #” v .
La différentielle d f elle-même est un objet relativement abstrait quand on le découvre. L’application d f associe à tout
point de Ω une forme linéaire de R2 .
f
Exemple Les fonctions (x, y) 7−→ x et (x, y) 7−→ y sont différentiables sur R2 et coïncident chacune avec sa différentielle.
On les note respectivement dx et d y.
Ce résultat n’est guère étonnant. Quand on passe de A = (x , y ) à A+ #”
A v = (x + h, y + k), la fonction f varie de h = f #”
A A A v .
2
Démonstration La fonction f a une propriété importante,
#” 2 #” #” elle est LINÉAIRE
#” #” A = (x A, yA) ∈ R . Pour
! Soient
tout v = (h, k) ∈ R : f A+ v = x A + h = f (A) + f v #”= #” f (A) + f v + o k v k , donc comme annoncé,
v → 0
f est différentiable en A et d fA = f .
14
Christophe Bertault — Mathématiques en MPSI
Définition (Différentielle d’une fonction de classe C 1 ) Soient Ω un ouvert de R2 et f ∈ C 1 (Ω, R). Alors f est
∂f ∂f
v ∈ R2 : d fA #”
différentiable sur Ω et pour tous A ∈ Ω et #” v = (A) dx A #”
v + (A) d yA #”
v .
∂x ∂y
∂f ∂f
En résumé : d f = dx + d y.
∂x ∂y
Et les physiciens dans tout ça ? Ils confondent souvent les fonctions qu’ils manipulent et leurs valeurs, et quand ils écrivent
d f , c’est de d fA #”
v qu’ils parlent. Quand on passe du point A au point A+ #”v , f varie à l’ordre 1 de d fA #”
v , mais les physiciens
auront tendance à considérer que f a varié de d f .
15