Exercice 1
Soit la fonction f définie par :
3
f (x, y) = (y − 1) ln(y − 1) − ln(x) + x2 − xy + 2y 2 − 7y − x + 3.
2
1- Domaine de définition Df
• Le terme (y − 1) ln(y − 1) est défini si et seulement si y − 1 > 0, donc y > 1.
• Le terme − ln(x) est défini si et seulement si x > 0, car le logarithme est défini pour
x > 0.
Donc,
Df = {(x, y) ∈ R2 | x > 0, y > 1}
Représentation graphique : Le domaine Df est un rectangle ouvert dans le plan xy,
le premier quadrant x > 0 et y > 1.
2- L’ensemble Df est-il convexe?
Df est un rectangle dans le plan xy, ce qui est un ensemble convexe. En effet, pour tout
couple de points (x1 , y1 ) et (x2 , y2 ) dans Df , le segment de droite reliant ces deux points
reste également dans Df (puisque x > 0 et y > 1 pour tous les points dans Df ). Donc, Df
est convexe.
3- Montrer que la fonction φ : u → ln(u) est convexe sur son ensemble de
définition.
La fonction φ est définie sur ]0, +∞[. Pour tout u ∈]0, +∞[, on a : φ′ (u) = u1 + ln(u) =
1 + ln(u) qui est une fonction croissante. Ainsi, φ est donc convexe sur ]0, +∞[.
4- En déduire la convexité de f sur Df
Par composition d’une fonction convexe par une fonction affine, la fonction (x, y) 7→
(y − 1) ln(y − 1) = φ(y − 1) est convexe sur Df . De plus, par application du critère de
convexité des fonctions polynomiales de degré 2, la fonction (x, y) 7→ x2 −xy+2y 2 −y 2 − 23 x+3
est convexe sur Df . Enfin, la fonction − ln étant convexe, la fonction (x, y) 7→ − ln(x) est
convexe d’après la propriété d’extension.
La fonction f est une somme de fonctions convexes, elle est par conséquent convexe sur
Df .
5- Montrer que (2,2) est un point critique.
On calcule, pour tout (x, y) ∈ Df , ∂f 1
∂x (x, y) = − x + 2x − y −
3
2 et ∂f
∂y (x, y) = (y − 1) ·
1
y−1 + ln(y − 1) − x + 4y − 7 = ln(y − 1) − x + 4y − 6.
∂f ∂f
On vérifie que ∂x (2, 2) = 0 et ∂y (2, 2) = 0, donc (2, 2) est un point critique de f .
6- En déduire la nature de (2,2).
La fonction f étant convexe sur Df , elle admet un minimum global en (2, 2).
7- La fonction f admet-elle un maximum global sur Df .
1
La fonction f n’admet pas de maximum global sur Df : en effet, pour tout x > 0,
7
f (x, 2) = x2 − x + 11 − ln(x) et lim f (x, 2) = +∞
2 x→+∞
Exercice 2
Les points critiques de
2
+y 2 )
f (x, y) = xye−π(x
sont les solutions de
∂f ∂f
=0 et = 0,
∂x ∂y
soit
1 1
(0, y), (x, 0), et ±√ , ±√ .
2π 2π
La matrice hessienne est
∂2f ∂2f
!
∂x2 ∂x∂y
Hf (x, y) = ∂2f ∂2f
∂y∂x ∂y 2
avec
∂2f 2 2
= ye−π(x +y ) − 4πx + 4πx3 ,
∂x 2
∂2f 2 2
= xe−π(x +y ) − 4πy + 4πy 3 ,
∂y 2
∂2f 2 2
= e−π(x +y ) 1 − 2πy 2 − 4πx2 .
∂x∂y
Le déterminant de la hessienne vaut
2
∂2f ∂2f ∂2f
det(Hf (x, y)) = − .
∂x2 ∂y 2 ∂x∂y
Pour (0, 0) :
∂2f ∂2f ∂2f
= 0, = 0, = 1,
∂x2 ∂y 2 ∂x∂y
det(Hf (0, 0)) = 0 × 0 − 12 = −1 < 0,
donc (0, 0) est un point selle.
Pour
1 1
±√ , ±√ ,
2π 2π
le déterminant est positif et les éléments diagonaux sont positifs, donc ce sont des minima
locaux.
2
Exercice 3
Nous allons démontrer que :
ϕΩ est convexe ⇐⇒ Ω est convexe.
1. Si Ω est convexe, alors ϕΩ est convexe
Rappel : Une fonction f est convexe si pour tout x1 , x2 ∈ Rn et α ∈ [0, 1], on a :
f (αx1 + (1 − α)x2 ) ≤ αf (x1 ) + (1 − α)f (x2 )
Cas 1 : x1 , x2 ∈
/Ω
ϕΩ (x1 ) = ϕΩ (x2 ) = +∞ ⇒ αϕΩ (x1 ) + (1 − α)ϕΩ (x2 ) = +∞
Donc :
ϕΩ (αx1 + (1 − α)x2 ) ≤ +∞
Toujours vraie.
Cas 2 : x1 ∈ Ω, x2 ∈
/Ω
ϕΩ (x1 ) = 0, ϕΩ (x2 ) = +∞ ⇒ α · 0 + (1 − α) · (+∞) = +∞
Donc, peu importe si αx1 + (1 − α)x2 ∈ Ω ou non, on a toujours :
ϕΩ (αx1 + (1 − α)x2 ) ≤ +∞
Cas 3 : x1 , x2 ∈ Ω
Alors :
ϕΩ (x1 ) = ϕΩ (x2 ) = 0
et comme Ω est convexe, on a :
αx1 + (1 − α)x2 ∈ Ω ⇒ ϕΩ (αx1 + (1 − α)x2 ) = 0
Donc :
0 = ϕΩ (αx1 + (1 − α)x2 ) ≤ 0
Convexité est vérifiée dans tous les cas.
2. Si ϕΩ est convexe, alors Ω est convexe
Soient x1 , x2 ∈ Ω ⇒ ϕΩ (x1 ) = ϕΩ (x2 ) = 0. La convexité de ϕΩ implique :
ϕΩ (αx1 + (1 − α)x2 ) ≤ α · 0 + (1 − α) · 0 = 0
Or, ϕΩ (x) ≥ 0, donc on a :
ϕΩ (αx1 + (1 − α)x2 ) = 0 ⇒ αx1 + (1 − α)x2 ∈ Ω
Donc Ω est convexe.
3
Exercice 4
Montrer qu’il existe un unique x̄ ∈ R2 tel que x̄ = minx∈R2 f (x) et le calculer.
Étape 1 : Calcul du gradient de f
1. Dérivée partielle par rapport à x1 :
∂f ∂
= (2x21 + x22 − x1 x2 − 3x1 − x2 + 4) = 4x1 − x2 − 3
∂x1 ∂x1
2. Dérivée partielle par rapport à x2 :
∂f ∂
= (2x21 + x22 − x1 x2 − 3x1 − x2 + 4) = 2x2 − x1 − 1
∂x2 ∂x2
Ainsi,
4x1 − x2 − 3
∇f (x1 , x2 ) =
2x2 − x1 − 1
Étape 2 : Résolution du système ∇f (x1 , x2 ) = 0
On résout le système :
4x1 − x2 − 3 = 0 (1), 2x2 − x1 − 1 = 0 (2)
1. De (1) : x2 = 4x1 − 3
2. Remplaçons dans (2) : 2(4x1 − 3) − x1 − 1 = 0 ⇒ 7x1 − 7 = 0 ⇒ x1 = 1
3. Donc x2 = 4(1) − 3 = 1
Ainsi, x̄ = (1, 1).
Étape 3 : Calcul du Hessien
Le Hessien est :
∂2f ∂2f
" #
∂x21 ∂x1 ∂x2 4 −1
Hf (x1 , x2 ) = ∂2f ∂2f
=
−1 2
∂x2 ∂x1 ∂x22
2
∂2f ∂2f ∂2f
[label=0.] ∂∂xf2 = 4 ∂x22
=2 ∂x1 ∂x2 = ∂x2 ∂x1 = −1 Déterminant : det(Hf ) = 4 · 2 −
1
(−1)2 = 7 > 0
Donc Hf est définie positive, et x̄ = (1, 1) est un minimum global.
Gradient à Pas Fixe (GPF)
• Point initial : X (0) = (0, 0), α = 0.5
3.
2.
1.
4.
−3
• ∇f (0, 0) =
−1
4
• Mise à jour :
(1) (0) (0) −3 −1.5
X =X − α∇f (X ) = (0, 0) − 0.5 · =
−1 −0.5
Gradient à Pas Optimal (GPO)
−3 3
• ∇f (0, 0) = ⇒ δ (0) =
−1 1
• On définit φ(α) = f (3α, α) :
φ(α) = 2(3α)2 + α2 − 3α2 − 9α − α + 4 = 16α2 − 10α + 4
• Dérivée : φ′ (α) = 32α − 10 ⇒ α0 = 5
16
• Mise à jour :
5 3 15 5
X (1) = X (0) + α0 δ (0) = · = ,
16 1 16 16