Cours Programmation Non Lineaire
Cours Programmation Non Lineaire
Spécialité: Mathématiques
Élaboré par
Riahi Mohamed Hédi
Support pédagogique
Programmation Non Linéaire:
Contents
ii
CONTENTS iii
4 Algorithmes d'optimisation 32
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2 Algorithme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.3 Méthode du gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
topologique de Rn
Sommaire
1.1 Espace Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Notion de distance dans Rn . . . . . . . . . . . . . . . . . . . . . 2
1.3 Norme sur Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Notions topologiques associées à une norme . . . . . . . . . . . 3
1
1.1. ESPACE RN 2
1.1 Espace Rn
On désigne par Rn , n ∈ N∗ , l'ensemble de tous les n-uples (x1 , x2 , ...., xn ) où xi , i = 1, ..n
sont des nombres réels. Ainsi:
• Rn est un R espace vectorielle dont la base canonique est (e1 , e2 , ..., en ) avec e1 =
(1, 0, 0, ..., 0), e2 = (0, 1, 0, 0, ..., 0),... et en = (0, 0, ...., 0, 1).
X + Y = (x1 + y1 , x2 + y2 , ..., xn + yn ) ∈ Rn .
∀λ ∈ R, λ.X = (λx1 , λx2 , ..., λxn ).
1. d(x, y) = 0 SSi x = y .
vériant:
1. N (x) = 0 ⇐⇒ x = 0Rn .
3. N (x + y) ≤ N (x) + N (y), ∀x ∈ Rn et ∀y ∈ Rn .
||.|| : Rn → R+
x 7→ ||x||.
1. Exercice:
Montre que ∀x, y ∈ Rn on a
||x|| − ||y|| ≤ ||x + y||
i=1
n
(b) ||x||2 = ( (xi )2 ) 2 .
1
X
i=1
(c) ||x||∞ = Sup(|x1 |, |x2 |, ..., |xn |).
Remarque 3 Dans Rn les normes ||x||1 , ||x||2 et ||x||∞ sont équivalentes. On peut
utiliser n'importe quelle norme.
3. Partie bornée de Rn :
Une partie X de Rn est dite bornée dans Rn SSi ∀x ∈ Rn , ∃k > 0 tel que ||x|| ≤ k.
4. Ouverts-Fermé de Rn :
(a) Une partie partie Ω de Rn est dite ouvert SSi ∀x ∈ Ω, ∃r > 0 telle que B(x, r) ⊂ Ω.
(b) Une partie F de Rn est dite fermée de Rn si son complémentaire dans Rn est une
partie ouverte.
(c) Un ensemble V est un voisinage de x ∈ Rn s'il contient une boule ouverte non
vide de centre x.
5. Suite dans Rn : Convergence Soit Un = (xn1 , xn2 , ..., xnn ), ∀n ∈ N, la suite (Un )n est une
suite d'éléments de Rn .
(a) On dit que (Un )n est convergente dans Rn vers l = (l1 , l2 , ..., ln ) ∈ Rn SSi
lim ||Un − l|| = 0
n→+∞
On note lim Un = l.
n→+∞
(b) Exemple:
1 1 2n + 1
Soit dans R3 la suite Un = ( , 1 − , ). Etudier la convergence de la suite
n n n
(Un ).
6. Compact de L'ensemble Rn :
Toute partie K de Rn non vide, fermée et bornée est dite compacte.
Exemple: Les pavés fermées [a1 , b1 ] × [a2 , b2 ] × ... × [an , bn ] de Rn est un comapcts de
Rn .
FONCTION DE PLUSIEURS
VARIABLES
Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Fonctions de plusieurs variables . . . . . . . . . . . . . . . . . . . 7
2.2.1 Dénition et exemples . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2.2 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Limite d'une fonction de R dans R . . . . . . . . . . . . . . . . 10
n
2.3.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.2 Exemples et applications . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 Continuité d'une fonction de Rn dans R . . . . . . . . . . . . . . 12
2.4.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5 Fonctions diérentiables . . . . . . . . . . . . . . . . . . . . . . . 13
2.5.1 Dérivées partielles, gradient et matrice jacobienne . . . . . . . . 13
2.5.2 Dérivée suivant un vecteur-Dérivée directionnelle . . . . . . . . . 16
2.5.3 Dérivées partielles d'ordre supérieur . . . . . . . . . . . . . . . . 17
6
2.1. INTRODUCTION 7
2.1 Introduction
Dans ce chapitre nous étudierons les fonctions qui dépendent de plusieurs variables. En eet,
dans les sciences appliquées telles que la physique, on cherche à modéliser des phénomènes
dépend de plusieurs paramètres. Ainsi l'étude théorique de ces fonctions de plusieurs vari-
ables trouvera un cadre applicatif dans de très nombreux domaines. A la n du cours,
l'étudiant doit avoir une bonne compréhension de l'analyse des fonctions de à plusieurs vari-
ables et devrait être en mesure d'appliquer ces connaissances pour résoudre des problèmes
exercices dans une variété de contextes.
En particulier, l'étudiant doit être capable de:
f : D ⊂ Rn −→ R
X = (x1 , x2 , ..., xn ) 7−→ f (X) = f (x1 , x2 , ..., xn )
D: domaine de dénition de f .
Rp . Notons que chacune des fonctions fi est une fonction de n variables et à valeur
réelle. On dit que f est un champ de vecteurs à m composantes sur Rn .
p
2. On dénit les fonctions de D ⊂ R dans R , en remarquant que Df = où (fi )
\
n p
Dfi
i=1
sont les composantes de f .
3. Pour une fonction f : Rn → Rp , le calcul des limites, l'étude de la continuité et
la dérivabilité de f se ramènent au calcul des limites, l'étude de la continuité et la
dérivabilté de chaque composante. C'est pour cela, que dans la suite, on s'intéresse
aux fonctions de Rn dans R.
[Link] Exemples
1. Périmètre d'un rectangle en fonction de sa longeur x et sa largeur y :
f : D ⊂ R2 −→ R
X = (x, y) 7−→ f (X) = ......
D = ....
f : D ⊂ R2 −→ R
X = (x, y) 7−→ f (X) = ......
D = ....
1
3. Le volume d'une cône est V = πr2 h. V dépend de deux paramètres: le rayon r et
3
l'hauteur h. On dénit une fonction mathématique dépend de deux variables r et h
par:
V : D ⊂ R2 −→ R
(r, h) 7−→ V (r, h) = ......
4. Exemple en physique:
Il est bien rare que les modèle mathématique choisi par les physicien ne depend que
d'un paramètre. Par exemple en thermodynamique, lorsque l'on considère une énergie,
on est souvent amené à étudier l'inuence de paramètres T (température), P (pres-
sion) et V (volume).
On donne la loi des gaz parfaits:
P V = nRT .
f (P, V, T ) = 0
avec
f : D ⊂ R3 −→ R
(P, V, T ) 7−→ (P, V, T ) = ......
2. Pour une fonction de deux variables dénie sur un domaine D ⊂ R2 et à valeurs réelles
on dénit de même le graphe par:
que l'on peut représenter comme surface d'équation z = f (x, y) dans l'éspace à 3
dimensions. Soit l'exemple de f (x, y) = x2 − y 2 .
Exercice:
Pour chacune des fonctions suivantes, déterminer son domaine de dénition:
1. f (x, y) = (1 − x2 )(1 − y 2 ).
p
s
y2
2. f (x, y) =
2y − x2
∀ε > 0, ∃η > 0 telle que ∀X = (x1 , x2 , ..., xn ) ∈ D, ||X − a|| ≤ η alors |f (X)| ≤ ε.
2. Soit l ∈ R. On dit que f a pour limite l en a si f −l tend vers 0. On note lim f (X) = l
X→a
Remarque 7 Si une fonction admet une limite en un point alors cette limite est unique.
3x2 + xy
f (x, y) = p .
x2 + y 2
xy
2. Soit f : R2 \ {(0, 0)} → R dénie par: f (x, y) =
x2 + y 2
(a) Calculer lim f (t, t).
t→0
(b) Calculer lim f (t, 2t).
t→0
(c) Déduire lim f (x, y).
(x,y)→(0,0)
3. Soit f : R2 → R dénie par f (x, y). Pour calculer lim f (x, y) on peut utiliser
(x,y)→(a1 ,a2 )
le changement de variables en coordonnées polaires:
x = r cos(θ)
y = r sin(θ) (2.3.1)
r > 0, θ ∈ [0, 2π].
x3 y
(a) Calculer lim .
(x,y)→(0,0) x2 + y 2
xy
(b) Calculer lim .
(x,y)→(0,0) x + y 2
2
Remarque 8 Les opérations algébriques sur les limites concernant sommes, diérences,
produits, quotients et compositions sont les mêmes que celles utilisées dans le cas des fonc-
tions d'une variable rélle.
C'est à dire si
∀ε > 0, ∃η > 0 telle que ∀x = (x1 , x2 , ..., xn ) ∈ D, ||x − a|| ≤ η alors |f (x) − f (a)| ≤ ε.
2. Une fonction f est continue sur un ensemble D ⊂ Rn si elle est continue en tout point
de cet ensemble.
Montrer que la fonction Pi est continue en tout point a = (a1 , ...., an ) ∈ Rn . la fonction
Pi est appelée fonction projection.
Théorème 1 Soit f une fonction dénie au voisinage d'un point a = (a1 , a2 , ..., an ) ∈ Rn
à valeurs dans R. Supposons que f est continue au point a et dénisons les fonctions réelles
g1 , ..., gn à une variable rélle par:
Pour tout i = 1, ..., n la fonction gi qui est dénie au voisinage de ai est continue au point
ai .
Exercice:
Soit f : R2 → R la fonction dénie par:
xy
si (x, y) 6= (0, 0)
f (x, y) = x2 + y2 (2.4.1)
0 si (x, y) = (0, 0)
3. Conclure.
Théorème 2 Soit f une fonction dénie sur une partie D ⊂ Rn à valeurs dans R et
a = (a1 , ..., an ) ∈ D.
La fonction f est continue en a SSi pour toute suite (yk )k∈N d'élément
de D telles que lim yk = a on a lim f (yk ) = f (a)
k→+∞ k→+∞
Application:
Soit f : R2 → R la fonction dénie par:
sin( 1 ) si (x, y) 6= (0, 0)
f (x, y) = x2 + y 2 (2.4.2)
0 si (x, y) = (0, 0)
1 1
1. Soit la suite yn = ( , ) calculer lim f (yn ).
n n n→+∞
Remarque 10 Les opérations algébriques sur les fonctions continues concernant sommes,
diérences, produits, quotients et compositions sont les mêmes que celle utilisées dans le cas
des fonctions d'une seul variable réelle.
Exercice:
gi :]ai − δ, ai + δ[→ R
t 7−→ gi (t) = f (a1 , a2 , ..., ai−1 , t, ai+1 , ..., an ).
1. On dit que f admet une dérivée par rapport à la i-ième variable au point a si la
fonction gi est dérivable au point ai .
∂f 0
(a) = g (ai ) =
∂xi
f (a1 , a2 , ..., ai−1 , ai + h, ai+1 , ..., an ) − f (a1 , a2 , ..., ai−1 , ai , ai+1 , ..., an )
lim .
h→0 h
∂f
Remarque 11 Le calcul de consiste à ne dériver l'expression de f que par rapport à
∂xi
∂f
xi .Les fonctions dérivées partielle sont aussi des fonctions de n variables à valeurs
∂xi
dans R.
Exemples
∀(x, y) ∈ R2 , g(x, y) = x2 + y 2 + xy .
Calculer les dérivées partielles de g par rapport aux variable x et y en tout point
(x, y) ∈ R2
f (x, y, z) = x2 + y 2 + z 2 − xy − xz − yz
∂f
(a) = Df (a)(ei ), i = 1, ..., n,
∂xi
n
∂f
(a)hi , ∀h = (h1 , ..., hn ).
X
Df (a)(h) =
i=1
∂xi
Exemple:
Soit la fonction f : R2 → R, dénie par f (x, y) = x sin(xy) + y cos(xy).
1. Montrer que f admet des dérivées partielles par rapport aux variables x et y en tout
point de R2 .
∂f ∂f
2. Calculer et en tout point (x, y) ∈ R2 .
∂x ∂y
3. Déduire Df (x, y)(h1 , h2 ) pour tout (h1 , h2 ) ∈ R2 .
Gradient et matrice jacobienne:
∂f ∂f ∂f
gradf (a) = ( (a))1≤i≤n = ( (a), ..., (a))
∂xi ∂x1 ∂xn
∂f ∂f ∂f
Jf (a) = ( (a))t1≤i≤n = ( (a), ..., (a))t
∂xi ∂x1 ∂xn
Remarque 12 Avec les deux notions précédentes, les diérentielles peuvent être écrites sous
la forme:
Df (a)(h) =< gradf (a), h > et DF (a)(h) = JF (a)h, ∀h = (h1 , ..., hn ) ∈ Rn .
Où le symbole < ., . > désigne le produit scalaire euclidien de Rn .
Théorème 4 Soit f : D ⊂ Rn → R. On dit que f est de classe C 1 sur D et ses dérivées par-
∂f
tielles (x) , i = 1, .., n existent en tout point x de D et si les fonctions dérivées partielles:
∂xi
∂f
: D ⊂ Rn −→ R
∂xi
∂f
x 7−→ (x)
∂xi
sont continues.
Exemples:
3. Conclure.
ϕ(t) = f (a + th).
1. On dit que f admet une dérivée en a suivant le vecteur h si la fonction ϕ est dérivable
en 0. Dans ce cas ϕ (0) s'appelle dérivée de f en a suivant le vecteur h et on note
0
Df (a)(h) = dh f (a).
∂f
4. Remarque 13 On a pour i = {1, ..., n}, (a) correspond à la dérivée en a suivant
∂xi
le vecteur de la base canonique ei = (0, ...., 0, 1, 0, ..., 0):
∂f
(a) = Df (a)(ei ) = dei f (a)
∂xi
f (x, y) = x2 + y 2 (2.5.3)
0 si (x, y) = (0, 0)
1. Montre que f admet une dérivée suivant tout vecteur h = (h1 , h2 ) 6= (0, 0).
3. Conclure.
2. Exemple:
Soit f : R2 → R la fonction dénie par:
x3 y
si (x, y) 6= (0, 0)
f (x, y) = x2 + y 2
0 si (x, y) = (0, 0)
(a) Calculer
si (x, y) 6= (0, 0)
(
∂f .....................
(x, y) =
∂x ...................... si (x, y) = (0, 0)
si (x, y) 6= (0, 0)
(
∂f .....................
(x, y) =
∂y ...................... si (x, y) = (0, 0)
(b) Calculer
∂2f
(0, 0) = ......................
∂x∂y
∂2f
(0, 0) = .......................
∂y∂x
Remarque 14 A partir des dérivées partielles d'ordre 2, on dénit les dérivées partielles
d'ordre 3 lorsqu'elles existent. De proche en proche, on dénit les dérivées partielle d'ordre
k lorsqu'elles existe.
Exercice
Cherhcer les dérivées partielle d'ordre 3 de la fonction f : R2 → R dénie par:
f (x, y) = x + y − x2 y 3 .
Dénition:
Soit f : D ⊂ Rn → R, k ∈ N∗ . On dit que f est de classe C k sur D et on écrit que f ∈ C k (D)
si toutes ses dérivées partielle jusqu'à l'ordre k existent et sont continues sur D.
∂2f ∂2f
=
∂xi ∂xj ∂xj ∂xi
Dénition
Soit D un ouvert non vide de Rn , a ∈ D et f : D → R deux fois diérentiable sur D. On
dénit la matrice hessienne Hf ∈ Mn (R) de f par:
plusieurs variables
Sommaire
3.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1.1 Notions sur la convexité . . . . . . . . . . . . . . . . . . . . . . . 21
3.1.2 Exemples de problèmes d'optimisation . . . . . . . . . . . . . . . 23
3.2 Résultats d'existence et d'unicité . . . . . . . . . . . . . . . . . . 24
3.2.1 Existence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2.2 Unicité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.3 Optimisation sans contrainte . . . . . . . . . . . . . . . . . . . . 26
3.3.1 Condition d'optimalité du premier ordre . . . . . . . . . . . . . . 26
3.3.2 Condition d'optimalité du second ordre . . . . . . . . . . . . . . 27
3.4 Optimisation avec contrainte . . . . . . . . . . . . . . . . . . . . 28
3.4.1 Contraintes en égalité . . . . . . . . . . . . . . . . . . . . . . . . 29
3.4.2 Contraintes en égalité et en inégalité . . . . . . . . . . . . . . . . 30
20
3.1. MOTIVATIONS 21
3.1 Motivations
La forme générale d'un problème d'optimisation est la suivante:
minX∈Rn f (X)
(PC = sous les contraintes (3.1.1)
h(X) = 0g(X) ≤ 0
un convexe.
i=1
Exercice:
1
Soit f (x) = < Ax, x > − < b, x > avec A ∈ Mn (R), x ∈ Rn et b ∈ Rn .
2
montrer que f est convexe SSi A est positive.
(a) Soit (x, y) ∈ (R∗+ )2 . Le prot P (x, y) réalisé par l'entreprise lorsqu'elle a vendu
x jouets de modèle X et y jouets de modèle Y est:
P (x, y) = .........................................
h(x, y) − 20 = .................
3.2.1 Existence
Théorème 10 Si f : K ⊂ Rn −→ R est continue et si de plus K est un ensemble compact,
alors (P) admet une solution xe ∈ K qui vérie
x) ≤ f (x)
f (e ∀x ∈ K
Exemple:
On considère la fonction f dénie sur R2 par:
f (x, y) = x2 + y 2 + xy .
On note D = {(x, y) ∈ R2 , x2 + y 2 ≤ 1 et x + y ≥ 1}
Exemple
On considère la fonction g : R2 → R dénie par:
∀(x, y) ∈ R2 , g(x, y) = x2 + y 2 + xy
x+y 1 1
1. Montrer que g(x, y) = ( √ ) + x2 + x2 .
2 2 2
2. Montrer que lim g(x, y) = +∞.
||(x,y)||→+∞
3.2.2 Unicité
L'unicité résulte en général de propriétés de convexité.
3 −1 −1 1
, et b = 1 .
A=
−1 3 −1
−1 −1 3 1
x
1
< AX, X > − < b, X >, ∀X = .
J(X) = y
2
z
x) = 0Rn .
∇f (e
Dénition
Un point x∗ de Rn vériant ∇f (x∗ ) = 0Rn est appelé point critique. La relation ∇f (x∗ ) =
0Rn est appelée équation d'Euler.
Exemple:
Condition nécessaire et susantes
Exercice :
On considère la fonction f dénie sur R3 par:
f (x, y, z) = x2 + y 2 + z 2 − 2x − 2y + 1.
Remarque 22 Nous traiterons plus particulièrement le cas où C est déni par des égalités
et des inégalités:
Exemple
On considère les sous-ensembles de R2 suivantes:
Représenter graphiquement chacun de ces ensembles et dire s'il est convexe, fermé et borné.
min J(x).
x∈C
avec C = {x ∈ Rn tel que h1 (x) = 0, ..., hp (x) = 0} Les fonctions h1 ,...,hp sont continue
de Rn dans R.
Condition nécessaire du premier ordre-contraintes en égalité
p
λ∗j ∇hj (x∗ ) = 0Rn .
X
∇J(x∗ ) +
j=1
Remarque 23 Les réels λ∗j obtenus par le théorème précédent sont appelés multiplicateurs
de Lagrange.
Exemple
Soit le problème (P) :
avec:
ainsi on obtient:
10x − 2y − 3 + λ = 0
10y − 2x − 3 + λ = 0 (3.4.1)
x + y = 20
min J(x).
x∈C
Théorème 17 On suppose que J ,h1 ,...,hp ,g1 ,...,gq sont de classe C 1 . Soit x∗ une solution
du problème (P). Alors il existe λ∗ = (λ∗1 , ..., λ∗p ) ∈ Rp et µ∗ = (µ∗1 , ..., µ∗q ) ∈ Rq tels que:
1. ∀j ∈ {1, ..., q} µj ≥ 0.
p q
µj gj (x).
X X
L(x, λ, µ) = J(x) + λi hi (x) +
i=1 j=1
∇x L(x∗ , λ∗ , µ∗ ) = 0.
Algorithmes d'optimisation
Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2 Algorithme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.3 Méthode du gradient . . . . . . . . . . . . . . . . . . . . . . . . . 34
32
4.1. INTRODUCTION 33
4.1 Introduction
Dans ce chapitre nous allons présenterquelques algorithmes permettant de calculer de manière
approchée la ou les solutions du problème (P) dénie par:
minX∈Rn J(X)
avec J : Rn −→ R diérentiabilité.
La plupart de ces algorithmes exploitent la condition d'optimalité dont on a vu qu'elle
permet de déterminer des minima locaux.
Remarque 25 Nous avons fait l'hypothèse de diérentiabilité de la fonction J . Il existe
des méthodes permettont de traiter le cas non diérentiable.
4.2 Algorithme
Dénition:
Un algorithme d'optimisation est déni par une application A : Rn −→ R permettant
lagénération d'une suite d'éléments de Rn par la formule:
x0 ∈ R
n
donné k = 0 Initialisation
xk+1 = A(xk ) ItérationK
k =k+1
ek+1 ≤ αk ek
avec J : Rn −→ R diérentiabilité.
Les étapes à suivre pour résoudre le problème (P) sont les suivantes:
donné
(
X0 ∈ Rn
Xk+1 = Xk + ρk dk , dk ∈ Rn , ρk ∈ R∗+
1 2
f (x) = f (x1 , x2 ) = x + 2x22 .
2 1
La gure suivante donne l'allure de la fonction f au point x = (x1 , x2 ) = (1, 1) dans plusieurs
directions.
Algorithme de descente:
Le Schéma général d'un algorithme de descente est la suivante:
Données f : Rn −→ R diérentiable, X0 ∈ Rn point initial arbitraire choisi et ε donné.
Sortie Une approximation de la solution du problème minn J(X).
X∈R
1. k = 0.
2. Tant que ||Xk+1 − Xk || > ε ou ||∇J(Xk+1 )|| > ε
(a) Trouver une direction dk .
(b) recherche linéaire: choisir un pas ρk > 0 à faire dans la direction dk tel que:
Test d'arrêt:
Soit X ∗ un point de minimum local du critère de J à optimiser. Supposons que l'on choisi
comme test d'arrêt dans l'algorithme de descente modèle, le critère idéal Xk = X ∗ . Dans
un monde ideal soit l'algorithme s'arrête après un nombre ni d'itération, soit il construit
une suite innie X1 , ..., Xk , ... de points de Rn qui converge vers X ∗ .
En pratique, un test d'arrêt devra être choisi pour garantir que l'algorithme s'arrête
toujours après un nombre ni d'itérations et que le derniere point calculer soit susamment
proche de X ∗ .
Soit ε > 0 la précission demander. Plusieurs critères sont à notre disposition:
1. ||∇J(Xk )|| ≤ ε ⇒ Xk solution. (Condition nécessaire d'optimalité du premier ordre).
2. En pratique, le test d'optimalité n'est pas toujours satisfait et on devra faire appel à
d'autres critères.
On veut que J(Xk + ρk dk ) < J(Xk ) alors le meilleur choix est dk = −∇J(Xk ), pour ρk
constant ou variable.
Le choix de la direction de plus forte descente dénit une famille d'algorithme appelés
algorithmes de descentes de gradient dont le schéma est le suivant:
Algorithme de descente de gradient
1. k = 0.
(b) Recherche linéaire: choisir un pas ρk > 0 à faire dans la direction dk tel que:
Remarque 29 Il faut dénir une stratégie de recherche linéaire pour le calcul du pas:
• Méthode à pas optimal.
• Méthode à pas xe.
1. Pas optimal: Une idée naturelle consiste à suivre la direction de plus forte descente
et à faire un pas qui rende la fonction à minimiser la plus petite possible dans cette
direction. Ainsi on dénie la méthode de gradient à pas optimal.
L'étape 2)b) est remplacer par:
Calculer un pas optimal ρk solution de min J(Xk + ρdk ).
ρ>0
2. Pas xe: L'idée est trés simple. On impose une fois pour toutes la taille du pas
eectué selon la direction de descente calculée à chaque itération. Ainsi on dénie la
méthode de gradient à pas xe.
L'étape 2)b)c) est remplacer par: Xk+1 = Xk − ρ∇J(Xk ).
Exemple:
On veut minimiser f : R2 −→ R dénie par:
1 2 7 2
f (x, y) = x + y .
2 2
Nous allons utiliser les algorithmes de descente de gradient à:
• Pas xe.
• Pas optimal.
1 7
min f (Xk + ρdk ) = min x2k (1 − ρ)2 + yk2 (1 − 7ρ)2
ρ>0 ρ>0 2 2
x2k + 72 yk2
ρk = .
x2k + 73 yk2
! ! !
xk+1 xk x2k + 72 yk2 −xk
4. Ainsi = + 2
yk+1 yk xk + 73 yk2 −7yk
!
7
Appliquons maintenant les deux algorithme à partir du point X0 = . Soit la gure
1.5
suivante qui illustre les itérations des algorithmes de gradient à pas xe et à pas optimal,
générées à partir du point X0 .
Cet exemple met en évidence la lenteur de la méthode de plus profonde descente, caractérise
par le comportement en zigzag des itérés. Ces zigzags ce traduisent par le faite que deux
directions de descente successives calculées par l'algorithme de plus forte descente sont or-
thogonales.
Soit le tableau suivant qui décrit les itérations de la méthode de plus profonde descente.
Le critère d'optimalité est satisfait en 43 itérations pour une precision ε = 10−5 et en 79
itérations si ε = 10−10 .
Pour l'algorithme à pas xe, on a le nombre d'itérations en fonction de pas choisi est donner
par le tableau suivant: