Modélisation et optimisation des phénomènes
Modélisation et optimisation des phénomènes
et OPTIMISATION
Claude HOINARD
Faculté des Sciences Pharmaceutiques
« Philippe Maupas » -Tours
1
Claude Hoinard, UFR de Pharmacie de Tours, Mai 2009
Rappels
Méthodologie dans l’étude d ’un
phénomène
Lors de l ’étude d ’un phénomène, plusieurs questions
se posent, auxquelles répondent différents types de
plans. On peut distinguer 3 grandes étapes dans
l ’acquisition des connaissances :
Recherche des facteurs influents
la modélisation
l ’optimisation
5
I - Généralités
Pour un système (industriel, de laboratoire…)
dont l’état dépend de variables opératoires le
terme OPTIMISATION désigne une action qui
vise à trouver l’ensemble des valeurs de ces
variables qui entraîne un état souhaité pour le
système étudié.
7
Dans tout problème d’optimisation, il intervient 2 catégories de
variables.
Les variables opératoires (x) appelées
aussi les facteurs.
Ces facteurs doivent être de nature quantitative (ex :
pH, température…) et il doit être possible de les faire varier
à volonté (facteurs contrôlés) dans les limites permises
par l’expérimentation.
La réponse (y) dite aussi fonction de
réponse.
Ce doit être aussi une variable quantitative ; c’est elle
qui sera dite « optimisée ». La dénomination « fonction de
réponse » indique que y doit dépendre des valeurs x prises
par les variables opératoires.
8
Bien que le qualificatif « état souhaité pour le
système » n’implique pas nécessairement la
détermination d’un extremum (on peut par exemple
être satisfait dans certaines études par une réponse
y supérieure à une valeur seuil prédéterminée …),
nous privilégierons dans la suite du chapitre
l’optimisation comme la recherche d’ un
maximum (ex : rendement réaction) ou d’un
minimum (ex : coût d’une opération) de la
fonction de réponse y en faisant varier
convenablement les variables opératoires x (les
facteurs) pour faciliter cette localisation.
9
Il s’agit donc le plus souvent de
trouver l’optimum vrai de la réponse,
soit d’un point de vue mathématique de
rechercher l’extremum (minimum ou
maximum) d’une fonction y de plusieurs
variables :
y = f(x1, x2,…….,xn)
10
Optimisation à une variable opératoire
La réponse y est
fonction d’une seule
variable x et on
recherche la valeur
xmax de x, comprise
entre les limites
expérimentales xA et xB,
qui rend la valeur de y
optimale, c ’est à dire
ymax.
11
Optimisation à deux variables opératoires
La fonction objectif y
dépend de 2 variables x1 et
x2 ; elle est représentée
sous forme de courbes de
même niveau de réponse,
dites courbes d ’
isoréponses (figurées en
pointillés).
On recherche donc les
valeurs x1max et x2max qui
correspondent à la valeur
ymax optimale.
12
Stratégie expérimentale d ’optimisation
Quand plusieurs variables opératoires x agissent sur une
réponse y à optimiser,
-0.8
-0.6
-0.4
0
-0.2
0.2
0.4
0.6
x1 -1.6
0.8
1
15
II - La méthode des plans
d ’expériences
Dans ce cas, il faut postuler a priori un modèle pour la
surface de réponse puis estimer son équation par la
technique statistique de régression linéaire multiple.
La valeur des coefficients de l’équation ainsi que leur
précision dépendent fortement de l ’organisation des
essais, d ’où la nécessité de planifier les expériences.
Parmi les divers plans mis au point par les statisticiens,
plans de DOEHLERT, plans de BOX, plans composites
centrés (PCC) …, nous ne détaillerons que ces derniers
parce que ce sont les plus utilisés.
16
Localisation MAXIMUM
Cheminement vers l’optimum
(cas avec 2 facteurs x1 et x2 Plan Composite Centré
meilleure réponse
11
Expérimentation ligne
de plus grande pente
10
8 direction optimum
4 3
Plan factoriel complet
(ou fractionnaire)
1 2 17
Quelques précisions
19
Validité du modèle du 1er degré
Dans les plans factoriels 2n chaque facteur n’est
expérimenté qu’en 2 points , aux extrémités –1 et +1 du
domaine. Cela explique le choix empirique d’une équation du
1er degré en fonction des facteurs centrés réduits X : par 2
points , il passe une droite et une seule ; mais il faut aussi
ajouter qu’il peut y passer une infinité de courbes
d’équations diverses …
réponse y
21
Exemple modèle 1er degré
Le modèle du 1er degré n’est pas valide ici : toutes les prévisions de
réponses sont fausses : il aurait fallu valider le modèle avant ! 23
Le modèle du 2ème degré
Le modèle du 1er degré ne peut pas convenir pour caractériser un
optimum : une telle fonction ne comporte ni minimum, ni maximum.
Le modèle du 2ème degré en diffère par l’existence de
termes supplémentaires du 2ème degré en x :
ŷ = yC + a1x1 + a2x2 +a12x1x2 + a11x²1 + a22x²2
Les coefficients a11 et a22 attachés aux carrés des variables
x1 et x2 sont primordiaux pour le calcul de l ’extremum.
Ce modèle contient 6 paramètres (en incluant yC) et un
minimum de 12 essais est donc souhaitable pour appliquer
convenablement la régression linéaire multiple.
Cette condition étant remplie, il est possible de tester la
validité du modèle, choisi empiriquement, et d’identifier
les coefficients qui diffèrent statistiquement de 0 ; seuls
les termes significatifs figureront dans l ’équation de la
surface de réponse.
24
II - 2 : le plan composite centré à 2 facteurs
Les plans composites centrés ont été conçus pour assurer une
précision à peu près uniforme des estimations de réponse ŷe
dans la totalité du domaine expérimenté, avec le plus petit
nombre d’essais possible …
Ces plans comprennent 3 catégories d’essais établis de telle
sorte qu’à chaque variable x correspondent 3 niveaux :
les essais du plan factoriel (pour 2n et n = 2, il y en a 4)
des essais « en étoile » par rapport aux essais précédents (au
total 2n , soit 4 pour 2 facteurs) et dont la distance à l’origine
des coordonnées dépend de n (1,414 pour n = 2).
des essais au centre du domaine, 3ème niveau de chaque
facteur, le nombre de répétitions augmentant avec le nombre
de facteurs étudiés (pour n = 2, il est habituel d’en prendre 5).
25
Le plan composite
centré à 2 facteurs X2 5 répétitions au
comporte 13 essais 1,414 centre du domaine
-1 1
-1,414 1,414
X1
-1
90.0-100.0
On voit que la réponse passe par un
90.0
80.0
80.0-90.0
70.0-80.0
maximum, mais ce type de graphe
60.0-70.0
rendement
70.0 50.0-60.0 est difficile à exploiter
60.0
1.2
0.5
50.0
-1.6
-0.2
-1.4
-1.2
X3
-1
-0.8
-0.6
-0.4
-0.9
-0.2
0
0.2
0.4
0.6
0.8
-1.6
1
1.2
X1
1.4
1.6
1.6
1.4
1.2
1
Diagramme des courbes
d’isoréponses
0.8 rendement
0.6
0.4 90.0-100.0
0.2 80.0-90.0
0
-0.2
X1 70.0-80.0
60.0-70.0
Projection du graphe précédent (vue
-0.4
-0.6
-0.8
50.0-60.0
du dessus)
-1
-1.2
-1.4
-1.6
Commode pour visualiser la région
-1.6
-1.4
-1.2
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
30
1ère phase : plan factoriel 22
31
Les réponses des essais 1 à 4 permettent de calculer les
coefficients (les effets) du plan factoriel :
a1 = -8,25 ; a2 = 7,25 ; a12 = -1,25 et yC = 85,25
L ’erreur type d ’un coefficient est E = 1,5 (puisqu ’on
sait que y = 3). Un coefficient est significatif si sa valeur
absolue dépasse 2 E , soit 3. L ’interaction n ’est donc
pas significative. L’équation s ’écrit :
ŷ = 85,25 - 8,25x1 + 7,25x2
Les 3 répétitions au centre (5 à 7) permettent d ’obtenir
une mesure directe de la réponse au centre du domaine
par sa moyenne : y0 = 72,67.
La différence entre cette moyenne et l’estimation yC
donnée par le modèle (12,58 ) est très grande par rapport
à la dispersion des mesures : le modèle du 1er degré ne
convient pas.
32
2ème phase : plan composite centré
35
Détermination du domaine [x1 , x2] tel que ŷ > 90
37
Courbes d'isoréponses
vitesse rotation
(t/mn)
900
878
857
836
814
Stabilité
793 120.0-130.0
771
110.0-120.0
750
100.0-110.0
729
707 90.0-100.0
686 80.0-90.0
664 70.0-80.0
643
60.0-70.0
622
600
0.49
0.71
0.93
1.14
1.36
1.57
1.79
2.01
38
II - 3 : le plan composite centré à 3 facteurs
x1
6 répétitions au
centre du domaine
45
Les 6 essais en étoile Les 6 répétitions au centre
Résultats de la régression linéaire multiple
valeur degré de
désignation coefficient erreur-type statistique t signification
constante 84.925 5.64 15.06 3.37x10-08
a1 -8.228 3.74 -2.20 0.053
a2 -1.598 3.74 -0.43 0.678
a3 26.074 3.74 6.97 3.86x10-05
a12 -6.250 4.89 -1.28 0.230
a13 2.750 4.89 0.56 0.586
a23 0.250 4.89 0.05 0.960
a11 -18.543 3.64 -5.09 4.71x10-04
a22 -2.987 3.64 -0.82 0.431
a33 -13.947 3.64 -3.83 0.003
Détermination de l ’optimum
La dérivée de y par rapport à X1 a pour expression :
dy/dX1 = -8,23 - 2*18,54*X1
100.0
90.0-100.0
90.0
80.0-90.0
80.0
70.0-80.0
60.0-70.0
rendement
70.0 50.0-60.0
60.0
1.2
0.5
50.0
-1.6
-0.2
-1.4
-1.2
X3
-1
-0.8
-0.6
-0.4
-0.9
-0.2
0
0.2
0.4
0.6
0.8
-1.6
1
1.2
X1
1.4
1.6
48
Courbes d ’iso-réponses
1.6
1.4
1.2
1
0.8 rendement
0.6
0.4 90.0-100.0
0.2 80.0-90.0
0 X1 70.0-80.0
-0.2
-0,22 60.0-70.0
-0.4
-0.6
50.0-60.0
-0.8
-1
-1.2 optimum
-1.4
-1.6
-1
0
-1.6
-1.4
-1.2
-0.8
-0.6
-0.4
-0.2
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
X3 0,93
49
x1 -1 x3 -1
X1 = X3 =
0,5 0,5
X1max = -0.22
Une remarque pour terminer X3max = 0.93
50
II - 5 : aperçu sur les plans de Box-Behnken
4 sur la Soit,
section
X1 = 0 au total 15 essais
4 sur la face
X1 = +1
52
III - La méthode du simplex et
ses variantes
Inventée par SPENDLEY en 1962, cette méthode consiste
à se déplacer pas à pas sur la surface de réponse grâce à
un algorithme itératif, sans jamais avoir à déterminer
l’équation liant la réponse y aux variables opératoires x.
60
Illustration : dans la recherche du maximum de la réponse y, le
simplex actuel est [W,B,N] et les 3 réponses sont connues.
Règle n°2
Lorsqu’un même point apparaît dans k + 1 simplex
successifs sans être éliminé (les simplex tournent autour de
ce point pivot), cela signifie que, soit la réponse en ce point
est entachée d’une erreur de mesure, soit que ce point pivot
est proche d’un optimum.
Il faut donc effectuer à nouveau l’expérience en ce point ; si
la mesure est confirmée, la procédure normale continue.
Sinon, il faut reprendre les simplex précédents pour
redéfinir l’orientation.
62
Illustration de la règle 2 Après 3 simplex (k = 2), le point rose
n’est pas encore éliminé : une 2ème
mesure de ce point s’impose.
y = 60 y = 60
y = 52 y = 52
y = 40 R
y = 40 2
2 3 3
1 y = 62
1
y = 62
y = 68 R y = 48 y = 68
y = 48
2ème mesure : 2ème mesure :
y = 67 y = 55
63
Règles d’évolution du simplex (fin)
Règle n°3
Lorsque le symétrique du plus mauvais point dans un simplex
est également le plus mauvais point dans le simplex suivant,
on prend le symétrique du 2ème plus mauvais point.
64
Illustration de la règle 3 : le simplex actuel est [W,B,N] et
les 3 réponses sont connues.
B yB = 61
impossible
W R d’expérimenter
au point R !
yW = 48
Les conditions
N yN = 53 sont
On repart du 2ème irréalisables
plus mauvais point.
65
Arrêt de la procédure des simplex
66
Illustration :
81%
8
x2
9
64% La procédure est terminée :
5 7
85%
le simplex suivant
86%
consisterait à prendre le
4
63% symétrique de 8 (règle 3) et
75% on retomberait sur le point 4
6
3 73% déjà expérimenté.
L ’hexagone se refermerait.
x1
Et ensuite ?
67
Exemple d ’application
71
Évolution du simplex dans l ’espace à 3 dimensions
R
R’
2ème
Simplex
3ème
W’ Simplex
73
• Si yR > yB expansion (E) et simplex suivant : [N,B,E]
4
3 y8 < y6 , y7 et y4
2
contraction vers 4
d ’où le point 9
1
0
y3 > y2 (B) expansion vers 4 X1
75
III - 5 : optimisation dans le cas d ’un seul
facteur - méthode Uniplex
Dans le domaine expérimental [xA , xB] de la variable
opératoire x dont dépend la réponse y, il s ’agit de localiser la
valeur xM donnant l ’optimum de y.
Au départ, il faut réaliser 2 essais situés vers le milieu du
domaine, pas trop rapprochés l ’un de l ’autre pour donner 2
réponses différentes, ce qui permet de savoir dans quel sens se
diriger.
Dans la recherche yx0 < yx1
d ’un maximum :
xA x0 x1 xB
yx0 > yx1
76
Divers algorithmes ont été proposés : méthodes du nombre
d’or, méthodes de Fibonacci qui explorent l ’intervalle [xA , xB]
par domaines successifs selon un protocole défini à l ’avance.
W CW B CR R E
yW yCW yB yCR yR yE
Si yR > yB expansion vers E. Simplex suivant : BE
Si yR < yB et yR > yW contraction vers B (CR). Simplex
suivant : BCR si yCR > yR ou BR si yCR < yR
Si yR < yW contraction vers W (CW). Simplex suivant :
BCW si yCR > yW. Sinon vérifier la mesure yB.
78
Exemple d ’application
Optimisation de la fraction molaire x d ’un constituant pour obtenir
le rendement de réaction y % le plus élevé possible. L’incertitude
sur une mesure de rendement est de 2%.
On part de x1 = 0,25 avec un pas x = 0,40 ; on a donc x2 = 0,65
Le 3ème point a pour fraction molaire x3 = 1,05 (0,65 + 0,40)
Comme y3 < y2 et y3 > y1, on a x4 = 0,85 (milieu de 2-3)
Le point suivant est x5 = 0,75 (milieu de 2-4)
L’optimisation est terminée : les rendements ne diffèrent plus.
0
1 0,5 2 5 4 1 3
x
32 % 47 % 50 % 51 % 43 %
79
Une remarque importante
80
III -6 : La méthode « 1 seul facteur
variable à la fois »
81
1ère phase : variation de x1 à x2 constant
2ème phase : variation de x2 à x1 constant
Point de 1 2 5 3 4
départ Maximum
6 obtenu en
Maximum 7 faisant
obtenu en varier x2
faisant 8
varier x1 Réseau
d ’isoréponses
x2 y
Maximum
déterminé
x1
Le maximum déterminé est très loin du max vrai … Maximum
vrai
Ce n’est pas une procédure à recommander.
82
Pour que la méthode de Friedman soit applicable en
pratique et donne confiance dans l’optimum déterminé, il est
nécessaire après 2 étapes de refaire varier x1 pour rechercher
un nouvel optimum, puis à nouveau x2 et réitérer ce
processus autant de fois qu ’il le faut jusqu’à ce que la
réponse n’augmente plus…
Cette méthode présente l’inconvénient de réclamer un
grand nombre d ’essais, comme l’illustre le schéma suivant
De plus, il est des cas particuliers où cette technique ne
permet pas d ’atteindre l ’optimum vrai (blocage sur une
arête de la surface de réponse).
83
Continuons
Il faut la
beaucoup
recherche
d expériences
du (29) pour parvenir à
l’optimum
maximum vrai vrai avec la méthode de Friedman ...
Point de 1 2 5 3 4
départ
6
7
9 10 11
8 14 15
12
18 Réseau
16 19
13 d ’isoréponses
22
20 23 y
17 26
x2 24 27
21 25 29
28
x1
Maximum
vrai
84
Simplex 1 3
de départ 5
6
9
2 4
7
8
10
11 12
Réseau
d ’isoréponses
13
y
x2 14 17
16 18
15
x1
Maximum
vrai
85
Conclusion : simplex ou plan d ’expérience ?
avantages
86
Conclusion : simplex ou plan d ’expérience ?
inconvénients
87