Cours Les Plans Dexpériences M2 GPE
Cours Les Plans Dexpériences M2 GPE
Plan
d’expérience
2
Introduction
Les plans des expériences !
Une méthode scientifique statistique pour la planification, la réalisation, l’analyse
et l’interprétation de données issues d’essais ou d’expériences contrôlés.
Une méthodologie mathématique utilisée pour planifier et mener efficacement une
étude scientifique qui modifie simultanément:
les variables d’entrée (X) appelées Facteurs afin de révéler leurs effets sur une
variable de sortie (ou plusieurs)(Y) appelée Réponse
Acquisition 4
progressive des
résultats
Les trois aspects essentiels du processus d’acquisition des connaissances sont les suivantes :
– le choix de la méthode d’expérimentation,
– l’analyse des résultats,
– l’acquisition progressive de la connaissance.
Les expériences sont organisées pour faciliter l’exploitation des résultats et pour permettre
l’acquisition progressive des résultats d’intérêt.
5
La grandeur d’intérêt, qui est généralement notée y, porte le nom de réponse. Les
variables qui peuvent modifier la réponse sont appelées facteurs. On parle donc des
facteurs qui influent sur une réponse. Les termes facteur et réponse sont universellement
employés dans le domaine des plans d’expériences.
Facteur
PS. La frontière est parfois floue entre ces différents types de facteurs, la vitesse
par exemple, peut être transformé en facteur ordonnable ou discret : rapide et lent,
ou vitesse A et vitesse B
7
Réponses
Réponses ou sorties de l’expérience: Sont les résultats mesurables potentiellement influencés par
les facteurs et leurs niveaux respectifs.
Espace expérimental
Pour présenter l’espace expérimental nous utiliserons un espace à deux dimensions, ce qui
facilitera les représentations graphiques. Il est ensuite facile d’étendre les notions introduites à des
espaces multidimensionnels. L’espace expérimental comprend tous les points du plan « facteur 1
× facteur 2 » et chacun d’eux représente une expérience. S’il y a un troisième facteur, on le
représente aussi par un axe orienté et gradué, et on le positionne perpendiculairement aux deux
premiers. À partir de quatre facteurs, on opère de même, mais il n’y a plus de représentation
géométrique possible et l’on doit adopter une représentation purement mathématique
8
Domaine d’un facteur
En plans d’expériences, lorsque nous étudions l’influence d’un facteur, en général, nous limitons sa
variation entre deux bornes appelées respectivement: niveau bas (-1) et niveau haut (+1) qui
définissent le domaine d’étude de ce facteur. Si nous considérons 5 niveaux de la pression (1, 5, 10, 1
et 20 bars), son domaine d’étude sera [1, 20]
S’il y a plusieurs facteurs, chacun d’eux à son domaine de variation. Afin d’avoir une
représentation commune pour tous les facteurs, on note les niveaux bas par –1 et les niveaux
hauts par +1.
À l’intérieur du domaine d’un facteur continu toutes les valeurs sont théoriquement possibles. On
peut donc y choisir deux, trois ou plusieurs niveaux selon les besoins de l’étude. Par exemple, si
l’on veut établir un modèle du second degré, on choisira trois ou quatre niveaux.
9
Domaine d’étude
Dans la pratique, l’expérimentateur sélectionne une partie de l’espace expérimental pour réaliser son
étude. Cette zone particulière de l’espace expérimental est le domaine d’étude. Ce domaine est défini
par les niveaux hauts et les niveaux bas de tous les facteurs et éventuellement par des contraintes
entre les facteurs.
10
Lorsqu’on attribue la valeur −1 au niveau bas d’un facteur et la valeur +1 au niveau haut, on
effectue deux modifications importantes :
On déplace l’origine des mesures. Dans l’exemple choisi, le milieu de l’intervalle [−1 ; +1]
correspond à une certaine valeur. La valeur numérique de la nouvelle origine, zéro, diffère donc de
l’origine exprimée en unité courante.
On change l’unité de mesure.
Ces deux modifications entraînent l’introduction de nouvelles variables que l’on appelle variables
centrées réduites: centrées pour indiquer le changement d’origine et réduites pour signaler la
nouvelle unité. On utilise également le terme de variables codées.
Le passage des variables d’origine A aux variables codées x, et inversement, est donné par la formule
suivante (A0 est la valeur centrale en unités courantes):
11
Exemple d’application :
Un expérimentateur choisit pour le facteur « vitesse de la voiture » 80 km/h comme niveau bas et
120 km/h comme niveau haut. Quelle est, en variables codées, la valeur de la vitesse de 90 km/h ?
Calculons le pas du
facteur vitesse:
Calculons la valeur centrale
entre niveau bas et niveau haut:
Enfin, appliquons la
relation précédente
12
Objectif de criblage
Objectif de comparaison alternatif:
Les expériences de criblage sont un moyen
permet de déterminer l’effet des
efficace, avec un nombre minimal de tests,
différents niveau de même facteur, et
pour déterminer les facteurs importants.
déterminer si ce facteur est
Nous pourrions poser une question: Quels
significatif. Si non on choisi le moins
sont les facteurs importants qui ont un
couteux par exemple.
impact sur notre réponse!
Objectif de prédiction:
Objectif de modélisation Un modèle mathématique obtenu peut être utilisé pour prédire
La méthodologie de une réponse à un point quelconque dans les limites des domaines
surface de réponse est un expérimentaux.
ensemble de techniques
mathématiques et Objectif d’optimisation:
statistiques pour la Une optimisation est effectuée pour déterminer les valeurs des
construction de modèles entrées du processus à utiliser pour obtenir la sortie du processus
mathématiques souhaitée.
empiriques.
L’exploitation de ces Objectif d’optimisation multi-réponses:
modèles peut répondre à L’objectif est de déterminer les paramètres des facteurs
plusieurs objectifs: permettant d’optimiser simultanément (un compromis) plusieurs
réponses.
13
Quelles sont les étapes des plans d’expériences!!
1. Poser un objectif:
La priorisation des objectifs vous aide à choisir la direction à prendre en ce qui concerne la sélection
des facteurs, les réponses et un plan particulier.
3. Choix de plan :
Le choix dépend directement de l’objectif et le nombre de facteurs à étudier.
Par exemple: Entre 2 et 4 facteurs:
Si l’objectif est le criblage on choisi plan factoriel complet ou fractionnaire (On aura aussi un
modèle mathématique).
Si l’objectif est la modélisation et l’optimisation on choisi les plans de surface de réponse (Central
composite, Box Benken, Dohelert….)
14
Dans les plans factoriels, plusieurs facteurs sont étudiés simultanément pendant
l’étude. Des facteurs qualitatifs et/ou quantitatifs peuvent être pris en compte.
L’objectif de ces plans est d’identifier les facteurs qui ont un effet significatif sur
la réponse, ainsi que d’étudier l’effet des interactions (en fonction du plan
d’expériences utilisé).
Des prédictions peuvent également être effectuées lorsque des facteurs quantitatifs
sont présents, mais des précautions doivent être prises car certains plans sont très
limités dans le choix du modèle prédictif.
Par exemple, dans les plans à deux niveaux, seule une relation linéaire entre la
réponse et les facteurs peut être utilisée, ce qui peut ne pas être réaliste.
16
a0 représente l’effet théorique et les ai représentent les effets principaux des
différents facteurs.
Les effets des interactions sont quantifiés et représentés par les coefficients aij
3.3. Calcul des effets: Effets globaux et effets 19
moyens
Soit la matrice d’expériences avec
réponses (yi) pour un plan
factoriel complet 22 pour deux
facteur nommés x1 et x2.
Effet moyen:
Les effets moyens d’un facteur aux
niveau -1 et +1 correspondent aux
moyennes des réponses pour chaque
niveau. Idem pour le facteur x2
D’une manière générale, quand le modèle choisi est un polynôme, les coefficients des
termes du premier degré sont les effets des facteurs.
20
Réponse théorique:
C’est la moyenne des réponses
observées aux niveaux -1 et +1.
Exemple d’application
Considérons le processus de cuisson d’un gâteau dont nous voulons étudier l’effet de
la température (T) et la durée (D) de la cuisson sur l’épaisseur (E) du gâteau.
Les résultats mesurés de l’épaisseur (E) pour chaque expérience réalisée, sont
donnés dans le tableau:
Ainsi, dès que le nombre de facteurs augmente, leur mise en œuvre devient
lourde et coûteuse, car le nombre des essais devient vite très important.
Plans
fractionnaires
25
Mais comment on
procède pour construire
un plan fractionnaire?
27
I A B AB
1) Choix d’un plan de base 22=4
essais ABC BC AC C
2) Construire la matrice des 1 -1 -1 +1
effets de modèle saturé avec 1 +1 -1 -1
ce plan de base 1 -1 +1 -1
3) Le facteur C est confondu 1 +1 +1 +1
avec l’interaction AB (d’ordre
le plus élevé) C=AB C*C=ABC I=ABC
4) Détermination des confusions
résultantes C=AB Est confondu
Générateur d’alias
Générateur d’Alias: 28
Les générateurs d’alias servent à calculer la structure des alias qui décrit les
confusions des plans factoriels fractionnaires.
Toute lettre multipliée par elle-même désigne l’identité I.
I multiplié par toute lettre désigne cette même lettre. Les lettres sont
commutatives et associatives.
Pour obtenir tous les alias pour chaque terme nous multiplions les termes de la
relation de définition par les facteurs initiaux constituant la matrice extraite.
Contrastes:
h0 = a0 + aABCD
h1 = aA + aBCD
h2 = aB + aACD
h3 = aC + aABD
h4 = aAB + aCD
h5 = aAC + aBD
h6 = aBC + aAD
h7 = aABC + aD
Le calcul des contrastes hi peut être effectué en utilisant la méthode habituelle du
calcul des coefficients.
Le modèle mathématique qui lie les contrastes au différentes colonnes peut être
décrit sous la même forme que celles des plans complets.
30
Exemple: plan fractionnaire 25-2
1) Choix d’un plan de base 23=8 essais
2) Construire la matrice des effets de modèle saturé avec ce plan de base
3) Le facteur D est confondu avec l’interaction AB et E avec AC
4) Détermination des confusions résultantes D=AB et AC=E:
donc I=ABD=ACE=BDCE
I A B C AB AC BC ABC
ABD BD AD AE D E DE CD
ACE CE ABCE BDE BCE BDC ABE BE
BDCE ABCDE CDE ABCD ADCE ABDE ACD ADE
1 -1 -1 -1 +1 +1 +1 -1
1 +1 -1 -1 -1 -1 +1 +1
1 -1 +1 -1 -1 +1 -1 +1
1 +1 +1 -1 +1 -1 -1 -1
1 -1 -1 +1 +1 -1 -1 +1
1 +1 -1 +1 -1 +1 -1 -1
1 -1 +1 +1 -1 -1 +1 -1
1 +1 +1 +1 +1 +1 +1 +1
h0 h1 h2 h3 h4 h5 h6 h7
31
• Hypothèse 2 : S’il s’avère qu’un contraste est négligeable, tous les termes
aliasés avec ce contraste sont aussi négligeables.
• Hypothèse 4 : Si l’effet d’un des facteurs qui est composant d’une interaction
est négligeable, l’interaction est généralement aussi négligeable.
32
Application:
Nous nous intéressons à étudier l’effet des 4 facteurs A, B, C et D sur une
réponse y.
La plan fractionnaire 24-1 est choisi comme méthode expérimental pour cette
étude, dont les réponses sont illustrées dans la table suivante:
Questions:
Quel est le plan de base choisi?
Le 4ème facteur est aliasé avec quelle interaction? Déduire le générateur d’alias.
A partir de ce générateur, défini tous les alias qui corresponds au différents termes.
Calculer les différentes contrastes.
Déduire les différents effets en appliquant les hypothèses citées précédemment.
33
La matrice du plan fractionnaire 24-1 avec interactions peut être obtenue à partir
d’une matrice d’un plan complet (plan de base) = 23.
Le générateur d’alias pour ce plan est : I = ABCD.
À partir de ce générateur nous pouvons définir tous les alias qui correspondent
aux différents termes (A, B, C, AB, AC, BC et ABC) de la matrice en multipliant le
générateur d’alias par les termes de la matrice du plan 23).
Les contrastes sont calculés de la même manière que le calcul des effets.
34
h0 = a0 + aABCD, en appliquant l’hypothèse 1
h1 = aA + aBCD,
h2 =aB +aACD,
h3 = aC +aABD, aABCD=0 donc h0 = a0 = 55,5
h4 = aAB +aCD, aBCD =0 donc h1 = aA =3,75
h5 = aAC +aBD, aACD =0 donc h2 =aB = -7,5
h6 = aBC +aAD, aABD =0 donc h3 = aC = 4
h7 = aD +aABC. aABC =0 donc h7 = aD = -0,75
en appliquant l’hypothèse 2
Si2 Variance
un risque α
degré de liberté ddl = n−p
38
Exemple:
La valeur critique de student tcrit pour un modèle dont p=7, n=8 et pour un risque
α=0.05 correspond à la cellule de l’intersection de la première ligne (n−p=1) et la
sixième colonne (α=0.05) dans la table de student
39
Application:
En prenant l’exemple précédent de la cuisson d’un gâteau ou nous considérons
l’ajout ou le non ajout de la levure comme un facteur supplémentaire.
L’objectif de cette étude est de déterminer quels sont les facteurs et les
interactions qui ont un effet significatif et ceux qui ont un effet négligeable.
L’expérimentateur décide d’utiliser un plan d’expériences factoriel complet 23. Il
définit le domaine d’étude des trois paramètres comme suit:
Pour calculer la variance S2 nous calculons les réponses estimées Êi par le modèle
précédent ainsi que les écartes type Si :
La variance Si Ecart-type
42
Modèle de 1er
degré
Modèle de 2éme
degré
Modèle de n
degré
44
2.4 Test de validation
L’analyse de la variance (ANOVA), consiste à comparer à l’aide d’un test f la
somme des carrés des écartes due uniquement à la régression au modèle avec la
somme des carrés de résidu
Notons que :
A. yi sont les réponses observées lors de la réalisation des expériences,
B. ȳ est la moyenne des réponses
C. ŷi sont les réponses estimées à l’aide du modèle.
Tableau ANOVA
En outre, on note:
CML le carré moyen associé à SCEL.
CMR le carré moyen associé à SCER.
46
Le test F permet alors de comparer le Fcal que nous avons calculé dans le
tableau précédent avec le Fcrit (ddl1; ddl2 ; α) lu à partir de la table de Fisher-
Snedecor avec les degrés de liberté
ddl1 = p-1,
ddl2 = n-p
avec un risque fixé à l’avance .
En résumant:
• Si Fcal > Fcrit le modèle de la régression linéaire est considéré comme valide.
• Sinon, le modèle est considéré comme non valide.
47
Application:
En prenant l’exemple précédent de la cuisson d’un gâteau où nous avons
obtenu le modèle mathématique suivant :
Nous voulons étudier la validité du modèle obtenu avec un risque ( α= 0,05) ainsi
que sa qualité (sa correspondance aux données mesurées, sa capacité de
prédiction et sa précision adéquate) en effectuant une analyse de la variance
(ANOV A) et en calculant les différentes mesures statistiques.
49
50
Tableau ANOVA
Les valeurs de R2 et R2 ajusté sont très proches de 1 ce qui prouve que la qualité du
modèle est très bonne en ce qui concerne sa correspondance aux données observées.
51
52
Les plans examinés précédemment n’avaient que deux niveaux d’étude par
facteur et les modèles mathématiques utilisés étaient du premier degré (avec ou
sans interactions) par rapport à chaque facteur.
Ces plans sont les plus employés car ils permettent le criblage des facteurs et
conduisent parfois à des modélisations simples mais suffisantes.
On fait alors appel aux plans pour surfaces de réponse. Ces plans utilisent des
modèles polynomiaux du second degré.
Par exemple : les plans composites, les plans de Box-Behnken et les plans de
Doehlert.
53
2. Les applications les plus étendues de RSM se situent dans les situations
particulières où plusieurs variables d’entrée influencent potentiellement une
mesure de performance (Réponse).
Modélisation
La modélisation est le choix d’une équation mathématique qui relie la réponse
aux facteurs en utilisant le développement limité de la série de Tayor-Mac Laurin
ŷ: Réponse estimée.
b0 : Constante.
bi: Coefficient principal.
bii: Coefficient quadratique.
bij: Coefficient d’interaction.
et xi xj: Valeurs codées des variables.
Premièrement : établir une relation, entre y et x1, x2,. . . , xk qui peut être utilisée
pour prédire les valeurs de réponse pour des valeurs données des variables.
Deuxièmement : déterminer à l’aide des tests d’hypothèses la signification des
facteurs.
Troisièmement : déterminer les paramètres optimaux de x1, x2,. . . , xk
57
Le nombre total n d’essais à réaliser est la somme des essais du plan factoriel (nf ),
des essais du plan en étoile (nα) et des essais au centre (n0). Le nombre n des essais
d’un plan composite est donné par la relation :
n = nf + na + n0
Les points en étoiles sont à une certaine distance du centre en fonction des
propriétés souhaitées pour le plan et du nombre de facteurs de la conception. Ces
modèles ont une symétrie circulaire, sphérique ou hyper-sphérique et nécessitent 5
niveaux pour chaque facteur.
Exemple:
Plan de Box-Behnken
Le plan de Box-Behnken est une méthodologie pour
surfaces de réponse (RSM) qui ne nécessite que
trois niveaux (-1, 0, +1) pour exécuter une
expérience. Il s’agit d’un plan spécial à 3 niveaux et
il ne contient aucun point aux sommets de la région
expérimentale.
Avantages:
Ces plans sont faciles à mettre en œuvre
et possèdent la propriété de
séquentialité. On peut entreprendre
l’étude des k premiers facteurs en se
réservant la possibilité d’en ajouter de
nouveaux sans perdre les résultats des
essais déjà effectués.
61
Plan Doehlert
En 1970, D.H Doehlert a proposé un nouveau plan pour les modèles du
second ordre où les points remplissent d’une manière uniforme l’espace
expérimental. C’est une conception de forme hexagone régulière pour un plan
à deux facteurs et il s’agit d’une forme sphérique, pour trois facteurs
62
la répartition uniforme des
points permet d’étendre le plan
vers n’importe quelle direction de Le nombre
l’espace étudié, en ajoutant des d'expériences «n»
points qui seront aussi repartis dépend du nombre de
d’une manière régulière, ce qui facteurs «k» sans
facilite l’exploitation de l’espace points centraux, n = k
expérimental. (k + 1). Pour les points
centraux, un seul point
ou plus peut ou
peuvent être ajouté(s)
Surface de réponse
Les surfaces de réponse reproduisent les variations d’un phénomène donné dans un
espace à trois dimensions. Le plan horizontal de cet espace matérialise le domaine
de variation de 2 facteurs alors que l’axe vertical matérialise la variation de la
réponse à partir du modèle empirique.
Si on a plus que 2 facteurs, il faut dans ce cas fixer à un niveau constant les autres
facteurs qui ne figurent pas dans le plan horizontal.
65
Courbe Iso-réponse
Les courbes iso-réponse sont une sorte de projection d’une surface tridimensionnelle
(surface de réponse) sur un plan à deux dimensions. Ces courbes sont présentées
comme des courbes de niveaux, dessinées sur une carte topographique. Tout comme
pour les surfaces de réponse, cette représentation ne fait intervenir que 2 facteurs à la
fois, les autres devant être fixés à un niveau constant.
66
Application
L’élimination d’un colorant dans une eau a été effectuée avec le procédé
d’adsorption sur charbon actif, trois paramètres expérimentaux ont été
étudiés à savoir:
X1 : Concentration de polluant
X2 : dose de charbon
X3 : Le pH de milieu
Pour la modélisation et optimisation de ces paramètres, le plan Box-
Behnken à 3 facteurs a été choisi.