Université Hassan II de Casablanca Faculté des Sciences Ben M’Sik
DEPARTEMENT DE CHIMIE
Masters GME & VARENAP
Module :
Maîtrise Statistique des Procédés (MSP)
=
Contrôle Statistique des Procédés (CSP)
Pr S. BELOUAFA
Année universitaire 2021-2022
1
Présentation introductive
2
La maîtrise statistique
des procédés (MSP) est DISPERSION «REGULIERE»
un ensemble de
techniques ayant pour
objectif d’amener un temps
processus dans un état
stable (sous contrôle)
Processus stable
et de le maintenir dans
cet état.
3
DISPERSION «IRREGULIERE»
Tous les processus • Le processus n’est pas maîtrisé
sont naturellement • Il faut analyser avec MSP
variables et être ???
? ?
sous contrôle n’est ?
?
? ?
?
?
pas un état naturel! ? ?? ?? ?
temps
Processus instable
4
Variabilité
Entrants Sortants
Processus
Variabilité
5
Diagramme Causes-Effet
Milieu Matière Main d'Oeuvre
circuit d'eau couleur
hygiène
circuit d'air odeur
motivation
température texture
formation
propreté propreté
manutentions stérilisation
entreposage débit
lavage température
décongélation entretien
Méthodes Machines
6
Processus amélioré: moins de variabilité à
l’entrée et au cours de la production => moins de
variabilité à la sortie
Entrants Sortants
Processus
MSP
• Optimiser des paramètres
• Éviter les dérives de processus
• Réduire les coûts de non-qualité
• Améliorer la productivité 7
Techniques de la
MSP :
Analyse des données
Plans d’expériences
…
8
Analyse des données
9
Définition
L’analyse de données (ou le traitement informatique des
données) est une série de processus qui permettent
d’extraire de l’information ou de produire du savoir à partir
de données brutes. Ces processus, une fois programmés,
sont le plus souvent automatisés à l’aide d’ordinateurs.
10
Analyse ?
L’analyse des résultats d’une étude implique la poursuite de trois objectifs :
- Résumer les informations recueillies pour chacune des variables mesurées,
- Découvrir des relations entre certaines de ces variables,
- Généraliser les résultats à la population mère.
11
Analyses possibles
* Suivant le nombre de variables, étudié à la fois, les analyses ne sont pas les mêmes :
Décrire une variable à la fois
Mettre en liaison 2 variables : expliquer
Analyser simultanément plusieurs variables
expliquer
12
Objectifs
– Comprendre les étapes d’une analyse de données.
– Se familiariser avec le logiciel SPSS.
Compétences recherchées
– Comprendre les fondements des méthodes statistiques.
– Savoir interpréter les tables et graphiques issus de ces méthodes.
– Etre capable de mener soi-même une telle étude.
13
Etapes d’une Analyse de données
Encodage
Comment
1e fois quepasser de la matrice
l’on dispose à la base
des données, on de
est données
souvent klk
peu démuni. Comment faire face à cette masse de
variables et de données ? Il faudra disposer d’1 logiciel
Etape nécessaire pour la recherched’an. de données
rapide des erreurs et valeurs aberrantes
Permet de tirer 1 maximum d’information de données par des analyses
descriptives simple
Permet de répondre aux questions posées dans l’étude tout en utilisant des
outils statistiques
Sous forme de textes, tableaux ou de graphiques
Cette écriture sera guidée par les hypothèses de départ
14
Objectifs de l'étude
La première phase consiste à rédiger clairement les objectifs de l'étude en les
décomposant en "domaines d'interrogation".
15
Etapes d’un traitement informatique de données
16
• N variables
• P réponses
L’ «espace d’observation» comme résultats du produit
cartésien entre ces deux ensembles d’éléments :
La matrice
Créer un fichier de données.
Pour cela, il faut élaborer et utiliser un plan de codage
17
Exemple de Tableau de codage
Variable Etiquette de la Etiquette de la Valeur
Variable
id Numéro d’identification
ph pH 1=acide
2=neutre
3=basique
phase 1=solide
2=liquide
3=gaz
V Volume
18
Etapes d’un traitement informatique de données
19
Mise en forme des données et validations de base
Rassembler les données en un fichier rectangulaire et mise en forme du fichier
• Choisir une structure de fichier en accord avec l’analyse qui sera faite.
• Unifier les noms des variables, le codage des variables catégorielles, les unités…
• Choisir des noms explicites pour les variables (8 lettres ou chiffres sans accents)
• Mettre des labels explicites pour les étiquettes de variables (si pas trop longs)
• Coder les valeurs manquantes (blanc, NA, -9999…).
Validations de base
Recherche rapide des erreurs et valeurs aberrantes (intervalle acceptable, relations logiques
entre variables…). Action appropriée dans le fichier mais ne pas “jeter” d’information.
Transformer éventuellement des variables
Outils conseillés
• Excel pour les petits tableaux (manipulations manuelles)
• SPSS pour les grands tableaux et/ou les tâches répétitives et/ou complexes.
Cette étape peut prendre les ¾ du temps de l’étude.
20
Transformation de variables
• Modifier la structure (la forme) d’une variable (recodage) :
modifier la manière dont la variable a été initialement codée pour
satisfaire aux exigences de certaines analyses.
Vous pouvez modifier les valeurs de données en les recodant .
Exemple : fusionner des rendements dans des catégories d’intervalles de
rendement.
• Créer une nouvelle variable : création d’une nouvelle variable
à l’aide d’opérations arithmétiques et/ou d’opérations logiques
sur une ou plusieurs variable(s) d’origine :
Calculer les valeurs d’une variable en fonction des transformations numériques
d’autres variables.
21
Exemple 1 : restreindre l’échelle de pH
a) Passage de 4 modalités à 2 :
Ancienne variable
Très acide faiblement Faiblement Très
Acide basique basique
pH 1 2 3 4
Nouvelle variable
Acide basique
1 2
22
Exemple 2 : l’indice de masse corporelle (IMC)
L’«Indice de masse corporelle» s’obtient en divisant le poids d’un
individu (exprimé en kg) par le carré de sa taille (en mètres).
A partir des variables "Poids" et "Taille" figurant dans un fichier,
on peut donc créer la nouvelle variable "Masse corporelle" :
poids/taille2
23
Exemple 3 : croisement T - pH
Connaissant la T et le pH d’un groupe de réacteurs, on peut créer
une variable composite en définissant 4 modalités :
T = 90°C T = 100°C
pH = 9 1 3
pH = 10 2 4
1 : T de 90°C, pH = 9
2 : T de 90°C, pH = 10
3 : T de 100°C, pH = 9
4 : T de 100°C, pH = 10
24
Etapes d’un traitement informatique de données
25
Analyse exploratoire des données
Objectif
Tirer un maximum d’informations des données par des analyses
descriptives simples. Etudier les distributions des variables et les
relations entre elles.
Méthodes
• Pour chaque variable, dessiner la distribution (histogramme ou
diagramme en barres), la résumer par quelques indices (min,
max, moyenne, médiane, tableau de fréquence),
• Pour chaque couple de variables étudier la relation qui les lie
(graphe X-Y ou table de contingence),
• Quand le nombre de variables est grand, utiliser des techniques
d’analyse de données (composantes principales, …).
26
Les mesures d’association: Quel intérêt ?
Explorer les liens entre les variables analysées (sont
elles liées? )
Expliquer une variable par une autre
Faciliter la prise de décision
27
Relation entre deux variables
Description des caractéristiques d’un ensemble d’observations
à partir de deux variables : étude de la relation entre variables
(statistique bivariée).
• Corrélation (Spermann, Kendall, Pearson)
• Régression linéaire simple
28
Corrélation
La corrélation mesure la relation linéaire entre deux variables.
La corrélation peut prendre des valeurs entre –1 et 1 avec :
• proche de –1 : forte relation négative,
• proche de 0 : pas de relation linéaire,
• proche de 1 : forte relation positive.
29
30
31
Relation entre variables quantitatives
Corrélation de Bravais-Pearson
La corrélation r de Pearson est une mesure d’association
paramétrique pour deux variables aléatoires continues
32
Ex :Relation taille-poids
33
Relation entre variables qualitatives
Deux variables qualitatives de types nominales :
• Tableau croisé (cf. cours d’Excel).
Deux variables qualitatives de types ordinales :
• corrélation de rangs avec les coefficients de corrélation rhô de
Spearman et tau de Kendall.
34
Corrélation rhô de Spearman
Le rhô de Spearman est une mesure d’association non paramétrique
basée sur le rang des valeurs des données.
Il peut être utilisé pour des données qualitatives et pour des valeurs
extrêmes. Pour cela, remplacez les valeurs par des rangs, c’est-à-dire
remplacez xi par Ri et yi par Si
35
Corrélation rhô de Spearman
36
Corrélation tau de Kendall
Le tau de Kendall est une mesure d’association non paramétrique
basée sur le nombre de concordance et de non concordance dans
les pairs d’observations.
La concordance a lieu lorsque les pairs d’observations varient
ensemble et la discordance lorsque les pairs d’observations varient
de manière différente.
On compte combien de segments sont orientés vers le
haut et combien sont orientés vers le bas :
37
Corrélation tau de Kendall :
relation pas de relation
38
Corrélation
Il est primordial de vérifier la linéarité de la relation, car :
• Corrélation linéaire de valeur nulle ne veut pas dire qu’il
n’existe pas de relation entre les variables, [Link].: relation
quadratique.
• La mesure de la corrélation est très sensible aux données
extrêmes. Il est possible d’obtenir une corrélation linéaire
significative même s’il n’y a pas de relation entre les variables.
39
Régression linéaire simple
Permet de mesurer la relation linéaire entre deux variables, tout comme la
corrélation, mais elle donne une direction à la relation : c’est la VI qui
explique, et qui est la cause de la variation de la VD.
Le but de cette mesure est de savoir :
(1) si cette relation est présente
(2) quelle est sa force (quel pourcentage de la variance de la VD, la VI peut
expliquer)
(3) Comment utiliser ce résultat pour pouvoir prédire la VD sur d’autres
sujets pour lesquels on connaît la valeur de la VI.
40
Régression linéaire simple
Equation de la droite de régression :
Y= a + b.X
Y : la variable dépendante (VD)
X : la variable indépendante (VI)
a : ordonnée à l’origine (intercept) de la droite de régression
b : pente (slope) de la droite de régression
41
Régression linéaire simple : R-deux ajusté
R-deux ajusté : pourcentage de variance expliquée par la
variable indépendante.
R-deux ajusté entre 0 et 1
• proche de 1 : la valeur VI prédit presque exactement la valeur
de la VD.
• proche de 0 : la VI n’arrive pas à prédire la VD.
42
Etapes d’un traitement informatique de données
43
Analyse statistique pour répondre à la question
Objectifs
- Répondre aux questions posées dans l’étude.
- Tirer un maximum d’informations supplémentaires des données.
Méthododologie
• Rechercher les méthodes statistiques utiles pour répondre aux questions et qui soient
adaptées aux variables en jeu (quantitative ou qualitative).
• Effectuer les analyses avec si possible plusieurs méthodes (ex. Test param – non-param)
et tester plusieurs variantes des méthodes (transformer les variables, sélection de variables
dans les modèles…).
• Valider les hypothèses et recherche de points influents (normalité…).
• Comparer, recouper les résultats des différentes analyse à l’aide de graphiques et d’indices
statistiques. Tenter de comprendre la source des différences.
L’analyse statistique est un processus itératif
44
Etapes d’un traitement informatique de données
45
Exportation des résultats, préparation du rapport
Types de résultats : textes, tableaux et graphiques
Mode de sauvegarde de résultats :
Dans un traitement de texte (Word), sous forme HTML, sous forme de fichier
texte ou graphique (EPS, GIF…), sous forme de fichier “intelligent” lié au
logiciel qui l’a produit.
Méthode de transfert des résultats du logiciel de traitement de texte :
Via fichiers ou par copier/coller
Recommandations
• Mettre les résultats (tableaux, graphiques) en forme dans le logiciel statistique.
• Documenter rapidement les analyses liées à chaque sortie.
• Attention aux pertes de qualité dans le copier/coller. Utiliser le “copier special”
dans Word.
46
Définition de l’étude
Collecte des données
Analyse et constat
Durée entre 2 mois et 8 mois
oui
Procédé en
anomalie
Recherche des causes avec
les acteurs du processus
Propositions d’actions
correctives
Contrôle de l’efficacité des
actions correctives
47