CHAPITRE II : CALCUL DES GRANDEURS STATISTIQUES
III.1 Présentation d’un résultat expérimental :
L’écriture d’une mesure d’une grandeur physique x est :
𝑉𝑎𝑙𝑒𝑢𝑟 𝑚𝑒𝑠𝑢𝑟é𝑒 𝑋 = 𝑋̅ ± ∆𝑥
Avec :
𝑋̅ : La meilleure estimation de la valeur vraie 𝑋
∆𝑥 : L’incertitude-type sur la mesure (incertitude absolue).
En l’absence d’erreurs systématiques, la valeur vraie de 𝑥 se trouve proche de l’intervalle
𝑋̅ + ∆𝑥 et 𝑋̅ − ∆𝑥
III.2 Moyenne et Médiane :
Pour réaliser des calculs statistiques, une valeur moyenne doit être disponible. On appelle cela
une valeur centrale. Sa valeur est égale au total de toutes les mesures divisées au nombre de
mesures :
∑ 𝑥𝑖
𝑋̅ = (III.1)
𝑛
Pour cela on effectue plusieurs mesures n, dont la plupart vont être proche de la moyenne.
Le terme médiane désigne la valeur moyenne ("midlle value") d'un lot de données classées par
ordre numérique. Si le nombre de mesures est faible, la moyenne et la médiane diffèrent. Quand
le nombre de résultats est impair, la médiane peut être évaluée directement. Par contre, pour un
nombre de mesures pair, il s'agit de la moyenne de la paire centrale. Cette fonction intervient
lorsque l'ensemble des données contient un "oubli" (" résultat sensiblement différent des autres
"), affectant fortement la valeur moyenne et non la médiane
.Exemple : la détermination de la teneur en plomb par absorption atomique d'un échantillon
d'eau potable fournit les résultats suivants, exprimés en ppm :
19.4 19.5 19.6 19.8 20.1 20.3
Calcul de la moyenne :
19.4 + 19.5 + 19.6 + 19.8 + 20.1 + 20.3
𝑋̅ = = 19.8 𝑝𝑝𝑚
6
Calcul de la médiane :
19.6 + 19.8
𝑚𝑒𝑑𝑖𝑎𝑛𝑒 = 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 𝑑𝑒 𝑙𝑎 𝑝𝑎𝑖𝑟𝑒 𝑐𝑒𝑛𝑡𝑟𝑎𝑙𝑒 = = 19.7 𝑝𝑝𝑚
2
Page | 1
III. 3 Ecart type (déviation standard) :
L'écart type s décrit la propagation des mesures individuelles. C'est une mesure utile qui utilise
toute les valeurs et décrit la précision.
∑(𝑥𝑖 −𝑋̅ )2
𝑠=√ (III.2)
𝑛−1
Exemple : Calculer l’écart type dans l’exemple précédent :
𝑥𝑖 𝑥𝑖 − 𝑋̅ (𝑥𝑖
− 𝑋̅)2
19.4 -0.4 0.16
19.5 -0.3 0.09
19.6 -0.2 0.04
19.8 0.0 0.00
20.1 0.3 0.09
20.3 0.5 0.25
total 118.7 -0.1 0.63
∑ 𝑥𝑖 118.7
𝑋̅ = = = 19.8 𝑚𝑙
𝑛 6
∑(𝑥𝑖 − 𝑋̅)2 0.63
𝑠=√ =√ = 0.35 𝑚𝑙
𝑛−1 5
En pratique, il est inhabituel de faire ces calculs sur papier, alors que les calculatrices et Excel
peuvent en proportionner le résultat en introduisant les valeurs des 𝑥𝑖 .
III. 4 La Variance :
Quantité statistique importante pour caractériser la dispersion d'erreurs, c'est le carré s2.
VAR= s2 (III.3)
Exemple : calculer la variance de l’exercice précédent
s=0.35 ; s2=0.123
III. 5 Coefficient de Variation (déviation standard relative) :
Le coefficient de variation CV exprimé en unité pourcentage.
100×𝑠
𝑅𝑆𝐷 = 𝐶𝑉 = (III.4)
𝑋̅
Page | 2
Exemple :
Calculer le coefficient de variation de l’exercice précédent ?
Solution :
100 × 𝑠 100 × 0.35
𝐶𝑉 = = = 1.77%
𝑋̅ 19.8
III. 6 La distribution des mesures et résultats :
Un échantillon est généralement prélevé et reproduit dans le cadre d'une analyse quantitative.
Ils présentent des résultats expérimentaux dispersés autour d'une valeur centrale. La
représentation d'un résultat en tant que moyenne est insuffisante, du fait qu'elle omet d'indiquer
l'incertitude de la mesure. Les informations pertinentes relatives à l'incertitude de mesure sont
complétées par le calcul de l'écart type et de l'écart de mesure.
III. 6.1 La distribution Gaussienne :
Parmi les lois de probabilité théoriques, la loi normale (gaussienne) s'avère la plus connue et la
plus utile, car elle récapitule un grand nombre de distributions statistiques observées. Dans sa
représentation graphique symétrique et continue, elle revêt une allure de cloche très simple
(courbe gaussienne), comme le montre la figure III.1.
Figure III.1 : courbe de densité de probabilité de gauss.
Lorsque la distribution est normale, 95 % des valeurs de la population sont comprises dans une
marge de ± 2 écarts-types par rapport à la moyenne (ou plus précisément 1,96 écart-type). Elle
est le plus souvent utilisée pour les intervalles de confiance bilatéraux. Aussi, 68% des valeurs
de la population se situent entre ± 1 écart type autour de la moyenne, et à 99.7% les valeurs se
retrouvent à ± 3 écarts types autour de la moyenne (figure III.2).
Page | 3
Figure III.2 : Distribution normales à différents écarts types.
Le modèle mathématique est décrit par la formule suivante :
1 −(𝑥−𝜇)2
𝑓(𝑥) = 𝜎√2𝜋 𝑒𝑥𝑝 { } (III.5)
2𝜎2
Avec : μ valeur vrai et σ déviation standard à n et non pas n-1.
La proportion exacte des valeurs de f(z) comprises dans un intervalle est déterminée à l'aide du
tableau A.1 de l'annexe dans le cas d'une distribution normale dont la moyenne μ et l'écart type
σ sont connus. F(z) correspond à la fonction de distribution accumulative normale standard. La
formule suivante permet de déterminer ces valeurs z standardisées (variable normale
standardisée) :
(𝑥−𝜇)
𝑍= (III.6)
𝜎
Exemple : Pour déterminer le pourcentage des comprimés contenant moins de 243 d’aspirine
à σ =5 et μ=250, en calculant z correspondant à cet intervalle.
(𝑥 − 𝜇) (243 − 250)
𝑍= = = −1.4
𝜎 5
Selon le tableau A.1 le pourcentage est 8.08%
III. 6.2 La distribution log-normal :
Ce type de distribution est utilisé lorsqu'une mesure est effectuée pour chaque série
d'échantillons. La fréquence y est représentée par rapport au logarithme de la concentration.
Dans le sérum sanguin humain, la concentration d'anticorps a une distribution log-normale. En
outre, le graphique représentant la fréquence en fonction de la concentration est asymétrique
Page | 4
(figure III.3). Par ailleurs, les dimensions des gouttelettes formées par pulvérisation en
spectroscopie de flamme suivent une distribution log-normal.
.
Figure III.3 : Différents types de distributions.
III. 7 Intervalle de confiance :
Les limites de confiance correspondent à l'intervalle à l'intérieur duquel on peut
raisonnablement supposer que la vraie valeur se situe. Les valeurs extrêmes de cet intervalle
sont appelées limites de confiance. Le terme de confiance renvoie donc ici à la possibilité
d'affirmer, avec une certaine certitude et une certaine probabilité, l'intervalle de confiance
comme contenant la vraie valeur. Pratiquement, on connaît la moyenne ; dans une distribution
normale, on cherche l'intervalle de la vraie valeur μ, avec 95 % des moyennes situées dans
l'intervalle : x
𝜎 𝜎
𝑋̅ − 1.96 ( ) < 𝜇 < 𝑋̅ − 1.96 ( )
√𝑛 √𝑛
III. 7.1 Limites de confiance (LC) de la moyenne pour les petits échantillons :
Quand n˂30 et n est généralement inférieur ou égal à 5 et supérieur à 3 :
𝑠
𝐿𝐶 = 𝑋̅ ± [𝑡𝑛−1 ] (III.7)
√𝑛
Le calcul des incertitudes s’effectue pout un niveau de confiance NC à 95% bilatéral (2T).
υ = n-1 : correspond au degré de liberté : nombre des résultats indépendants qui entrent dans
le calcul de la déviation standard.
La valeur de tn-1 dépend essentiellement du degré de liberté et du niveau de confiance. Elle est
lue dans le tableau A.2 de t Student. Pour des valeurs grandes de n, les valeurs de tn-1 pour des
niveaux de confiance 95% et 99% sont proches respectivement aux valeurs 1.96 et 2.58.
Page | 5
Exemple 1 : La détermination du contenu en ion de Sodium dans un échantillon d’urine avec
une électrode sélective d’ions proportionne les résultats suivants(en mM) :
102 97 99 98 101 106
Quelles sont les limites de confiance de la concentration de l’ion sodium à 99% ?
Solution :
La moyenne et l’écart type sont calculés selon les formules (III.1) et (III.2), les valeurs
respectives sont : 100.5 mM et 3.27 mM.
υ =6-1=5
A partir du tableau A.2, la valeur de t599%= 4.03
Les limites de confiance de la moyenne à 99% selon la formule (III.7) :
3.27
𝐿𝐶 = 100.5 ± [4.03 ] = 100.5 ± 5.4 𝑚𝑀
√6
Exemple 2 :
En analysant le contenu en alcool dans le sang, le chimiste obtient les résultats suivants en %
C2H5OH :
0.084 0.089 0.079
Calculer l’intervalle de confiance à 95% de niveau de confiance ?
Solution :
∑ 𝑥𝑖 = 0.252
∑(𝑥𝑖 − 𝑋̅)2 = 0.007056 + 0.007921 + 0.006241 = 0.021218
0.252
𝑋̅ = = 0.084% C2H5OH
4
0.021218
𝑠=√ = 0.005% C2H5OH
3−1
t2 = 4.3 selon le tableau A. 2 à 95%
0.005
𝐿𝐶 = 0.084 ± [4.3 ] = 0.084 ± 0.012% C2H5OH
√3
III. 7.2 Limites de confiance des grands échantillons :
Pour un grand nombre échantillon les limites de confiances
𝑠
𝑋̅ ± [𝑍 ] (III.8)
√𝑛
Page | 6
Z dépend du degré de confiance et est déterminé à partir du tableau suivant :
% confiance Z
50 0.67
68 1.00
80 1.28
90 1.64
95 1.96
99 2.58
99.7 3.00
99.9 3.29
Exemple :
Calculer à 80 et 95 % les limites de confiance de la concentration de glucose de 1108 ml/Kg
chez les patients diabétiques, avec un écart-type de 19 et le nombre de mesures est de 7.
Solution : Selon la formule (III.8)
19
A 80% Z=1.28 1108 ± [1.28 ] = 1108 ± 9.2 𝑚𝑔/𝑚𝐿
√7
19
A 95% Z=1.96 1108 ± [1.96 ] = 1108 ± 14.1 𝑚𝑔/𝑚𝐿
√7
III. 7. 3 D'autres usages de la limite de confiance :
Pour détecter les erreurs systématiques, les intervalles de confiance peuvent être utilisés comme
test, voir l'exemple suivant :
Exemple :
L'étalonnage de l'absorbance d'un spectromètre à une longueur d'onde spécifique est vérifié à
l'aide d'une solution étalon dont l'absorbance est de 0,470. Les résultats de dix mesures
d'absorbance sont les suivants : 𝑋̅ =0.461 s=0.003.
Trouvez l'intervalle de confiance à 95% de la moyenne et décidez s'il y a erreur systématique ?
Solution :
à 95% : t9=2.26
0.003
0.461 ± [2.26 ] = 0.461 ± 0.002
√10
L’intervalle de confiance n'inclue pas l'absorbance connue 0.470
Donc il y a une erreur systématique
Page | 7
III. 8 Distribution des mesures répétées (Histogramme) :
Alors que l'écart-type représente la mesure de la répartition d'un ensemble de résultats autour
d'une valeur moyenne, cela n'indique pas le modèle de la distribution. Celle-ci peut être
représentée en termes de fréquences d'apparition pour des valeurs individuelles par rapport aux
valeurs elles-mêmes ; ces points sont appelés "probabilités de distribution".
Exemple :
Le tableau suivant présente les résultats de 25 déterminations de la concentration de l'ion nitrate
dans un échantillon d'eau en μg/ml :
0.50 0.51 0.51 0.53 0.51
0.48 0.51 0.52 0.51 0.49
0.49 0.49 0.48 0.46 0.49
0.48 0.51 0.53 0.51 0.50
0.53 0.51 0.50 0.50 0.52
Ces résultats se résument dans un tableau de fréquence (Nombre de répétitions de chaque
valeur) :
Concentration Fréquence
μg/mL
0.46 1
0.48 3
0.49 4
0.50 4
0.51 8
0.52 2
0.53 3
La distribution de ces résultats est mieux appréciée en faisant un histogramme
Page | 8
Ou sous forme de diagramme circulaire
Dr. AIT TAYEB M. A
Page | 9