I- Temps de réponse :
1- Un ballon est équipé d'instruments de mesure de la température et de l'altitude
et dispose d'un équipement radio qui peut transmettre les lectures de sortie de ces
instruments au sol. Le ballon est initialement ancré au sol avec les lectures de
sortie de l'instrument en état stable. L'instrument de mesure d'altitude est
approximativement d'ordre zéro et le transducteur de température d'ordre premier
avec une constante de temps de 15 secondes. La température au sol, T0, est de
10°C et la température Tx à une altitude de x mètres est donnée par la relation :
Tx = T0 – 0.01x
(a) Si le ballon est lâché à l'instant zéro, puis s'élève à une vitesse de 5
mètres/seconde, tracez un tableau indiquant les mesures de température et
d'altitude rapportées à des intervalles de 10 secondes au cours des 50 premières
secondes de déplacement. Indiquez également dans le tableau l'erreur dans chaque
relevé de température.
(b) Quelle température rapporte le ballon à une altitude de 5 000 mètres ?
Solution
Le capteur de température est de premier ordre :
𝑑𝑠
𝐴 + 𝐵𝑠 = 𝑚
𝑑𝑡
On peut tirer le mesurande reçu (mr) du signal s par la courbe d’étalonnage :
s = (1/B) mr, ou B s = mr
𝑑𝑠 𝑑(𝑚𝑟/𝐵 )
𝐴 + 𝐵𝑠 = 𝑚 = 𝐴 + 𝑚𝑟 = 𝑚
𝑑𝑡 𝑑𝑡
𝑑(𝑚𝑟/𝐵 ) 𝐴 𝑑𝑚𝑟
𝐴 + 𝑚𝑟 = 𝑚 = + 𝑚𝑟 = 𝑚
𝑑𝑡 𝐵 𝑑𝑡
A/B a la dimension de temps : A/B =constante du temps
𝑑𝑚𝑟
𝜏 + 𝑚𝑟 = 𝑚
𝑑𝑡
On peut considérer m= Tx comme excitation et mr = Tr comme réponse.
𝑑𝑇𝑟
𝜏 + 𝑇𝑟 = 𝑇𝑥 = 10 − 0.01 𝑥
𝑑𝑡
x=5t
𝑑𝑇𝑟
𝜏 + 𝑇𝑟 = 10 − 0.05 𝑡
𝑑𝑡
= 15 s
𝑑𝑇𝑟
15 + 𝑇𝑟 = 10 − 0.05 𝑡
𝑑𝑡
La solution étant :
Tr(t) = 10.75 – 0.05 t – 0.75 e-t/15
a)
t (s) Altitude Température réelle Température reçue Erreur
(m) Tx(°C) Tr(°C)
0 0 10 10 0
10 50 9.5 9.86 0.36
20 100 9 9.55 0.55
30 150 8.5 9.15 0.65
40 200 8 8.7 0.7
50 250 7.5 8.22 0.72
b)
Pour x = 5000 m t = 1000 s
Tr (1000 s) = 10.75 – 0.05 *1000 – 0.075 e-1000 / 15
Tr(1000 s) = -39.25 °C
Tx(1000 s) = - 40 °C
Erreur = 0.75
II- Analyse statistique des mesures
Valeurs moyennes et médianes :
La valeur moyenne d'un ensemble de mesures d'une quantité constante peut être
exprimée comme la valeur moyenne ou la valeur médiane. Comme le nombre de
mesures augmente, la différence entre la valeur moyenne et les valeurs médianes
devient très faible. Or, pour tout ensemble de n mesures x1, x2 …, xn d'une
grandeur constante, la valeur vraie la plus probable est la moyenne donnée par :
𝒙 𝒙𝟏 +𝒙𝟐+⋯+𝒙𝒏
𝒎𝒐𝒚= =𝝁
𝒏
La médiane est une approximation de la moyenne qui peut être écrite sans avoir
à additionner les mesures. La médiane est la valeur médiane lorsque les mesures
de l'ensemble de données sont écrites par ordre de grandeur croissant. Pour un
ensemble de n mesures x1, x2 …, xn d'une grandeur constante, notées par ordre
de grandeur croissant, la valeur médiane est donnée par :
xmediane = x(n+1)/2 (n impair)
Ainsi, pour un ensemble de 9 mesures x1, x2 …, x9 rangées par ordre de grandeur,
la valeur médiane est x5. Pour un nombre pair de mesures, la valeur médiane pour
10 mesures (par exemple) x1, x2 …, x10, la valeur médiane est donnée par :
(x5 + x6) /2 : (xn/2 + x(n/2+1))/2 (n pair)
Exemple :
Supposons que la longueur d'une barre d'acier soit mesurée par un
certain nombre d'observateurs différents et que l'ensemble suivant de
11 mesures soit enregistré (unités mm). Nous appellerons cela ensemble
de mesure « A ».
398 420 394 416 404 408 400
420 396 413 430
Moyenne = 409,0 et Médiane = 408.
Supposons maintenant que les mesures soient refaites en utilisant une
meilleure règle de mesure, et avec plus d'attention des observateurs,
pour produire l'ensemble de mesures B suivant :
409 406 402 407 405 404 407
404 407 407 408
Pour ces mesures, moyenne = 406,0 et médiane = 407.
Dans lequel des deux ensembles de mesures A et B, et les valeurs moyennes et
médianes correspondantes, devrions-nous avoir le plus confiance ? Intuitivement,
on peut considérer le jeu de mesures B comme plus fiable puisque les mesures
sont beaucoup plus rapprochées.
Dans l'ensemble A, l'écart entre la plus petite (396) et la plus grande (430) valeur
est de 34, tandis que dans l'ensemble B, l'écart n'est que de 6.
Ainsi, plus la dispersion des mesures est faible, plus nous avons confiance dans
la valeur moyenne ou médiane calculée.
Voyons maintenant ce qui se passe si nous augmentons le nombre de mesures en
étendant le jeu de mesures B à 23 mesures. Nous appellerons cet ensemble de
mesures C.
409 406 402 407 405 404 407 404 407 407 408 406 410 406 405 408
406 409 406 405 409 406 407.
Maintenant, moyenne = 406.5 et médiane = 406.
Cela confirme notre affirmation précédente selon laquelle la valeur médiane tend
vers la valeur moyenne à mesure que le nombre de mesures augmente.
Écart-type et variance
Exprimer la dispersion des mesures simplement comme la plage entre la valeur la
plus grande et la plus petite n'est en fait pas une très bonne façon d'examiner
comment les valeurs de mesure sont réparties autour de la valeur moyenne. Une
bien meilleure façon d'exprimer la distribution consiste à calculer la variance ou
l'écart type des mesures.
Le point de départ pour le calcul de ces paramètres est de calculer l'écart (erreur)
di de chaque mesure xi par rapport à la valeur moyenne xmoyen :
di = xi - xmoyen
La variance (V) est alors donnée par :
𝒅𝟐𝟏 + 𝒅𝟐𝟐 + ⋯ + 𝒅𝟐𝒏
𝑽=
𝒏−𝟏
L'écart type est simplement la racine carrée de la variance. Ainsi :
𝒅𝟐𝟏 + 𝒅𝟐𝟐 + ⋯ + 𝒅𝟐𝒏
𝝈 = √𝑽 = √
𝒏−𝟏
Calculez et V pour les ensembles de mesures A, B et C ci-dessus.
Solution :
« A » : Moyenne = 409
Mesure 398 420 394 416 404 408 400 420 396 413 430
Écart par -11 +11 -15 +7 -5 -1 -9 +11 -13 +4 +21
rapport à la
moyenne
(déviations)2 121 121 225 49 25 1 81 121 169 16 441
(déviations)2 = 1370,
n = nombre de mesures = 11.
Variance :
(𝒅𝒆𝒗𝒊𝒂𝒕𝒊𝒐𝒏𝒔)𝟐 𝟏𝟑𝟕𝟎
𝑽= = = 𝟏𝟑𝟕
𝒏−𝟏 𝟏𝟎
Ecart type :
𝝈 = √𝑽 = √𝟏𝟑𝟕 = 𝟏𝟏. 𝟕
« B » : Moyenne = 406
Mesure 409 406 402 407 405 404 407 404 407 407 408
Écart par +3 0 -4 +1 -1 -2 +1 -2 +1 +1 +2
rapport à la
moyenne
(déviations)2 9 0 16 1 1 4 1 4 1 1 4
V = 4.2 = 2.05
« C » : Moyenne = 406.5
Mesure 409 406 402 407 405 404 407 404
Écart par +2.5 -0.5 -4.5 +0.5 -1.5 -2.5 +0.5 -2.4
rapport à la
moyenne
(déviations)2 6.25 0.25 20.25 0.25 2.25 6.25 0.25 6.25
Mesure 407 407 408 406 410 406 405 408
Écart par +0.5 +0.5 +1.5 -0.5 +3.5 -0.5 -1.5 +1.5
rapport à la
moyenne
(déviations)2 0.25 0.25 2.25 0.25 12.25 0.25 2.25 2.25
Mesure 406 409 406 405 409 406 407
Écart par -0.5 +2.5 -0.5 -1.5 +2.5 -0.5 +0.5
rapport à la
moyenne
(déviations)2 0.25 6.25 0.25 2.25 6.25 0.25 0.25
V = 3.53 = 1.88
A noter que les plus petites valeurs de V et pour l'ensemble de mesures « B »
par rapport à « A » correspondent à la taille respective de l'écart dans la plage
entre les valeurs maximales et minimales pour les deux ensembles.
Ainsi, à mesure que V et diminuent pour un ensemble de mesures, nous
sommes en mesure d'exprimer une plus grande confiance dans le fait que la
valeur moyenne ou médiane calculée est proche de la vraie valeur, c'est-à-
dire que le processus de calcul de la moyenne a réduit la valeur d'erreur
aléatoire proche de zéro.
En comparant V et pour les ensembles de mesures « B » et « C », V et
diminuent à mesure que le nombre de mesures augmente, confirmant que
la confiance dans la valeur moyenne augmente à mesure que le nombre de
mesures augmente.
Techniques d'analyse graphique des données – fréquence distributions
Les techniques graphiques sont un moyen très utile d'analyser la manière dont les
erreurs de mesure aléatoires sont réparties. La manière la plus simple de procéder
consiste à dessiner un histogramme, dans lequel des bandes de largeur égale sur
la plage de valeurs de mesure sont définies et le nombre de mesures dans chaque
bande est compté. La figure 1 montre un histogramme pour l'ensemble C des
données de mesure de longueur données, dans lequel les bandes choisies ont une
largeur de 2 mm. Par exemple, il y a 11 mesures dans la plage entre 405.5 et 407.5
et donc la hauteur de l'histogramme pour cette plage est de 11 unités. De plus, il
y a 5 mesures dans la plage de 407.5 à 409.5 et donc la hauteur de l'histogramme
sur cette plage est de 5 unités. Le reste de l'histogramme est complété de la même
manière. Un tel histogramme a la forme caractéristique montrée par des données
vraiment aléatoires, avec une symétrie autour de la valeur moyenne des mesures.
Comme c'est la valeur réelle de l'erreur de mesure qui est généralement la plus
préoccupante, il est souvent plus utile de tracer un histogramme des écarts des
mesures par rapport à la valeur moyenne plutôt que de tracer un histogramme des
mesures elles-mêmes.
Le point de départ pour cela est de calculer l'écart de chaque mesure par rapport à
la valeur moyenne calculée. Ensuite, un histogramme des déviations peut être
tracé en définissant des bandes de déviation de largeur égale et en comptant le
nombre de valeurs de déviation dans chaque bande. Cet histogramme a
exactement la même forme que l'histogramme des mesures brutes sauf que
l'échelle de l'axe horizontal doit être redéfinie en fonction des valeurs d'écart (ces
unités sont indiquées entre parenthèses sur graphique : figure 1).
Nombre de mesures
11
1
0
401.5 403.5 405.5 407.5 409.5 411.5 Mesures
(-5) (-3) (-1) (+1) (+3) Déviations
(+5)
Figure 1 : Histogramme des mesures et déviations.
Explorons maintenant ce qu'il advient de l'histogramme des déviations lorsque le
nombre de mesures augmente. Au fur et à mesure que le nombre de mesures
augmente, des bandes plus petites peuvent être définies pour l'histogramme, qui
conserve sa forme de base mais se compose alors d'un plus grand nombre d'étapes
plus petites de chaque côté du pic. A la limite, lorsque le nombre de mesures tend
vers l'infini, l'histogramme devient une courbe lisse appelée courbe de distribution
de fréquence comme le montre la figure 2. L'ordonnée de cette courbe est la
fréquence d'apparition de chaque valeur d'écart, F(D), et l'abscisse est l'amplitude
de l'écart, D.
F(D)
D0 Dp D1 D2 D
Figure 2
La symétrie des figures 1 et 2 autour de la valeur d'écart zéro est très utile pour
montrer graphiquement que les données de mesure ne comportent que des erreurs
aléatoires. Bien que ces chiffres ne puissent pas être facilement utilisés pour
quantifier l'ampleur et la distribution des erreurs, des techniques graphiques très
similaires y parviennent. Si la hauteur de la courbe de distribution de fréquence
est normalisée de telle sorte que l'aire en dessous est égale à l'unité, alors la courbe
sous cette forme est connue sous le nom de courbe de probabilité, et la hauteur
F(D) à toute amplitude de déviation particulière D est connue sous le nom de
fonction de densité probabilité (f.d.p).
La condition selon laquelle l'aire sous la courbe est l'unité peut être exprimée
mathématiquement comme suit :
+∞
∫−∞ 𝐹(𝐷) 𝑑𝐷 = 1 (1)
La probabilité que l'erreur d'une mesure particulière se situe entre deux niveaux
D1 et D2 peut être calculée en mesurant l'aire sous la courbe contenue entre deux
lignes verticales passant par D1 et D2, comme indiqué par la zone hachurée de
droite sur la figure 2. Cela peut être exprimé mathématiquement comme suit :
𝐷
𝑃 (𝐷1 ≤ 𝐷 ≤ 𝐷2 ) = ∫𝐷 2 𝐹(𝐷) 𝑑𝐷 (2)
1
La fonction de distribution cumulative (f. d. c.) est particulièrement importante
pour évaluer l'erreur maximale probable dans une mesure. Celle-ci est définie
comme la probabilité d'observer une valeur inférieure ou égale à D 0, et s'exprime
mathématiquement par :
0 𝐷
𝑃 (𝐷 ≤ 𝐷0 ) = ∫−∞ 𝐹(𝐷) 𝑑𝐷 (3)
Ainsi, la (f. d. c) est l'aire sous la courbe à gauche d'une ligne verticale passant par
D0, comme indiqué par la zone hachurée de gauche sur la figure 2.
L'amplitude de déviation Dp correspondant au pic de la courbe de distribution de
fréquence (Figure 2) est la valeur de déviation qui a la plus grande probabilité. Si
les erreurs sont de nature entièrement aléatoire, alors la valeur de D p sera égale à
zéro. Toute valeur non nulle de Dp indique des erreurs systématiques dans les
données, sous la forme d'un biais souvent éliminable par recalibrage.
Distribution gaussienne
Les ensembles de mesures qui ne contiennent que des erreurs aléatoires se
conforment généralement à une distribution avec une forme particulière appelée
gaussienne, bien que cette conformité doive toujours être testée. La forme d'une
courbe gaussienne est telle que la fréquence des petits écarts par rapport à la valeur
moyenne est bien supérieure à la fréquence des grands écarts. Cela coïncide avec
l'attente habituelle dans les mesures sujettes à des erreurs aléatoires selon laquelle
le nombre de mesures avec une petite erreur est beaucoup plus grand que le
nombre de mesures avec une grande erreur. Les noms alternatifs pour la
distribution gaussienne sont la distribution normale ou la distribution en forme de
cloche.
Une courbe gaussienne est formellement définie comme une distribution de
fréquence normalisée qui est symétrique par rapport à la ligne d'erreur nulle et
dans laquelle la fréquence et l'amplitude des quantités sont liées par l'expression :
1 2 /2𝜎2 ]
𝐹 (𝑥 ) = 𝑒 [−(𝑥−𝜇) (4)
𝜎 √2𝜋
où est la valeur moyenne de l'ensemble de données x et les autres quantités sont
telles que définies précédemment.
L'équation (4) est particulièrement utile pour analyser un ensemble gaussien de
mesures et prédire combien de mesures se situent dans une plage définie
particulière. Si les écarts de mesure D sont calculés pour toutes les mesures telles
que D = x- , alors la courbe de fréquence d'écart F(D) tracée en fonction de
l'amplitude d'écart D est une courbe gaussienne connue sous le nom de courbe de
distribution de fréquence d'erreur. La relation mathématique entre F(D) et D peut
alors être dérivée en modifiant l'équation pour donner :
1 2 /2𝜎2 ]
𝐹 (𝐷 ) = 𝑒 [−𝐷 (5)
𝜎 √2𝜋
La forme d'une courbe gaussienne est fortement influencée par la valeur de , la
largeur de la courbe diminuant à mesure qu'elle devient plus petite. Comme un
plus petit correspond aux écarts typiques des mesures par rapport à la valeur
moyenne qui deviennent plus petits, cela confirme l'observation précédente selon
laquelle la valeur moyenne d'un ensemble de mesures se rapproche de la valeur
réelle à mesure que diminue.
Si l'écart type est utilisé comme unité d'erreur, la courbe gaussienne peut être
utilisée pour déterminer la probabilité que l'écart d'une mesure particulière dans
un ensemble de données gaussiennes soit supérieur à une certaine valeur. En
remplaçant l'expression de F(D) dans l'équation de probabilité, la probabilité que
l'erreur se situe dans une bande entre les niveaux d'erreur D 1 et D2 peut être
exprimée comme suit :
𝐷 1 2 /2𝜎2 ]
𝑃 (𝐷1 ≤ 𝐷 ≤ 𝐷2 ) = ∫𝐷 2 𝑒 [−𝐷 𝑑𝐷 (6)
1 𝜎√2𝜋
La solution de cette expression est simplifiée par la substitution :
z = D/
Ceci a pour effet de changer la courbe de distribution des erreurs en une nouvelle
distribution gaussienne qui a un écart type ( = 1) et une moyenne de zéro. Cette
nouvelle forme, illustrée à la figure 3, est connue sous le nom de courbe
gaussienne standard, et la variable dépendante est maintenant z au lieu de D.
L'équation (6) peut maintenant être réexprimée comme suit :
𝑧 1 2 /2]
𝑃 (𝐷1 ≤ 𝐷 ≤ 𝐷2 ) = 𝑃 (𝑧1 ≤ 𝑧 ≤ 𝑧2) = ∫𝑧 2 𝑒 [−𝑧 𝑑𝑧 (7)
1 √2𝜋
Malheureusement, ni l'équation (6) ni (7) ne peuvent être résolues analytiquement
à l'aide de tables d'intégrales standard, et l'intégration numérique fournit la seule
méthode de résolution.
Cependant, en pratique, l'ennui de l'intégration numérique peut être évité lors de
l'analyse des données car la forme standard de l'équation (7), et son indépendance
par rapport aux valeurs particulières de la moyenne et de l'écart type des données,
signifie que les tables gaussiennes standard qui tabulent F(z) pour différentes
valeurs de z peut être utilisé.
F(z)
0 z
Figure 3
Tables gaussiennes standard
Une table gaussienne standard, telle que celle présentée dans le tableau 3.1, tabule
F z pour différentes valeurs de z, où F(z) est donné par :
𝑧 1 2 /2]
𝛷(𝑧) = ∫ 𝑒 [−𝑧 𝑑𝑧
−∞ √2𝜋
Ainsi, (z) donne la proportion de valeurs de données inférieures ou égales à z.
Cette proportion est l'aire sous la courbe de F(z) qui est à gauche de z. Par
conséquent, l'expression donnée en doit être évaluée comme [(z2) - (z1)].
L'étude du tableau montre que (z) = 0.5 pour z = 0. Ceci confirme que, comme
prévu, le nombre de valeurs de données 0 représente 50 % du total. Cela doit être
le cas si les données n'ont qu'un nombre aléatoire des erreurs. On observera
également que le tableau 3.1, comme la plupart des tableaux gaussiens standard
publiés, ne donne (z) que pour des valeurs positives de z. Pour les valeurs
négatives de z, nous pouvons utiliser la relation suivante car la courbe de
distribution de fréquence est normalisée :
(-z) =1-(z)
((-z) est l'aire sous la courbe à gauche de (-z), c'est-à-dire qu'elle représente la
proportion de valeurs de données < -z).
Exemple 1
Une puce de circuit intégré contient 105 transistors. Les transistors ont
un gain de courant moyen de 20 et un écart type de 2. Calculez ce qui
suit :
(a) le nombre de transistors avec un gain en courant compris entre 19.8
et 20.2
(b) le nombre de transistors avec un gain en courant supérieur à 17.
Solution
(a) La proportion de transistors où 19.8 < gain < 20.2 est :
P[X < 20] - P[X < 19.8] = P[D < 0.2] - P[D < - 0.2] pour z = (X-) /
Pour X = 20.2 ; z = 0.1 et pour X = 19.8 ; z = 0.1
D'après les tableaux, P[z < 0,1] = 0.5398
et donc P[z < -0,1] = 1 - P[z < 0,1] = 1 – 0.5398 = 0.4602
Ainsi, P[z < 0,1] - P[z < -0,1] = 0.5398 – 0.4602 = 0.0796
Ainsi, les transistors 0,0796 * 105 = 7960 ont un gain en courant
compris entre 19.8 et 20.2.
(b) Le nombre de transistors avec gain >17 est donné par :
P[x > 17] = 1- P[x < 17] = 1 - P[z < -1.5] = P[z < +1.5] = 0.9332
Ainsi, 93,32%, soit 93320 transistors ont un gain >17.
Exemple 2
L'épaisseur d'un ensemble de joints varie en raison de perturbations de
fabrication aléatoires : les valeurs d'épaisseur appartiennent à une
distribution gaussienne.
Si l'épaisseur moyenne est de 3 mm et l'écart type est de 0.25, calculer
le pourcentage de joints d'épaisseur supérieure à 2.5 mm ?