0% ont trouvé ce document utile (0 vote)

188 vues19 pages

Statistique descriptive continue: calculs et distribution

Ce document décrit la distribution empirique continue et la fonction de densité pour une variable statistique continue à partir de données groupées. Il présente des données sur la masse d'étudiants groupées en classes, calcule les fréquences associées à chaque classe de façon à obtenir une distribution continue, et explique comment fractionner les classes pour cette fin.

Transféré par

Abdessamad Boulhdoub

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

188 vues19 pages

Statistique descriptive continue: calculs et distribution

Transféré par

Abdessamad Boulhdoub

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Marcel Délèze

Edition 2017

§2 Statistique descriptive pour une

variable statistique continue:
distribution empirique continue

Objectifs
Pour chaque notion étudiée (moyenne, médiane, écart-type, ...), le lecteur doit se préoccuper de
savoir la calculer
1° à partir de données brutes, sans ordinateur;
2° à partir de données groupées, sans ordinateur;
3° à partir de données brutes, avec Mathematica;
4° à partir de données groupées, avec Mathematica.

Packages de l’auteur
◼ On peut consulter le mode d’emploi du package Statistique:
https://www.deleze.name/marcel/sec2/applmaths/packages/aide/Statistique.pdf
◼ Avant d’utiliser le package, il faut le charger en donnant son adresse web:

Needs["Statistique`",
nécessite
"https://www.deleze.name/marcel/sec2/applmaths/packages/Statistique.m"]

Voici la liste des instructions disponibles :

Names["Statistique`*"]
noms

{amplitudes, densiteContinue, densites, diagrammeBatons,

diagrammeCumulatif, distributionContinue, distributionLissee, fctDensite,
fctFrequenceCumulee, frequenceCumuleeContinue, frequenceCumuleeLissee,
histogramme, InterpolatedQuantile, noeudsPolygonaux, polygoneDeDensite,
quantileC, quantileLisse, sommesCumulees, StandardDeviationMLE, VarianceMLE}

◼ Le package Tableaux contient des commandes qui facilitent la présentation des données et
résultats sous la forme de tableaux:

Needs["Tableaux`",
nécessite
"https://www.deleze.name/marcel/sec2/applmaths/packages/Tableaux.m"]

Names["Tableaux`*"]
noms

{afficheTableau, afficheTableauTitre, arrondis, fusionneColonnes,

fusionneLignes, fusionneTableaux, prodCart, prodCartTrans, tableauGraph}

◼ On peut consulter le mode d’emploi du package Tableaux:

https://www.deleze.name/marcel/sec2/applmaths/packages/aide/Tableaux.pdf

Printed by Wolfram Mathematica Student Edition

2 2-stat_I.nb

Pour ne pas oublier d'exécuter ces instructions au début de chaque session de travail, il est con-
seillé de déclarer les instructions Needs comme étant des cellules d'initialisation. Pour ce faire,
sélectionnez les cellules voulues puis passez par le menu
Cell / Cell properties / Initialization cell
§ 2.1 Distribution empirique continue et fonction de densité

Données groupées en classes

D'un échantillon d'étudiants de sexe masculin, on a mesuré la masse de chacun. Les masses ont
été arrondies à l'entier. Voici les données groupées en 7 classes:
Masses en kg Nombre d'étudiants
45 - 54 5
55 - 59 14
60 - 64 33
65 - 69 47
70 - 74 26
75 - 79 13
80 - 89 2
La variable aléatoire X = masse corporelle de l'étudiant est continue.
Pour une variable continue, les effectifs sont associés non à une valeur mais à un intervalle.
L'intervalle 45 - 54 représente plus précisément l'intervalle [44.5; 54.5[,
55 - 59 [54.5; 59.5[,
60 - 64 [59.5; 64.5[,
65 - 69 [64.5; 69.5[,
70 - 74 [69.5; 74.5[,
75 - 79 [74.5; 79.5[,
80 - 89 [79.5; 89.5[.
On définit ainsi une liste des bornes des classes :
b0 , b1 , b2 , ..., bk
b = {44.5, 54.5, 59.5, 64.5, 69.5, 74.5, 79.5, 89.5};

Remarquez qu'il y a k classes mais (k+1) bornes.

On calcule ensuite les centres des classes
b0 + b 1 b1 + b 2 bk-1 + bk
c1 = , c2 = , ..., ck =
2 2 2
bj-1 + bj
cj =
2

Drop[b, 1] + Drop[b, - 1]
c=
2
{49.5, 57., 62., 67., 72., 77., 84.5}

effectifs = {5, 14, 33, 47, 26, 13, 2};

Nombre de classes

Printed by Wolfram Mathematica Student Edition

2-stat_I.nb 3

k = Length[effectifs]
longueur

Taille de l'échantillon
n = Apply[Plus, effectifs]
remp⋯ plus

140

Fréquences
effectifs
freq =
n
1 1 33 47 13 13 1
 , , , , , , 
28 10 140 140 70 140 70

Répartition uniforme de la fréquence par classe

Considérer que les effectifs sont concentrés au centre des classes est déconseillé. La variable
statistique étant continue, nous désirons avoir une distribution continue. Pour y parvenir, nous
allons répartir les effectifs uniformément dans chaque classe.
Comment répartir les 5 étudiants dans la classe [44.5; 54.5[ ? Subdivisons l'intervalle en 5 inter-
valles partiels égaux
[44.5; 46.5[, [46.5; 48.5[, [48.5; 50.5[, [50.5; 52.5[, [52.5; 54.5[
puis attribuons un étudiant à chaque intervalle partiel. Nous dirons que
5
la fréquence de l'intervalle [44.5; 54.5[ est de 140
tandis que, pour chaque intervalle partiel,
1
la fréquence de l'intervalle [44.5; 46.5[ est de 140
;
1
la fréquence de l'intervalle [46.5; 48.5[ est de 140
;
1
la fréquence de l'intervalle [48.5; 50.5[ est de 140
;
1
la fréquence de l'intervalle [50.5; 52.5[ est de 140
;
1
la fréquence de l'intervalle [52.5; 54.5[ est de 140
.
Pour rendre la distribution continue, nous acceptons de fractionner encore ces intervalles partiels
1
la fréquence de l'intervalle [44.5; 45.5[ est de 280
,
ce que nous interprétons comme suit:
en choisissant une personne au hasard, il y a une chance sur 280 que son poids
se situe dans l'intervalle [44.5; 45.5[.
Plus généralement, à chaque classe est associée une fréquence
n1
f1 = = f[b0 ; b1 [ = fréquence de la classe numéro 1
n
... ×
nj
fj = = f[bj-1 ; bj [ = fréquence de la classe numéro j
n
... ×
nk
fk = = f[bk-1 ; bk [ = fréquence de la classe numéro k
n

Printed by Wolfram Mathematica Student Edition

4 2-stat_I.nb

k
 fj = 1
j=1

Dans notre exemple, la fréquence de la 4-ème classe - c'est-à-dire la fréquence de l'événement "la
47
masse appartient à l'intervalle [64.5; 69.5[" - est de 140
, ce que l'on peut noter
47
f4 = f64.5; 69.5 =
140
La signification de l'événement "la masse est de 66 kg" doit être précisée. Déterminons sa
fréquence. S'il s'agit de f([65.5; 66.5[) on peut estimer sa valeur en répartissant les effectifs uniformé-
ment sur toute la largeur de la classe
66.5 - 65.5 1 47
f65.5; 66.5 = f64.5; 69.5 = f4 =
69.5 - 64.5 5 700
S'il s'agit de l'événement "la masse vaut exactement un 66 kg", commençons par de petits inter-
valles autour de 66 :
66.05 - 65.95 0.1 47
f65.95; 66.05 = f64.5; 69.5 = f4 =
69.5 - 64.5 5 7000
66.005 - 65.995 0.01 47
f65.995; 66.005 = f64.5; 69.5 = f4 =
69.5 - 64.5 5 70 000
En prenant une suite d'intervalles emboîtés dont les largeurs tendent vers 0, on peut conclure que
la fréquence d'un événement réduit à un point est nulle:
f ({66}) = 0
On peut intuitivement interpréter ce dernier résultat comme suit : "Il n'y a quasiment aucune chance
pour qu'une personne pèse exactement 66.000 000 000 ... kg.
Généralisons. La fréquence d'un événement A peut être écrite sous la forme

effectif de A nA
f (A) = =
effectif total n

A l'intérieur d'une classe, lorsqu'on distribue la fréquence uniformément sur toute la largeur de la
classe, on a
x - bj-1
bj-1 ≤ x < bj ⟹ fbj-1 ; x = fj
bj - bj-1

Propriétés de la fréquence d'un événement

Les événements sont des intervalles de nombres réels, ou des réunions et intersections
d'intervalles.
En particulier, on a
0 ≤ f (A) ≤ 1
0
f (∅) = =0 fréquence de l ' événement impossible;
n
n
f () = =1 fréquence de l ' événement certain.
n
Deux événements disjoints (c'est-à-dire tels que A ⋂ B = ⌀) sont appelés incompatibles.
La fonction fréquence est additive. Par exemple, pour deux événements incompatibles

Printed by Wolfram Mathematica Student Edition

2-stat_I.nb 5

33 + 47
f 59.5; 64.5  [64.5; 69.5[ = f59.5; 69.5 = =
140
33 47
+ = f[59.5; 64.5[ + f[64.5; 69.5[
140 140
Plus généralement,

A⋂B = ⌀ ⟹ f (A ⋃ B) = f (A) + f (B)

En conséquence, lorsqu'on calcule la fréquence d'un intervalle, il importe peu que l'intervalle soit
ouvert ou fermé
f[a; b] = f {a} + f] a; b[ + f {b} = 0 + f] a; b[ + 0 = f] a; b[

La fréquence cumulée comme fonction de distribution empirique continue

Calculons d'abord la fréquence cumulée aux bornes des classes
freqCum = Accumulate[freq]
accumule
1 19 13 99 25 69
 , , , , , , 1
28 140 35 140 28 70

en insérant la fréquence 0 au début de la liste

afficheTableau[{"Bornes des classes", "Fréquences cumulées"},
None, {b, Prepend[freqCum, 0]}]
aucun appose

Bornes des classes 44.5 54.5 59.5 64.5 69.5 74.5 79.5 89.5
1 19 13 99 25 69
Fréquences cumulées 0 1
28 140 35 140 28 70

La fréquence cumulée est

F (x) = f] - ∞, x] = fréquence des modalités ≤ x
afficheTableau[{"x", "F(x)"}, None, {b, Prepend[freqCum, 0]}]
aucun appose

x 44.5 54.5 59.5 64.5 69.5 74.5 79.5 89.5

1 19 13 99 25 69
F(x) 0 1
28 140 35 140 28 70

Pour satisfaire l'hypothèse que les effectifs sont uniformément distribués dans chaque classe, on
interpole linéairement entre ces points. On obtient ainsi une fonction F qui est continue et affine par
morceaux.

Printed by Wolfram Mathematica Student Edition

6 2-stat_I.nb

frequenceCumuleeContinue[b, freq, AxesLabel → {None, "Fréquence cumulée"}]

titre d'axe aucun
Fréquence cumulée

1.0

0.8

0.6

0.4

0.2

44.5 54.5 59.5 64.5 69.5 74.5 79.5 89.5

La fréquence cumulée (on dit aussi fonction de répartition empirique) est une fonction
F : ℝ⟶ℝ
qui vérifie
pour les x ϵ {b0 , b1 , ..., bk }, on a
nombre d' éléments inférieurs ou égaux à x
F (x) = = f - ∞;
effectif total
x

c'est-à-dire
F (b0 ) = 0 = f] - ∞; b0 ]
F (b1 ) = f1 = f] - ∞; b1 ]
F (b2 ) = f1 + f 2 = f] - ∞; b2 ]
... . ... . ...
F (bk-1 ) = f1 + f2 + ... + fk-1 = f] - ∞; bk-1 ]
F (bk ) = 1 = f] - ∞; ∞[
Pour x ≤ b0 , F (x) = f] - ∞; b0 ] = 0
x-b0
Pour b0 ≤ x ≤ b1 , F (x) = f] - ∞; b0 ] + f] b0 ; x] = F (b0 ) + b1 -b0
f1
x-b1
Pour b1 ≤ x ≤ b2 , F (x) = f] - ∞; b1 ] + f] b1 ; x] = F (b1 ) + b2 -b1
f2
... .. . ... . ...
Pour bk-1 ≤ x ≤ bk , F (x) = f] - ∞; bk-1 ] + f] bk-1 ; x] = F (bk-1 ) + bx-b
-b
k-1
fk
k k-1

Pour bk ≤ x F (x) = f] - ∞; ∞[ = 1

Relation entre distribution empirique et fréquence

La valeur de la fonction de distribution empirique en x est égale à la fréquence de l'intervalle ] -∞; x]

Pour tout x ϵ , on a F (x) = f] - ∞; x]

En d'autres termes, F(x) représente la fréquence de l'événement "être inférieur ou égal à x".
F est aussi appelé fonction fréquence cumulée continue.
On remarquera que la distribution F est une fonction d'une variable réelle dont la représentation
graphique est immédiate.

Printed by Wolfram Mathematica Student Edition

2-stat_I.nb 7

Il n'en est pas de même de la fonction fréquence f dont l'argument n'est pas un nombre réel mais un
événement. La fréquence d'un intervalle peut se déduire de la distribution

f(] a, b]) = F (b) - F (a)

Plus simplement - mais abusivement - on note aussi f ] a, b]. Dans notre exemple numérique,
f] 60, 70] = F (70) - F (60)

F(70)

FREQUENCE CUMULEE
f]60; 70]

F(60)

40 50 60 70 80 90

La densité de fréquence
La fréquence cumulée étant une fonction affine par morceaux, intéressons-nous à la pente de
chacun des morceaux. Situons-nous à l'intérieur de la classe numéro j et désignons la pente par hj .
F (bj ) - F (bj-1 ) fj f] bj-1 ; bj ]
hj = = =
bj - bj-1 bj - bj-1 bj - bj-1
Le nombre hj a une double interprétation
* d'une part,

fj f] bj-1 ; bj ]
hj = =
bj - bj-1 bj - bj-1

représente la fréquence divisée par l'amplitude de la classe d'où le nom de densité de

fréquence;
fréquence de la classe j
en mots, Densité de la classe j = amplitude de la classe j
* d'autre part,
F (bj ) - F (bj-1 )
hj =
bj - bj-1

représente la pente moyenne de la fonction F sur la classe numéro j.

h = densites[b, freq]
{0.00357143, 0.02, 0.0471429, 0.0671429, 0.0371429, 0.0185714, 0.00142857}

Ces k nombres permettent de définir une fonction h : ℝ ⟶ ℝ constante par morceaux

Pour x ≤ b0 , h (x) = 0 = 0
f1
Pour b0 ≤ x ≤ b1 , h (x) = h1 = b1 -b0

Printed by Wolfram Mathematica Student Edition

8 2-stat_I.nb

f2
Pour b1 ≤ x ≤ b2 , h (x) = h2 = b2 -b1
... .. . ... . ...
fk
Pour bk-1 ≤ x ≤ bk , h (x) = hk = bk -bk-1
Pour bk ≤ x h (x) = 0 = 0

Histogramme
Nous verrons ci-après que la surface comprise entre l'axe des abscisses et le graphique de la
fonction h(x) = densité de fréquence a une signification statistique importante. C'est la raison pour
laquelle on représente le graphique de la fonction h avec des rectangles et que l'on grise ces rectan-
gles. Cette représentation est appelée histogramme:
histogramme[b, freq, AxesLabel → {None, "Densité"}]
titre d'axe aucun
Densité

0.06

0.05

0.04

0.03

0.02

0.01

44.5 54.5 59.5 64.5 69.5 74.5 79.5 89.5

Dans le but d'interpréter le graphique précédent, répondons à la question : "Quelle est la fréquence
de l'événement la masse appartient à l'intervalle [61; 63[ ?".

0.06

0.05
h3

0.04

0.03
DENSITE

0.02

0.01

44.5 54.5 59.5 64.5 69.5 74.5 79.5 89.5

L'axe vertical est l'axe des densités; il est gradué en fréquence par kg
f3 33 1
h3 = =
5 kg 700 kg
Conformément à la relation fréquence = densité * amplitude, on a

Printed by Wolfram Mathematica Student Edition

2-stat_I.nb 9

33 66
f] 61; 63] = h3 * (63 kg - 61 kg) = 2 kg =
700 kg 700
Du point de vue géométrique, pour le rectangle marqué en noir,
aire = hauteur * largeur
L'aire en noir représente donc la fréquence de l'événement la masse appartient à l'intervalle [61; 63[.
Retenons le résultat suivant. Dans un histogramme,
* les hauteurs des rectangles représentent des densités;
* les aires des rectangles représentent des fréquences.
En particulier, la somme des aires d'un histogramme est égale à 1.
Selon cette interprétation,
f {61} = f] 61; 61] = aire du rectangle de hauteur h3 et de largeur 0

0.06

0.05
h3

0.04

0.03
DENSITE

0.02

0.01

Il s'ensuit que
f {61} = 0
f[61; 63] = f] 61; 63[ = f[61; 63[

Relation entre distribution et densité

La valeur de la fonction de distribution en x est égale à l'aire de la surface délimitée par la fonction
densité de fréquence au-dessus de l'intervalle ] -∞, x].
Dans la figure ci-dessous, l'aire de la surface noire est égale à F(x).

Printed by Wolfram Mathematica Student Edition

10 2-stat_I.nb

0.06

0.05
DENSITE

0.04

0.03

0.02

0.01

Relation entre fréquence et distribution

La fréquence d'un intervalle est égale à l'accroissement de la fonction de distribution sur cet
intervalle

f(] a, b]) = F (b) - F (a)

Graphiquement, la fréquence de l'intervalle ] a, b] est représentée par l'aire de la surface délimitée

par la fonction densité de fréquence au-dessus de l'intervalle ] a, b] (voir figure ci-dessous):

0.06

0.05
DENSITE

0.04

0.03

0.02

0.01

a b

La fonction de distribution empirique contient toutes les informations sur la manière dont on se
représente les données.

Relation entre densité et fréquence

A l'intérieur d'une classe (disons dans la classe numéro j), c'est-à-dire pour
] a, b] ⊂ ] bj-1 , bj ]
on a
f] a, b] = hj (b - a)
En remplaçant "densité constante" par "densité moyenne", on peut généraliser la formule précé-
dente à n'importe quels nombres a, b vérifiant a ⩽ b

Printed by Wolfram Mathematica Student Edition

2-stat_I.nb 11

—
f] a, b] = h (b - a)
—
où h = densité moyenne sur l'intervalle [a, b]. Donc,

— f] a, b]
h[a,b] =
b-a

En mots:
fréquence de l' intervalle
(densité moyenne sur l' intervalle) =
amplitude de l ' intervalle

Relation entre densité et fonction de distribution

A l'intérieur d'une classe (disons dans la classe numéro j), c'est-à-dire pour
] a, b] ⊂ ] bj-1 , bj ]
on a
F (b) - F (a) = hj (b - a)
En remplaçant "densité constante" par "densité moyenne", on peut généraliser la formule précé-
dente à n'importe quels nombres a, b vérifiant a ⩽ b
—
F (b) - F (a) = h (b - a)
—
où h = densité moyenne sur l'intervalle [a, b]. Donc,
— F (b) - F (a)
h[a,b] =
b-a

En mots:
la densité moyenne sur l'intervalle [a, b] est égale à la pente moyenne de la fonction F sur l'intervalle
(on dit aussi le taux d'accroissement de F sur l'intervalle [a, b]).
Densité ponctuelle (prolongement pour lecteurs avertis)
Téléchargez le cahier :

https://www.deleze.name/marcel/sec2/applmaths/csud/statistique_1/annexes/2-1_densite_ponctuelle.pdf

Moyenne
Pour calculer la moyenne de données groupées en classes, on peut utiliser la formule suivante
dans laquelle les cj désignent les centres des classes et les fj les fréquences des classes
correspondantes
k
—
m = x =  cj fj
j=1

Cette formule est exacte alors même que l'on suppose que la densité est uniforme dans chaque
classe.
m = c.freq
66.3036

Printed by Wolfram Mathematica Student Edition

12 2-stat_I.nb

Ecart-type
Pratiquement, on peut utiliser la formule approximative suivante

k
s≈  (cj - m)2 fj
j=1

Cette formule n'est pas tout à fait exacte car elle suppose que les effectifs sont concentrés aux
centres des classes alors que les densités sont uniformes dans chaque classe.

s= (c - m)2 .freq
6.68198

Classe modale
On appelle classe modale la classe dont la densité est maximale. (Attention : il ne s'agit pas néces-
sairement de la classe dont la fréquence est maximale !)
Dans notre exemple, la classe modale est l'intervalle [64.5; 69.5[.
Dans le cas où plusieurs classes sont de densité maximale, on dit que la distribution est
multimodale.
Avec Mathematica,
h = densites[b, freq]
{0.00357143, 0.02, 0.0471429, 0.0671429, 0.0371429, 0.0185714, 0.00142857}

clMod = Flatten[Position[h, Max[h]]]

aplatis position maximum

{4}

Usuellement, le milieu de la classe modale est appelé mode:

mo = c[[4]]
67.

1
Médiane (ou quantile interpolé )
2
1 1
La médiane est le nombre me = Q 1 tel que F(me) = 2 . Le quantile 2
auquel il correspond est dit
2

interpolé car la fonction F est construite par interpolation linéaire.

Calcul sans ordinateur
b
{44.5, 54.5, 59.5, 64.5, 69.5, 74.5, 79.5, 89.5}

N[freqCum]
valeur numérique

{0.0357143, 0.135714, 0.371429, 0.707143, 0.892857, 0.985714, 1.}

Printed by Wolfram Mathematica Student Edition

2-stat_I.nb 13

x 64.5 me 69.5
F(x) 0.371429 0.5 0.707143

0.5 - 0.371429 0.707143 - 0.371429

=
me - 64.5 69.5 - 64.5
0.128571 0.335714
=
me - 64.5 5
(me - 64.5) 0.335714 = 0.642855
0.642855
me - 64.5 =
0.335714
0.642855
me = 64.5 + = 66.4149
0.335714
Calcul avec Mathematica
1
me = quantileCb, freq, 
2
66.4149

1
FREQUENCE CUMULEE

1
2

44.5 Q1 89.5
2

La médiane partage l'histogramme en deux parties d'aires égales.

0.07

0.06

0.05
DENSITE

0.04

0.03

0.02

0.01

44.5 Q1 89.5
2

Printed by Wolfram Mathematica Student Edition

14 2-stat_I.nb

Intervalle interquartile
3 1
L'intervalle interquartile représente la différence entre les quantiles 4
et 4
(voir la figure qui suit):

FREQUENCE CUMULEE
4

1
4

44.5 Q1 Q3 89.5
4 4

3 1
interQuartile = quantileCb, freq,  - quantileCb, freq, 
4 4
8.7296

Il s'ensuit que, dans l'intervalle interquartile se situe exactement 50 % de l'effectif total.

0.07

0.06

0.05
DENSITE

0.04

0.03

0.02

0.01

44.5 Q1 Q3 89.5
4 4

Exercice 2 - 1 [Sans ordinateur]

Dans une ferme, à une date déterminée, on a pesé les oeufs qui ont été produits:

Masse de l'oeuf
[g] Nombre d'oeufs
28 - 37 3
38 - 47 51
48 - 52 74
53 - 57 112
58 - 62 92
63 - 72 62
73 - 82 6

Printed by Wolfram Mathematica Student Edition

2-stat_I.nb 15

a) Calculez les fréquences et représentez graphiquement la distribution empirique.

Calculez la médiane et l'intervalle interquartile.
b) Calculez les densités de fréquence et représentez graphiquement l'histogramme.
Déterminez la classe modale.
c) Calculez ou déterminez
la moyenne arithmétique;
la variance;
l'écart-type.

Exercice 2 - 2 [Avec Mathematica]

Mêmes questions que dans l'exercice précédent.

Exercice 2 - 3 [Sans ordinateur]

Avec les données de l'exercice 2-1,
a) calculez la fréquence des intervalles suivants
f ([49.5; 50.5[) ×
f ([50; 52[) ×
f ([50; 52]) ×
f ([60; 80[) ×
f ([-∞; 60[)
b) calculez la valeur de la fonction de distribution empirique aux abscisses suivantes
F (20)
F (40)
F (60)
F (80)
F (100)
c) Vérifiez les relations
F (40) = f(] - ∞; 40[)
F (60) = f(] - ∞; 60[)
f ([60; 80[) = F (80) - F (60)
d) A partir des résultats de la partie b), calculez la fréquence des intervalles suivants
f ([40; 60[) ×
f ([40; 80[)

§ 2.2 Erreurs de groupement

Données brutes
Dans l'exemple "Masses corporelles d'étudiants" présenté dans le § 2.1, les données étaient
groupées. Voici maintenant les observations originelles, appelées données brutes, à partir
desquelles le groupement a été établi

Printed by Wolfram Mathematica Student Edition

16 2-stat_I.nb

x = {69, 59, 70, 72, 67, 49, 69, 67, 62, 65, 60, 68, 71, 75, 62, 77, 74, 59, 65, 62,
67, 74, 54, 63, 54, 69, 61, 72, 65, 54, 62, 71, 71, 74, 80, 61, 80, 67, 65, 65,
69, 69, 77, 62, 73, 61, 58, 77, 59, 73, 73, 66, 62, 57, 55, 61, 62, 67, 57, 55,
61, 67, 79, 69, 64, 70, 68, 68, 59, 67, 67, 64, 77, 73, 67, 57, 66, 68, 72, 78,
75, 62, 55, 64, 62, 71, 66, 67, 70, 68, 52, 77, 60, 65, 61, 57, 58, 70, 69, 66,
76, 69, 67, 63, 77, 77, 69, 72, 66, 60, 65, 62, 65, 61, 66, 72, 73, 76, 61, 63,
66, 64, 65, 61, 64, 61, 70, 66, 60, 65, 67, 56, 67, 66, 73, 70, 73, 73, 68, 64};

Pour obtenir les données numériques précédentes, téléchargez le cahier

https://www.deleze.name/marcel/sec2/applmaths/csud/statistique_1/2-stat_I.nb
Taille de l'échantillon
n = Length[x]
longueur

140

Valeurs extrêmes
{Min[x], Max[x]}
minimum maximum

{49, 80}

Groupement
Nous expliquons ici comment on peut passer des données brutes aux données groupées du § 2.1.
On divise l'intervalle des modalités en classes d'égale entendue, sauf peut-être aux deux
extrémités. Pour extraire l'essentiel de l'information sans qu'elle soit brouillée par des complications
inutiles, le nombre de classes est choisi ni trop grand (rarement au-delà de 15 classes), ni trop petit
(rarement au-dessous de 5 classes).
Comme bornes des classes, nous avons choisi
b = {44.5, 54.5, 59.5, 64.5, 69.5, 74.5, 79.5, 89.5};

Les milieux des classes sont

Drop[b, - 1] + Drop[b, 1]
c=
2
{49.5, 57., 62., 67., 72., 77., 84.5}

Calculons les effectifs de chaque classe

effectifs = BinCounts[x, {b}]
compte des huches

{5, 14, 33, 47, 26, 13, 2}

effectifs
freq =
n
1 1 33 47 13 13 1
 , , , , , , 
28 10 140 140 70 140 70

Paramètres empiriques
Calculons la moyenne des données brutes, puis la moyenne des données groupées

Printed by Wolfram Mathematica Student Edition

2-stat_I.nb 17

mB = Mean[x]; N[mB]
valeur m⋯ valeur numérique

66.2786

mG = c.freq; N[mG]
valeur numérique

66.3036

Pour comparer les deux moyennes, on peut calculer l'erreur relative due au groupement :
mG - mB
mB
0.000377196

qui vaut ici environ 0.04 %.

Calculons l'écart-type des données brutes, puis l'écart-type des données groupées (valeurs
numériques approchées)
sB = StandardDeviationMLE[x]; N[sB]
valeur numérique

6.33817

sG = c - mG2 .freq ; N[sG]

valeur numérique

6.68198

Calculons la médiane des données brutes, puis la médiane des données groupées
1
meBrut = InterpolatedQuantilex, 
2
66

1
meGr = quantileCb, freq, 
2
66.4149

Calculons l'intervalle interquartile des données brutes, puis l'intervalle interquartile des données
groupées
3 1
interQuartBrut = InterpolatedQuantilex,  - InterpolatedQuantilex, ;
4 4
N[interQuartBrut]
valeur numérique

8.5

3 1
interQuartGr = quantileCb, freq,  - quantileCb, freq, 
4 4
8.7296

Erreur de groupement
On peut observer ci-dessus comment le groupement des données peut modifier la moyenne, l'écart-
type, la médiane et l'écart interquartile. On appelle erreur de groupement l'erreur induite par le

Printed by Wolfram Mathematica Student Edition

18 2-stat_I.nb

groupement des données. Une autre manière de grouper les données donnerait probablement des
résultats encore différents.
L'erreur de groupement est due au fait que l'hypothèse
les données brutes sont réparties uniformément dans chaque classe
n'est vérifiée que d'une manière approximative.

Exercice 2 - 4 [Avec Mathematica]

Partons des données brutes à partir desquelles on a effectué le groupement donné dans l'exercice
2-1 :

https://www.deleze.name/marcel/sec2/applmaths/csud/statistique_1/annexes/2-4_donnees_exercice.nb

a) Comparez la moyenne arithmétique des données brutes et la moyenne arithmétique des

données groupées. Plus précisément, calculez l’erreur relative due au groupement.
b) Question analogue pour l’écart-type.
c) Question analogue pour la médiane.
d) Question analogue pour l’intervalle interquartile.

Exercice 2 - R [Révision]
D'une table de mortalité (Suisse 1988-1993), on a extrait les données suivantes pour 100000
personnes de sexe masculin:

Âge Nombre de décès cumulés

0 0
40 4743
50 7341
60 13 688
70 28 960
80 57 691
90 89 909
110 100 000

a) [Méthode libre] Pour chaque classe d'âge, calculez la fréquence de décès et la densité de
décès.
b) [Avec Mathematica] Dessinez l'histogramme.
c) [Sans ordinateur] Calculez la fréquence de décès entre 77 et 84 ans.
d) [Avec Mathematica] Calculez l'âge moyen de décès et l'écart-type.
e) [Sans ordinateur] Ecrivez les formules pour calculer l'âge moyen de décès et l'écart-type.
Remplacez les symboles par les valeurs numériques pour montrer comment elles
s'appliquent ici.
1
f) [Sans ordinateur] A quel âge 4
des hommes sont-ils décédés ?

g) [Avec Mathematica] Calculez l'âge médian de décès et l'intervalle interquartile.

Polygone des fréquences (Supplément facultatif)

téléchargez et consultez le cahier

Printed by Wolfram Mathematica Student Edition

2-stat_I.nb 19

https://www.deleze.name/marcel/sec2/applmaths/csud/statistique_1/annexes/supplement_2-1.pdf

Liens
Vers les corrigés des exercices :
https://www.deleze.name/marcel/sec2/applmaths/csud/corriges/statistique_1/2-stat_I-cor.pdf
Vers la page mère Applications des mathématiques
https://www.deleze.name/marcel/sec2/applmaths/csud/index.html

Printed by Wolfram Mathematica Student Edition

Vous aimerez peut-être aussi

Index
Pas encore d'évaluation
Index
15 pages
Cours de Statistiques
100% (1)
Cours de Statistiques
62 pages
Diagramme Cerculaire en Statistique
100% (1)
Diagramme Cerculaire en Statistique
61 pages
3e - Chapitre 12 - Statistiques Et Probabilités - Leçon
Pas encore d'évaluation
3e - Chapitre 12 - Statistiques Et Probabilités - Leçon
6 pages
Introduction à la Distribution Statistique
Pas encore d'évaluation
Introduction à la Distribution Statistique
15 pages
Cours Statistiques Seconde
Pas encore d'évaluation
Cours Statistiques Seconde
7 pages
Cours Maths Gen BTS1 2023
Pas encore d'évaluation
Cours Maths Gen BTS1 2023
56 pages
Coorigés Statistiques
Pas encore d'évaluation
Coorigés Statistiques
16 pages
E 134 e 749 Coursstatistiques
Pas encore d'évaluation
E 134 e 749 Coursstatistiques
10 pages
Mime-Attachment 5
Pas encore d'évaluation
Mime-Attachment 5
10 pages
Ingenieur Aide Memoire Probabilite-Statistiques 2022-2023
Pas encore d'évaluation
Ingenieur Aide Memoire Probabilite-Statistiques 2022-2023
16 pages
Chapitre 1 Notions de Probabilités Et de Statistiques1
Pas encore d'évaluation
Chapitre 1 Notions de Probabilités Et de Statistiques1
16 pages
Statistiques pour BTS : Cours et Applications
100% (1)
Statistiques pour BTS : Cours et Applications
23 pages
CH 1 (Stat.) 20-21
Pas encore d'évaluation
CH 1 (Stat.) 20-21
25 pages
Cours de Biostatistique
100% (2)
Cours de Biostatistique
65 pages
Cours Stat Simple
Pas encore d'évaluation
Cours Stat Simple
14 pages
Calcul des Effectifs Cumulés en Statistique
Pas encore d'évaluation
Calcul des Effectifs Cumulés en Statistique
18 pages
Statistique Descriptive 2018
Pas encore d'évaluation
Statistique Descriptive 2018
7 pages
Statistique descriptive et moyenne
Pas encore d'évaluation
Statistique descriptive et moyenne
11 pages
Statistiques 1
Pas encore d'évaluation
Statistiques 1
7 pages
Éléments de Probabilités et Statistiques
Pas encore d'évaluation
Éléments de Probabilités et Statistiques
23 pages
Leçon de Statistiques pour 1ère A
Pas encore d'évaluation
Leçon de Statistiques pour 1ère A
15 pages
Analyse statistique des risques en génie civil
Pas encore d'évaluation
Analyse statistique des risques en génie civil
26 pages
Statistique Bivariée et Séries Doubles
Pas encore d'évaluation
Statistique Bivariée et Séries Doubles
11 pages
Statistiques : Définitions et Méthodes
Pas encore d'évaluation
Statistiques : Définitions et Méthodes
15 pages
Fréquences et Effectifs en Statistiques
Pas encore d'évaluation
Fréquences et Effectifs en Statistiques
27 pages
Cours Stats
Pas encore d'évaluation
Cours Stats
6 pages
Resume Statistiques
Pas encore d'évaluation
Resume Statistiques
4 pages
Statistiques Corrige
100% (2)
Statistiques Corrige
5 pages
Statistiques : Moyenne, Médiane, Mode
Pas encore d'évaluation
Statistiques : Moyenne, Médiane, Mode
17 pages
Wa0003
Pas encore d'évaluation
Wa0003
12 pages
Introduction à la Statistique et ses Concepts Clés
Pas encore d'évaluation
Introduction à la Statistique et ses Concepts Clés
9 pages
Cours1 - 2 - Variable Quantitative Continue - 2024-2025
Pas encore d'évaluation
Cours1 - 2 - Variable Quantitative Continue - 2024-2025
5 pages
Cours
Pas encore d'évaluation
Cours
87 pages
TST2S Statistiques Cours
Pas encore d'évaluation
TST2S Statistiques Cours
18 pages
241203chap2 Stat Des
Pas encore d'évaluation
241203chap2 Stat Des
135 pages
Introduction aux séries statistiques
Pas encore d'évaluation
Introduction aux séries statistiques
18 pages
Statistiques Descriptives - Assistance Scolaire Personnalisée Et Gratuite - ASP
Pas encore d'évaluation
Statistiques Descriptives - Assistance Scolaire Personnalisée Et Gratuite - ASP
17 pages
Statistique Descriptive Corrigée PDF
Pas encore d'évaluation
Statistique Descriptive Corrigée PDF
6 pages
16 Statistiques
Pas encore d'évaluation
16 Statistiques
10 pages
Statistique Management Culturel
Pas encore d'évaluation
Statistique Management Culturel
57 pages
Content://org Telegram Messenger Provider/media/android/data/org Telegram messenger/files/Telegram/Telegram%20Files/PROBA-STAT%20
Pas encore d'évaluation
Content://org Telegram Messenger Provider/media/android/data/org Telegram messenger/files/Telegram/Telegram%20Files/PROBA-STAT%20
15 pages
250227chap2 Rappel Statistiques Descriptives
Pas encore d'évaluation
250227chap2 Rappel Statistiques Descriptives
140 pages
Techniques d'échantillonnage et statistiques
Pas encore d'évaluation
Techniques d'échantillonnage et statistiques
26 pages
Guide Complet des Statistiques Descriptives
Pas encore d'évaluation
Guide Complet des Statistiques Descriptives
5 pages
Cours Histogramme
100% (1)
Cours Histogramme
21 pages
Statistique descriptive : Effectifs et fréquences
Pas encore d'évaluation
Statistique descriptive : Effectifs et fréquences
27 pages
Cours Apc Maths 3ème Online 2025 PDF
Pas encore d'évaluation
Cours Apc Maths 3ème Online 2025 PDF
8 pages
COURS DE MATHS 2nde
Pas encore d'évaluation
COURS DE MATHS 2nde
48 pages
Introduction à la Statistique Descriptive
Pas encore d'évaluation
Introduction à la Statistique Descriptive
19 pages
Étude des Variables Statistiques Continues
Pas encore d'évaluation
Étude des Variables Statistiques Continues
7 pages
Code
Pas encore d'évaluation
Code
19 pages
Variable Statistique Discrète
Pas encore d'évaluation
Variable Statistique Discrète
10 pages
Statistiques Probas 3eme Cours
Pas encore d'évaluation
Statistiques Probas 3eme Cours
7 pages
Statistique Descriptive Univariée
Pas encore d'évaluation
Statistique Descriptive Univariée
44 pages
24 - Statistique Descriptive
Pas encore d'évaluation
24 - Statistique Descriptive
11 pages
Vie de Famille et Loisirs de Marie
Pas encore d'évaluation
Vie de Famille et Loisirs de Marie
1 page
Exam Rsolus 2016 Statistique s1
Pas encore d'évaluation
Exam Rsolus 2016 Statistique s1
16 pages
Analyse des Distributions Statistiques en Psychologie et Sociologie
Pas encore d'évaluation
Analyse des Distributions Statistiques en Psychologie et Sociologie
7 pages
Exam Rsolus 2016 Statistique s1
Pas encore d'évaluation
Exam Rsolus 2016 Statistique s1
16 pages
Les 500 Exercices de Grammaire PDF
96% (27)
Les 500 Exercices de Grammaire PDF
221 pages
Exam Rsolus 2016 Statistique s1
Pas encore d'évaluation
Exam Rsolus 2016 Statistique s1
16 pages
Serie 4
Pas encore d'évaluation
Serie 4
2 pages
Statistiques Descriptives Cours s1 Prof
100% (3)
Statistiques Descriptives Cours s1 Prof
157 pages
Tchebychev
Pas encore d'évaluation
Tchebychev
4 pages
TD Chap 2
Pas encore d'évaluation
TD Chap 2
10 pages
Introduction à la Statistique Descriptive
Pas encore d'évaluation
Introduction à la Statistique Descriptive
34 pages
Serie 2
100% (1)
Serie 2
2 pages
Statistiques économiques au Burkina Faso
Pas encore d'évaluation
Statistiques économiques au Burkina Faso
63 pages
Serie 3
Pas encore d'évaluation
Serie 3
2 pages
Mode D-Une Série Stat A Variable Continue Corr
100% (1)
Mode D-Une Série Stat A Variable Continue Corr
5 pages
Serie 1
Pas encore d'évaluation
Serie 1
2 pages
Exam 1
Pas encore d'évaluation
Exam 1
2 pages
Correc Exam 2
Pas encore d'évaluation
Correc Exam 2
2 pages
Corrige S4
Pas encore d'évaluation
Corrige S4
6 pages
Statistiques Descriptives : Exercices Corrigés
0% (1)
Statistiques Descriptives : Exercices Corrigés
5 pages
Formation OpenBuildings Débutant
Pas encore d'évaluation
Formation OpenBuildings Débutant
2 pages
Kit IAG - Lart Du Prompt
Pas encore d'évaluation
Kit IAG - Lart Du Prompt
2 pages
Maintenance Dépannage PC en Réseau
0% (1)
Maintenance Dépannage PC en Réseau
22 pages
Ingénieur Informatique Junior Créatif
Pas encore d'évaluation
Ingénieur Informatique Junior Créatif
1 page
Prix Samsung Note 20 Ultra à Abidjan
Pas encore d'évaluation
Prix Samsung Note 20 Ultra à Abidjan
1 page
Guide de Spam par Email
Pas encore d'évaluation
Guide de Spam par Email
19 pages
FR E30 A1 Manual v1.00 (WW)
Pas encore d'évaluation
FR E30 A1 Manual v1.00 (WW)
77 pages
Évolution de la Veille Technologique
Pas encore d'évaluation
Évolution de la Veille Technologique
9 pages
Client Commande Produit Detail
Pas encore d'évaluation
Client Commande Produit Detail
3 pages
Fiche de TD1
Pas encore d'évaluation
Fiche de TD1
2 pages
Mfossi Salim2
Pas encore d'évaluation
Mfossi Salim2
59 pages
2408281234mkyal 2
Pas encore d'évaluation
2408281234mkyal 2
1 page
1.description D'un Système de Production Automatisé
Pas encore d'évaluation
1.description D'un Système de Production Automatisé
34 pages
DEDICACE3
Pas encore d'évaluation
DEDICACE3
2 pages
Ecritures Comptables Format CEGID TRA
Pas encore d'évaluation
Ecritures Comptables Format CEGID TRA
8 pages
Chap 3 Algèbre de Boole - Bis
Pas encore d'évaluation
Chap 3 Algèbre de Boole - Bis
17 pages
Langage de Modélisation UML: 2 Année Du Cycle Ingénieur - Génie Informatique - Année Universitaire 2022 - 2023
Pas encore d'évaluation
Langage de Modélisation UML: 2 Année Du Cycle Ingénieur - Génie Informatique - Année Universitaire 2022 - 2023
256 pages
Manuel - D'utilisation - MONOPRICE MP10
Pas encore d'évaluation
Manuel - D'utilisation - MONOPRICE MP10
26 pages
Initiation
Pas encore d'évaluation
Initiation
30 pages
TP de La Geomatique-Qgis
Pas encore d'évaluation
TP de La Geomatique-Qgis
24 pages
Codage et Compression de Texte
Pas encore d'évaluation
Codage et Compression de Texte
85 pages
Quiz Informatique : Questions et Réponses
Pas encore d'évaluation
Quiz Informatique : Questions et Réponses
23 pages
Manuel d'utilisation Surftest SJ-210/310/410
Pas encore d'évaluation
Manuel d'utilisation Surftest SJ-210/310/410
14 pages
Intégration de fonctionnalités pour KYOWORK
Pas encore d'évaluation
Intégration de fonctionnalités pour KYOWORK
18 pages
Formation ISO 17025 : Exigences et Objectifs
Pas encore d'évaluation
Formation ISO 17025 : Exigences et Objectifs
93 pages
Arona Lamine TOP
Pas encore d'évaluation
Arona Lamine TOP
119 pages
Introduction au Shell Unix
Pas encore d'évaluation
Introduction au Shell Unix
65 pages
Approche et outils en gestion de projet
Pas encore d'évaluation
Approche et outils en gestion de projet
60 pages
Exercice CRC
Pas encore d'évaluation
Exercice CRC
1 page
Projet de Specialisation
Pas encore d'évaluation
Projet de Specialisation
7 pages