Introduction aux Statistiques
Introduction aux Statistiques
1 – Description Statistique :
Autrefois la statistique était une science qui s’occupait seulement de la démographie
(étude de la population humaine) ; nombre d’habitant des villes ; taux de mortalité, de
naissance, densité.
Actuellement selon Olivier Maggioni, la statistique peut être vue comme l’ensemble
des méthodes et des techniques permettant de traiter les données (informations chiffrées)
associées à une situation ou un phénomène. Par exemples le recensement de la population,
la production agricole d’un pays, l’efficacité d’un nouveau remède contre telle maladie,
rendement d’une nouvelle variété de riz.
La statistique se révèle être un outil fondamental d’aide à la décision.
Définitions
Population statistique : ensemble d’unités statistiques ou individus.
Exemples :
- Relevés pluviométriques quotidiens (populations = jours)
- Tous les malades atteints de vers de Guinée (où ? quand ?)
Exemple : A la veille des élections présidentielles on veut savoir quel est le candidat
favori ?
X candidat ADEMA ; Y candidat RDA ; Z candidat CNID. On fait un sondage
d’opinion. Population = ensemble des électeurs. On prélève une partie de cette
population (échantillon). A partir des pourcentages obtenus pour l’échantillon on tire
des conclusions valables pour la population. 40% des électeurs favorables à Z ; 20%
des électeurs favorables à X ; 10% des électeurs favorables à Y.
Exemple 1 : On mesure les longueurs en centimètre de quelques pieds de riz, on obtient les
résultats suivants : 97 ; 93 ; 95 ; 90 ; 94 ; 93 ; 94 ; 93 ; 92 ; 91 ; 94 ; 93 ; 90 ; 95 ; 93 ;
96 ; 94 .
Population = ensemble des pieds de riz ; Effectif = 17.
L’étude statistique porte sur la taille (longueur) des pieds de riz. On dit que le caractère de
cette étude porte sur la taille ou la longueur. Ici le caractère s’exprime à l’aide de chiffre,
on dit que c’est un caractère quantitatif (ou une variable numérique).
Exemple : Recenser au Mali le nombre de mères ayant plus de 10 enfants par régions du
Mali.
Variable Continue : c’est une variable qui s’exprime à l’aide de nombres réels
Classes Effectifs
C1 n1
C2 n2
Valeurs Effectifs
x1 n1
x2 n2
x3 n3
Exemple : voici les tailles des élèves d’une classe de Lycée en (cm).
158 ; 160 ; 166 ; 165 ; 150 ; 158 ; 157 ; 170 ; 166 ; 167 ; 166 ; 158 ; 172 ; 181 ; 182 ;
175 ; 172 ; 170 ; 165 . Dresser la série des effectifs.
Valeurs Effectifs
150 1
157 1
158 3
160 1
165 2
166 3
167 1
170 2
172 2
175 1
181 1
182 1
19
Exemple : Une série statistique sur le poids des enfants d’un groupe d’enfants de 7 ans
donne : 22 ; 25 ; 23 ; 24 ; 19 ; 23 ; 18 ; 20 ; 21 ; 19 ; 22 ; 20 ; 17 ; 21 ; 23 ; 24 ; 17 ; 21 ;
20 ; 20 ; 19 ; 22 ; 19 ; 20 ; 19 ; 21. Classer ces renseignements en classes d’amplitude 2.
Solution : [17, 19[ ; [19, 21[ ; [21, 23[ ; [23, 25[ ; [25, 27[ ; etc…
• L’effectif cumulé est donné par le nombre d’unités statistiques ayant un score
k
inférieur ou égal. nk ↑= ∑ ni .
i =1
Soient x1 ; x2 ; ….. ; xk les valeurs d’une variable statistique ; n1 ; n2 ; …. ; nk les effectifs
associés. n = n1 + n2 + ….+ nk effectif total.
Série par classe des effectifs cumulés, des fréquences, fréquences cumulées :
x1 30
x2 20
x3 18
x4 10
Effectifs
30
20
18
10
x1 x2 x3 x4 Classes
Classes Fréquences
30 15
x1 =
42 21
20 10
x2 =
42 21
18 9
x3 =
42 21
10 5
x4 =
42 21
30
classe X1
38%
18 classe X2
23% classe X3
classe X4
20
26%
Effectifs
n4
n1
0 x1 x2 x3 x4 Valeurs
Effectifs
5
Diagramme en bâtons
20 et
4 Polygone statistique
20 des Effectifs
3
20
2
20
1
20
0 90 91 92 93 94 95 96 97 Valeurs
Soit une variable discrète x prenant les valeurs x1 ; x2 ; x3 ; ….. ; xk. La fonction cumulative
des effectifs est l’application F de ℝ vers ℝ définie par :
F ( x) = ∑ ni tel que pour xi < x ni effectif de xi .
Histogramme :
Il sert à représenter les effectifs comme les fréquences.
• Grouper les valeurs xi de la variable en intervalles d’égale amplitude semi-ouverts
d’un côté.
• Dans un système d’axes rectangulaires, porter les valeurs xi en abscisses ; en
ordonnées les effectifs (ou fréquences).
• Elever en chaque intervalle une bande dont la hauteur est proportionnelle à l’effectif
(ou la fréquence) de la classe.
Remarque 1 : Si les classes sont d’amplitudes égales, la « hauteur de chaque rectangle est
proportionnelle à l’effectif de la classe correspondante.
Effectifs
n4
n3 Histogramme des
Effectifs
n2
n1
0 x1 x2 x3 Classes
28 cm
20 cm
20 cm
12 cm
18 cm
8 cm
5 cm
0 2 3 4 6 8 12 16
termes médians
xk + x p
Valeur médiane de la série est : .
2
Exemple1 :
On mesure les longueurs en centimètre de quelques pieds de riz, on obtient les résultats
suivants : 97 ; 93 ; 95 ; 91 ; 90 ; 94 ; 97 ; 91 ; 93 ; 94 ;
93 ; 92 ; 91 ; 94 ; 93 ; 90 ; 95 ; 93 ; 96 ; 94 .
Trouver le mode et la médiane de cette série statistique.
Solution :
Valeurs 90 91 92 93 94 95 96 97 Total
Effectifs 2 3 1 5 4 2 1 2 20
L’intervalle contenant la médiane est appelé intervalle médian. Dans le cas d’une variable
continue la médiane est calculée par interpolation linéaire.
Exemple2:
On donne les âges des élèves d’une classe de1ère génie civile, on obtient les résultats
suivants dans le tableau :
Classes Effectifs ni
[15 ; 16[ 7
[16 ; 17[ 8
[17 ; 18[ 11
[18 ; →[ 2
Quelle est la classe modale de cette série statistique
Déterminer l’intervalle médian et en déduire la médiane Me.
Solution :
Classes Effectifs ni Effectifs cumulés
croissant
[15 ; 16[ 7 7
[16 ; 17[ 8 15
[17 ; 18[ 11 26
[18 ; →[ 2 28
Total 28 ///////////////////////////
B
15
I
14
J
5 C
A
16 Me 17
AJ JI Me − 16 14 − 5
Les triangles AIJ et ABC sont semblables. On a : = ⇔ =
AC CB 17 − 16 15 − 5
Me − 16 9 9
⇔ = ⇔ Me − 16 = ⇔ Me = 16 + 0,9 ⇔ Me = 16,9 .
1 10 10
Valeurs xi x1 x2 …… xn
Effectifs ni n1 n2 …… nk
n1 x1 + n2 x2 + ...... + nk xk
La moyenne arithmétique de cette série est : m= .
n1 + n2 + ....... + nk
Définition 2 :
La moyenne pondérées des valeurs x1 ; x2 ; x3 ; ….. ; xk affectées respectivement des
coefficients p1 ; p2 ; p3 ; …… ; pk , est le nombre :
p1 x1 + p 2 x2 + ...... + pk xk
. m= où les p k sont réels donnés .
p1 + p2 + ........ + p k
Calculer la moyenne arithmétique des notes. Calculer la moyenne pondérée des notes
sachant que les matières ont respectivement pour cœfficient : Philo = 3 ; Maths = 5 ;
Economie = 5 ; Anglais = 2 ; Géographie = 2.
Solution :
8 + 12 + 13 + 7 + 15 55
- Moyenne arithmétique est : m = = = 11 ;
5 5
b) Formule :
n
∑ (x ) i
2
. M .Q = i =1
.
n
c) Exemple : calculer la moyenne quadratique de la distribution µ : 3 ; 3 ; 5 ; 8.
9 + 9 + 25 + 64 107
MQ = = ≈ 5,17 .
4 4
n
harmonique la valeur notée : MH = avec xi ≠ 0 .
1 1 1
+ + ........ +
x1 x2 xn
n
ou encore on a : MH = .
n
1
∑
i =1 xi
c) Formule :
1
= ∏ xi
n n
∏x
n
. M .G = n x1 × x2 × ......... × xn = n .
i =1
i
i =1
40 60 | 60 80 | 80 80 | 100 100.
x1 x2 | x3 x4 | x5 x6 | x7 x8
Q0 | Q1 | Q2 |
La demie différence entre le 3ème quartile et le 1er quartile est appelée écart probable (ou
Q − Q0 80 − 60
écart semi-quartile). 2 = = 10 . L’écart inter-quartiles est : Q2 – Q0.
2 2
5–7–2 Déciles :
Les déciles d’une série statistique sont les 9 valeurs (D1 ; D2 ; D3 ;…… ; D9) du caractère
qui partage la série en 10 groupes de même effectif.
5–7–3 Centiles :
Les centiles d’une série statistique sont les 99 valeurs du caractère qui partage la série en
100 groupes de même effectif.
Série S1 Série S2
Mode : 80 Mode : 80
Médiane : 80 Médiane : 80
Moyenne arithmétique = 80,12 Moyenne arithmétique = 80
Conclusion :
S2
40 60 80 100 120
On constate que dans la série S1, les valeurs sont plus regroupées autour de la médiane.
Dans celle de S2, elles sont dispersées.
Définition 1 :
La fluctuation ou la variance d’une série statistique est le réel noté V(x) ou σ2(x).
n1 ( x1 − x) 2 + n2 ( x2 − x) 2 + .......... + nk ( xk − x) 2
. V ( x) = .
n1 + n2 + ........ + nk
Définition 2 :
L’écart-type d’une série est la racine carrée de la variance. Il est noté σ.
σ 2 = ∑ ni (xi − x )
1 n 2
. σ = V (x) ou .
n i=1
Remarques :
σ≥0;
Plus σ est grand plus les valeurs xi sont dispersées. Plus σ est petit les valeurs xi
sont regroupées autour de la médiane.