Résumé Détaillé : Statistiques
realisé par : rafiq ouardani, zakia heyouni, soufian azerar, ayoub zeiker, ayman boukhalkhal.
G : 2 college
1 Notions de base des variables statistiques
Une variable statistique est une caractéristique mesurable sur une population ou un échan-
tillon. Types :
• Qualitative :
– Nominale : sans ordre (ex. : couleur).
– Ordinale : avec ordre (ex. : niveau de satisfaction).
• Quantitative :
– Discrète : valeurs entières (ex. : nombre d’enfants).
– Continue : valeurs réelles (ex. : poids).
Exemple : Série de notes d’un examen pour 10 étudiants :
X = {8, 9, 10, 11, 12, 13, 14, 15, 16, 17}.
2 Représentation graphique : Histogramme
Un histogramme visualise la distribution d’une variable quantitative en regroupant les données
en classes. Chaque barre représente l’effectif (ou la fréquence) d’une classe.
Exemple : Pour les notes {8, 9, 10, 11, 12, 13, 14, 15, 16, 17}, classes : [8-11], [12-15],
[16-19]. Effectifs : 4, 4, 2.
Effectif
4
3
2
1
Notes
[8-11] [12-15] [16-19]
3 Paramètres de position
Les paramètres de position décrivent la tendance centrale ou la répartition des données.
1
3.1 Moyenne
Pn
i=1 xi
x̄ = ,
n
où xi sont les valeurs et n l’effectif total. Exemple :
8 + 9 + 10 + 11 + 12 + 13 + 14 + 15 + 16 + 17 125
x̄ = = = 12.5.
10 10
3.2 Généralisation de la moyenne
La moyenne peut être généralisée à d’autres types :
• Moyenne géométrique : v
u n
uY
n
G= t xi .
i=1
√
Utile pour des données de croissance (ex. : taux). Exemple : G = 10
8 × 9 × · · · × 17 ≈
12.14.
• Moyenne harmonique :
n
H = Pn 1 .
i=1 xi
Utile pour des données de type vitesse ou ratio. Exemple : H = 1
10
+ 19 +···+ 17
1 ≈ 11.66.
8
• Moyenne quadratique : r Pn
i=1 x2i
Q= .
n
q
Utile pour des données avec variation importante. Exemple : Q = 82 +92 +···+172
10
≈
12.85.
3.3 M Dolores
σ
CV = × 100,
x̄
où σ est l’écart-type et x̄ la moyenne. Mesure la dispersion relative. Exemple : σ ≈ 3.11,
x̄ = 12.5, donc CV = 3.11
12.5
× 100 ≈ 24.88%.
3.4 Médiane
Valeur centrale après tri des données.
(
x n+1 si n impair,
Médiane = 2
x n +x n +1
2
2
2
si n pair.
Exemple : Notes triées : {8, 9, 10, 11, 12, 13, 14, 15, 16, 17}. Médiane = 12+13
2
= 12.5.
3.5 Mode
Valeur la plus fréquente. Exemple : Pas de mode (toutes les valeurs sont uniques).
2
3.6 Quartiles
Les quartiles divisent la série triée en quatre parties égales :
• Q1 : 25% des données (premier quartile).
• Q2 : Médiane (50% des données).
• Q3 : 75% des données (troisième quartile).
Formules : Pour une série triée, Q1 = x⌊(n+1)/4⌋ , Q3 = x⌊3(n+1)/4⌋ . Exemple : Pour {8, 9, 10,
11, 12, 13, 14, 15, 16, 17}, n = 10 :
Q1 = x⌊(10+1)/4⌋ = x3 = 10, Q3 = x⌊3(10+1)/4⌋ = x8 = 15.
Relations :
• Écart interquartile : IQR = Q3 − Q1 . Exemple : IQR = 15 − 10 = 5.
• Écart semi-interquartile : SIQR = Q3 −Q1
2
. Exemple : SIQR = 5
2
= 2.5.
4 Paramètres de dispersion
Les paramètres de dispersion mesurent l’étalement des données.
4.1 Étendue
E = max(xi ) − min(xi ).
Exemple : E = 17 − 8 = 9.
4.2 Variance
Pn
i=1 (xi − x̄)2
V = .
n
Exemple :
(8 − 12.5)2 + (9 − 12.5)2 + · · · + (17 − 12.5)2
V = ≈ 9.65.
10
4.3 Écart-type
√
σ= V.
√
Exemple : σ = 9.65 ≈ 3.11.
5 Paramètres de forme
Les paramètres de forme décrivent la distribution.
5.1 Asymétrie (Skewness de Fisher)
1
Pn
n i=1 (xi − x̄)3
γ1 = .
σ3
Valeur positive : biais à droite ; négative : biais à gauche ; nulle : symétrique. Exemple :
Pour les notes, γ1 ≈ 0 (distribution approximativement symétrique).
3
5.2 Coefficient de Yule
Q3 + Q1 − 2Q2
SY = .
Q3 − Q1
Mesure l’asymétrie par rapport aux quartiles. Exemple : Q1 = 10, Q2 = 12.5, Q3 = 15,
15 + 10 − 2 · 12.5 25 − 25
SY = = = 0.
15 − 10 5
5.3 Coefficient de Kelly
P90 − P10 P50 − P10
SK = − ,
P90 − P50 P90 − P10
où P10 , P50 , P90 sont les 10e, 50e et 90e centiles. Exemple : Approximativement, P10 ≈ 8,
P50 = 12.5, P90 ≈ 17,
17 − 8 12.5 − 8 9 4.5
SK ≈ − ≈ − = 2 − 1 = 1.
17 − 12.5 17 − 12.5 4.5 4.5
(Valeur indicative, nécessite plus de données pour précision.)
5.4 Aplatissement (Kurtosis)
1
Pn
n i=1 (xi − x̄)4
γ2 = .
σ4
Kurtosis = 3 pour une distribution normale ; > 3 : leptokurtique ; < 3 : platykurtique.
Exemple : Calcul complexe, mais les notes sont proches d’une distribution normale.
6 Paramètres de concentration
La concentration mesure l’inégalité dans la répartition des données.
6.1 Indice de Gini
Pn Pn
i=1 j=1 |xi − xj |
G= .
2n2 x̄
Exemple : Pour une série de revenus {1000, 2000, 5000, 8000},
x̄ = 4000, G ≈ 0.35.
6.2 Courbe de Lorenz
Représentation graphique de la répartition cumulative par rapport à une répartition égale.
Exemple : Pour les revenus, la courbe s’éloigne de la diagonale.
7 Série statistique double
Une série statistique double analyse la relation entre deux variables.
7.1 Covariance
Pn
i=1 (xi − x̄)(yi − ȳ)
Cov(X, Y ) = .
n
4
7.2 Corrélation
Cov(X, Y )
r= , −1 ≤ r ≤ 1.
σX σY
Exemple : Données (taille en cm, poids en kg) : {(160, 55), (170, 65), (175, 70), (180, 75)}.
Moyennes : x̄ = 171.25, ȳ = 66.25. Covariance : Cov(X, Y ) ≈ 62.5. Écarts-types : σX ≈ 7.5,
σY ≈ 7.5. Corrélation : r ≈ 0.99.
Nuage de points :
75
Poids (kg) 65
55
160 170 180
Taille (cm)