0% ont trouvé ce document utile (0 vote)
43 vues5 pages

Resume Statistique

Le document présente les notions de base des variables statistiques, y compris les types de variables, la représentation graphique par histogramme, et les paramètres de position tels que la moyenne, la médiane et le mode. Il aborde également les paramètres de dispersion, de forme et de concentration, ainsi que l'analyse de séries statistiques doubles à travers la covariance et la corrélation. Des exemples illustrent chaque concept pour faciliter la compréhension des statistiques.

Transféré par

maghribimohammed2
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
43 vues5 pages

Resume Statistique

Le document présente les notions de base des variables statistiques, y compris les types de variables, la représentation graphique par histogramme, et les paramètres de position tels que la moyenne, la médiane et le mode. Il aborde également les paramètres de dispersion, de forme et de concentration, ainsi que l'analyse de séries statistiques doubles à travers la covariance et la corrélation. Des exemples illustrent chaque concept pour faciliter la compréhension des statistiques.

Transféré par

maghribimohammed2
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Résumé Détaillé : Statistiques

realisé par : rafiq ouardani, zakia heyouni, soufian azerar, ayoub zeiker, ayman boukhalkhal.
G : 2 college

1 Notions de base des variables statistiques


Une variable statistique est une caractéristique mesurable sur une population ou un échan-
tillon. Types :
• Qualitative :

– Nominale : sans ordre (ex. : couleur).


– Ordinale : avec ordre (ex. : niveau de satisfaction).

• Quantitative :

– Discrète : valeurs entières (ex. : nombre d’enfants).


– Continue : valeurs réelles (ex. : poids).

Exemple : Série de notes d’un examen pour 10 étudiants :

X = {8, 9, 10, 11, 12, 13, 14, 15, 16, 17}.

2 Représentation graphique : Histogramme


Un histogramme visualise la distribution d’une variable quantitative en regroupant les données
en classes. Chaque barre représente l’effectif (ou la fréquence) d’une classe.
Exemple : Pour les notes {8, 9, 10, 11, 12, 13, 14, 15, 16, 17}, classes : [8-11], [12-15],
[16-19]. Effectifs : 4, 4, 2.

Effectif
4
3
2
1
Notes
[8-11] [12-15] [16-19]

3 Paramètres de position
Les paramètres de position décrivent la tendance centrale ou la répartition des données.

1
3.1 Moyenne
Pn
i=1 xi
x̄ = ,
n
où xi sont les valeurs et n l’effectif total. Exemple :
8 + 9 + 10 + 11 + 12 + 13 + 14 + 15 + 16 + 17 125
x̄ = = = 12.5.
10 10

3.2 Généralisation de la moyenne


La moyenne peut être généralisée à d’autres types :

• Moyenne géométrique : v
u n
uY
n
G= t xi .
i=1

Utile pour des données de croissance (ex. : taux). Exemple : G = 10
8 × 9 × · · · × 17 ≈
12.14.

• Moyenne harmonique :
n
H = Pn 1 .
i=1 xi

Utile pour des données de type vitesse ou ratio. Exemple : H = 1


10
+ 19 +···+ 17
1 ≈ 11.66.
8

• Moyenne quadratique : r Pn
i=1 x2i
Q= .
n
q
Utile pour des données avec variation importante. Exemple : Q = 82 +92 +···+172
10

12.85.

3.3 M Dolores
σ
CV = × 100,

où σ est l’écart-type et x̄ la moyenne. Mesure la dispersion relative. Exemple : σ ≈ 3.11,
x̄ = 12.5, donc CV = 3.11
12.5
× 100 ≈ 24.88%.

3.4 Médiane
Valeur centrale après tri des données.
(
x n+1 si n impair,
Médiane = 2
x n +x n +1
2
2
2
si n pair.

Exemple : Notes triées : {8, 9, 10, 11, 12, 13, 14, 15, 16, 17}. Médiane = 12+13
2
= 12.5.

3.5 Mode
Valeur la plus fréquente. Exemple : Pas de mode (toutes les valeurs sont uniques).

2
3.6 Quartiles
Les quartiles divisent la série triée en quatre parties égales :
• Q1 : 25% des données (premier quartile).
• Q2 : Médiane (50% des données).
• Q3 : 75% des données (troisième quartile).
Formules : Pour une série triée, Q1 = x⌊(n+1)/4⌋ , Q3 = x⌊3(n+1)/4⌋ . Exemple : Pour {8, 9, 10,
11, 12, 13, 14, 15, 16, 17}, n = 10 :
Q1 = x⌊(10+1)/4⌋ = x3 = 10, Q3 = x⌊3(10+1)/4⌋ = x8 = 15.
Relations :
• Écart interquartile : IQR = Q3 − Q1 . Exemple : IQR = 15 − 10 = 5.
• Écart semi-interquartile : SIQR = Q3 −Q1
2
. Exemple : SIQR = 5
2
= 2.5.

4 Paramètres de dispersion
Les paramètres de dispersion mesurent l’étalement des données.

4.1 Étendue
E = max(xi ) − min(xi ).
Exemple : E = 17 − 8 = 9.

4.2 Variance
Pn
i=1 (xi − x̄)2
V = .
n
Exemple :
(8 − 12.5)2 + (9 − 12.5)2 + · · · + (17 − 12.5)2
V = ≈ 9.65.
10

4.3 Écart-type

σ= V.

Exemple : σ = 9.65 ≈ 3.11.

5 Paramètres de forme
Les paramètres de forme décrivent la distribution.

5.1 Asymétrie (Skewness de Fisher)


1
Pn
n i=1 (xi − x̄)3
γ1 = .
σ3
Valeur positive : biais à droite ; négative : biais à gauche ; nulle : symétrique. Exemple :
Pour les notes, γ1 ≈ 0 (distribution approximativement symétrique).

3
5.2 Coefficient de Yule
Q3 + Q1 − 2Q2
SY = .
Q3 − Q1
Mesure l’asymétrie par rapport aux quartiles. Exemple : Q1 = 10, Q2 = 12.5, Q3 = 15,
15 + 10 − 2 · 12.5 25 − 25
SY = = = 0.
15 − 10 5

5.3 Coefficient de Kelly


P90 − P10 P50 − P10
SK = − ,
P90 − P50 P90 − P10
où P10 , P50 , P90 sont les 10e, 50e et 90e centiles. Exemple : Approximativement, P10 ≈ 8,
P50 = 12.5, P90 ≈ 17,
17 − 8 12.5 − 8 9 4.5
SK ≈ − ≈ − = 2 − 1 = 1.
17 − 12.5 17 − 12.5 4.5 4.5
(Valeur indicative, nécessite plus de données pour précision.)

5.4 Aplatissement (Kurtosis)


1
Pn
n i=1 (xi − x̄)4
γ2 = .
σ4
Kurtosis = 3 pour une distribution normale ; > 3 : leptokurtique ; < 3 : platykurtique.
Exemple : Calcul complexe, mais les notes sont proches d’une distribution normale.

6 Paramètres de concentration
La concentration mesure l’inégalité dans la répartition des données.

6.1 Indice de Gini


Pn Pn
i=1 j=1 |xi − xj |
G= .
2n2 x̄
Exemple : Pour une série de revenus {1000, 2000, 5000, 8000},

x̄ = 4000, G ≈ 0.35.

6.2 Courbe de Lorenz


Représentation graphique de la répartition cumulative par rapport à une répartition égale.
Exemple : Pour les revenus, la courbe s’éloigne de la diagonale.

7 Série statistique double


Une série statistique double analyse la relation entre deux variables.

7.1 Covariance
Pn
i=1 (xi − x̄)(yi − ȳ)
Cov(X, Y ) = .
n
4
7.2 Corrélation
Cov(X, Y )
r= , −1 ≤ r ≤ 1.
σX σY
Exemple : Données (taille en cm, poids en kg) : {(160, 55), (170, 65), (175, 70), (180, 75)}.
Moyennes : x̄ = 171.25, ȳ = 66.25. Covariance : Cov(X, Y ) ≈ 62.5. Écarts-types : σX ≈ 7.5,
σY ≈ 7.5. Corrélation : r ≈ 0.99.
Nuage de points :

75

Poids (kg) 65

55

160 170 180


Taille (cm)

Vous aimerez peut-être aussi