Statistique Descriptive
Statistique Descriptive
STATISTIQUE
DESCRIPTIVE
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
Chapitre 1 : Généralités
I. Définitions
Réponses 1
1) Le caractère régime matrimonial est qualitatif
2)
Régime Dépouillement Effectif ni Fréquence fi Angle :
matrimonial 360°fréquence
C 25 0,5 180°
M 16 0,32 115,2°
D 4 0,08 28,8°
V 5 0,10 36°
Total 50 1,00 360°
Effectif ni
a) fréquence = ; fi
Effectif total N
ni
La fréquence peut être exprimée en % dans ce cas f i 100
N
La somme des fréquences est toujours égale à 1 ou 100%
ni N
fi
N
N
1
3) Graphique à secteur circulaire
Pour construire ces graphiques, on utilise un cercle 360° . On délimite le cercle en secteur de sorte que les aires
des secteurs soient proportionnelles aux effectifs des différentes modalités du caractère.
Angles = 360° fréquence
Marié D
50 Célibatair
e
40
30 Mariés
veuf
Divorcé
20
10
0 1 2 3 nbre d'enfants
1
0,90
0,80
0,70
0,60
0,50
0,40
0,30 <
0,20
0,10
0 1 2 3 nombre d'enfants
5) Comprendre les expressions : « au moins » ; « moins de » ; « au plus » ; « plus de ».
Au moins veut dire "supérieur ou égal" "au min"
Moins de veut dire "Inférieur" (<)
Au plus veut dire "inférieur ou égal" " au max"
Plus de veut dire "supérieur" (>)
Au moins un enfant : (c’est-à-dire 1, 2 et 3 enfants) 71,25%
Au plus deux enfants (c’est-à-dire 0 ; 1 et 2 enfants): 82,50%
Moins de deux enfants (c’est-à-dire 0 et 1 enfant): 62,5%
Plus d'un enfant (c’est-à-dire 2 et 3 enfants): 37,50%
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
Exemple 3: dépouillement / cas de variables continues
Une enquête sur le poids des élèves d'une classe a donné les résultats suivants:
59 52 60 70 65 74 55 76 66 77 75 53 80
55 82 57 68 70 69 75 75 96 58 72 84 64
78 73 63 87 85 67 74 66 54 86 69 95 86
79 76 56 61 70 62 63 73 73 70 72
1) Quelle est la nature de la variable statistique ?
2) Effectuer le dépouillement suivant les classes: [50, 60]; [60, 70[; [80, 90[; [90,100[.
3) Dresser le tableau statistique des effectifs, fréquences, fréquences cumulées
4) Tracer l'histogramme (cas d'amplitude égale) et le polygone statistique des fréquences.
5) Tracer la courbe cumulative (cas variable continue).
6) Quel est le pourcentage d'élèves qui ont les poids suivants : au moins 70kg; au plus 75kg; moins de 80kg.
Réponse 3:
1) La variable statistique est continue
2)
Poids kg dépouillement effectif fréquences Fréquences Fréquences
cumulées cumulées
croissantes décroissantes
[50, 60[ 9 0,18 0,18 1
[60, 70[ 13 0,26 0,44 0,82
[70, 80[ 19 0,38 0,82 0,56
[80, 90[ 7 0,14 10,96 0,18
[90, 100[ 2 0,04 1,00 0,04
Total 50 1,00 X
N.B.: Dans le cas des variables continues, les valeurs du caractère sont des intervalles de classes [a, b[ où a
est inclus et b est exclus. La différence entre les deux bornes s'appelle amplitude.
Par exemple [50, 60[Amplitude est 60 - 50 = 10.
4) Histogramme
Cas d'amplitude égale
On porte en abscisse les bornes des intervalles de classes. On construit des rectangles juxtaposés ayant pour
largeur l'amplitude de la classe et pour hauteur une longueur proportionnelle à l'effectif (ou fréquence) de la
classe.
L'histogramme est la ligne polygonale entourant les rectangles. Les aires des rectangles sont proportionnelles
aux effectifs.
Cas d'amplitude inégale
Pour cela on choisit une classe étalon d'amplitude a0 (la plus petite amplitude). On calcule pour chaque classe
les fréquences (ou effectifs) rectifiées.
Effectif plus petiteamplitude n a0
Effectif rectifié = n’i = i
amplitudedela classe ai
0,40
0,36
0,62
0,28
0,24
0,20 polygone statistique
0,16
0,12
0,08
0,04
50 60 70 80 90 100
5) Courbe cumulative: (cas des variables continue)
C'est la fonction de répartition continue non décroissante de
[0, 1]
x F(x) = f1 + f2 + f3 + ……….. + fi
x < 50 F(x) = 0
x = 60 F(x) = 0,18
x = 70 F(x) = 0,44
x = 80 F(x) = 0,82
x = 90 F(x) = 0,96
x 100 F(x) = 1,00
N.B.: elle est tracée en fonction des fréquences cumulées croissantes en considérant les bornes supérieures
des intervalles.
1,00
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
50 60 70 80 90 100 poids kg
6) au moins 70 kgs : 56%
au plus 75 kgs : 70%
moins de 80 kgs : 82%
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
Exemple 4: Variables continues / Amplitudes inégales
La répartition des quatre vingt travailleurs d'une entreprise suivant leurs âges est donnée par le tableau suivant
:
Ages années [20, 25[ [25, 30[ [30, 35[ [35, 45[ [45, 60[
Fréquences 0,25 0,0625 … 0,125 0,375
1) Reconstituer les effectifs rectifiés ;
2) Calculer les fréquences cumulées croissantes ;
3) Tracer l'histogramme et le polygone des fréquences ;
4) Tracer la courbe cumulative.
Réponse 4 : La variable statistique est continue
Ages Effectif Fréquences Fréquences cumulées croissantes Fréquences rectifiées
[20, 25[ 20 0,25 0,25 0,25
[25, 30[ 5 0,0625 0,3125 0,0625
[30, 35[ 15 0,1875 0,5000 0,1875
[35, 45[ 10 0,125 0,6250 0,1255/10 = 0,0625
[45, 60[ 30 0,375 1,00 0,3755/15 = 0,125
Total 80 1,000 X X
fré quence plus petiteamplitude
Fréquence rectifiée =
amplitudedela classe
3) Histogramme : amplitude inégale
Pour tracer l'histogramme, il faut commencer par rectifier les fréquences (ou effectifs) lorsque ces amplitudes
sont inégales.
Noter bien : La fréquence rectifiée est utilisée exclusivement dans le cas de l'histogramme ou du calcul de
mode.
0,2500
0,125
0,06250
20 25 30 35 40 45 50 55 60
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
1,00
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
20 25 30 35 40 45 50 55 60 âges
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
Si l'effectif total est pair, N = 2K la médiane n'est pas une valeur du caractère mais elle vaut
xk xk 1
Me’ =
2
Par exemple : N = 20 la médiane correspond au 10,5ième individu.
Cas des variables statistiques continues
La médiane est la valeur du caractère pour laquelle la courbe cumulative prend la valeur (1/2) :
1
f ( xi )
La médiane: Mé x x
i i 1
x
i
2
f ( xi 1) f ( xi )
A partir des fréquences cumulées croissantes on détermine un encadrement de ½ : f(x i) < ½ < f(x i+1)
et la classe médiane [x i, xi+1[ : x i < Mé < xi+1.
Exemple 5: On donne la répartition des élèves suivants, le nombre de frères
Nombre de frères 1 2 3 4 5 Total
effectifs 10 5 15 7 8 45
TAF:
1) Quelle est la nature de la variable statistique?
2) Déterminer le mode et la médiane
Réponse 5
1) la variable statistique est discrète ;
2) le mode = 3 frères (qui correspond à l'effectif le plus élevé)
Réponse 7:
Le mode: la classe modale [160, 165[, correspond à la fréquence rectifiée la plus élevée. Classe modale
160 165
[160, 165[ , le mode = = 162,5 cm
2
La médiane:
1
f ( xi )
Mé x
i
x i 1
x
i
2
f ( xi 1) f ( xi )
A partir des fréquences cumulées croissantes ½ est entre 0,3375 et 0,5625 (0,3375 < ½ < 0,5625) ce
qui correspond à la classe médiane [160, 165[, alors 160<Mé<165 : 160 < Me < 165 et 0,3375 < ½ <
0,5625
( 165 160 )( 50% 33 ,75%)
Me' = 160 + = 163,61 cm
56 ,25% 33 ,75%
III. Les Quantiles, déciles et centiles (caractéristique de position)
Les quantiles c’est la division d'une distribution statistique en quatre parties égales : Q1, ( ¼ ) ;
Q2, ( ½ ) ; Q3 ( ¾ )
i
f ( xi )
Q x xi 1 x f (4
i i i
x ) f ( xi )
i 1
Note : Q2 = médiane
Remarques : (caractéristiques de dispersion)
Ecart interquartile absolu : ea = Q3 - Q1.
Ecart interquartile relatif : er = (Q3 - Q1.) / Q2
si er est grand on peut dire que la population est dispersée..
Exemple 8 : A partir de l'exemple 7 calculer l'intervalle interquartile.
Réponse 8:
Q1 : fréquences cumulées ¼ est entre 0,2125 et 0,3375 correspondant à la classe [155, 160[ : 155 <
Q1 < 160 et 0,2125 < ¼ < 0,3375
( 160 155 )( 25% 21,25%)
Q1 = 155 + = 156,5 cm
33 ,75% 21,25%
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
Q3 : fréquences cumulées ¾ est entre 0,5625 et 0,8125 correspondant à la classe [165, 175[ : 165 <
Q3 < 175 et 0,5625 < ¾ < 0,8125
( 175 165 )( 75% 56 ,25%)
Q3 = 165 + = 172,5 cm
81,25% 56 ,25%
Les déciles :
Les déciles c’est la division d'une distribution statistique en dix parties égales : D1, ; D2, ; D3, ; D4, ; D5, ;
D6, ; D7, ; D8, ; D9, .
i
(b a )( f ( a ))
Di = = a + 10
f (b) f ( a )
Les centiles :
Les déciles c’est la division d'une distribution statistique en cent parties égales : C1, ; C2, ; C3, ; …… ;
D99 ;
i
(b a )( f ( a ))
Ci = = a + 100
f (b) f ( a )
1. La moyenne arithmétique X
Soient les valeurs x1, x2, x3, …….., xn
X
x1 x2 x3 xn
xi
n n
Exemple 9 : 3, 5, 7, 8, 9
3 5 7 8 9 32
X = 6,4
5 5
a b c
Exemple 10 : a, b, c X
3
Cas des tableaux statistiques
X
n1 x1 n2 x2 n3 x3 nk x k
ni xi
n n
N.B.: Dans le cas des variables continues c'est-à-dire des intervalles de classes le caractère xi sera le
a b
centre de classe x i . [a, b[ centre x i .
2
La moyenne arithmétique par changement d'origine et d’échelle :
On pose yi
x i x0
avec X = h Y +x0 et Y
ni y i
h n
x0 : c'est une valeur centrale du caractère xi.
h : c'est la plus petite amplitude des classes .
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
Retenons bien :
Si Y = ax + b la moyenne arithmétique Y = a X + b
Si Z = ax + by la moyenne arithmétique Z = a x + by
X X
Si Z i la moyenne arithmétique de Z : Z i
h h
Exemple : Calculer la moyenne de Z :
X 5 2X XX X 2X
a) Z b) Z c) Z d) Z
i
2 i
5 i
i
2
2. La moyenne géométrique X G
Soient les valeurs x1, x2, x3, ….., xn
X G n x1 x2 x3 xn
Exemple 11 : 3, 5, 7, 8, 9 X G 5 3 5 7 8 9 = 5,966
Exemple 12 : a, b, c X G 3 a b c
Cas de tableaux statistique
n n n n
X G n x1 1 x2 2 x3 3 xk k
ni ln xi
Dans la pratique, on utilise ln X G
n
N.B.: ln "logarithme népérien" ln X = a X = ea
Retenons bien :
Si Y = ax la moyenne géométrique de Yg : Y g= a XG
Si Z = axα la moyenne géométrique de Z : Z a. X G
Exemple : Calculer la moyenne de Z :
X2 2X
a) Zi b) Zi
2 5
3. Moyenne harmonique X H
Soient les valeurs x1, x2, x3, … , xn
n n
XH
xi
1 1 1 1 1
x1 x2 x3 xn
Exemple 13 : 3, 5, 7, 8, 9 5 = 5,48
X H
1 1 1 1 1
3 5 7 8 9
Exemple 14 : a, b, c 3
XH
1 1 1
a b c
Cas de tableaux statistique
n n
X H
n1 n2 n3 n n
x1 x2 x3
k
xk xii
Retenons :
1
Si Y = 1/X la moyenne harmonique de X : X H
Y
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
4. Moyenne quadratique X q
Soient les valeurs x1, x2, x3, …, xn
Xq
x12 x 22 x32 x n2
x 2
i
n n
Exemple 15 : 3, 5, 7, 8, 9 X q
32 5 2 7 2 8 2 9 2
6,75
5
La formule développée V (X )
n x i
2
i
(X )2
n
V ( X ) X 2 ( X ) 2 , la moyenne des carrés - le carré des moyennes
V ( X ) 1 1
n n
Par exemple : 3, 5, 7, 8, 9
32 5 2 7 2 8 2 9 2 357 89
2
V ( X ) 39,2
5 5
V(X) = 39,2 l'écart type = 39,2 6,26
h n
h
x0 : c'est une valeur centrale du caractère xi.
h : c'est la plus petite amplitude des classes .
Remarques
1. la variance V(X) 0 (positive ou nulle)
2. l'écart type (X) = V (X )
3. V(X) = ( X q ) 2 ( X ) 2 (moyenne quadratique au carré - moyenne arithmétique au carré.
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
V. Les moments (caractéristique de dispersion)
On appelle moment d'ordre r par rapport à la valeur "a" le nombre r pré-indicer "r" par a (amr) tel que
amr
n (x i i a) r
n
En exposant a = 0 Moments non centrés d'ordre "r" mr.
mr
n x i
r
i
si r=0 m0
n 1
i
si r=1 m1
ni x i X
n
si r=2 m2
ni xi2 ( X q ) 2
n
Retenons :
le moment centré de Z : Z x X
r
X
Si Z i
r
h r r
h
En supposant a = X Moments centrés d'ordre "r" : X
r
X
n (x i i X) r
r n
Si r = 0 0 = 1
Si r = 1 1 = 0
Si r = 2 2 = V(X)
Retenons :
le moment centré de Z : Z x X
r
X
Si Z i
r
h r r
h
Exemple : Calculer le moment centré de Z :
X 5 2X XX X 2X
a) Z b) Z c) Z d) Z
i
2 i
5 i
i
2
e
X i
Mé ni
ou e Mé fi . C’est le plus petit des écarts moyens.
n X i
e
X m n
i i
ou e X im fi
n i
élevée).
n x
2
x
Ecart quadratique moyen ou écart type : C’est la mesure de dispersion la
i i
X
i 1
n
plus utilisée.
Coefficient de variation
C’est le rapport de l’écart type à la moyenne arithmétique CV (x)= x
. Il n’a pas d’unité de
x
mesure et il est invariant par changement d’échelle.
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
X
X
2
X
X 2
la moyenne arithmétique ; la variance v(x)
n n
Exemple 1 : Soit une population statistique ayant été étudiée à un double point de vue x et y :
Xi 8 3 5 4 0
yj 1 3 2 1 1
1/ Calculer le coefficient de corrélation linéaire entre X et Y.
2/ Donner l’équation de la droite de régression de Y en X (méthode des moindres carrés) ;
Réponse :
Xi 8 3 5 4 0 20
Yi 1 3 2 1 1 8
X² 64 9 25 16 0 114
Y² 1 9 4 1 1 16
X.Y 8 9 10 4 0 31
1/ Le coefficient de corrélation
Cov( x, y ) = -0,2 / [2,608 * 0,8] = -0,096
R xy
x y
Cov( x, y )
X .Y X x Y = 31/5 – (20/5)x (8/5) = -0,2 ;
n n n
X
²
n
n
Y ² Y
2
Y
²
n n = (16/5) – (8 /5 )² = 0,64 et σy = 0,8
2/ la droite de régression :
Y = a + b X avec b = Cov (x,y) / V(x) = -0,0956 / 6,8 = -0,014
a = Y – bX = 1,6 – (-0,014) x 5 = 1,67
Y = 1,67 - 0,014 X
Exemple 2 : soit le tableau suivant
Yj 1 2 3 4 5 Total
Xi
1 3 2 1 0 1 7
2 1 0 1 2 1 5
3 2 1 3 2 3 11
Total 6 3 5 4 5 23
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
1°) Calculer x ; y ; v(x) et v(y) 2°) Calculer Cov (x,y) et coefficient de corrélation r x y
Solution 2 :
xi ni ni xi ni xi2 yj nj Nj yj nj y 2j
1 7 7 7 1 6 6 6
2 5 10 20 2 3 6 12
2 11 33 99 3 5 15 45
total 23 50 126 4 4 16 64
5 5 25 125
Total 23 68 252
x = 50/23=2,17 y = 68/23=2,957
v(x) = 126/23 – (2,17)2=0,769 v(y) = 252/23 – (2,957)2 = 2,213
x = 0,877 x = 1,488
Cov (x , y) = E (x* y) – E(x) . E(y)
Retenons que E (x) = X ; E (y) = Y soit l’espérance mathématique
A partir du tableau à double entrée (voir l’énoncé) calculons
1 3 1 1 2 2 1 1 3 1 0 4 1 1 5 2 1 1 2 0 2 2 1 3
E(x * y) 23
2 2 4 2 1 5 3 2 1 3 1 2 3 3 3 3 2 4 3 3 5
E(x * y) 157 / 23 6,826
Cov (x, y) = E (x*y) – E (x). E(y) = 6,826 - 2,17 x 2,957 = 0,409
N.B. La covariance peut être positive, négative ou nulle
Si Cov (x , y) = 0 alors x et y sont indépendantes
Si Cov (x , y) > 0 alors x et y varient dans le même sens
Si Cov (x , y) < 0 alors x et y ne varient pas dans le même sens.
* Le coefficient de corrélation
R XY
Cov(x , y) /x.y 0,409 / 0,887 1,488 0,314
N.B. –1 < r x y < 1
Si r x y est = 1 alors x et y sont fortement corrélées ;
Si r x y est = 0 alors x et y sont indépendantes.
Retenons bien ceci : E(x) l’espérance mathématique de x
v (x) la variance de x
E(ax) = a E(x)
E (ax + by) = a E(x) + b E(y)
V(ax) = a2 v(x)
V(ax + by) = a2 V(x) + b2 V(y) + 2ab Cov(x,y)
E(3x + 4y) = 3 E(x) + 4 E(y)
V (3x + 4y) =9 V(x) + 16 V(y) + 2 x 3 x 4 Cov(x,y).
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
Exemple 3 :
A partir du tableau suivant calculer
a) E(x) ; E(y) ; V(x) ; V(y) ; Cov(x,y) ; r x y
b) On pose Z = 3x + 4y ; T = x – y ; W = x + 2y
Calculer E(z) ; E(T) ; E (w) ; V(z) ; V(T) ; V(w)
Réponses 3 : Vous disposez des résultats, on vous demande de tester votre niveau
a) E(x) = 42/12 E(y) = 27/12 V(x) = 29/12 V(y) = 8,25/12
Cov(x,y) = 1,5/12 r x y = 0,075
b) E(z) = 3 E(x) + 4 E(y) ; E(T) = E(x) – E(y) ; E(w) = E(x) + 2 E(y)
V(z) = 9 V(x) + 16 V(y) + 2 x 3 x 4 Cov (x , y)
V(T) = V(x) + V(y) + 2 Cov (x , y)
V(w) = V(x) + 4V(y) + 4 Cov (x , y)
Retenons : V(-x) = (-1)2 V(x) = V(x) alors V(-ax) = V(ax) = a2V(x)
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
Régression simple
2.I.- Les distributions statistiques à deux variables
Une série statistique à deux variables est une série pour laquelle deux
caractères mesurables sont relevés pour chaque individu.
Tableau des distributions statistiques à deux variables
Les distributions statistiques se présentent sous formes :
1er tableau : Tableau à simple entrée
La variable Xi X1 X2 X3 X4 X5
La variable Yj Y1 Y2 Y3 Y 4 Y5
̅; 𝒀
Calculs des variables : 𝑿 ̅ ; 𝝈𝒙 , 𝝈𝒚 ; 𝑪𝒐𝒗 (𝒙, 𝒚)
∑ 𝑋𝑖 𝑋1 +𝑋2 +𝑋3 + ……+𝑋𝑛
̅=
la moyenne arithmétique de X : 𝑋 =
𝑛 𝑛
∑ 𝑌𝑖 𝑌1 +𝑌2 +𝑌3 + ……+𝑌𝑛
̅=
la moyenne arithmétique de Y : 𝑌 =
𝑛 𝑛
∑ 𝑋𝑖2
la variance de X : 𝑉(𝑋) = − (𝑋̅)² l’écart type 𝝈𝒙 = √𝑽(𝒙)
𝑛
∑ 𝑌𝑖2
la variance de Y : 𝑉(𝑌) = − (𝑌̅)² l’écart type 𝝈𝒚 = √𝑽(𝒚)
𝑛
∑ 𝑋∗𝑌
la covariance de X et Y : 𝐶𝑜𝑣(𝑋, 𝑌) = − (𝑋̅ ∗ 𝑌̅)
𝑛
𝐶𝑜𝑣 (𝑋,𝑌)
le coefficient de corrélation X et Y : 𝑅𝑥𝑦 = −1 ≤ 𝑅𝑥𝑦 ≤ +1
𝜎𝑥 ∗ 𝜎𝑦
Analyse de la covariance :
Si cov (X,Y) est = 0 : les variables X et Y sont indépendantes
Si cov (X,Y) est = + : les variables X et Y évoluent dans le même sens
Si cov (X,Y) est = - : les variables X et Y évoluent dans le même sens
La droite d’ajustement Y= ax + b par la méthode des moindres carrés
ordinaire MCO :
La droite de tendance 𝒀(𝒙) = 𝒂 ∗ 𝒙 + 𝒃 par la méthode linéaire
Formule de calcul de : 𝒀 = 𝒂 ∗ 𝒙 + 𝒃 par la méthode linéaire
∑ 𝑋∗𝑌−𝑛∗𝑋̅ ∗𝑌̅ ∑𝒙 ∑𝒚
𝑎= ̅− 𝒂∗𝒙
et 𝒃 = 𝒀 ̅ avec 𝒙
̅ = 𝒊 et 𝒚̅= 𝒊
∑ 𝑋 −𝑛 ̅
2 2
𝑋 𝒏 𝒏
Exemple : une enquête portant sur le nombre d’enfants (X) et le nombre de frères (Y) des
employés d’une entreprise a donné les résultats suivants :
7 employés ont 1 enfant et 1 frère ; 6 employés ont 2 enfants et 2 frères;
5 employés ont 1 enfant et 2 frères 3 employés ont 2 enfants et 3 frères
4 employés ont 1 enfant et 3 frères ; 4 employés ont 3 enfants et 1 frère ;
8 employés ont 2 enfants et 1 frère 1 employé a 3 enfants et 2 frères
2 employés ont 3 enfants et 3 frères ;
Construire le tableau à double entrée :
X 1 2 3 Total
Y des effectifs de Y
1 7 8 4 19
2 5 6 1 12
3 4 3 2 9
Total des effectifs de X 16 17 7 40
Exemple 2 : soit le tableau suivant
Yj 1 2 Total
Xi
1 3 2 5
2 1 0 1
3 1 1 2
Total 5 3 8
1/ Calculer les variables : 𝑋̅ ; 𝑌̅; 𝜎𝑥 , 𝜎𝑦 ; 𝐶𝑜𝑣 (𝑥, 𝑦)
2/ Calculer le coefficient de corrélation linéaire entre X et Y.
3/ Donner l’équation de la droite de régression de Y en X (méthode des moindres carrés) ;
Réponses :
Distribution marginale de Y
Distribution marginale de X Yj nj Ni*Yi Ni*Yi²
Xi ni Ni*Xi Ni*Xi² 1 5 5 5
1 5 5 5 2 3 6 12
2 1 2 4 Total 8 11 17
3 2 6 18 ∑ 𝑛𝑖 ∗ 𝑦𝑖 11
Total 8 13 27 𝑌̅ = = = 1,375
∑ 𝑛𝑖 ∗ 𝑥𝑖 13 𝑛 8
𝑋̅ = = = 1,625 17
𝑛 8 𝑉(𝑦) = − (1,375)² = 0,23
8
27 L’écart type de Y = 0,48
𝑉(𝑥) = − (1,625)² = 0,74
8
1,890625
L’écart type de X = 0,86
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
∑ 𝑛𝑖𝑗 ∗𝑋𝑖 ∗𝑌𝑗
Covariance 𝐶𝑜𝑣 (𝑋, 𝑌) = − 𝑋̅ ∗ 𝑌̅
𝑛
1∗3∗1+1∗2∗2+2∗1∗1+2∗0∗2+3∗1∗1+3∗1∗2
Covariance 𝐶𝑜𝑣 (𝑋, 𝑌) = − 1,625 ∗ 1,375 = 0,02
8
𝐶𝑜𝑣 (𝑋,𝑌) 0,02
Le coefficient de corrélation X et Y : 𝑅𝑥𝑦 = = = 0,048
𝜎𝑥 ∗ 𝜎𝑦 0,86∗0,48
La droite de régression :
Formule de calcul de : 𝒀 = 𝒂 ∗ 𝒙 + 𝒃 par la méthode linéaire
∑ 𝑋∗𝑌−𝑛∗𝑋̅ ∗𝑌̅ ∑ 𝒙𝒊 ∑ 𝒚𝒊
𝑎= et 𝒃 = ̅
𝒀 − 𝒂 ∗ ̅
𝒙 avec ̅
𝒙 = et ̅
𝒚 =
∑ 𝑋 −𝑛 ̅
2 2𝑋 𝒏 𝒏
𝐶𝑜𝑣(𝑋, 𝑌) ∑ 𝑋 ∗ 𝑌 − 𝑛 ∗ 𝑋̅ ∗ 𝑌̅ 0,02
𝑎= = = = 0,027
𝑉(𝑋) ∑ 𝑋 2 − 𝑛 ̅𝑋 2 0,74
̅− 𝒂∗𝒙
et 𝒃 = 𝒀 ̅ = 𝟏, 𝟑𝟕𝟓 − (𝟎, 𝟎𝟐𝟕) ∗ (𝟏, 𝟔𝟐𝟓) = 𝟏, 𝟑𝟑 Y = 1,33 - 0,027 X
74
2
8
2
Compléter ce tableau sachant que : X 21/ 5 ; Y 3 ; X 25 ; Y
Compléter le tableau Calculer le coefficient de corrélation entre X et Y ;
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
TOTAL
xi 0 1 2 3 4 10
Les points essentiels de Statistique Descriptive ***Bemba B TRAORE 76 43 95 33
yi 398 451 423 501 673 2446
Soit G1 le point moyen de E1
10 2446
x G1 = 2 et y G1 = 489,2 donc
5 5
G1 (2 ; 489,2) 1 point
Soit E2 le sous nuage formé des 5 derniers points du nuage
TOTAL
xi 5 6 7 8 9 35
yi 398 451 423 501 673 6235
Soit G2 le point moyen de E2
35 6235
x G2 = 7 et y G 2 = 1247 , donc
5 5
G2 (7 ; 1247) 1 point
Soit : y = ax + b, la droite d’ajustement affine.
G1 489,2 2a b
On a :
G2 1247 7 a b
On obtient a = 151,56 et b = 186,08. Donc la droite d’ajustement affine de y en x par la méthode
de MAYER a pour équation :
y = 151,56x + 186,08 2 points
3° Prévision des dépenses pour l’année 2005.
L’année 2005 correspond au rang
x = 15 0,5 point
Pour x = 15, y = 151,56 15 + 186,08 = 2 459, 48
La prévision des dépenses en 2005 est estimée à 2 459,48 millions 0,5 point