USTHB/Faculté des Mathématiques 2022/2023
2ème Année GP
Série d’exercice 2 : Statistique double
Exercice 1 :
Le tableau suivant indique la répartition de 100 logements d’une cité, en fonction de l
nombre Y de pièces principales et leur surface X exprimée en m2.
1 2 3 4 5 .
X
40 8
50 6 2
60 4 8 5
70 4 6 2
80 12 4 6
90 5 10
100 10 8
.
1. Déterminer le nombre de logements de 4 pièces dont la surface est supérieure
à 70 m2 .
2. Quel est le pourcentage de logements de superficie ≤ 80 m2 ?
3. Etablir la distribution des marginales X et Y.
4. Calculer la surface moyenne de l’ensemble des logements.
et
5. Calculer et donner les significations des fréquences: conditionnelles
/ /
6. Calculer la surface moyenne des logements de 5 pièces.
Sol 1 :
1 2 3 4 5 . .
X
40 0 8 0 0 0 8 0,08
50 0 6 2 0 0 8 0,08
60 0 4 8 5 0 17 0,17
70 0 0 4 6 2 12 0,12
80 0 0 12 4 6 22 0,22
90 0 0 0 5 10 15 0,15
100 0 0 0 10 8 18 0,18
. 0 18 26 30 26 100
. 0 0,18 0,26 0,30 0,26 1
1
1. Déterminer le nombre de logements de 4 pièces dont la surface est supérieure
à 70 m2 .
+
+ = logements
Le nombre de logements de 4 pièces dont la surface est supérieure à 70 m2 est :
2. Quel est le pourcentage de logements de superficie ≤ 80 m2 ?
+ + + +
%= × %= %
3. Etablir la distribution des marginales X et Y :
40 50 60 70 80 90 100 Tot
. 8 8 17 12 22 15 18 50
. 0,08 0,08 0,17 0,12 0,22 0,15 0,18 1
1 2 3 4 5 Tot
. 0 18 26 30 26 50
. 0 0,18 0,26 0,30 0,26 1
4. Calculer la surface moyenne de l’ensemble des logements :
" "
= ! =! = !
= #$ × %+$ × %+$ × %+$ × %+$ × %+$ × %
+$ × %& = , (
et
5. Calculer et donner les significations des fréquences: conditionnelles
/ /
= = = = ,
)
/ )
.
/ = = = = ,
.
6. Calculer la surface moyenne des logements de 5 pièces.
/* = ! + = #$ × %+$ × %+$ × %+$ × %&
.
= , )(
2
Exercice 2 :
Un statisticien fait une enquête sur 100 cadres d’une entreprise et cherche à établir
le lien pouvant exister entre l’âge des cadres et le salaire mensuel perçu. Il présente
ses résultats dans un tableau de contingence, la variable statistique X représente
l’âge tandis que la variable Y représente le salaire en milliers de dinars.
Y
[22-26[ [26-30[ [30-34[ [34-38[ [38-42[ ni .
X
[30-36[ 3 4 10 1 0
[36-42[ 0 2 0 9 0
[42-48[ 6 4 2 2 2
[48-54[ 6 8 10 0 4
[54-60[ 0 8 10 4 5
n. j
1. Que représentent la colonne . et la ligne . ?
2. Donner le pourcentage des cadres dont le salaire est supérieur à 26000 DA.
3. Parmi les cadres ayant plus de 42 ans, donner le pourcentage de ceux qui
perçoivent moins de 30000 DA.
, , , et
4. Calculer et donner les significations de :
. .) / ) )/
5. Donner la distribution conditionnelle de X sachant que Y [26-30[ et
calculer sa moyenne.
6. Donner la distribution conditionnelle de Y sachant que X 48 ,54 .
7. X et Y sont-elles indépendantes ?
Sol 2 :
[22-26[ [26-30[ [30-34[ [34-38[ [38-42[ . .
Ci X
33 [30-36[ 3 4 10 1 0 18 0,18
39 [36-42[ 0 2 0 9 0 11 0,11
45 [42-48[ 6 4 2 2 2 16 0,16
51 [48-54[ 6 8 10 0 4 28 0,28
57 [54-60[ 0 8 10 4 5 27 0,27
. 15 26 32 16 11 100
. 0,15 0,26 0,32 0,16 0,11 1
1. Que représentent la colonne . et la ligne . ?
La colonne . représente l’âge tandis des cadres d’une entreprise
La ligne . représente le salaire des cadres en milliers de dinars
2. Donner le pourcentage des cadres dont le salaire est supérieur à 26000 DA.
%=$ , + ,) + , + , %× = %
ou %=$ + , %× = %
3
3. Parmi les cadres ayant plus de 42 ans, donner le pourcentage de ceux qui
perçoivent moins de 30000 DA
+ + + +
%= × %=) %
, , , et
4. Calculer et donner les significations de :
. .) / ) )/
= = = ,
.
.
,
) % des cadres ont l'âge entre 48 et 54
= = = ,
,
% des cadres ont l'âge entre 36 et 42 et salaire entre 34000 et 38000 DA
)
= = = ,)
.)
.)
,
) % des cadres ont le salaire entre 30000 et 34000 DA
= = = ,
)
/ )
).
Parmi les cadres l'âge entre 42 et 48, il ya % ont le salaire entre 30000 et
34000 DA
= = = ,
)
)/
.
% des cadres ont l'âge entre 42 et 48 sachant que leur salaire est compris
entre 26000 et 30000 DA
5. Donner la distribution conditionnelle de X sachant que Y [26-30[ et
calculer sa moyenne:
/* * [30-36[ [36-42[ [42-48[ [48-54[ [54-60[ Tot
4 2 4 8 8 26
= , = , 0,15 0,3 0,3 1
/* * = ∑ . = #$ × ))% + $ × ) % + $ × %+$ × %+$ × %& =
.
, ) / 0 (. sont les centres de classes)
L'âge moyen des cadres sachant que leur salaire entre 26000 et 30000
DA est 48 ans
6. Donner la distribution conditionnelle de Y sachant que X 48 ,54
/+ + [22-26[ [26-30[ [30-34[ [34-38[ [38-42[ Tot
6 8 10 0 4 28
4
= , = , 0,35 0 0,14 1
/+ + = ! . .′ = #$ × %+$ × %+$ ×) %+$ × %&
.
=) , 23443567 85 839:67
Le salaire moyen des cadres sachant que leurs âge entre 48 et 54 ans est 30 en
milliers de dinars
7. X et Y sont-elles indépendantes ?
= = . = = , . = = ,
. × . = , × , = , ≠
Alors X et Y ne sont pas indépendants.
Exercice 3 :
A la fin de l’année universitaire, on a noté la moyenne générale X obtenue et le
nombre de module acquis sur les 9 modules de l’année Y de 20 étudiants non
admis. on a obtenu les résultats suivants
Valeurs de X 1 4 6 5 8.5 4.5 8 8.5 5.5 3 8.5 6 8.5 7 9 5.5 9 8 9 6
Valeurs de Y 0 1 3 2 4 1 3 4 2 0 1 2 3 2 4 1 3 2 4 3
1- Représenter graphiquement la série (X,Y). Que peut-on dire sur la liaison entre
X et Y.
2- Répartir le caractère X en classes de même amplitude.
3- Compléter le tableau de contingence suivant:
Y ni .
X
[ , [
[ , [
[ , [
[ , [
n. j
4- Les caractères X et Y sont-ils indépendants?
5- Calculer la covariance entre X et Y.
6- Calculer le coefficient de corrélation linéaire. Que peut- on conclure ?
7- Donner l’équation des deux droites de régression. Tracer les deux droites dans
un repère orthonormé. Que peut-conclure ?
5
8- Comment peut- on prévoir la moyenne générale d’un étudiant qui a 5 modules
acquis?
Sol 3:
1- Représenter graphiquement la série (X,Y). Que peut-on dire sur la liaison entre
X et Y :
2- Répartir le caractère X en classes de même amplitude :
− − − − −
<(= = = = = = = =
(/+ ( (/+ ( (/+ (
? √, √, √ √
3- Compléter le tableau de contingence suivant
0 1 2 3 4
Ci X
2 [1-3[ 1 0 0 0 0 1 0,05
4 [3-5[ 1 2 0 0 0 3 0,15
6 [5-7[ 0 1 3 2 0 6 0,30
8 [7-9[ 0 1 2 3 4 10 0,50
2 4 5 5 4 20
0,1 0,2 0,25 0,25 0,2 1
4- Les caractères X et Y sont-ils indépendants?
= = = = = , = = = ,
, ,
$ × = , × , = , %≠$ = %
X et Y ne sont pas indépendants.
6
5- Calculer la covariance entre X et Y.
" ?
ABC = D ! ! E * F−
(les E sont les centres des classes du caractère X)
Première formule pour la covariance
= ! .E = #$ × % + $) × % + $ × % + $ × %& = ,
= ! . * = #$ × % + $ × % + $ × % + $ × )% + $ × %& = ,
AGH = I #$ × × %+$ × × % + $) × × %+$ × × )% + $ × × %+$ × × % + $) ×
+$ × × %&J − , × ,
=I #) &J − , × , = ,) − , = ,
ABC = EKL$ , % = ,
6- Calculer le coefficient de corrélation linéaire. Que peut- on conclure ?
EKL$ , %
M =
N N
O/P$ % = ! .E −
= #$ × % + $) × %+$ × %+$ × %& − ,
= # &− , = ),
N = QO/P$ % = Q), = ,
O/P$ % = ! . * −
= #$ × %+$ × %+$ × %+$ ×) %+$ × %& − ,
= # &− , = , − , = ,
N = QO/P$ % = Q , = ,
EKL$ , % ,
M = = = 0,73
N N , × ,
7
La corrélatoinM est forte $|P| V 0.7% , les deux droites de régression sont très
proches et le nuage peut etre approximé par une droite ( ajustement linéaire ).
7- Donner l’équation des deux droites de régression. Tracer les deux droites dans
un repère orthonormé. Que peut-conclure ?
La droite d'équation W = X Y + Z est appelée droite de régression de Y en
X , obtenue par la méthode des moindre carrés :
EKL $ , % EKL $ , %
$[ % *= + + $* − +%
/
N + N +
EKL $ , % EKL $ , %
$[ % += * + $+ − *%
/
N * N *
EKL $ , % EKL $ , % , ,
$[ % *= + + \* − +] = ++^ , − , _
/
O/P$ % O/P$ % ), ),
= , +− ,
$[ / % *= , +− ,
EKL $ , % EKL $ , % , ,
$[ % += * + \+ − *] = *+^ , − , _
/
O/P$ % O/P$ % , ,
= , )*+ ,
$[ / % += , )*+ ,
Le point d'intersection est le centre de gravité du nuage
8- Comment peut- on prévoir la moyenne générale d’un étudiant qui a 5 modules
acquis?
8
Pour prévoir la moyenne générale , il suffit de remplacer y=5 dans
$[ / % + = , ) * + , = , )$ %+ , = ,)
l'équation de la droite X en Y
Exercice 4 :
Une entreprise qui organise des stages de formation de secrétaires portant sur le
traitement de texte, cherche à évaluer l’efficacité de ce stage. Ce stage est de durée
de 15 jours.
Une enquête statistique incluant plusieurs promotions de stagiaires, a permis
d’obtenir le tableau suivant :
Numéro du jour du stage X 5 6 8 10 11 12 13 15
Nombre d’erreurs de saisie 42 44 30 35 28 27 22 20
par page Y
8 8 8 8 8
2
On donne : x i 80 , yi 248 , xi2 884 ,
i 1 i 1 i 1
yi 8222 , x i yi 2282
i 1 i 1
1- Calculer le coefficient de corrélation linéaire, commenter.
2- Déterminer la droite de régression de Y et X.
3- Si la durée du stage est prolongée de deux jours, quel serait le nombre
d’erreurs de saisie par page au 17ème jour.
Exercice 5:
Un constructeur d’automobiles veut étudier le lien qui peut exister entre la
consommation d’une voiture (Y) en fonction de sa vitesse (X). Les 14 mesures sont
données dans le tableau suivant :
X(km/h) 50 60 70 80 85 90 95 100 105 110 115 120 130 140
Y(L/100 km) 4 4,5 5 4 4,5 5 5,5 6 6 8 9 10 10 12
1. Représenter graphiquement la série (X,Y). Que peut-on dire de la liaison entr
X et Y.
2. On pose Z ln Y ( ln désigne le logarithme Népérien).
On donne :
14 14 14 14
2
14
x i 1350 , zi 25.65 , xi2 139000 , zi 48.81 x i zi 2590.03
i 1 i 1 i 1 i 1 i 1
Déterminer le coefficient de corrélation linéaire entre Z et X. interprétez.
3. Déterminer la droite de régression de Z en X.
4. Peut-on estimer la consommation du véhicule, s’il roule à 150 km/h ?
5. En choisissant 3 classes pour X et 2 classes pour Y de même amplitude pour les
2 variables:
a. Donner le tableau de contingence correspondant aux données initiales.
b. Les variables X et Y sont elles dépendantes ?
c. Calculer les moyennes et les variances marginales X , Y , V X et V Y .
9
d. Calculer la covariance entre X et Y, déduire le coefficient de corrélation
linéaire. commentez.
e. Estimer la consommation d’un véhicule qui roule à 150 km/h ?
6. Quelle est la meilleure prédiction entre les deux estimations calculées.
Sol 5 :
1- Représenter graphiquement la série (X,Y). Que peut-on dire sur la liaison entre
X et Y :
Y(L/100 km)
14
12
10
Y
8
Linear (Y)
6
0 X(km/h)
0 50 100 150
X et Y n'ont pas une liaison linéaire.
EKL$ , `%
2- Déterminer le coefficient de corrélation linéaire entre Z et X :
M`=
N N`
ABC = a ! + b c − $ `%
Deuxième formule pour la covariance
= !+ = # ) &= ,
,
`= !b = # , & = ,)
,
O/P$ % = !+ − = # ) &− , = # &− , = ) ,
N = QO/P$ % = Q ) , = , )
O/P$b% = !b − ` = # , &− ,) = , )
Nb = QO/P$b% = Q , ) = , )
10
ABd = a ! + b c − $ è % = ×$ , )% − , × ,) = ,
=
EKL$ , `% ,
M = = = ,
`
N N` , ) × ,)
La corrélatoin est très forte $ , ≤ P V 1% , l’ajustement linéaire est
accepter
3- Déterminer la droite de régression de Z en X ?
La droite d'équation h = X Y + Z est appelée droite de régression de Z en
X , obtenue par la méthode des moindre carrés :
EKL $ , % EKL $ , %
$[` / % b= + + $` − %
N N
EKL $ , `% EKL $ , `%
$[b / % b= + + \` − +]
O/P$ % O/P$ %
, ,
= ++^ , )− × , _= , ++ ,
) , ) ,
$[` / % b= , ++ ,
= i` = i , +j , (Ecrire Y en fonction de Z et remplacer dans
l’équatioin pour obtenir l’estimation)
l(
"KkP + = ⟹ =i , × j ,
= ), o/ ?(
m
Partie 2 :
− − −
<(=+ = = = =)
(/+ ( (/+ (
? √, )
(/+ − (/+ − −
<(=* = = = =
( (
? √,
a) Compléter le tableau de contingence suivant
c’j 6 10
[4-8[ [8-12[
ci X
2 [1-3[ 3 0 3 0,21
4 [3-5[ 6 0 6 0,43
6 [5-7[ 0 5 5 0,36
11
9 5 N=14
0,64 0,36 1
b) Les caractères X et Y sont-ils indépendants?
)
= = = = = , = = = ,)
, ,
$ × = , × ,) = , ) %≠$ = %
X et Y ne sont pas indépendants.
c) Calculer les moyennes et les variances marginales.
= ! .E = #$ × %+$ × %+$ × %& = ,
= ! . E′ = ,
) )
O/P $ % = ! . $+ − +% = p ! .E q− = ) ), − , = ,
N = ,
O/P $*% = ! . $* − *% = p ! r . E′ sq − = ),
N = ,
d)
)
N = EKL$ , % = t !! E E′ u − ee
= =
=I #$) × × %+$ × × %+$ × × %&J − , × , =) ,
EKL$ , % ) ,
M = = = , ≥ ,
`
N N , × ,
On a une forte corrélatoin alors l'ajustement linéaire est accepté.
e)
12
EKL $ , % EKL $ , %
$[ % = ++\ − +]
/
O/P$ % O/P$ %
) , ) ,
= ++^ , − × , _= , ++ ,
, ,
$[ / % = , ++ ,
l(
"KkP + = ⟹ = , . + , = , o/ ?(
m
La meilleure estimation est = ), o/ ?( car elle est calculée dans le cas
discret.
13