100% ont trouvé ce document utile (2 votes)
4K vues13 pages

Corrige Serie Stat Double

Ce document présente deux exercices de statistique. Le premier concerne un tableau croisé sur les logements en fonction de leur surface et nombre de pièces. Le second concerne un lien entre l'âge et le salaire de cadres via un autre tableau croisé. Les questions portent sur le calcul de pourcentages, distributions marginales, moyennes conditionnelles et indépendance.

Transféré par

Brahim Mell
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (2 votes)
4K vues13 pages

Corrige Serie Stat Double

Ce document présente deux exercices de statistique. Le premier concerne un tableau croisé sur les logements en fonction de leur surface et nombre de pièces. Le second concerne un lien entre l'âge et le salaire de cadres via un autre tableau croisé. Les questions portent sur le calcul de pourcentages, distributions marginales, moyennes conditionnelles et indépendance.

Transféré par

Brahim Mell
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

USTHB/Faculté des Mathématiques 2022/2023

2ème Année GP
Série d’exercice 2 : Statistique double
Exercice 1 :
Le tableau suivant indique la répartition de 100 logements d’une cité, en fonction de l
nombre Y de pièces principales et leur surface X exprimée en m2.
1 2 3 4 5 .
X
40 8
50 6 2
60 4 8 5
70 4 6 2
80 12 4 6
90 5 10
100 10 8
.

1. Déterminer le nombre de logements de 4 pièces dont la surface est supérieure


à 70 m2 .
2. Quel est le pourcentage de logements de superficie ≤ 80 m2 ?
3. Etablir la distribution des marginales X et Y.
4. Calculer la surface moyenne de l’ensemble des logements.

et
5. Calculer et donner les significations des fréquences: conditionnelles
/ /
6. Calculer la surface moyenne des logements de 5 pièces.
Sol 1 :
1 2 3 4 5 . .
X
40 0 8 0 0 0 8 0,08
50 0 6 2 0 0 8 0,08
60 0 4 8 5 0 17 0,17
70 0 0 4 6 2 12 0,12
80 0 0 12 4 6 22 0,22
90 0 0 0 5 10 15 0,15
100 0 0 0 10 8 18 0,18
. 0 18 26 30 26 100
. 0 0,18 0,26 0,30 0,26 1

1
1. Déterminer le nombre de logements de 4 pièces dont la surface est supérieure
à 70 m2 .
+
+ = logements
Le nombre de logements de 4 pièces dont la surface est supérieure à 70 m2 est :

2. Quel est le pourcentage de logements de superficie ≤ 80 m2 ?


+ + + +
%= × %= %

3. Etablir la distribution des marginales X et Y :

40 50 60 70 80 90 100 Tot
. 8 8 17 12 22 15 18 50
. 0,08 0,08 0,17 0,12 0,22 0,15 0,18 1

1 2 3 4 5 Tot
. 0 18 26 30 26 50
. 0 0,18 0,26 0,30 0,26 1

4. Calculer la surface moyenne de l’ensemble des logements :


" "

= ! =! = !

= #$ × %+$ × %+$ × %+$ × %+$ × %+$ × %


+$ × %& = , (

et
5. Calculer et donner les significations des fréquences: conditionnelles
/ /

= = = = ,
)
/ )
.

/ = = = = ,
.

6. Calculer la surface moyenne des logements de 5 pièces.

/* = ! + = #$ × %+$ × %+$ × %+$ × %&


.
= , )(

2
Exercice 2 :
Un statisticien fait une enquête sur 100 cadres d’une entreprise et cherche à établir
le lien pouvant exister entre l’âge des cadres et le salaire mensuel perçu. Il présente
ses résultats dans un tableau de contingence, la variable statistique X représente
l’âge tandis que la variable Y représente le salaire en milliers de dinars.
Y
[22-26[ [26-30[ [30-34[ [34-38[ [38-42[ ni .
X
[30-36[ 3 4 10 1 0
[36-42[ 0 2 0 9 0
[42-48[ 6 4 2 2 2
[48-54[ 6 8 10 0 4
[54-60[ 0 8 10 4 5
n. j

1. Que représentent la colonne . et la ligne . ?


2. Donner le pourcentage des cadres dont le salaire est supérieur à 26000 DA.
3. Parmi les cadres ayant plus de 42 ans, donner le pourcentage de ceux qui
perçoivent moins de 30000 DA.

, , , et
4. Calculer et donner les significations de :
. .) / ) )/
5. Donner la distribution conditionnelle de X sachant que Y  [26-30[ et
calculer sa moyenne.
6. Donner la distribution conditionnelle de Y sachant que X 48 ,54  .
7. X et Y sont-elles indépendantes ?

Sol 2 :

[22-26[ [26-30[ [30-34[ [34-38[ [38-42[ . .


Ci X
33 [30-36[ 3 4 10 1 0 18 0,18
39 [36-42[ 0 2 0 9 0 11 0,11
45 [42-48[ 6 4 2 2 2 16 0,16
51 [48-54[ 6 8 10 0 4 28 0,28
57 [54-60[ 0 8 10 4 5 27 0,27
. 15 26 32 16 11 100
. 0,15 0,26 0,32 0,16 0,11 1

1. Que représentent la colonne . et la ligne . ?


La colonne . représente l’âge tandis des cadres d’une entreprise
La ligne . représente le salaire des cadres en milliers de dinars
2. Donner le pourcentage des cadres dont le salaire est supérieur à 26000 DA.
%=$ , + ,) + , + , %× = %
ou %=$ + , %× = %

3
3. Parmi les cadres ayant plus de 42 ans, donner le pourcentage de ceux qui
perçoivent moins de 30000 DA

+ + + +
%= × %=) %

, , , et
4. Calculer et donner les significations de :
. .) / ) )/

= = = ,
.
.
,
) % des cadres ont l'âge entre 48 et 54

= = = ,
,
% des cadres ont l'âge entre 36 et 42 et salaire entre 34000 et 38000 DA
)
= = = ,)
.)
.)
,
) % des cadres ont le salaire entre 30000 et 34000 DA

= = = ,
)
/ )
).
Parmi les cadres l'âge entre 42 et 48, il ya % ont le salaire entre 30000 et
34000 DA

= = = ,
)
)/
.
% des cadres ont l'âge entre 42 et 48 sachant que leur salaire est compris
entre 26000 et 30000 DA
5. Donner la distribution conditionnelle de X sachant que Y  [26-30[ et
calculer sa moyenne:

/* * [30-36[ [36-42[ [42-48[ [48-54[ [54-60[ Tot


4 2 4 8 8 26

= , = , 0,15 0,3 0,3 1

/* * = ∑ . = #$ × ))% + $ × ) % + $ × %+$ × %+$ × %& =


.
, ) / 0 (. sont les centres de classes)

L'âge moyen des cadres sachant que leur salaire entre 26000 et 30000
DA est 48 ans

6. Donner la distribution conditionnelle de Y sachant que X 48 ,54 

/+ + [22-26[ [26-30[ [30-34[ [34-38[ [38-42[ Tot


6 8 10 0 4 28

4
= , = , 0,35 0 0,14 1

/+ + = ! . .′ = #$ × %+$ × %+$ ×) %+$ × %&


.
=) , 23443567 85 839:67

Le salaire moyen des cadres sachant que leurs âge entre 48 et 54 ans est 30 en
milliers de dinars

7. X et Y sont-elles indépendantes ?

= = . = = , . = = ,

. × . = , × , = , ≠

Alors X et Y ne sont pas indépendants.

Exercice 3 :
A la fin de l’année universitaire, on a noté la moyenne générale X obtenue et le
nombre de module acquis sur les 9 modules de l’année Y de 20 étudiants non
admis. on a obtenu les résultats suivants

Valeurs de X 1 4 6 5 8.5 4.5 8 8.5 5.5 3 8.5 6 8.5 7 9 5.5 9 8 9 6


Valeurs de Y 0 1 3 2 4 1 3 4 2 0 1 2 3 2 4 1 3 2 4 3

1- Représenter graphiquement la série (X,Y). Que peut-on dire sur la liaison entre
X et Y.
2- Répartir le caractère X en classes de même amplitude.
3- Compléter le tableau de contingence suivant:
Y ni .
X
[ , [
[ , [
[ , [
[ , [
n. j

4- Les caractères X et Y sont-ils indépendants?


5- Calculer la covariance entre X et Y.
6- Calculer le coefficient de corrélation linéaire. Que peut- on conclure ?
7- Donner l’équation des deux droites de régression. Tracer les deux droites dans
un repère orthonormé. Que peut-conclure ?

5
8- Comment peut- on prévoir la moyenne générale d’un étudiant qui a 5 modules
acquis?

Sol 3:
1- Représenter graphiquement la série (X,Y). Que peut-on dire sur la liaison entre
X et Y :

2- Répartir le caractère X en classes de même amplitude :

− − − − −
<(= = = = = = = =
(/+ ( (/+ ( (/+ (
? √, √, √ √

3- Compléter le tableau de contingence suivant

0 1 2 3 4
Ci X
2 [1-3[ 1 0 0 0 0 1 0,05
4 [3-5[ 1 2 0 0 0 3 0,15
6 [5-7[ 0 1 3 2 0 6 0,30
8 [7-9[ 0 1 2 3 4 10 0,50
2 4 5 5 4 20
0,1 0,2 0,25 0,25 0,2 1
4- Les caractères X et Y sont-ils indépendants?

= = = = = , = = = ,
, ,

$ × = , × , = , %≠$ = %

X et Y ne sont pas indépendants.

6
5- Calculer la covariance entre X et Y.

" ?

ABC = D ! ! E * F−

(les E sont les centres des classes du caractère X)


Première formule pour la covariance

= ! .E = #$ × % + $) × % + $ × % + $ × %& = ,

= ! . * = #$ × % + $ × % + $ × % + $ × )% + $ × %& = ,

AGH = I #$ × × %+$ × × % + $) × × %+$ × × )% + $ × × %+$ × × % + $) ×

+$ × × %&J − , × ,

=I #) &J − , × , = ,) − , = ,

ABC = EKL$ , % = ,

6- Calculer le coefficient de corrélation linéaire. Que peut- on conclure ?

EKL$ , %
M =
N N

O/P$ % = ! .E −

= #$ × % + $) × %+$ × %+$ × %& − ,

= # &− , = ),

N = QO/P$ % = Q), = ,

O/P$ % = ! . * −

= #$ × %+$ × %+$ × %+$ ×) %+$ × %& − ,

= # &− , = , − , = ,
N = QO/P$ % = Q , = ,
EKL$ , % ,
M = = = 0,73
N N , × ,

7
La corrélatoinM est forte $|P| V 0.7% , les deux droites de régression sont très
proches et le nuage peut etre approximé par une droite ( ajustement linéaire ).

7- Donner l’équation des deux droites de régression. Tracer les deux droites dans
un repère orthonormé. Que peut-conclure ?

 La droite d'équation W = X Y + Z est appelée droite de régression de Y en


X , obtenue par la méthode des moindre carrés :

EKL $ , % EKL $ , %
$[ % *= + + $* − +%
/
N + N +

EKL $ , % EKL $ , %
$[ % += * + $+ − *%
/
N * N *

EKL $ , % EKL $ , % , ,
$[ % *= + + \* − +] = ++^ , − , _
/
O/P$ % O/P$ % ), ),
= , +− ,

$[ / % *= , +− ,

EKL $ , % EKL $ , % , ,
$[ % += * + \+ − *] = *+^ , − , _
/
O/P$ % O/P$ % , ,
= , )*+ ,
$[ / % += , )*+ ,

Le point d'intersection est le centre de gravité du nuage

8- Comment peut- on prévoir la moyenne générale d’un étudiant qui a 5 modules


acquis?

8
Pour prévoir la moyenne générale , il suffit de remplacer y=5 dans

$[ / % + = , ) * + , = , )$ %+ , = ,)
l'équation de la droite X en Y

Exercice 4 :
Une entreprise qui organise des stages de formation de secrétaires portant sur le
traitement de texte, cherche à évaluer l’efficacité de ce stage. Ce stage est de durée
de 15 jours.
Une enquête statistique incluant plusieurs promotions de stagiaires, a permis
d’obtenir le tableau suivant :
Numéro du jour du stage X 5 6 8 10 11 12 13 15
Nombre d’erreurs de saisie 42 44 30 35 28 27 22 20
par page Y
8 8 8 8 8
2
On donne :  x i  80 ,  yi  248 ,  xi2  884 ,
i 1 i 1 i 1
 yi  8222 ,  x i yi  2282
i 1 i 1

1- Calculer le coefficient de corrélation linéaire, commenter.


2- Déterminer la droite de régression de Y et X.
3- Si la durée du stage est prolongée de deux jours, quel serait le nombre
d’erreurs de saisie par page au 17ème jour.

Exercice 5:

Un constructeur d’automobiles veut étudier le lien qui peut exister entre la


consommation d’une voiture (Y) en fonction de sa vitesse (X). Les 14 mesures sont
données dans le tableau suivant :
X(km/h) 50 60 70 80 85 90 95 100 105 110 115 120 130 140
Y(L/100 km) 4 4,5 5 4 4,5 5 5,5 6 6 8 9 10 10 12
1. Représenter graphiquement la série (X,Y). Que peut-on dire de la liaison entr
X et Y.
2. On pose Z  ln Y ( ln désigne le logarithme Népérien).
On donne :
14 14 14 14
2
14
 x i  1350 ,  zi  25.65 ,  xi2  139000 ,  zi  48.81  x i zi  2590.03
i 1 i 1 i 1 i 1 i 1

Déterminer le coefficient de corrélation linéaire entre Z et X. interprétez.


3. Déterminer la droite de régression de Z en X.
4. Peut-on estimer la consommation du véhicule, s’il roule à 150 km/h ?
5. En choisissant 3 classes pour X et 2 classes pour Y de même amplitude pour les
2 variables:
a. Donner le tableau de contingence correspondant aux données initiales.
b. Les variables X et Y sont elles dépendantes ?
c. Calculer les moyennes et les variances marginales X , Y , V  X  et V Y .

9
d. Calculer la covariance entre X et Y, déduire le coefficient de corrélation
linéaire. commentez.
e. Estimer la consommation d’un véhicule qui roule à 150 km/h ?
6. Quelle est la meilleure prédiction entre les deux estimations calculées.

Sol 5 :
1- Représenter graphiquement la série (X,Y). Que peut-on dire sur la liaison entre
X et Y :
Y(L/100 km)

14

12

10
Y
8
Linear (Y)
6

0 X(km/h)
0 50 100 150

X et Y n'ont pas une liaison linéaire.

EKL$ , `%
2- Déterminer le coefficient de corrélation linéaire entre Z et X :
M`=
N N`

ABC = a ! + b c − $ `%
Deuxième formule pour la covariance

= !+ = # ) &= ,
,

`= !b = # , & = ,)
,

O/P$ % = !+ − = # ) &− , = # &− , = ) ,

N = QO/P$ % = Q ) , = , )

O/P$b% = !b − ` = # , &− ,) = , )

Nb = QO/P$b% = Q , ) = , )

10
ABd = a ! + b c − $ è % = ×$ , )% − , × ,) = ,
=
EKL$ , `% ,
M = = = ,
`
N N` , ) × ,)

 La corrélatoin est très forte $ , ≤ P V 1% , l’ajustement linéaire est


accepter
3- Déterminer la droite de régression de Z en X ?

 La droite d'équation h = X Y + Z est appelée droite de régression de Z en


X , obtenue par la méthode des moindre carrés :

EKL $ , % EKL $ , %
$[` / % b= + + $` − %
N N

EKL $ , `% EKL $ , `%
$[b / % b= + + \` − +]
O/P$ % O/P$ %
, ,
= ++^ , )− × , _= , ++ ,
) , ) ,

$[` / % b= , ++ ,

= i` = i , +j , (Ecrire Y en fonction de Z et remplacer dans


l’équatioin pour obtenir l’estimation)
l(
"KkP + = ⟹ =i , × j ,
= ), o/ ?(
m
Partie 2 :

− − −
<(=+ = = = =)
(/+ ( (/+ (
? √, )
(/+ − (/+ − −
<(=* = = = =
( (
? √,

a) Compléter le tableau de contingence suivant


c’j 6 10

[4-8[ [8-12[
ci X
2 [1-3[ 3 0 3 0,21
4 [3-5[ 6 0 6 0,43
6 [5-7[ 0 5 5 0,36

11
9 5 N=14
0,64 0,36 1

b) Les caractères X et Y sont-ils indépendants?

)
= = = = = , = = = ,)
, ,

$ × = , × ,) = , ) %≠$ = %

X et Y ne sont pas indépendants.

c) Calculer les moyennes et les variances marginales.

= ! .E = #$ × %+$ × %+$ × %& = ,

= ! . E′ = ,

) )

O/P $ % = ! . $+ − +% = p ! .E q− = ) ), − , = ,

N = ,

O/P $*% = ! . $* − *% = p ! r . E′ sq − = ),

N = ,
d)
)

N = EKL$ , % = t !! E E′ u − ee
= =

=I #$) × × %+$ × × %+$ × × %&J − , × , =) ,

EKL$ , % ) ,
M = = = , ≥ ,
`
N N , × ,

On a une forte corrélatoin alors l'ajustement linéaire est accepté.


e)

12
EKL $ , % EKL $ , %
$[ % = ++\ − +]
/
O/P$ % O/P$ %
) , ) ,
= ++^ , − × , _= , ++ ,
, ,
$[ / % = , ++ ,

l(
"KkP + = ⟹ = , . + , = , o/ ?(
m
La meilleure estimation est = ), o/ ?( car elle est calculée dans le cas
discret.

13

Vous aimerez peut-être aussi