QCM et QCU
1. La régression linéaire permet de :
o a) Comparer des moyennes entre plusieurs groupes
o b) Prédire une variable dépendante en fonction d'une ou plusieurs variables
indépendantes
o c) Calculer l’écart-type
o d) Déterminer la variance entre deux groupes
2. Si la corrélation entre deux variables est de 0, cela signifie que :
o a) Il n'y a aucune relation entre elles
o b) Elles varient ensemble
o c) Elles sont en relation inverse
o d) L'une dépend de l'autre
3. QCU : Une corrélation positive entre deux variables signifie que :
o a) Quand l'une augmente, l'autre diminue
o b) Quand l'une augmente, l'autre augmente aussi
o c) Il n'y a pas de relation entre elles
o d) Une des variables dépend de l'autre
4. La pente dans un modèle de régression linéaire représente :
o a) Le point où la droite coupe l'axe des ordonnées
o b) La variation de la variable dépendante pour chaque unité de variation de la
variable indépendante
o c) La somme des résidus
o d) L’écart-type des données
5. La corrélation de Pearson est utilisée pour :
o a) Mesurer la force d'une relation linéaire entre deux variables
o b) Déterminer la causalité entre deux variables
o c) Prédire une variable à partir d'une autre
o d) Vérifier l'association entre deux variables quantitatives
6. Un coefficient de corrélation égal à -1 signifie que :
o a) Il y a une corrélation parfaite et inverse entre les deux variables
o b) Il n'y a aucune corrélation
o c) Il y a une corrélation positive parfaite
o d) Les deux variables sont indépendantes
7. Un modèle de régression est dit "linéaire" si :
o a) Les points de données sont ordonnés de manière ascendante
o b) La relation entre la variable dépendante et les variables indépendantes est une
droite
o c) La corrélation est positive
o d) Il y a plusieurs variables indépendantes
8. Une corrélation élevée entre deux variables signifie-t-elle que l'une cause l'autre ?
o a) Oui, c'est une preuve de causalité
o b) Non, la corrélation n'implique pas la causalité
o c) Il faut faire un test de causalité
o d) C’est uniquement un indicateur de la force de l’association
9. En régression multiple, plusieurs variables indépendantes sont utilisées pour :
o a) Comparer plusieurs groupes
o b) Prédire la variable dépendante
o c) Calculer la corrélation entre variables
o d) Estimer la moyenne des variables
10. Dans un modèle de régression, les variables indépendantes sont également appelées :
o a) Variables dépendantes
o b) Variables explicatives
o c) Résidus
o d) Variables contrôlées
II. CORRELATION ET REGRESSION LINEAIRE : Etude de cas
Un chercheur souhaite étudier l'impact du nombre d'heures de préparation des enseignants sur
les résultats moyens des élèves en mathématiques dans différents établissements scolaires. Il
collecte les données suivantes auprès de 10 écoles, où il note le nombre moyen d'heures
hebdomadaires de préparation des enseignants et le score moyen des élèves en mathématiques.
X 5 7 6 4 8 9 6 5 10 7
Y 70 78 72 65 82 85 73 71 88 76
X*X 25 49 36 16 64 81 36 25 100 49
X*Y 350 546 432 260 656 765 438 355 880 532
MOY(X) 6,7
MOY(Y) 76
MOY(X*Y) 521,4
X-MOY(X) -1,7 0,3 -0,7 -2,7 1,3 2,3 -0,7 -1,7 3,3 0,3
Y-MOY(Y) -6 2 -4 -11 6 9 -3 -5 12 0
X-MOY(X)*Y-MOY(Y) 10,2 0,6 2,8 29,7 7,8 20,7 2,1 8,5 39,6 0
SOM(X-MOY(X)*Y- 122
MOY(Y)
X-MOY(X)*X-MOY(X) 2,89 0,09 0,49 7,29 1,69 5,29 0,49 2,89 10,89 0,09
SOM(X-MOY(X)*X- 32,1
MOY(X)
Y-MOY(Y)*Y-MOY(Y) 36 4 16 121 36 81 9 25 144 0
SOM(Y-MOY(Y)*Y- 472
MOY(Y)
racine 123,090211
r 0,99114299
MOY(X*X) 48,1
a 3,80062305
b 50,5358255
Score des élèves en mathematiques en fonction du
temps de préparation des enseignants
100
y = 3,8393x + 50,268
80
Score des élèves
60
40
20
0
4 5 6 7 8 9 10 11
temps de préparation des enseignants
1. Analyse de la corrélation
a) Calculons le coefficient de corrélation de Pearson
̅ )(𝒀𝒊 −𝒀
∑(𝑿𝒊 −𝑿 ̅) 122
on a : 𝒓 = ̅ )𝟐 (𝒀𝒊 −𝒀
√(𝑿𝒊 −𝑿 ̅ )𝟐
= = 0,99114299
123,090211
b) interprétation
la corrélation entre le nombre d’heures de préparation des enseignants et le score moyen en
mathématiques est très forte. Plus les enseignant mettent assez de temps pour la préparation des
cours plus le score des élevés est élevé.
2. Régression linéaire simple
a) trouvons l'équation de la droite de régression qui prédit le score moyen en fonction du
nombre d'heures de préparation par la méthode des moindres carrés.
l'équation de la droite de régression est de la forme : 𝑌 = 𝑎𝑋 + 𝑏 + 𝜀 avec :
̅̅̅̅ −𝑋̅ 𝑌̅
𝑋𝑌 521,4−6,7×76
𝑎= ̅̅̅̅ =48,1−6,7×6,7 = 3,80062305
𝑋 2 −𝑋̅ 2
̅ − 𝑎𝑋̅ = 76 − 3,80062305 × 6,7 = 50,5358255
b= 𝑌
𝜀 = 0,05
D’où : 𝒀 = 𝟑, 𝟖𝟎𝑿 + 𝟓𝟎, 𝟓𝟒 + 0,05
b) Interprétons les valeurs de la pente et de l'ordonnée à l'origine.
La pente 𝒂= 3,80 est positive, ce qui suggère une relation positive entre le temps de préparation
des enseignants et les performances scolaires.
3. Prédiction
a) Prédisons le score moyen en mathématiques pour une école dont les enseignants passent
8 heures par semaine en préparation.
𝒀 = 𝟑, 𝟖𝟎 × 𝟖 + 𝟓𝟎, 𝟓𝟒 + 0,05 = 81
Donc le score moyen en mathématiques pour une école dont les enseignants passent 8 heures
par semaine en préparation est 81
b) Expliquez l'utilité de cette prédiction pour les responsables de l'éducation.
Cette prédiction permettra de prendre des décisions par rapport au temps de préparation des
enseignants pour un meilleur score des élèves en mathématiques.
III. Distribution Normale (Courbe de Gauss)
On étudie les tailles (en centimètres) d'un échantillon de 100 adultes dans une population bien
connue. Supposons que la taille moyenne des adultes est de 170 cm avec un écart-type de 10
cm. Puisque la population est grande et l'écart-type est connu, nous utilisons une distribution
normale.
Données (échantillon de tailles)
• Taille moyenne () = 170 cm
• Écart-type () = 10 cm
• Taille de l'échantillon = 100 adultes
IV. distribution de Student
Données
• moyenne () = 0
• Écart-type () = 2,36643191
• Taille de l'échantillon = 42 valeurs de t
Distribution Normale (Courbe de Gauss)
valeur de t Distribution de la valeur de t
140 0,000443185
142 0,000791545
144 0,001358297
146 0,002239453
148 0,003547459 Courbe de GAUSS
150 0,005399097 0,045
152 0,007895016
distribustion de la valeur de t
0,04
154 0,011092083 0,035
156 0,014972747 0,03
158 0,019418605 0,025
160 0,024197072 0,02
162 0,028969155 0,015
164 0,03332246 0,01
166 0,036827014 0,005
168 0,039104269
0
170 0,039894228 140 144 148 152 156 160 164 168 172 176 180 184 188 192 196 200
172 0,039104269 Valeur de t
174 0,036827014
176 0,03332246
178 0,028969155
180 0,024197072
182 0,019418605
184 0,014972747
186 0,011092083
188 0,007895016
190 0,005399097
192 0,003547459
194 0,002239453
196 0,001358297
198 0,000791545
200 0,000443185
Distribution de student
Valeur de Densité de probabilité
t
-4 0,00203103
-3,8 0,00285439
-3,6 0,00402462
-3,4 0,00568856
-3,2 0,00805217 distribution de la statistique t
-3 0,01140055 0,45
-2,8 0,01612126 0,4
"Densité de probabilité
-2,6 0,02272812 0,35
-2,4 0,03187949 0,3
-2,2 0,04437968 0,25
-2 0,06114577 0,2
-1,8 0,08311639 0,15
-1,6 0,11107788 0,1
-1,4 0,14539488 0,05
-1,2 0,18566389 0
-4 -3,6-3,2-2,8-2,4 -2 -1,6-1,2-0,8-0,4 0 0,4 0,8 1,2 1,6 2 2,4 2,8 3,2 3,6 4
-1 0,23036199
valeur de t
-0,8 0,27662513
-0,6 0,32032581
-0,4 0,35657853
-0,2 0,38065818
0 0,38910838
0,2 0,38065818
0,4 0,35657853
0,6 0,32032581
0,8 0,27662513
1 0,23036199
1,2 0,18566389
1,4 0,14539488
1,6 0,11107788
1,8 0,08311639
2 0,06114577
2,2 0,04437968
2,4 0,03187949
2,6 0,02272812
2,8 0,01612126
3 0,01140055
3,2 0,00805217
3,4 0,00568856
3,6 0,00402462
3,8 0,00285439
4 0,00203103