0% ont trouvé ce document utile (0 vote)
36 vues16 pages

Exercices de préparation aux examens statistiques

Cet exercice propose plusieurs exercices statistiques à réaliser sur des jeux de données fictifs. Les exercices portent sur le calcul de statistiques descriptives, tests du chi-deux, corrélation, régression linéaire simple sur des variables quantitatives et catégorielles.

Transféré par

chimie.cantique2
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOC, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
36 vues16 pages

Exercices de préparation aux examens statistiques

Cet exercice propose plusieurs exercices statistiques à réaliser sur des jeux de données fictifs. Les exercices portent sur le calcul de statistiques descriptives, tests du chi-deux, corrélation, régression linéaire simple sur des variables quantitatives et catégorielles.

Transféré par

chimie.cantique2
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOC, PDF, TXT ou lisez en ligne sur Scribd

Exercices

Exercices:

Les exercices servent à se préparer pour les examens. J’en ajoute à ceux que vous
trouverez dans Howell (2006/2008) ainsi que Myers et Hansen (2006/2007). L’idéal est
de les faire régulièrement. Pour les solutions et les réponses, consultez les assistants
de cours ou le professeur.

Exercice 1 : lecture et coloriage d’un article (1 point)

Se choisir un des quatre articles de recherche, colorier les éléments que vous ne
comprenez pas en deux couleurs, une couleur pour les concepts et une autre
pour les statistiques. À faire au cours de la 1ère semaine.

Exercice 13 : retour sur l’article de l’exercice 1 (1 point)

À la fin du cours, revenez sur les statistiques que vous n’aviez pas comprises et
identifiez-en que vous comprenez maintenant et d’autres que vous ne comprenez
toujours pas s’il y a lieu. Commentez vos apprentissages.

Pour tous les problèmes de calculs, veuillez-vous


pratiquer à interpréter les résultats.
Exercice 2 : chapitre 2 d’Howell (1 point)

Une petite bière


Quinze d’entre vous participez à une étude sur l’effet de l’alcool sur le comportement
social. Cette étude comporte deux conditions, l’une où vous buvez une bière non
alcoolisée (condition « placébo ») et l’autre où vous buvez une vraie bière. Ces deux
conditions se déroulent dans la même pièce, un laboratoire aménagé en salon étudiant
(voir un exemple à [Link] ). Chaque condition
est réalisée lors d’une journée indépendante. Le nombre de sourires dirigés vers
d’autres personnes est enregistré à chaque fois.

Participant(e) Bière non alcoolisée Bière alcoolisée


Luce 4 6
Dan 2 5
Olivier 1 5
Alice 5 3
Marc-Antoine 3 6
Cléo 2 4
Winston 3 7
Berthe 2 6
Pierre 1 8
Johanne 4 3
Fédor 3 7
Ivana 4 8
Boris 5 3
Marguerita 2 5
Ivanovich 1 4

1.- et 2.- Calculez les statistiques descriptives (moyenne, écart-type, minimum, les 3
quartiles et le maximum) de chaque condition.
3.- Faites de même pour une nouvelle série de chiffres où vous aurez combinés les
2 conditions en une seule colonne de 30 chiffres.
4.- Comparez les résultats de 1.- et 2.- à ceux de 3.-. Les valeurs obtenues
semblent-elles les mêmes ?
Exercice 3 : Données catégorielles et 2 (1 point)

1.- Faire le problème 6.3 de Howell (2006/2008).

2.- Faire le problème 6.10 de Howell (2006/2008).

3.- Faire le problème 6.11 de Howell (2006/2008).

4.- Une petite bière


Quinze d’entre vous participez à une étude sur l’effet de l’alcool sur le comportement
social. Cette étude comporte deux conditions, l’une où vous buvez une bière non
alcoolisée (condition « placébo ») et l’autre où vous buvez une vraie bière. Ces deux
conditions se déroulent dans la même pièce, un laboratoire aménagé en salon étudiant
(voir un exemple à [Link] ). Chaque condition
est réalisée lors d’une journée indépendante. Le nombre de sourires dirigés vers
d’autres personnes est enregistré à chaque fois.

Participant(e) Bière non alcoolisée Bière alcoolisée


Luce 4 6
Dan 2 5
Olivier 1 5
Alice 5 3
Marc-Antoine 3 6
Cléo 2 4
Winston 3 7
Berthe 2 6
Pierre 1 8
Johanne 4 3
Fédor 3 7
Ivana 4 8
Boris 5 3
Marguerita 2 5
Ivanovich 1 4

Réorganisez ces données pour en faire un 2 et en supposant une distribution


théorique aléatoire pour les résultats (indice : comparez combien de personnes sourient
plus dans la condition sous alcool à combien sourient plus dans la condition sans
alcool).
.

Réponses
1 2 (4) = 2,40 , p> .05
2 2 (1) = 5,38, p < .05

3 (A) 2 (1) = 10,76, p < .05


(B) la taille de l’échantillon a doublé, la valeur de 2 a aussi doublé,
multiplication par une constante

4. 2 (1) = 5,40, p < .05.

Exercice 4 : Corrélation et régression simple (1 point)

1. Des chercheurs construisent deux échelles mesurant l’estime de soi. Plus la cote
obtenue sur ces échelles est élevée, plus le répondant a une estime de soi
importante. Mme Lajoie, une éducatrice veut savoir si les deux échelles d’estime de
soi mesurent le même concept. Elle administre donc les deux échelles à 10 enfants
et obtient les résultats suivants :

Enfants X Y
Robert 1 5
Lucie 3 7
Marc 6 9
Josée 4 3
Pierre 4 5
Margot 5 7
Sébastien 4 9
Julie 9 8
Arthur 8 4
Kim 7 3

a) Tracez un diagramme de dispersion de X et Y.


b) Calculez le coefficient de corrélation.
c) Interprétez ce dernier.
d) Calculez la régression de Y sur X.
Tiré de : McGrath, R. E. (1997). Understanding statistics.
2. Le professeur d’éducation physique, M. Bouleronde, demande à différents athlètes de
sa classe le nombre d’heures moyen par semaines consacrées à l’entraînement au
Ceps. Ensuite, il leur demande le nombre d’heures moyen par semaines qu’ils
passent à regarder la télévision.
(A) Calculer le coefficient de corrélation. Interprétez ce résultat.
(B) Veuillez tracer le diagramme de dispersion et calculez la régression. Interprétez
ce résultat.

Données du problème 2

Athlètes Entraînement Télévision (Y)


(X)
Boris 7 13
Svend 21 3.5
Nathan 10.5 9
Josip 5 11
Geneviève 17.5 6.5
Ingrid 9.5 14
Josette 2.5 18

3. Un sondage a été effectué dans le but d’étudier les réactions à différentes mesures.
En Intpremier lieu, les sujets rapportent leurs sentiments à l’égard de leur famille en
fonction d’une échelle de 0 à 100 (où plus le score est élevé, plus le sentiment est
favorable). De plus, les sujets rapportent leur idéologie politique (où plus le score est
élevé, plus le sujet fait preuve d’une idéologie politique conservatrice). Enfin, les
sujets notent le nombre de fois par mois, en moyenne, qu’ils fréquentent l’église.

a) Trouvez le coefficient de corrélation entre les sentiments et l’idéologie politique


b) Trouvez le coefficient de corrélation entre l’idéologie politique et l’église.
c) Trouvez le coefficient de corrélation entre les sentiments et l’église.
d) Décrire l’importance et la direction de chaque coefficient de corrélation.

Sentiments Idéologie Église


10 7 0
70 3 3
50 4 2
30 6 1
90 4 4

Tiré de : Agresti, A. & Finlay, B. (1997). Statistical methods for the social sciences.
4. M. Maternité est père d’un premier fils. Or, il est anxieux à savoir si ce dernier fait
preuve d’une intelligence aussi douée que la sienne. Pour se rassurer, il demande à
10 « papas » du quartier de passer un test de QI et faire passer un test de QI à leur
fils aîné. Calculez le coefficient de corrélation et interprétez ce dernier.

QI des papas QI des garçons


112 125
123 120
100 89
98 117
109 90
125 123
132 128
120 117
117 100
109 113

Tiré de : Evans, A. N. (1998). Using basic statistics in the social sciences.

Réponses :

1. b) r = .04
d) Estime de soi 2 = 5,807 + .038 (estime de soi 1)

2. b) r = -.91
d) [Link] de TV = 17,611 + -.661 (heures d’entraînement)

3. a) r = -.87
b) r = -.87
c) r = 1.00

4. r = .57
Exercice 5 : Régression multiple (2 points)

1.- Faites les calculs appropriés pour évaluer les paramètres de la régression
multiple du problème suivant. Il s’agit de déterminer le salaire en 10000$ d’un
groupe de professeurs et professeures d’un département en tenant compte de
leurs années d’ancienneté et leur production en recherche.

SALAIRE ANNÉES Publications (X )2 (X2)


2
(Y) (X1) (Y) (X2) (X1) (X2)
1
(Y) (X1) (X2)
18 1 2
20 2 4
20 5 5
17 7 12
20 10 5
19 4 9
27 3 3
27 8 1
32 4 8
27 16 12
25 15 9
28 19 4
33 8 8
28 14 11
38 28 21

Tiré de Cohen, J., et Cohen A. (1998). Applied regression methods

Réponse :
Y prédit ($alaire en 1000$) = 20,11 + 0,46 (année d’expérience) + 0,10 publication
2.- Voici les résultats d’une régression multiple où une chercheure a mesuré le
Niveau Socio-Économique (NSE), le niveau d’habileté mentale (QI, intelligence)
et la motivation de jeunes en 10e année et leur rendement académique en 12 e
année. Elle s’est servie des cotes de 10 e année pour prédire le rendement
académique trois ans plus tard chez un échantillon aléatoire de 30 élèves d’une
école secondaire.

Tableau de corrélations

RA HM NSE MO
Rendement 1.000
académique (RA)
Habileté mentale .637 1.000
(HM)
Niveau socio- .505 .256 1.000
économique (NSE)
Motivation (MO) .653 .313 .536 1.000

R multiple .80736
R carré (PRE) .65183
R carré ajusté .61165
Erreur standard 9.44912

Analyse de variance
Source de ddl SC CM F p
Y
Régression 3 4346.0324 1448.6774 16.22515 < .05
0 7
Résiduelle 26 2321.4342
7 89.28593
Totale 29 6667.4666
7

--------------------------- Variables dans l’équation ----------------------------------------

Variable B É.T. de b β t p

Ordonnée -30.01857 19.36297


NSE 1.67887 1.43722 .16107 1.168 > .05
HM .78925 .20850 .46405 3.785 < .05
MOT 1.45354 .48451 .42105 3.000 < .05
(a) Interprétez la PRE obtenue.
(b) Expliquez brièvement ce qui se passe dans le Tableau de corrélations.
(c) Que représente chaque β ?
(d) Pourquoi les valeurs de β sont-elles différentes des valeurs de corrélation
présentées dans le tableau de corrélations (en particulier, pourquoi la corrélation
de NSE avec le rendement académique en 12e année est-elle plus forte que le β
du rendement académique sur le NSE)?

Exercice 6 : Test du changement de PRE (R2) (2 points)

Howell (2008) donne aux pp. 511-517 le contexte de ce problème qui est celui de
l’évaluation des cours. La variable dépendante est la qualité globale du cours telle
qu’évaluée par les étudiantes et les étudiants. Les variables de prédiction sont celles de
(a) de l’évaluation par les étudiantes et étudiants de la pédagogie du professeur,
(b) de la qualité des tests et examens,
(c) de la connaissance de la matière,
(d) des résultats attendus et
(e) du nombre d’inscriptions.
L’échantillon regroupe les données de 50 individus. Ici, nous avons procédé à une
analyse de régression hiérarchique de ces données (en utilisant comme ordre
d’inclusion la liste des variables), ce qui s’avère une analyse différente de celle
présentée dans Howell.

Pratiquez-vous à calculer le test F du changement pour chacune des étapes en


commençant par la comparaison de l’étape 2 avec la première. (4 tests F à calculer,
dont un seul est significatif).

Statistiques du changement
Variable Changement Test F du
Modèle ajoutée PRE de PRE changement ddl1 ddl2 p
1 Pédagogie ,6462 ,6462 87,6682 1 48 ,0000
2 Examens ,6468 ,0006 ,0802 1 47 ,7783
3 Connaissance ,7390 ,0922 16,2411 1 46 ,0002
4 Résultats ,7454 ,0064 1,1311 1 45 ,2932
5 Inscriptions ,7554 ,0101 1,8148 1 44 ,1848
Exercice 7: Test d’hypothèse appliqué aux moyennes (1 point)

1. Eh oui, encore de la bière


Reprenez le problème 4 de l’exercice 2. Au seuil de signification de 5%, y a-t-il eu
une augmentation significative de nombre de sourires dans la condition bière
alcoolisée par rapport à la condition bière non alcoolisée? Répondez en vous
inspirant des cinq étapes du test d’hypothèse.

2. Bière à tout jamais: faisons quelque chose de mal avec la bière


Au problème 1, vous avez décidé d’appliquer soit la formule du test t pour les
échantillons reliés soit celle pour les échantillons indépendants. Quelle que soit la
formule utilisée au problème 1, utilisez maintenant l’autre formule (l’une des deux
forcément incorrecte) et expliquez la différence entre les deux résultats.

3. Bière et sexe
Un psychologue veut, à l’aide d’un test de quotient intellectuel déterminer s’il existe
une différence significative entre les collégiens et les collégiennes. Le QI moyen
d’un échantillon de 40 femmes est 131 avec un écart-type de 15 ; le résultat moyen
d’un échantillon de 36 hommes est de 126 avec un écart-type de 17.
(A) Au seuil de signification de .05, existe-t-il une différence ? Répondez en
vous inspirant des cinq étapes du test d’hypothèse.
(B) Étant donné ces écart-types et ces tailles d’échantillon, quelles moyennes
faudrait-il obtenir pour avoir un t significatif?

Tiré de : Allard, F. (1990). Les statistiques : une approche nouvelle.

__________________________
Réponses

1. t(14) = -3.96, p < .05


2. t(28) = -4.46, p < .05
3. (a) t(74) = 1.35, p > .05; (b) soit par exemple 134 et 126 ou 131 et 123
Exercice 8 : Analyse de variance à un critère de classification
(1 point)

1. Complétez le tableau!
Veuillez compléter le tableau suivant des résultats d’une analyse de variance à
une dimension où la variable indépendante a trois niveaux ayant 20 participants
chacun. Présentez vos calculs et évaluez le rapport F (p = .05).

Source de variance SC dl CM F

Intergroupe A B E G
Intragroupe 152 C F

Total 182 D

2. Quand l’économie va mal


Une chercheure formule l’hypothèse suivante : l’économie des pays de la
périphérie capitaliste, qui sont restés plus longtemps dans les liens de la
colonisation directe, tend à être moins performante que celle des pays qui ont
acquis plus tôt le statut de pays politiquement indépendant. Si nous considérons
le produit national brut par habitant comme un indicateur de performance
économique, nous serons en mesure de comparer les « pays de l’Amérique
latine », les « pays de l’Afrique » et les « pays de l’Europe» par rapport au
produit national brut par habitant pour l’année 1986. En vous servant des
résultats ci-dessous, veuillez vérifier cette hypothèse en fonction des cinq étapes
de la vérification d’hypothèse. (p = .05). Interprétez votre résultat.

Types de pays Produit national brut par habitant

pays de l’Amérique latine (n = 5) : 2 1 2 3 2

pays de l’Afrique (n = 5) : 5 4 3 4 4

pays de l’Europe (n = 5) : 9 6 3 7 5
3. « One flew over the cuckoo’s nest»
Dans un centre de santé mentale, le psychologue, Dr. Analysetout, tente de
déterminer s’il existe une différence significative dans la durée du séjour au
centre (en terme de mois) pour des patients diagnostiqués selon différentes
catégories de désordre psychiatrique. En fonction des données, veuillez
déterminer si la durée du séjour varie selon la catégorie du désordre des patients
(p = .05). N’oubliez pas de vous servir des cinq étapes du test d’hypothèse et
d’interprétez votre résultat statistique.

Catégorie du désordre Durée du séjour (en semaines)

Désordre affectif (n = 4) 1 5 1 1

Désordre cognitif (n = 4) 3 3 1 1

Condition reliée à des problèmes de drogues (n = 6) 5 9 9 5 9 5

Tiré de : Aron, A., & Aron, E. (1994). Statistics for psychology. et


Jaccard, J., & Becker, M. A. (1997). Statistics for the behavioral sciences

__________
Réponses :

1. A = 30 ; B = 2 ; C = 57 ; D = 59 ; E = 15 ; F = 2.67 ; G = 5.61 ; F(2,57) = 5.61, p<.05

2. F (2,12) = 10, p< .05

Source SC dl CM F

Inter 40 2 20 10
Intra 24 12 2

Total 64 14

3. F (2,11) = 11.79, p < .01


_____________________________________________
Source SC dl CM F
_____________________________________________
Inter 85.71 2 42.855 11.785
Intra 40 11 3.6364

Total 125.71 13
______________________________________________
Exercice 9 : Comparaisons multiples planifiées (a priori) suivant
l’ANOVA (1 point)

1.- Faire le problème 12.1 de Howell (2006/2008). Parmi les SC à calculer, ne


calcule que les SC des contrastes. Les SC des autres parties de l’analyse de
variance sont données dans les réponses du livre de Howell. Faites les tests F.

2.- Faire le problème 12.5 de Howell (2006/2008).

3.- Faire le problème 12.7 de Howell (2006/2008). Faites les tests F sans la
correction de Bonferroni.

Exercice 10 : Comparaisons post hoc suivant l’ANOVA (2 points)

1.- Calculer le test de Scheffé sur les données du problème 13.1 (voir solution de
l’analyse de variance à la fin du livre). Les données de ce problème produisent
un effet principal significatif, celui du facteur combiné de la taille du bébé et de
l’âge de la mère. Parce que le test F de cet effet a 2 dl au numérateur, son
interprétation est ambigüe. Supposons que nous voulons tester la différence
entre la combinaison des deux groupes de poids faible à la naissance versus le
groupe de poids normal dans un premier temps et celle entre les deux groupes
de poids faible dans un 2e temps. Remarquez le n pour ces calculs est de 20.
Voici le tableau des moyennes

Poids faible mère < 18 Poids faible mère Poids normal


> 18
4,2 6,1 7,3

2.- Refaire les calculs du # 1, mais en appliquant la procédure de Newman-Keuls


cette fois-ci.

3.- Appliquer la procédure de Newman-Keuls pour interpréter l’interaction


significative du problème 13.5. Le tableau suivant vous donne les moyennes. Ici,
n = 5.

Variable dépendante: latence


zone
A B neutre
50 100 150 50 100 150 50 100 150
16,800 23,000 26,800 24,400 16,000 26,400 28,600 28,000 27,600
Exercice 11 : Analyse factorielle de variance (2 points)

1. Plan plan
Pour chacun des énoncés, identifiez les variables indépendantes, le nombre de niveau
de chaque variable indépendante, la variable dépendante et le nombre total de
participants.
a) 18 garçons et 18 filles de chacune de trois écoles d’une région font un test
d’aptitude.
b) Des astronautes des États-Unis, de la Russie ainsi que du Canada qui ont été ou
non en orbite font un test d’anxiété. Il y a 12 personnes par cellule.
c) Des enfants qui habitent soit avec leurs deux parents (N=15), soit dans une
famille monoparentale (N=15), soit dans une famille de trois générations, c’est-à-dire
avec un parent et un grand-parent (N=15) sont assignés à l’une de trois conditions
éducatives, tutorat entre étudiant, tutorat d’un professionnel ou aucun traitement spécial.
Après trois mois, on leur demande à quel âge ils veulent devenir un parent.
Tiré de : Harris, Mary B. (1998). Basic Statistics for Behavioral Science Research.
Allyn and Bacon, Toronto.

2. Thérapie quand tu nous tiens!


Un psychologue compare l’efficacité de trois différents types de thérapie pour deux
différents diagnostics. Les patients des deux diagnostics ont été assignés de façon
aléatoire à l’une de trois thérapies. Il y avait deux participants par cellule. En vous
basant sur les résultats présentés, veuillez calculer les effets principaux et l’interaction
en fonction des cinq étapes du test d’hypothèse (p = .05). Interprétez vos résultats.
Thérapie A Thérapie B Thérapie C
Diagnostic I 6 et 2 3 et 1 2 et 4
Diagnostic II 11 et 9 7 et 9 8 et 10
Tiré de Aron, A. et Aron, E. N. (1999). Statistics for Psychology.
Prentice Hall, N. J.

(à suivre)
Exercice 11 : Analyse factorielle de variance (suite)

3. Parle, parle, jase, jase


Un chercheur pense qu’en général, les étudiants se sentent plus confortable de discuter
avec un professeur du même sexe qu’avec un professeur du sexe opposé. On compte
le nombre de mots que l’étudiant dit au professeur dans une période de 10 minutes.
Voici les résultats:

Étudiant
Homme Femme
Homme 32 et 25 12 et 16
Professeur
Femme 26 et 23 14 et 18

Veuillez compéter le tableau suivant :

Source SC dl CM Test F p
Sexe prof. 2.0 B C D
Sexe étud. A E F G
Interaction 18.0 H I J
Erreur 45.0 K L
Total 329.5 7.0

4. Vieillir, oh, mais vieillir…


Un psychologue désire connaître l’effet de la responsabilité et l’âge sur l’estime de soi
parmi des enfants âgés de 8, 10 et 12 ans. Les résultats sont présentés ci-dessous.
Veuillez évaluer les effets en fonction des cinq étapes du test d’hypothèse (p=.05).
Interprétez vos résultats.

Niveau de responsabilité

Bas Élevé

8ans 5 8
5 6
3 8

Âge
10ans 7 8
4 7
8 8

12ans 3 9
8 8
4 4
____________________________
Réponses:
2. Diagnostic : F(1, 6) = 36, p > .05
Thérapie : F(2, 6) = 1.33, p > .05
Interaction : F(2, 6) = 0, p > .05
3. A = 264.5 B = 1 C = 2.0 D = 0.178 E = 1 F = 264.5 G = 23.511
H = 1 I = 18.0 J = 1.6 K = 4 L = 11.25
4. Effet Âge : F(2,12) = .67, p>.05; Effet Responsabilité : F(1,12)=5.65, p<.05; Âge X
Responsabilité : F(2,12)=.29, p>.05

Exercice 12 : Analyse de variance pour plan à mesures répétées et


plan mixte (1 point)

1.- Faire le problème 14.1 de Howell (2006/2008).

2.- Faire le problème 14.3 de Howell (2006/2008).

Vous aimerez peut-être aussi