Méthodologie des Guidances Statistiques
Méthodologie des Guidances Statistiques
Méthodologie de la
recherche et statistiques
Eléonore de Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 1
Chapitre 1 : Variables et
organisation d’une recherche
QCM
➤ Rem: Une variable est continue même si l’instrument de mesure ne l’est pas.
On randomise (la randomisation) afin d'essayer de limiter les effets des variables parasites et confondues
sur la variable dépendante.
Ce système est super important pour que les variations de la variable dépendante soient dues à la variable
indépendante et non à autre chose.
QCM
Inter-sujets ! Plan simple, plan à mesures indépendantes (sur JASP : Between subject).
Dans le cas d’un plan simple (donc inter-sujets), chaque sujet ne passe qu’une des conditions.
➤ Ex : On teste la vitesse en lecture selon le sexe ! On ne sait pas dire « toi, tu es une fille et toi, tu es
un garçon », on ne sait pas assigner un sexe aléatoirement.
Intra-sujets ! Plan à mesures répétées (sur JASP : Within subject). Ici, chaque sujet passe toutes les
conditions.
➤ Ex : On teste la vitesse en lecture selon le moment de la journée.
QCM
Les variables catégorielles ne peuvent pas se mesurer. On la nomme, ça renvoie à une catégorie
➤ Ex : fumeur/non fumeur, couleur des yeux, marque de voitures
QCM
Dans les plans à mesures répétées (within subject), chaque sujet est assigné à chacune des conditions
Résultats à un test en fonction
du sexe et du déjeuner
➤ Ex de quasi-expérience
➤ Ex d’expérience
QCM
La VI est manipulée par l'expérimentateur afin que l'échantillon soit le plus représentatif possible de la
population. Le but est de réduire l'effet des variables externes.
QCM
Que ce soit dans une expérience ou dans une quasi-expérience, on cherche toujours à savoir les variations
de la VD par rapport à la VI.
La différence d’une quasi-expérience et d’une expérience est le hasard. Dans une quasi-expérience, on ne
peut pas attribuer les sujets au hasard (Ex : le sexe, la couleur de cheveux)
QCM
12. Un chercheur a effectué une observation pour examiner le lien entre la quantité d'alcool
consommée par des fans de football de l'équipe locale et le nombre de buts marqués par
cette équipe lors du match. Il a trouvé une corrélation entre ces deux grandeurs. Quelles
conclusions peut-on en tirer ?
a) Le lien entre l'alcool consommé et le nombre de buts est réel mais ne signifie pas qu'il
y a une relation de cause à effet entre les deux variables
b) le nombre de buts n'est pas lié à la quantité d'alcool consommée, mais aux
applaudissements de la foule
c) un accroissement de la consommation d'alcool cause un accroissement concomitant
du nombre de buts
d) Toutes ces conclusions
QCM
12. Un chercheur a effectué une observation pour examiner le lien entre la quantité d'alcool
consommée par des fans de football de l'équipe locale et le nombre de buts marqués par
cette équipe lors du match. Il a trouvé une corrélation entre ces deux grandeurs. Quelles
conclusions peut-on en tirer ?
a) Le lien entre l'alcool consommé et le nombre de buts est réel mais ne signifie pas
qu'il y a une relation de cause à effet entre les deux variables
b) le nombre de buts n'est pas lié à la quantité d'alcool consommée, mais aux
applaudissements de la foule
c) un accroissement de la consommation d'alcool cause un accroissement concomitant
du nombre de buts
d) Toutes ces conclusions
Une corrélation a pour objectif de mettre en évidence un lien entre deux variables, il n'y a donc pas de
causalité entre les deux variables.
QCM
13. Dans un plan à mesures répétées, si on néglige le contrebalancement, les résultats risquent
a) D’être déformés par un effet d’ordre
b) D’être déformé par un effet de l’heure
c) D’être insuffisant par manque de participants
d) Tout cela à la fois
QCM
13. Dans un plan à mesures répétées, si on néglige le contrebalancement, les résultats risquent
a) D’être déformés par un effet d’ordre
b) D’être déformé par un effet de l’heure
c) D’être insuffisant par manque de participants
d) Tout cela à la fois
Le contre-balancement est une manière de limiter l'effet d'ordre dans un plan à mesures répétées (les
sujets subissent chaque condition). "Pour contre-balancer, on demande à la moitié seulement des
participants d'effectuer la première condition d'abord, puis la seconde ensuite. Pour l'autre moitié des
participants, on impose l'ordre inverse, à savoir la seconde condition en premier, et ensuite seulement la
première condition" (Dancey & Reidy, 2016, p21).
QCM
14. Vous avez organisé une étude qui montre que plus les gens se lèvent tôt, plus ils travaillent.
Quelles conclusions peut-on en tirer ?
a) Il n'y a pas forcément de relation de cause à effet entre le fait de se lever tôt et le fait
de travailler beaucoup
b) Les gens qui se lèvent tôt ont un besoin naturel de travail
c) Certaines personnes se lèvent plus tôt que les autres parce qu'elles ont beaucoup de
travail à faire
d) Les réponse a) et b)
QCM
14. Vous avez organisé une étude qui montre que plus les gens se lèvent tôt, plus ils travaillent.
Quelles conclusions peut-on en tirer ?
a) Il n'y a pas forcément de relation de cause à effet entre le fait de se lever tôt et le fait
de travailler beaucoup
b) Les gens qui se lèvent tôt ont un besoin naturel de travail
c) Certaines personnes se lèvent plus tôt que les autres parce qu'elles ont beaucoup de
travail à faire
d) Les réponse a) et b)
Ca pourrait être une corrélation (=observation) et pas un lien de causalité. Les 2 variables varient ensemble
=> plus l'une augmente plus l'autre augmente. Mais ce n'est pas spécialement la première qui cause la 2e
(ou inversement)
QCM
15. Quel type d’expérience a le moins de chance de permettre de démontrer une relation de
cause à effet entre deux variables?
a) Les véritables expériences
b) Les quasi-expériences
c) Les observations
d) Les plans à mesures répétées
QCM
15. Quel type d’expérience a le moins de chance de permettre de démontrer une relation de
cause à effet entre deux variables?
a) Les véritables expériences
b) Les quasi-expériences
c) Les observations
d) Les plans à mesures répétées
Les observations permettent de voir s’il existe un lien entre 2 variables, mais pas de montrer une causalité
➤ Ex : On peut observer un lien entre le nombre de livre lu à la maison et le score en lecture. Mais cela ne
veut pas dire que si on a des bons score de lecture, c’est parce qu’on lit beaucoup à la maison.
QCM
17. Supposez que vous vouliez faire une étude pour vérifier que les personnes dépressives se
rongent plus les ongles que les non-dépressifs. Quelles serait la bonne méthode?
a) Faire passer un questionnaire de dépression aux participants, ce qui donne un score de
dépression. Par un autre questionnaire, mesurer si les sujets sont de gros "rongeurs
d'ongles" ou pas. Classer, sur base du premier questionnaire, les participants en
"dépressif" ou "nondépressif" et chercher une différence entre ces deux groupes
b) Comme en a), mais sans séparer les participants en deux groupes. Utiliser plutôt les
vrais scores de dépression et chercher un lien entre les scores de dépression et de
tendance à se ronger les ongles
c) Cette étude est impossible
d) Rien de tout cela
QCM
17. Supposez que vous vouliez faire une étude pour vérifier que les personnes dépressives se
rongent plus les ongles que les non-dépressifs. Quelles serait la bonne méthode?
a) Faire passer un questionnaire de dépression aux participants, ce qui donne un score de
dépression. Par un autre questionnaire, mesurer si les sujets sont de gros "rongeurs
d'ongles" ou pas. Classer, sur base du premier questionnaire, les participants en
"dépressif" ou "nondépressif" et chercher une différence entre ces deux groupes
b) Comme en a), mais sans séparer les participants en deux groupes. Utiliser plutôt les
vrais scores de dépression et chercher un lien entre les scores de dépression et de
tendance à se ronger les ongles
c) Cette étude est impossible
d) Rien de tout cela
Les trois réponses sont justes car elles peuvent avoir une influence sur une VD qu’on sait mesurer.
➤ Ex : Le sexe (VI) par rapport à un score de lecture (VD)
Le fait de souffrir (ou non) de névrose d’angoisse (VI) par rapport à un score en mathématiques (VD)
Le fait d’être (ou non) étudiant (VI) par rapport à un score de stresse (VD)
QCM
19. Dans les plans à mesures répétées, l’effet d’ordre apparait seulement lorsque
a) Les participants sont fatigués dans la dernière condition
b) Les participants ont des résultats égaux dans toutes les situations
c) Les participants ont du mal à obtenir un verre au bar
d) Aucune de ces réponses
QCM
19. Dans les plans à mesures répétées, l’effet d’ordre apparait seulement lorsque
a) Les participants sont fatigués dans la dernière condition
b) Les participants ont des résultats égaux dans toutes les situations
c) Les participants ont du mal à obtenir un verre au bar
d) Aucune de ces réponses
L'effet ordre est le résultat du fait que les personnes participent plusieurs fois à l'étude. La répétition peut
avoir des effets sur la variable dépendante, du seul fait de cette répétition, sans que cela soit attribuable aux
niveaux de la variable indépendante" (Dancey & Reidy, 2016, p21).
Comme les sujets participent plusieurs fois, ils peuvent se fatiguer ou se lasser. Il faut donc contrebalancer.
QCM
20. Parmi les problèmes suivants, lesquels sont associés à la dichotomisation des variables
continues?
a) La réduction de la puissance
b) De faux effet peuvent apparaitre
c) Perte importante d’information
d) Toutes ces réponses
QCM
20. Pari les problèmes suivants, lesquels sont associés à la dichotomisation des variables
continues?
a) La réduction de la puissance
b) De faux effet peuvent apparaitre
c) Perte importante d’information
d) Toutes ces réponses
Dichotomisation = Séparer en plusieurs groupes
THEORIE
1. Parmi les coefficients suivants, lequel est la meilleure estimation de la moyenne sur la
population?
a) La moyenne d’un échantillon
b) La moyenne de plusieurs moyennes d’échantillon
c) Le mode de plusieurs échantillons
d) La médiane de plusieurs échantillon
QCM
1. Parmi les coefficients suivants, lequel est la meilleure estimation de la moyenne sur la
population?
a) La moyenne d’un échantillon
b) La moyenne de plusieurs moyennes d’échantillon
c) Le mode de plusieurs échantillons
d) La médiane de plusieurs échantillon
2. Si vous avez une variable normalement distribuée sur un échantillon et qu’elle ne présente
pas de scores extrêmes, quel paramètre de position choisirez-vous?
a) Le mode
b) La médiane
c) La moyenne
d) Aucun de ceux-là
QCM
2. Si vous avez une variable normalement distribuée sur un échantillon et qu’elle ne présente
pas de scores extrêmes, quel paramètre de position choisirez-vous?
a) Le mode
b) La médiane
c) La moyenne
d) Aucun de ceux-là
La plus part du temps, la moyenne fonctionnera. Si il y a des valeurs aberrantes, alors il faut prendre la
médiane. Le mode est a utilisé en dernier recours.
QCM
La moyenne se base sur les valeurs et est donc sensibles aux valeurs extrêmes. La médiane, elle, se
base sur le rang
➤ Ex : Moyenne des tailles de l’auditoire
Moyenne des tailles de l’auditoire + 1 géant de 4m
QCM
7. Le mode est
a) La fréquence absolue du score le plus fréquent divisé par le nombre total des scores
b) Le score du milieu une fois qu’on a ordonné les valeurs
c) Le score le plus fréquent
d) La somme de tous les scores divisée par le nombre total de valeurs
QCM
7. Le mode est
a) La fréquence absolue du score le plus fréquent divisé par le nombre total des scores
b) Le score du milieu une fois qu’on a ordonné les valeurs
c) Le score le plus fréquent
d) La somme de tous les scores divisée par le nombre total de valeurs
➤ Ex : le mode vestimentaire
QCM
18. L’écart-type d’une série de 12 valeurs est 6. Quelle est alors la variance?
a) 144
b) 2
c) 36
d) 2,45
QCM
18. L’écart-type d’une série de 12 valeurs est 6. Quelle est alors la variance?
a) 144
b) 2
c) 36
d) 2,45
Intervalle de confiance : Encadrer une valeur qu’on cherche à estimer. Cet encadrement a un niveau de
confiance de 95%.
6. Si vous avez une probabilité de 33%, combien vaut-elle exprimée sous forme décimale?
a) 0,033
b) 0,33
c) 0,23
d) 0,133
QCM
6. Si vous avez une probabilité de 33%, combien vaut-elle exprimée sous forme décimale?
a) 0,033
b) 0,33
c) 0,23
d) 0,133
QCM
- Comme nous prenons un échantillon d’une population, il est probable que la moyenne de cet
échantillon diffère de la vraie moyenne de la population. L’écart entre la moyenne de notre
échantillon et la moyenne réelle de la population s’appelle l’erreur standard.
8. Par combien faut-il multiplier l’erreur standard pour déterminer un intervalle de confiance au
niveau de 95%
a) 95
b) La racine de l’échantillon
c) L’écart-type
d) 1,96
QCM
8. Par combien faut-il multiplier l’erreur standard pour déterminer un intervalle de confiance au
niveau de 95%
a) 95
b) La racine de l’échantillon
c) L’écart-type
d) 1,96
10. Si vous un évènement a une probabilité de 95% de se réaliser, cela signifie que
a) L’évènement devrait se produire 5 fois sur 100
b) L’évènement devrait se produire 95 fois sur 100
c) L’évènement devrait se produire 95 fois sur 95
d) Rien de tout cela
QCM
10. Si vous un évènement a une probabilité de 95% de se réaliser, cela signifie que
a) L’évènement devrait se produire 5 fois sur 100
b) L’évènement devrait se produire 95 fois sur 100
c) L’évènement devrait se produire 95 fois sur 95
d) Rien de tout cela
QCM
11. Quelle carrière choisir si vos scores en poterie et haltérophilie sont les suivants :
Haltérophille: 52 (moyenne 55 écart-type 12) Poterie: 50 (moyenne 58, écart-type 32)
a. Haltérophilie
b. Poterie
c. Vos scores sont similaires dans les deux cas, les deux options sont donc équivalentes
d. Aucun des deux, parce que vous êtes mauvais dans les deux disciplines.
QCM
11. Quelle carrière choisir si vos scores en poterie et haltérophilie sont les suivants:
Haltérophille: 52 (moyenne 55 écart-type 12) Poterie: 50 (moyenne 58, écart-type 32)
a. Haltérophilie
b. Poterie
c. Vos scores sont similaires dans les deux cas, les deux options sont donc équivalentes
d. Aucun des deux, parce que vous êtes mauvais dans les deux disciplines.
Dans cet exercice, nous devons calculer le score z qui nous permettra de voir où les deux valeurs se
situent dans la distribution normale standard. Nous pourrons ainsi les comparer.
Haltérophilie: (52-55)/12
La moyenne
= - 0.25 Le score
Ce score si situe à – 0.25 écarts-type de la moyenne
Poterie: (50-58)/32
= - 0.25
Ce score si situe à – 0.25 écarts-type de la moyenne
L’écart-type
Haltérophille
La poterie
QCM
12. Les phrases suivantes, concernant les statistiques inférentielles, sont-elles vraies?
a. Elles ne font que décrire les données
b. Elles permettent de donner des conclusions sur la population à partir de l'observation
d'un échantillon
c. Elles sont machiavéliquement utilisées pour donner un air scientifique à la psychologie
d. Elles permettent de donner des conclusions sur un échantillon à partir de l'observation
de la population.
Comme il est impossible de réaliser une recherche sur toute une population (trop de monde), nous prenons un
échantillon de cette population pour nos tests statistiques inférentiels.
➤ Exemple: nous réalisons une recherche sur l’influence du coca sur l’excitation avant d’aller dormir
Population: toutes les personnes dans le monde qui boivent du coca avant d’aller dormir
Echantillon: un groupe de quelques personnes qui boivent du coca avant d’aller dormir
QCM
13. Si vous avez un score d'anxiété de 13 et que la moyenne de ce score et son écart-type sont
20 et 5 respectivement sur la population, quel est votre score z?
a. -2,33
b. -1,4
c. 1,33
d. 0
QCM
13. Si vous avez un score d'anxiété de 13 et que la moyenne de ce score et son écart-type sont
20 et 5 respectivement sur la population, quel est votre score z?
a. -2,33
b. -1,4
c. 1,33
d. 0
Z = (13-20)/5
= - 1.4
La moyenne
Le score
L’écart-type
QCM
14. Si la distribution des scores sur la population est aplatie (donc pas normale), comment est la
distribution d'échantillonnage de la moyenne?
a. Aplatie
b. Bimodale
c. À asymétrie négative
d. Normale
QCM
14. Si la distribution des scores sur la population est aplatie (donc pas normale), comment est la
distribution d'échantillonnage de la moyenne?
a. Aplatie
b. Bimodale
c. À asymétrie négative
d. Normale
A retenir: les distribution d’échantillonnages tendent vers la normalité, même si la variable sous-
jacente ne l’est pas
SEM = 42/√16
= 10,5
Taille de
l’échantillon
Erreur standard Ecart-type
SEM = s/√N
QCM
17. On tire une centaine d'échantillons dans une population particulière, puis on calcule la moyenne des
scores sur ces échantillons, et on représente par un histogramme la série des moyennes observées.
Qu'est-ce que cela représente?
a. La distribution moyenne
b. Une distribution asymétrique
c. La distribution d'échantillonnage
d. Rien de cela.
QCM
17. On tire une centaine d'échantillons dans une population particulière, puis on calcule la moyenne des
scores sur ces échantillons, et on représente par un histogramme la série des moyennes observées.
Qu'est-ce que cela représente?
a. La distribution moyenne
b. Une distribution asymétrique
c. La distribution d'échantillonnage
d. Rien de cela.
➤ Ex: Dans la population de toutes les voitures rouges, nous faisons 6 échantillons de 10 voitures rouges et on calcule pour chaque
échantillon la moyenne. Nous aurons 6 moyennes différentes. Si nous représentons ces 6 moyennes sur un histogramme, nous
obtiendrons la distribution d’échantillonnage.
QCM
18. Étant donnée une erreur standard de 5,2 sur un échantillon de taille 9, quel est l'écart-type?
a. 1.73
b. 15.6
c. 46.8
d. 0,556.
QCM
18. Étant donnée une erreur standard de 5,2 sur un échantillon de taille 9, quel est l'écart-type?
a. 1.73
b. 15.6
c. 46.8
d. 0,556.
s = 5,2 x √9
= 15.6
20. Si nous avons une population sur laquelle notre variable présente une distribution à
asymétrie négative. quelle forme aura la distribution d'échantillonnage de la moyenne?
a. Elle présentera une asymétrie négative
b. Elle présentera une asymétrie positive
c. Elle sera normale
d. On ne peut pas le savoir.
QCM
20. Si nous avons une population sur laquelle notre variable présente une distribution à
asymétrie négative. Quelle forme aura la distribution d'échantillonnage de la moyenne?
a. Elle présentera une asymétrie négative
b. Elle présentera une asymétrie positive
c. Elle sera normale
d. On ne peut pas le savoir.
A retenir: les distribution d’échantillonnages tendent vers la normalité, même si la variable sous-
jacente ne l’est pas
• Les statistiques inférentielles = pour estimer les paramètres d’une population sur base de ce
qu’on observe dans notre échantillon
• Avec ces tests, nous allons déterminer la probabilité que ce qu’on a observé dans notre
échantillon, soit le résultat d’une erreur d’échantillonnage
• L’intervalle de confiance: Après avoir mesuré une moyenne d’un échantillon, nous allons
l’encadrer avec un intervalle (à 95%). Nous sommes sûr que la moyenne de la population se
trouve dans cet intervalle.
Méthodologie de la
recherche et statistiques
Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 2
Du coup si la probabilité est faible (p<0.05) , ça veut dire qu'on peut, avec la marge d'erreur de 5%,
conclure qu'il est peu probable d'avoir fait une erreur d'échantillonnage, et donc que le lien observé
dans l'échantillon correspond à ce qu'il se passe vraiment dans la population (=on peut généraliser
l'observation de l'échantillon sur la population = statistiques inférentielles)
QCM
3. Si vous obtenez une signification p de 0.02 dans un test unilatéral, quelle est la valeur correspondante
dans le cas d’un test bilatéral?
a. 0.01
b. 0.04
c. 0.02
d. 0.4
QCM
3. Si vous obtenez une signification p de 0.02 dans un test unilatéral, quelle est la valeur correspondante
dans le cas d’un test bilatéral?
a. 0.01
b. 0.04
c. 0.02
d. 0.4
P bilatéral = p unilatéral x 2
QCM
4. Si vous prédisez que deux variables A et B sont liées, quelle est l’hypothèse nulle?
a. Qu’il n’y aucun lien entre les variables A et B
b. Que A est plus grand que B
c. Qu’il y a une différence entre A et B
d. Rien de tout cela
QCM
4. Si vous prédisez que deux variables A et B sont liées, quelle est l’hypothèse nulle?
a. Qu’il n’y aucun lien entre les variables A et B
b. Que A est plus grand que B
c. Qu’il y a une différence entre A et B
d. Rien de tout cela
5. La puissance est
a. α
b. La capacité du test à rejeter l’hypothèse nulle si elle est, en réalité , fausse
c. La sensibilité des participants à nos manipulations
d. Tout cela à la fois
QCM
5. La puissance est
a. α
b. La capacité du test à rejeter l’hypothèse nulle si elle est, en réalité , fausse
c. La sensibilité des participants à nos manipulations
d. Tout cela à la fois
La probabilité qu’un test d’hypothèses puisse détecter une hypothèse alternative si celle-ci est réelle se
nomme la puissance (1 - β).
Plus la puissance est grande, plus le test va nous montrer ce qui correspond à la réalité.
QCM
6. Quand vous prévoyez qu’une condition A donnera des résultats plus élevés que la condition B, vous
faites
a. un test unilatéral
b. un test bilatéral
c. une prédiction unidirectionnelle
d. A la fois a. et c.
QCM
6. Quand vous prévoyez qu’une condition A donnera des résultats plus élevés que la condition B, vous
faites
a. un test unilatéral
b. un test bilatéral
c. une prédiction unidirectionnelle
d. A la fois a. et c.
7. La probabilité qu’un effet significatif se produise par hasard alors que l’hypothèse nulle est vraie est
a. négligeable
b. α
c. ß
d. Rien de tout cela
QCM
7. La probabilité qu’un effet significatif se produise par hasard alors que l’hypothèse nulle est vraie est
a. négligeable
b. α
c. ß
d. Rien de tout cela
8. Si vous trouvez une signification p de 0,02 dans un test bilatéral, quelle est la valeur équivalente pour
un test unilatéral ?
a. 0.01
b. 0.04
c. 0.02
d. 0.4
QCM
8. Si vous trouvez une signification p de 0,02 dans un test bilatéral, quelle est la valeur équivalente pour
un test unilatéral ?
a. 0.01
b. 0.04
c. 0.02
d. 0.4
P bilatéral = p unilatéral x 2
QCM
9. Si vous prédisez une différence entre deux situations A et B, alors vous faites
a. un test unilatéral
b. un test bilatéral
c. une prédiction nulle
d. A la fois b et c
QCM
9. Si vous prédisez une différence entre deux situations A et B, alors vous faites
a. un test unilatéral
b. un test bilatéral
c. une prédiction nulle
d. A la fois b et c
QCM
Question d’examen!
11. Si vous prédisez une différence entre deux conditions A et B, quelle est l’hypothèse nulle?
a. la condition A donnera des résultats plus grands que la condition B
b. la condition B donnera des résultats plus grands que la condition A
c. La condition A et la condition B sont liées
d. Il n’y a aucune différence entre les situations A et B
QCM
11. Si vous prédisez une différence entre deux conditions A et B, quelle est l’hypothèse nulle?
a. la condition A donnera des résultats plus grands que la condition B
b. la condition B donnera des résultats plus grands que la condition A
c. La condition A et la condition B sont liées
d. Il n’y a aucune différence entre les situations A et B
13. Quelles sont les conditions d’application de la plupart des test paramétriques
a. Les données doivent être normalement distribuées
b. Les variances doivent être similaires
c. Il ne faut pas de scores extrêmes
d. Tout cela à la fois
QCM
13. Quelles sont les conditions d’application de la plupart des test paramétriques
a. Les données doivent être normalement distribuées
b. Les variances doivent être similaires
c. Il ne faut pas de scores extrêmes
d. Tout cela à la fois
Théorie pure!!!
QCM
18. Lorsque nous calculons un coefficient à partir de nos scores pour pouvoir faire un test, comment se
nomme cette valeur?
a. significative
b. non-significative
c. Une variable de décision
d. la puissance
QCM
18. Lorsque nous calculons un coefficient à partir de nos scores pour pouvoir faire un test, comment se
nomme cette valeur?
a. significative
b. non-significative
c. Une variable de décision
d. la puissance
Théorie pure!!!
QCM
19. Imaginons que l'on réalise deux études. Dans l'étude A, 1000 participants sont réunis et on trouve un
p de 0,01. Dans l'étude B, qui regroupe 20 participants, on trouve un p de 0,05. Dans laquelle de
ceux études l'effet est-il le plus grand ?
a. l’étude A
b. l’étude B
c. les effets sont égaux
d. on ne peut pas répondre à cette question parce qu’il nous manque des informations
QCM
19. Imaginons que l'on réalise deux études. Dans l'étude A, 1000 participants sont réunis et on trouve un
p de 0,01. Dans l'étude B, qui regroupe 20 participants, on trouve un p de 0,05. Dans laquelle de
ceux études l'effet est-il le plus grand ?
a. l’étude A
b. l’étude B
c. les effets sont égaux
d. on ne peut pas répondre à cette question parce qu’il nous manque des informations
On a tendance à associer la valeur de p à tout… Il ne faut pas!! La valeur de p ne nous donne pas
d’information sur la taille de l’effet
QCM
20. Si vous trouvez une signification p de 0.05, quelle est la probabilité que l’hypothèse alternative soit
vraie?
a. 0.05
b. 0.95
c. On ne peut pas le savoir
d. Rien de tout cela
QCM
20. Si vous trouvez une signification p de 0.05, quelle est la probabilité que l’hypothèse alternative soit
vraie?
a. 0.05
b. 0.95
c. On ne peut pas le savoir
d. Rien de tout cela
De nouveau, la valeur de p n’indique pas si les hypothèse sont vraie ou fausse. On ne peut que les rejeter
ou ne pas les rejeter.
Question d’examen!!!
THEORIE
1. Si une variable x explique 36% des variations d’un score y, quel pourcentage de variation reste
inexpliqué?
a. 64%
b. 36%
c. 6%
d. 0.6%
QCM
1. Si une variable x explique 36% des variations d’un score y, quel pourcentage de variation reste
inexpliqué?
a. 64%
b. 36%
c. 6%
d. 0.6%
QCM
6. Si vous trouvez un coefficient de corrélation r=0.05, quel pourcentage de variation reste inexpliqué?
a. 25%
b. 50%
c. 75%
d. Rien de tout cela
QCM
6. Si vous trouvez un coefficient de corrélation r=0.5, quel pourcentage de variation reste inexpliqué?
a. 25%
b. 50%
c. 75%
d. Rien de tout cela
7. Un chercheur qui a réalisé une étude de corrélation trouve un effet de 64%. A quelle valeur de r cela
correspond-il?
a. +0.8
b. -0.8
c. 0.8 ou -0.8
d. +0.64
QCM
7. Un chercheur qui a réalisé une étude de corrélation trouve un effet de 64%. A quelle valeur de r cela
correspond-il?
a. +0.8
b. -0.8
c. 0.8 ou -0.8
d. +0.64
Le terme « effet » correspond à la variance expliquée. De plus, on ne connait pas le sens de l’effet.
QCM
8. Si vous avez un coefficient de corrélation de 0.4, quelle proportion des variations reste inexpliquée?
a. 16%
b. 40%
c. 84%
d. Rien de tout cela
QCM
8. Si vous avez un coefficient de corrélation de 0.4, quelle proportion des variations reste inexpliquée?
a. 16%
b. 40%
c. 84%
d. Rien de tout cela
9. Le temps passé devant un écran d’ordinateur et la qualité de la vue sont liés négativement. Que
pouvons-nous conclure?
a. Les gens qui ont une mauvaise vue sont plus susceptibles que les autres de passer du temps
devant l’écran
b. Un travail prolongé à l’ordinateur est mauvais pour les yeux
c. Certains types de personnalité correspondent à la fois à une envie de travailler à l’ordinateur et à
une mauvaise vue
d. Tous ces cas sont impossible – la corrélation n’est pas une causalité
QCM
9. Le temps passé devant un écran d’ordinateur et la qualité de la vue sont liés négativement. Que
pouvons-nous conclure?
a. Les gens qui ont une mauvaise vue sont plus susceptibles que les autres de passer du temps
devant l’écran
b. Un travail prolongé à l’ordinateur est mauvais pour les yeux
c. Certains types de personnalité correspondent à la fois à une envie de travailler à l’ordinateur et à
une mauvaise vue
d. Tous ces cas sont impossible – la corrélation n’est pas une causalité
QCM
10. Observez le diagramme de dispersion. Quelle est la conclusion la plus sensée? Que les variables
présentent une corrélation de
a. +1
b. -1
c. +0.7
d. -0.7
QCM
10. Observez le diagramme de dispersion. Quelle est la conclusion la plus sensée? Que les variables
présentent une corrélation de
a. +1
b. -1
c. +0.7
d. -0.7
QCM
11. Observez le diagramme de dispersion ci-dessous. Quelle est la conclusion la plus sensée? Que les
variables présentent une corrélation de
a. -1
b. -0.1
c. 1
d. 0.1
QCM
11. Observez le diagramme de dispersion ci-dessous. Quelle est la conclusion la plus sensée? Que les
variables présentent une corrélation de
a. -1
b. -0.1
c. 1
d. 0.1
QCM
14. Une corrélation de -0.5 a été trouvée entre la taille et le poids dans un groupe d’élèves. Quel
pourcentage de la taille peut s’expliquer par le poids?
a. 5%
b. 50%
c. 25%
d. Rien de tout cela
QCM
14. Une corrélation de -0.5 a été trouvée entre la taille et le poids dans un groupe d’élèves. Quel
pourcentage de la taille peut s’expliquer par le poids?
a. 5%
b. 50%
c. 25%
d. Rien de tout cela
15. Une chercheuse souhaite étudier le lien entre la motivation et les performances à un examen.
Cependant, elle pense que le QI peut influencer ces deux variables et décide donc de déterminer un
coefficient de corrélation partielle. Quelle est la meilleure option possible : calculer le coefficient de
corrélation
a. de motivation et QI indépendamment de la performance
b. de motivation et performance indépendamment du QI
c. de QI et performance indépendamment de la motivation
d. Rien de tout cela n’est pertinent
QCM
15. Une chercheuse souhaite étudier le lien entre la motivation et les performances à un examen.
Cependant, elle pense que le QI peut influencer ces deux variables et décide donc de déterminer un
coefficient de corrélation partielle. Quelle est la meilleure option possible : calculer le coefficient de
corrélation
a. de motivation et QI indépendamment de la performance
b. de motivation et performance indépendamment du QI
c. de QI et performance indépendamment de la motivation
d. Rien de tout cela n’est pertinent
Le QI est une variable confondue ici, donc on la prend indépendamment.
QCM
Si Jasp indique p = .00000, nous devons rapporter cette valeur comme cela : p < 0.0001
THEORIE
➢ (20 – 1) + (20 – 1) = 38
QCM
2. Pour un test de comparaison de moyennes (40 participants) pour deux échantillons appariés, le dl
est de
a. 20
b. 39
c. 38
d. aucun de ceux-là.
QCM
2. Pour un test de comparaison de moyennes (40 participants) pour deux échantillons appariés, le dl
est de
a. 20
b. 39
c. 38
d. aucun de ceux-là.
➢ 40 – 1 = 39
QCM
➢ 40 – 1 = 39
Théorie - rappel
4. Une centaine d'étudiants ont été testés grâce à un questionnaire d'anxiété avant et après une
thérapie contre l'anxiété. Les scores sont normaux sur la population. Quel test est le plus approprié?
a. Le test de comparaison de moyennes pour deux échantillons indépendants
b. Le test de comparaison de moyennes pour deux échantillons appariés
c. Le test de Levene
d. Aucun de ceux-là.
QCM
4. Une centaine d'étudiants ont été testés grâce à un questionnaire d'anxiété avant et après une
thérapie contre l'anxiété. Les scores sont normaux sur la population. Quel test est le plus approprié?
a. Le test de comparaison de moyennes pour deux échantillons indépendants
b. Le test de comparaison de moyennes pour deux échantillons appariés
c. Le test de Levene
d. Aucun de ceux-là.
Les tests statistiques ont pour but de comparer les moyennes des deux groupes, afin de voir s’il y a une différence entre
les deux groupes
Les étudiants sont questionnés avant la thérapie. Les mêmes étudiants sont questionnés après la thérapie:
échantillons appariés
Groupe 1 Groupe 2
Florian Florian
Eléonore Eléonore
Marine Marine
Martin Martin
QCM
5. La plus importante condition qui permet l'utilisation du test de Student est que
a. les variances doivent être aussi petites que possible
b. les scores doivent être normaux sur la population
c. les conditions doivent correspondre à des moyennes égales
d. tout cela à la fois.
QCM
5. La plus importante condition qui permet l'utilisation du test de Student est que
a. les variances doivent être aussi petites que possible
b. les scores doivent être normaux sur la population
c. les conditions doivent correspondre à des moyennes égales
d. tout cela à la fois.
Théorie à connaitre
QCM
6. Plus la statistique test élevée, plus il est probable que la différence observée
a. vienne d'une erreur d'échantillonnage sous l'hypothèse nulle
b. vienne d'autre chose qu'une erreur d'échantillonnage
c. soit nulle
d. rien de tout cela.
QCM
6. Plus la statistique test élevée, plus il est probable que la différence observée
a. vienne d'une erreur d'échantillonnage sous l'hypothèse nulle
b. vienne d'autre chose qu'une erreur d'échantillonnage
c. soit nulle
d. rien de tout cela.
Théorie à connaitre
Plus la statistique de test (t, F,..) est élevé, plus p est petit
➢ Si p est petit = le risque que nous avons obtenu le résultat qu’on a obtenu alors qu’il y a une erreur
d’échantillonnage, est faible
QCM
Théorie à connaitre
Le signe n’a pas d’importance
QCM
Attention: le livre utilise des tableaux SPSS et nous utilisons l’application JASP, mais le principe reste le même
QCM
Attention: le livre utilise des tableaux SPSS et nous utilisons l’application JASP, mais le principe reste le même
QCM
10. La grandeur de l'effet pour des groupes indépendants d est donnée par:
a. (moyenne 1 - moyenne 2) / écart-type
b. (moyenne 1 + moyenne 2) / écart-type
c. (moyenne 1 - moyenne 2) / erreur standard
d. (moyenne 1 + moyenne 2) / erreur standard.
QCM
10. La grandeur de l'effet pour des groupes indépendants d est donnée par:
a. (moyenne 1 - moyenne 2) / écart-type
b. (moyenne 1 + moyenne 2) / écart-type
c. (moyenne 1 - moyenne 2) / erreur standard
d. (moyenne 1 + moyenne 2) / erreur standard.
Formule à connaitre
Moyenne 1 – moyenne 2 (l’ordre n’a pas d’importance))
Ecart-type)
QCM
11. Si l'intervalle de confiance au niveau de confiance 95 % pour la différence entre les moyennes est
(10,5; 13,01), nous pouvons en déduire que, si nous reproduisons 100 fois l'expérience:
a. nos résultats seront significatifs 5 fois
b. nos résultats seront significatifs 95 fois
c. la moyenne observée sera entre 10,5 et 13,0 dans 95 % des cas, et sera en dehors le reste du
temps
d. rien de tout cela.
QCM
11. Si l'intervalle de confiance au niveau de confiance 95 % pour la différence entre les moyennes est
(10,5; 13,01), nous pouvons en déduire que, si nous reproduisons 100 fois l'expérience:
a. nos résultats seront significatifs 5 fois
b. nos résultats seront significatifs 95 fois
c. la moyenne observée sera entre 10,5 et 13,0 dans 95 % des cas, et sera en dehors le reste du
temps
d. rien de tout cela.
Théorie à connaitre
QCM
Théorie à connaitre
• SPSS = JASP
• Dans JASP, il n y aura jamais p = O,OOO MAIS il sera noté
comme l’exemple ci-dessous:
QCM
13. Pour un plan à mesures répétées utilisant 20 participants, le degré de liberté pour le test de
comparaison de moyennes est
a. 20
b. 38
c. 19
d. 40.
QCM
13. Pour un plan à mesures répétées utilisant 20 participants, le degré de liberté pour le test de
comparaison de moyennes est
a. 20
b. 38
c. 19
d. 40.
➢ 20 – 1 = 19
QCM
Théorie à connaitre
QCM
15. Après avoir lu l'extrait suivant d'un article de Ratcliff et al. (2003), répondez à la question qui suit.
Les changements de moyenne entre les sessions 4 et 5 étaient tous significatifs selon les tests de
comparaison de moyennes pour échantillons pairés (tous les p étant inférieurs à 0,001, sauf pour MMSE,
P = 0,012, le rappel différé de listes de mots, P = 0,009, et le « Boston naming », p = 0,019).
Pourquoi les premières valeurs p sont-elles rapportées comme étant simplement inférieures à 0,001,
alors que les trois dernières sont données par des chiffres exacts ?
15. Après avoir lu l'extrait suivant d'un article de Ratcliff et al. (2003), répondez à la question qui suit.
Les changements de moyenne entre les sessions 4 et 5 étaient tous significatifs selon les tests de
comparaison de moyennes pour échantillons pairés (tous les p étant inférieurs à 0,001, sauf pour MMSE,
P = 0,012, le rappel différé de listes de mots, P = 0,009, et le « Boston naming », p = 0,019).
Pourquoi les premières valeurs p sont-elles rapportées comme étant simplement inférieures à 0,001,
alors que les trois dernières sont données par des chiffres exacts ?
Méthodologie de la
recherche et statistiques
Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 3
Chapitre 8 : Autour de la
signification
QCM
L’intervalle de confiance sert à encadrer la moyenne de l’échantillon. Plus il est petit, plus on est
certain de nos résultats. Plus il est grand, moins on est certain.
QCM
2. La signification statistique
a. est équivalente à l’importance
b. ne signifie pas forcément que le résultat est psychologiquement important
c. dépend de la taille de l’échantillon
d. A la fois b. et c.
QCM
2. La signification statistique
a. est équivalente à l’importance
b. ne signifie pas forcément que le résultat est psychologiquement important
c. dépend de la taille de l’échantillon
d. a la fois b. et c.
3. Toutes choses égales par ailleurs, les plans à mesures répétées donnent
a. la même puissance que les autres plans
b. une puissance en général inférieure aux autres plans d’expérience
c. une puissance en général supérieurs aux autres plans
d. rien de tout cela
QCM
3. Toutes choses égales par ailleurs, les plans à mesures répétées donnent
a. la même puissance que les autres plans
b. une puissance en général inférieure aux autres plans d’expérience
c. une puissance en général supérieurs aux autres plans
d. rien de tout cela
Théorie pure!!!
Les plans à mesures indépendantes sont moins puissants que les plans à mesures répétées
QCM
Au plus la taille de l’échantillon augmente, au plus il y a de participants, au plus on est certain de voir
un effet s’il existe. Donc la puissance statistique augmente.
QCM
On ne peut pas savoir la moyenne de la population exactement. On ne sait faire que des estimations
ponctuelles (à un moment donné). Si on prend plusieurs échantillons, on peut prendre les moyennes
d’échantillons pour en faire une moyenne qui se rapproche de celle de la population (statistiques
inférentielles)
QCM
8. Toutes choses égales par ailleurs, plus un test statistique est puissant
a. plus l’intervalle de confiance est large
b. plus il est probable que l’intervalle de confiance contienne zéro
c. plus l’intervalle de confiance est court
d. plus la taille de l’échantillon est réduite
QCM
8. Toutes choses égales par ailleurs, plus un test statistique est puissant
a. plus l’intervalle de confiance est large
b. plus il est probable que l’intervalle de confiance contienne zéro
c. plus l’intervalle de confiance est court
d. plus la taille de l’échantillon est réduite
Si l’intervalle de confiance de confiance est court, alors la moyenne se trouve dans ce court intervalle.
Donc il est préférable qu’il soit petit.
QCM
13. Un chercheur a trouvé un coefficient de corrélation de r = +0.3, un IC (à 95%) de [-0.2 ; 0.7]. Quelle
est la meilleur conclusion : que l’on est sûr à 95% que la corrélation sur la population toute entière
a. est positive (+0.3)
b. est nulle
c. est négative (-0.2)
d. se trouve entre -0.2 et 0.7
QCM
13. Un chercheur a trouvé un coefficient de corrélation de r = +0.3, un IC (à 95%) de [-0.2 ; 0.7]. Quelle
est la meilleur conclusion : que l’on est sûr à 95% que la corrélation sur la population toute entière
a. est positive (+0.3)
b. est nulle
c. est négative (-0.2)
d. se trouve entre -0.2 et 0.7
16. Il est plus important de connaitre la puissance associé à une étude quand
a. l’étude est faite sur un nombre important de participants et les résultats sont significatifs
b. l’étude est faite sur un nombre important de participants et les résultats sont non significatifs
c. l’étude est faite sur un nombre réduit de participants et les résultats sont significatifs
d. l’étude est faite sur un nombre réduit de participants et les résultats sont non significatifs
QCM
16. Il est plus important de connaitre la puissance associé à une étude quand
a. l’étude est faite sur un nombre important de participants et les résultats sont significatifs
b. l’étude est faite sur un nombre important de participants et les résultats sont non significatifs
c. l’étude est faite sur un nombre réduit de participants et les résultats sont significatifs
d. l’étude est faite sur un nombre réduit de participants et les résultats sont non significatifs
Si d’avance je sais que j’ai un nombre de participants assez réduit, autant essayer de l’augmenter car
mes résultats ne seront surement pas significatifs.
Tandis que si j’ai déjà un grand échantillon mais que mes résultats ne sont pas significatifs, alors je
peux m’interroger sur le nombre de participants malgré tout.
QCM
Exercices guidés
Exercices en autonomie
Exercice guidé 1
…. …
Exercice guidé 1
Etape 3
Quelles sont mes variables?
Nous souhaitons tester l’efficacité de deux manuels scolaires. La classe 1A étudie leur cours d’histoire avec le
manuel A. La classe 1B étudie leurs cours d’histoire avec le manuel B. Nous comparons ensuite leur note obtenue à
l’examen, avec le manuel qu’ils ont utilisé pour l’étudier.
Hypothèse bilatérale
Exercice guidé 1
Etape 5
Je note ma conclusion
Un test t pour échantillons indépendants montre que cette différence de moyenne est
significative (t(22) = 6.14; p < 0.001)
4. Conclusion en 1 phrase
En conclusion, selon cette étude, le manuel B est plus efficace que le manuel A.
Exercice guidé 2
Etape 1
je vérifie si les conditions d’applications sont remplies
Selina 8 Nadia 8
…. …
Exercice guidé 2
Etape 3
Quelles sont mes variables?
Nous souhaitons tester la capacité de la mémoire après avoir bu de l’alcool ou après avoir bu de l’eau. Nous
demandons à 40 étudiants, 20 qui ont bu de l’alcool et 20 qui ont bu de l’eau de retenir 10 mots. Nous comptons
ensuite le nombre de mot que chaque étudiant à retenu en fonction de son groupe.
Hypothèse bilatérale
Exercice guidé 1
Etape 5
Je note ma conclusion
Un test t pour échantillons indépendants montre que cette différence de moyenne est
non-significative (t(38) = 0.42; p = 0.68)
4. Conclusion en 1 phrase
En conclusion, nous ne pouvons pas conclure qu’il y a un lien entre la boisson bue la
veille et la capacité de mémorisation des étudiants.
Exercice autonome 1
Méthodologie de la
recherche et statistiques
Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 4
La représentation d'une ANOVA à un facteur (VI) = "professeur qui a donné la leçon". Le facteur a 3
conditions, 3 niveaux du facteurs, 3 modalités(= "madame Renard" ou "madame Poule" ou "monsieur
girafe").
On est dans un plan simple, échantillon indépendant parce que les participants (= élèves) apparaissent une
seule fois toutes les modalités
QCM
La représentation d'une ANOVA à un facteur (VI) = job. Ce facteur a 3 modalités(caissière au Carrefour, hôte à
Walibi, tuteur).
Il s'agit d'un plan à mesures répétées, échantillon apparié. Chaque participant se retrouve dans chacune des
conditions.
QCM
2. Voici les résultats sortie de SPSS. Quelle est la conclusion la plus raisonnable?
a. Les trois groupes sont significativement différents
b. Il existe des différences importantes entre les groupes, mais elles ne sont pas significatives
c. Il n’y a pas de différence significative entre les groupes car le risque d’erreur est trop élevé
d. On ne peut pas tirer de conclusion de cette étude
QCM
2. Voici les résultats sortie de SPSS. Quelle est la conclusion la plus raisonnable?
a. Les trois groupes sont significativement différents
b. Il existe des différences importantes entre les groupes, mais elles ne sont pas significatives
c. Il n’y a pas de différence significative entre les groupes
d. On ne peut pas tirer de conclusion de cette étude
QCM
3. Le tableau suivant est donné par le logiciel SPSS. Que peut-on en conclure?
a. Les variances sont significativement différentes
b. Les variances sont similaires
c. Les variances sont hétérogènes
d. Rien de tout cela
QCM
3. Le tableau suivant est donné par le logiciel SPSS. Que peut-on en conclure?
a. Les variances sont significativement différentes
b. Les variances sont similaires
c. Les variances sont hétérogènes
d. Rien de tout cela
QCM
4. Les résultats d’une étude donne un p significatif pour une ANOVA simple. Quelle est la conclusion la
plus appropriée?
a. Il y a une différence significative entre les groupes et je sais d’avance où elle se situe.
b. Il y a une différence significative entre les groupes, mais je ne sais pas où elle se situe.
c. Il n’y a pas de différence significative entre le groupes, je dois faire des test post-hoc.
d. Rien de tout cela
QCM
4. Les résultats d’une étude donne un p significatif pour une ANOVA simple. Quelle est la conclusion la
plus appropriée?
a. Il y a une différence significative entre les groupes et je sais d’avance où elle se situe.
b. Il y a une différence significative entre les groupes, mais je ne sais pas où elle se situe.
c. Il n’y a pas de différence significative entre le groupes, je dois faire des test post-hoc.
d. Rien de tout cela
QCM
Plus la variation inter-groupe est grande par rapport à la variation intragroupe, plus F est grand. Et plus F est
grand, plus le p associé est petit (et donc il va être de plus en plus probable que cette taille de F soit due à la
seule erreur d'échantillonnage).
Attention, F = statistique de test (pas à la taille de l'effet)
QCM
7. Le professeur de Saint-Glé examine la différence entre trois groupes. Si les groupes sont homogènes pour
la variance, cela signifie que les variances des trois groupes sont
a. Similaires
b. Dissemblables
c. Exactement égales
d. Très différentes
QCM
7. Le professeur de Saint-Glé examine la différence entre trois groupes. Si les groupes sont homogènes pour
la variance, cela signifie que les variances des trois groupes sont
a. Similaires
b. Dissemblables
c. Exactement égales
d. Très différentes
QCM
8. Une différence entre les groupes qui provient de la manipulation expérimentale se nomme
a. Différence individuelle
b. Effet du traitement ou de la condition
c. Erreur expérimentale
d. Effet intra-sujet
QCM
8. Une différence entre les groupes qui provient de la manipulation expérimentale se nomme
a. Différence individuelle
b. Effet du traitement ou de la condition
c. Erreur expérimentale
d. Effet intra-sujet
9. Monsieur Noisette se demande s’il doit utiliser un plan simple ou à mesures répétées pour son étude.
Comme d’habitude, il y a des avantages et des inconvénients dans chaque cas. Il a quatre conditions. Si, dans
un plan à mesures répétées, il utilise 10 participants, combien lui en faudrait-il pour un plan simple?
a. 40
b. 20
c. 10
d. 100
QCM
9. Monsieur Noisette se demande s’il doit utiliser un plan simple ou à mesures répétées pour son étude.
Comme d’habitude, il y a des avantages et des inconvénients dans chaque cas. Il a quatre conditions. Si, dans
un plan à mesures répétées, il utilise 10 participants, combien lui en faudrait-il pour un plan simple?
a. 40
b. 20
c. 10
d. 100
QCM
11. Le docteur Dingue réparti aléatoirement 96 participants dans 4 groupes. Il inspecte, car il est fort
méticuleux, les histogrammes des 4 groupes. Il remarque que ses données sont plus ou moins normales. Pour
traiter ses données, il devrait utiliser
a. Une ANOVA simple
b. Un test de Student
c. Un coefficient de corrélation linéaire
d. Une ANOVA pour plan à mesures répétées
QCM
11. Le docteur Dingue réparti aléatoirement 96 participants dans 4 groupes. Il inspecte, car il est fort
méticuleux, les histogrammes des 4 groupes. Il remarque que ses données sont plus ou moins normales. Pour
traiter ses données, il devrait utiliser
a. Une ANOVA simple
b. Un test de Student
c. Un coefficient de corrélation linéaire
d. Une ANOCA pour plan à mesures répétées
QCM
Dans le cas d’un plan à mesures répétées, les corrélations (variances) entre conditions doivent être similaire.
Faute dans le livre!!
Ce test est remis en cause par certain chercheur.
QCM
13. Si, dans une ANOVA, vous obtenez un n² de 0.52, quelle proportion de la variances des scores est
imputable à la variable indépendante?
a. 9%
b. 52%
c. 25%
d. 27%
QCM
13. Si, dans une ANOVA, vous obtenez un n² de 0.52, quelle proportion de la variances des scores est
imputable à la variable indépendante?
a. 9%
b. 52%
c. 25%
d. 27%
14. Calculez quelle proportion de la variance totale est due à l’erreur et à la manipulation expérimentale, c’est
a. Calculer la variance
b. Répartir la variance
c. Produire la variance
d. Résumer la variance
QCM
14. Calculez quelle proportion de la variance totale est due à l’erreur et à la manipulation expérimentale, c’est
a. Calculer la variance
b. Répartir la variance
c. Produire la variance
d. Résumer la variance
15. On donne les résultats d’un test post-hoc. Quel groupe diffère de quel autre?
a. Seulement surveillance et clergé
b. Seulement surveillance et immobilier
c. Immobilier et clergé seulement
d. Clergé diffère de immobilier, ainsi que immobilier de surveillance
QCM
15. On donne les résultats d’un test post-hoc. Quel groupe diffère de quel autre?
a. Seulement surveillance et clergé
b. Seulement surveillance et immobilier
c. Immobilier et clergé seulement
d. Clergé diffère de immobilier, ainsi que immobilier de surveillance
QCM
✓ L'ANOVA permet de comparer une VD numérique dans plusieurs groupes définis par les différentes modalités
d'un ou plusieurs facteurs (VI)
✓ L'ANOVA cherche une différence entre les moyennes des groupes. Elle cherche la moyenne générale et
compare les différentes moyennes à cette moyenne générale
✓ L'ANOVA est une extension du test de Student à plus de deux groupes
✓ H0: M1 = M2 = M3
✓ Condition d’application : Normalité, homogénéité des variances, sphéricité (plan à mesures répétées)
✓ F = variance inter-groupes/variance intra-groupes
✓ Comparaison à priori : Faire des test-t 2 à 2 soit même ET ajuster le seuil selon le nombre de comparaison.
✓ Comparaison post-hoc : Bouton sur Jasp (Bonferroni, Tukey) et le seuil est ajusté tout seul.
✓ Taille de l’effet :
✓ Ecart-type moyen :
THEORIE
✓ L’ANOVA à mesures répétées a une source de variation en moins : Variance due aux différence inter-
individuelles ! Ce sont les mêmes sujets.
✓ L’ANOVA à mesures répétées est plus puissant que le plan simple.
EXERCICES
! Les exercices ont été inventés pour les guidances de statistiques. Les chiffres ne sont pas réels.
Exercice guidé 1
Etape 2
Quel type de test est-ce que je vais utiliser?
Nous souhaitons voir s’il y a un lien de cause à effet entre le nombre d’interaction qu’on a en promenade et la
race du chien qu’on promène. Pour ce faire, nous avons 3 groupes de 10 étudiants qui promènent soit un Jack
Russel, soit un Golden Retriever, soit un bulldog. Nous comptons le nombre d’interaction que chacun des
groupes a eu.
Etape 3
Quelles sont mes variables?
Nous souhaitons voir s’il y a un lien de cause à effet entre le nombre d’interaction qu’on a en promenade et la
race du chien qu’on promène. Pour ce faire, nous avons 3 groupes de 10 étudiants qui promènent soit un Jack
Russel, soit un Golden Retriever, soit un bulldog. Nous comptons le nombre d’interaction que chacun des
groupes a eu.
Etape 4
J’écris mes hypothèses
Nous souhaitons voir s’il y a un lien de cause à effet entre le nombre d’interaction qu’on a en promenade et la
race du chien qu’on promène. Pour ce faire, nous avons 3 groupes de 10 étudiants qui promènent soit un Jack
Russel, soit un Golden Retriever, soit un bulldog. Nous comptons le nombre d’interaction que chacun des
groupes a eu.
➢ Hypothèse à posteriori
Exercice guidé 1
Etape 4
Je note ma conclusion
Théorie
Etape 4
Je note ma conclusion
Partie 1
1. Présenter les données descriptives
Le graphique « descriptives plots » suggère que la condition « Golden retriever » à,
en moyenne, plus d’interactions que les deux autres conditions.
2. Impression confirmée ou non + nom du test
Une analyse de variance (ANOVA) plan simple appuie ces impressions (F(2,27) =
63.13; MSE = 1071.30; p < 0.001; n² = 0.82)
Exercice guidé 1
Etape 4
Je note ma conclusion
Partie 2
3. Comparaison de moyennes
Un test post-hoc (Bonferonni) à été réalisé et indique que la moyenne du groupe qui s’est promené avec un golden retriever est
significativement plus importante que le groupe qui s’est promené avec un Jack Russel (p < 0.001; d = 2.14) et le groupe qui s’est promené
avec un Bull dog (p < 0.001; d = - 5.00)
Ce même test indique également que les personnes qui se sont promenés avec un Jack Russel ont eu significativement plus d’interactions
que ceux qui se sont promenés avec un bull dog (p < 0.001, d = - 3.17 )
PS : Il faut regarder les moyennes pour savoir laquelle est plus haute!!
Exercice guidé 2
Etape 2
Quel type de test est-ce que je vais utiliser?
La performance sportive à une épreuve est étudiée en fonction du temps de repos, décliné en 3 modalités: moins de 6h, entre 6h
et 8h, plus de 8h.Le chercheur récolte un groupe de 10 sportifs. Ils passent une première épreuve avec moins de 6h de repos, le
lundi. Une deuxième épreuve avec 6 à 8h de repos le jeudi. Une troisième épreuve avec plus de 8h de repos le dimanche. Le
chercheur s’attend à ce que les sportifs ayant eu plus de 8h de repos, obtiennent un meilleur score à l’épreuve que ceux qui ont
eu moins de 8h de repos.
Etape 3
Quelles sont mes variables?
La performance sportive à une épreuve est étudiée en fonction du temps de repos, décliné en 3 modalités: moins de 6h, entre 6h et 8h,
plus de 8h.Le chercheur récolte un groupe de 10 sportifs. Ils passent une première épreuve avec moins de 6h de repos, le lundi. Une
deuxième épreuve avec 6 à 8h de repos le jeudi. Une troisième épreuve avec plus de 8h de repos le dimanche. Le chercheur s’attend à ce
que les sportifs ayant eu plus de 8h de repos, obtiennent un meilleur score à l’épreuve que ceux qui ont eu moins de 8h de repos.
H0 : la moyenne obtenue par les sportifs ayant eu plus de 8h de repos est inférieur ou égale à la moyenne obtenue par les sujets ayant eu entre 6h et 8h de
repos
H1 : la moyenne obtenue par les sportifs ayant eu plus de 8h de repos est supérieur à la moyenne obtenue par les sujets ayant eu entre 6h et 8h de repos
H0: la moyenne obtenue par les sportifs ayant eu plus de 8h de repos est inférieur ou égale à la moyenne obtenue par les sujets ayant eu moins de 6h de
repos
H1 : la moyenne obtenue par les sportifs ayant eu plus de 8h de repos est supérieur à la moyenne obtenue par les sujets ayant eu moins de 6h de repos
➢ Hypothèse à priori
Exercice guidé 2
Etape 4
Je note ma conclusion
Partie 1
1. Présenter les données descriptives
Le graphique « descriptives plots » suggère que la condition « plus de 8h » a, en
moyenne, un score plus élevé que les deux autres conditions.
2. Impression confirmée ou non + nom du test
Une analyse de variance (ANOVA) plan à mesures répétées appuie ces impressions
(F(2,18) = 10.44; MSE = 57.63; p < 0.001; n² = 0.54)
Exercice guidé 2
Etape 4
Je note ma conclusion
Partie 2
3. Comparaison de moyennes
Le graphique « descriptives plots » suggère que la condition « Traitement A » est, en moyenne, plus efficace que
les deux autres traitements.
Une analyse de variance (ANOVA) plan simple appuie ces impressions (F(2,27) = 41.50; MSE = 80.53; p < 0.001;
n² = 0.76)
Un test post-hoc (Bonferonni) à été réalisé et indique que la moyenne du groupe ayant eu le traitement A est
significativement plus importante que le groupe ayant eu le traitement B (p = 0.01; d = 1.70) et le groupe ayant
eu le placebo (p < 0.001; d = - 3.67)
Ce même test indique également que les personnes ayant eu le traitement B est significativement plus
importante que le groupe ayant eu le placebo (p < 0.001, d = - 2.48 )
LOGO-E5001
Méthodologie de la
recherche et statistiques
Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 5
✓ Quand on demande « Combien d’effet pouvons-nous tester… » ! Effets principaux + Interaction (pas les
effets simples).
✓ Quelles sont les sources de variation possibles dans un plan complètement inter-sujet ?
--> les 2 VI, les erreurs et l'interaction des VI
✓ Quelles sont les sources de variation possibles dans un plan complètement intra-sujet?
--> La VI1 et l'erreur associée, la VI2 et son erreur associée, l'interaction et l'erreur associée
ANOVA 2 x 2 x 4
VI VI VI
Je compte 3 facteurs, 3 variables indépendantes
La première à 2 niveaux, conditions, modalités
La deuxième à 2 niveaux, conditions, modalités
La troisième à 4 niveaux, conditions, modalités
Ex : Je test l’effet du sommeil (bien dormi, pas dormi ! VI – catégoriel – 2 niveaux), de la satiété (bien
mangé, pas mangé ! VI – catégoriel – 2 niveaux) et de l’humeur (pas heureux, légèrement heureux,
heureux, très heureux ! VI – catégoriel – 4 niveaux) sur le stresse (VD – continue)
QCM
ANOVA 4 x 5 x 6 x 12
VI VI VI VI
3. Quelles sont les sources de variations possibles dans un plan complètement inter-sujet?
a. La population dans son ensemble
b. Chacune des deux VI, et l’erreur
c. Les deux VI, les erreurs et l’interaction des VI
d. A la fois a et c.
QCM
3. Quelles sont les sources de variations possibles dans un plan complètement inter-sujet?
a. La population dans son ensemble
b. Chacune des deux VI, et l’erreur
c. Les deux VI, les erreurs et l’interaction des VI
d. A la fois a et c.
4. n² est
a. Une mesure de la taille de la probabilité d’erreurs d’échantillonnage
b. Une mesure de la taille d’effet qu’on utilise en ANOVA
c. une organisation
d. A la fois a et b.
QCM
4. n² est
a. Une mesure de la taille de la probabilité d’erreurs d’échantillonnage
b. Une mesure de la taille d’effet qu’on utilise en ANOVA
c. une organisation
d. A la fois a et b.
QCM
9. Quelle proportion des variations de la VD s’explique par l’interaction entre le véhicule et le lieu?
a. 95.4%
b. 5.2%
c. 37.3%
d. 0.7%
QCM
9. Quelle proportion des variations de la VD s’explique par l’interaction entre le véhicule et le lieu?
a. 95.4%
b. 5.2%
c. 37.3%
d. 0.7%
QCM
11. Combien d’effets pouvons-nous tester dans le cadre d’une ANOVA 2x2?
a. 1
b. 2
c. 3
d. 4
QCM
11. Combien d’effets pouvons-nous tester dans le cadre d’une ANOVA 2x2?
a. 1
b. 2
c. 3
d. 4
L’ANOVA va nous dire si oui ou non, il y a un effet principal de chaque condition puis, éventuellement, s'il
y a une interaction
QCM
On utilise ce test dans le cas d’un plan à mesures répétées s’il y a plus de deux modalités. Il n’y a pas le nom
de le cours.
QCM
14. Quelles sont les sources de variation dans un plan complètement intra-sujets à 2 VI?
a. La VI1 et l’erreur associée, la VI2 et l’erreur associée, l’interaction et l’erreur associée
b. Les facteurs, l’interaction, l'erreur
c. Les facteurs, l’interaction
d. Rien de tout cela
QCM
14. Quelles sont les sources de variation dans un plan complètement intra-sujets à 2 VI?
a. La VI1 et l’erreur associée, la VI2 et l’erreur associée, l’interaction et l’erreur associée
b. Les facteurs, l’interaction, l'erreur
c. Les facteurs, l’interaction
d. Rien de tout cela
Dans un plan à mesures répétées, on est amené à considérer l’erreur pour chaque effet (contrairement aux
autres plans)
QCM
17. Si vous avez un carré moyen de 12.4 pour votre effet, et de 3.1 pour l’erreur, quelle est la valeur de
F?
a. 6.2
b. 4.1
c. 3.1
d. 4
QCM
17. Si vous avez un carré moyen de 12.4 pour votre effet, et de 3.1 pour l’erreur, quelle est la valeur de
F?
a. 6.2
b. 4.1
c. 3.1
d. 4
18. Dans le cas d’un plan complètement intra-sujets, avec des VI à deux modalités, comment étudier les
effets simples?
a. Avec des test-t pour échantillons indépendants en scindant le fichier
b. Par des test de Student pour échantillons indépendants, en ajustant le risque d’erreur alpha
c. Avec des tests de comparaisons de moyennes pairés en ajustant alpha
d. Rien de tout cela
QCM
18. Dans le cas d’un plan complètement intra-sujets, avec des VI à deux modalités, comment étudier les
effets simples?
a. Avec des test-t pour échantillons indépendants en scindant le fichier
b. Par des test de Student pour échantillons indépendants, en ajustant le risque d’erreur alpha
c. Avec des tests de comparaisons de moyennes pairés en ajustant alpha
d. Rien de tout cela
QCM
19. Combien d’effets pouvons-nous étudier dans une ANOVA 2x2x2 sans tenir compte des effets
simples?
a. 3
b. 5
c. 7
d. 8
QCM
19. Combien d’effets pouvons-nous étudier dans une ANOVA 2x2x2 sans tenir compte des effets
simples?
a. 3
b. 5
c. 7
d. 8
VI1 + VI2 + VI3 + VI1 et VI2 + VI1 et VI3 + VI2 et VI3 + VI1 et VI2 et VI3
L’erreur n’est pas un effet un effet à proprement parler ici, elle n’est pas à considérer dans les sources de
variation.
QCM
21. Décomposer la variance totale dans le cas d’une ANOVA complètement inter-sujet à 4 facteurs,
disons A, B, C et D.
QCM
21. Décomposer la variance totale dans le cas d’une ANOVA complètement inter-sujet à 4 facteurs,
disons A, B, C et D.
Effets principaux : A, B, C, D
Interactions : AB, AC, AD, BC, BD, CD, ABC, ACD, ABD, BCD, ABCD
L'erreur
QCM
Réalisez une figure représentant l’interaction entre les deux VI à partir du tableau ci-dessous. La figure doit
représenter les intervalles de confiance à 95% autour des moyennes.
95% IC
Moment
Chien Marginal Mean SE Lower Upper
journée
Golden Matin 16.20 0.48 15.98 18.01
Soir 19.41 0.48 17.76 20.04
Bernois Matin 15.87 0.48 13.62 16.90
Soir 21.59 0.48 20.14 23.28
EXERCICES
Réalisez une figure représentant l’interaction entre les deux VI à partir du tableau ci-dessous. La figure doit
représenter les intervalles de confiance à 95% autour des moyennes.
95% IC
Moment Marginal
Chien SE Lower Upper
journée Mean
Golden Matin 15.98 18.01
16.20 0.48
Etape 2
Quel type de test est-ce que je vais utiliser?
On s’intéresse au nombre de connexions faites sur Instagram par jour chez les garçons et les filles en fonction de la
marque du téléphone. Deux groupes de 20 adolescents ayant un Iphone ou un samsung sont choisis au hasard et
scindés en deux groupes (garçon, fille).
• Test t pour échantillons indépendants • Anova à un seul facteur, plan à mesures répétées
Etape 3
Quelles sont mes variables?
On s’intéresse au nombre de connexions faites sur Instagram par jour chez les garçons et les filles en fonction de la
marque du téléphone. Deux groupes de 20 adolescents ayant un Iphone ou un samsung sont choisis au hasard et
scindés en deux groupes (garçon, fille).
• Variable dépendante (VD) : Le nombre de connexions sur instagram par jour (variable discrète ;
utilisée comme une variable continue)
• Variable indépendante (VI) : La marque du téléphone (variable catégorielle, inter-sujet)
➢ 2 modalités: Iphone, Samsung
• Variable indépendante (VI): Le sexe (variable catégorielle, inter-sujet)
➢ 2 modalités: garçon, fille
On s’intéresse au nombre de connexions faites sur Instagram par jour chez les garçons et les filles en fonction de la
marque du téléphone. Deux groupes de 20 adolescents ayant un Iphone ou un samsung sont choisis au hasard et
scindés en deux groupes (garçon, fille).
POUR VI: effet du sexe POUR VI: effet de la marque du téléphone
H0 : Il n’y a pas différence de moyenne entre les sexes H0 : Il n’y a pas de différence de moyenne entre les marques de téléphone
H1 : Il y a une différence significative de moyenne entre les sexes H1 : Il y a une différence significative de moyenne entre les marques de téléphone
POUR l’interaction:
H0 : Il y a pas d’interaction entre les deux facteurs
H1 : Il y a une interaction significative entre les deux facteurs
EXERCICES
Etape 5
Je note ma conclusion
Théorie
1. Décrire le graphique interaction
Le graphique (nom du graphique) montre les moyennes et l’intervalle de confiance à 95% de X en fonction de X. Cette figure
suggère que…
2. Impression confirmée ou non + nom du test (F(dl Gr, dl rés.) = X; MSE = X; P = X; n²p = X) => effets principaux + interaction
(Nom du test COMPLET) révèle un effet (non)significatif pour le facteur…/un effet (non)significatif pour l’interaction…
3. Comparaison des moyennes => effets simples
Un test post-hoc (bonferonni)…
a) Les comparaisons significatives (p = x; d= x)
b) Les comparaisons non-significatives (p = x)
4. Conclusion
Ces données suggèrent que…
EXERCICES
Etape 5
Iphone Je note ma conclusion
Samsung
Partie 1
1. Présenter les données descriptives
Le graphique « descriptives plots » montre les moyennes et l’intervalle de confiance à 95% du nombre de
connexions sur Instagram par jour des filles et des garçons en fonction de la marque de leur téléphone. Cette
figure suggère que les filles se connectent en moyenne, plus souvent sur Instagram si elles ont un Samsung
plutôt qu’un Iphone. La figure suggère l’inverse pour les garçons.
2. Impression confirmée ou non + nom du test
Fille Garçon Une ANOVA à deux facteurs , plan factoriel; (facteur sexe (2 modalités: fille, garçon), facteur téléphone (2
modalités: Iphone, Samsung)) révèle un effet non-significatif du facteur sexe (F(1,36) = 1.088, p = 0.304) et du
facteur téléphone (F(1,36) = 0.484, p = 0.491). Cependant, il révèle une interaction significative entre les deux
facteurs (F1,36) = 13.330, p < 0.001, n²p = 0.270)
EXERCICES
Etape 5
Je note ma conclusion
Partie 2
En sachant que:
• sexe 1 = fille
• sexe 2 = garçon
• téléphone 1 = Iphone
• Téléphone 2 = Samsung
EXERCICES
Etape 5
Je note ma conclusion
Partie 2
3. Comparaison de moyennes
Des comparaisons de moyennes ont été réalisées avec des tests posthoc (bonferonni). Ces tests révèlent que les filles ayant
un Iphone se connectent, en moyenne, significativement moins que les garçons ayant un iphone (p < 0.001; d = -2.319), que
les filles ayant un samsung (p < 0.001; d = -2.207) et que les garçons ayant un samsung (p = 0.025 d = -1.369 )
La différence de moyennes entre les garçons ayant un Iphone et les filles ayant un Samsung est non significative (p = 1)
La différence de moyenne entre les garçons ayant un Iphone et ceux ayant un Samsung est non significative (p = 0.244)
La différence de moyenne entre les filles qui ont un Samsung et les garçons ayant un Samsung est non significative (p =
0.414)
On s’intéresse au score des élèves de l’année passerelle sur leur examen de statistiques. Deux groupes de 20
personnes sont choisis au hasard et interrogés sur leur présence aux cours (oui/non), mais également sur leur
présence en bibliothèque pour étudier ce dernier (oui/non).
À vous de jouer
• Etape 1: quel test est-ce que je vais utiliser? ANOVA à plusieurs facteurs, plan simple
• Etape 2: quelles sont mes variables?
• VD: le score à l’examen (variable continue)
• VI1: présence aux cours (variable catégorielle, intersujet, 2 conditions (oui ou non))
• VI2: présence en bibliothèque (variable catégorielle, intersujet, 2 conditions (oui ou non))
• Etape 3: quelles sont mes hypothèses?
• ! A postériori
• Effet de la VI présence aux cours : HO: il n y a pas de différence de moyenne entre les deux groupes,
H1: il y a une différence significative de moyenne entre les deux groupes
• Effet de la VI présence en bibli: HO: il n y a pas de différence de moyenne entre les deux groupes,
H1: il y a une différence significative de moyenne entre les deux groupes
• Effet de l’interaction: H0: l’interaction est non significative; H1: l’interaction est significative
EXERCICES
En sachant que:
• Bibli 1 = non
• Bibli 2 = oui
• Cours 1 = non
• Cours 2 = oui
EXERCICES
La différence de moyenne entre les élèves qui n’ont pas été en cours, ni à la bibliothèque et ceux qui ont été en cours et à la
bibliothèque n’est pas significative (p = 0.358). La différence de moyenne entre les étudiants qui ont été en bibliothèque
mais pas en cours et ceux qui ont été à la bibliothèque et en cours (p = 0.405) ainsi que ceux qui ont n’ont pas été à la
bibliothèque mais en cours (p = 1) n’est pas significative. Pour finir, la différence de moyenne entre ceux qui n’ont pas été en
bibliothèque mais en cours et ceux qui ont été à la bibliothèque et en cours est également non-significative (p = 0.996)
En conclusion, il est préférable d’aller soit en cours, soit à la bibli.
LOGO-E5001
Méthodologie de la
recherche et statistiques
Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 6
2. Pour analyser la différence entre deux séries de scores dans le cas de groupes indépendants avec des
variables ordinales, on utilise
a. le test de Student pour échantillons indépendants
b. le test de Wilcoxon
c. le test de comparaison de moyenne pour échantillons appariés
d. le test de Mann-Whitney
QCM
2. Pour analyser la différence entre deux séries de scores dans le cas de groupes indépendants avec des
variables ordinales, on utilise
a. le test de Student pour échantillons indépendants
b. le test de Wilcoxon
c. le test de comparaison de moyenne pour échantillons appariés
d. le test de Mann-Whitney
QCM
Les tests non paramétriques se basent sur la somme des rangs pour chaque groupe afin de voir la différence
de rangs entre les conditions. Les test paramétriques se basent sur les valeurs (moyennes)
QCM
6. Un test de Mann-Whtiney donne les résultats suivants : U = 9 ; p = 0.1726 (bilatéral). Les chercheurs
ont fait une hypothèse unidirectionnelle sur la différence entre groupes, hypothèse confirmée sur
l’échantillon. La bonne signification est alors
a. 0.0863
b. 0.863
c. 0.1726
d. indéterminée
QCM
6. Un test de Mann-Whitney donne les résultats suivants : U = 9 ; p = 0.1726 (bilatéral). Les chercheurs
ont fait une hypothèse unidirectionnelle sur la différence entre groupes, hypothèse confirmée sur
l’échantillon. La bonne signification est alors
a. 0.0863
b. 0.863
c. 0.1726
d. indéterminée
P bilatéral = 2 x P unilatéral
QCM
7. Si, dans un plan à mesures répétées à deux conditions, nous avons un petit nombre de participants et
des données asymétriques ordinales, il vaut mieux utiliser
a. un test de comparaison de moyennes pour échantillons indépendants
b. un test de comparaison de moyennes pour échantillons appariés
c. un test de Mann-Whitney
d. un test de Wilcoxon
QCM
7. Si, dans un plan à mesures répétées à deux conditions, nous avons un petit nombre de participants et
des données asymétriques ordinales, il vaut mieux utiliser
a. un test de comparaison de moyennes pour échantillons indépendants
b. un test de comparaison de moyennes pour échantillons appariés
c. un test de Mann-Whitney
d. un test de Wilcoxon
QCM
Théorie pure!!
QCM
9. Une valeur W = 3 est convertie en score z, ce qui donne z = -3.2. Cela montre
a. une erreur dans les calculs
b. la différence n’est sans doute pas significative
c. la différence est probablement significative
d. on ne peut pas savoir
QCM
9. Une valeur W = 3 est convertie en score z, ce qui donne z = -3.2. Cela montre
a. une erreur dans les calculs
b. la différence n’est sans doute pas significative
c. la différence est probablement significative
d. on ne peut pas savoir
Ce type de question n’est pas vraiment dans le cours. C’est du plus et de la compréhension.
Se trouver à -3.2 écart-types est relativement grand ! On peut en déduire que notre différence est
probablement significative.
QCM
16. Voici une table de coefficient de Spearman. Quelle est la bonne conclusion? La souffrance et les
différentes autres mesurent sont
a. peut liées
b. modérément liées
c. fortement liées
d. parfaitement liées
QCM
16. Voici une table de coefficient de Spearman. Quelle est la bonne conclusion? La souffrance et les
différentes autres mesurent sont
a. peut liées
b. modérément liées
c. fortement liées
d. parfaitement liées
QCM
16. Voici une table de coefficient de Spearman. Quelle est la bonne conclusion? La souffrance et les
différentes autres mesurent sont
a. peut liées
b. modérément liées
c. fortement liées
d. parfaitement liées
17. Voici une table de coefficient de Spearman. La plus forte relation se trouve entre la souffrance et
a. la tension
b. l’autonomie
c. la peur
d. la punition
QCM
17. Voici une table de coefficient de Spearman. La plus forte relation se trouve entre la souffrance et
a. la tension
b. l’autonomie
c. la peur
d. la punition
Relation forte ne veut pas dire forcément positive! Une relation forte peut être négative
QCM
20. Considérez la table suivante. Le professeur Dupont pense que la force et la motivation sont liées
positivement. Malheureusement, il n’est pas aussi fort que nous en statistiques, il n’a obtenu que la
signification bilatéral, alors qu’il souhaite faire un test unilatéral. La relation entre force et motivation
est
a. significative (rs = 0.613 ; p = 0.144)
b. significative (rs = 0.613 ; p = 0.072)
c. non significative (rs = 0.613 ; p = 0.144)
d. non significative (rs = 0.613 ; p = 0.072)
QCM
20. Considérez la table suivante. Le professeur Dupont pense que la force et la motivation sont liées
positivement. Malheureusement, il n’est pas aussi fort que nous en statistiques, il n’a obtenu que la
signification bilatéral, alors qu’il souhaite faire un test unilatéral. La relation entre force et motivation
est
a. significative (rs = 0.613 ; p = 0.144)
b. significative (rs = 0.613 ; p = 0.072)
c. non significative (rs = 0.613 ; p = 0.144)
d. non significative (rs = 0.613 ; p = 0.072)
✓ Les tests non paramétriques sont basés sur les rangs (différence significative de rangs moyens entre
deux groupes.
✓ Pour choisir un test non paramétrique, regarder les conditions d’application (Skewness – indice
d’asymétrie, Kurtosis – indice d’aplatissement, Shapiro-Wilk – normalité)
✓ L’équivalent non paramétrique du r de Pearson est le r de Spearman
THEORIE
QCM
2. Le V de Cramer est
a) un signe de victoire que l'on fait lorsqu'on a réussi un test de Cramer
b) une mesure d'effet fondée sur les scores standardisés
c) une mesure de corrélation liée au test du x²
d) une mesure de différence
QCM
2. Le V de Cramer est
a) un signe de victoire que l'on fait lorsqu'on a réussi un test de Cramer
b) une mesure d'effet fondée sur les scores standardisés
c) une mesure de corrélation liée au test du x²
d) une mesure de différence
Le V de Cramer est un indice d’association qui fournit une mesure de la taille de l’effet et peut
s’interpréter comme le coefficient de corrélation entre les deux variables
QCM
6. On demande à 290 personnes d’indiquer leur soda préféré parmi les cinq proposés. Les résultats sont
les suivants:
6. On demande à 290 personnes d’indiquer leur soda préféré parmi les cinq proposés. Les résultats sont
les suivants (image).
67 + 83 + 77 + 6 + 57 = 290
290/5 choix = 58
QCM
8. On donne la table:
8. On donne la table(image).
72 + 31 + 15 + 50
168/4 choix = 42
QCM
Théorie pure
QCM
Théorie pure
Le V de Cramer est toujours positif car il s’agit d’une somme de carrés (voir slide 72 pour un exemple)
QCM
15. On donne la table de contingence suivante, obtenue sur un échantillon de 150 volontaires
15. On donne la table de contingence suivante, obtenue sur un échantillon de 150 volontaires
Si nous additionnons toutes les observations du tableau, nous arrivons à un total de 110.
QCM
16. 485 personnes doivent choisir le meilleur dessin d’oiseau pour une campagne pacifiste. Les résultats
sont les suivants:
16. 485 personnes doivent choisir le meilleur dessin d’oiseau pour une campagne pacifiste. Les résultats
sont les suivants (image).
Quels sont les effectifs attendus?
a) 79
b) 97
c) 485
d) 5
162 + 84 + 57 + 94 + 88 = 485
485/ 5 = 97
QCM
17. Pour connaitre la taille de l’effet lorsqu’on à réalisé un test de X² d’indépendance, il faut:
a) Convertir le V de Cramer en X²
b) Convertir le X² en V de Cramer
c) Élever au carré le X²
d) Convertir le X² en Z de Fisher
QCM
17. Pour connaitre la taille de l’effet lorsqu’on à réalisé un test de X² d’indépendance, il faut:
a) Convertir le V de Cramer en X²
b) Convertir le X² en V de Cramer
c) Élever au carré le X²
d) Convertir le X² en Z de Fisher
Théorie pure
QCM
Cela s’appelle
a) Une table 2 x 2 de contingence
b) une table 3 x 3 de contingence
c) une table 1 × 2 du X²
d) une table 2 x 2 du X²
QCM
Théorie pure
QCM
19. Le but d’un test de X² d’indépendance pour une table 2x2 est de montrer
19. Le but d’un test de X² d’indépendance pour une table 2x2 est de montrer
Théorie pure
THEORIE
Test du X²
• Pour des variables catégorielles: les fréquences/effectifs sont traités plutôt que des données brutes (chiffres)
• Le test de X² montre un lien entre deux variables catégorielles
• Exemple: la langue maternelle influence-t-elle le type d’erreurs de lecture
• V de cramer: mesure de la taille de l’effet et peut s’interpréter comme coefficient de corrélation entre les deux
variables
1. Test de X² de conformité
• Cas d’une unique variable catégorielle
Ex: choix du chien préféré au sein d’un échantillon de 110 personnes
• Permet de déterminer si une série d’effectifs observés diffère significativement d’une série d’effectifs attendus
• Distribution uniforme (pas d’attentes sur quel chien sera le préféré) & distribution théorique (quand on a une attente)
• H0 = les observations sont égales aux fréquences attendues
EXEMPLE X² DE CONFORMITE
Sous l’hypothèse d’uniformité (distribution uniforme)
• Table de contingence
• Pas de distribution uniformes dans ce cas-ci
• H0 = les observations sont égales aux fréquences attendues
EXEMPLE X² D’INDEPENDANCE
Ce qu’on a observé
Alcool
Non oui
Méthodologie de la
recherche et statistiques
Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 8
! Voir guidance 5 (ANOVA à plusieurs facteurs) pour avoir des exemples des graphiques d’interaction et
des conclusions types ☺
ERREURS FREQUENTES