0% ont trouvé ce document utile (0 vote)
543 vues471 pages

Méthodologie des Guidances Statistiques

Transféré par

4j9dfzq8pf
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
543 vues471 pages

Méthodologie des Guidances Statistiques

Transféré par

4j9dfzq8pf
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

LOGO-E5001

Méthodologie de la
recherche et statistiques

Guidances présentées par

Eléonore de Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 1

Table des matières

▪ Introduction des guidances


▪ Le fameux cours de statistiques
▪ QCM
▪ Théorie
INTRODUCTION DES GUIDANCES

▪ Présentation des étudiants-assistants


▪ Cours théoriques (6), TP (6), guidances (10)
▪ Base de l’étude :
o Cours de Madame Bertels (disponible en podcast aussi)
o TP de Monsieur Collet
o Présentations des guidances
o Guidances de l’année passée (Coralie Dulière et Maïlis Cappeliez)
o Documents disponibles sur l’UV dans la section « Guidance »
o Livre plus que recommandé si vous avez des difficultés :
Dancey, Ch. & Reidy, J. (2016). Statistiques sans maths pour psychologues
(2ème ed.). Louvain-la-Neuve : De boeck Supérieur.
LE FAMEUX COURS DE STATISTIQUES

▪ Etudier régulièrement (l’un des plus gros examens du Q1)


▪ Refaire les exercices des TP
▪ Etudier sur une synthèse complète (de vous ou des autres ! Disponible sur l’UV)
▪ Poser et répondre aux questions de la page Facebook : STAT questions/réponses | Facebook
▪ Lire les chapitre du livre et faire les QCM (il y a quelques fautes dans les correctifs)
▪ Poser et répondre aux questions sur le forum des guidances sur l’UV

SURTOUT, PAS DE STRESSE


LE FAMEUX COURS DE STATISTIQUES

▪ L’examen se compose de la manière suivante :


o 1re partie - 20 QCM retraçant toute la matière du cours :
15 QCM abordables en connaissant la matière et 5 QCM demandant davantage de
réflexion
Point négatif ! On discutera stratégie lors du dernier cours
o 2e partie - Analyse de résultats :
5 questions guidées vers l’écriture d’un rapport statistiques

SURTOUT, PAS DE STRESSE


QCM

Chapitre 1 : Variables et
organisation d’une recherche
QCM

1. Quelles sont, parmi les exemples suivants, les variables continues?


a) Le nombre de fois qu’un score de 180 est atteint lorsqu’on joue aux fléchettes
b) Le sexe
c) La température
d) Les trois, c’est-à-dire a), b) et c)
QCM

1. Quelles sont, parmi les exemples suivants, les variables continues?


a) Le nombre de fois qu’un score de 180 est atteint lorsqu’on joue aux fléchettes
b) Le sexe
c) La température
d) Les trois, c’est-à-dire a), b) et c)

Variables continues ! ON PEUT LA MESURER (nombre à virgule)


Elles peuvent prendre n’importe quelle valeur dans un intervalle donné. La seule limite à la précision de la
mesure est la précision de l’instrument de mesure lui-même.
➤ Ex: Temps de réaction, température, distance, durée d’exposition, une longueur, la vitesse de lecture…

➤ Rem: Une variable est continue même si l’instrument de mesure ne l’est pas.

➤ Ex: Le QI, l’anxiété


QCM

2. Les véritables expériences se caractérisent par


a) deux conditions au maximum
b) l’absence de groupe témoin
c) la répartition aléatoire des participants
d) rien de tout cela
QCM

2. Les véritables expériences se caractérisent par


a) deux conditions au maximum
b) l’absence de groupe témoin
c) la répartition aléatoire des participants
d) rien de tout cela

On randomise (la randomisation) afin d'essayer de limiter les effets des variables parasites et confondues
sur la variable dépendante.
Ce système est super important pour que les variations de la variable dépendante soient dues à la variable
indépendante et non à autre chose.
QCM

3. Dans une étude où le sexe est une variable manipulée, la VI est


a) Intra-sujets
b) Une corrélation
c) Inter-sujets
d) Rien de tout cela
QCM

3. Dans une étude où le sexe est une variable manipulée, la VI est


a) Intra-sujets
b) Une corrélation
c) Inter-sujets
d) Rien de tout cela

Inter-sujets ! Plan simple, plan à mesures indépendantes (sur JASP : Between subject).
Dans le cas d’un plan simple (donc inter-sujets), chaque sujet ne passe qu’une des conditions.
➤ Ex : On teste la vitesse en lecture selon le sexe ! On ne sait pas dire « toi, tu es une fille et toi, tu es
un garçon », on ne sait pas assigner un sexe aléatoirement.

Intra-sujets ! Plan à mesures répétées (sur JASP : Within subject). Ici, chaque sujet passe toutes les
conditions.
➤ Ex : On teste la vitesse en lecture selon le moment de la journée.
QCM

4. Dans une observation


a) Il n’y a en général ni VD ni VI
b) On cherche un lien entre 2 variables
c) On ne peut pas savoir s’il y a un lien de cause à effet
d) Toutes ces réponses
QCM

4. Dans une observation


a) Il n’y a en général ni VD ni VI
b) On cherche un lien entre 2 variables
c) On ne peut pas savoir s’il y a un lien de cause à effet
d) Toutes ces réponses

Dans une observation, aucune variable ne dépend de l’autre.


Si l’une augmente, l’autre augmente.
Si l’une augmente, l’autre diminue.
➤ Ex : Il y a un lien entre le nombre d'heures d'études et les résultats à un examen. Quand l'un augmente,
l'autre augmente
QCM

5. Lesquelles sont des variables catégorielles?


a) Le sexe
b) La marque des boites de haricots
c) La couleur des cheveux
d) Toutes ces réponses
QCM

5. Lesquelles sont des variables catégorielles?


a) Le sexe
b) La marque des boites de haricots
c) La couleur des cheveux
d) Toutes ces réponses

Les variables catégorielles ne peuvent pas se mesurer. On la nomme, ça renvoie à une catégorie
➤ Ex : fumeur/non fumeur, couleur des yeux, marque de voitures
QCM

6. Les plans à mesures répétées peuvent être


a) Quasi-expérimentaux ou d’expérience
b) Seulement des expériences
c) Seulement quasi-expérimentaux
d) Seulement des observations
QCM

6. Les plans à mesures répétées peuvent être


a) Quasi-expérimentaux ou d’expérience
b) Seulement des expériences
c) Seulement quasi-expérimentaux
d) Seulement des observations

Dans les plans à mesures répétées (within subject), chaque sujet est assigné à chacune des conditions
Résultats à un test en fonction
du sexe et du déjeuner

➤ Ex de quasi-expérience

➤ Ex d’expérience
QCM

7. Dans une véritable expérience


a) La VI est manipulé par l’expérimentateur
b) La VD est supposée dépendre de la VI
c) Il est difficile d’organiser l’étude
d) Les réponse a) et b)
QCM

7. Dans une véritable expérience


a) La VI est manipulé par l’expérimentateur
b) La VD est supposée dépendre de la VI
c) Il est difficile d’organiser l’étude
d) Les réponse a) et b)

La VI est manipulée par l'expérimentateur afin que l'échantillon soit le plus représentatif possible de la
population. Le but est de réduire l'effet des variables externes.
QCM

8. Dans une quasi-expérience


a) Il y a une VD et une VI
b) Les participants ne sont pas répartis au hasard entre les conditions
c) Il n’y a ni VD ni VI
d) Les réponses a) et b)
QCM

8. Dans une quasi-expérience


a) Il y a une VD et une VI
b) Les participants ne sont pas répartis au hasard entre les conditions
c) Il n’y a ni VD ni VI
d) Les réponses a) et b)

Que ce soit dans une expérience ou dans une quasi-expérience, on cherche toujours à savoir les variations
de la VD par rapport à la VI.
La différence d’une quasi-expérience et d’une expérience est le hasard. Dans une quasi-expérience, on ne
peut pas attribuer les sujets au hasard (Ex : le sexe, la couleur de cheveux)
QCM

9. Une variable continue


a) Peut prendre seulement certaines valeurs particulières dans un intervalle
b) Peut prendre n’importe quelle valeur dans un intervalle
c) Définit des catégories
d) Rien de tout cela
QCM

9. Une variable continue


a) Peut prendre seulement certaines valeurs particulières dans un intervalle
b) Peut prendre n’importe quelle valeur dans un intervalle
c) Définit des catégories
d) Rien de tout cela

Une variable continue se mesure (souvent avec des virgules)


➤ Ex : la taille, la longueur de cheveux, la distance de freinage
QCM

10. Quels problèmes se posent avec les plans à mesures répétées?


a) L’effet de fatigue ou d’entrainement peut être gênant
b) Les participants risquent de deviner le but de l’expérience
c) Ils ne seront pas utilisables dans les quasi-expériences
d) Tout cela à la fois
QCM

10. Quels problèmes se posent avec les plans à mesures répétées?


a) L’effet de fatigue ou d’entrainement peut être gênant
b) Les participants risquent de deviner le but de l’expérience
c) Ils ne seront pas utilisables dans les quasi-expériences
d) Tout cela à la fois

Erreur dans le livre.


Dans les plans à mesures répétées, comme chaque sujet passe chaque condition, il peut y avoir un effet de
fatigue ou d’entrainement. De plus, si les sujets font chaque condition, ils peuvent découvrir le but de
l’expérience.
➤ Ex : Etude sur la concentration selon le moment de la journée
QCM

12. Un chercheur a effectué une observation pour examiner le lien entre la quantité d'alcool
consommée par des fans de football de l'équipe locale et le nombre de buts marqués par
cette équipe lors du match. Il a trouvé une corrélation entre ces deux grandeurs. Quelles
conclusions peut-on en tirer ?
a) Le lien entre l'alcool consommé et le nombre de buts est réel mais ne signifie pas qu'il
y a une relation de cause à effet entre les deux variables
b) le nombre de buts n'est pas lié à la quantité d'alcool consommée, mais aux
applaudissements de la foule
c) un accroissement de la consommation d'alcool cause un accroissement concomitant
du nombre de buts
d) Toutes ces conclusions
QCM

12. Un chercheur a effectué une observation pour examiner le lien entre la quantité d'alcool
consommée par des fans de football de l'équipe locale et le nombre de buts marqués par
cette équipe lors du match. Il a trouvé une corrélation entre ces deux grandeurs. Quelles
conclusions peut-on en tirer ?
a) Le lien entre l'alcool consommé et le nombre de buts est réel mais ne signifie pas
qu'il y a une relation de cause à effet entre les deux variables
b) le nombre de buts n'est pas lié à la quantité d'alcool consommée, mais aux
applaudissements de la foule
c) un accroissement de la consommation d'alcool cause un accroissement concomitant
du nombre de buts
d) Toutes ces conclusions

Une corrélation a pour objectif de mettre en évidence un lien entre deux variables, il n'y a donc pas de
causalité entre les deux variables.
QCM

13. Dans un plan à mesures répétées, si on néglige le contrebalancement, les résultats risquent
a) D’être déformés par un effet d’ordre
b) D’être déformé par un effet de l’heure
c) D’être insuffisant par manque de participants
d) Tout cela à la fois
QCM

13. Dans un plan à mesures répétées, si on néglige le contrebalancement, les résultats risquent
a) D’être déformés par un effet d’ordre
b) D’être déformé par un effet de l’heure
c) D’être insuffisant par manque de participants
d) Tout cela à la fois

Le contre-balancement est une manière de limiter l'effet d'ordre dans un plan à mesures répétées (les
sujets subissent chaque condition). "Pour contre-balancer, on demande à la moitié seulement des
participants d'effectuer la première condition d'abord, puis la seconde ensuite. Pour l'autre moitié des
participants, on impose l'ordre inverse, à savoir la seconde condition en premier, et ensuite seulement la
première condition" (Dancey & Reidy, 2016, p21).
QCM

14. Vous avez organisé une étude qui montre que plus les gens se lèvent tôt, plus ils travaillent.
Quelles conclusions peut-on en tirer ?
a) Il n'y a pas forcément de relation de cause à effet entre le fait de se lever tôt et le fait
de travailler beaucoup
b) Les gens qui se lèvent tôt ont un besoin naturel de travail
c) Certaines personnes se lèvent plus tôt que les autres parce qu'elles ont beaucoup de
travail à faire
d) Les réponse a) et b)
QCM

14. Vous avez organisé une étude qui montre que plus les gens se lèvent tôt, plus ils travaillent.
Quelles conclusions peut-on en tirer ?
a) Il n'y a pas forcément de relation de cause à effet entre le fait de se lever tôt et le fait
de travailler beaucoup
b) Les gens qui se lèvent tôt ont un besoin naturel de travail
c) Certaines personnes se lèvent plus tôt que les autres parce qu'elles ont beaucoup de
travail à faire
d) Les réponse a) et b)
Ca pourrait être une corrélation (=observation) et pas un lien de causalité. Les 2 variables varient ensemble
=> plus l'une augmente plus l'autre augmente. Mais ce n'est pas spécialement la première qui cause la 2e
(ou inversement)
QCM

15. Quel type d’expérience a le moins de chance de permettre de démontrer une relation de
cause à effet entre deux variables?
a) Les véritables expériences
b) Les quasi-expériences
c) Les observations
d) Les plans à mesures répétées
QCM

15. Quel type d’expérience a le moins de chance de permettre de démontrer une relation de
cause à effet entre deux variables?
a) Les véritables expériences
b) Les quasi-expériences
c) Les observations
d) Les plans à mesures répétées
Les observations permettent de voir s’il existe un lien entre 2 variables, mais pas de montrer une causalité
➤ Ex : On peut observer un lien entre le nombre de livre lu à la maison et le score en lecture. Mais cela ne
veut pas dire que si on a des bons score de lecture, c’est parce qu’on lit beaucoup à la maison.
QCM

16. On parle d’effet de désirabilité quand


a) Les participants se comportent comme ils pensent que l’expérimentateur souhaite
qu’ils se comportent
b) Les participants ont de mauvais scores parce qu’ils sont fatigués
c) Les participants ont de bons résultats parce qu’ils ont de l’entrainement
d) Rien de tout cela
QCM

16. On parle d’effet de désirabilité quand


a) Les participants se comportent comme ils pensent que l’expérimentateur souhaite
qu’ils se comportent
b) Les participants ont de mauvais scores parce qu’ils sont fatigués
c) Les participants ont de bons résultats parce qu’ils ont de l’entrainement
d) Rien de tout cela
a) L’effet de désirabilité
b) L’effet de fatigue
c) L’effet d’entrainement
QCM

17. Supposez que vous vouliez faire une étude pour vérifier que les personnes dépressives se
rongent plus les ongles que les non-dépressifs. Quelles serait la bonne méthode?
a) Faire passer un questionnaire de dépression aux participants, ce qui donne un score de
dépression. Par un autre questionnaire, mesurer si les sujets sont de gros "rongeurs
d'ongles" ou pas. Classer, sur base du premier questionnaire, les participants en
"dépressif" ou "nondépressif" et chercher une différence entre ces deux groupes
b) Comme en a), mais sans séparer les participants en deux groupes. Utiliser plutôt les
vrais scores de dépression et chercher un lien entre les scores de dépression et de
tendance à se ronger les ongles
c) Cette étude est impossible
d) Rien de tout cela
QCM

17. Supposez que vous vouliez faire une étude pour vérifier que les personnes dépressives se
rongent plus les ongles que les non-dépressifs. Quelles serait la bonne méthode?
a) Faire passer un questionnaire de dépression aux participants, ce qui donne un score de
dépression. Par un autre questionnaire, mesurer si les sujets sont de gros "rongeurs
d'ongles" ou pas. Classer, sur base du premier questionnaire, les participants en
"dépressif" ou "nondépressif" et chercher une différence entre ces deux groupes
b) Comme en a), mais sans séparer les participants en deux groupes. Utiliser plutôt les
vrais scores de dépression et chercher un lien entre les scores de dépression et de
tendance à se ronger les ongles
c) Cette étude est impossible
d) Rien de tout cela

Le fait de séparer les participants en 2 groupes réduit la finesse de la recherche.


QCM

18. Quelles variables pourraient être des VI dans une quasi-expérience?


a) Le sexe
b) Le fait de souffrir (ou non) de névrose d’angoisse
c) Le fait d’être (ou non) étudiant
d) Les trois
QCM

18. Quelles variables pourraient être des VI dans une quasi-expérience?


a) Le sexe
b) Le fait de souffrir (ou non) de névrose d’angoisse
c) Le fait d’être (ou non) étudiant
d) Les trois

Les trois réponses sont justes car elles peuvent avoir une influence sur une VD qu’on sait mesurer.
➤ Ex : Le sexe (VI) par rapport à un score de lecture (VD)
Le fait de souffrir (ou non) de névrose d’angoisse (VI) par rapport à un score en mathématiques (VD)
Le fait d’être (ou non) étudiant (VI) par rapport à un score de stresse (VD)
QCM

19. Dans les plans à mesures répétées, l’effet d’ordre apparait seulement lorsque
a) Les participants sont fatigués dans la dernière condition
b) Les participants ont des résultats égaux dans toutes les situations
c) Les participants ont du mal à obtenir un verre au bar
d) Aucune de ces réponses
QCM

19. Dans les plans à mesures répétées, l’effet d’ordre apparait seulement lorsque
a) Les participants sont fatigués dans la dernière condition
b) Les participants ont des résultats égaux dans toutes les situations
c) Les participants ont du mal à obtenir un verre au bar
d) Aucune de ces réponses

L'effet ordre est le résultat du fait que les personnes participent plusieurs fois à l'étude. La répétition peut
avoir des effets sur la variable dépendante, du seul fait de cette répétition, sans que cela soit attribuable aux
niveaux de la variable indépendante" (Dancey & Reidy, 2016, p21).
Comme les sujets participent plusieurs fois, ils peuvent se fatiguer ou se lasser. Il faut donc contrebalancer.
QCM

20. Parmi les problèmes suivants, lesquels sont associés à la dichotomisation des variables
continues?
a) La réduction de la puissance
b) De faux effet peuvent apparaitre
c) Perte importante d’information
d) Toutes ces réponses
QCM

20. Pari les problèmes suivants, lesquels sont associés à la dichotomisation des variables
continues?
a) La réduction de la puissance
b) De faux effet peuvent apparaitre
c) Perte importante d’information
d) Toutes ces réponses
Dichotomisation = Séparer en plusieurs groupes
THEORIE

Informations à ne pas oublier!!

▪ Différence entre variable continue, variable discrète et variable catégorielle


▪ Variable confondue
▪ X = VD et Y = VI
▪ Variables inter-sujets et variables intra-sujets
QCM

Chapitre 2 : Premier pas avec JASP


QCM
QCM

Chapitre 3 : Statistiques descriptives


QCM

1. Parmi les coefficients suivants, lequel est la meilleure estimation de la moyenne sur la
population?
a) La moyenne d’un échantillon
b) La moyenne de plusieurs moyennes d’échantillon
c) Le mode de plusieurs échantillons
d) La médiane de plusieurs échantillon
QCM

1. Parmi les coefficients suivants, lequel est la meilleure estimation de la moyenne sur la
population?
a) La moyenne d’un échantillon
b) La moyenne de plusieurs moyennes d’échantillon
c) Le mode de plusieurs échantillons
d) La médiane de plusieurs échantillon

Plus on prend la moyenne de plusieurs moyennes


d’échantillon, plus on se rapproche de la moyenne de la
population
QCM

2. Si vous avez une variable normalement distribuée sur un échantillon et qu’elle ne présente
pas de scores extrêmes, quel paramètre de position choisirez-vous?
a) Le mode
b) La médiane
c) La moyenne
d) Aucun de ceux-là
QCM

2. Si vous avez une variable normalement distribuée sur un échantillon et qu’elle ne présente
pas de scores extrêmes, quel paramètre de position choisirez-vous?
a) Le mode
b) La médiane
c) La moyenne
d) Aucun de ceux-là

La plus part du temps, la moyenne fonctionnera. Si il y a des valeurs aberrantes, alors il faut prendre la
médiane. Le mode est a utilisé en dernier recours.
QCM

3. Quelle mesure de tendance centrale est sensible aux valeurs extrêmes?


a) Le mode
b) La médiane
c) La moyenne
d) Aucun de ceux-là
QCM

3. Quelle mesure de tendance centrale est sensible aux valeurs extrêmes?


a) Le mode
b) La médiane
c) La moyenne
d) Aucun de ceux-là

La moyenne se base sur les valeurs et est donc sensibles aux valeurs extrêmes. La médiane, elle, se
base sur le rang
➤ Ex : Moyenne des tailles de l’auditoire
Moyenne des tailles de l’auditoire + 1 géant de 4m
QCM

4. Comment décrivez-vous la distribution représentée par le diagramme qui suit


a) Elle est normale
b) A asymétrie à gauche
c) A asymétrie à droite
d) Bimodale
QCM

4. Comment décrivez-vous la distribution représentée par le diagramme qui suit


a) Elle est normale
b) A asymétrie à gauche
c) A asymétrie à droite
d) Bimodale
QCM

5. L’écart-type est égal à


a) La variance
b) La racine carrée de la variance
c) Le carré de la variance
d) La variance divisée par le nombre de valeurs
QCM

5. L’écart-type est égal à


a) La variance
b) La racine carrée de la variance
c) Le carré de la variance
d) La variance divisée par le nombre de valeurs

Comment calculer à la main l'écart-type avec un calculatrice :


1. On calcule la moyenne
2. On calcule les écarts (de chaque valeur) à la moyenne
3. On élève la valeur des écarts au carré, on obtient ainsi des valeurs positives
4. On calcule la moyenne de ces valeurs (soit la variance)
5. On extrait la racine carrée de la variance pour obtenir l'écart-type
QCM

Exemple : Calculer l’écart-type de la série suivante


45, 32, 12, 37, 23
Mettre dans l’ordre : 12, 23, 32, 37, 45
Moyenne : 12 + 23 + 32 + 37 + 45 = 29,8
5
Ecarts à la moyenne : -17,8 ; -6,8 ; 2,2 ; 7,2 ; 15,2
Ecarts à la moyenne au carré : 316,84 ; 46,24 ; 4,84 ; 51,84 ; 231,04
Moyenne des écarts à la moyenne au carré (Variance) : 130,16
Racine carrée de la variance (Ecart-type) : 11,41
QCM

6. Quelle est la relation entre la taille de l’échantillon et l’erreur d’échantillonnage?


a) Plus la taille de l’échantillon est grande, plus l’erreur d’échantillonnage est grande
b) Plus la taille de l’échantillon est grande, plus l’erreur d’échantillonnage est petite
c) La taille de l’échantillon est égale à l’erreur d’échantillonnage
d) Rien de tout cela
QCM

6. Quelle est la relation entre la taille de l’échantillon et l’erreur d’échantillonnage?


a) Plus la taille de l’échantillon est grande, plus l’erreur d’échantillonnage est grande
b) Plus la taille de l’échantillon est grande, plus l’erreur d’échantillonnage est petite
c) La taille de l’échantillon est égale à l’erreur d’échantillonnage
d) Rien de tout cela

Plus il y a un échantillon grand, au moins on a d’erreur potentielle.


QCM

7. Le mode est
a) La fréquence absolue du score le plus fréquent divisé par le nombre total des scores
b) Le score du milieu une fois qu’on a ordonné les valeurs
c) Le score le plus fréquent
d) La somme de tous les scores divisée par le nombre total de valeurs
QCM

7. Le mode est
a) La fréquence absolue du score le plus fréquent divisé par le nombre total des scores
b) Le score du milieu une fois qu’on a ordonné les valeurs
c) Le score le plus fréquent
d) La somme de tous les scores divisée par le nombre total de valeurs

➤ Ex : le mode vestimentaire
QCM

8. Dans une boîte à moustache, un score extrême est défini comme


a) Un score tombant entre les barres
b) Un score tombant entre les barres et les charnières
c) Un score tombant entre les barres et les valeurs adjacentes
d) Un score qui se trouve entre les charnières
QCM

8. Dans une boîte à moustache, un score extrême est défini comme


a) Un score tombant entre les barres
b) Un score tombant entre les barres et les charnières
c) Un score tombant entre les barres et les valeurs adjacentes
d) Un score qui se trouve entre les charnières

Faute dans le livre ! Score extrême = valeur extrême = valeur


qui se trouve en dehors de la boite à moustache
QCM

9. Quelle propriété doit posséder une distribution pour être normale?


a) Elle doit avoir une forme de cloche
b) Elle doit être symétrique
c) La courbe doit rencontrer l’axe des x en seulement l’infini
d) Tout cela à la fois
QCM

9. Quelle propriété doit posséder une distribution pour être normale?


a) Elle doit avoir une forme de cloche
b) Elle doit être symétrique
c) La courbe doit rencontrer l’axe des x en seulement l’infini
d) Tout cela à la fois
QCM

10. Si vous choisissiez de manière aléatoire un échantillon A de 20 pandas, puis un deuxième


échantillon B de 300 pandas, et que vous calculiez les poids moyens des pandas dans vos
échantillons, quelle serait la meilleure estimation du poids moyen des pandas sur la population?
a) La moyenne sur A
b) La moyenne sur B
c) Les deux donnent des estimations de même qualité
d) Aucune des deux ne peut être considérée comme étant une estimation de la moyenne
générale
QCM

10. Si vous choisissiez de manière aléatoire un échantillon A de 20 pandas, puis un deuxième


échantillon B de 300 pandas, et que vous calculiez les poids moyens des pandas dans vos
échantillons, quelle serait la meilleure estimation du poids moyen des pandas sur la population?
a) La moyenne sur A
b) La moyenne sur B
c) Les deux donnent des estimations de même qualité
d) Aucune des deux ne peut être considérée comme étant une estimation de la moyenne
générale

On peut toujours estimer la moyenne de la population sans jamais réellement l’atteindre.


Plus la moyenne est calculée sur base d’un grand échantillon, plus celle-ci se rapprochera de la
moyenne de la population.
QCM

18. L’écart-type d’une série de 12 valeurs est 6. Quelle est alors la variance?
a) 144
b) 2
c) 36
d) 2,45
QCM

18. L’écart-type d’une série de 12 valeurs est 6. Quelle est alors la variance?
a) 144
b) 2
c) 36
d) 2,45

L’écart-type = Racine carrée de la variance


La variance = Le carré de l’écart-type
QCM

19. Lesquelles des propositions suivantes sont vraies?


a) Les paramètres décrivent des échantillons et les statistiques des populations
b) Une statistique décrit un échantillon et une population
c) Un paramètre décrit une population, une statistique un échantillon
d) Les réponses a) et b)
QCM

19. Lesquelles des propositions suivantes sont vraies?


a) Les paramètres décrivent des échantillons et les statistiques des populations
b) Une statistique décrit un échantillon et une population
c) Un paramètre décrit une population, une statistique un échantillon
d) Les réponses a) et b)

Ne pas se tromper lorsqu’on fait des statistiques inférentielles.


THEORIE

▪ Mesures de tendance centrale : mode (fréquence), moyenne (valeur), médiane (rang)


▪ Mesures de dispersion : étendue (très peu utilisée), écart-type (tout le temps utilisé)
▪ Statistiques inférentielles
▪ La boite à moustache et ses charnières (dia 36)
QCM

Chapitre 4 : Probabilités, échantillonnage et distributions


QCM

1. Comment exprime-t-on une probabilité de 1 sur 5 en pourcentage?


a) 14%
b) 25%
c) 20%
d) 32%
QCM

1. Comment exprime-t-on une probabilité de 1 sur 5 en pourcentage?


a) 14%
b) 25%
c) 20%
d) 32%
QCM

2. Quel est le lien entre la taille de l’échantillon et l’erreur d’échantillonnage?


a) Plus la taille de l’échantillon est grande, plus l’erreur est grande
b) Plus la taille de l’échantillon est grande, plus l’erreur est petite
c) La taille de l’échantillon égale l’erreur d’échantillonnage
d) Rien de tout cela
QCM

2. Quel est le lien entre la taille de l’échantillon et l’erreur d’échantillonnage?


a) Plus la taille de l’échantillon est grande, plus l’erreur est grande
b) Plus la taille de l’échantillon est grande, plus l’erreur est petite
c) La taille de l’échantillon égale l’erreur d’échantillonnage
d) Rien de tout cela
QCM

3. Si l’intervalle de confiance à 95% est de 3+-2, qu’est-ce que cela signifie?


a) La moyenne de la population est forcément entre 1 et 5
b) On est sûr à 95% que la moyenne de la population est entre 3 et 2
c) On est sûr à 95% que la moyenne de la population est entre 1 et 5
d) Rien de tout cela
QCM

3. Si l’intervalle de confiance à 95% est de 3+-2, qu’est-ce que cela signifie?


a) La moyenne de la population est forcément entre 1 et 5
b) On est sûr à 95% que la moyenne de la population est entre 3 et 2
c) On est sûr à 95% que la moyenne de la population est entre 1 et 5
d) Rien de tout cela

Intervalle de confiance : Encadrer une valeur qu’on cherche à estimer. Cet encadrement a un niveau de
confiance de 95%.

Comment noter un intervalle de confiance?: moyenne de l’échantillon +- (SEMx1,96)


=> Donc ici:
3-2=1
3+2=5
-> On est sûr à 95% que la moyenne de la population est entre 1 et 5
QCM

4. Quels scores suivent souvent une loi normale standard?


a) Les scores extrêmes
b) Les scores Z
c) Les scores d’écart-type
d) À la fois (b) et (c)
QCM

4. Quels scores suivent souvent un loi normale standard?


a) Les scores extrêmes
b) Les scores Z
c) Les scores d’écart-type
d) À la fois (b) et (c)

Théorie à connaitre par cœur


QCM

5. L’erreur standard est


a) La racine de la moyenne
b) La racine de l’écart-type
c) L’écart-type divisé par la moyenne
d) L’écart-type divisé par la racine de la taille de l’échantillon
QCM

5. L’erreur standard est


a) La racine de la moyenne
b) La racine de l’écart-type
c) L’écart-type divisé par la moyenne
d) L’écart-type divisé par la racine de la taille de l’échantillon

Formule à connaitre par cœur


QCM

6. Si vous avez une probabilité de 33%, combien vaut-elle exprimée sous forme décimale?
a) 0,033
b) 0,33
c) 0,23
d) 0,133
QCM

6. Si vous avez une probabilité de 33%, combien vaut-elle exprimée sous forme décimale?
a) 0,033
b) 0,33
c) 0,23
d) 0,133
QCM

7. L’erreur standard nous renseigne sur


a) L’écart entre la moyenne d’un échantillon et la moyenne des moyennes des
échantillons
b) L’écart entre la moyenne d’un échantillon et la moyenne de la population
c) L’écart entre l’écart-type d’échantillon et la moyenne de la population
d) (a) et (b)
QCM

7. L’erreur standard nous renseigne sur


a) L’écart entre la moyenne d’un échantillon et la moyenne des moyennes des
échantillons
b) L’écart entre la moyenne d’un échantillon et la moyenne de la population
c) L’écart entre l’écart-type d’échantillon et la moyenne de la population
d) (a) et (b)

- Comme nous prenons un échantillon d’une population, il est probable que la moyenne de cet
échantillon diffère de la vraie moyenne de la population. L’écart entre la moyenne de notre
échantillon et la moyenne réelle de la population s’appelle l’erreur standard.

- La moyenne de la population = la moyenne des moyennes des échantillons


QCM

8. Par combien faut-il multiplier l’erreur standard pour déterminer un intervalle de confiance au
niveau de 95%
a) 95
b) La racine de l’échantillon
c) L’écart-type
d) 1,96
QCM

8. Par combien faut-il multiplier l’erreur standard pour déterminer un intervalle de confiance au
niveau de 95%
a) 95
b) La racine de l’échantillon
c) L’écart-type
d) 1,96

Théorie à connaitre par cœur


Comment noter une intervalle de confiance?: moyenne de l’échantillon +- (SEMx1,96)
QCM

9. Si vous avez un score z de 2,33 cela indique


a) Que votre score se trouve 2,33 écarts type au-delà de la moyenne
b) Que votre score se trouve 2,33 écarts type en deçà de la moyenne
c) Que la probabilité d’avoir un score plus élevé que le votre est de 2,33
d) Que la probabilité d’avoir un score plus faible que le vôtre est de 2,33
QCM

9. Si vous avez un score z de 2,33 cela indique


a) Que votre score se trouve 2,33 écarts type au-delà de la moyenne
b) Que votre score se trouve 2,33 écarts type en deçà de la moyenne
c) Que la probabilité d’avoir un score plus élevé que le votre est de 2,33
d) Que la probabilité d’avoir un score plus faible que le vôtre est de 2,33
QCM

10. Si vous un évènement a une probabilité de 95% de se réaliser, cela signifie que
a) L’évènement devrait se produire 5 fois sur 100
b) L’évènement devrait se produire 95 fois sur 100
c) L’évènement devrait se produire 95 fois sur 95
d) Rien de tout cela
QCM

10. Si vous un évènement a une probabilité de 95% de se réaliser, cela signifie que
a) L’évènement devrait se produire 5 fois sur 100
b) L’évènement devrait se produire 95 fois sur 100
c) L’évènement devrait se produire 95 fois sur 95
d) Rien de tout cela
QCM

11. Quelle carrière choisir si vos scores en poterie et haltérophilie sont les suivants :
Haltérophille: 52 (moyenne 55 écart-type 12) Poterie: 50 (moyenne 58, écart-type 32)
a. Haltérophilie
b. Poterie
c. Vos scores sont similaires dans les deux cas, les deux options sont donc équivalentes
d. Aucun des deux, parce que vous êtes mauvais dans les deux disciplines.
QCM

11. Quelle carrière choisir si vos scores en poterie et haltérophilie sont les suivants:
Haltérophille: 52 (moyenne 55 écart-type 12) Poterie: 50 (moyenne 58, écart-type 32)
a. Haltérophilie
b. Poterie
c. Vos scores sont similaires dans les deux cas, les deux options sont donc équivalentes
d. Aucun des deux, parce que vous êtes mauvais dans les deux disciplines.

Dans cet exercice, nous devons calculer le score z qui nous permettra de voir où les deux valeurs se
situent dans la distribution normale standard. Nous pourrons ainsi les comparer.

Haltérophilie: (52-55)/12
La moyenne
= - 0.25 Le score
Ce score si situe à – 0.25 écarts-type de la moyenne
Poterie: (50-58)/32
= - 0.25
Ce score si situe à – 0.25 écarts-type de la moyenne
L’écart-type
Haltérophille

La poterie
QCM

12. Quelles phrases, concernant les statistiques inférentielles, sont correctes?


a. Elles ne font que décrire les données
b. Elles permettent de donner des conclusions sur la population à partir de l'observation
d'un échantillon
c. Elles sont machiavéliquement utilisées pour donner un air scientifique à la psychologie
d. Elles permettent de donner des conclusions sur un échantillon à partir de l'observation
de la population.
QCM

12. Les phrases suivantes, concernant les statistiques inférentielles, sont-elles vraies?
a. Elles ne font que décrire les données
b. Elles permettent de donner des conclusions sur la population à partir de l'observation
d'un échantillon
c. Elles sont machiavéliquement utilisées pour donner un air scientifique à la psychologie
d. Elles permettent de donner des conclusions sur un échantillon à partir de l'observation
de la population.

Comme il est impossible de réaliser une recherche sur toute une population (trop de monde), nous prenons un
échantillon de cette population pour nos tests statistiques inférentiels.

➤ Exemple: nous réalisons une recherche sur l’influence du coca sur l’excitation avant d’aller dormir
Population: toutes les personnes dans le monde qui boivent du coca avant d’aller dormir
Echantillon: un groupe de quelques personnes qui boivent du coca avant d’aller dormir
QCM

13. Si vous avez un score d'anxiété de 13 et que la moyenne de ce score et son écart-type sont
20 et 5 respectivement sur la population, quel est votre score z?
a. -2,33
b. -1,4
c. 1,33
d. 0
QCM

13. Si vous avez un score d'anxiété de 13 et que la moyenne de ce score et son écart-type sont
20 et 5 respectivement sur la population, quel est votre score z?
a. -2,33
b. -1,4
c. 1,33
d. 0

Formule à connaitre par cœur

Z = (13-20)/5
= - 1.4
La moyenne
Le score

L’écart-type
QCM

14. Si la distribution des scores sur la population est aplatie (donc pas normale), comment est la
distribution d'échantillonnage de la moyenne?
a. Aplatie
b. Bimodale
c. À asymétrie négative
d. Normale
QCM

14. Si la distribution des scores sur la population est aplatie (donc pas normale), comment est la
distribution d'échantillonnage de la moyenne?
a. Aplatie
b. Bimodale
c. À asymétrie négative
d. Normale

Théorie à connaitre par cœur

A retenir: les distribution d’échantillonnages tendent vers la normalité, même si la variable sous-
jacente ne l’est pas

➤ Exemple des lancers de dé


QCM

15. Quelle est la meilleure estimation a priori de la moyenne de la population?


a. La moyenne d'un échantillon
b. La moyenne des moyennes de plusieurs échantillons
c. L'écart-type
d. L'erreur standard.
QCM

15. Quelle est la meilleure estimation a priori de la moyenne de la population?


a. La moyenne d'un échantillon
b. La moyenne des moyennes de plusieurs échantillons
c. L'écart-type
d. L'erreur standard.
QCM

16. Pour un certain ensemble de données, on a un écart-type de 42 sur un échantillon de 16


individus. Quelle est l'erreur standard de la moyenne?
a. 0,339
b. 2,95
c. 21,68
d. 10,5
QCM

16. Pour un certain ensemble de données, on a un écart-type de 42 sur un échantillon de 16


individus. Quelle est l'erreur standard de la moyenne?
a. 0,339
b. 2,95
c. 21,68
d. 10.5.

Formule à connaitre par cœur

SEM = 42/√16
= 10,5

Taille de
l’échantillon
Erreur standard Ecart-type

SEM = s/√N
QCM

17. On tire une centaine d'échantillons dans une population particulière, puis on calcule la moyenne des
scores sur ces échantillons, et on représente par un histogramme la série des moyennes observées.
Qu'est-ce que cela représente?
a. La distribution moyenne
b. Une distribution asymétrique
c. La distribution d'échantillonnage
d. Rien de cela.
QCM

17. On tire une centaine d'échantillons dans une population particulière, puis on calcule la moyenne des
scores sur ces échantillons, et on représente par un histogramme la série des moyennes observées.
Qu'est-ce que cela représente?
a. La distribution moyenne
b. Une distribution asymétrique
c. La distribution d'échantillonnage
d. Rien de cela.

Théorie à connaitre par cœur

➤ Ex: Dans la population de toutes les voitures rouges, nous faisons 6 échantillons de 10 voitures rouges et on calcule pour chaque
échantillon la moyenne. Nous aurons 6 moyennes différentes. Si nous représentons ces 6 moyennes sur un histogramme, nous
obtiendrons la distribution d’échantillonnage.
QCM

18. Étant donnée une erreur standard de 5,2 sur un échantillon de taille 9, quel est l'écart-type?
a. 1.73
b. 15.6
c. 46.8
d. 0,556.
QCM

18. Étant donnée une erreur standard de 5,2 sur un échantillon de taille 9, quel est l'écart-type?
a. 1.73
b. 15.6
c. 46.8
d. 0,556.

Formule à connaitre par cœur

s = 5,2 x √9
= 15.6

SEM = s/√N s = SEM x √N


QCM

19. Pour quels paramètres est-il impossible de déterminer un intervalle de confiance ?


a. La moyenne
b. Le coefficient de corrélation
c. La différence moyenne entre deux scores
d. Aucun de ceux-là.
QCM

19. Pour quels paramètres est-il impossible de déterminer un intervalle de confiance ?


a. La moyenne
b. Le coefficient de corrélation
c. La différence moyenne entre deux scores
d. Aucun de ceux-là.

Théorie à connaitre par cœur


QCM

20. Si nous avons une population sur laquelle notre variable présente une distribution à
asymétrie négative. quelle forme aura la distribution d'échantillonnage de la moyenne?
a. Elle présentera une asymétrie négative
b. Elle présentera une asymétrie positive
c. Elle sera normale
d. On ne peut pas le savoir.
QCM

20. Si nous avons une population sur laquelle notre variable présente une distribution à
asymétrie négative. Quelle forme aura la distribution d'échantillonnage de la moyenne?
a. Elle présentera une asymétrie négative
b. Elle présentera une asymétrie positive
c. Elle sera normale
d. On ne peut pas le savoir.

A retenir: les distribution d’échantillonnages tendent vers la normalité, même si la variable sous-
jacente ne l’est pas

➤ Exemple des lancers de dé


THEORIE

• Les statistiques inférentielles = pour estimer les paramètres d’une population sur base de ce
qu’on observe dans notre échantillon
• Avec ces tests, nous allons déterminer la probabilité que ce qu’on a observé dans notre
échantillon, soit le résultat d’une erreur d’échantillonnage

• La distribution d’échantillonnage : la moyenne des moyennes des échantillons

• L’intervalle de confiance: Après avoir mesuré une moyenne d’un échantillon, nous allons
l’encadrer avec un intervalle (à 95%). Nous sommes sûr que la moyenne de la population se
trouve dans cet intervalle.

• Erreur standard de la moyenne: l’écart entre la moyenne de l’échantillon et celle de la


population
LOGO-E5001

Méthodologie de la
recherche et statistiques

Guidances présentées par

Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 2

Table des matières


▪ QCM
▪ Théorie
QCM

Chapitre 5 : Tests et signification


QCM

1. Une erreur de seconde espèce se produit lorsque


a. l’hypothèse nulle n’est pas rejetée, alors qu’elle devrait être
b. l’hypothèse nulle est rejetée alors qu’elle devrait l’être
c. L’hypothèse nulle est rejetée alors qu’elle ne devrait pas l’être
d. L’hypothèse nulle n’est pas rejetée et ne devrait pas l’être
QCM

1. Une erreur de seconde espèce se produit lorsque


a. l’hypothèse nulle n’est pas rejetée, alors qu’elle devrait être
b. l’hypothèse nulle est rejetée alors qu’elle devrait l’être
c. L’hypothèse nulle est rejetée alors qu’elle ne devrait pas l’être
d. L’hypothèse nulle n’est pas rejetée et ne devrait pas l’être
QCM

2. Quelle est la base logique de l’inférence statistiques


a. déterminer la probabilité que nos observations se produisent par hasard sous l’hypothèse nulle
b. déterminer la probabilité que nos observations se produisent par hasard si l’hypothèse nulle est
fausse
c. calculer la probabilité d’erreur de seconde espèce
d. Tout cela à la fois
QCM

2. Quelle est la base logique de l’inférence statistiques


a. déterminer la probabilité que nos observations se produisent par hasard sous l’hypothèse nulle
b. déterminer la probabilité que nos observations se produisent par hasard si l’hypothèse nulle est
fausse
c. calculer la probabilité d’erreur de seconde espèce
d. Tout cela à la fois

Explications très claires des guidances de l’année passée !


Le but est de déterminer la probabilité ...
- que nos observations (=lien observé) se produisent par hasard alors qu'il n'y a pas de relation entre
les variables dans la réalité
- d'avoir fait une erreur d'échantillonnage en trouvant un lien alors qu'il n'y a pas de lien dans la réalité

Du coup si la probabilité est faible (p<0.05) , ça veut dire qu'on peut, avec la marge d'erreur de 5%,
conclure qu'il est peu probable d'avoir fait une erreur d'échantillonnage, et donc que le lien observé
dans l'échantillon correspond à ce qu'il se passe vraiment dans la population (=on peut généraliser
l'observation de l'échantillon sur la population = statistiques inférentielles)
QCM

3. Si vous obtenez une signification p de 0.02 dans un test unilatéral, quelle est la valeur correspondante
dans le cas d’un test bilatéral?
a. 0.01
b. 0.04
c. 0.02
d. 0.4
QCM

3. Si vous obtenez une signification p de 0.02 dans un test unilatéral, quelle est la valeur correspondante
dans le cas d’un test bilatéral?
a. 0.01
b. 0.04
c. 0.02
d. 0.4

P bilatéral = p unilatéral x 2
QCM

4. Si vous prédisez que deux variables A et B sont liées, quelle est l’hypothèse nulle?
a. Qu’il n’y aucun lien entre les variables A et B
b. Que A est plus grand que B
c. Qu’il y a une différence entre A et B
d. Rien de tout cela
QCM

4. Si vous prédisez que deux variables A et B sont liées, quelle est l’hypothèse nulle?
a. Qu’il n’y aucun lien entre les variables A et B
b. Que A est plus grand que B
c. Qu’il y a une différence entre A et B
d. Rien de tout cela

Ho : Il n’y a pas de différence de moyenne entre les variables

H1 : Il y a une différence de moyenne entre les variables


QCM

5. La puissance est
a. α
b. La capacité du test à rejeter l’hypothèse nulle si elle est, en réalité , fausse
c. La sensibilité des participants à nos manipulations
d. Tout cela à la fois
QCM

5. La puissance est
a. α
b. La capacité du test à rejeter l’hypothèse nulle si elle est, en réalité , fausse
c. La sensibilité des participants à nos manipulations
d. Tout cela à la fois

La probabilité qu’un test d’hypothèses puisse détecter une hypothèse alternative si celle-ci est réelle se
nomme la puissance (1 - β).
Plus la puissance est grande, plus le test va nous montrer ce qui correspond à la réalité.
QCM

6. Quand vous prévoyez qu’une condition A donnera des résultats plus élevés que la condition B, vous
faites
a. un test unilatéral
b. un test bilatéral
c. une prédiction unidirectionnelle
d. A la fois a. et c.
QCM

6. Quand vous prévoyez qu’une condition A donnera des résultats plus élevés que la condition B, vous
faites
a. un test unilatéral
b. un test bilatéral
c. une prédiction unidirectionnelle
d. A la fois a. et c.

On prédit à l’avance le sens. L’expérimentateur prédit le sens.


QCM

7. La probabilité qu’un effet significatif se produise par hasard alors que l’hypothèse nulle est vraie est
a. négligeable
b. α
c. ß
d. Rien de tout cela
QCM

7. La probabilité qu’un effet significatif se produise par hasard alors que l’hypothèse nulle est vraie est
a. négligeable
b. α
c. ß
d. Rien de tout cela

Définition par cœur = Erreur de première espèce


QCM

8. Si vous trouvez une signification p de 0,02 dans un test bilatéral, quelle est la valeur équivalente pour
un test unilatéral ?
a. 0.01
b. 0.04
c. 0.02
d. 0.4
QCM

8. Si vous trouvez une signification p de 0,02 dans un test bilatéral, quelle est la valeur équivalente pour
un test unilatéral ?
a. 0.01
b. 0.04
c. 0.02
d. 0.4

P bilatéral = p unilatéral x 2
QCM

9. Si vous prédisez une différence entre deux situations A et B, alors vous faites
a. un test unilatéral
b. un test bilatéral
c. une prédiction nulle
d. A la fois b et c
QCM

9. Si vous prédisez une différence entre deux situations A et B, alors vous faites
a. un test unilatéral
b. un test bilatéral
c. une prédiction nulle
d. A la fois b et c
QCM

10. Si vous trouvez un p de 4% (0.04), qu’est-ce que cela signifie?


a. la probabilité que l’hypothèse nulle soit vraie est de 4%
b. la probabilité que l’hypothèse nulle soit fausse est de 4%
c. La probabilité de trouver un effet aussi important que celui que vous aves observé du fait d’une
erreur d’échantillonnage, et en supposant l’hypothèse nulle vérifiée, est de 4%
d. Tout cela à la fois
QCM

10. Si vous trouvez un p de 4% (0.04), qu’est-ce que cela signifie?


a. la probabilité que l’hypothèse nulle soit vraie est de 4%
b. la probabilité que l’hypothèse nulle soit fausse est de 4%
c. La probabilité de trouver un effet aussi important que celui que vous aves observé du fait d’une
erreur d’échantillonnage, et en supposant l’hypothèse nulle vérifiée, est de 4%
d. Tout cela à la fois

Question d’examen!

p = 0.04 ne veut pas dire que la probabilité est de 4%!!!


QCM

11. Si vous prédisez une différence entre deux conditions A et B, quelle est l’hypothèse nulle?
a. la condition A donnera des résultats plus grands que la condition B
b. la condition B donnera des résultats plus grands que la condition A
c. La condition A et la condition B sont liées
d. Il n’y a aucune différence entre les situations A et B
QCM

11. Si vous prédisez une différence entre deux conditions A et B, quelle est l’hypothèse nulle?
a. la condition A donnera des résultats plus grands que la condition B
b. la condition B donnera des résultats plus grands que la condition A
c. La condition A et la condition B sont liées
d. Il n’y a aucune différence entre les situations A et B

Hypothèse nulle = Ho = Il n’y a pas de différence de moyenne entre les variables

Hypothèse alternative = H1 = Il y a une différence de moyenne entre les variables


QCM

12. Si nous rejetons à tort l’hypothèse nulle, nous commettons


a. une erreur de première espèce
b. une erreur de seconde espèce
c. un progrès scientifique
d. A la fois b. et c.
QCM

12. Si nous rejetons à tort l’hypothèse nulle, nous commettons


a. une erreur de première espèce
b. une erreur de seconde espèce
c. un progrès scientifique
d. A la fois b. et c.
QCM

13. Quelles sont les conditions d’application de la plupart des test paramétriques
a. Les données doivent être normalement distribuées
b. Les variances doivent être similaires
c. Il ne faut pas de scores extrêmes
d. Tout cela à la fois
QCM

13. Quelles sont les conditions d’application de la plupart des test paramétriques
a. Les données doivent être normalement distribuées
b. Les variances doivent être similaires
c. Il ne faut pas de scores extrêmes
d. Tout cela à la fois

Théorie pure!!!
QCM

14. Une erreur de seconde espèce se produit quand


a. On rejette l’hypothèse nulle alors qu’elle est vraie
b. On conclut que l’hypothèse alternative est vraie alors qu’elle est fausse
c. On ne rejette pas l’hypothèse nulle alors qu’elle est fausse
d. Rien de tout cela
QCM

14. Une erreur de seconde espèce se produit quand


a. On rejette l’hypothèse nulle alors qu’elle est vraie
b. On conclut que l’hypothèse alternative est vraie alors qu’elle est fausse
c. On ne rejette pas l’hypothèse nulle alors qu’elle est fausse
d. Rien de tout cela
QCM

16. Comment se note la puissance


a. α
b. β
c. 1 - α
d. 1 - β
QCM

16. Comment se note la puissance


a. α
b. β
c. 1 - α
d. 1 - β
QCM

17. Pourquoi fixer le seuil à 5%?


a. C’est la tradition psychologique qui veut ça
b. C’est un bon compromis quand on veut éviter les erreurs de première et de seconde espèce
c. C’est plus facile de conclure avec un tel alpha
d. A la fois a. Et b.
QCM

17. Pourquoi fixer le seuil à 5%?


a. C’est la tradition psychologique qui veut ça
b. C’est un bon compromis quand on veut éviter les erreurs de première et de seconde espèce
c. C’est plus facile de conclure avec un tel alpha
d. A la fois a. Et b.
QCM

18. Lorsque nous calculons un coefficient à partir de nos scores pour pouvoir faire un test, comment se
nomme cette valeur?
a. significative
b. non-significative
c. Une variable de décision
d. la puissance
QCM

18. Lorsque nous calculons un coefficient à partir de nos scores pour pouvoir faire un test, comment se
nomme cette valeur?
a. significative
b. non-significative
c. Une variable de décision
d. la puissance

Théorie pure!!!
QCM

19. Imaginons que l'on réalise deux études. Dans l'étude A, 1000 participants sont réunis et on trouve un
p de 0,01. Dans l'étude B, qui regroupe 20 participants, on trouve un p de 0,05. Dans laquelle de
ceux études l'effet est-il le plus grand ?
a. l’étude A
b. l’étude B
c. les effets sont égaux
d. on ne peut pas répondre à cette question parce qu’il nous manque des informations
QCM

19. Imaginons que l'on réalise deux études. Dans l'étude A, 1000 participants sont réunis et on trouve un
p de 0,01. Dans l'étude B, qui regroupe 20 participants, on trouve un p de 0,05. Dans laquelle de
ceux études l'effet est-il le plus grand ?
a. l’étude A
b. l’étude B
c. les effets sont égaux
d. on ne peut pas répondre à cette question parce qu’il nous manque des informations

On a tendance à associer la valeur de p à tout… Il ne faut pas!! La valeur de p ne nous donne pas
d’information sur la taille de l’effet
QCM

20. Si vous trouvez une signification p de 0.05, quelle est la probabilité que l’hypothèse alternative soit
vraie?
a. 0.05
b. 0.95
c. On ne peut pas le savoir
d. Rien de tout cela
QCM

20. Si vous trouvez une signification p de 0.05, quelle est la probabilité que l’hypothèse alternative soit
vraie?
a. 0.05
b. 0.95
c. On ne peut pas le savoir
d. Rien de tout cela

De nouveau, la valeur de p n’indique pas si les hypothèse sont vraie ou fausse. On ne peut que les rejeter
ou ne pas les rejeter.

Question d’examen!!!
THEORIE

▪ Formuler les hypothèses H0 (pas de lien) et H1 (lien)


▪ Attention à la signification de p
▪ Les erreurs de 1ère et de 2nde espèce
▪ Test unilatéral et test bilatéral
▪ Les 3 conditions d’application (distribution normale, variances égales, pas de valeurs extrêmes)
QCM

Chapitre 6 : Analyse de corrélation,


le coefficient r
QCM

1. Si une variable x explique 36% des variations d’un score y, quel pourcentage de variation reste
inexpliqué?
a. 64%
b. 36%
c. 6%
d. 0.6%
QCM

1. Si une variable x explique 36% des variations d’un score y, quel pourcentage de variation reste
inexpliqué?
a. 64%
b. 36%
c. 6%
d. 0.6%
QCM

2. Si deux variables sont totalement indépendantes, alors le coefficient r vaut


a. -0.1
b. -1
c. +1
d. 0
QCM

2. Si deux variables sont totalement indépendantes, alors le coefficient r vaut


a. -0.1
b. -1
c. +1
d. 0

Au plus on étudie, au plus nos points sont élevés (r positif proche de 1)


Au plus on étudie, au moins nos points sont élevés (r négatif proche -1)
Indépendant (r autour de 0)
QCM

Quel couple de variable correspond au lien le plus fort?


Quelle relation est la plus faible?
Quelle est la signification observée pour la corrélation entre lien familial et humeur? Est-ce significatif?
QCM

6. Si vous trouvez un coefficient de corrélation r=0.05, quel pourcentage de variation reste inexpliqué?
a. 25%
b. 50%
c. 75%
d. Rien de tout cela
QCM

6. Si vous trouvez un coefficient de corrélation r=0.5, quel pourcentage de variation reste inexpliqué?
a. 25%
b. 50%
c. 75%
d. Rien de tout cela

r = 0.5 ! 0.5² = 0.25 ! 25% de variance expliquée ! 75% de variance inexpliquée


QCM

7. Un chercheur qui a réalisé une étude de corrélation trouve un effet de 64%. A quelle valeur de r cela
correspond-il?
a. +0.8
b. -0.8
c. 0.8 ou -0.8
d. +0.64
QCM

7. Un chercheur qui a réalisé une étude de corrélation trouve un effet de 64%. A quelle valeur de r cela
correspond-il?
a. +0.8
b. -0.8
c. 0.8 ou -0.8
d. +0.64

Le terme « effet » correspond à la variance expliquée. De plus, on ne connait pas le sens de l’effet.
QCM

8. Si vous avez un coefficient de corrélation de 0.4, quelle proportion des variations reste inexpliquée?
a. 16%
b. 40%
c. 84%
d. Rien de tout cela
QCM

8. Si vous avez un coefficient de corrélation de 0.4, quelle proportion des variations reste inexpliquée?
a. 16%
b. 40%
c. 84%
d. Rien de tout cela

r = 0.4 ! 0.4² = 0.16 ! 16% de variance expliquée ! 84% de variance inexpliquée


QCM

9. Le temps passé devant un écran d’ordinateur et la qualité de la vue sont liés négativement. Que
pouvons-nous conclure?
a. Les gens qui ont une mauvaise vue sont plus susceptibles que les autres de passer du temps
devant l’écran
b. Un travail prolongé à l’ordinateur est mauvais pour les yeux
c. Certains types de personnalité correspondent à la fois à une envie de travailler à l’ordinateur et à
une mauvaise vue
d. Tous ces cas sont impossible – la corrélation n’est pas une causalité
QCM

9. Le temps passé devant un écran d’ordinateur et la qualité de la vue sont liés négativement. Que
pouvons-nous conclure?
a. Les gens qui ont une mauvaise vue sont plus susceptibles que les autres de passer du temps
devant l’écran
b. Un travail prolongé à l’ordinateur est mauvais pour les yeux
c. Certains types de personnalité correspondent à la fois à une envie de travailler à l’ordinateur et à
une mauvaise vue
d. Tous ces cas sont impossible – la corrélation n’est pas une causalité
QCM

10. Observez le diagramme de dispersion. Quelle est la conclusion la plus sensée? Que les variables
présentent une corrélation de
a. +1
b. -1
c. +0.7
d. -0.7
QCM

10. Observez le diagramme de dispersion. Quelle est la conclusion la plus sensée? Que les variables
présentent une corrélation de
a. +1
b. -1
c. +0.7
d. -0.7
QCM

11. Observez le diagramme de dispersion ci-dessous. Quelle est la conclusion la plus sensée? Que les
variables présentent une corrélation de
a. -1
b. -0.1
c. 1
d. 0.1
QCM

11. Observez le diagramme de dispersion ci-dessous. Quelle est la conclusion la plus sensée? Que les
variables présentent une corrélation de
a. -1
b. -0.1
c. 1
d. 0.1
QCM

14. Une corrélation de -0.5 a été trouvée entre la taille et le poids dans un groupe d’élèves. Quel
pourcentage de la taille peut s’expliquer par le poids?
a. 5%
b. 50%
c. 25%
d. Rien de tout cela
QCM

14. Une corrélation de -0.5 a été trouvée entre la taille et le poids dans un groupe d’élèves. Quel
pourcentage de la taille peut s’expliquer par le poids?
a. 5%
b. 50%
c. 25%
d. Rien de tout cela

Pourcentage de la taille expliquer : r = -0.5 ! r² = (-0.5)² = 0.25 ! 25%


QCM

15. Une chercheuse souhaite étudier le lien entre la motivation et les performances à un examen.
Cependant, elle pense que le QI peut influencer ces deux variables et décide donc de déterminer un
coefficient de corrélation partielle. Quelle est la meilleure option possible : calculer le coefficient de
corrélation
a. de motivation et QI indépendamment de la performance
b. de motivation et performance indépendamment du QI
c. de QI et performance indépendamment de la motivation
d. Rien de tout cela n’est pertinent
QCM

15. Une chercheuse souhaite étudier le lien entre la motivation et les performances à un examen.
Cependant, elle pense que le QI peut influencer ces deux variables et décide donc de déterminer un
coefficient de corrélation partielle. Quelle est la meilleure option possible : calculer le coefficient de
corrélation
a. de motivation et QI indépendamment de la performance
b. de motivation et performance indépendamment du QI
c. de QI et performance indépendamment de la motivation
d. Rien de tout cela n’est pertinent
Le QI est une variable confondue ici, donc on la prend indépendamment.
QCM

18. Une relation est positive si


a. Elle est importante
b. Quand x augmente, y diminue
c. Quand x augmente, y croit itou
d. x et y sont souvent grands
QCM

18. Une relation est positive si


a. Elle est importante
b. Quand x augmente, y diminue
c. Quand x augmente, y croit itou
d. x et y sont souvent grands
QCM

19. Si un coefficient de corrélation est associé à une probabilité p de 0.02 alors


a. Notre hypothèse est juste
b. Les résultats sont importants
c. Il y a seulement 2% de chance que nos résultats soient apparus suite à une erreur
d’échantillonnage, si l’on suppose l’hypothèse nulle vraie
d. Il y a une probabilité de 2% que nos résultats soient justes
QCM

19. Si un coefficient de corrélation est associé à une probabilité p de 0.02 alors


a. Notre hypothèse est juste
b. Les résultats sont importants
c. Il y a seulement 2% de chance que nos résultats soient apparus suite à une erreur
d’échantillonnage, si l’on suppose l’hypothèse nulle vraie
d. Il y a une probabilité de 2% que nos résultats soient justes

Théorie pure et question d’examen!!!


QCM

Si Jasp indique p = .00000, nous devons rapporter cette valeur comme cela : p < 0.0001
THEORIE

▪ Une corrélation n’est pas une relation de cause à effet


▪ r > 0 ! positif ; r = 0 ! nulle ; r < 0 ! négatif
▪ r est le coefficient de corrélation ; r² est le coefficient de détermination
QCM

Chapitre 7 : Comparer deux


conditions : le test de Student
QCM

1. Le dl pour un test de comparaison de moyennes pour deux groupes indépendants de 20 personnes


chacun est
a. 38
b. 20
c. 40
d. 68
QCM

1. Le dl pour un test de comparaison de moyennes pour deux groupes indépendants de 20 personnes


chacun est
a. 38
b. 20
c. 40
d. 68

Formule à connaitre par cœur!


• Test de comparaison de moyennes pour deux groupes indépendants: dl: (N-1) + (N-1)
• Test de comparaison de moyennes pour deux groupes appariés: dl: N-1
-> N= nombre de participants

➢ (20 – 1) + (20 – 1) = 38
QCM

2. Pour un test de comparaison de moyennes (40 participants) pour deux échantillons appariés, le dl
est de
a. 20
b. 39
c. 38
d. aucun de ceux-là.
QCM

2. Pour un test de comparaison de moyennes (40 participants) pour deux échantillons appariés, le dl
est de
a. 20
b. 39
c. 38
d. aucun de ceux-là.

Formule à connaitre par cœur!


• Test de comparaison de moyennes pour deux groupes indépendants: dl: (N-1) + (N-1)
• Test de comparaison de moyennes pour deux groupes appariés: dl: N-1
-> N= nombre de participants

➢ 40 – 1 = 39
QCM

3. Pour un test de comparaison de moyennes pour deux échantillons indépendants de 15 participants


chacun, le dl est
a. 28
b. 14
c. 30
d. 15.
QCM

3. Pour un test de comparaison de moyennes pour deux échantillons indépendants de 15 participants


chacun, le dl est
a. 28
b. 14
c. 30
d. 15.

Formule à connaitre par cœur!


• Test de comparaison de moyennes pour deux groupes indépendants: dl: (N-1) + (N-1)
• Test de comparaison de moyennes pour deux groupes appariés: dl: N-1
-> N= nombre de participants

➢ 40 – 1 = 39
Théorie - rappel

Echantillon indépendant Échantillon apparié


= chaque sujet est assigné aléatoirement à l’une des = chaque sujet est assigné à chacune des conditions
condition
Synonymes: plan simple, between subjects, variable Synonymes: plan à mesures répétées, within subject,
inter-sujet variable intra-sujet
Exemple: Exemple:
Groupe 1: Groupe 2: Groupe 1: Groupe 2:
• Personne A • Personne E • Personne A • Personne A
• Personne B • Personne F • Personne B • Personne B
• Personne C • Personne G • Personne C • Personne C
• Personne D • Personne H • Personne D • Personne D
QCM

4. Une centaine d'étudiants ont été testés grâce à un questionnaire d'anxiété avant et après une
thérapie contre l'anxiété. Les scores sont normaux sur la population. Quel test est le plus approprié?
a. Le test de comparaison de moyennes pour deux échantillons indépendants
b. Le test de comparaison de moyennes pour deux échantillons appariés
c. Le test de Levene
d. Aucun de ceux-là.
QCM

4. Une centaine d'étudiants ont été testés grâce à un questionnaire d'anxiété avant et après une
thérapie contre l'anxiété. Les scores sont normaux sur la population. Quel test est le plus approprié?
a. Le test de comparaison de moyennes pour deux échantillons indépendants
b. Le test de comparaison de moyennes pour deux échantillons appariés
c. Le test de Levene
d. Aucun de ceux-là.

Les tests statistiques ont pour but de comparer les moyennes des deux groupes, afin de voir s’il y a une différence entre
les deux groupes

Test de Levene: vérifie l’homogénéité des variances (conditions d’applications)

Les étudiants sont questionnés avant la thérapie. Les mêmes étudiants sont questionnés après la thérapie:
échantillons appariés
Groupe 1 Groupe 2

Florian Florian
Eléonore Eléonore
Marine Marine
Martin Martin
QCM

5. La plus importante condition qui permet l'utilisation du test de Student est que
a. les variances doivent être aussi petites que possible
b. les scores doivent être normaux sur la population
c. les conditions doivent correspondre à des moyennes égales
d. tout cela à la fois.
QCM

5. La plus importante condition qui permet l'utilisation du test de Student est que
a. les variances doivent être aussi petites que possible
b. les scores doivent être normaux sur la population
c. les conditions doivent correspondre à des moyennes égales
d. tout cela à la fois.

Théorie à connaitre
QCM

6. Plus la statistique test élevée, plus il est probable que la différence observée
a. vienne d'une erreur d'échantillonnage sous l'hypothèse nulle
b. vienne d'autre chose qu'une erreur d'échantillonnage
c. soit nulle
d. rien de tout cela.
QCM

6. Plus la statistique test élevée, plus il est probable que la différence observée
a. vienne d'une erreur d'échantillonnage sous l'hypothèse nulle
b. vienne d'autre chose qu'une erreur d'échantillonnage
c. soit nulle
d. rien de tout cela.

Théorie à connaitre
Plus la statistique de test (t, F,..) est élevé, plus p est petit
➢ Si p est petit = le risque que nous avons obtenu le résultat qu’on a obtenu alors qu’il y a une erreur
d’échantillonnage, est faible
QCM

7. Une valeur t de -5 est


a. moins importante qu'une valeur de +5
b. plus importante qu'une valeur de +5
c. équivalente à t = +5
d. moins significative que t= +5.
QCM

7. Une valeur t de -5 est


a. moins importante qu'une valeur de +5
b. plus importante qu'une valeur de +5
c. équivalente à t = +5
d. moins significative que t= +5.

Théorie à connaitre
Le signe n’a pas d’importance
QCM

8. La différence entre les moyennes des groupes


est, à deux décimales près
a. 0,41
b. 0,69
c. 0,96
d. 0,76.
QCM

8. La différence entre les moyennes des groupes


est, à deux décimales près
a. 0,41
b. 0,69
c. 0,96
d. 0,76.

Attention: le livre utilise des tableaux SPSS et nous utilisons l’application JASP, mais le principe reste le même
QCM

9. Que peut-on conclure de ces résultats?


a. Il n'y a aucune différence notable entre
les groupes
b. Il y a une différence significative entre
les groupes, mais elle n'est pas
importante
c. Il y a une différence importante entre les
groupes, mais elle n'est pas significative
d. Il y a une différence à la fois importante
et significative entre les groupes.
QCM

9. Que peut-on conclure de ces résultats?


a. Il n'y a aucune différence notable entre
les groupes
b. Il y a une différence significative entre
les groupes, mais elle n'est pas
importante
c. Il y a une différence importante entre les
groupes, mais elle n'est pas significative
d. Il y a une différence à la fois importante
et significative entre les groupes.

Attention: le livre utilise des tableaux SPSS et nous utilisons l’application JASP, mais le principe reste le même
QCM

10. La grandeur de l'effet pour des groupes indépendants d est donnée par:
a. (moyenne 1 - moyenne 2) / écart-type
b. (moyenne 1 + moyenne 2) / écart-type
c. (moyenne 1 - moyenne 2) / erreur standard
d. (moyenne 1 + moyenne 2) / erreur standard.
QCM

10. La grandeur de l'effet pour des groupes indépendants d est donnée par:
a. (moyenne 1 - moyenne 2) / écart-type
b. (moyenne 1 + moyenne 2) / écart-type
c. (moyenne 1 - moyenne 2) / erreur standard
d. (moyenne 1 + moyenne 2) / erreur standard.

Formule à connaitre
Moyenne 1 – moyenne 2 (l’ordre n’a pas d’importance))

Ecart-type)
QCM

11. Si l'intervalle de confiance au niveau de confiance 95 % pour la différence entre les moyennes est
(10,5; 13,01), nous pouvons en déduire que, si nous reproduisons 100 fois l'expérience:
a. nos résultats seront significatifs 5 fois
b. nos résultats seront significatifs 95 fois
c. la moyenne observée sera entre 10,5 et 13,0 dans 95 % des cas, et sera en dehors le reste du
temps
d. rien de tout cela.
QCM

11. Si l'intervalle de confiance au niveau de confiance 95 % pour la différence entre les moyennes est
(10,5; 13,01), nous pouvons en déduire que, si nous reproduisons 100 fois l'expérience:
a. nos résultats seront significatifs 5 fois
b. nos résultats seront significatifs 95 fois
c. la moyenne observée sera entre 10,5 et 13,0 dans 95 % des cas, et sera en dehors le reste du
temps
d. rien de tout cela.

Théorie à connaitre
QCM

12. Dans une sortie SPSS, si on lit p = 0,000, il faut écrire


a. p = 0,000
b. p = 0,0001
c. p < 0,001
d. p < 0,0001.
QCM

12. Dans une sortie SPSS, si on lit p = 0,000, il faut écrire


a. p = 0,000
b. p = 0,0001
c. p < 0,001
d. p < 0,0001.

Théorie à connaitre
• SPSS = JASP
• Dans JASP, il n y aura jamais p = O,OOO MAIS il sera noté
comme l’exemple ci-dessous:
QCM

13. Pour un plan à mesures répétées utilisant 20 participants, le degré de liberté pour le test de
comparaison de moyennes est
a. 20
b. 38
c. 19
d. 40.
QCM

13. Pour un plan à mesures répétées utilisant 20 participants, le degré de liberté pour le test de
comparaison de moyennes est
a. 20
b. 38
c. 19
d. 40.

Formule à connaitre par cœur!


• Test de comparaison de moyennes pour deux groupes indépendants: dl: (N-1) + (N-1)
• Test de comparaison de moyennes pour deux groupes appariés: dl: N-1
-> N= nombre de participants

➢ 20 – 1 = 19
QCM

14. Le test de Levene est


a. un test d'hétérogénéité des variances fondé sur l'hypothèse de normalité
b. un test d'homogénéité des variances fondé sur l'hypothèse de normalité
c. un test d'hétérogénéité des variances non fondé sur l'hypothèse de normalité
d. un test d'homogénéité des variances non fondé sur l'hypothèse de normalité.
QCM

14. Le test de Levene est


a. un test d'hétérogénéité des variances fondé sur l'hypothèse de normalité
b. un test d'homogénéité des variances fondé sur l'hypothèse de normalité
c. un test d'hétérogénéité des variances non fondé sur l'hypothèse de normalité
d. un test d'homogénéité des variances non fondé sur l'hypothèse de normalité.

Théorie à connaitre
QCM

15. Après avoir lu l'extrait suivant d'un article de Ratcliff et al. (2003), répondez à la question qui suit.

Les changements de moyenne entre les sessions 4 et 5 étaient tous significatifs selon les tests de
comparaison de moyennes pour échantillons pairés (tous les p étant inférieurs à 0,001, sauf pour MMSE,
P = 0,012, le rappel différé de listes de mots, P = 0,009, et le « Boston naming », p = 0,019).

Pourquoi les premières valeurs p sont-elles rapportées comme étant simplement inférieures à 0,001,
alors que les trois dernières sont données par des chiffres exacts ?

a. Les chercheurs n'ont pas réussi à calculer les vraies valeurs


b. Le programme de calcul a donné p = 0,000
c. Les premières variables n'ont aucune importance
d. Tout cela à la fois.
QCM

15. Après avoir lu l'extrait suivant d'un article de Ratcliff et al. (2003), répondez à la question qui suit.

Les changements de moyenne entre les sessions 4 et 5 étaient tous significatifs selon les tests de
comparaison de moyennes pour échantillons pairés (tous les p étant inférieurs à 0,001, sauf pour MMSE,
P = 0,012, le rappel différé de listes de mots, P = 0,009, et le « Boston naming », p = 0,019).

Pourquoi les premières valeurs p sont-elles rapportées comme étant simplement inférieures à 0,001,
alors que les trois dernières sont données par des chiffres exacts ?

a. Les chercheurs n'ont pas réussi à calculer les vraies valeurs


b. Le programme de calcul a donné p = 0,000
c. Les premières variables n'ont aucune importance
d. Tout cela à la fois.
LOGO-E5001

Méthodologie de la
recherche et statistiques

Guidances présentées par

Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 3

Table des matières


▪ QCM
▪ Théorie
▪ Exercices guidés et autonomes
QCM

Chapitre 8 : Autour de la
signification
QCM

1. Plus l’intervalle de confiance est court


a. plus on est sûr des résultats
b. moins on est sûr des résultats
c. plus il est probable que les résultats soient dus à une erreur d’échantillonnage
d. rien de tout cela
QCM

1. Plus l’intervalle de confiance est court


a. plus on est sûr des résultats
b. moins on est sûr des résultats
c. plus il est probable que les résultats soient dus à une erreur d’échantillonnage
d. rien de tout cela

L’intervalle de confiance sert à encadrer la moyenne de l’échantillon. Plus il est petit, plus on est
certain de nos résultats. Plus il est grand, moins on est certain.
QCM

2. La signification statistique
a. est équivalente à l’importance
b. ne signifie pas forcément que le résultat est psychologiquement important
c. dépend de la taille de l’échantillon
d. A la fois b. et c.
QCM

2. La signification statistique
a. est équivalente à l’importance
b. ne signifie pas forcément que le résultat est psychologiquement important
c. dépend de la taille de l’échantillon
d. a la fois b. et c.

Si on a un petit échantillon ! Pas certain qu’il y ait assez de participants!


La signification ne dit pas forcément qu’un résultat est important.
QCM

3. Toutes choses égales par ailleurs, les plans à mesures répétées donnent
a. la même puissance que les autres plans
b. une puissance en général inférieure aux autres plans d’expérience
c. une puissance en général supérieurs aux autres plans
d. rien de tout cela
QCM

3. Toutes choses égales par ailleurs, les plans à mesures répétées donnent
a. la même puissance que les autres plans
b. une puissance en général inférieure aux autres plans d’expérience
c. une puissance en général supérieurs aux autres plans
d. rien de tout cela

Théorie pure!!!

Les plans à mesures indépendantes sont moins puissants que les plans à mesures répétées
QCM

4. Toutes choses égales par ailleurs,


a. quand la taille de l’échantillon augmente, la puissance diminue
b. quand la taille de l’échantillon augmente, la puissance croît itou
c. la taille de l’échantillon et la puissance sont indépendantes
d. quand la taille de l’échantillon augmente, l’imprécision concernant la puissance aussi
QCM

4. Toutes choses égales par ailleurs,


a. quand la taille de l’échantillon augmente, la puissance diminue
b. quand la taille de l’échantillon augmente, la puissance croît itou
c. la taille de l’échantillon et la puissance sont indépendante
d. quand la taille de l’échantillon augmente, l’imprécision concernant la puissance aussi

Au plus la taille de l’échantillon augmente, au plus il y a de participants, au plus on est certain de voir
un effet s’il existe. Donc la puissance statistique augmente.
QCM

5. La puissance est la capacité à détecter


a. un effet significatif, à supposer qu’il existe
b. l’importance psychologique d’un résultat réel
c. a la fois a. et b.
d. des erreurs dans l’expérience
QCM

5. La puissance est la capacité à détecter


a. un effet significatif, à supposer qu’il existe
b. l’importance psychologique d’un résultat réel
c. a la fois a. et b.
d. des erreurs dans l’expérience

C’est la définition même de la puissance.


QCM

6. La taille de l’effet, c’est


a. l’écart entre les conditions
b. la force du lien entre les variables
c. ça peut être les deux
d. ça n’est ni l’un ni l’autre
QCM

6. La taille de l’effet, c’est


a. l’écart entre les conditions
b. la force du lien entre les variables
c. ça peut être les deux
d. ça n’est ni l’un ni l’autre
QCM

7. Les moyennes d’échantillons sont


a. des estimations ponctuelles des moyennes d’échantillon
b. des estimations par intervalle de la moyenne de la population
c. des estimations par intervalle de la moyenne des échantillons
d. des estimations ponctuelles de la moyenne de la population
QCM

7. Les moyennes d’échantillons sont


a. des estimations ponctuelles des moyennes d’échantillon
b. des estimations par intervalle de la moyenne de la population
c. des estimations par intervalle de la moyenne des échantillons
d. des estimations ponctuelles de la moyenne de la population

On ne peut pas savoir la moyenne de la population exactement. On ne sait faire que des estimations
ponctuelles (à un moment donné). Si on prend plusieurs échantillons, on peut prendre les moyennes
d’échantillons pour en faire une moyenne qui se rapproche de celle de la population (statistiques
inférentielles)
QCM

8. Toutes choses égales par ailleurs, plus un test statistique est puissant
a. plus l’intervalle de confiance est large
b. plus il est probable que l’intervalle de confiance contienne zéro
c. plus l’intervalle de confiance est court
d. plus la taille de l’échantillon est réduite
QCM

8. Toutes choses égales par ailleurs, plus un test statistique est puissant
a. plus l’intervalle de confiance est large
b. plus il est probable que l’intervalle de confiance contienne zéro
c. plus l’intervalle de confiance est court
d. plus la taille de l’échantillon est réduite

Si l’intervalle de confiance de confiance est court, alors la moyenne se trouve dans ce court intervalle.
Donc il est préférable qu’il soit petit.
QCM

9. On peut calculer la puissance quand on connait


a. le test, le type de design expérimental et la taille de l’effet
b. le test, le seuil de signification et la taille de l’effet
c. le risque, la taille de l’effet et le type de design expérimental
d. le risque, la taille de l’effet et la taille de l’échantillon
QCM

9. On peut calculer la puissance quand on connait


a. le test, le type de design expérimental et la taille de l’effet
b. le test, le seuil de signification et la taille de l’effet
c. le risque, la taille de l’effet et le type de design expérimental
d. le risque, la taille de l’effet et la taille de l’échantillon
QCM

10. Une puissance de 0.3 indique


a. que l’on a 30% de chances de détecter un effet s‘il existe
b. que l’on a 0.3% de chances de détecter un effet s’il existe
c. que l’on a 70% de chances de détecter un effet s’il existe
d. que l’on 0.7% de chance de détecter un effet s’il existe
QCM

10. Une puissance de 0.3 indique


a. que l’on a 30% de chances de détecter un effet s‘il existe
b. que l’on a 0.3% de chances de détecter un effet s’il existe
c. que l’on a 70% de chances de détecter un effet s’il existe
d. que l’on 0.7% de chance de détecter un effet s’il existe

Une puissance de 0.3 ! en pourcentage ! 0.3 x 100 = 30%


QCM

13. Un chercheur a trouvé un coefficient de corrélation de r = +0.3, un IC (à 95%) de [-0.2 ; 0.7]. Quelle
est la meilleur conclusion : que l’on est sûr à 95% que la corrélation sur la population toute entière
a. est positive (+0.3)
b. est nulle
c. est négative (-0.2)
d. se trouve entre -0.2 et 0.7
QCM

13. Un chercheur a trouvé un coefficient de corrélation de r = +0.3, un IC (à 95%) de [-0.2 ; 0.7]. Quelle
est la meilleur conclusion : que l’on est sûr à 95% que la corrélation sur la population toute entière
a. est positive (+0.3)
b. est nulle
c. est négative (-0.2)
d. se trouve entre -0.2 et 0.7

On parle bien de corrélation et non de moyenne.


QCM

16. Il est plus important de connaitre la puissance associé à une étude quand
a. l’étude est faite sur un nombre important de participants et les résultats sont significatifs
b. l’étude est faite sur un nombre important de participants et les résultats sont non significatifs
c. l’étude est faite sur un nombre réduit de participants et les résultats sont significatifs
d. l’étude est faite sur un nombre réduit de participants et les résultats sont non significatifs
QCM

16. Il est plus important de connaitre la puissance associé à une étude quand
a. l’étude est faite sur un nombre important de participants et les résultats sont significatifs
b. l’étude est faite sur un nombre important de participants et les résultats sont non significatifs
c. l’étude est faite sur un nombre réduit de participants et les résultats sont significatifs
d. l’étude est faite sur un nombre réduit de participants et les résultats sont non significatifs

Si d’avance je sais que j’ai un nombre de participants assez réduit, autant essayer de l’augmenter car
mes résultats ne seront surement pas significatifs.
Tandis que si j’ai déjà un grand échantillon mais que mes résultats ne sont pas significatifs, alors je
peux m’interroger sur le nombre de participants malgré tout.
QCM

21. Si d = 0.89, alors la taille de l’effet est dite


a. nulle
b. faible
c. modérée
d. forte
QCM

21. Si d = 0.89, alors la taille de l’effet est dite


a. nulle
b. faible
c. modérée
d. forte
QCM

22. Quand est-il particulièrement important de connaitre la puissance?


a. Quand on trouve un effet
b. Quand on ne trouve pas d’effet
c. Ca a toujours autant d’importance
d. Rien de tout cela
QCM

22. Quand est-il particulièrement important de connaitre la puissance?


a. Quand on trouve un effet
b. Quand on ne trouve pas d’effet
c. Ca a toujours autant d’importance
d. Rien de tout cela

Si on trouve un effet, alors il n’est pas si important de connaitre la puissance.


Si on ne trouve pas d’effet, alors on peut s’interroger sur la puissance.
QCM

Exercices guidés
Exercices en autonomie
Exercice guidé 1

La note obtenue à l’examen d’histoire, en fonction du manuel scolaire utilisé

Nous souhaitons tester l’efficacité de deux


manuels scolaires. La classe 1A étudie leur
cours d’histoire avec le manuel A. La classe 1B
étudie leur cours d’histoire avec le manuel B.
Nous comparons ensuite leur note obtenue à
l’examen, avec le manuel qu’ils ont utilisé pour
l’étudier.
Exercice guidé 1
Etape 1
je vérifie si les conditions d’applications sont remplies

Mes données sont-elles distribuées


normalement?

Les variances sont-elles égales (+-)?

!!!! P > 0.05 = non significatif


Nous pouvons donc poursuivre notre test
DONC la condition est bien remplie
Exercice guidé 1
Etape 2
Quel type de test est-ce que je vais utiliser?
Nous souhaitons tester l’efficacité de deux manuels scolaires. La classe 1A étudie leur cours d’histoire avec le
manuel A. La classe 1B étudie leurs cours d’histoire avec le manuel B. Nous comparons ensuite leur note obtenue à
l’examen, avec le manuel qu’ils ont utilisé pour l’étudier.

• Test t pour échantillons appariés


Manuel A Manuel B
• Test t pour échantillons indépendants Elève Note Elève Note
Salma (1A) 5 Florian (1B) 15
• Test t pour échantillons unique Eléonore (1A) 10 Fanny (1B) 9

Romain (1A) 6 Selina (1B) 11

…. …
Exercice guidé 1
Etape 3
Quelles sont mes variables?

Nous souhaitons tester l’efficacité de deux manuels scolaires. La classe 1A étudie leur cours d’histoire avec le
manuel A. La classe 1B étudie leurs cours d’histoire avec le manuel B. Nous comparons ensuite leur note obtenue à
l’examen, avec le manuel qu’ils ont utilisé pour l’étudier.

• Variable indépendante (VI) : Le manuel scolaire utilisé (variable catégorielle, inter-sujet)


• Variable dépendante (VD) : La note obtenue à l’examen d’histoire (variable continue)

!!!! Ne pas oublier de catégoriser les variables à l’examen


Exercice guidé 1
Etape 4
J’effectue mon test dans JASP

Nous souhaitons tester l’efficacité de


deux manuels scolaires. La classe 1A
étudie leur cours d’histoire avec le
manuel A. La classe 1B étudie leurs cours
d’histoire avec le manuel B. Nous
comparons ensuite leur note obtenue à
l’examen, avec le manuel qu’ils ont utilisé
pour l’étudier.
Exercice guidé 1
Etape 4
J’écris mes hypothèses

H0 : Il n’y a pas différence de moyenne entre les scores

H1 : Il y a une différence significative de moyenne entre les scores

Hypothèse bilatérale
Exercice guidé 1
Etape 5
Je note ma conclusion

1. Je décris mes statistiques descriptives


(moyenne +- écart-type)
2. Je note la différence de moyenne entre les
conditions avec l’intervalle de confiance à
95% + taille de l’effet
3. Je mentionne le test utilisé + son résultat
(t(df) = x; p=x)
4. Conclusion en 1 phrase
Exercice guidé 1
Etape 5
Je note ma conclusion

1. Je décris mes statistiques descriptives (moyenne +- écart-type)


Les sujets de la condition « manuel B » ont obtenu une meilleure note à l’examen
d’histoire (moyenne+- écart type = 13.83 +-2.76) que ceux qui ont utilisé le manuel
A (moyenne+- écart type = 7.25+- 2.49)

2. Je note la différence de moyenne entre les conditions avec l’intervalle de


confiance à 95% + la taille de l’effet
La différence de moyennes entre les deux conditions (IC au niveau 95%: [4.36;
8.81]) correspond à un effet important de la condition (d = 2.51)

3. Je mentionne le test utilisé + son résultat (t(df) = x; p=x)

Un test t pour échantillons indépendants montre que cette différence de moyenne est
significative (t(22) = 6.14; p < 0.001)

4. Conclusion en 1 phrase
En conclusion, selon cette étude, le manuel B est plus efficace que le manuel A.
Exercice guidé 2

La capacité de mémorisation en fonction de la boisson bue la veille

Nous souhaitons tester la capacité de la mémoire après avoir bu de


l’alcool ou après avoir bu de l’eau. Nous demandons à 40
étudiants, 20 qui ont bu de l’alcool et 20 qui ont bu de l’eau de
retenir 10 mots. Nous comptons ensuite le nombre de mot que
chaque étudiant à retenu en fonction de son groupe.
Exercice guidé 2

Etape 1
je vérifie si les conditions d’applications sont remplies

Mes données sont-elles distribuées


normalement?

Les variances sont-elles égales (+-)?

!!!! P > 0.05 = non significatif


Nous pouvons donc poursuivre notre test
DONC la condition est bien remplie
Exercice guidé 2
Etape 2
Quel type de test est-ce que je vais utiliser?
Nous souhaitons tester la capacité de la mémoire après avoir bu de l’alcool ou après avoir bu de l’eau. Nous
demandons à 40 étudiants, 20 qui ont bu de l’alcool et 20 qui ont bu de l’eau de retenir 10 mots. Nous comptons
ensuite le nombre de mot que chaque étudiant à retenu en fonction de son groupe.

• Test t pour échantillons appariés


Alcool Eau
• Test t pour échantillons indépendants Etudiant Score Etudiant Score
Florian 10 Fanny 7
• Test t pour échantillons unique Lucie 3 Eléonore 4

Selina 8 Nadia 8

…. …
Exercice guidé 2
Etape 3
Quelles sont mes variables?

Nous souhaitons tester la capacité de la mémoire après avoir bu de l’alcool ou après avoir bu de l’eau. Nous
demandons à 40 étudiants, 20 qui ont bu de l’alcool et 20 qui ont bu de l’eau de retenir 10 mots. Nous comptons
ensuite le nombre de mot que chaque étudiant à retenu en fonction de son groupe.

• Variable indépendante (VI) : La boisson bue la veille (variable catégorielle, intersujet)


• Variable dépendante (VD) : Le nombre de mots retenus (variable discrète)

!!!! Ne pas oublier de catégoriser les variables à l’examen


Exercice guidé 1
Etape 4
J’effectue mon test dans JASP

Nous souhaitons tester la capacité de la


mémoire après avoir bu de l’alcool ou
après avoir bu de l’eau. Nous demandons
à 40 étudiants, 20 qui ont bu de l’alcool
et 20 qui ont bu de l’eau de retenir 10
mots. Nous comptons ensuite le nombre
de mot que chaque étudiant à retenu en
fonction de son groupe.
Exercice guidé 1
Etape 4
J’écris mes hypothèses

H0 : Il n’y a pas de différence de moyenne entre le nombre de mots retenus

H1 : Il y a une différence de moyenne significative entre le nombre de mots retenus

Hypothèse bilatérale
Exercice guidé 1
Etape 5
Je note ma conclusion

1. Je décris mes statistiques descriptives (moyenne +- écart-type)


Les sujets de la condition « eau» ont retenu en moyenne, plus de mots (moyenne+-
écart type = 5.85 +- 2.91) que ceux de la condition « alcool » (moyenne+- écart
type = 5.45 +- 3.07)
2. Je note la différence de moyenne entre les conditions avec l’intervalle de
confiance à 95% + la taille de l’effet
La différence de moyennes entre les deux conditions (IC au niveau 95%: [-1.51;
2.31]) correspond à un petit effet de la condition (d = 0.13)

3. Je mentionne le test utilisé + son résultat (t(df) = x; p=x)

Un test t pour échantillons indépendants montre que cette différence de moyenne est
non-significative (t(38) = 0.42; p = 0.68)

4. Conclusion en 1 phrase
En conclusion, nous ne pouvons pas conclure qu’il y a un lien entre la boisson bue la
veille et la capacité de mémorisation des étudiants.
Exercice autonome 1

La condition physique en fonction de la couleur des yeux

Nous souhaitons voir s’il y a un lien de cause à


effet entre la condition physique d’une
personne et la couleur des yeux.
Pour ce faire, nous mesurons les conditions
physique de 20 personnes ayant les yeux verts
et de 20 autres personnes ayant les yeux
bruns. Nous leur donnons un score sur 20.
Exercice autonome 1

La condition physique en fonction de la couleur des yeux


Nous souhaitons voir s’il y a un lien de cause à effet entre la condition physique d’une personne et la couleur des
yeux. Pour ce faire, nous mesurons les conditions physique de 20 personnes ayant les yeux verts et de 20 autres
personnes ayant les yeux bruns. Nous leur donnons un score sur 20.
Exercice autonome 1

La condition physique en fonction de la couleur des yeux

Les sujets de la condition « couleur des yeux bruns » ont,


en moyenne, une condition physique moins haute (9.3 +-
2.3) que les sujets de la condition « couleur des yeux
verts » (14.55 +- 3.28).
La différence de moyennes entre les deux conditions (IC
au niveau 95%: [-7.06; -3.44]) correspond à un grand
effet de la condition (d = -1.85).
Un test-t pour échantillon indépendant montre que cette
différence de moyenne est significative
(t(38) = -5.86 ; p < 0.001).
En conclusion, les personnes ayant les yeux verts ont
tendance, en moyenne, à avoir une condition physique
plus élevée.
Exercice autonome 2

La nombre d’interaction en promenade en fonction de la race du chien

Nous souhaitons voir s’il y a un lien de cause à


effet entre le nombre d’interaction qu’on a en
promenade et la race du chien qu’on promène.
Pour ce faire, nous avons 2 groupes différents
de 10 étudiants qui promènent soit un Jack
Russel, soit un Golden Retriever. Nous
comptons le nombre d’interaction que chacun
des groupes a eu.
Exercice autonome 2

La nombre d’interaction en promenade en fonction de la race du chien


Nous souhaitons voir s’il y a un lien de cause à effet entre le nombre d’interaction qu’on a en promenade et la
race du chien qu’on promène. Pour ce faire, nous avons 2 groupes de 10 étudiants qui promènent soit un Jack
Russel, soit un Golden Retriever. Nous comptons le nombre d’interaction que chacun des groupes a eu.
Exercice autonome 2

La nombre d’interaction en promenade en fonction de la race du chien

Les sujets possédant un Golden Retriever ont, en moyenne, plus


d’interaction (27.5 +- 5.38) que les sujets promenant un Jack
Russel (17.3 +- 4.08).
La différence de moyennes entre les deux conditions (IC au niveau
95%: [5.71; 14.69]) correspond à un grand effet de la condition (d
= 2.14).
Un test-t pour échantillon indépendant montre que cette
différence de moyenne est significative (t(18) = 4.78 ; p < 0.001).
En conclusion, le nombre d’interaction est plus élevé, en
moyenne, pour les promeneurs ayant un Golden Retriever.
A retenir

Conclusion des tests-T


1. Je décris mes statistiques descriptives (moyenne +- écart-type)
2. Je note la différence de moyenne entre les conditions avec
l’intervalle de confiance à 95% + taille de l’effet
3. Je mentionne le test utilisé + son résultat (t(df) = x; p=x)
4. Conclusion en 1 phrase
LOGO-E5001

Méthodologie de la
recherche et statistiques

Guidances présentées par

Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 4

Table des matières


▪ QCM
▪ Théorie
▪ Exercices guidés et autonomes
QCM

Chapitre 10 : Comparaison de plus


de 2 groupes
QCM

Dans quel type de test sommes-nous?


Nous comparons les notes obtenues a un test de lecture selon le
professeur.
QCM

Dans quel type de test sommes-nous?


Nous comparons les notes obtenues a un test de lecture selon le
professeur.

La représentation d'une ANOVA à un facteur (VI) = "professeur qui a donné la leçon". Le facteur a 3
conditions, 3 niveaux du facteurs, 3 modalités(= "madame Renard" ou "madame Poule" ou "monsieur
girafe").
On est dans un plan simple, échantillon indépendant parce que les participants (= élèves) apparaissent une
seule fois toutes les modalités
QCM

Dans quel type de test sommes-nous?


Nous comparons l’argent obtenu en fonction du job étudiant.
QCM

Dans quel type de test sommes-nous?


Nous comparons l’argent obtenu en fonction du job étudiant.

La représentation d'une ANOVA à un facteur (VI) = job. Ce facteur a 3 modalités(caissière au Carrefour, hôte à
Walibi, tuteur).
Il s'agit d'un plan à mesures répétées, échantillon apparié. Chaque participant se retrouve dans chacune des
conditions.
QCM

1. L’ANOVA simple généralise


a. le test de Student pour échantillon appariés
b. le test de Student pour échantillon indépendants
c. le x²
d. le coefficient de corrélation linéaire
QCM

1. L’ANOVA simple généralise


a. le test de Student pour échantillon appariés
b. le test de Student pour échantillon indépendants
c. le x²
d. le coefficient de corrélation linéaire

En français courant : l’ANOVA est un test-t pour plus de 2 groupes.


ANOVA simple = ANOVA à un facteur à plan simple.
QCM

2. Voici les résultats sortie de SPSS. Quelle est la conclusion la plus raisonnable?
a. Les trois groupes sont significativement différents
b. Il existe des différences importantes entre les groupes, mais elles ne sont pas significatives
c. Il n’y a pas de différence significative entre les groupes car le risque d’erreur est trop élevé
d. On ne peut pas tirer de conclusion de cette étude
QCM

2. Voici les résultats sortie de SPSS. Quelle est la conclusion la plus raisonnable?
a. Les trois groupes sont significativement différents
b. Il existe des différences importantes entre les groupes, mais elles ne sont pas significatives
c. Il n’y a pas de différence significative entre les groupes
d. On ne peut pas tirer de conclusion de cette étude
QCM

3. Le tableau suivant est donné par le logiciel SPSS. Que peut-on en conclure?
a. Les variances sont significativement différentes
b. Les variances sont similaires
c. Les variances sont hétérogènes
d. Rien de tout cela
QCM

3. Le tableau suivant est donné par le logiciel SPSS. Que peut-on en conclure?
a. Les variances sont significativement différentes
b. Les variances sont similaires
c. Les variances sont hétérogènes
d. Rien de tout cela
QCM

4. Les résultats d’une étude donne un p significatif pour une ANOVA simple. Quelle est la conclusion la
plus appropriée?
a. Il y a une différence significative entre les groupes et je sais d’avance où elle se situe.
b. Il y a une différence significative entre les groupes, mais je ne sais pas où elle se situe.
c. Il n’y a pas de différence significative entre le groupes, je dois faire des test post-hoc.
d. Rien de tout cela
QCM

4. Les résultats d’une étude donne un p significatif pour une ANOVA simple. Quelle est la conclusion la
plus appropriée?
a. Il y a une différence significative entre les groupes et je sais d’avance où elle se situe.
b. Il y a une différence significative entre les groupes, mais je ne sais pas où elle se situe.
c. Il n’y a pas de différence significative entre le groupes, je dois faire des test post-hoc.
d. Rien de tout cela
QCM

5. La valeur de F est le rapport de


a. La variance intra-groupes sur la variance inter-groupes
b. La variance inter-groupes sur la variance intra-groupes
c. La variance inter-groupes x la variance intra-groupes
d. La variance inter-groupes x la variance intra-groupes
QCM

5. La valeur de F est le rapport de


a. La variance intra-groupes sur la variance inter-groupes
b. La variance inter-groupes sur la variance intra-groupes
c. La variance inter-groupes x la variance intra-groupes
d. La variance inter-groupes x la variance intra-groupes

Plus la variation inter-groupe est grande par rapport à la variation intragroupe, plus F est grand. Et plus F est
grand, plus le p associé est petit (et donc il va être de plus en plus probable que cette taille de F soit due à la
seule erreur d'échantillonnage).
Attention, F = statistique de test (pas à la taille de l'effet)
QCM

7. Le professeur de Saint-Glé examine la différence entre trois groupes. Si les groupes sont homogènes pour
la variance, cela signifie que les variances des trois groupes sont
a. Similaires
b. Dissemblables
c. Exactement égales
d. Très différentes
QCM

7. Le professeur de Saint-Glé examine la différence entre trois groupes. Si les groupes sont homogènes pour
la variance, cela signifie que les variances des trois groupes sont
a. Similaires
b. Dissemblables
c. Exactement égales
d. Très différentes
QCM

8. Une différence entre les groupes qui provient de la manipulation expérimentale se nomme
a. Différence individuelle
b. Effet du traitement ou de la condition
c. Erreur expérimentale
d. Effet intra-sujet
QCM

8. Une différence entre les groupes qui provient de la manipulation expérimentale se nomme
a. Différence individuelle
b. Effet du traitement ou de la condition
c. Erreur expérimentale
d. Effet intra-sujet

Pas dans le cours, mais assez simple à déduire.


QCM

9. Monsieur Noisette se demande s’il doit utiliser un plan simple ou à mesures répétées pour son étude.
Comme d’habitude, il y a des avantages et des inconvénients dans chaque cas. Il a quatre conditions. Si, dans
un plan à mesures répétées, il utilise 10 participants, combien lui en faudrait-il pour un plan simple?
a. 40
b. 20
c. 10
d. 100
QCM

9. Monsieur Noisette se demande s’il doit utiliser un plan simple ou à mesures répétées pour son étude.
Comme d’habitude, il y a des avantages et des inconvénients dans chaque cas. Il a quatre conditions. Si, dans
un plan à mesures répétées, il utilise 10 participants, combien lui en faudrait-il pour un plan simple?
a. 40
b. 20
c. 10
d. 100
QCM

10. Les différences individuelles à l’intérieur des groupes se nomment


a. Effet du traitement
b. Erreur inter-sujets
c. Erreur intra-sujets
d. Biais individuels
QCM

10. Les différences individuelles à l’intérieur des groupes se nomment


a. Effet du traitement
b. Erreur inter-sujets
c. Erreur intra-sujets
d. Biais individuels
QCM

11. Le docteur Dingue réparti aléatoirement 96 participants dans 4 groupes. Il inspecte, car il est fort
méticuleux, les histogrammes des 4 groupes. Il remarque que ses données sont plus ou moins normales. Pour
traiter ses données, il devrait utiliser
a. Une ANOVA simple
b. Un test de Student
c. Un coefficient de corrélation linéaire
d. Une ANOVA pour plan à mesures répétées
QCM

11. Le docteur Dingue réparti aléatoirement 96 participants dans 4 groupes. Il inspecte, car il est fort
méticuleux, les histogrammes des 4 groupes. Il remarque que ses données sont plus ou moins normales. Pour
traiter ses données, il devrait utiliser
a. Une ANOVA simple
b. Un test de Student
c. Un coefficient de corrélation linéaire
d. Une ANOCA pour plan à mesures répétées
QCM

12. La condition de sphéricité est satisfaite lorsque


a. Les variances sont similaires
b. Les variances des différences entre conditions sont égales
c. Les variances des écarts à la moyenne générales sont égales
d. Les variances sont toutes différentes
QCM

12. La condition de sphéricité est satisfaite lorsque


a. Les variances entre conditions sont similaires
b. Les variances des différences entre conditions sont exactement égales
c. Les variances des écarts à la moyenne générales sont égales
d. Les variances sont toutes différentes

Dans le cas d’un plan à mesures répétées, les corrélations (variances) entre conditions doivent être similaire.
Faute dans le livre!!
Ce test est remis en cause par certain chercheur.
QCM

13. Si, dans une ANOVA, vous obtenez un n² de 0.52, quelle proportion de la variances des scores est
imputable à la variable indépendante?
a. 9%
b. 52%
c. 25%
d. 27%
QCM

13. Si, dans une ANOVA, vous obtenez un n² de 0.52, quelle proportion de la variances des scores est
imputable à la variable indépendante?
a. 9%
b. 52%
c. 25%
d. 27%

Ce n’est pas précisé explicitement dans le cours.


Mais, c’était une question d’examen de l’année passée.
QCM

14. Calculez quelle proportion de la variance totale est due à l’erreur et à la manipulation expérimentale, c’est
a. Calculer la variance
b. Répartir la variance
c. Produire la variance
d. Résumer la variance
QCM

14. Calculez quelle proportion de la variance totale est due à l’erreur et à la manipulation expérimentale, c’est
a. Calculer la variance
b. Répartir la variance
c. Produire la variance
d. Résumer la variance

Ce n’est pas précisé explicitement dans le cours.


Le fait de calculer une proportion de variance, c’est le fait de la répartir.
QCM

15. On donne les résultats d’un test post-hoc. Quel groupe diffère de quel autre?
a. Seulement surveillance et clergé
b. Seulement surveillance et immobilier
c. Immobilier et clergé seulement
d. Clergé diffère de immobilier, ainsi que immobilier de surveillance
QCM

15. On donne les résultats d’un test post-hoc. Quel groupe diffère de quel autre?
a. Seulement surveillance et clergé
b. Seulement surveillance et immobilier
c. Immobilier et clergé seulement
d. Clergé diffère de immobilier, ainsi que immobilier de surveillance
QCM

17. Si n² vaut 0.566, quelle est la taille de l’effet?


a. 5.7%
b. 57%
c. 0.57%
d. 5%
QCM

17. Si n² vaut 0.566, quelle est la taille de l’effet?


a. 5.7%
b. 57%
c. 0.57%
d. 5%

n² correspond à la taille de l’effet pour les ANOVA


THEORIE

✓ L'ANOVA permet de comparer une VD numérique dans plusieurs groupes définis par les différentes modalités
d'un ou plusieurs facteurs (VI)
✓ L'ANOVA cherche une différence entre les moyennes des groupes. Elle cherche la moyenne générale et
compare les différentes moyennes à cette moyenne générale
✓ L'ANOVA est une extension du test de Student à plus de deux groupes
✓ H0: M1 = M2 = M3
✓ Condition d’application : Normalité, homogénéité des variances, sphéricité (plan à mesures répétées)
✓ F = variance inter-groupes/variance intra-groupes
✓ Comparaison à priori : Faire des test-t 2 à 2 soit même ET ajuster le seuil selon le nombre de comparaison.
✓ Comparaison post-hoc : Bouton sur Jasp (Bonferroni, Tukey) et le seuil est ajusté tout seul.
✓ Taille de l’effet :

✓ Ecart-type moyen :
THEORIE

✓ L’ANOVA à mesures répétées a une source de variation en moins : Variance due aux différence inter-
individuelles ! Ce sont les mêmes sujets.
✓ L’ANOVA à mesures répétées est plus puissant que le plan simple.
EXERCICES

EXERCICES GUIDES ET EXERCICES EN AUTONOMIE

! Les exercices ont été inventés pour les guidances de statistiques. Les chiffres ne sont pas réels.
Exercice guidé 1

La nombre d’interaction en promenade en fonction de la race du chien

Nous souhaitons voir s’il y a un lien de cause à effet entre le nombre


d’interactions qu’on a en promenade et la race du chien qu’on promène.
Pour ce faire, nous avons 3 groupes de 10 étudiants qui promènent soit un
Jack Russel, soit un Golden Retriever, soit un Bulldog. Nous comptons le
nombre d’interactions que chacun des groupes a eu.

Considérez que les conditions d’application sont remplies


Exercice guidé 1

Etape 2
Quel type de test est-ce que je vais utiliser?
Nous souhaitons voir s’il y a un lien de cause à effet entre le nombre d’interaction qu’on a en promenade et la
race du chien qu’on promène. Pour ce faire, nous avons 3 groupes de 10 étudiants qui promènent soit un Jack
Russel, soit un Golden Retriever, soit un bulldog. Nous comptons le nombre d’interaction que chacun des
groupes a eu.

• Test t pour échantillons appariés


• Anova à un seul facteur, plan simple
• Test t pour échantillons indépendants
• Anova à un seul facteur, plan à mesures répétées
• Test t pour échantillons unique
Exercice guidé 1

Etape 3
Quelles sont mes variables?
Nous souhaitons voir s’il y a un lien de cause à effet entre le nombre d’interaction qu’on a en promenade et la
race du chien qu’on promène. Pour ce faire, nous avons 3 groupes de 10 étudiants qui promènent soit un Jack
Russel, soit un Golden Retriever, soit un bulldog. Nous comptons le nombre d’interaction que chacun des
groupes a eu.

• Variable indépendante (VI) : Le chien promené (variable catégorielle, inter-sujet)


➢ 3 modalités: Golden retriever, Bulldog, Jack Russel
• Variable dépendante (VD) : Le nombre d’interactions (variable discrète -> variable continue dans JASP)

!!!! Ne pas oublier de catégoriser les variables à l’examen


Exercice guidé 1

Etape 4
J’écris mes hypothèses
Nous souhaitons voir s’il y a un lien de cause à effet entre le nombre d’interaction qu’on a en promenade et la
race du chien qu’on promène. Pour ce faire, nous avons 3 groupes de 10 étudiants qui promènent soit un Jack
Russel, soit un Golden Retriever, soit un bulldog. Nous comptons le nombre d’interaction que chacun des
groupes a eu.

H0 : Il n’y a pas différence de moyenne entre les 3 groupes


H1 : Il y a une différence significative de moyenne entre les trois groupes

➢ Hypothèse à posteriori
Exercice guidé 1

Etape 4
Je note ma conclusion
Théorie

1. Présenter les données descriptives


Le graphique (nom du graphique) suggère….
2. Impression confirmée ou non + nom du test (F(dl Gr, dl rés.) = X; MSE = X; p = X; n² = X)
Un (nom du test) appuie ces impressions…
3. Comparaison des moyennes
Un test post-hoc/test-t a été réalisé et indique que…
a) Les comparaisons significatives (p = x; d= x)
b) Les comparaisons non-significatives (p = x)
Exercice guidé 1

Etape 4
Je note ma conclusion
Partie 1
1. Présenter les données descriptives
Le graphique « descriptives plots » suggère que la condition « Golden retriever » à,
en moyenne, plus d’interactions que les deux autres conditions.
2. Impression confirmée ou non + nom du test
Une analyse de variance (ANOVA) plan simple appuie ces impressions (F(2,27) =
63.13; MSE = 1071.30; p < 0.001; n² = 0.82)
Exercice guidé 1
Etape 4
Je note ma conclusion
Partie 2

3. Comparaison de moyennes

Un test post-hoc (Bonferonni) à été réalisé et indique que la moyenne du groupe qui s’est promené avec un golden retriever est
significativement plus importante que le groupe qui s’est promené avec un Jack Russel (p < 0.001; d = 2.14) et le groupe qui s’est promené
avec un Bull dog (p < 0.001; d = - 5.00)
Ce même test indique également que les personnes qui se sont promenés avec un Jack Russel ont eu significativement plus d’interactions
que ceux qui se sont promenés avec un bull dog (p < 0.001, d = - 3.17 )

PS : Il faut regarder les moyennes pour savoir laquelle est plus haute!!
Exercice guidé 2

Performance sportive à une épreuve étudiée en fonction du repos

La performance sportive à une épreuve est étudiée en fonction du temps de repos,


décliné en 3 modalités: moins de 6h, entre 6h et 8h, plus de 8h.
Le chercheur récolte un groupe de 10 sportifs. Ils passent une première épreuve avec
moins de 6h de repos, le lundi. Une deuxième épreuve avec 6 à 8h de repos le jeudi. Une
troisième épreuve avec plus de 8h de repos le dimanche. Le chercheur s’attend à ce que
les sportifs ayant eu plus de 8h de repos, obtiennent un meilleur score à l’épreuve que
ceux qui ont eu moins de 8h de repos.

Considérez que les conditions d’application sont remplies


Exercice guidé 2

Etape 2
Quel type de test est-ce que je vais utiliser?
La performance sportive à une épreuve est étudiée en fonction du temps de repos, décliné en 3 modalités: moins de 6h, entre 6h
et 8h, plus de 8h.Le chercheur récolte un groupe de 10 sportifs. Ils passent une première épreuve avec moins de 6h de repos, le
lundi. Une deuxième épreuve avec 6 à 8h de repos le jeudi. Une troisième épreuve avec plus de 8h de repos le dimanche. Le
chercheur s’attend à ce que les sportifs ayant eu plus de 8h de repos, obtiennent un meilleur score à l’épreuve que ceux qui ont
eu moins de 8h de repos.

• Test t pour échantillons appariés


• Anova à un seul facteur, plan simple
• Test t pour échantillons indépendants
• Anova à un seul facteur, plan à mesures répétées
• Test t pour échantillons unique
Exercice guidé 2

Etape 3
Quelles sont mes variables?
La performance sportive à une épreuve est étudiée en fonction du temps de repos, décliné en 3 modalités: moins de 6h, entre 6h et 8h,
plus de 8h.Le chercheur récolte un groupe de 10 sportifs. Ils passent une première épreuve avec moins de 6h de repos, le lundi. Une
deuxième épreuve avec 6 à 8h de repos le jeudi. Une troisième épreuve avec plus de 8h de repos le dimanche. Le chercheur s’attend à ce
que les sportifs ayant eu plus de 8h de repos, obtiennent un meilleur score à l’épreuve que ceux qui ont eu moins de 8h de repos.

• Variable indépendante (VI) : Le temps de repos (variable catégorielle, intra-sujet)


➢ 3 modalités: moins de 6h, entre 6h et 8h, plus de 8h
• Variable dépendante (VD) : Le score à l’épreuve (variable discrète -> variable continue dans JASP)

!!!! Ne pas oublier de catégoriser les variables à l’examen


Exercice guidé 2
Etape 4
J’écris mes hypothèses
La performance sportive à une épreuve est étudiée en fonction du temps de repos, décliné en 3 modalités: moins de 6h, entre 6h
et 8h, plus de 8h.Le chercheur récolte un groupe de 10 sportifs. Ils passent une première épreuve avec moins de 6h de repos, le
lundi. Une deuxième épreuve avec 6 à 8h de repos le jeudi. Une troisième épreuve avec plus de 8h de repos le dimanche. Le
chercheur s’attend à ce que les sportifs ayant eu plus de 8h de repos, obtiennent un meilleur score à l’épreuve que ceux qui ont
eu moins de 8h de repos.

H0 : la moyenne obtenue par les sportifs ayant eu plus de 8h de repos est inférieur ou égale à la moyenne obtenue par les sujets ayant eu entre 6h et 8h de
repos
H1 : la moyenne obtenue par les sportifs ayant eu plus de 8h de repos est supérieur à la moyenne obtenue par les sujets ayant eu entre 6h et 8h de repos
H0: la moyenne obtenue par les sportifs ayant eu plus de 8h de repos est inférieur ou égale à la moyenne obtenue par les sujets ayant eu moins de 6h de
repos
H1 : la moyenne obtenue par les sportifs ayant eu plus de 8h de repos est supérieur à la moyenne obtenue par les sujets ayant eu moins de 6h de repos
➢ Hypothèse à priori
Exercice guidé 2

Etape 4
Je note ma conclusion
Partie 1
1. Présenter les données descriptives
Le graphique « descriptives plots » suggère que la condition « plus de 8h » a, en
moyenne, un score plus élevé que les deux autres conditions.
2. Impression confirmée ou non + nom du test
Une analyse de variance (ANOVA) plan à mesures répétées appuie ces impressions
(F(2,18) = 10.44; MSE = 57.63; p < 0.001; n² = 0.54)
Exercice guidé 2
Etape 4
Je note ma conclusion
Partie 2

3. Comparaison de moyennes

Des comparaisons de moyennes ont été réalisées avec deux


tests-t pour échantillons appariés, au seuil de significativité
pour comparaisons multiples, ajusté à 0.025.

Ils indiquent que la moyenne à l’épreuve sportive est


significativement plus élevée dans le groupe « plus de 8h »
que dans le groupe « moins de 6h » (p = 0.002; d = 1.32)
Cependant, la différence de moyenne entre le groupe « entre
6h et 8h » et « plus de 8h » n’est pas significative (p = 0.7).
Exercice autonome 1

L’humeur du patient en fonction de son traitement

L’humeur de 30 patients est étudiée en fonction du traitement qu’ils reçoivent:


traitement A, traitement B, placebo.
Nous répartissons par tirage au sort les patients venant consulter dans un centre
psychologique et nous leur affectons l’un des trois traitements.
Nous mesurons ensuite leur humeur grâce à un test qui nous donne un score sur 10.
Le chercheur cherche à savoir quel traitement est le plus efficace.
Placebo A B
Exercice autonome 1 - réponse

L’humeur du patient en fonction de son traitement

Le graphique « descriptives plots » suggère que la condition « Traitement A » est, en moyenne, plus efficace que
les deux autres traitements.
Une analyse de variance (ANOVA) plan simple appuie ces impressions (F(2,27) = 41.50; MSE = 80.53; p < 0.001;
n² = 0.76)
Un test post-hoc (Bonferonni) à été réalisé et indique que la moyenne du groupe ayant eu le traitement A est
significativement plus importante que le groupe ayant eu le traitement B (p = 0.01; d = 1.70) et le groupe ayant
eu le placebo (p < 0.001; d = - 3.67)
Ce même test indique également que les personnes ayant eu le traitement B est significativement plus
importante que le groupe ayant eu le placebo (p < 0.001, d = - 2.48 )
LOGO-E5001

Méthodologie de la
recherche et statistiques

Guidances présentées par

Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 5

Table des matières


▪ QCM
▪ Théorie
▪ Exercices guidés et autonomes
QCM

Chapitre 11 : ANOVA pour plusieurs


facteurs
QCM

Dans les ANOVA à plusieurs facteurs, le vocabulaire est très important.


✓ Effet : différence entre 2 conditions ou lien entre 2 variables
✓ Effet principal : effet global d'une VI (facteur) sur la VD
✓ Effet simple : effet de l'une des VI sur la VD pour un niveau fixé de l'autre VI (= "interaction" entre
chaque condition de chaque VI. Attention, je mets le mot interaction pour comprendre mais on ne
parle d'interaction que quand on parle des effets principaux)
✓ Interaction : interaction des VI, interaction des effets principaux
QCM

✓ Quand on demande « Combien d’effet pouvons-nous tester… » ! Effets principaux + Interaction (pas les
effets simples).
✓ Quelles sont les sources de variation possibles dans un plan complètement inter-sujet ?
--> les 2 VI, les erreurs et l'interaction des VI
✓ Quelles sont les sources de variation possibles dans un plan complètement intra-sujet?
--> La VI1 et l'erreur associée, la VI2 et son erreur associée, l'interaction et l'erreur associée

Très important car question d’examen!!!


QCM

1. Comment décrire une ANOVA 2x2x4 ?


a. Une VI à 3 conditions
b. Une VI à 4 niveaux, et une à 2 niveaux
c. Une VI à 4 niveaux, et deux à 2 niveaux
d. Une VI à 16 conditions
QCM

1. Comment décrire une ANOVA 2x2x4 ?


a. Une VI à 3 conditions
b. Une VI à 4 niveaux, et une à 2 niveaux
c. Une VI à 4 niveaux, et deux à 2 niveaux
d. Une VI à 16 conditions

ANOVA 2 x 2 x 4
VI VI VI
Je compte 3 facteurs, 3 variables indépendantes
La première à 2 niveaux, conditions, modalités
La deuxième à 2 niveaux, conditions, modalités
La troisième à 4 niveaux, conditions, modalités

Ex : Je test l’effet du sommeil (bien dormi, pas dormi ! VI – catégoriel – 2 niveaux), de la satiété (bien
mangé, pas mangé ! VI – catégoriel – 2 niveaux) et de l’humeur (pas heureux, légèrement heureux,
heureux, très heureux ! VI – catégoriel – 4 niveaux) sur le stresse (VD – continue)
QCM

1. Comment décrire une ANOVA 4x5x6x12 ?


QCM

1. Comment décrire une ANOVA 4x5x6x12 ?

ANOVA 4 x 5 x 6 x 12
VI VI VI VI

Je compte 4 facteurs, 4 variables indépendantes


La première à 4 niveaux, conditions, modalités
La deuxième à 5 niveaux, conditions, modalités
La troisième à 6 niveaux, conditions, modalités
La quatrième à 12 niveaux, conditions, modalités
QCM

2. L’ANOVA est utile pour


a. des effets de différents facteurs sur des individus
b. Etudier des données dans le cas de plusieurs VI et une seule VD
c. Analyser des corrélations
d. Tout cela à la fois
QCM

2. L’ANOVA est utile pour


a. des effets de différents facteurs sur des individus
b. Etudier des données dans le cas de plusieurs VI et une seule VD
c. Analyser des corrélations
d. Tout cela à la fois

Dans notre domaine d’étude, on s’arrête généralement à 2 VI.


QCM

3. Quelles sont les sources de variations possibles dans un plan complètement inter-sujet?
a. La population dans son ensemble
b. Chacune des deux VI, et l’erreur
c. Les deux VI, les erreurs et l’interaction des VI
d. A la fois a et c.
QCM

3. Quelles sont les sources de variations possibles dans un plan complètement inter-sujet?
a. La population dans son ensemble
b. Chacune des deux VI, et l’erreur
c. Les deux VI, les erreurs et l’interaction des VI
d. A la fois a et c.

Théorie par cœur.

Rappel : Inter-sujet = Plan simple


QCM

4. n² est
a. Une mesure de la taille de la probabilité d’erreurs d’échantillonnage
b. Une mesure de la taille d’effet qu’on utilise en ANOVA
c. une organisation
d. A la fois a et b.
QCM

4. n² est
a. Une mesure de la taille de la probabilité d’erreurs d’échantillonnage
b. Une mesure de la taille d’effet qu’on utilise en ANOVA
c. une organisation
d. A la fois a et b.
QCM

6. Quelle est la bonne conclusion?


a. Il y a surement un effet principal du lieu et un effet de l’interaction sur le nombre d’erreurs de
conduite
b. Seul l’interaction a un effet sur le nombre d’erreurs de conduite
c. Aucun effet n’est significatif
d. A la fois a et b.
QCM

6. Quelle est la bonne conclusion?


a. Il y a surement un effet principal du lieu et un effet de l’interaction sur le nombre d’erreurs de
conduite
b. Seul l’interaction a un effet sur le nombre d’erreurs de conduite
c. Aucun effet n’est significatif
d. A la fois a et b.
QCM

7. La significativité pour l’effet principal de véhicule est


a. 0.003
b. 0.471
c. 0.503
d. Rien de tout cela
QCM

7. La significativité pour l’effet principal de véhicule est


a. 0.003
b. 0.471
c. 0.503
d. Rien de tout cela
QCM

9. Quelle proportion des variations de la VD s’explique par l’interaction entre le véhicule et le lieu?
a. 95.4%
b. 5.2%
c. 37.3%
d. 0.7%
QCM

9. Quelle proportion des variations de la VD s’explique par l’interaction entre le véhicule et le lieu?
a. 95.4%
b. 5.2%
c. 37.3%
d. 0.7%
QCM

11. Combien d’effets pouvons-nous tester dans le cadre d’une ANOVA 2x2?
a. 1
b. 2
c. 3
d. 4
QCM

11. Combien d’effets pouvons-nous tester dans le cadre d’une ANOVA 2x2?
a. 1
b. 2
c. 3
d. 4

Effets = on cherche les différences entre 2 conditions ou le lien entre 2 variables

VI1 + VI2 + interaction VI1+VI2

L’ANOVA va nous dire si oui ou non, il y a un effet principal de chaque condition puis, éventuellement, s'il
y a une interaction
QCM

12. Le test de Mauchly


a. un test qui permet de vérifier l’hypothèse de sphéricité
b. un test qui permet de savoir si les données de l’ANOVA sont arrondies
c. un test bien connu développé par un grand psychiatre Suisse
d. Rien de tout cela
QCM

12. Le test de Mauchly


a. un test qui permet de vérifier l’hypothèse de sphéricité
b. un test qui permet de savoir si les données de l’ANOVA sont arrondies
c. un test bien connu développé par un grand psychiatre Suisse
d. Rien de tout cela

On utilise ce test dans le cas d’un plan à mesures répétées s’il y a plus de deux modalités. Il n’y a pas le nom
de le cours.
QCM

14. Quelles sont les sources de variation dans un plan complètement intra-sujets à 2 VI?
a. La VI1 et l’erreur associée, la VI2 et l’erreur associée, l’interaction et l’erreur associée
b. Les facteurs, l’interaction, l'erreur
c. Les facteurs, l’interaction
d. Rien de tout cela
QCM

14. Quelles sont les sources de variation dans un plan complètement intra-sujets à 2 VI?
a. La VI1 et l’erreur associée, la VI2 et l’erreur associée, l’interaction et l’erreur associée
b. Les facteurs, l’interaction, l'erreur
c. Les facteurs, l’interaction
d. Rien de tout cela

Dans un plan à mesures répétées, on est amené à considérer l’erreur pour chaque effet (contrairement aux
autres plans)
QCM

15. Le n² partiel mesure


a. La puissance
b. La même chose que le etha carré total
c. Quelque chose de plus grand que le etha carré
d. La taille de l’effet
QCM

15. Le n² partiel mesure


a. La puissance
b. La même chose que le etha carré total
c. Quelque chose de plus grand que le etha carré
d. La taille de l’effet
QCM

16. Qu’est-ce qu’un effet simple?


a. L’effet d’une variable sur une autre
b. L’effet d’une variable indépendante sur une VD, pour un niveau fixé d’une autre VI
c. Un moyen commode de faire des statistiques
d. La taille de l’effet
QCM

16. Qu’est-ce qu’un effet simple?


a. L’effet d’une variable sur une autre
b. L’effet d’une variable indépendante sur une VD, pour un niveau fixé d’une autre VI
c. Un moyen commode de faire des statistiques
d. La taille de l’effet

Théorie par cœur, c’est la définition même d’un effet simple


QCM

17. Si vous avez un carré moyen de 12.4 pour votre effet, et de 3.1 pour l’erreur, quelle est la valeur de
F?
a. 6.2
b. 4.1
c. 3.1
d. 4
QCM

17. Si vous avez un carré moyen de 12.4 pour votre effet, et de 3.1 pour l’erreur, quelle est la valeur de
F?
a. 6.2
b. 4.1
c. 3.1
d. 4

F = mean square / erreur


QCM

18. Dans le cas d’un plan complètement intra-sujets, avec des VI à deux modalités, comment étudier les
effets simples?
a. Avec des test-t pour échantillons indépendants en scindant le fichier
b. Par des test de Student pour échantillons indépendants, en ajustant le risque d’erreur alpha
c. Avec des tests de comparaisons de moyennes pairés en ajustant alpha
d. Rien de tout cela
QCM

18. Dans le cas d’un plan complètement intra-sujets, avec des VI à deux modalités, comment étudier les
effets simples?
a. Avec des test-t pour échantillons indépendants en scindant le fichier
b. Par des test de Student pour échantillons indépendants, en ajustant le risque d’erreur alpha
c. Avec des tests de comparaisons de moyennes pairés en ajustant alpha
d. Rien de tout cela
QCM

19. Combien d’effets pouvons-nous étudier dans une ANOVA 2x2x2 sans tenir compte des effets
simples?
a. 3
b. 5
c. 7
d. 8
QCM

19. Combien d’effets pouvons-nous étudier dans une ANOVA 2x2x2 sans tenir compte des effets
simples?
a. 3
b. 5
c. 7
d. 8

VI1 + VI2 + VI3 + VI1 et VI2 + VI1 et VI3 + VI2 et VI3 + VI1 et VI2 et VI3

L’erreur n’est pas un effet un effet à proprement parler ici, elle n’est pas à considérer dans les sources de
variation.
QCM

21. Décomposer la variance totale dans le cas d’une ANOVA complètement inter-sujet à 4 facteurs,
disons A, B, C et D.
QCM

21. Décomposer la variance totale dans le cas d’une ANOVA complètement inter-sujet à 4 facteurs,
disons A, B, C et D.

Effets principaux : A, B, C, D
Interactions : AB, AC, AD, BC, BD, CD, ABC, ACD, ABD, BCD, ABCD
L'erreur
QCM

22. Où trouve-t-on une interaction?


QCM

22. Où trouve-t-on une interaction?


QCM

23. Quelles expressions décrivent un effet simple?


a. La différence entre chewing-gum et pas de chewing-gum en situation de discussion
b. La différence globale entre les situations avec et sans thé
c. L'effet du bruit en situation d'examen de mathématiques
d. L'effet d'une thérapie cognitive sur le contrôle de la peur dans la population générale
QCM

23. Quelles expressions décrivent un effet simple?


a. La différence entre chewing-gum et pas de chewing-gum en situation de discussion
b. La différence globale entre les situations avec et sans thé
c. L'effet du bruit en situation d'examen de mathématiques
d. L'effet d'une thérapie cognitive sur le contrôle de la peur dans la population générale
QCM

24. Quand et comment doit-on ajuster le seuil alpha?


QCM

24. Quand et comment doit-on ajuster le seuil alpha?


Dans une ANOVA, quand on fait des comparaisons 2 à 2.
- Soit on fait des tests-t et on doit ajuster le seuil soi-même en fonction du nombre de comparaisons
prévues
- Soit on fait des post-hoc. Il faut alors cocher Bonferroni ou Tukey et on ne doit pas changer le seuil de
0.05 car Bonferroni et Tukey tiennent déjà compte de ça.
THEORIE

✓ Le design d’une ANOVA (2x2 ; 3x4x2…)


✓ Les effets simples et principaux
✓ 3 ANOVA à plusieurs facteurs : Plan factoriel (plan simple, indépendant), Plan à mesures répétées
(appariées) et Plan mixte (à l’examen l’année passée)
✓ Les sources de variations (effets principaux, interaction, erreur)
✓ Ajuster le seuil, si comparaison à priori, selon le nombre de comparaison
✓ Savoir réaliser un tableau représentant l’interaction avec l’IC à 95%
EXERCICES

EXERCICES GUIDES ET AUTONOMES


EXERCICES

Réalisez une figure représentant l’interaction entre les deux VI à partir du tableau ci-dessous. La figure doit
représenter les intervalles de confiance à 95% autour des moyennes.

95% IC
Moment
Chien Marginal Mean SE Lower Upper
journée
Golden Matin 16.20 0.48 15.98 18.01
Soir 19.41 0.48 17.76 20.04
Bernois Matin 15.87 0.48 13.62 16.90
Soir 21.59 0.48 20.14 23.28
EXERCICES

Réalisez une figure représentant l’interaction entre les deux VI à partir du tableau ci-dessous. La figure doit
représenter les intervalles de confiance à 95% autour des moyennes.

95% IC
Moment Marginal
Chien SE Lower Upper
journée Mean
Golden Matin 15.98 18.01
16.20 0.48

Soir 17.76 20.04


19.41 0.48

Bernois Matin 13.62 16.90


15.87 0.48

Soir 20.14 23.28


21.59 0.48
EXERCICES

Le nombre de connexion sur instagram en fonction du sexe et du téléphone

On s’intéresse au nombre de connexions faites sur


Instagram par jour chez les garçons et les filles en fonction
de la marque du téléphone des adolescents. Deux groupes
de 20 personnes ayant un Iphone ou un Samsung sont
choisis au hasard et scindés en deux groupes (garçon, fille).

Considérez que les conditions d’applications sont remplies

Exercice repris et adapté du TP


EXERCICES

Etape 2
Quel type de test est-ce que je vais utiliser?
On s’intéresse au nombre de connexions faites sur Instagram par jour chez les garçons et les filles en fonction de la
marque du téléphone. Deux groupes de 20 adolescents ayant un Iphone ou un samsung sont choisis au hasard et
scindés en deux groupes (garçon, fille).

• Test t pour échantillons appariés • Anova à un seul facteur, plan simple

• Test t pour échantillons indépendants • Anova à un seul facteur, plan à mesures répétées

• Test t pour échantillons unique


• Anova à plusieurs facteur, plan factoriel

• Anova à plusieurs facteur, plan à mesures répétées

• Anova à plusieurs facteurs, plan mixte


EXERCICES

Etape 3
Quelles sont mes variables?
On s’intéresse au nombre de connexions faites sur Instagram par jour chez les garçons et les filles en fonction de la
marque du téléphone. Deux groupes de 20 adolescents ayant un Iphone ou un samsung sont choisis au hasard et
scindés en deux groupes (garçon, fille).

• Variable dépendante (VD) : Le nombre de connexions sur instagram par jour (variable discrète ;
utilisée comme une variable continue)
• Variable indépendante (VI) : La marque du téléphone (variable catégorielle, inter-sujet)
➢ 2 modalités: Iphone, Samsung
• Variable indépendante (VI): Le sexe (variable catégorielle, inter-sujet)
➢ 2 modalités: garçon, fille

!!!! Ne pas oublier de catégoriser les variables à l’examen


EXERCICES
Etape 4
J’écris mes hypothèses

On s’intéresse au nombre de connexions faites sur Instagram par jour chez les garçons et les filles en fonction de la
marque du téléphone. Deux groupes de 20 adolescents ayant un Iphone ou un samsung sont choisis au hasard et
scindés en deux groupes (garçon, fille).
POUR VI: effet du sexe POUR VI: effet de la marque du téléphone
H0 : Il n’y a pas différence de moyenne entre les sexes H0 : Il n’y a pas de différence de moyenne entre les marques de téléphone
H1 : Il y a une différence significative de moyenne entre les sexes H1 : Il y a une différence significative de moyenne entre les marques de téléphone

POUR l’interaction:
H0 : Il y a pas d’interaction entre les deux facteurs
H1 : Il y a une interaction significative entre les deux facteurs
EXERCICES
Etape 5
Je note ma conclusion
Théorie
1. Décrire le graphique interaction
Le graphique (nom du graphique) montre les moyennes et l’intervalle de confiance à 95% de X en fonction de X. Cette figure
suggère que…
2. Impression confirmée ou non + nom du test (F(dl Gr, dl rés.) = X; MSE = X; P = X; n²p = X) => effets principaux + interaction
(Nom du test COMPLET) révèle un effet (non)significatif pour le facteur…/un effet (non)significatif pour l’interaction…
3. Comparaison des moyennes => effets simples
Un test post-hoc (bonferonni)…
a) Les comparaisons significatives (p = x; d= x)
b) Les comparaisons non-significatives (p = x)
4. Conclusion
Ces données suggèrent que…
EXERCICES
Etape 5
Iphone Je note ma conclusion
Samsung
Partie 1
1. Présenter les données descriptives
Le graphique « descriptives plots » montre les moyennes et l’intervalle de confiance à 95% du nombre de
connexions sur Instagram par jour des filles et des garçons en fonction de la marque de leur téléphone. Cette
figure suggère que les filles se connectent en moyenne, plus souvent sur Instagram si elles ont un Samsung
plutôt qu’un Iphone. La figure suggère l’inverse pour les garçons.
2. Impression confirmée ou non + nom du test
Fille Garçon Une ANOVA à deux facteurs , plan factoriel; (facteur sexe (2 modalités: fille, garçon), facteur téléphone (2
modalités: Iphone, Samsung)) révèle un effet non-significatif du facteur sexe (F(1,36) = 1.088, p = 0.304) et du
facteur téléphone (F(1,36) = 0.484, p = 0.491). Cependant, il révèle une interaction significative entre les deux
facteurs (F1,36) = 13.330, p < 0.001, n²p = 0.270)
EXERCICES
Etape 5
Je note ma conclusion
Partie 2

En sachant que:
• sexe 1 = fille
• sexe 2 = garçon
• téléphone 1 = Iphone
• Téléphone 2 = Samsung
EXERCICES
Etape 5
Je note ma conclusion
Partie 2
3. Comparaison de moyennes
Des comparaisons de moyennes ont été réalisées avec des tests posthoc (bonferonni). Ces tests révèlent que les filles ayant
un Iphone se connectent, en moyenne, significativement moins que les garçons ayant un iphone (p < 0.001; d = -2.319), que
les filles ayant un samsung (p < 0.001; d = -2.207) et que les garçons ayant un samsung (p = 0.025 d = -1.369 )

La différence de moyennes entre les garçons ayant un Iphone et les filles ayant un Samsung est non significative (p = 1)
La différence de moyenne entre les garçons ayant un Iphone et ceux ayant un Samsung est non significative (p = 0.244)
La différence de moyenne entre les filles qui ont un Samsung et les garçons ayant un Samsung est non significative (p =
0.414)

ATTENTION: il manque le d de cohen dans le tableau et dans la conclusion!!!!


EXERCICES

La note à l’examen de statistique en fonction


de la présence en cours et en bibliothèque

On s’intéresse au score des élèves de l’année passerelle sur


leur examen de statistiques. Deux groupes de 20 personnes
sont choisis au hasard et interrogés sur leur présence aux
cours (oui/non), mais également sur leur présence en
bibliothèque pour étudier ce dernier (oui/non).

Considérez que les conditions d’applications sont remplies

Exercice repris et adapté du TP


EXERCICES

La note à l’examen de statistique en fonction de la présence en cours et en bibliothèque

On s’intéresse au score des élèves de l’année passerelle sur leur examen de statistiques. Deux groupes de 20
personnes sont choisis au hasard et interrogés sur leur présence aux cours (oui/non), mais également sur leur
présence en bibliothèque pour étudier ce dernier (oui/non).

À vous de jouer

• Etape 1: quel test est-ce que je vais utiliser?


• Etape 2: quelles sont mes variables?
• Etape 3: quelles sont mes hypothèses?
EXERCICES

La note à l’examen de statistique en fonction de la présence en cours et en bibliothèque

À vous de jouer - réponses

• Etape 1: quel test est-ce que je vais utiliser? ANOVA à plusieurs facteurs, plan simple
• Etape 2: quelles sont mes variables?
• VD: le score à l’examen (variable continue)
• VI1: présence aux cours (variable catégorielle, intersujet, 2 conditions (oui ou non))
• VI2: présence en bibliothèque (variable catégorielle, intersujet, 2 conditions (oui ou non))
• Etape 3: quelles sont mes hypothèses?
• ! A postériori
• Effet de la VI présence aux cours : HO: il n y a pas de différence de moyenne entre les deux groupes,
H1: il y a une différence significative de moyenne entre les deux groupes
• Effet de la VI présence en bibli: HO: il n y a pas de différence de moyenne entre les deux groupes,
H1: il y a une différence significative de moyenne entre les deux groupes
• Effet de l’interaction: H0: l’interaction est non significative; H1: l’interaction est significative
EXERCICES

La note à l’examen de statistique en fonction de la présence en cours et en bibliothèque

Dessinez le graphique d’interaction

Intervalle de confiance à 95%

En sachant que: Minimum Maximum


• Bibli 1 = non 11,79 18,24
• Bibli 2 = oui
• Cours 1 = non 17,62 23,87
• Cours 2 = oui
19,25 23,92
16,09 21,17
EXERCICES

La note à l’examen de statistique en fonction de la présence en cours et en bibliothèque

Dessinez le graphique d’interaction


Réponse
Non
Oui

!!!! Ne pas oublier de dessiner les intervalles de Non Oui


confiance à l’examen
EXERCICES

La note à l’examen de statistique en fonction de la présence en cours et en bibliothèque


EXERCICES

La note à l’examen de statistique en fonction de la présence en cours et en bibliothèque

En sachant que:
• Bibli 1 = non
• Bibli 2 = oui
• Cours 1 = non
• Cours 2 = oui
EXERCICES

La note à l’examen de statistique en fonction de la présence en cours et en bibliothèque


Conclusion
Réponse – partie 1
Le graphique « descriptives plots » montre les moyennes et l’intervalle de confiance à 95% du score à l’examen de
statistiques en fonction de la présence aux cours des étudiants et du fait qu’ils ont étudié en bibliothèque ou non. Cette
figure suggère que la note à l’examen de statistiques est plus élevée lorsque les étudiants vont soit à la bibliothèque, soit
en cours.
Une ANOVA à deux facteurs , plan factoriel; (facteur présence cours (2 modalités: oui, non), facteur présence bibli (2
modalités: oui, non)) révèle un effet non-significatif du facteur cours (F(1,36) = 1.084, p = 0.305) et du facteur
bibliothèque (F(1,36) = 2.917, p = 0.096). Cependant, il révèle une interaction significative entre les deux facteurs
(F1,36) = 13.774, p < 0.001, n^2 = 0.256)
EXERCICES

La note à l’examen de statistique en fonction de la présence en cours et en bibliothèque


Conclusion
Réponse – partie 2
Des comparaisons de moyennes ont été réalisées avec des tests posthoc (bonferonni). Ces tests révèlent que les élèves
n’ayant été présents ni à la bibliothèque, ni aux cours, ont une moyenne significativement inférieurs aux élèves qui n’ont
pas été présents aux cours mais qui ont étudié à la bibliothèque (p = 0.003 ; d = -1.712) et aux élèves qui ont été présents
aux cours mais qui n’ont pas étudié en bibliothèque (p= 0.011 ; d= -1.502).

La différence de moyenne entre les élèves qui n’ont pas été en cours, ni à la bibliothèque et ceux qui ont été en cours et à la
bibliothèque n’est pas significative (p = 0.358). La différence de moyenne entre les étudiants qui ont été en bibliothèque
mais pas en cours et ceux qui ont été à la bibliothèque et en cours (p = 0.405) ainsi que ceux qui ont n’ont pas été à la
bibliothèque mais en cours (p = 1) n’est pas significative. Pour finir, la différence de moyenne entre ceux qui n’ont pas été en
bibliothèque mais en cours et ceux qui ont été à la bibliothèque et en cours est également non-significative (p = 0.996)
En conclusion, il est préférable d’aller soit en cours, soit à la bibli.
LOGO-E5001

Méthodologie de la
recherche et statistiques

Guidances présentées par

Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 6

Table des matières


▪ QCM
▪ Théorie
QCM

Chapitre 16 : Statistiques non


paramétriques
QCM

1. Le test de Wilcoxon pour échantillons pariés est adapté


a. aux facteurs intra-sujets
b. aux facteurs inter-sujets
c. aux échantillons appariés
d. A la fois a et c
QCM

1. Le test de Wilcoxon pour échantillons pairés est adapté


a. aux facteurs intra-sujets
b. aux facteurs inter-sujets
c. aux échantillons appariés
d. A la fois a et c

Intra-sujets = pairés = appariés = mesures répétées


QCM

2. Pour analyser la différence entre deux séries de scores dans le cas de groupes indépendants avec des
variables ordinales, on utilise
a. le test de Student pour échantillons indépendants
b. le test de Wilcoxon
c. le test de comparaison de moyenne pour échantillons appariés
d. le test de Mann-Whitney
QCM

2. Pour analyser la différence entre deux séries de scores dans le cas de groupes indépendants avec des
variables ordinales, on utilise
a. le test de Student pour échantillons indépendants
b. le test de Wilcoxon
c. le test de comparaison de moyenne pour échantillons appariés
d. le test de Mann-Whitney
QCM

4. Le tets de Wilcoxon peut être utilisé quand


a. il y a deux conditions
b. les participants passent les deux conditions
c. les données sont au moins ordinales
d. tout cela à la fois
QCM

4. Le tets de Wilcoxon peut être utilisé quand


a. il y a deux conditions
b. les participants passent les deux conditions
c. les données sont au moins ordinales
d. tout cela à la fois
QCM

5. Le tets de Mann-Whitney utilise


a. la différence des moyennes entre les conditions
b. la somme des rangs pour chaque groupe
c. le rang de la différence de score
d. la différence de rangs entre les conditions
QCM

5. Le tets de Mann-Whitney utilise


a. la différence des moyennes entre les conditions
b. la somme des rangs pour chaque groupe
c. le rang de la différence de score
d. la différence de rangs entre les conditions

Les tests non paramétriques se basent sur la somme des rangs pour chaque groupe afin de voir la différence
de rangs entre les conditions. Les test paramétriques se basent sur les valeurs (moyennes)
QCM

6. Un test de Mann-Whtiney donne les résultats suivants : U = 9 ; p = 0.1726 (bilatéral). Les chercheurs
ont fait une hypothèse unidirectionnelle sur la différence entre groupes, hypothèse confirmée sur
l’échantillon. La bonne signification est alors
a. 0.0863
b. 0.863
c. 0.1726
d. indéterminée
QCM

6. Un test de Mann-Whitney donne les résultats suivants : U = 9 ; p = 0.1726 (bilatéral). Les chercheurs
ont fait une hypothèse unidirectionnelle sur la différence entre groupes, hypothèse confirmée sur
l’échantillon. La bonne signification est alors
a. 0.0863
b. 0.863
c. 0.1726
d. indéterminée

Lorsque qu’on parle de signification, on parle bien de la valeur de p.

P bilatéral = 2 x P unilatéral
QCM

7. Si, dans un plan à mesures répétées à deux conditions, nous avons un petit nombre de participants et
des données asymétriques ordinales, il vaut mieux utiliser
a. un test de comparaison de moyennes pour échantillons indépendants
b. un test de comparaison de moyennes pour échantillons appariés
c. un test de Mann-Whitney
d. un test de Wilcoxon
QCM

7. Si, dans un plan à mesures répétées à deux conditions, nous avons un petit nombre de participants et
des données asymétriques ordinales, il vaut mieux utiliser
a. un test de comparaison de moyennes pour échantillons indépendants
b. un test de comparaison de moyennes pour échantillons appariés
c. un test de Mann-Whitney
d. un test de Wilcoxon
QCM

8. Un test de Wilcoxon donne W = 3 et p = 0.02. Cela montre


a. que sous l’hypothèse nulle, la probabilité d’obtenir un W aussi grand que 3 est de 2%
b. que nous sommes sûrs à 98% que nos résultats sont significatifs
c. avec nos données, on doit trouver W = 3 dans 2% des cas
d. si l’hypothèse nulle est fausse, alors la probabilité que W dépasse 3 est de 2%
QCM

8. Un test de Wilcoxon donne W = 3 et p = 0.02. Cela montre


a. que sous l’hypothèse nulle, la probabilité d’obtenir un W aussi grand que 3 est de 2%
b. que nous sommes sûrs à 98% que nos résultats sont significatifs
c. avec nos données, on doit trouver W = 3 dans 2% des cas
d. si l’hypothèse nulle est fausse, alors la probabilité que W dépasse 3 est de 2%

Théorie pure!!
QCM

9. Une valeur W = 3 est convertie en score z, ce qui donne z = -3.2. Cela montre
a. une erreur dans les calculs
b. la différence n’est sans doute pas significative
c. la différence est probablement significative
d. on ne peut pas savoir
QCM

9. Une valeur W = 3 est convertie en score z, ce qui donne z = -3.2. Cela montre
a. une erreur dans les calculs
b. la différence n’est sans doute pas significative
c. la différence est probablement significative
d. on ne peut pas savoir

Ce type de question n’est pas vraiment dans le cours. C’est du plus et de la compréhension.

Se trouver à -3.2 écart-types est relativement grand ! On peut en déduire que notre différence est
probablement significative.
QCM

16. Voici une table de coefficient de Spearman. Quelle est la bonne conclusion? La souffrance et les
différentes autres mesurent sont
a. peut liées
b. modérément liées
c. fortement liées
d. parfaitement liées
QCM

16. Voici une table de coefficient de Spearman. Quelle est la bonne conclusion? La souffrance et les
différentes autres mesurent sont
a. peut liées
b. modérément liées
c. fortement liées
d. parfaitement liées
QCM

16. Voici une table de coefficient de Spearman. Quelle est la bonne conclusion? La souffrance et les
différentes autres mesurent sont
a. peut liées
b. modérément liées
c. fortement liées
d. parfaitement liées

On ne parle pas de significativité ici. On doit donc regarder le coefficient de Spearman


QCM

17. Voici une table de coefficient de Spearman. La plus forte relation se trouve entre la souffrance et
a. la tension
b. l’autonomie
c. la peur
d. la punition
QCM

17. Voici une table de coefficient de Spearman. La plus forte relation se trouve entre la souffrance et
a. la tension
b. l’autonomie
c. la peur
d. la punition

Relation forte ne veut pas dire forcément positive! Une relation forte peut être négative
QCM

20. Considérez la table suivante. Le professeur Dupont pense que la force et la motivation sont liées
positivement. Malheureusement, il n’est pas aussi fort que nous en statistiques, il n’a obtenu que la
signification bilatéral, alors qu’il souhaite faire un test unilatéral. La relation entre force et motivation
est
a. significative (rs = 0.613 ; p = 0.144)
b. significative (rs = 0.613 ; p = 0.072)
c. non significative (rs = 0.613 ; p = 0.144)
d. non significative (rs = 0.613 ; p = 0.072)
QCM

20. Considérez la table suivante. Le professeur Dupont pense que la force et la motivation sont liées
positivement. Malheureusement, il n’est pas aussi fort que nous en statistiques, il n’a obtenu que la
signification bilatéral, alors qu’il souhaite faire un test unilatéral. La relation entre force et motivation
est
a. significative (rs = 0.613 ; p = 0.144)
b. significative (rs = 0.613 ; p = 0.072)
c. non significative (rs = 0.613 ; p = 0.144)
d. non significative (rs = 0.613 ; p = 0.072)

Attention qu’on passe


en unilatéral!
THEORIE

✓ Les tests non paramétriques sont basés sur les rangs (différence significative de rangs moyens entre
deux groupes.
✓ Pour choisir un test non paramétrique, regarder les conditions d’application (Skewness – indice
d’asymétrie, Kurtosis – indice d’aplatissement, Shapiro-Wilk – normalité)
✓ L’équivalent non paramétrique du r de Pearson est le r de Spearman
THEORIE
QCM

Chapitre 9 : Mesures d’association


QCM

2. Le V de Cramer est
a) un signe de victoire que l'on fait lorsqu'on a réussi un test de Cramer
b) une mesure d'effet fondée sur les scores standardisés
c) une mesure de corrélation liée au test du x²
d) une mesure de différence
QCM

2. Le V de Cramer est
a) un signe de victoire que l'on fait lorsqu'on a réussi un test de Cramer
b) une mesure d'effet fondée sur les scores standardisés
c) une mesure de corrélation liée au test du x²
d) une mesure de différence

Le V de Cramer est un indice d’association qui fournit une mesure de la taille de l’effet et peut
s’interpréter comme le coefficient de corrélation entre les deux variables
QCM

3. Combien de femmes se trouvaient dans le groupe du mardi?


a) 127
b) 43
c) 99
d) 210
QCM

3. Combien de femmes se trouvaient dans le groupe du mardi?


a) 127
b) 43
c) 99
d) 210
QCM

4. Le test du X² donne une signification de


a) p < 0,001
b) 0,004
c) 0,00124
d) rien de tout cela
QCM

4. Le test du X² donne une signification de


a) p < 0,001
b) 0,004
c) 0,00124
d) rien de tout cela

Erreur dans le livre


QCM

5. Le nombre total de participants est


a) 231
b) 170
c) 124
d) 593
QCM

5. Le nombre total de participants est


a) 231
b) 170
c) 124
d) 593
QCM

6. On demande à 290 personnes d’indiquer leur soda préféré parmi les cinq proposés. Les résultats sont
les suivants:

Quelles sont les fréquences attendues?


a) 57
b) 58
c) 290
d) Rien de tout cela
QCM

6. On demande à 290 personnes d’indiquer leur soda préféré parmi les cinq proposés. Les résultats sont
les suivants (image).

Quelles sont les fréquences attendues?


a) 57
b) 58
c) 290
d) Rien de tout cela

67 + 83 + 77 + 6 + 57 = 290
290/5 choix = 58
QCM

7. On donne la sortie suivante:

Le X² est associé à une p-value de


a) 0.00005
b) 0.00004
c) 0.00200
d) 0,00050
QCM

7. On donne la sortie suivante:

Le X² est associé à une p-value de


a) 0.00005
b) 0.00004
c) 0.00200
d) 0,00050
QCM

8. On donne la table:

Quels sont les effectifs attendus sous l’hypothèse d’uniformité?


a) 32
b) 50
c) 42
d) 25
QCM

8. On donne la table(image).

Quels sont les effectifs attendus sous l’hypothèse d’uniformité?


a) 32
b) 50
c) 42
d) 25

72 + 31 + 15 + 50
168/4 choix = 42
QCM

9. Un test de X² pour une seule variable est


a) un test de conformité
b) un test d'indépendance
c) un test 2 x 4
d) un test 2 x 2.
QCM

9. Un test de X² pour une seule variable est


a) un test de conformité
b) un test d'indépendance
c) un test 2 x 4
d) un test 2 x 2.

Théorie pure
QCM

10. La valeur du X² est toujours


a) Positive
b) Négative
c) Haute
d) Inconnue
QCM

10. La valeur du X² est toujours


a) Positive
b) Négative
c) Haute
d) Inconnue

Théorie pure

Le V de Cramer est toujours positif car il s’agit d’une somme de carrés (voir slide 72 pour un exemple)
QCM

12. La valeur du X² est


a) 12.162
b) 21.516
c) 22.305
d) 525
QCM

12. La valeur du X² est


a) 12.162
b) 21.516
c) 22.305
d) 525
QCM

15. On donne la table de contingence suivante, obtenue sur un échantillon de 150 volontaires

Il y a quelque chose qui cloche dans ce tableau parce que:


a) la somme des cellules devrait faire 150
b) la somme des cellules devrait faire 100
c) les cellules devraient être égales
d) le tableau devrait avoir 4 lignes
QCM

15. On donne la table de contingence suivante, obtenue sur un échantillon de 150 volontaires

Il y a quelque chose qui cloche dans ce tableau parce que:


a) la somme des cellules devrait faire 150
b) la somme des cellules devrait faire 100
c) les cellules devraient être égales
d) le tableau devrait avoir 4 lignes

Si nous additionnons toutes les observations du tableau, nous arrivons à un total de 110.
QCM

16. 485 personnes doivent choisir le meilleur dessin d’oiseau pour une campagne pacifiste. Les résultats
sont les suivants:

Quels sont les effectifs attendus


a) 79
b) 97
c) 485
d) 5
QCM

16. 485 personnes doivent choisir le meilleur dessin d’oiseau pour une campagne pacifiste. Les résultats
sont les suivants (image).
Quels sont les effectifs attendus?
a) 79
b) 97
c) 485
d) 5

162 + 84 + 57 + 94 + 88 = 485
485/ 5 = 97
QCM

17. Pour connaitre la taille de l’effet lorsqu’on à réalisé un test de X² d’indépendance, il faut:
a) Convertir le V de Cramer en X²
b) Convertir le X² en V de Cramer
c) Élever au carré le X²
d) Convertir le X² en Z de Fisher
QCM

17. Pour connaitre la taille de l’effet lorsqu’on à réalisé un test de X² d’indépendance, il faut:
a) Convertir le V de Cramer en X²
b) Convertir le X² en V de Cramer
c) Élever au carré le X²
d) Convertir le X² en Z de Fisher

Théorie pure
QCM

18. On donne la table suivante :

Cela s’appelle
a) Une table 2 x 2 de contingence
b) une table 3 x 3 de contingence
c) une table 1 × 2 du X²
d) une table 2 x 2 du X²
QCM

18. On donne la table suivante (image).


Cela s’appelle
a) Une table 2 x 2 de contingence
b) une table 3 x 3 de contingence
c) une table 1 × 2 du X²
d) une table 2 x 2 du X²

Théorie pure
QCM

19. Le but d’un test de X² d’indépendance pour une table 2x2 est de montrer

a) une association entre deux variables catégorielles


b) une association entre deux variables numériques
c) une différence entre 2 x 2 groupes
d) rien de tout cela
QCM

19. Le but d’un test de X² d’indépendance pour une table 2x2 est de montrer

a) une association entre deux variables catégorielles


b) une association entre deux variables numériques
c) une différence entre 2 x 2 groupes
d) rien de tout cela

Théorie pure
THEORIE

Test du X²
• Pour des variables catégorielles: les fréquences/effectifs sont traités plutôt que des données brutes (chiffres)
• Le test de X² montre un lien entre deux variables catégorielles
• Exemple: la langue maternelle influence-t-elle le type d’erreurs de lecture
• V de cramer: mesure de la taille de l’effet et peut s’interpréter comme coefficient de corrélation entre les deux
variables
1. Test de X² de conformité
• Cas d’une unique variable catégorielle
Ex: choix du chien préféré au sein d’un échantillon de 110 personnes

• Permet de déterminer si une série d’effectifs observés diffère significativement d’une série d’effectifs attendus
• Distribution uniforme (pas d’attentes sur quel chien sera le préféré) & distribution théorique (quand on a une attente)
• H0 = les observations sont égales aux fréquences attendues
EXEMPLE X² DE CONFORMITE
Sous l’hypothèse d’uniformité (distribution uniforme)

Comment calculer les effectifs attendus:


Total de l’échantillon/nombre de choix
(110/4 = 27,5)
Effectifs attendus inégaux

Comment calculer les effectifs attendus:


En sachant que dans la population nous avons 10% de
gauchers
Total des observations x 10% = fréquence attendue pour les
gauchers (317 x 0.1 = 31.7)
Le reste = fréquence attendue pour les droitiers (317 – 31,7 =
285,3)
THEORIE

2. Test de x² d’indépendance pour des tables 2x2


• Permet de déterminer s’il existe une association entre 2 variables catégorielles
Ex: Lien entre le fait de fumer et le fait de boire

• Table de contingence
• Pas de distribution uniformes dans ce cas-ci
• H0 = les observations sont égales aux fréquences attendues
EXEMPLE X² D’INDEPENDANCE

Ce qu’on a observé

Ce qui est attendu

Alcool

Non oui

Tabac Non 25/100 x 43 75/100 x 43


= 10.75 = 32.25
Comment calculer les effectifs attendus:
Total de la colonne / total général x total de la ligne Oui 25/100 x 57 75/100 x 57
= 14.25 = 42.75
LOGO-E5001

Méthodologie de la
recherche et statistiques

Guidances présentées par

Eléonore De Roubaix
Florian Crobeddu
PLANNING
Vendredi 16h-18h : S.UB2.139 (Multimédia)
Lundi 18h-20h : S.H2214 (Auditoire Angela Davis)
Guidance 1 : Vendredi 14/10/2022
2 : Vendredi 21/10/2022
3 : Vendredi 28/10/2022
4 : Vendredi 04/11/2022
5 : Lundi 14/11/2022
6 : Vendredi 25/11/2022
7 : Vendredi 02/12/2022
8 : Questions-réponses Lundi 05/12/2022
9 : Vendredi 09/12/2022
10 : Examen blanc Lundi 12/12/2022
11 : Correction examen blanc Vendredi 16/12/2022
PRESENTATION 8

Table des matières


▪ Erreurs fréquentes
ERREURS FREQUENTES

Pour la partie analyse et conclusion :


✓ Préciser le type de variables (pour la VD et les VI)
✓ Préciser si les VI sont inter-sujet ou intra-sujet
✓ Mettre les niveaux des VI (c’est indiqué dans la consigne)
✓ Pour les résultats significatifs, en 3 phrases c’est ok. Ne mettre que ce qui est significatif, pas le test de
Levene!
✓ Pour le graphique, il ne faut pas oublier le titre, la légende, le nom de l’axe avec la VD, les intervalles de
confiances

! Voir guidance 5 (ANOVA à plusieurs facteurs) pour avoir des exemples des graphiques d’interaction et
des conclusions types ☺
ERREURS FREQUENTES

Pour la partie QCM :


✓ Théorie par cœur
✓ Etudier bien vos formules
✓ Attention à la manière de répondre ! Consignes examen ULB
FIN DES GUIDANCES

Merci pour votre participation active et votre présence!


Courage pour la suite, vous êtes des machines!!

Vous aimerez peut-être aussi