0% ont trouvé ce document utile (0 vote)
46 vues39 pages

Statsderniercours

Transféré par

lilas.jurg
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
46 vues39 pages

Statsderniercours

Transféré par

lilas.jurg
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Pas d’exercices pour cette

séance
Séance 11
Tests statistiques de l’hypothèse nulle

Rappel de notions-clés

Tests de significativité

Degrés de libertés

Exemple du test-t pour comparer deux groupes


2
Les types de mesures
Nominale : Catégories distinctes (e.g., Sexe, Typologie d’individus).
Ordinale : Ordre hiérarchique (e.g., Niveau d’études).
Intervalle : Échelle sans zéro absolu (e.g., Température en °C).
Rapport : Échelle avec zéro absolu (e.g., Temps de jeu).

Continue/quantitatif Discrète/qualitatif

Nominale X
Ordinale X
Intervalle X
Ratio X 3
Mesures de tendance centrale et de
dispersion
Mode : Valeur la plus
fréquente.

Médiane : Valeur au milieu de


la distribution.

Moyenne : Somme des valeurs


divisée par leur nombre.

4
Échantillon et population
Population : Ensemble complet des individus
ou phénomènes étudiés.

Échantillon : Sous-ensemble de la population


choisi pour être étudié.

Objectif : Utiliser l’échantillon pour tirer des


conclusions sur la population.

5
La Loi Normale
• Forme en cloche.

• Moyenne (m) = centre.

• Écart-type (σ) = dispersion


autour de la moyenne.
Distribution symétrique.

• 68 %, 95 %, 99 % des données
dans 1, 2 ou 3 écarts-types.

6
La Loi Normale
• Forme en cloche.

• Moyenne (m) = centre.

• Écart-type (σ) = dispersion


autour de la moyenne.
Distribution symétrique.

• 68 %, 95 %, 99 % des données
dans 1, 2 ou 3 écarts-types.

7
Loi normale centrée réduite
• Transforme toute loi normale en une
forme standard.
La moyenne (M)

• Moyenne = 0, Écart-type = 1.
• Permet de comparer différentes
distributions. L’écart-type (SD)
(racine carrée de la
variance)

8
Probabilités : mesurer l’incertitude
• Probabilité = chance qu’un événement se
produise.

• Somme des probabilités = 1

• Outil clé pour modéliser des situations


incertaines.

9
La Loi Binomiale
• Pour des événements avec deux résultats possibles.
• Probabilité de succès ( p ) et d’échec ( 1-p ).
• Exemple : Lancer une pièce (pile ou face).

10
Pourquoi aller au-delà des statistiques
descriptives ?
• Les statistiques descriptives (moyenne, médiane, écart-type)
permettent de résumer et décrire des données.
• Mais que se passe-t-il si nous voulons aller plus loin ?
• Exemple : Est-ce que les résultats d’un échantillon représentent
fidèlement la population entière ?
• Exemple : Comment comparer deux groupes et savoir si leurs
différences sont significatives ?
• Les statistiques inférentielles permettent de répondre à ces questions en
utilisant des modèles probabilistes.

11
Principes des statistiques inférentielles
Les statistiques descriptives décrivent les données échantillonnées.
Mais nous cherchons souvent à répondre à des questions plus générales.

L’inférence statistique nous permet de :

1. Estimer les paramètres d’une population à partir de l’échantillon (e.g.,, la


moyenne des temps de jeu pour tous les joueurs).

2. Tester des hypothèses pour savoir si un effet observé est réel ou


simplement dû au hasard.

3. Quantifier l’incertitude de nos conclusions.


12
Qu’est ce que l’inférence ?

Distributions théoriques Interprétation de l’incertitude

Ces distributions nous servent de Quand nous disons qu’un


modèles pour comprendre intervalle de confiance est de
comment les données devraient 95%, cela signifie que la vraie
se comporter si certaines moyenne de la population se
situe dans cet intervalle dans
hypothèses sont vraies. 95% des échantillons
Par exemple, la loi normale aide Ces calculs reposent sur des
à estimer la probabilité de voir concepts de probabilités pour
des scores proches ou éloignés déterminer à quel point nos
de la moyenne. résultats sont solides.

13
Test statistiques : la vision
« fréquentiste » de la probabilité
La vision fréquentiste de la probabilité est l’une des approches les plus courantes en statistique.

Elle définit la probabilité comme la fréquence à laquelle un événement se produit dans une série de répétitions. C’est l’approche
hégémonique en Psychologie (mais aussi en médecine, écologie, épidémiologie etc.)

Simple :

Imaginez que vous jouez à pile ou face avec une pièce de monnaie : plus on lance la pièce, plus on va se rapprocher de 50% de pile
(et de face). Ca ressemblerait à ça :

Dans cette séquence, 11 lancers sur 20 ont donné “face”, soit 55%.

à Si on continue de la lancer, la moyenne des lancer va converger petit à petit vers 50%
La vision fréquentiste
Si on fait un tableau, ça ressemble à ça : notez que ça fluctue énormément au début, puis de moins en moins à mesure que le
nombre de lancers augmente. C’est ce que les fréquentistes appellent la probabilité : la chance que quelque chose se produise si
on répète l’action un nombre infini de fois (ici, la proportion est la proportion de « face »)

La probabilité d’un événement est nécessairement observée dans le monde.

Deux personnes différentes observant la même suite d’évènements vont parvenir au même résultat
La vision fréquentiste – en appliqué
Reprenons cet exemple, sauf qu’on lance 1000 pièces et que l’on sait que 10% des pièces sont truquées :

Une pièce normale a 50% de chance de tomber sur pile/face. Une pièce truquée a 80% de
chance de tomber sur pile. Sur 1000 pièces combien tomberont sur pile ?

On calcule les probabilité avec les deux sous-échantillons de pièces : normales et truquées
:

Nombre de pièces défectueuses : 1000 * 10% = 100. Piles avec pièces défectueuses : 100 * 80% = 80

Nombre de pièces normales : 1000 * 90% = 900

Piles avec pièces normales : 900 * 50% = 450

Total des piles : 80 + 450 = 530 piles


Les étapes d’un test statistique

1. Formuler l’hypothèse nulle (H0) et une hypothèse alternative (H1).

2. Calculer une statistique (e.g., z, t, F), c’est-à-dire un ratio


signal/bruit en faveur de H1. Le signal est l’écart entre H0 et H1, le
bruit la variabilité de l’échantillon.

3. Calculer la probabilité d’observer une statistique aussi extrême que


celle-ci sur le long terme si H0 est vraie sur une table des valeurs
critiques

17
Qu’est-ce qu’une statistique de test ?
Définition : Une statistique de test mesure à quel point les données
observées s’écartent de ce que prédit H0.

La statistique de test est comparée à une distribution théorique pour décider


de rejeter ou non H0 .

Exemple : “Un t très grand signifie que la différence entre deux groupes est
difficilement attribuable au hasard.”

La statistique de test fait le lien entre l’échantillon (les données que vous
avez mesurées) et la population (les conclusions que vous voulez
généraliser) en posant une hypothèse nulle ( H0 ) sur la population.

18
Qu’est-ce qu’une statistique de test ? –
représentation graphique

19
La loi normale centrée réduite et test statistique
Le plus simple : le test z - voir un échantillon
diffère de 0
• Le test statistique consiste à comparer
les données observées à une hypothèse
nulle (H0).
• Si les données sont compatibles
avec H0, elles se situent autour de la
moyenne.
• Si elles sont très éloignées, elles se
trouvent dans les zones critiques.

La statistique de test
est la suivante :
L’ombrage des régions critiques et l’ajout d’un point observé ( z ) montrent la zone rejet de H0 .
20
La loi normale centrée réduite et test statistique
Le plus simple : le test z - voir un échantillon
diffère de 0
• La statistique z repose sur
l’hypothèse que nous
connaissons exactement l’écart-
type de la population.
• La distribution de Z suit alors une
loi normale standardisée
• L’écart-type de la population est
une constante connue

L’ombrage des régions critiques et l’ajout d’un point observé ( z ) montrent la zone rejet de H0 .
21
Exemple de test z – les données

22
Exemple de test z – calcul de la statistique de test
z
A ne pas confondre avec le « score z »

23
Exemple de test z – calcul de la statistique de test
z
Résultats

24
Exemple de test z – calcul de la statistique de test
z
Interprétation

25
Différence écart-type / erreur standard

26
La loi binomiale et les tests pour des
données catégoriques
• La loi binomiale modélise
des situations où il y a deux
résultats possibles, comme
‘succès’ ou ‘échec’.
• Le test consiste à vérifier si
le nombre de succès
observé est compatible avec
une probabilité donnée
sous H0 .

L’histogramme met en évidence les probabilités des différentes valeurs et montre comment les régions critiques sont définies.
27
La loi binomiale et les tests pour des
données catégoriques

L’histogramme met en évidence les probabilités des différentes valeurs et montre comment les régions critiques sont
définies.
28
Test d’hypothèse avec la loi binomiale
Test d’hypothèse avec H0 : p = 0.25

29
Test d’hypothèse avec la loi binomiale
Définir la statistique de test

30
Test d’hypothèse avec la loi binomiale
Calcul de la statistique de test

On calcule la proportion de réponses correctes

31
Test d’hypothèse avec la loi binomiale
Décision

32
Vers le test « t »
• Le test z est utilisé lorsque la
variance populationnelle est
connue et l’échantillon est
grand (n > 30 ).

• Le test t est utilisé lorsque la


variance est estimée à partir
de l’échantillon

• Le test t repose sur la


distribution de Student, qui
compense l’incertitude de
l’estimation.
33
Vers le test « t »
• Test z : Utilisé pour
comparer un échantillon à
une valeur fixe ( mu0 = 0
).
• Test t : Utile pour
comparer deux groupes
sur une même variable.
• Concrètement : Mesurer
l’effet d’une intervention
psychologique (Groupe A
vs Groupe B).
La flèche indique la différence dans le graphique représente la distance entre les deux
moyennes des groupes sur l’axe x 34
Le test t pour comparer deux groupes en
psychologie

35
Tests de significativité

En bref : réduire l’incertitude en minimisant le chevauchement entre les


distributions (H0 et H1)

Attention !!!
• Un très grand échantillon peut faire ressortir des effets (i.e., des différences entre
des groupes, ou des associations entre variables) très faibles.
à La solution est de se reporter sur les tailles d’effets.
Comparaison de petit et grand échantillon :
impact sur le résultat
du test

• Voici un graphique comparant la significativité des p-values pour un grand échantillon (en bleu) et un petit échantillon (en orange). La zone sous les
courbes au-delà du seuil critique (±1.96) illustre les zones de rejet de l’hypothèse nulle,
37
• Les grands échantillons peuvent obtenir des p-values significatives plus facilement.
Pourquoi la taille d’échantillon est
importante
Une faible différence de moyenne entre deux groupes (significative
grâce à un grand échantillon).

38
Pourquoi la taille d’effet est importante
La p-value ne mesure pas l’importance d’un effet.
La taille d’effet complète l’analyse.

39

Vous aimerez peut-être aussi