0% ont trouvé ce document utile (0 vote)
91 vues112 pages

Introduction aux Statistiques et Tests

Le document présente un mémo sur l'analyse statistique de données. Il décrit différents types de données, des mesures statistiques descriptives comme la moyenne et l'écart type, et des tests statistiques comme le test t et des tests non paramétriques.

Transféré par

Sahbi Dkhili
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
91 vues112 pages

Introduction aux Statistiques et Tests

Le document présente un mémo sur l'analyse statistique de données. Il décrit différents types de données, des mesures statistiques descriptives comme la moyenne et l'écart type, et des tests statistiques comme le test t et des tests non paramétriques.

Transféré par

Sahbi Dkhili
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

MEMO-I4034

Chapitre I: Rappels

Caroline Verhoeven
Table des matières
1 Introduction
2 Les données
3 Statistiques descriptives
Représentation numérique des données quantitatives
Corrélation et régression
4 Tests d’hypothèse
La p-valeur
Etapes d’un test d’hypothèse
Test t pour 2 échantillons indépendants
Test t pour échantillon appariés
Exercices
5 Normalité ?
6 Tests non paramétriques
Test de Mann-Withney
Test de rangs de Wilcoxon pour 2 échantillons appariés
eamerlogo
Caroline Verhoeven MEMO-I4034 2 / 49
Infos pratiques

Titulaire : Caroline Verhoeven


email :[email protected]
Site :
http://homepages.ulb.ac.be/˜cverhoev/teach.html
Horaire :
le 08/02 de 13h à 16h
le 15/02 de 13h à 16h
le 22/02 de 13h à 15h
le 22/03 de 13h à 16h
Local : Salle COMFORT

eamerlogo
Caroline Verhoeven MEMO-I4034 3 / 49
Examen

Travail à rendre 4 semaines après le dernier cours (le 19/04)


Choisir un sujet qui vous plaı̂t. Sujet à rendre à la date du dernier
cours
2 ou 3 “questions scientifiques”
Il faut des données
Le travail doit correspondre à 2 ou 3 exercices du type fait en cours
Le travail doit contenir
Le fichier avec lequel vous avez travaillé
Un rapport de 2 à 3 pages avec :
1 une introduction au sujet
2 la méthode utilisée (pourquoi cette méthode là)
3 les résultats et conclusions

eamerlogo
Caroline Verhoeven MEMO-I4034 4 / 49
1. Introduction

Les logiciels

Voici quelques logiciels statistiques :


SAS
R
JMP
Minitab
SPSS
Mathematica

eamerlogo
Caroline Verhoeven MEMO-I4034 5 / 49
1. Introduction

Les logiciels

Voici quelques logiciels statistiques :


SAS
R
JMP
Minitab
SPSS
Mathematica

eamerlogo
Caroline Verhoeven MEMO-I4034 5 / 49
1. Introduction

Les logiciels

Voici quelques logiciels statistiques :


SAS
R
JMP
Minitab
SPSS
Mathematica
Statistiques simples : Excel

eamerlogo
Caroline Verhoeven MEMO-I4034 5 / 49
2. Les données

Les types de données

données

Qualitatives Quantitatives

Nominales Ordinales Discrètes Continues

eamerlogo
Caroline Verhoeven MEMO-I4034 6 / 49
2. Les données

Les types de données

données

Qualitatives Quantitatives

Nominales Ordinales Discrètes Continues

Exemple données nominales : groupe sanguin

eamerlogo
Caroline Verhoeven MEMO-I4034 6 / 49
2. Les données

Les types de données

données

Qualitatives Quantitatives

Nominales Ordinales Discrètes Continues

Exemple données nominales : groupe sanguin


Exemple données ordinales : évaluations des profs

eamerlogo
Caroline Verhoeven MEMO-I4034 6 / 49
2. Les données

Les types de données

données

Qualitatives Quantitatives

Nominales Ordinales Discrètes Continues

Exemple données nominales : groupe sanguin


Exemple données ordinales : évaluations des profs
Exemple données quantitatives discrètes : nombre de bactéries

eamerlogo
Caroline Verhoeven MEMO-I4034 6 / 49
2. Les données

Les types de données

données

Qualitatives Quantitatives

Nominales Ordinales Discrètes Continues

Exemple données nominales : groupe sanguin


Exemple données ordinales : évaluations des profs
Exemple données quantitatives discrètes : nombre de bactéries
Exemple de données quantitatives continues : taille
eamerlogo
Caroline Verhoeven MEMO-I4034 6 / 49
2. Les données

Exercice 1 I

Une étude a été menée pour comprendre l’évolution saisonnière de la


dépression. 10 femmes et 10 hommes ont été suivis durant toute une
année. On a une échelle de dépression pour chaque saison.

eamerlogo
Caroline Verhoeven MEMO-I4034 7 / 49
2. Les données

Exercice 1 I

Une étude a été menée pour comprendre l’évolution saisonnière de la


dépression. 10 femmes et 10 hommes ont été suivis durant toute une
année. On a une échelle de dépression pour chaque saison.
Ici : seulement hiver et printemps
Plus le score est élevé, plus l’état dépressif est important

eamerlogo
Caroline Verhoeven MEMO-I4034 7 / 49
2. Les données

Exercice 1 II

Id sexe printemps hiver Id sexe printemps hiver


1 1 8,2 5,7 11 1 9,3 9,4
2 1 5,0 3,2 12 1 5,5 2,3
3 2 12,6 9,9 13 1 8,2 5,5
4 1 6,3 6,2 14 2 13,1 10,8
5 2 8,4 3,7 15 2 8,6 4,7
6 2 10,5 10,4 16 1 7,3 8,1
7 2 9,9 10,1 17 2 12,5 8,6
8 1 7,2 8,4 18 2 10,0 7,7
9 1 6,7 8,6 19 2 8,1 6,8
10 2 12,9 11,1 20 1 4,9 3,7

(a) Introduire les données ci-dessus dans Excel (1=homme, 2=femme)


(b) Déterminer le données nominales et quantitatives
(c) Sauvegarder les données en format .xls ou .xlsx
eamerlogo
Caroline Verhoeven MEMO-I4034 8 / 49
3. Statistiques descriptives 1. Représentation numérique des données quantitatives

Moyenne arithmétique, écart type

Moyenne d’un échantillon


PN
xi
i=1
formule : x =
N
Excel : fonction MOYENNE

eamerlogo
Caroline Verhoeven MEMO-I4034 9 / 49
3. Statistiques descriptives 1. Représentation numérique des données quantitatives

Moyenne arithmétique, écart type

Moyenne d’un échantillon


PN
xi
i=1
formule : x =
N
Excel : fonction MOYENNE
Variance
PN
2 − x)2
i=1 (xi
formule : s =
N −1
Excel : fonction VAR.S

eamerlogo
Caroline Verhoeven MEMO-I4034 9 / 49
3. Statistiques descriptives 1. Représentation numérique des données quantitatives

Moyenne arithmétique, écart type

Moyenne d’un échantillon


PN
xi
i=1
formule : x =
N
Excel : fonction MOYENNE
Variance
PN
2 − x)2
i=1 (xi
formule : s =
N −1
Excel : fonction VAR.S
Ecart-type

formule s = s2
Excel : fonction ECARTTYPE.STANDARD

eamerlogo
Caroline Verhoeven MEMO-I4034 9 / 49
3. Statistiques descriptives 1. Représentation numérique des données quantitatives

La médiane et l’écart interquartile

La médiane
50% de sujets auront des mesures plus petites, 50% des mesures
plus grandes
Excel : fonction MEDIANE

eamerlogo
Caroline Verhoeven MEMO-I4034 10 / 49
3. Statistiques descriptives 1. Représentation numérique des données quantitatives

La médiane et l’écart interquartile

La médiane
50% de sujets auront des mesures plus petites, 50% des mesures
plus grandes
Excel : fonction MEDIANE
Le centile p
p% des sujets auront des mesures plus petites
Excel : fonction CENTILE.INCLURE

eamerlogo
Caroline Verhoeven MEMO-I4034 10 / 49
3. Statistiques descriptives 1. Représentation numérique des données quantitatives

La médiane et l’écart interquartile

La médiane
50% de sujets auront des mesures plus petites, 50% des mesures
plus grandes
Excel : fonction MEDIANE
Le centile p
p% des sujets auront des mesures plus petites
Excel : fonction CENTILE.INCLURE
l’écart interquartile
Le centile 75 - le centile 25

eamerlogo
Caroline Verhoeven MEMO-I4034 10 / 49
3. Statistiques descriptives 2. Exercices

Exercices 2

(a) Déterminer la médiane des scores de dépression au printemps


(b) Déterminer la moyenne et l’écart-type des scores de dépression en
hiver chez les femmes
(Indice : Données → Trier)
(c) Idem chez les hommes

eamerlogo
Caroline Verhoeven MEMO-I4034 11 / 49
3. Statistiques descriptives 2. Exercices

Exercice 3

Nous regardons le taux de fer (mg/100g) de 14 aliments différents.


(a) Ouvrir le fichier fer.xls
(b) Calculer la moyenne et la médiane pour le taux de fer de ces
aliments ? Que remarquez-vous ?
(c) Calculer le 25ème et le 75ème centile
(d) En déduire l’étendue interquartile

eamerlogo
Caroline Verhoeven MEMO-I4034 12 / 49
3. Statistiques descriptives 2. Exercices

Exercice 4 I

Nous considérons une étude menée sur 110 personnes sur l’épaisseur
de l’intima-média

eamerlogo
Caroline Verhoeven MEMO-I4034 13 / 49
3. Statistiques descriptives 2. Exercices

Exercice 4 II

Prenez le fichier intima media.xls sur le site


http://homepages.ulb.ac.be/˜cverhoev/teach.html
Variable Unité ou Codage
sexe 1=homme, 2=femme
age le jour de la visite Années
taille cm
poids kg
tabac 0=ne fume pas, 1=ne fume plus, 2=fume
sport 0=non, 1=oui
mesure mm
alcool 0=ne boit pas, 1=boit occasionnellement, 2=boit régulièrement

eamerlogo
Caroline Verhoeven MEMO-I4034 14 / 49
3. Statistiques descriptives 2. Exercices

Exercice 4 III

(a) Ouvrir le fichier intima-media.xls


(b) Déterminer l’épaisseur moyenne de l’intima-media.
(c) Déterminer l’écart-type de cette épaisseur.
(d) Déterminer le nombre de personnes qui ne fument pas, fument plus
et fument.
Indice : NB.SI

eamerlogo
Caroline Verhoeven MEMO-I4034 15 / 49
3. Statistiques descriptives 3. Corrélation et régression

Le nuage de points I

Exemple 1
En 2004, Whitman et al. ont montré que la quantité de pigmentations
noirs sur le nez des lions mâles augmentait avec leur âge. L’âge du lion
est-il lié au taux de pigmentation ?

eamerlogo
Caroline Verhoeven MEMO-I4034 16 / 49
3. Statistiques descriptives 3. Corrélation et régression

Le nuage de points II

Exemple 1

10
âge

0
0.2 0.4 0.6 0.8
proportion noir

eamerlogo
Caroline Verhoeven MEMO-I4034 17 / 49
3. Statistiques descriptives 3. Corrélation et régression

Le nuage de points II

Exemple 1

10
âge

0
0.2 0.4 0.6 0.8
proportion noir

En Excel : Choisir l’onglet Insertion et choisir Nuage


eamerlogo
Caroline Verhoeven MEMO-I4034 17 / 49
3. Statistiques descriptives 3. Corrélation et régression

Droite de régression : Exemple I

Exemple 2
Peut-on prédire l’âge moyen des lions à partir de la proportion de noir
sur leur nez ?

âge 10

0
0.2 0.4 0.6 0.8
proportion noir

eamerlogo
Caroline Verhoeven MEMO-I4034 18 / 49
3. Statistiques descriptives 3. Corrélation et régression

Droite de régression : Exemple I

Exemple 2
Peut-on prédire l’âge moyen des lions à partir de la proportion de noir
sur leur nez ?

âge 10

0
0.2 0.4 0.6 0.8
proportion noir

Quelle est la “meilleure” droite passant à travers ces points ?

eamerlogo
Caroline Verhoeven MEMO-I4034 18 / 49
3. Statistiques descriptives 3. Corrélation et régression

Droite de régression : Calcul

Equation d’une droite


y = b0 + b1 x

b0 : l’ordonnée à l’origine
b1 : pente

eamerlogo
Caroline Verhoeven MEMO-I4034 19 / 49
3. Statistiques descriptives 3. Corrélation et régression

Droite de régression : Calcul

Equation d’une droite


y = b0 + b1 x

b0 : l’ordonnée à l’origine
b1 : pente

b0 ? b1 ?

eamerlogo
Caroline Verhoeven MEMO-I4034 19 / 49
3. Statistiques descriptives 3. Corrélation et régression

Régression en Excel

Fim explicatif sur youtube :

eamerlogo
Caroline Verhoeven MEMO-I4034 20 / 49
3. Statistiques descriptives 4. Exercices

Exercices

Exercice 5
Prendre le fichier lion.xlsx sur le site
Faire un nuage de points avec la proportion de noir du nez
(horizontal) et l’âge du lion (vertical)
Faire une régression linéaire pour ce nuage de points

eamerlogo
Caroline Verhoeven MEMO-I4034 21 / 49
3. Statistiques descriptives 4. Exercices

Exercices

Exercice 5
Prendre le fichier lion.xlsx sur le site
Faire un nuage de points avec la proportion de noir du nez
(horizontal) et l’âge du lion (vertical)
Faire une régression linéaire pour ce nuage de points
Exerice 6
Prendre le fichier intima media.xls sur le site
Faire un nuage de points de l’épaisseur de l’intima-média (vertical)
en fonction de l’âge (horizontal)
Faire une régression linéaire pour le nuage de points

eamerlogo
Caroline Verhoeven MEMO-I4034 21 / 49
4. Tests d’hypothèse 1. La p-valeur

Principe de base

But : Utiliser les données d’un échantillon afin d’étudier une


hypothèse sur un paramêtre de la population

eamerlogo
Caroline Verhoeven MEMO-I4034 22 / 49
4. Tests d’hypothèse 1. La p-valeur

Principe de base

But : Utiliser les données d’un échantillon afin d’étudier une


hypothèse sur un paramêtre de la population
Comparaison de 2 hypothèses contradictoires :

eamerlogo
Caroline Verhoeven MEMO-I4034 22 / 49
4. Tests d’hypothèse 1. La p-valeur

Principe de base

But : Utiliser les données d’un échantillon afin d’étudier une


hypothèse sur un paramêtre de la population
Comparaison de 2 hypothèses contradictoires :
Hypothèse nulle (H0 ) :

Hypothèse alternative (Ha) :

eamerlogo
Caroline Verhoeven MEMO-I4034 22 / 49
4. Tests d’hypothèse 1. La p-valeur

Principe de base

But : Utiliser les données d’un échantillon afin d’étudier une


hypothèse sur un paramêtre de la population
Comparaison de 2 hypothèses contradictoires :
Hypothèse nulle (H0 ) :
Hypothèse selon laquelle la population suit une loi donnée.
Formulée comme une égalité
Exemple : le traitement n’a pas d’effet, effet=0

Hypothèse alternative (Ha) :

eamerlogo
Caroline Verhoeven MEMO-I4034 22 / 49
4. Tests d’hypothèse 1. La p-valeur

Principe de base

But : Utiliser les données d’un échantillon afin d’étudier une


hypothèse sur un paramêtre de la population
Comparaison de 2 hypothèses contradictoires :
Hypothèse nulle (H0 ) :
Hypothèse selon laquelle la population suit une loi donnée.
Formulée comme une égalité
Exemple : le traitement n’a pas d’effet, effet=0

Hypothèse alternative (Ha) :


Hypothèse selon laquelle la population ne suit pas une loi donnée.
Formulée comme <, > ou =
En général : ce que le chercheur espère
Exemple : effet= 0, effet> 0 ou effet< 0

eamerlogo
Caroline Verhoeven MEMO-I4034 22 / 49
4. Tests d’hypothèse 1. La p-valeur

Principe de base

But : Utiliser les données d’un échantillon afin d’étudier une


hypothèse sur un paramêtre de la population
Comparaison de 2 hypothèses contradictoires :
Hypothèse nulle (H0 ) :
Hypothèse selon laquelle la population suit une loi donnée.
Formulée comme une égalité
Exemple : le traitement n’a pas d’effet, effet=0

Hypothèse alternative (Ha) :


Hypothèse selon laquelle la population ne suit pas une loi donnée.
Formulée comme <, > ou =
En général : ce que le chercheur espère
Exemple : effet= 0, effet> 0 ou effet< 0

Après le test on rejette H0 (RH0 ) ou on ne rejette pas H0 (NRH0 )

eamerlogo
Caroline Verhoeven MEMO-I4034 22 / 49
4. Tests d’hypothèse 1. La p-valeur

Erreurs de test hypothèse

Réalité
H0 vraie H0 fausse
NRH0 Erreur du type II
, /
RH0 Erreur du type I
/ ,

eamerlogo
Caroline Verhoeven MEMO-I4034 23 / 49
4. Tests d’hypothèse 1. La p-valeur

Erreurs de type I

Erreur du type I : Rejeter H0 si elle est vraie


Exemple : Conclure que l’entraı̂nement a un effet alors que non
Il faut éviter ce type d’erreur

eamerlogo
Caroline Verhoeven MEMO-I4034 24 / 49
4. Tests d’hypothèse 1. La p-valeur

Erreurs de type I

Erreur du type I : Rejeter H0 si elle est vraie


Exemple : Conclure que l’entraı̂nement a un effet alors que non
Il faut éviter ce type d’erreur
Limiter le fait que la différence entre le résultat obtenu et H0 est dû
au hasard

eamerlogo
Caroline Verhoeven MEMO-I4034 24 / 49
4. Tests d’hypothèse 1. La p-valeur

Erreurs de type I

Erreur du type I : Rejeter H0 si elle est vraie


Exemple : Conclure que l’entraı̂nement a un effet alors que non
Il faut éviter ce type d’erreur
Limiter le fait que la différence entre le résultat obtenu et H0 est dû
au hasard
En général on accepte que la probabilité de se tromper est α = 0.05
α : le taux significatif

eamerlogo
Caroline Verhoeven MEMO-I4034 24 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif I
Cas : On a les données d’1 échantillon et on veut conclure si :

eamerlogo
Caroline Verhoeven MEMO-I4034 25 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif I
Cas : On a les données d’1 échantillon et on veut conclure si :
H0 : µ = µ 0
Ha : µ > µ 0

eamerlogo
Caroline Verhoeven MEMO-I4034 25 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif I
Cas : On a les données d’1 échantillon et on veut conclure si :
H0 : µ = µ 0
Ha : µ > µ 0

eamerlogo
Caroline Verhoeven MEMO-I4034 25 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif I
Cas : On a les données d’1 échantillon et on veut conclure si :
H0 : µ = µ 0
Ha : µ > µ 0
Supposons que les données donnent x > µ0
Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne de
la population masculine : µ0 = 175cm. En moyenne, les basketteurs
sont-ils plus grands que la taille moyenne de la population masculine ?
Doit-on rejeter H0 ou non ?

eamerlogo
Caroline Verhoeven MEMO-I4034 25 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif I
Cas : On a les données d’1 échantillon et on veut conclure si :
H0 : µ = µ 0
Ha : µ > µ 0
Supposons que les données donnent x > µ0
Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne de
la population masculine : µ0 = 175cm. En moyenne, les basketteurs
sont-ils plus grands que la taille moyenne de la population masculine ?
Doit-on rejeter H0 ou non ?

Distribution d’échantillonnage si H0
vraie

Μ0

eamerlogo
Caroline Verhoeven MEMO-I4034 25 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif I
Cas : On a les données d’1 échantillon et on veut conclure si :
H0 : µ = µ 0
Ha : µ > µ 0
Supposons que les données donnent x > µ0
Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne de
la population masculine : µ0 = 175cm. En moyenne, les basketteurs
sont-ils plus grands que la taille moyenne de la population masculine ?
Doit-on rejeter H0 ou non ?

Distribution d’échantillonnage si H0
vraie
α = P(Y ≥ x)
Α
Μ0
x

eamerlogo
Caroline Verhoeven MEMO-I4034 25 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif I
Cas : On a les données d’1 échantillon et on veut conclure si :
H0 : µ = µ 0
Ha : µ > µ 0
Supposons que les données donnent x > µ0
Exemple : On mesure 30 basketteurs et x = 201cm, la taille moyenne de
la population masculine : µ0 = 175cm. En moyenne, les basketteurs
sont-ils plus grands que la taille moyenne de la population masculine ?
Doit-on rejeter H0 ou non ?

Distribution d’échantillonnage si H0
vraie
1-Α
α = P(Y ≥ x)
Α
x ≥ x ⇒ RH0
NRH0
Μ0
x < x ⇒ NRH0
x RH0

eamerlogo
Caroline Verhoeven MEMO-I4034 25 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif II
H0 : µ = µ0 , Ha : µ < µ0
Distribution d’échantillonnage si H0 vraie

Μ0

eamerlogo
Caroline Verhoeven MEMO-I4034 26 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif II
H0 : µ = µ0 , Ha : µ < µ0
Distribution d’échantillonnage si H0 vraie
α = P(Y ≤ x)
Α
Μ0
x

eamerlogo
Caroline Verhoeven MEMO-I4034 26 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif II
H0 : µ = µ0 , Ha : µ < µ0
Distribution d’échantillonnage si H0 vraie
1-Α α = P(Y ≤ x)
Α x ≤ x ⇒ RH0
Μ0 x > x ⇒ NRH0
RH0 x NRH0

eamerlogo
Caroline Verhoeven MEMO-I4034 26 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif II
H0 : µ = µ0 , Ha : µ < µ0
Distribution d’échantillonnage si H0 vraie
1-Α α = P(Y ≤ x)
Α x ≤ x ⇒ RH0
Μ0 x > x ⇒ NRH0
RH0 x NRH0

H0 : µ = µ0 , Ha : µ 6= µ0
Distribution d’échantillonnage si H0 vraie

Μ0

eamerlogo
Caroline Verhoeven MEMO-I4034 26 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif II
H0 : µ = µ0 , Ha : µ < µ0
Distribution d’échantillonnage si H0 vraie
1-Α α = P(Y ≤ x)
Α x ≤ x ⇒ RH0
Μ0 x > x ⇒ NRH0
RH0 x NRH0

H0 : µ = µ0 , Ha : µ 6= µ0
Distribution d’échantillonnage si H0 vraie
α = P(Y ≤ x1 ou Y ≥ x2 )
Α2 Α2
Μ0
x1 x2

eamerlogo
Caroline Verhoeven MEMO-I4034 26 / 49
4. Tests d’hypothèse 1. La p-valeur

Taux significatif II
H0 : µ = µ0 , Ha : µ < µ0
Distribution d’échantillonnage si H0 vraie
1-Α α = P(Y ≤ x)
Α x ≤ x ⇒ RH0
Μ0 x > x ⇒ NRH0
RH0 x NRH0

H0 : µ = µ0 , Ha : µ 6= µ0
Distribution d’échantillonnage si H0 vraie
1-Α α = P(Y ≤ x1 ou Y ≥ x2 )
Α2 Α2 x ≤ x1 ou x ≥ x2 ⇒ RH0
Μ0 x1 < x < x2 ⇒ NRH0
RH0 NRH0
x1 x2 RH0

eamerlogo
Caroline Verhoeven MEMO-I4034 26 / 49
4. Tests d’hypothèse 1. La p-valeur

La valeur p (p-value) I

Supposons que
H0 : µ = µ 0
Ha : µ > µ 0
Nous avons x des données

Distribution d’échantillonnage si
H0 vraie

Μ0

eamerlogo
Caroline Verhoeven MEMO-I4034 27 / 49
4. Tests d’hypothèse 1. La p-valeur

La valeur p (p-value) I

Supposons que
H0 : µ = µ 0
Ha : µ > µ 0
Nous avons x des données

Distribution d’échantillonnage si
H0 vraie
x p = P(Y ≥ x)
p p ≤ α ⇒ RH0
Μ0 x

eamerlogo
Caroline Verhoeven MEMO-I4034 27 / 49
4. Tests d’hypothèse 1. La p-valeur

La valeur p (p-value) I

Supposons que
H0 : µ = µ 0
Ha : µ > µ 0
Nous avons x des données

Distribution d’échantillonnage si
x
H0 vraie
p = P(Y ≥ x)
p
p ≤ α ⇒ RH0
Μ0 x
p > α ⇒ NRH0

eamerlogo
Caroline Verhoeven MEMO-I4034 27 / 49
4. Tests d’hypothèse 1. La p-valeur

La valeur p (p-value) II

Si
H0 : µ = µ 0
Ha : µ < µ 0

Μ0

eamerlogo
Caroline Verhoeven MEMO-I4034 28 / 49
4. Tests d’hypothèse 1. La p-valeur

La valeur p (p-value) II

Si
H0 : µ = µ 0
Ha : µ < µ 0

p = P(Y < x)
x p ≤ α ⇒ RH0
p
x Μ0

eamerlogo
Caroline Verhoeven MEMO-I4034 28 / 49
4. Tests d’hypothèse 1. La p-valeur

La valeur p (p-value) II

Si
H0 : µ = µ 0
Ha : µ < µ 0

x
p = P(Y < x)
p
p ≤ α ⇒ RH0
p > α ⇒ NRH0
x Μ0

eamerlogo
Caroline Verhoeven MEMO-I4034 28 / 49
4. Tests d’hypothèse 1. La p-valeur

La valeur p (p-value) III

Si
H0 : µ = µ 0
Ha : µ 6= µ0
x > µ0 ⇒ p/2 = P(Y ≥ x)
x < µ0 ⇒ p/2 = P(Y ≤ x)
et
p ≤ α ⇒ RH0
Μ0
p > α ⇒ NRH0

eamerlogo
Caroline Verhoeven MEMO-I4034 29 / 49
4. Tests d’hypothèse 1. La p-valeur

La valeur p (p-value) III

Si
H0 : µ = µ 0
Ha : µ 6= µ0
x > µ0 ⇒ p/2 = P(Y ≥ x)
x < µ0 ⇒ p/2 = P(Y ≤ x)
x et
p2
p ≤ α ⇒ RH0
Μ0 x2
p > α ⇒ NRH0

eamerlogo
Caroline Verhoeven MEMO-I4034 29 / 49
4. Tests d’hypothèse 1. La p-valeur

La valeur p (p-value) III

Si
H0 : µ = µ 0
Ha : µ 6= µ0
x > µ0 ⇒ p/2 = P(Y ≥ x)
x x < µ0 ⇒ p/2 = P(Y ≤ x)
et
p2
p ≤ α ⇒ RH0
Μ0 x2
p > α ⇒ NRH0

eamerlogo
Caroline Verhoeven MEMO-I4034 29 / 49
4. Tests d’hypothèse 2. Etapes d’un test d’hypothèse

1 Choisir le niveau significatif α

eamerlogo
Caroline Verhoeven MEMO-I4034 30 / 49
4. Tests d’hypothèse 2. Etapes d’un test d’hypothèse

1 Choisir le niveau significatif α


2 Formuler H0 et Ha

eamerlogo
Caroline Verhoeven MEMO-I4034 30 / 49
4. Tests d’hypothèse 2. Etapes d’un test d’hypothèse

1 Choisir le niveau significatif α


2 Formuler H0 et Ha
3 Choisir le test approprié

eamerlogo
Caroline Verhoeven MEMO-I4034 30 / 49
4. Tests d’hypothèse 2. Etapes d’un test d’hypothèse

1 Choisir le niveau significatif α


2 Formuler H0 et Ha
3 Choisir le test approprié
4 Calculer la valeur p et comparer avec α

eamerlogo
Caroline Verhoeven MEMO-I4034 30 / 49
4. Tests d’hypothèse 2. Etapes d’un test d’hypothèse

1 Choisir le niveau significatif α


2 Formuler H0 et Ha
3 Choisir le test approprié
4 Calculer la valeur p et comparer avec α
5 Formuler une conclusion

eamerlogo
Caroline Verhoeven MEMO-I4034 30 / 49
4. Tests d’hypothèse 2. Etapes d’un test d’hypothèse

1 Choisir le niveau significatif α


2 Formuler H0 et Ha
3 Choisir le test approprié
4 Calculer la valeur p et comparer avec α
5 Formuler une conclusion

eamerlogo
Caroline Verhoeven MEMO-I4034 30 / 49
4. Tests d’hypothèse 3. Test t pour 2 échantillons indépendants

Test de t pour 2 échantillons indépendants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sont


égales ou non
Formulation des hypothèses :
H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2 , ou µ1 6= µ2 )

eamerlogo
Caroline Verhoeven MEMO-I4034 31 / 49
4. Tests d’hypothèse 3. Test t pour 2 échantillons indépendants

Test de t pour 2 échantillons indépendants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sont


égales ou non
Formulation des hypothèses :
H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2 , ou µ1 6= µ2 )
On considère 2 échantillons de N1 et N2 sujets

eamerlogo
Caroline Verhoeven MEMO-I4034 31 / 49
4. Tests d’hypothèse 3. Test t pour 2 échantillons indépendants

Test de t pour 2 échantillons indépendants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sont


égales ou non
Formulation des hypothèses :
H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2 , ou µ1 6= µ2 )
On considère 2 échantillons de N1 et N2 sujets
Si σ12 = σ22 , test t classique

eamerlogo
Caroline Verhoeven MEMO-I4034 31 / 49
4. Tests d’hypothèse 3. Test t pour 2 échantillons indépendants

Test de t pour 2 échantillons indépendants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sont


égales ou non
Formulation des hypothèses :
H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2 , ou µ1 6= µ2 )
On considère 2 échantillons de N1 et N2 sujets
Si σ12 = σ22 , test t classique
Si σ12 6= σ22 , test t de Welch

eamerlogo
Caroline Verhoeven MEMO-I4034 31 / 49
4. Tests d’hypothèse 3. Test t pour 2 échantillons indépendants

Test de t pour 2 échantillons indépendants : principe

But : Conclure si les moyennes µ1 et µ2 de 2 populations sont


égales ou non
Formulation des hypothèses :
H0 : µ1 = µ2 vs Ha : µ1 > µ2 (ou µ1 < µ2 , ou µ1 6= µ2 )
On considère 2 échantillons de N1 et N2 sujets
Si σ12 = σ22 , test t classique
Si σ12 6= σ22 , test t de Welch
D’abord tester si σ12 = σ22 avec Fisher

eamerlogo
Caroline Verhoeven MEMO-I4034 31 / 49
4. Tests d’hypothèse 3. Test t pour 2 échantillons indépendants

Test t pour 2 échantillons indépendants : conditions

Conditions sur les données


Les échantillons doivent être indépendants
Les échantillons ne peuvent pas être biaisés
Les donnees doivent être normalement distribuées pour les 2
échantillons ou N1 et N2 doivent être assez grands
Si la distribution n’est pas trop différente de la normale, N1 ≥ 5 et
N2 ≥ 5 est suffisant

eamerlogo
Caroline Verhoeven MEMO-I4034 32 / 49
4. Tests d’hypothèse 3. Test t pour 2 échantillons indépendants

Test t pour 2 échantillons indépendants : conditions

Conditions sur les données


Les échantillons doivent être indépendants
Les échantillons ne peuvent pas être biaisés
Les donnees doivent être normalement distribuées pour les 2
échantillons ou N1 et N2 doivent être assez grands
Si la distribution n’est pas trop différente de la normale, N1 ≥ 5 et
N2 ≥ 5 est suffisant
Il faut vérifier si σ1 = σ2 ou pas

eamerlogo
Caroline Verhoeven MEMO-I4034 32 / 49
4. Tests d’hypothèse 4. Test t pour échantillon appariés

Test t pour 2 échantillons appariés : principe

But : Tester si la moyenne reste la même ou non pour les mêmes


sujets dans des conditions différentes

eamerlogo
Caroline Verhoeven MEMO-I4034 33 / 49
4. Tests d’hypothèse 4. Test t pour échantillon appariés

Test t pour 2 échantillons appariés : Conditions

Conditions sur les données


Les sujets doivent être sélectionnés de manière indépendante
Les échantillons ne peuvent pas être biaisés
Les données doivent être normalement distribuées ou N ≥ 15

eamerlogo
Caroline Verhoeven MEMO-I4034 34 / 49
4. Tests d’hypothèse 4. Test t pour échantillon appariés

Test t en Excel
Onglet Données → Utilitaire d’analyse
Fim explicatif sur youtube :

eamerlogo
Caroline Verhoeven MEMO-I4034 35 / 49
4. Tests d’hypothèse 5. Exercices

Exercice 6
Pour beaucoup d’espèces un mâle possédant un
taux de testostérone élevé attirer plus facilement
une femelle. On peut se poser la question s’il paye
un prix pour ce taux élevé.
Une des hypothèse est que des mâles ayant un
taux de testostérone élevé ont un système immuni-
taire plus faible. Des biologise ont implanté un tube
perméable contenant de la testostérone à des ca-
rouges à épaulettes. Ils on mesuré le taux d’anti-
corps dans le sang avant et après l’implantation.
Les données se trouvent dans le fichier
oiseau.xlsx
Y-a-t-il au seuil de 5% une différence entre le taux d’anticorps avant
et après l’implantation ?

eamerlogo
Caroline Verhoeven MEMO-I4034 36 / 49
4. Tests d’hypothèse 5. Exercices

Exercice 7

Un biologiste regarde la longueur en


mm des œufs de de coucou trouvés
dans les nids de deux espèces d’oi-
seaux : le roitelet et la fauvette. Le
roitelet est plus petit que la fauvette.
Vous trouverez les données dans le
fichier coucou.xls sur le site.
Le coucou adapte-t-il la taille de ses œufs en fonction de la taille du
nid dans lequel il pond ? Autrement dit la longueur moyenne des
œufs de nids de fauvettes est-elle plus grande que celle des
roitelets, au seuil 5% ?

eamerlogo
Caroline Verhoeven MEMO-I4034 37 / 49
5. Normalité ?

Tester la normalité : Exemple I


Exemple 3
Chez le grillon des sauges (Cyphoderris
strepitans), durant l’accouplement, la fe-
melle grignote les extrémités des ailes du
mâle.
En 1999, Johnson et al. se sont demandé
si une femelle affamée aura plus facilement
tendance à s’accoupler.

eamerlogo
Caroline Verhoeven MEMO-I4034 38 / 49
5. Normalité ?

Tester la normalité : Exemple I


Exemple 3
Chez le grillon des sauges (Cyphoderris
strepitans), durant l’accouplement, la fe-
melle grignote les extrémités des ailes du
mâle.
En 1999, Johnson et al. se sont demandé
si une femelle affamée aura plus facilement
tendance à s’accoupler.
Ils ont pris 24 grillons et ont choisi un groupe
de N1 = 11 au hasard qu’ils ont affamé,
l’autre groupe de N2 = 13 a été nourri.
Après quoi chaque femelle a été mise dans
une cage avec 1 mâle, et on a enregistré le
temps d’attente pour l’accouplement

eamerlogo
Caroline Verhoeven MEMO-I4034 38 / 49
5. Normalité ?

Tester la normalité : Exemple I


Exemple 3
Chez le grillon des sauges (Cyphoderris
strepitans), durant l’accouplement, la fe-
melle grignote les extrémités des ailes du
mâle.
En 1999, Johnson et al. se sont demandé
si une femelle affamée aura plus facilement
tendance à s’accoupler.
Ils ont pris 24 grillons et ont choisi un groupe
de N1 = 11 au hasard qu’ils ont affamé,
l’autre groupe de N2 = 13 a été nourri.
Après quoi chaque femelle a été mise dans
une cage avec 1 mâle, et on a enregistré le
temps d’attente pour l’accouplement
Les mesures se trouvent sur le slide suivant
eamerlogo
Caroline Verhoeven MEMO-I4034 38 / 49
5. Normalité ?

Tester la normalité : Exemple II

Exemple 3
faim nourri
1,9 1,5
2,1 1,7
3,8 2,4
9,0 3,6
9,6 5,7
13,0 22,6
14,7 22,8
17,9 39,0
21,7 54,4
29,0 72,1
72,3 73,6
79,5
88,9

eamerlogo
Caroline Verhoeven MEMO-I4034 39 / 49
5. Normalité ?

Tester la normalité : Exemple III

Femelles affamées Femelles nourries


8 8
6

nombre
6
nombre

4 4

2 2

0 0
0 20 40 60 80 100 0 20 40 60 80 100
temps temps

eamerlogo
Caroline Verhoeven MEMO-I4034 40 / 49
5. Normalité ?

Tester la normalité avec SPSS : Le Q-Q plot I

Le Q-Q plot :
Compare les quantiles de nos données (centrées et réduites) avec
les quantiles (théoriques) de la normale standard.

eamerlogo
Caroline Verhoeven MEMO-I4034 41 / 49
5. Normalité ?

Tester la normalité avec SPSS : Le Q-Q plot I

Le Q-Q plot :
Compare les quantiles de nos données (centrées et réduites) avec
les quantiles (théoriques) de la normale standard.
Si les données sont distribuées normalement, les quantiles
observés et théoriques sont (approximativement) égaux

eamerlogo
Caroline Verhoeven MEMO-I4034 41 / 49
5. Normalité ?

Tester la normalité avec SPSS : Le Q-Q plot I

Le Q-Q plot :
Compare les quantiles de nos données (centrées et réduites) avec
les quantiles (théoriques) de la normale standard.
Si les données sont distribuées normalement, les quantiles
observés et théoriques sont (approximativement) égaux
SPSS : Analyze → Descriptive Statistics → Q-Q
plots

eamerlogo
Caroline Verhoeven MEMO-I4034 41 / 49
5. Normalité ?

Tester la normalité avec SPSS : Le test de


Shapiro-Wilk I

Le test de Shapiro-Wilk :
Test statistique qui détermine si la variable est distribuée
normalement
H0 : La variable est distribuée normalement
Ha : La variable n’est pas distribuée normalement

eamerlogo
Caroline Verhoeven MEMO-I4034 42 / 49
5. Normalité ?

Tester la normalité avec SPSS : Le test de


Shapiro-Wilk I

Le test de Shapiro-Wilk :
Test statistique qui détermine si la variable est distribuée
normalement
H0 : La variable est distribuée normalement
Ha : La variable n’est pas distribuée normalement
Si p ≤ 0, 05 RH0 , si p > 0, 05 NRH0

eamerlogo
Caroline Verhoeven MEMO-I4034 42 / 49
5. Normalité ?

Tester la normalité avec SPSS : Le test de


Shapiro-Wilk I

Le test de Shapiro-Wilk :
Test statistique qui détermine si la variable est distribuée
normalement
H0 : La variable est distribuée normalement
Ha : La variable n’est pas distribuée normalement
Si p ≤ 0, 05 RH0 , si p > 0, 05 NRH0
Il faut minimum 7 données

eamerlogo
Caroline Verhoeven MEMO-I4034 42 / 49
5. Normalité ?

Tester la normalité avec SPSS : Le test de


Shapiro-Wilk I

Le test de Shapiro-Wilk :
Test statistique qui détermine si la variable est distribuée
normalement
H0 : La variable est distribuée normalement
Ha : La variable n’est pas distribuée normalement
Si p ≤ 0, 05 RH0 , si p > 0, 05 NRH0
Il faut minimum 7 données
En SPSS : Analyze → Descriptive Satistics →
Explore

eamerlogo
Caroline Verhoeven MEMO-I4034 42 / 49
5. Normalité ?

Tester la normalité avec SPSS : Le test de


Shapiro-Wilk I

Le test de Shapiro-Wilk :
Test statistique qui détermine si la variable est distribuée
normalement
H0 : La variable est distribuée normalement
Ha : La variable n’est pas distribuée normalement
Si p ≤ 0, 05 RH0 , si p > 0, 05 NRH0
Il faut minimum 7 données
En SPSS : Analyze → Descriptive Satistics →
Explore
On peut également y trouver le test de Kolmogorov-Smirnov

eamerlogo
Caroline Verhoeven MEMO-I4034 42 / 49
5. Normalité ?

Tester la normalité avec SPSS : Le test de


Shapiro-Wilk I

Le test de Shapiro-Wilk :
Test statistique qui détermine si la variable est distribuée
normalement
H0 : La variable est distribuée normalement
Ha : La variable n’est pas distribuée normalement
Si p ≤ 0, 05 RH0 , si p > 0, 05 NRH0
Il faut minimum 7 données
En SPSS : Analyze → Descriptive Satistics →
Explore
On peut également y trouver le test de Kolmogorov-Smirnov
(moins bien)

eamerlogo
Caroline Verhoeven MEMO-I4034 42 / 49
6. Tests non paramétriques 1. Test de Mann-Withney

Test de Mann-Whitney : Principes

Egalement appelé test de rangs de Wilcoxon


Equivalent non-paramétrique du test t à 2 échantillons indépendants

eamerlogo
Caroline Verhoeven MEMO-I4034 43 / 49
6. Tests non paramétriques 1. Test de Mann-Withney

Test de Mann-Whitney : Principes

Egalement appelé test de rangs de Wilcoxon


Equivalent non-paramétrique du test t à 2 échantillons indépendants
Formulation des hypothèses
H0 : µ̃1 = µ̃2 médianes !
Ha : µ̃1 6= µ̃2

eamerlogo
Caroline Verhoeven MEMO-I4034 43 / 49
6. Tests non paramétriques 1. Test de Mann-Withney

Test de Mann-Whitney : Principes

Egalement appelé test de rangs de Wilcoxon


Equivalent non-paramétrique du test t à 2 échantillons indépendants
Formulation des hypothèses
H0 : µ̃1 = µ̃2 médianes !
Ha : µ̃1 6= µ̃2
SPSS : Analyze → Nonparametric Tests → Independent
Samples

eamerlogo
Caroline Verhoeven MEMO-I4034 43 / 49
6. Tests non paramétriques 1. Test de Mann-Withney

Test de Mann-Whitney : conditions

Il n’y a pas de conditions sur la distribution de la population


Les distributions de 2 populations doivent avoir la même forme
Les 2 échantillons sont aléatoires simples
Les 2 échantillons sont indépendants

eamerlogo
Caroline Verhoeven MEMO-I4034 44 / 49
6. Tests non paramétriques 2. Test de rangs de Wilcoxon pour 2 échantillons appariés

Wilcoxon pour 2 échantillons appariés : Principe

Egalement appelé test de Wilcoxon des rangs signés


Equivalent non-paramétrique du test t pour 2 échantillons appariés

eamerlogo
Caroline Verhoeven MEMO-I4034 45 / 49
6. Tests non paramétriques 2. Test de rangs de Wilcoxon pour 2 échantillons appariés

Wilcoxon pour 2 échantillons appariés : Principe

Egalement appelé test de Wilcoxon des rangs signés


Equivalent non-paramétrique du test t pour 2 échantillons appariés
Hypothèse sur la médiane δ̃ des différence entre les 2 mesures d’1
paire

eamerlogo
Caroline Verhoeven MEMO-I4034 45 / 49
6. Tests non paramétriques 2. Test de rangs de Wilcoxon pour 2 échantillons appariés

Wilcoxon pour 2 échantillons appariés : Principe

Egalement appelé test de Wilcoxon des rangs signés


Equivalent non-paramétrique du test t pour 2 échantillons appariés
Hypothèse sur la médiane δ̃ des différence entre les 2 mesures d’1
paire
Formulation des hypothèses
H0 : δ̃ = 0
Ha : δ̃ 6= 0

eamerlogo
Caroline Verhoeven MEMO-I4034 45 / 49
6. Tests non paramétriques 2. Test de rangs de Wilcoxon pour 2 échantillons appariés

Wilcoxon pour 2 échantillons appariés : Principe

Egalement appelé test de Wilcoxon des rangs signés


Equivalent non-paramétrique du test t pour 2 échantillons appariés
Hypothèse sur la médiane δ̃ des différence entre les 2 mesures d’1
paire
Formulation des hypothèses
H0 : δ̃ = 0
Ha : δ̃ 6= 0
SPSS : Analyze → Nonparametric Tests → Related
Samples

eamerlogo
Caroline Verhoeven MEMO-I4034 45 / 49
7. Exercices

Exercice 1

Ouvrir le fichier grillon.xls en SPSS


Faire un Q-Q plot pour la variable “nourrie” et un pour la variable
“affamée”
Faire le test de Shapiro Wilk pour la variable “nourrie” et un pour la
variable “affamée”

eamerlogo
Caroline Verhoeven MEMO-I4034 46 / 49
7. Exercices

Exercice 2

Reprendre le fichier grillon.xls


Déterminer s’il y a une différence significative entre le temps
d’accouplements de femelles nourries et affamées

eamerlogo
Caroline Verhoeven MEMO-I4034 47 / 49
7. Exercices

Exercice 3

En 1994, Régis et Millot ont étudié l’impact de la pratique du poney sur


des enfants handicapés mentaux.
Ils ont mesuré le nombre de comportements de stéréotypie (répétition
des mêmes geste ou mots) de 6 enfants lors de travaux manuels à leur
institut médico-pédagogique et lors de la pratique du poney.
Ouvrir le fichier hippother.xls en SPSS
Déterminer s’il y a une différence de comportement significative
entre l’activité manuelle et l’activité avec les poneys

eamerlogo
Caroline Verhoeven MEMO-I4034 48 / 49
7. Exercices

Exercice 6

Les gens faisant beaucoup de sport ont la réputation d’être plus attirants
d’un point de vue sexuel. Pour vérifier cela, on a compté le nombre de
partenaires sexuelles qu’on eu des étudiants en sport et des étudiants
en bio, sur une année.
Ouvrir le fichier sport vs bio.xls
Tester si le nombre de partenaires sexuelles est une variable
distribuée normalement pour les étudiants en bio et les étudiants en
sport
Déterminer s’il y a une différence différence significative entre le
nombre de partenaires sexuelles des étudiants en sport et en bio.

eamerlogo
Caroline Verhoeven MEMO-I4034 49 / 49

Vous aimerez peut-être aussi