Master1 Cours8
Master1 Cours8
Tests non-paramétriques
2ème partie
Sommaire
1 Contexte du test
Conditions d’application
4 Comparaisons multiples
5 Application
Introduction
Nous observons, de manière indépendante, une variable
aléatoire X de loi continue, sur k > 3 populations, ou sur une
population divisée en k > 3 sous-populations.
Nous supposons ainsi que nous disposons de k échantillons
aléatoires indépendants (X1,1 , . . . , X1,n1 ), . . . , (Xk ,1 , . . . , Xk ,nk )
et de k > 3 séries d’observations (x1,1 , . . . , x1,n1 ) pour la
première, . . . , (xk ,1 , . . . , xk ,nk ) pour la dernière. Nous notons
Li (X ) la loi de la variable aléatoire X sur la (sous-)population
d’ordre i avec 1 6 i 6 k .
Sans faire d’hypothèses spécifiques, le test de
Kruskal-Wallis ne permet pas de tester l’égalité des
moyennes ni celle des médianes.
Hypothèses du test
Le test de Kruskal-Wallis est utilisé pour tester les hypothèses
suivantes :
H0 : L1 (X ) = · · · = Li (X ) = · · · = Lk (X )
contre
H1 : Les lois L1 (X ), . . . , Lk (X ) ne sont pas toutes identiques.
Sommaire
1 Contexte du test
Conditions d’application
4 Comparaisons multiples
5 Application
Statistique de test
Calculons :
1 le rang Ri,j de Xi,j parmi les n• valeurs ;
2 puis la somme des rangs associée à chaque échantillon :
ni
X
Ri,• = Ri,j ;
j=1
Propriétés
Lorsque l’hypothèse nulle H0 est vraie, la variable aléatoire
KWn• a les trois propriétés suivantes.
1 Pour i = 1, . . . , k , Wi = ni Ri,• est la statistique de Wilcoxon
qui compare le i−ème traitement aux k − 1 autres
traitements.
Sous l’hypothèse nulle H0 , nous en déduisons que
E (Wi ) = ni (n• + 1)/2 et Var (Wi ) = ni (n• − ni )(n• + 1)/12.
Ainsi par conséquent, nous avons :
k
1 X (Wi − E (Wi ))2
KWn• = (n• − ni ) ·
n• Var (Wi )
i=1
Propriétés (suite)
2 (Suite) Nous calculons alors l’espérance et la variance de
KWn• sous l’hypothèse nulle H0 :
E (KWn• ) = k − 1,
2 3k 2 − 6k + n• (2k 2 − 6k + 1)
Var (KWn• ) = 2(k − 1) −
5n• (n• + 1)
k
6X 1
− ·
5 ni
i=1
Sommaire
1 Contexte du test
Conditions d’application
4 Comparaisons multiples
5 Application
KWn•
KWn?• = .
T
1− 3
n• − n•
Sommaire
1 Contexte du test
Conditions d’application
4 Comparaisons multiples
5 Application
Test de Steel-Dwass-Critchlow-Fligner
Wni ,ni 0 est la statistique de Wilcoxon qui compare le i−ème
traitement au i 0 −ème traitement.
Les observations des deux groupes i et i 0 sont ordonnées puis
regroupées en h classes d’ex æquo Cj , 1 6 j 6 h.
Notons dj le nombre d’ex æquo de la classe Cj et
mi,i 0 = ni + ni 0 .
Remarque
Il s’agit d’une application des inégalités de Bonferroni. Cette
procédure est plus puissante que la précédente.
Il est également possible d’utiliser une approche séquentielle
comme la procédure de Holm-Bonferroni (test de Dunn) ou de
Holm-Sidak.
Remarque
Il s’agit d’une procédure analogue à celle de Tukey-Kramer
dans le cas paramétrique et valide asymptotiquement. Elle est
généralement plus puissante que les deux approches
précédentes.
Sommaire
1 Contexte du test
Conditions d’application
4 Comparaisons multiples
5 Application
Application
Des forestiers ont réalisé des plantations d’arbres en trois
endroits.
Plusieurs années plus tard, ils souhaitent savoir si la hauteur
moyenne des arbres est identique dans les trois forêts.
Chacune des forêts constitue une population et dans chacune
d’entre elles, un échantillon d’arbres est tiré au sort. Puis la
hauteur de chaque arbre est mesurée en mètres. Le tableau
ci-après donne les valeurs des mesures de hauteur ainsi que
les moyennes et les variances corrigées estimées dans chacun
des groupes.
Données
Forêt 1 Forêt 2 Forêt 3
23,4 18,9 22,5
Données 24,4 21,1 22,9
expérimentales 24,6 21,1 23,7
(en mètres) 24,9 22,1 24,0
25,0 22,5 24,0
26,2 23,5 24,5
Moyennes 24,750 21,533 23,600
Variances corrigées 0,831 2,487 0,568
Représentation graphique
26
@
24
@
22
@
20
1 2 3
Statistique du test
Nous sommes en présence d’ex æquo, nous devons donc
utiliser la statistique de test KWn?• à la place de la statistique de
test KWn• .
Nous calculons la valeur de KWn?• sur l’échantillon :
KWn?• (obs) = 11, 51.
Remarque
La valeur de KWn• (obs) est égale à 11, 48. Nous remarquons
la différence apportée par la correction pour prendre en compte
les ex æquo.
Résultats
Kruskal-Wallis: Multiple Comparisons
Rang
Group N Médiane moyen Z
Forêt_1 6 24,75 14,5 2,81
Forêt_2 6 21,60 4,1 -3,04
Forêt_3 6 23,85 9,9 0,23
Global 18 9,5
B H = 11,48 DL = 2 P = 0,003
H = 11,51 DL = 2 P = 0,003
(ajusté pour les nombres de même grandeur)
Frédéric Bertrand & Myriam Maumy Tests non-paramétriques
Contexte du test
Absence d’ex æquo dans les observations
Présence d’ex æquo dans les observations
Comparaisons multiples
Application
Résultats
Kruskal-Wallis: All Pairwise Comparisons
----------------------------------------
Comparisons: 3
Ties: 3
Family Alpha: 0,05
Bonferroni Individual Alpha: 0,017
Bonferroni Z-value (2-sided): 2,394
----------------------------------------
Résultats
Standardized Absolute Mean Rank Differences
|Rbar(i)-Rbar(j)| / Stdev
1. Table of Z-values
Forêt_1 0,00000 * *
Forêt_2 3,37961 0,00000 *
Forêt_3 1,48703 1,89258 0
-------------------------------------------
Résultats
Adjusted for Ties in the Data
1. Table of Z-values
Forêt_1 0,00000 * *
Forêt_2 3,38486 0,00000 *
Forêt_3 1,48934 1,89552 0
2. Table of P-values
Forêt_1 1,00000 * *
Forêt_2 0,00071 1,00000 *
Forêt_3 0,13640 0,05802 1
-------------------------------------------
Résultats
Sign Confidence Intervals controlled at a
family error rate of 0,05
Intervalle de
Confiance confiance
N Médiane atteinte Inférieur Supérieur Pos.
F_1 6 24,75 0,7813 24,40 25,00 2
0,9095 24,10 25,36 NLI
0,9688 23,40 26,20 1
Résultats
F_2 6 21,60 0,7813 21,10 22,50 2
0,9095 20,44 22,80 NLI
0,9688 18,90 23,50 1
F_3 6 23,85 0,7813 22,90 24,00 2
0,9095 22,78 24,15 NLI
0,9688 22,50 24,50 1
Résultats
Kruskal-Wallis: Conclusions
26
Forêt_1 Forêt_2
25
24
Forêt_3
23
Données
22
21
20
Forêt_2 Forêt_3
19
18
Forêt_1 Forêt_2 Forêt_3 -Z 0 Z
Normal (0,1) Distribution
Family Alpha: 0,05
Bonferroni Individual Alpha: 0,017 |Bonferroni Z-value|: 2,394
Résultats
Kruskal-Wallis: Multiple Comparisons
Rang
Group N Médiane moyen Z
Forêt_1 6 24,75 14,5 2,81
Forêt_2 6 21,60 4,1 -3,04
Forêt_3 6 23,85 9,9 0,23
Global 18 9,5
B H = 11,48 DL = 2 P = 0,003
H = 11,51 DL = 2 P = 0,003
(ajusté pour les nombres de même grandeur)
Frédéric Bertrand & Myriam Maumy Tests non-paramétriques
Contexte du test
Absence d’ex æquo dans les observations
Présence d’ex æquo dans les observations
Comparaisons multiples
Application
Résultats
Kruskal-Wallis: Comparisons to a Control
----------------------------------------
Comparisons: 2
Ties: 3
Family Alpha: 0,05
Bonferroni Individual Alpha: 0,025
Bonferroni Z-value (2-sided): 2,241
----------------------------------------
Résultats
Standardized Absolute Mean Rank Differences
|Rbar(i)-Rbar(Control)| / Stdev
Z-value
Forêt_1 1,48703
Forêt_2 1,89258
-------------------------------------------
Résultats
Adjusted for Ties in the Data
-------------------------------------------
Résultats
Sign Confidence Intervals controlled at a
family error rate of 0,05
Intervalle de
Confiance confiance
N Médiane atteinte Inférieur Supérieur Pos.
F_1 6 24,7 0,7813 24,40 25,00 2
0,8870 24,19 25,25 NLI
0,9688 23,40 26,20 1
Résultats
F_2 6 21,60 0,7813 21,10 22,50 2
0,8870 20,65 22,71 NLI
0,9688 18,90 23,50 1
F_3 6 23,85 0,7813 22,90 24,00 2
0,8870 22,82 24,10 NLI
0,9688 22,50 24,50 1
26
25
Forêt_1
24
23
22
21
20 Forêt_2
19
18
Forêt_1 Forêt_2 Forêt_3
-Z 0 Z
Family Alpha: 0,05
N (0,1) Distribution
Bonferroni Individual Alpha: 0,025
Control Group: Forêt_3 |Bonferroni Z-value|: 2,241