0% ont trouvé ce document utile (0 vote)

124 vues24 pages

Comparaison de distributions statistiques

Ce document décrit différentes techniques statistiques pour comparer des distributions entre deux échantillons, notamment le test de Wilcoxon-Mann-Whitney pour des échantillons indépendants. Il explique le contexte d'utilisation de ces tests ainsi que les hypothèses nulles et alternatives.

Transféré par

Lilou Ṧṹpeř Maboull

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

124 vues24 pages

Comparaison de distributions statistiques

Transféré par

Lilou Ṧṹpeř Maboull

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

U.F.R.

SPSE – Master 1
PMP STA 21 Méthodes statistiques pour l’analyse des données en psychologie 2009-10

Chapitre 2
Comparaisons de deux distributions
Il s’agit de comparer les distributions d’un même caractère dans deux populations, observées sur deux
échantillons. Les techniques statistiques utilisées dépendent du type de caractère étudié, qualitatif ou quan-
titatif, des tailles des échantillons et de s’ils sont indépendants ou non (appariés).
Pour un caractère qualitatif (à deux modalités ou plus) et des tailles d’échantillons suffisamment grandes
(> 30) on utilise des tests du khi-deux (ou khi-carré χ2 ) qui consistent à comparer les proportions des
différentes modalités.
Pour un caractère quantitatif, lorsque les distributions sont supposées normales, il suffit pour les comparer,
de comparer leurs moyennes (indice de position ou de valeur centrale) et donc de procéder à un test de com-
paraison de deux moyennes basé sur la loi de Student, ou lorsque les tailles des échantillons sont suffisamment
grandes (> 30) d’utiliser des tests basés sur les approximations normales des moyennes empiriques.
En revanche lorsque les distributions ne peuvent pas être considérées comme normales, et en général pour de
petites tailles d’échantillons (< 30), il est préférable d’utiliser des tests dits non-paramétriques (distribution
free) qui ne font pas d’hypothèse sur la forme des distributions et consistent à comparer l’ensemble des
distributions (les fonctions de répartition) ou les médianes (indice de position ou de valeur centrale) de ces
distributions.
La plupart de ces techniques se généralisent à la comparaison de plus de deux distributions.

1. Variables qualitatives
Tests de comparaison de proportions
– Deux échantillons indépendants : Test du khi-deux d’homogénéité (cf Annexe, section B)
généralisation à plus de 2 distributions : même test
– Deux échantillons appariés : Test du khi-deux de Mac-Nemar
généralisation à plus de 2 distributions : Test Q de Cochran

2. Variables quantitatives
* Lois normales : tests paramétriques, test de comparaison de deux moyennes (cf Annexe, section A)
– Deux échantillons indépendants : Test de Student (cf Annexe, section A.1)
généralisation à plus de 2 distributions (moyennes) : Test d’ANOVA à un facteur
– Deux échantillons appariés : Test de Student (cf Annexe, section A.3)
généralisation à plus de 2 distributions (moyennes) : Test d’ANOVA à un facteur avec mesures
répétées
* Grands échantillons : tests paramétriques, test de comparaison de deux moyennes (cf Annexe, section
A)
– Deux échantillons indépendants : Test normal (cf Annexe, section A.2)
généralisation à plus de 2 distributions (moyennes) : Test d’ANOVA à un facteur
– Deux échantillons appariés : Test normal (cf Annexe, section A.3)
généralisation à plus de 2 distributions (moyennes) : Test d’ANOVA à un facteur avec mesures
répétées
Conditions d’application des tests paramétriques (cf Annexe, section A.4) :
– adéquation à la loi normale : Test de Kolmogorov-Smirnov, Test de Lilliefors, Test de Shapiro-
Wilk, droite de Henry
– égalité de deux variances : Test de Fisher (rapport des variances)
– homogénéité des variances : Test de Bartlett (généralisation du test de Fisher), Test de Levene,
Test de Brown-Forsythe, Test de Hartley, Test de Cochran
* Petits échantillons : tests non-paramétriques
– Deux échantillons indépendants : Test de Wilcoxon Mann-Whitney (cf chapitre 2, section 2)
généralisation à plus de 2 distributions : Test d’ANOVA à un facteur de Kruskal et Wallis
– Deux échantillons appariés : Test des signes (cf chapitre 2, section 3.3), Test de Wilcoxon ou
test des signes et rangs (cf chapitre 2, section 3.4)
généralisation à plus de 2 distributions : Test d’ANOVA de Friedman, coefficient de concordance
de Kendall

1
Tests non paramétriques
1 Tests non paramétriques basés sur les rangs
Les tests non paramétriques de (Wilcoxon) Mann-Whitney et de Wilcoxon (ou ”signes et rangs”) sont
basés sur les rangs des observations, par ordre croissant (de la plus petite à la plus grande valeur).
Ces tests nécessitent seulement de savoir ordonner les individus les uns par rapport aux autres (on n’a pas
besoin des valeurs précises de la variable étudiée).
Rang : place occupée par une valeur dans la suite ordonnée en ordre croissant (de la plus petite à la plus
grande valeur).
- exemple pour n = 6 observations de la variable X :
xi 30 12 41 27 20 32
les rangs vont de 1 à 6.
rang(xi ) 4 1 6 3 2 5
Propriétés des rangs
Dans un échantillon de n valeurs, les rangs vont de 1 à n.
n × (n + 1)
La somme S de tous les rangs ne dépend que de n : S=
2
- calcul de S pour n = 6 :
S = 1 +2 +3 +4 +5 +6
6×7
S = 6 +5 +4 +3 +2 +1 donc S = 2 = 21.
2 S = 7 +7 +7 +7 +7 +7 =6×7
- même raisonnement pour n :
S = 1 +2 ... +n
S = n +(n − 1) . . . +1 n × (n + 1)
donc S =
2S = n+1 +(n + 1) . . . +(n + 1) 2
= n(n + 1)
Traitement des ex aequo
En cas d’ex aequo, on attribue le rang moyen c’est à dire la moyenne des rangs qu’ils auraient eu s’ils avaient
été consécutifs.
- exemple : ex aequo sur les rangs 1 et 2 :
xi 14 22 14 37
rang moyen 1+2 2 = 1, 5 S = 4×52 = 10
rang(xi ) 1,5 3 1,5 4
- exemple : ex aequo
sur les rangs 2 et 3 : rang moyen 2+32 = 2, 5
et sur les rangs 4, 5 et 6 : rang moyen 4+5+6
3 =5
xi 12 21 37 21 37 37 6×7
S= 2 = 21
rang(xi ) 1 2,5 5 2,5 5 5

2
2 Comparaison de deux distributions sur deux échantillons indépendants
Test de Wilcoxon-Mann-Whitney
2.1 Contexte
On étudie deux populations P1 et P2 et deux variables qui représentent le même caractère, quantitatif de loi
continue. Elles sont notées : X dans P1 et Y dans P2 .
On veut comparer les distributions de X et de Y .
On dispose de deux échantillons indépendants ; cas le plus habituel : ils ont été obtenus par tirage au
sort dans deux populations différentes.
Exemple type d’utilisation de ce test : comparaison de l’efficacité de deux traitements
P1 ={personnes sous traitement A} X désigne le résultat avec le traitement A, et
P2 ={personnes sous traitement B} Y représente le résultat avec le traitement B.

Exemple 1
Pour étudier l’efficacité d’un traitement contre la claustrophobie, 13 personnes atteintes de claustro-
phobie ont été réparties au hasard dans 2 groupes de 6 et 7 personnes.
Les personnes du premier groupe ont reçu un placebo et celles du second groupe le traitement. Après
15 jours de traitement, on a évalué le degré de claustrophobie des 13 personnes
placebo 5,2 5,3 5,6 6,3 7,7 8,1
traitement 4,6 4,9 5,1 5,5 6,1 6,5 7,2
Peut-on au risque α = 5%, accepter l’hypothèse que le traitement est efficace ?
Contexte :
P1 = {personnes claustrophobes sous placebo}
P2 = {personnes claustrophobes sous traitement}
X = degré de claustrophobie sous placebo, dans P1
Y = degré de claustrophobie sous traitement, dans P2
Les 2 variables mesurent le même caractère et sont quantitatives continues.

2.2 Hypothèses de test et risque

Sous l’hypothèse nulle H0 , les variables X et Y sont distribués de la même manière (les deux traitements
ont la même efficacité)
H0 : X et Y ont la même loi ou H0 : X ≡ Y
pour l’hypothèse alternative H1 , selon l’hypothèse de recherche envisagée,
soit l’un des deux traitements est plus efficace que l’autre, alternative unilatérale
les valeurs de X peuvent être globalement supérieures à celles de Y
c-à-d que la distribution de X est à droite de celle de Y H1 : X Y
ou bien les valeurs de X peuvent être globalement inférieures à celles de Y
c-à-d que la distribution de X est à gauche de celle de Y H1 : X ≺ Y
soit les traitements ont des efficacités différentes, alternative bilatérale
les valeurs de X sont globalement différentes de celles de Y
X et Y n’ont pas la même loi (sans orientation) H1 : X 6≡ Y

Exemple 1
Hypothèses et risque α = 5%
Sous H0 on suppose que traitement et placebo ont la même efficacité, les degrés de claustrophobie sous
placebo X et sous traitement Y sont globalement identiques.
Le traitement est efficace si les degrés de claustrophobie sous traitement Y sont inférieurs aux degrés
sous placebo X : Y ≺ X ou X Y .

H0 : les valeurs de X sont globalement égales à celles de Y
D’où les hypothèses à tester
H1 : les valeurs de X sont globalement supérieures à celles de Y

3

H0 : X et Y ont la même distribution
ou
H1 : la distribution de X est à droite de celle de Y

H0 : X ≡ Y
Le test s’écrit de manière équivalente test unilatéral, au risque α = 5%
H1 : X Y

2.3 Observations
On dispose de 2 échantillons tirés au hasard de manière indépendante dans les 2 populations. On note :
E1 l’échantillon de taille n1 issu de P1 et xi les mesures de E1 ,
E2 l’échantillon de taille n2 issu de P2 et yi les mesures de E2
n représente la taille totale des 2 échantillons : n = n1 + n2

Exemple 1
On dispose de 2 échantillons indépendants :
E1 de taille n1 = 6 issu de P1 et E2 de taille n2 = 7 issu de P2 .
Au total, nous avons n = 6 + 7 = 13 individus.
E1 est appelé ”groupe témoin” et E2 ”groupe expérimental”.

2.4 Analyse descriptive des données

Histogrammes et boı̂tes à moustaches comparatifs des données observées de X et de Y permettent de situer
les deux distributions l’une par rapport à l’autre et de comparer visuellement indices de position (médiane)
et de dispersion (intervalle inter-quartiles).

Exemple 1
Les médianes observées de X et de Y valent resp. mX = 5, 95 (milieu entre 5, 6 et 6, 3) et mY = 5, 5
(valeur observée de Y de rang 4) : elles sont proches (pour l’ensemble des 2 groupes la médiane observée
vaut m = 5, 6 valeur observée de (X, Y ) de rang 7).
Cependant la dispersion observée de X est plus grande que celle de Y et la distribution observée de X
est décalée à droite par rapport à celle de Y (valeurs de X globalement plus grandes que celles de Y ) :
les degrés de claustrophobie observés sont globalement plus élevés sous placebo que sous traitement
(Figure 1). Il faut néanmoins faire un test pour confirmer ou infirmer la présence de ce décalage dans
les populations.

Fig. 1 – Boı̂tes à moustaches de X et de Y

4
2.5 Statistiques de test
On définit tout d’abord les statistiques de Wilcoxon pour 2 échantillons indépendants notées Wx et Wy puis
les statistiques de Mann-Whitney notées Ux et Uy qui en découlent, d’utilisation plus simple.
• Principe
Sous H0 : X et Y ont la même loi, ou H0 : X ≡ Y
les deux échantillons ne forment qu’un seul échantillon tiré d’une seule population.
Si on range par ordre croissant l’ensemble des n valeurs (les 2 échantillons confondus) les rangs de X et
de Y sont équivalents.

Exemple 1
Ici, n = 13 : les rangs dans l’interclassement de X et de Y, notés rang(x, y) vont de 1 à 13.

xi 5,2 5,3 5,6 6,3 7,7 8,1

rang(x, y) 4 5 7 9 12 13 wx = 50
yi 4,6 4,9 5,1 5,5 6,1 6,5 7,2
rang(x, y) 1 2 3 6 8 10 11 wy = 41

Remarques :
- En cas d’ex aequo, on leur attribue leur rang moyen.
- On ne supprime jamais d’observations dans ce test.
• Statistiques de Wilcoxon Wx et Wy pour 2 échantillons indépendants
Wx = somme des rangs de X et Wy = somme des rangs de Y
Wx et Wy sont des variables quantitatives discrètes.
n(n + 1)
Propriété : Wx + Wy =
2
en effet, cette somme correspond à celle de tous les rangs des individus, du 1er au nème , elle vaut donc
1 + 2 + . . . + n = n(n+1)
2 .

Exemple 1
Statistiques de Wilcoxon Wx et Wy
Les valeurs observées sont
pour Wx : wx = 4 + 5 + 7 + 9 + 12 + 13 = 50
pour Wy : wy = 1 + 2 + 3 + 6 + 8 + 10 = 41
vérification : n = 13, donc n×(n+1)
2 = 13×14
2 = 91.
n(n+1)
Nous avons wx + wy = 50 + 41 = 91 donc wx + wy = 2 .
Remarque :
les valeurs observées de Wx et Wy sont généralement des valeurs entières, sauf en présence d’ex aequo.
• Domaines de variation de Wx et Wy
– Pour la statistique Wx
Au minimum : les n1 valeurs de X ont les rangs les plus faibles, donc de 1 à n1 (les xi prennent les n1
premières places) alors : wx = 1 + 2 + . . . + n1 = n1 (n21 +1) .
Au maximum : à l’inverse, les n1 valeurs de X ont les rangs les plus élevés, et par conséquent, les yi
occupent les rangs les plus faibles donc de 1 à n2 (les yi prennent les n2 premières places et les xi les n1
dernières places) alors : wy = n2 (n22 +1) et au maximum wx = n(n+1)
2 − n2 (n22 +1) .

n1 (n1 + 1) n(n + 1) n2 (n2 + 1)
Domaine de variation de Wx : , ..., −
2 2 2

Exemple 1
Pour n1 = 6 et n2 = 7 le minimum de Wx vaut n1 (n21 +1) = 6×7 2 = 21 et le maximum de Wx est
13×14
2 − 7×8
2 = 91 − 28 = 63.
Wx varie de 21 à 63 : son domaine de variation (définition) est {21, 22, . . . , 63}.

5
– Pour la statistique Wy
Un
n raisonnement identique pour les mesures
o yi nous conduit au domaine de variation de Wy :
n2 (n2 +1) n(n+1) n1 (n1 +1)
2 , ..., 2 − 2

Exemple 1
Pour n1 = 6 et n2 = 7 le minimum de Wy vaut n2 (n22 +1) = 7×8 2 = 28 et le maximum
n(n+1) n1 (n1 +1)
2 − 2 = 91 − 21 = 70 donc W y varie de 28 à 70.

Lorsque n1 6= n2 les statistiques Wx et Wy ont des domaines de variations différents.

Sous H0 , elles n’ont donc pas tout à fait la même distribution et ne jouent pas un rôle symétrique, d’où
des difficultés d’utilisation.
Pour simplifier nous allons utiliser les statistiques de Mann-Whitney.
• Statistiques de Mann-Whitney Ux et Uy
On se base sur Wx et Wy mais on fait en sorte que les domaines de variation de Ux et Uy commencent à
0. On définit :

n1 × (n1 + 1) n2 × (n2 + 1)
Ux = Wx − et Uy = Wy −
2 2
Ux et Uy sont des variables quantitatives discrètes.

Exemple 1
Statistiques de Mann-Whitney Ux et Uy
Les valeurs observées sont
pour Ux : ux = 50 − 6×7 2 = 50 − 21 = 29
pour Uy : uy = 41 − 7×8 2 = 41 − 28 = 13
Le domaine de variation de Ux va de 21 − 21 = 0 jusqu’à 63 − 21 = 42 qui est en fait égal à
n1 × n2 = 6 × 7 = 42.
Le domaine de variation de Uy va de 28−28 = 0 jusqu’à 70−28 = 42 qui est aussi égal à n1 ×n2 = 42.
• Domaine de variation de Ux et Uy
Ux et Uy ont le même domaine de variation : {0, 1, . . . , n1 × n2 }
– Ux et Wx varient dans le même sens, de même Uy et Wy .
– Ux et Uy varient en sens contraire de manière à ce que leur somme soit toujours constante, égale à :
Ux + Uy = n1 × n2
Exemple 1
Vérification : ux + uy = 29 + 13 = 42 et n1 × n2 = 6 × 7 = 42, donc ux + uy = n1 × n2 .
• Interprétation de Ux et Uy
Ux est le nombre de fois où une valeur de X est supérieure à une valeur de Y , ou le nombre de fois où un
rang de X est supérieur à un rang de Y . De même pour Uy .

2.6 Lois des statistiques de Mann-Whitney sous H0 et niveau de signification

du test
Sous H0 les statistiques Ux et Uy ont la même distribution, notée U , définie sur {0, 1, . . . , n1 ×n2 } symétrique
n1 × n2
autour de la moyenne (et milieu) .
2
• Loi exacte des statistiques de Mann-Whitney sous H0
Pour des échantillons de petites tailles (n1 ≤ 8 et n2 ≤ 8) les probabilités cumulées PH0 [U ≤ u] sont
données dans les tables de Mann-Whitney.
Puisque ux +uy = n1 ×n2 on déduit que ux et uy sont symétriques par rapport au milieu sur la distribution
sym
de U et donc que : PH0 [Ux ≥ ux ] = PH0 [Uy ≤ uy ] = PH0 [U ≤ uy ].
On pourra ainsi trouver le niveau de signification αobs ou p-valeur, soit en lisant directement les tables,
soit en utilisant au préalable la symétrie de la distribution de U .

6
Exemple 1
Loi exacte des statistiques de Mann-Whitney sous H0
Sous H0 : X ≡ Y
– Ux et Uy ont la même distribution, définie sur {0, 1, . . . , 6 × 7 = 42} symétrique autour de la
moyenne (et milieu) n1 ×n2
2
= 422 = 21, représentée par son diagramme en bâtons (Figure 2).
– les xi et les yi sont mélangés de manière équilibrée donc les rangs faibles (forts) apparaissent en
quantités similaires dans les 2 échantillons.
Alors les valeurs de Ux et Uy sont proches, situées près du centre de la distribution.

Fig. 2 – Diagramme en bâtons de la loi de U sous H0 pour n1 = 6 et n2 = 7

Région critique et niveau de signification du test

Sous H1 : X Y les valeurs de X occupent des rangs élevés ce qui implique de grandes valeurs de
Wx et donc de Ux , et à l’opposé de petites valeurs de Wy et donc de Uy . La région critique du test
RC est à droite de la distribution de Ux (à gauche pour Uy ).
Si on choisit de travailler avec Ux :
sym
αobs = PH0 [Ux ≥ ux ] = PH0 [Ux ≥ 29] = PH0 [U ≤ uy ] = PH0 [U ≤ 13] = 0, 147
(cf table de Mann-Whitney)
• Région critique et niveau de signification du test
Test unilatéral
sym
H1 : X Y RC à droite pour Ux (à gauche pour Uy ) αobs = PH0 [Ux ≥ ux ] = PH0 [U ≤ uy ]
H1 : X ≺ Y RC à gauche pour Ux αobs = PH0 [Ux ≤ ux ]
Test bilatéral
H1 : X 6≡ Y RC aux 2 extrémités de Ux (ou de Uy ) αobs = 2 × PH0 [U ≤ umin ]
où umin = min(ux , uy )

• Approximation normale des statistiques de Mann-Whitney sous H0

Pour des tailles d’échantillons suffisamment grandes (n1 > 8 ou n2 > 8) la distribution de U sous H0 est
n1 × n2 n1 × n2 × (n + 1)
approximée par une loi normale de moyenne µ(U ) = et de variance var(U ) =
2 12
où n = n1 + n2 .
U − µ(U ) U − n1 ×n 2
2
approx
La variable centrée et réduite : Z = p =q ∼ N (0, 1)
var(U ) n 1 ×n 2 ×(n+1)
12
ux −µ(U ) uy −µ(U )
Si on choisit de travailler avec Ux la valeur observée de Z : zobs = √ =− √
var(U ) var(U )

• Région critique et niveau de signification du test

Si on choisit de travailler avec Ux (dans le cas contraire, pour Uy le signe de Z et les inégalités sont inversés)

7
Test unilatéral
H1 : X Y RC à droite pour Ux et pour Z αobs = PH0 [Ux ≥ ux ] ' PH0 [Z ≥ zobs ]
H1 : X ≺ Y RC à gauche pour Ux et pour Z αobs = PH0 [Ux ≤ ux ] ' PH0 [Z ≤ zobs ]
Test bilatéral
H1 : X 6≡ Y RC aux 2 extrémités de Ux et de Z αobs ' 2 × PH0 [Z ≥ |zobs |]

Exemple 1
Approximation normale sous H0
n1 n2 6×4
Si on approxime la loi de U par la loi normale de moyenne µ(U ) = 2 = 2 = 21 et de variance
var(U ) = n1 n212
(n+1)
= 6×7×14
12 = 49
U −µ(U ) approx
la statistique de test Z = √ ∼ N (0, 1)
var(U )
(mais cette approximation est peu justifiée ici puisque n1 et n2 ≤ 8).
On choisit de travailler avec Ux donc la valeur observée de Z :
ux −µ(U ) 29−21 8
zobs = √ = √
49
= 7 ' 1, 142857
var(U )
Région critique et niveau de signification du test
αobs ' P [Z ≥ 1, 142857] = 1 − P [Z ≤ 1, 142857] = 1 − 0, 873451 = 0, 126549
(cf Table de la loi N (0, 1)).

2.7 Décision et conclusion

• Règle de décision basée sur αobs
- si αobs > α on conserve H0 (on ne valide pas H1 ) au seuil α et au risque de 2de espèce β
inconnu
- si αobs ≤ α on rejette H0 en faveur de H1 (on valide H1 ) au risque α et au niveau de
signification (p-valeur ) αobs
• Conclusion
Exemple 1
Décision et conclusion
loi exacte : αobs = 14, 7% > α = 5% donc on conserve H0 et on ne valide pas H1 au risque β
approximation normale : αobs ' 12, 7% > α = 5% donc on conserve H0 au risque β.
NB : dans ce cas l’approximation normale étant peu justifiée puisque n1 et n2 ≤ 8, on préférera donc
conclure à partir de la décision découlant de la loi exacte.
On ne peut pas conclure à l’efficacité du traitement contre la claustrophobie, au seuil α = 5% et au
risque β inconnu.
Remarque : le test de Student de comparaison de deux moyennes pour deux échantillons indépendants
sous les conditions de normalité de X et de Y (tests de normalité non significatifs) et d’égalité
des variances (tests d’égalité non significatifs) donnerait tobs = 1, 09499 et αobs = PH0 [T ≥ tobs ] =
PH0 [T ≥ 1, 09499] = 0, 158459 ' 15, 8% d’après la loi de Student T11 et induirait la même conclusion.
Cependant, étant donné les petites tailles d’échantillons, les tests vérifiant la validité des conditions
d’application du test de Student sont peu puissants pour détecter un écart aux conditions, leurs résultats
sont peu fiables ; il est donc préférable de se référer au test non paramétrique présenté ici.

2.8 Remarques
Les variables X et Y étant continues, la probabilité de trouver deux valeurs identiques (ex aequo) est nulle.
En pratique, ils sont produits par les arrondis ou les erreurs de mesure :
- les formules (donc les tables) changent en présence d’ex aequo. Il est important de les utiliser uniquement
s’il n’y a que ”peu” d’ex aequo.
- des corrections pour prendre en compte les ex aequo sont disponibles et programmées dans les logiciels.

8
Résultats obtenus avec STATISTICA
STATISTICA calcule les valeurs observées des statistiques de Wilcoxon Wx et Wy et de la statistique
Umin = min(Ux , Uy ).
STATISTICA ne calcule que les p − valeurs bilatérales ; pour obtenir le niveau de signification d’un test
unilatéral il faut diviser la valeur donnée par 2.
STATISTICA calcule systématiquement les p − valeurs bilatérales exacte et basée sur l’approximation nor-
male avec correction de continuité sur la variable Ux , c’est à dire :
 u −µ(U )−0,5
 x√ si ux − µ(U ) > 0
c var(U )
zobs = −µ(U )+0,5
 ux√ si ux − µ(U ) < 0
var(U )

sans tenir compte des tailles des échantillons. Pour de petites tailles (n1 ou n2 ≤ 8) il est préférable d’in-
terpréter la p − valeur exacte, à moins qu’il y ait beaucoup d’ex aequo.
Cette correction de continuité consiste à diminuer la valeur obtenue avec l’approximation normale afin d’aug-
menter le niveau de signification pour rendre le test plus conservateur.
En présence d’ex aequo, on utilise la valeur de l’approximation normale corrigée pour en tenir compte (Z
ajusté) calculée par STATISTICA, et sa p − valeur associée.

Exemple 2
Les niveaux de compétences manuelles des élèves de deux écoles maternelles A et B ont été mesurées pour 6
élèves de l’école A et 8 de l’école B, tirés au sort parmi les élèves de grande section de chaque école

école A 20 12 0 2 6 92
école B 31 14 15 10 21 19 28 22

Peut-on, au risque α = 10%, accepter l’hypothèse que les niveaux de compétences manuelles sont différents
dans les deux écoles ?
Contexte
P1 = {élèves de l’école A} X = niveau de compétences manuelles dans P1
P2 = {élèves de l’école B} Y = niveau de compétences manuelles dans P2
Les 2 variables mesurent le même caractère et sont quantitatives continues.
Hypothèses
de test et risque
H0 : X et Y ont la même distribution H0 : X ≡ Y
ou test bilatéral, α = 10%
H1 : les X sont globalement différents des Y H1 : X 6≡ Y
Observations
On dispose de 2 échantillons indépendants :
E1 de taille n1 = 6 issu de P1 et E2 de taille n2 = 8 issu de P2 . Au total, n = 6 + 8 = 14.
Statistiques de test
Statistiques de Wilcoxon Wx et Wy pour 2 échantillons indépendants.
On range par ordre croissant l’ensemble des n = 14 valeurs : les rangs vont de 1 à 14.

xi 20 12 0 2 6 92
rang(x, y) 9 5 1 2 3 14 wx = 34
yi 31 14 15 10 21 19 28 22
rang(x, y) 13 6 7 4 10 8 12 11 wy = 71

Wx = somme des rangs de X et Wy = somme des rangs de Y .

Les valeurs observées sont :
wx = 9 + 5 + 1 + 2 + 3 + 14 = 34
wy = 13 + 6 + 7 + 4 + 10 + 8 + 12 + 11 = 71
vérification : la somme wx + wy = 34 + 71 = 105.
Or n = 14, donc n(n+1)2 = 14×15
2 = 105 d’où wx + wy = n(n+1)
2 .
Statistiques de Mann-Whitney Ux et Uy
Les valeurs observées sont :
n1 ×(n1 +1) 6×7
ux = wx − 2 = 34 − 2 = 34 − 21 = 13
n2 ×(n2 +1) 8×9
uy = wy − 2 = 71 − 2 = 71 − 36 = 35

9
Ux et de Uy variables quantitatives discrètes définies sur : {0, 1, . . . , n1 × n2 = 6 × 8 = 48}
vérification : ux + uy = 13 + 35 = 48 est égale à n1 × n2 = 6 × 8 = 48, donc ux + uy = n1 × n2 .
Lois sous H0 , région critique et niveau de signification du test
– loi exacte
Sous H0 , Ux et Uy ont la même loi définie sur {0, 1, . . . , 48} et symétrique de moyenne n12n2 = 24.
Région critique et niveau de signification
Sous H1 : X 6≡ Y RC aux deux extrémités du domaine de Ux (ou de Uy ).
αobs = 2 × PH0 [U ≤ umin ] = 2 × PH0 [U ≤ 13] = 2 × 0, 091 = 0, 182 = 18, 2% (table de Mann-Whitney)
– approximation normale
Sous H0 , Ux et Uy suivent la même loi, approximativement normale
de moyenne µ(U ) = n12n2 = 24 et de variance var(U ) = 6×8×15 12 = 60
U√−24
et la variable centrée réduite Z = 60 suit approximativement une loi normale N (0, 1)
(approximation peu justifiée ici puisque n1 et n2 ≤ 8).
Valeur observée de Z
ux −µ(U )
On choisit de travailler avec Ux : zobs = √ = 13−24√
60
= −1, 420094
var(U )
Région critique et niveau de signification
Sous H1 : X 6≡ Y RC aux deux extrémités du domaine de Ux (ou de Uy ) et donc de Z.
αobs = 2 × PH0 [Z ≥ |zobs |] = 2 × P [Z ≥ | − 1, 420094|] = 2 × (1 − P [Z ≤ 1, 420094])
= 2 × (1 − 0, 922210) = 2 × 0, 077790 = 0, 15558 ' 15, 6% (cf table de la loi N (0, 1))
Décision et conclusion
loi exacte : αobs = 18, 2% > α = 10% donc on conserve H0 , on ne valide pas H1 au seuil α = 10% et au
risque de 2de espèce β.
approximation normale : αobs = 15, 6% < α = 10% même décision que précédemment.
NB : dans ce cas l’approximation normale étant peu justifiée puisque n1 et n2 ≤ 8, on préférera donc conclure
à partir de la décision découlant de la loi exacte.
Les niveaux de compétences manuelles ne sont pas différents dans les deux écoles, au seuil α = 10% et au
risque de 2de espèce β inconnu.
Remarque : le test de Student de comparaison de deux moyennes pour deux échantillons indépendants n’est
pas applicable sur ces données puisque la condition de normalité de X n’est pas vérifiée (tests de normalité
Lilliefors (p < 0, 05) et Shapiro-Wilk (p = 0, 004) significatifs à 5%) et celle d’égalité des variances ne l’est
pas non plus (test du rapport des variances significatif à 5% (p = 0, 000539)).

Exemple 3
On a noté les poids de naissance de bébés (en kg) suivant si la mère avait reçu des soins prénataux depuis le
1er trimestre de grossesse (expérimental) ou le 3ème (en routine) pour resp. 10 et 8 bébés
3ème trimestre 1,68 3,83 3,11 2,76 1,70 2,79 1,40 2,66
1er trimestre 3,05 2,77 2,94 3,38 4,90 2,81 2,80 3,21 3,08 2,95
Peut-on, au risque α = 5%, accepter l’hypothèse que les soins prénataux précoces sont bénéfiques sur le poids
de naissance du bébé ?
Contexte
P1 = {bébés dont les mères ont des soins prénataux au 3ème trimestre de grossesse}
P2 = {bébés dont les mères ont des soins prénataux au 1er trimestre de grossesse}
X = poids de naissance du bébé dans P1 Y = poids de naissance du bébé dans P2
Les 2 variables mesurent le même caractère et sont quantitatives continues.
Hypothèses
de test et risque
H0 : X et Y ont la même distribution H0 : X ≡ Y
ou test unilatéral, α = 5%
H1 : les X sont globalement inférieurs aux Y H1 : X ≺ Y
Observations
On dispose de 2 échantillons indépendants :
E1 ”groupe témoin” de taille n1 = 8 issu de P1 et E2 ”groupe expérimental” de taille n2 = 10 issu de P2 d’où
n = n1 + n2 = 18.

10
Statistiques de test
Statistiques de Wilcoxon puis de Mann-Whitney pour 2 échantillons indépendants.
On calcule les rangs des individus dans l’ensemble des n = 18 individus : les rangs vont de 1 à 18.
3ème trimestre 1,68 3,83 3,11 2,76 1,70 2,79 1,40 2,66
rang(x, y) 2 17 14 5 3 7 1 4 wx = 53
1er trimestre 3,05 2,77 2,94 3,38 4,90 2,81 2,80 3,21 3,08 2,95
rang(x, y) 12 6 10 16 18 9 8 15 13 11 wy = 118
On définit les statistiques de Wilcoxon :
Wx = somme des rangs de X et Wy = somme des rangs de Y
dont les valeurs observées sont
wx = 2 + 17 + 14 + 5 + 3 + 7 + 1 + 4 = 53
wy = 12 + 6 + 10 + 16 + 18 + 9 + 8 + 15 + 13 + 11 = 118
n(n+1) n(n+1) 18×19
vérification : wx + wy = 2 puisque wx + wy = 53 + 118 = 171 et 2 = 2 = 171.
On définit les statistiques de Mann-Whitney : Ux et Uy
dont les valeurs observées sont
ux = wx − n1 (n21 +1) = 53 − 8×9 2 = 53 − 36 = 17
uy = wy − n2 (n22 +1) = 118 − 10×11 2 = 118 − 55 = 63
vérification : ux + uy = n1 × n2 puisque ux + uy = 17 + 63 = 80 et n1 n2 = 8 × 10 = 80.
Ux et Uy quantitatives discrètes sur {0, . . . , 80}.
Lois sous H0 région critique et niveau de signification du test
– loi exacte
Sous H0 , Ux et Uy ont la même loi définie sur {0, 1, . . . , 80} et symétrique de moyenne n12n2 = 40.
Région critique et niveau de signification
Sous H1 : X ≺ Y les valeurs de X occupent des rangs faibles d’où de petites valeurs de Wx et de Ux (à
l’opposé, de grandes valeurs de Wy et de Uy ) ; RC se situe à gauche du domaine de Ux (à droite pour Uy ).
On choisit de travailler avec Ux .
αobs = PH0 [Ux ≤ ux ] = PH0 [U ≤ 17] = 0, 0217 = 2, 17% (table de Mann-Whitney)
– approximation normale
Sous H0 , Ux et Uy suivent la même loi, approximativement normale
de moyenne µ(U ) = n12n2 = 40 et de variance var(U ) = 8×10×19 12 = 95
et la variable centrée réduite Z = U√−40
95
suit approximativement une loi normale N (0, 1).
Valeur observée de Z
ux −µ(U )
On choisit de travailler avec Ux : zobs = √ = 17−40
√
95
= −2, 04
var(U )
Région critique et niveau de signification
Sous H1 : X ≺ Y RC se situe à gauche du domaine de Ux et donc de Z.
αobs = P [Z ≤ zobs ] = P [Z ≤ −2, 04] = 1 − P [Z ≤ 2, 04] = 1 − 0, 9793 = 0, 0207 (Table de la loi N (0, 1))
Décision et conclusion
loi exacte : αobs = 2, 17% < α = 5% donc on rejette H0 en faveur de H1 (on valide H1 ) au risque α = 5%.
approximation normale : α = 5% > αobs = 2, 07% donc on rejette H0 en faveur de H1 (on valide H1 ) au
risque α = 5% (même conclusion).
Les soins prénataux donnés au 1er trimestre de grossesse augmentent le poids de naissance du bébé, au risque
α = 5% et au niveau de signification αobs = 2, 17%.
NB : dans ce cas l’approximation normale peut être justifiée puisque n2 = 10 > 8, mais quand on dispose
de la p − valeur calculée à partir de la loi exacte on préférera conclure à partir de la décision en découlant.
On peut remarquer qu’ici les deux p − valeurs sont très proches et conduisent à la même décision.
En présence d’ex aequo, l’approximation normale avec correction pour les ex aequo peut donner des résultats
plus fiables que la loi exacte qui n’en tient pas compte.
Remarque : le test de Student de comparaison de deux moyennes pour deux échantillons indépendants n’est
pas applicable sur ces données puisque la condition de normalité de Y n’est pas vérifiée (tests de normalité
Lilliefors (p < 0, 05) et Shapiro-Wilk (p = 0, 0002) significatifs à 5%).

11
3 Comparaison de deux distributions pour deux échantillons appariés
3.1 Contexte
Il s’agit d’un test portant sur deux échantillons appariés (ou pairés, ou appareillés) de deux variables X et
Y représentant le même caractère quantitatif continu,
soit issus d’une même population P, et dans ce cas les mesures de X et de Y sont faites sur les mêmes
individus,
soit issus d’une population P composée de paires d’individus (2 individus) aussi semblables que possible :
- personnes de la même famille (paires de jumeaux, (père, fils), ...)
- ou bien, on définit des ”variables d’appariement” (sexe, âge, durée ou gravité de la maladie, ...).
Afin de comparer les distributions de X et Y , on cherche à contrôler les facteurs ”connus” et ”inconnus” qui
jouent un rôle dans la différence entre les variables X et Y , autres que le facteur étudié, qui pourraient être
des ”facteurs de confusion”.

Exemples types d’utilisation de ce test :

∗ comparaison de type avant-après (un traitement, une thérapie, un régime, ...)
Pour chaque sujet, X représente le résultat avant traitement et Y le résultat après traitement.
Pour détecter un changement dû à ce traitement :
en hypothèse nulle, on suppose qu’il n’y a pas de changement, les valeurs de X sont globalement égales
à celles de Y H0 : X ≡ Y
en alternative,
il y a une amélioration, alternative unilatérale
les valeurs de X sont globalement plus élevées que celles de Y H1 : X Y
ou plus faibles H1 : X ≺ Y
ou une modification (sans préciser l’orientation) alternative bilatérale
les valeurs de X sont globalement différentes de celles de Y H1 : X 6≡ Y
La ”paire” est constituée par un seul individu et l’appariement est idéal : le sujet est pris comme son
”propre témoin” (ou ”contrôle”). Ceci permet d’augmenter la puissance en diminuant la variabilité des
résultats : en effet, la variabilité des résultats d’un même individu (”intra-sujet”) est plus faible que
celle d’individus différents (”inter-sujets”).
∗ comparaison de l’efficacité de deux traitements
X désigne le résultat avec le traitement A et Y le résultat avec le traitement B.
Pour comparer l’efficacité des traitements :
en hypothèse nulle, on suppose que les deux traitements ont la même efficacité H0 : X ≡ Y
en alternative, selon l’hypothèse de recherche envisagée
un traitement est plus performant que l’autre, alternative unilatérale
H1 : X Y ou H1 : X ≺ Y
ou ils ont simplement des efficacités différentes (sans orientation) alternative bilatérale
H1 : X 6≡ Y
Si le sujet est son propre témoin, chaque sujet reçoit le traitement A et le traitement B dans un ordre
qui peut-être aléatoire, ou prédéterminé si l’on veut étudier un ”effet ordre” du traitement.
L’appariement permet de contrôler les facteurs connus (ou inconnus) pour influencer l’évolution de la
maladie, autres que le traitement (âge, intensité, durée, ...).
Il permet de limiter le ”biais de confusion” qui consisterait à conclure à l’existence d’une différence
d’efficacité entre les traitements alors qu’elle n’est due qu’à un (ou des) facteur(s) de confusion.

On dispose donc de deux échantillons appariés (en paires d’individus ”jumeaux”) de taille n0 .
Principe pour des échantillons appariés :
on travaille avec la variable ”différence” notée D = X − Y (ou Y − X).
Le test de comparaison de 2 distributions sur 2 échantillons appariés est le test de comparaison de leur
différence à 0.

12
On peut utiliser :
- soit le test du signe (ou des signes) sur la différence D en comparant la médiane de la différence D
à la valeur théorique M0 = 0,
- soit le test des signes et rangs de Wilcoxon sur la différence D (D supposée symétrique).
Comme leur nom l’indique, ces deux tests utilisent les signes de la différence D.

3.2 Observations
On dispose de 2 échantillons appariés de même taille n0 issu de P.
On note :
E1 l’échantillon de taille n0 et (x1 , . . . , xn0 ) les mesures de X,
E2 l’échantillon de taille n0 et (y1 , . . . , yn0 ) les mesures de Y .

• On calcule la variable différence pour chaque paire di = xi − yi (ou yi − xi ) :

suppression des individus pour lesquels la valeur de la différence D est nulle
on dispose d’un échantillon E de taille n de D et (d1 , . . . , dn ) représentent les valeurs observées non nulles
de D.
• On construit la variable auxiliaire ”signe” notée signe(D) qualitative à 2 modalités : ’+’ ou ’−’

signe(di ) = + si di = xi − yi > 0 ou si xi > yi
signe(di ) = − si di = xi − yi < 0 ou si xi < yi

 proportion de ’+’
de paramètre p = proportion de valeurs de D > 0 inconnue dans P.
proportion de valeurs de X > Y


Exemple 4
On cherche à savoir si dans les familles, les aı̂nés ont tendance à être plus indépendants que leurs cadets.
Lors d’une étude on a procédé à l’évaluation sur une échelle d’indépendance en 25 points, de 9 aı̂nés
et du frère ou de la sœur qui suit directement chacun des aı̂nés. On a obtenu les résultats suivants
score de l’aı̂né 8 12 14 15 5 13 18 20 17
score du puı̂né 9 10 14 12 9 8 12 10 10
Peut-on répondre à la question, au risque α = 0, 05 ?
Contexte
P = {paire=(aı̂né, puı̂né) d’une même famille}
X = score d’indépendance de l’aı̂né Y = score d’indépendance du puı̂né
Les 2 variables mesurent le même caractère (score d’indépendance) et sont quantitatives continues.
Hypothèses et risque α = 5%
On souhaite tester si les aı̂nés sont plus indépendants, donc si les scores X des aı̂nés sont globalement
supérieurs aux scores Y des puı̂nés, noté X Y .

H0 : X ≡ Y
ce qui s’écrit alternative unilatérale, au risque α = 5%.
H1 : X Y
On définit la variable auxiliaire ”différence” : D = X − Y .
C’est une variable quantitative continue de médiane M inconnue.
Observations
On dispose de deux échantillons appariés de taille n0 = 9. On calcule les différences di = xi − yi . Une
différence est nulle, donc on enlève cette valeur de l’échantillon et on continue à travailler avec n = 8.
On dispose d’un échantillon E de la variable différence D de taille n = 8.
On construit ensuite la variable auxiliaire ”signe” : signe(D) qualitative dichotomique ’+’ ou ’−’ pour
les n = 8 valeurs observées de D non nulles.
score de l’aı̂né xi 8 12 14 15 5 13 18 20 17
score du puı̂né yi 9 10 14 12 9 8 12 10 10
différence di = xi − yi −1 2 0 3 −4 5 6 10 7
signe(di ) − + \/ + − + + + +

13
Analyse descriptive des données
La médiane observée de la différence des scores m = 3 (valeur observée de rang 5 car n0 = 9) : est-elle
significativement supérieure à 0 ?
Par ailleurs la boı̂te à moustache des valeurs observées de D indique une distribution symétrique :
min(D) = −4, max(D) = 10, 1er quartile = 0 et 3ème quartile = 6.

3.3 Test du signe pour deux échantillons appariés

Ce test de comparaison d’une médiane M inconnue à une valeur théorique M0 s’applique à une variable
quantitative continue. Nous utilisons ici un cas particulier de ce test pour une valeur théorique nulle M0 = 0
et pour une variable représentant la différence D entre deux autres variables, notées précédemment X et Y .
Le nom du test vient du fait qu’il utilise des signes ’+’ et ’−’ au lieu de mesures quantitatives.
Il peut être appliqué à des problèmes où les mesures quantitatives ne sont pas possibles (ou disponibles),
mais où l’on sait seulement s’il y a augmentation ou diminution.

3.3.1 Hypothèses de test et risque

On considère la variable différence D = X − Y quantitative continue de médiane M , inconnue dans la
population P.
Les hypothèses se traduisent sur la médiane de la variable D.
L’hypothèse nulle H0 : X ≡ Y se traduit par H0 : M =0
l’alternative bilatérale H1 : X 6≡ Y s’écrit H1 : M 6= 0
ou les alternatives unilatérales H1 : X Y devient H1 : M >0 à droite,
et H1 : X ≺ Y H1 : M <0 à gauche.
On est donc ramené à un test de comparaison d’une médiane (de la différence) à la valeur théorique (de
référence) 0, au même risque α.
Remarque : M 6= MX − MY où MX est la médiane de X et MY celle de Y .

Exemple 4
Hypothèses de test et risque
Les hypothèses du test de H0 : X ≡ Y contre H1 : X Y se traduisent sur la médiane M de la
différence
des scores d’indépendance, par
H0 : M = 0
test unilatéral droit, au risque α = 5%.
H1 : M > 0
En effet, H1 signifie que les valeurs de X sont globalement supérieures aux valeurs de Y , donc que les
différences D = X − Y sont globalement positives et ainsi la médiane de la variable D est positive.

• Principe du test du signe

On utilise la variable auxiliaire ”signe” pour traduire les hypothèses précédentes sur la proportion p de
signes ’+’ inconnue dans la population.
Sous H0 : M = 0 la médiane de D étant nulle, il y aura globalement autant ’+’ que de ’−’
donc H0 : M = 0 se traduit par H0 : p = 12
En revanche sous H1 : M > 0 (la vraie médiane M est > 0) du fait de ce décalage on enregistre plus de
valeurs de D positives, donc plus de la moitié de signes ’+’
d’où H1 : M > 0 se traduit par H1 : p > 21
H0 : p = 12

On s’est ramené à un test de comparaison d’une proportion à la valeur théorique p0 = 12
 H1 : p > 21
 proportion de ’+’
où p = proportion de valeurs de D > 0 test unilatéral droit, au risque α.
proportion de valeurs de X > Y


Un raisonnement similaire permet de déduire que

sous H1 : M < 0 (la vraie médiane M est < 0) du fait de ce décalage on enregistre plus de valeurs ’−’ et
moins de valeurs ’+’
donc H1 : M < 0 se traduit par H1 : p < 21 unilatérale gauche,
et que H1 : M 6= 0 se traduit par H1 : p 6= 12 bilatérale.

14
Ainsi, le test du signe est le test de comparaison de la proportion p de signes ’+’, à 12 (= 0, 5 = 50%).
Test unilatéral droit
1

H0 : X ≡ Y H0 : M = 0 H0 : p = 2
test de ou de ou de 1
H1 : X Y H1 : M > 0 H1 : p > 2
Test unilatéral gauche
1

H0 : X ≡ Y H0 : M = 0 H0 : p = 2
test de ou de ou de 1
H1 : X ≺ Y H1 : M < 0 H1 : p < 2
Test bilatéral
1

H0 : X ≡ Y H0 : M = 0 H0 : p = 2
test de ou de ou de 1
H1 : X 6≡ Y H1 : M 6= 0 H1 : p 6= 2

Exemple 4
On considère la variable signe(D) qualitative à 2 modalités ’+’ et ’−’
de paramètre p = proportion de signes ’+’.
Les
hypothèses se traduisent pour le test du signe par :
H0 : p = 12 les proportions de signes ’+’ et ’−’ sont égales
H1 : p > 21 la proportion de signes ’+’ est plus élevée que celle des signes ’−’
test unilatéral droit, au risque α = 5%.

3.3.2 Statistique de test et loi sous H0

On considère comme statistique de test
Sn = effectif empirique de signes ’+’
= nombre de signes ’+’ pour l’ensemble des échantillons de taille n
variable quantitative discrète, définie sur le domaine {0, 1, 2, . . . , n}.
La valeur observée de Sn : 
sobs = nombre de signes ’+’ 
= nombre de valeurs di > 0 observés sur l’échantillon.
= nombre de valeurs xi > yi


Exemple 4
Statistique de test
Sn = nombre de signes ’+’ pour tous les échantillons de taille n = 8
variable quantitative discrète définie sur {0, 1, . . . , n = 8}.
Sur l’échantillon E de taille n = 8 on observe sobs = 6 signes ’+’ pour les différences di .

• Loi exacte de la statistique de test sous H0 : loi binomiale

Sous H0 : p = 12 il y a autant de signes ’+’ que de signes ’−’,
1
la statistique de test Sn suit une loi binomiale de paramètres n et 2 notée B(n, 12 ) symétrique, de moyenne
(et milieu) n2 .
Pour de petites valeurs de n (n ≤ 30), les tables de lois binomiales donnent les probabilités cumulées
PH0 [Sn ≤ sobs ] qui permettront de calculer le niveau de signification αobs du test.
sym
La symétrie de Sn sous H0 permet de déduire que : PH0 [Sn ≥ sobs ] = PH0 [Sn ≤ n − sobs ].

Exemple 4
Loi exacte de la statistique de test sous H0
Sous H0 : X ≡ Y ou H0 : p = 21 la statistique de test Sn suit une loi binomiale B(8, 21 ) définie
sur {0, 1, . . . , n = 8} symétrique autour de sa moyenne (et milieu) n2 = 28 = 4 représentée par son
diagramme en bâtons (Figure 3).
Sous H0 , les xi et les yi sont mélangés de manière équilibrée donc les différences ’+’ et ’−’ apparaissent
en quantités similaires dans l’échantillon.
La valeur de Sn est alors située près du centre de la distribution.
Région critique et niveau de signification du test
Sous H1 : X Y les valeurs de X sont plus élevés que celles de Y ce qui implique plus de valeurs
positives de D = X − Y donc plus de la moitié de signes ’+’ (ici, plus de 4), c’est à dire une valeur

15
Fig. 3 – Diagramme en bâtons de la loi de Sn sous H0 pour n = 8 : B(8, 21 )

de Sn à l’extrémité droite de sa distribution sous H0 . La région critique du test RC est à droite de

la distribution de Sn .
Le niveau de signification du test unilatéral droit
sym
αobs = PH0 [Sn ≥ sobs ] = PH0 [Sn ≥ 6] = PH0 [Sn ≤ n − sobs ] = PH0 [Sn ≤ 8 − 6]
= PH0 [Sn ≤ 2] = 0, 1445 (cf table de la loi binomiale B(8, 21 )).
• Région critique et niveau de signification du test
Test unilatéral
1
H1 : X Y H1 : M > 0 H1 : p > 2 RC à droite de Sn αobs = PH0 [Sn ≥ sobs ]
sym
= PH0 [Sn ≤ n − sobs ]
1
H1 : X ≺ Y H1 : M < 0 H1 : p < 2 RC à gauche de Sn αobs = PH0 [Sn ≤ sobs ]
Test bilatéral
1
H1 : X 6≡ Y H1 : M 6= 0 H1 : p 6= 2 RC aux 2 extrémités de Sn αobs = 2 × PH0 [Sn ≤ smin ]
où smin = min(sobs , n − sobs )

• Approximation normale de la loi binomiale sous H0

Pour une taille d’échantillon suffisamment grande (n ≥ 30) la distribution de Sn sous H0 suit approxima-
n n
tivement une loi normale de moyenne µ(Sn ) = et de variance var(Sn ) = .
2 4
Sn − µ(Sn ) Sn − n2 approx
On en déduit que la variable centrée et réduite : Z = p = pn ∼ N (0, 1).
var(Sn ) 4
obs −µ(Sn ) s −n
La valeur observée de Z : zobs = s√ = obs√
n
2
var(Sn ) 2

• Région critique et niveau de signification du test

Test unilatéral
H1 : X Y RC à droite pour Sn et pour Z αobs = PH0 [Sn ≥ sobs ] ' PH0 [Z ≥ zobs ]
H1 : X ≺ Y RC à gauche pour Sn et pour Z αobs = PH0 [Sn ≤ sobs ] ' PH0 [Z ≤ zobs ]
Test bilatéral
H1 : X 6≡ Y RC aux 2 extrémités de Sn et de Z αobs ' 2 × PH0 [Z ≥ |zobs |]

Exemple 4
Approximation normale sous H0
Si on approxime la loi de Sn par la loi normale de moyenne µ(Sn ) = n2 = 4 et de variance var(Sn ) =
Sn −µ(Sn ) n −4
approx
n 8
4 = 4 = 2 ; la statistique de test Z =
√ = S√ 2
∼ N (0, 1)
var(Sn )
(approximation peu justifiée car n = 8 < 30).

16
obs −µ(Sn )
La valeur observée de Z : zobs = s√ = 6−4
√
2
' 1, 4142
var(Sn )
Région critique et niveau de signification du test
αobs ' P [Z ≥ 1, 4142] = 1 − P [Z ≤ 1, 4142] = 1 − 0, 92135 = 0, 07865 (cf Table de la loi N (0, 1))

3.3.3 Décision et conclusion

• Règle de décision basée sur αobs
• Conclusion

Exemple 4
Décision et conclusion
loi exacte : αobs = 14, 45% > α = 5% donc on conserve H0 au seuil α = 5% avec un risque β.
approximation normale : αobs = 7, 87% > α = 5%, décision identique à la précédente.
NB : dans ce cas l’approximation normale étant peu justifiée puisque n < 30, on préférera donc conclure
à partir de la décision découlant de la loi exacte.
On ne peut pas conclure au seuil 5% que les aı̂nés ont tendance à être plus indépendants que leurs
cadets, au risque de seconde espèce β inconnu.

Résultats obtenus avec STATISTICA

STATISTICA calcule :
– la valeur observée n−snobs exprimé en % c’est à dire le pourcentage de signes négatifs ou de valeurs xi < yi
parmi les n valeurs xi 6= yi
– la valeur observée de l’approximation normale de Sn avec correction de continuité
c
zobs = |sobs√−µ(Sn )|−0,5 et la p − valeur bilatérale correspondante.
var(Sn )
C’est une correction de continuité classique permettant d’éviter de trop sous estimer la vraie p − valeur en
utilisant l’approximation normale au lieu de test binomial exact : elle diminue la valeur de la statistique
de test afin de rendre le test plus conservateur (diminution de la p − valeur par rapport à celle obtenue
avec zobs ).
STATISTICA ne calcule que la p−valeur bilatérale ; pour obtenir le niveau de signification d’un test unilatéral
il faut diviser la valeur obtenue par 2.
STATISTICA ne propose pas le test binomial exact mais fait systématiquement l’approximation normale
avec correction de continuité quelle que soit la taille de l’échantillon.

Exemple 5
Huit adolescentes de 13 à 18 ans présentant une carence en fer sans anémie ont reçu un traitement
pour améliorer leur fonction cognitive. On mesure cette fonction par le score au test d’apprentissage
verbal de Hopkin avant et après traitement. On obtient les valeurs du tableau suivant

score avant traitement 5 3, 1 2, 8 1, 5 1, 8 0, 5 3, 7 6

17
Elle représente la mesure de l’effet du traitement sur le score de Hopkin (la fonction cognitive).
Observations
On dispose de deux échantillons appariés de taille n0 = 8. On calcule les différences di = xi − yi . Une
différence est nulle, donc on enlève cette valeur de l’échantillon et on continue à travailler avec n = 7.
On dispose d’un échantillon E de la variable différence D de taille n = 7.
On construit la variable signe(D) qualitative à 2 modalités ’+’ et ’−’ pour les n = 7 valeurs non nulles
de D.
xi 5 3,1 2,8 1,5 1,8 0,5 3,7 6
yi 3,1 6 6,7 1,5 3,5 5,5 4,3 5,7
di 1,9 −2, 9 −3, 9 0 −1, 7 −5 −0, 6 0,3
signe(di ) + − − /\ − − − +
Analyse descriptive des données
La médiane observée de D m = −1, 15 (milieu des valeurs observées de rang 4 et 5 car n0 = 8, donc
entre −1, 7 et −0, 6) est légèrement négative : est-elle significativement inférieure à 0 ?
Par ailleurs la boı̂te à moustache des valeurs observées de D indique une distribution plutôt symétrique :
min(D) = −5, max(D) = 1, 9, 1er quartile = −3, 4 et 3ème quartile = 0, 15.
Test du signe
Hypothèses de test et risque
Sur
la médiane M de la différence des scores de Hopkin, le test se traduit alors par
H0 : M = 0
test unilatéral gauche, au risque α = 10%.
H1 : M < 0
En effet, H1 signifie que les valeurs de X sont globalement inférieures aux valeurs de Y , donc les
différences D = X − Y sont globalement négatives et ainsi la médiane de la variable D est négative.
On considère la variable signe(D) variable qualitative à 2 modalités ’+’ et ’−’ de paramètre p =
proportion de signes ’+’. Les hypothèses se traduisent pour le test du signe par :
H0 : p = 21 les proportions de signes ’+’ et ’−’ sont égales

H1 : p < 21 la proportion de signes ’+’ est plus faible que celle des signes ’−’
test unilatéral gauche, au risque α = 10%.
Statistique de test
Sn = nombre de signes ’+’ sur les échantillons de taille n = 7
variable quantitative discrète définie sur {0, 1, . . . , n = 7}.
Sur l’échantillon E de taille n = 7 on observe sobs = 2 signes ’+’ pour les différences di .
Lois sous H0 , région critique et niveau de signification du test
- loi exacte
Sous H0 , Sn quantitative discrète sur {0, 1, . . . , 7} suit une loi binomiale B(7, 21 ) de moyenne 3,5.
Sous H1 : M < 0 ou p < 21 les valeurs de D sont en majorité négatives, on s’attend à observer
moins de la moitié de signes ’+’ (moins de 3,5), donc Sn est faible ; RC se situe à gauche du domaine
de Sn
αobs = PH0 [Sn ≤ sobs ] = PH0 [Sn ≤ 2] = 0, 2266 (Table de la loi binomiale B(7, 12 )).
- approximation normale
Sous H0 , Sn suit approximativement une loi normale de moyenne 27 = 3, 5 et de variance 74 = 1, 75
−3,5
donc la variable centrée réduite Z = S√n1,75 suit approximativement une loi N (0, 1) (approximation
peu valable car n = 7 << 30).
La valeur observée de Z : zobs = sobs √ −3,5 = √ 2−3,5
= −1, 1339
1,75 1,75

Sous H1 : M < 0 les valeurs de D sont en majorité négatives, donc Sn est faible ; RC est à gauche
du domaine de Sn et de Z, d’où
αobs ' PH0 [Z ≤ zobs ] = PH0 [Z ≤ −1, 1339] = 1 − PH0 [Z ≤ 1, 1339] = 1 − 0, 87158 = 0, 12842
(Table de la loi N (0, 1)).
Décision et conclusion
loi exacte : α = 10% < αobs = 22, 66% donc on conserve H0 au risque β inconnu.
approximation normale : α = 10% < αobs = 12, 84% décision identique à la précédente, bien que peu
justifiée.
On ne peut pas conclure à l’efficacité du traitement sur l’amélioration de la fonction cognitive des
adolescentes présentant une carence en fer, au seuil α = 10% et au risque β inconnu.

18
3.4 Test de Wilcoxon (signes et rangs) sur deux échantillons appariés
Ce test de comparaison de deux distributions s’applique à une variable quantitative continue et symétrique.
Nous utilisons ici un cas particulier de ce test pour deux échantillons appariés, c’est à dire pour une variable
représentant la différence D entre deux autres variables, notées précédemment X et Y , qui sera supposée
symétrique.
Le test du signe ne tient compte que d’une petite partie de l’information contenue dans les données puisqu’il
ne tient compte que du signe (’+’ ou ’−’) de la différence. Pour obtenir un test plus puissant (moindre erreur
β de seconde espèce) on veut prendre en compte non seulement les signes des différences, mais également
les amplitudes de ces différences. Le test des ”signes et rangs” attribue un poids plus important à une
différence de plus grande amplitude.
Ce test nécessite seulement de connaı̂tre les signes (sens) des différences et de savoir les ordonner les unes
par rapport aux autres (ne nécessite pas d’avoir des valeurs quantitatives précises).

3.4.1 Observations
On dispose d’un échantillon E de la variable ”différence” D = X − Y de taille n.
Comme pour le test du signe, on supprime les individus dont les différences sont nulles, c’est à dire pour
lesquels xi = yi .
On calcule successivement pour chaque individu :
– la différence di = xi − yi
– le signe de la différence + ou − (pas de 0)
– la valeur absolue de la différence |di |
– le rang de la valeur absolue rang(|di |)

3.4.2 Statistiques de test et loi sous H0

Statistiques de Wilcoxon V + et V − pour 2 échantillons appariés
V + = somme des rang(|di |) associés aux différences positives (de signe ’+’)
V − = somme des rangs(|di |) associés aux différences négatives (de signe ’−’)
Remarque : en cas d’ex aequo, on leur attribue leur rang moyen.

Exemple 4
Contexte
Il est identique à celui du test du signe (cf section 3.1) en supposant la symétrie de la variable
”différence” D.
Observations
On dispose d’un échantillon E de D = X −Y de taille n = 8 pour lequel on a calculé les signes signe(di ).
Il faut calculer également les valeurs absolues des différences |di | et les rangs de ces valeurs absolues
rang(|di |) de 1 à n = 8.
score de l’aı̂né xi 8 12 14 15 5 13 18 20 17
score du puı̂né yi 9 10 14 12 9 8 12 10 10
différence di = xi − yi −1 2 0 3 −4 5 6 10 7
signe(di ) − + \/ + − + + + +
|di | 1 2 0 3 4 5 6 10 7
rang(|di |) 1 2 \/ 3 4 5 6 8 7
On vérifie que les rangs vont de 1 à 8.
Statistiques de Wilcoxon
Les valeurs observées des statistiques de Wilcoxon
pour V + : v + = 2 + 3 + 5 + 6 + 7 + 8 = 31
pour V − : v − = 1 + 4 = 5

19
Domaine de variation de V + et de V −

Exemple 4
Les rangs vont de 1 à 8.
Au minimum : aucune différence positive donnerait v + = 0
8×9
Au maximum : toutes les différences sont positives, alors v + = 1+2+3+4+5+6+7+8 = S = 2 = 36
Donc V + varie dans l’ensemble {0, 1, 2, . . . , 36}.
Dans le cas général, pour un échantillon
de taille n,
les rangs vont de 1 à n.
n(n + 1)
Domaine de variation de V + : 0, 1, 2, . . . ,
2
V + variable quantitative discrète.
n(n + 1)
De même V − est une variable quantitative discrète sur 0, 1, 2, . . . ,
2
+ − n(n + 1)
Propriété : V + V =
2
en effet, cette somme est celle de tous les rangs de 1 à n.
V + et V − jouent un rôle symétrique :
n(n+1)
quand V + augmente, V − diminue et vice-versa, leur somme restant constante, égale à 2 .

Exemple 4
Ici : v + = 31, v − = 5 donc v + + v − = 36. Or n = 6 donc n(n+1)
2 = 8×9
2 = 36.
+ −
V et V sont quantitatives discrètes et varient sur le domaine {0, 1, . . . , 36}.

3.4.3 Lois des statistiques de Wilcoxon sous H0 et niveau de signification du test

n o
Sous H0 les statistiques V + et V − suivent la même loi, notée V , définie sur 0, 1, 2, . . . , n(n+1)
2 symétrique
n(n+1)
autour de la moyenne (et milieu) µ(V ) = 4 .
• Loi exacte des statistiques de Wilcoxon sous H0
Pour des échantillons de petites tailles (n ≤ 20) les probabilités cumulées PH0 [V ≤ v] sont données dans
les tables de Wilcoxon.
Elles permettent de trouver le niveau de signification αobs ou p-valeur. En effet,
v + + v − = n(n+1)
2 donc v + et v − sont symétriques par rapport au milieu sur la distribution de V ; on en
sym
déduit que : PH0 [V + ≥ v + ] = PH0 [V − ≤ v − ] = PH0 [V ≤ v − ].

Exemple 4
Loi exacte des statistiques de Wilcoxon sous H0
Sous H0 : X ≡ Y
– V + et V − ont la même distribution, définie sur {0, 1, . . . , 8×9 2 = 36} symétrique autour de la
n(n+1) 36
moyenne (et milieu) 4 = 2 = 18 représentée par son diagramme en bâtons (Figure 4).
– les différences di sont équilibrées donc les rangs faibles (forts) apparaissent associés indifféremment
à des signes ’+’ ou ’−’.
Alors les valeurs de V + et V − sont proches, situées près du centre de la distribution.
Région critique et niveau de signification du test
Sous H1 : X Y les valeurs de D = X − Y sont en majorité positives associées à des rangs élevés ce
qui implique de grandes valeurs de V + , et à l’opposé de petites valeurs de V − . La région critique du
test RC est située à droite de la distribution de V + (à gauche pour V − ).
Si on choisit de travailler avec V + :
sym
αobs = PH0 [V + ≥ v + ] = PH0 [V + ≥ 31] = PH0 [V ≤ v − ] = PH0 [V ≤ 5] = 0, 0391
(cf table de Wilcoxon)

20
Fig. 4 – Diagramme en bâtons de la loi de V sous H0 pour n = 8

• Région critique et niveau de signification du test

Test unilatéral
sym
H1 : X Y RC à droite pour V + (à gauche pour V − ) αobs = PH0 [V + ≥ v + ] = PH0 [V ≤ v − ]
H1 : X ≺ Y RC à gauche pour V + αobs = PH0 [V + ≤ v + ]
Test bilatéral
H1 : X 6≡ Y RC aux 2 extrémités de V + (ou de V − ) αobs = 2 × PH0 [V ≤ vmin ]
où vmin = min(v + , v − )

• Approximation normale des statistiques de Wilcoxon sous H0

Pour des tailles d’échantillons suffisamment grandes (n > 20) la distribution de V sous H0 suit approxi-
n(n + 1)
mativement une loi normale de moyenne µ(V ) =
2
n(n + 1)(2n + 1)
et de variance var(V ) = .
24
V − µ(V ) V − n(n+1)2 approx
On en déduit que la variable centrée et réduite : Z = p =q ∼ N (0, 1).
var(V ) n(n+1)(2n+1)
24
−
v + −µ(V )
Si on choisit de travailler avec V la valeur observée de Z : zobs = √
+
= − v√ −µ(V )
var(V ) var(V )

• Région critique et niveau de signification du test

Si on choisit de travailler avec V + (dans le cas contraire, pour V − le signe de Z et les inégalités sont
inversés)
Test unilatéral
H1 : X Y RC à droite pour V + et pour Z αobs = PH0 [V + ≥ v + ] ' PH0 [Z ≥ zobs ]
H1 : X ≺ Y RC à gauche pour V + et pour Z αobs = PH0 [V + ≤ v + ] ' PH0 [Z ≤ zobs ]
Test bilatéral
H1 : X 6≡ Y RC aux 2 extrémités de V + et de Z αobs ' 2 × PH0 [Z ≥ |zobs |]

Exemple 4
Approximation normale sous H0
Si on approxime la loi de V par la loi normale de moyenne µ(V ) = n(n+1)
4 = 8×9
4 = 18 et de variance
n(n+1)(2n+1) 8×9×17
var(V ) = 24 = 24 = 51
V −µ(V ) approx
la statistique de test Z = √ = V√−18
51
∼ N (0, 1) (mais cette approximation est peu justifiée
var(V )
ici puisque n = 8 < 20).

21
On choisit de travailler avec V + donc la valeur observée de Z :
V + −µ(V )
zobs = √ = 31−18
√
51
' 1, 82036
var(V )
Région critique et niveau de signification du test
Sous H1 : X Y RC se situe à droite de la distribution de V + et de Z.
αobs ' P [Z ≥ 1, 82036] = 1 − P [Z ≤ 1, 82036] = 1 − 0, 96565 = 0, 03435 (cf Table de la loi N (0, 1)).

3.5 Décision et conclusion

• Règle de décision basée sur αobs
- si αobs > α on conserve H0 (on ne valide pas H1 ) au seuil α et au risque de 2de espèce β
inconnu
- si αobs ≤ α on rejette H0 en faveur de H1 (on valide H1 ) au risque α et au niveau de
signification (p-valeur ) αobs
• Conclusion
Exemple 4
Décision et conclusion
loi exacte : αobs = 3, 91% < α = 5% donc on rejette H0 en faveur de H1 au risque α = 5%
approximation normale : αobs ' 3, 44% < α = 5% donc on rejette H0 en faveur de H1 au risque
α = 5%.
NB : dans ce cas l’approximation normale est peu justifiée puisque n < 20, on préférera donc conclure à
partir de la décision découlant de la loi exacte. Cependant, on remarque qu’ici le niveau de signification
obtenu avec l’approximation normale est proche de celui du test exact.
On peut conclure que les aı̂nés ont tendance à être plus indépendants que leurs cadets, au risque 5%
et au niveau de signification αobs = 3, 91%.
Remarques :
– le test du signe avec αobs = 14, 45% aboutissait à une conclusion inverse.
C’est une constatation fréquente puisque le test des signes et rangs de Wilcoxon est plus puissant
(moins conservateur) que le test du signe.
– le test de Student de comparaison de deux moyennes pour deux échantillons appariés sous les condi-
tions de normalité de D = X − Y (tests de normalité non significatifs) donnerait tobs = 2, 13498
et αobs = PH0 [T ≥ tobs ] = PH0 [T ≥ 2, 13498] = 0, 03264 ' 3, 26% d’après la loi de Student T8 et
induirait une conclusion identique.
Cependant, étant donné les petites tailles d’échantillons, les tests vérifiant la normalité sont peu puis-
sants pour détecter un écart à ces conditions, leurs résultats sont peu fiables ; il est donc préférable
de se référer au test non paramétrique présenté ici.

Résultats obtenus avec STATISTICA

ATTENTION : STATISTICA donne la taille des échantillons appariés n0 mais ne précise ni le nombre de
différences nulles (ou de valeurs xi = yi ) ni la taille de l’échantillon n à partir de laquelle les calculs sont
réalisés.
STATISTICA calcule la valeur observée de la statistique Vmin = min(V + , V − ) mais il ne calcule pas le
niveau de signification exact correspondant.
STATISTICA calcule systématiquement, quelle que soit la taille de l’échantillon, la valeur observée de Z
approximation normale de Vmax = max(V + , V − ) (zobs est toujours positive) sans correction de continuité ni
correction pour les ex aequo.
STATISTICA ne calcule que la p−valeur bilatérale ; pour obtenir le niveau de signification d’un test unilatéral
il faut diviser la valeur donnée par 2.

22
Exemple 5
Huit adolescentes de 13 à 18 ans présentant une carence en fer sans anémie ont reçu un traitement
pour améliorer leur fonction cognitive. On mesure cette fonction par le score au test d’apprentissage
verbal de Hopkin avant et après traitement. On obtient les valeurs du tableau suivant

score avant traitement 5 3, 1 2, 8 1, 5 1, 8 0, 5 3, 7 6

score avant après traitement 3, 1 6 6, 7 1, 5 3, 5 5, 5 4, 3 5, 7
Peut-on conclure, au risque α = 0, 10 que le traitement est efficace ?
Contexte
P = {adolescentes ayant une carence en fer sans anémie, sous traitement}
X = score de Hopkin avant traitement Y = score de Hopkin après traitement
Les 2 variables mesurent le même caractère (fonction cognitive) et sont quantitatives continues.
Hypothèses et risque
On souhaite tester si le traitement est efficace, donc si les scores Y après traitement sont globalement
supérieurs aux scores X avant traitement, noté Y X ou X ≺ Y .

H0 : le traitement n’est pas efficace H0 : X ≡ Y
On teste ce qui s’écrit
H1 : le traitement est efficace H1 : X ≺ Y
On définit la variable auxiliaire ”différence” : D = X − Y .
C’est une variable quantitative continue supposée symétrique.
Test des signes et rangs de Wilcoxon
Observations
On dispose de deux échantillons appariés de taille n0 = 8 puis d’un échantillon E de D = X − Y de
taille n = 7 pour lequel on a calculé les signes signe(di ).
Il faut compléter en calculant les valeurs absolues des différences |di | et les rangs de ces valeurs absolues
rang(|di |) de 1 à n = 7.
xi 5 3,1 2,8 1,5 1,8 0,5 3,7 6
yi 3,1 6 6,7 1,5 3,5 5,5 4,3 5,7
di 1,9 −2, 9 −3, 9 0 −1, 7 −5 −0, 6 0,3
signe(di ) + − − /\ − − − +
|di | 1,9 2, 9 3, 9 \/ 1, 7 5 0, 6 0,3
rang(|di |) 4 5 6 \/ 3 7 2 1
On vérifie que les rangs vont de 1 à 7.
Statistiques de Wilcoxon
V + = somme des rang(|di |) pour di > 0 et V − = somme des rang(|di |) pour di < 0
Les valeurs observées des statistiques de Wilcoxon
pour V + : v + = 4 + 1 = 5
pour V − : v − = 2 + 3 + 5 + 6 + 7 = 23
Vérification : v + = 5, v − = 23 donc v + + v − = 28. Or n = 7 donc n(n+1)
2 = 7×8
2 = 28.
+ −
V et V sont quantitatives discrètes et varient sur le domaine {0, 1, . . . , 28}.
Lois sous H0 , région critique et niveau de signification du test
- loi exacte
Sous H0 : X ≡ Y V + et V − ont la même distribution, définie sur {0, 1, . . . , 28} symétrique autour
de la moyenne (et milieu) n(n+1)
4 = 28
2 = 14.
Sous H1 : X ≺ Y les valeurs de D = X − Y sont en majorité négatives associées à des rangs élevés
ce qui implique de grandes valeurs de V − , et à l’opposé de petites valeurs de V + ; RC est à gauche
de la distribution de V + (à droite pour V − ).
Si on choisit de travailler avec V + :
αobs = PH0 [V + ≤ v + ] = PH0 [V + ≤ 5] = 0, 0781 (cf table de Wilcoxon)
- approximation normale
n(n+1) 7×8
Si on approxime la loi de V par la loi normale de moyenne µ(V ) = 4 = 4 = 14 et de variance
var(V ) = n(n+1)(2n+1)
24 = 7×8×15
24 = 35

23
V −µ(V ) V√−14 approx
la statistique de test Z = √ = 35
∼ N (0, 1)
var(V )
(mais cette approximation est peu justifiée ici puisque n = 7 < 20).
On choisit de travailler avec V + donc la valeur observée de Z : +
zobs = V√ −µ(V ) = 5−14
√
35
' −1, 521278
var(V )
+
Sous H1 : X ≺ Y RC est à gauche pour V et pour Z.
αobs ' P [Z ≤ −1, 521278] = 1 − P [Z ≤ 1, 521278] = 1 − 0, 9359 = 0, 0641 (cf Table de la loi N (0, 1)).
Décision et conclusion
loi exacte : αobs = 7, 81% < α = 10% donc on rejette H0 en faveur de H1 au risque α = 10%.
approximation normale : αobs = 6, 41% < α = 10% décision identique à la précédente.
NB : dans ce cas l’approximation normale est peu justifiée puisque n < 20, on préférera donc conclure
à partir de la décision découlant de la loi exacte. Cependant, on remarque qu’ici encore le niveau de
signification obtenu avec l’approximation normale est proche de celui du test exact.
On peut conclure à l’efficacité du traitement sur l’amélioration de la fonction cognitive des adolescentes
présentant une carence en fer, au risque α = 10% et au niveau de signification αobs = 7, 81%.
Remarques :
– le test du signe avec αobs = 22, 66% aboutissait à une conclusion opposée.
C’est une constatation fréquente puisque le test des signes et rangs de Wilcoxon est plus puissant
(moins conservateur) que le test du signe.
– le test de Student de comparaison de deux moyennes pour deux échantillons appariés sous les condi-
tions de normalité de D = X − Y (tests de normalité non significatifs) donnerait tobs = −1, 80888
et αobs = PH0 [T ≥ tobs ] = PH0 [T ≤ −1, 80888] = 0, 0567 ' 5, 67% d’après la loi de Student T7 et
induirait une conclusion identique.
Cependant, étant donné les petites tailles d’échantillons, les tests vérifiant la normalité sont peu puis-
sants pour détecter un écart aux conditions, leurs résultats sont peu fiables ; il est donc préférable
de se référer au test non paramétrique présenté ici.

3.6 Remarques
• Pour des variables X et Y continues, la probabilité de trouver un individu ayant la même valeur de X et
de Y est nulle.
De même la probabilité de trouver deux individus (ou plus) ayant la même valeur de D est nulle, en théorie
les ex aequo n’existent pas.
En pratique, ces cas de figure sont produits par les arrondis ou les erreurs de mesure :
- on ignore les individus donnant une valeur de D nulle (ils n’apportent pas d’information sur la différence
entre X et Y ),
- les formules (donc les tables) changent en présence d’ex aequo (voir logiciels). Il est important de les
utiliser uniquement s’il n’y a que ”peu” d’ex aequo.
• Le test du signe est plus conservateur (conserve plus souvent H0 ) ou moins puissant (détecte moins souvent
H1 ) que le test de Wilcoxon.
Démarche à suivre :
- faire le test du signe dont le champ d’application est très étendu puisqu’il ne nécessite aucune condition ;
- si la variable D = X − Y peut être supposée symétrique et si les données le permettent (on ne dispose
pas que des signes), faire le test de Wilcoxon ;
- le plus souvent les décisions concordent, mais si le test du signe conserve H0 alors que le test de Wilcoxon
rejette H0 , on garde cette dernière décision puisque le test de Wilcoxon est plus puissant.

Vous aimerez peut-être aussi

Comparaison de distributions en psychologie
Pas encore d'évaluation
Comparaison de distributions en psychologie
64 pages
Fiche Résolution Des Tests Statistiques
Pas encore d'évaluation
Fiche Résolution Des Tests Statistiques
25 pages
Tests Non Paramétriques en Statistiques
Pas encore d'évaluation
Tests Non Paramétriques en Statistiques
3 pages
Tests Statistiques : Hypothèses et Risques
Pas encore d'évaluation
Tests Statistiques : Hypothèses et Risques
33 pages
Biostatistiques et Tests Statistiques
Pas encore d'évaluation
Biostatistiques et Tests Statistiques
37 pages
Tests Statistiques : Méthodes et Applications
Pas encore d'évaluation
Tests Statistiques : Méthodes et Applications
40 pages
Formulaire
Pas encore d'évaluation
Formulaire
5 pages
Tests Non Parametriques Chap 8
Pas encore d'évaluation
Tests Non Parametriques Chap 8
40 pages
Gilbert CoursNP
Pas encore d'évaluation
Gilbert CoursNP
114 pages
Tests Statistiques en Écologie
Pas encore d'évaluation
Tests Statistiques en Écologie
77 pages
Tests Non Paramétriques en Économétrie
100% (2)
Tests Non Paramétriques en Économétrie
110 pages
Méthodologie de recherche statistique
100% (1)
Méthodologie de recherche statistique
75 pages
Introduction à la Statistique Descriptive
Pas encore d'évaluation
Introduction à la Statistique Descriptive
67 pages
Tests Statistiques pour Moyennes
Pas encore d'évaluation
Tests Statistiques pour Moyennes
73 pages
Introduction aux Tests Statistiques
Pas encore d'évaluation
Introduction aux Tests Statistiques
18 pages
Les Tests de Khi-Deux
100% (1)
Les Tests de Khi-Deux
32 pages
8 - Comparaison de Deux Moyennes
Pas encore d'évaluation
8 - Comparaison de Deux Moyennes
27 pages
Exer Test de Wilcoxon
Pas encore d'évaluation
Exer Test de Wilcoxon
3 pages
Tests Statistiques sur Variables Qualitatives
Pas encore d'évaluation
Tests Statistiques sur Variables Qualitatives
11 pages
Comparaison Statistique des Moyennes
Pas encore d'évaluation
Comparaison Statistique des Moyennes
31 pages
Biostat 2
Pas encore d'évaluation
Biostat 2
2 pages
Cours Khi Deux - A6 - DR BENELFEKIR
Pas encore d'évaluation
Cours Khi Deux - A6 - DR BENELFEKIR
9 pages
Tests Non Paramétriques en Statistiques
Pas encore d'évaluation
Tests Non Paramétriques en Statistiques
36 pages
Tests Non Parametriques
Pas encore d'évaluation
Tests Non Parametriques
36 pages
4) Tests Statistiques
Pas encore d'évaluation
4) Tests Statistiques
9 pages
Cours de Biostatistique I : Probabilités et Tests
Pas encore d'évaluation
Cours de Biostatistique I : Probabilités et Tests
67 pages
Analyse de La Variance - Pour Fusion
Pas encore d'évaluation
Analyse de La Variance - Pour Fusion
16 pages
Cours Tests
Pas encore d'évaluation
Cours Tests
8 pages
Cours Stat Tho 1
Pas encore d'évaluation
Cours Stat Tho 1
5 pages
Introduction aux traitements statistiques
Pas encore d'évaluation
Introduction aux traitements statistiques
71 pages
Théorie des estimateurs et tests statistiques
100% (1)
Théorie des estimateurs et tests statistiques
16 pages
Tests Statistiques d'Hypothèse en Biostatistique
100% (2)
Tests Statistiques d'Hypothèse en Biostatistique
11 pages
Dochead: Recherche en Soins Infirmiers
Pas encore d'évaluation
Dochead: Recherche en Soins Infirmiers
7 pages
Tests Statistiques : Principes et Méthodes
Pas encore d'évaluation
Tests Statistiques : Principes et Méthodes
46 pages
Tests Statistiques en Génie de l'Eau
Pas encore d'évaluation
Tests Statistiques en Génie de l'Eau
6 pages
Tests de Khi-deux en Statistique
100% (1)
Tests de Khi-deux en Statistique
31 pages
Outils d'Analyse Statistique en Recherche
Pas encore d'évaluation
Outils d'Analyse Statistique en Recherche
41 pages
2-Test Non Paramétriques
Pas encore d'évaluation
2-Test Non Paramétriques
15 pages
Comparaison d'échantillons et tests statistiques
Pas encore d'évaluation
Comparaison d'échantillons et tests statistiques
7 pages
L2 - Chapitre 4 - Test - 2
Pas encore d'évaluation
L2 - Chapitre 4 - Test - 2
17 pages
Chap2 Annexe
Pas encore d'évaluation
Chap2 Annexe
18 pages
Guide de Surive Stats
Pas encore d'évaluation
Guide de Surive Stats
19 pages
Test d'hypothèse statistique
Pas encore d'évaluation
Test d'hypothèse statistique
54 pages
Lpssa - Tests-Stat 2022-23 - M
Pas encore d'évaluation
Lpssa - Tests-Stat 2022-23 - M
47 pages
Tests d'hypothèses en statistique IV
Pas encore d'évaluation
Tests d'hypothèses en statistique IV
3 pages
P4 Cours BIOSTAT S3
Pas encore d'évaluation
P4 Cours BIOSTAT S3
42 pages
Tests Non Paramétriques en Biologie
Pas encore d'évaluation
Tests Non Paramétriques en Biologie
50 pages
Tests Statistiques : Comparaison et Méthodes
Pas encore d'évaluation
Tests Statistiques : Comparaison et Méthodes
8 pages
1-A6 - Test Du Chi Deux
Pas encore d'évaluation
1-A6 - Test Du Chi Deux
33 pages
Biostatistiques Séances 4 Test Khi2
Pas encore d'évaluation
Biostatistiques Séances 4 Test Khi2
16 pages
Comparaison de Plusieurs Distributions Juin2025
Pas encore d'évaluation
Comparaison de Plusieurs Distributions Juin2025
19 pages
Chap4 Tests Statistiques
Pas encore d'évaluation
Chap4 Tests Statistiques
22 pages
Comparaison 3
Pas encore d'évaluation
Comparaison 3
31 pages
Tests de Comparaison II
Pas encore d'évaluation
Tests de Comparaison II
73 pages
Comparaison de deux moyennes statistiques
Pas encore d'évaluation
Comparaison de deux moyennes statistiques
15 pages
Tests Khi-Carré : Méthodes et Applications
Pas encore d'évaluation
Tests Khi-Carré : Méthodes et Applications
17 pages
Maîtrise Statistique des Procédés en R
Pas encore d'évaluation
Maîtrise Statistique des Procédés en R
32 pages
Guide des Tests Statistiques sur R
Pas encore d'évaluation
Guide des Tests Statistiques sur R
10 pages
PARTIE 2 Stati Chap3
Pas encore d'évaluation
PARTIE 2 Stati Chap3
30 pages
Chi 2
Pas encore d'évaluation
Chi 2
17 pages
TRINDER
Pas encore d'évaluation
TRINDER
4 pages
La Lipase
100% (1)
La Lipase
2 pages
Gestion des Gammapathies Monoclonales
Pas encore d'évaluation
Gestion des Gammapathies Monoclonales
6 pages
Gammapathies : Suivi par Généralistes
Pas encore d'évaluation
Gammapathies : Suivi par Généralistes
30 pages
Bilirubine
100% (1)
Bilirubine
10 pages
Bêta 2-Microglobuline: - Chez Les Patients Infectés Par Le Virus de L'immunodéficience Humaine (VIH) : Elle Est Un
Pas encore d'évaluation
Bêta 2-Microglobuline: - Chez Les Patients Infectés Par Le Virus de L'immunodéficience Humaine (VIH) : Elle Est Un
3 pages
Acide Urique
100% (1)
Acide Urique
4 pages
Emile 2018
Pas encore d'évaluation
Emile 2018
3 pages
1 s2.0 S1773035X20303129 Main
Pas encore d'évaluation
1 s2.0 S1773035X20303129 Main
8 pages
Mouna Saidal
100% (1)
Mouna Saidal
7 pages
AMA et Cirrhose Biliaire Primitive
Pas encore d'évaluation
AMA et Cirrhose Biliaire Primitive
2 pages
Extraction
100% (1)
Extraction
40 pages
TS TQ Tca
100% (1)
TS TQ Tca
52 pages
Exercices TD
Pas encore d'évaluation
Exercices TD
4 pages
Bichou Saidal
0% (1)
Bichou Saidal
18 pages
Légendes et Souvenirs de Kabylie
Pas encore d'évaluation
Légendes et Souvenirs de Kabylie
192 pages
Rôle de l'eau et osmose chez les plantes
Pas encore d'évaluation
Rôle de l'eau et osmose chez les plantes
16 pages
Cours de Force de Vente L2
Pas encore d'évaluation
Cours de Force de Vente L2
132 pages
Abdomen Sans Préparation
93% (14)
Abdomen Sans Préparation
24 pages
ULTİ TYT-2 Cevap Anahtari
Pas encore d'évaluation
ULTİ TYT-2 Cevap Anahtari
1 page
Opérations Arithmétiques: 1 Addition en Binaire
Pas encore d'évaluation
Opérations Arithmétiques: 1 Addition en Binaire
7 pages
Cahier de Stage
Pas encore d'évaluation
Cahier de Stage
41 pages
Add1 Mod n4 Chasse Au Tresor v1
100% (4)
Add1 Mod n4 Chasse Au Tresor v1
54 pages
Pronoms Personnels COD, COI, en Et y
Pas encore d'évaluation
Pronoms Personnels COD, COI, en Et y
1 page
Rappel Sur Les Grandes Division Du Regne Vegeta Et Notion D
100% (1)
Rappel Sur Les Grandes Division Du Regne Vegeta Et Notion D
8 pages
Grammaire Pour Ados 250 Exercices NI
100% (2)
Grammaire Pour Ados 250 Exercices NI
160 pages
Présentation PowerPoint Sur Frank Gehry
Pas encore d'évaluation
Présentation PowerPoint Sur Frank Gehry
51 pages
Manuel
Pas encore d'évaluation
Manuel
4 pages
Discipline et Résilience en Sport
Pas encore d'évaluation
Discipline et Résilience en Sport
1 page
Fiche Pédagogique: Jeu "Qui Veut Gagner des Millions"
100% (1)
Fiche Pédagogique: Jeu "Qui Veut Gagner des Millions"
2 pages
Ilovepdf Merged
Pas encore d'évaluation
Ilovepdf Merged
14 pages
Analyse du poème "À Cassandre" de Ronsard
Pas encore d'évaluation
Analyse du poème "À Cassandre" de Ronsard
7 pages
08202
100% (1)
08202
236 pages
Agregint 2022 1 Corrige
Pas encore d'évaluation
Agregint 2022 1 Corrige
21 pages
Vocabulaire cm1
Pas encore d'évaluation
Vocabulaire cm1
5 pages
La Phrase Interrogative - Fiche Supplémentaire
Pas encore d'évaluation
La Phrase Interrogative - Fiche Supplémentaire
7 pages
La - Mort Aventure KNIGHT JDR
100% (1)
La - Mort Aventure KNIGHT JDR
16 pages
Introduction Wps Office
Pas encore d'évaluation
Introduction Wps Office
6 pages
Lois de probabilité discrètes et continues
Pas encore d'évaluation
Lois de probabilité discrètes et continues
1 page
Bac Corrige Dissertation Litteraire
100% (2)
Bac Corrige Dissertation Litteraire
3 pages
GDP
Pas encore d'évaluation
GDP
2 pages
Le Concept de L'intégrité Morale
Pas encore d'évaluation
Le Concept de L'intégrité Morale
3 pages
Concepts Et Rationalités Héritages de L'épistémologie Historique
Pas encore d'évaluation
Concepts Et Rationalités Héritages de L'épistémologie Historique
158 pages
Regle 3
Pas encore d'évaluation
Regle 3
7 pages
Calcul Stochastique pour Économistes
Pas encore d'évaluation
Calcul Stochastique pour Économistes
13 pages