100% ont trouvé ce document utile (1 vote)
453 vues90 pages

Tests Statistiques de Comparaison

Le document présente les tests statistiques de comparaison, en expliquant leur principe, leur interprétation et leur choix selon différentes situations. Il aborde également la formulation des hypothèses, les risques associés aux tests, ainsi que les principaux tests utilisés, tels que le test Z, le test T de Student et le test de Chi². Enfin, il illustre la comparaison de pourcentages à travers des exemples pratiques.

Transféré par

yasmineessaddik6
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (1 vote)
453 vues90 pages

Tests Statistiques de Comparaison

Le document présente les tests statistiques de comparaison, en expliquant leur principe, leur interprétation et leur choix selon différentes situations. Il aborde également la formulation des hypothèses, les risques associés aux tests, ainsi que les principaux tests utilisés, tels que le test Z, le test T de Student et le test de Chi². Enfin, il illustre la comparaison de pourcentages à travers des exemples pratiques.

Transféré par

yasmineessaddik6
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Les tests statistiques de

comparaison
Partie 1
Dr CHARIF Faïza
Professeure Assistante en Médecine Communautaire
Laboratoire d’épidémiologie et de santé publique
Faculté de Médecine et de Pharmacie de Tanger
29/10/2024
Objectifs

• Décrire le principe du test statistique

• Interpréter les résultats d’un test statistique

• Choisir le test statistique approprié au cas

• Comparer deux pourcentages dans différentes situations de


comparaison
Plan

• Principe des tests statistiques

• Comparaison de deux pourcentages


 Comparaison d’un pourcentage à une valeur théorique

 Comparaison de deux pourcentages observés sur séries indépendantes

 Comparaison de deux pourcentages observés sur séries appariées


Principe des tests statistiques
• La statistique sert à trois choses

• Estimer les paramètres inconnus d’une population

• Comparer des paramètres observés

• Prédire une situation à l’aide de modèles


« Une toxi-infection alimentaire collective (TIAC) à bord d’un navire :
Il y a plus de malades chez les marins qui ont mangé de l’espadon
(42,5%) que chez ceux qui n’en ont pas mangé (5,9%).
Mais, il y a aussi plus de malades chez ceux qui ont mangé des
tomates (26,9%) que chez ceux qui n’en ont pas mangé (19,0 %) »
Ce que vous voulez savoir

• A-t-on VRAIMENT plus de chances d’être malade quand on a mangé


du poisson que lorsqu’on a mangé des tomates ?

• ou est-ce simplement dû au hasard?

TESTS STATISTIQUES
Trois situations de comparaison
Exemple
Dans une population, trois personnes sur dix sont atteintes d’une maladie M; on
souhaite mener une étude épidémiologique sur cette maladie, on tire à cet effet au
hasard 50 personnes dans la population : on constate que 12 personnes sont
atteintes de M.
La proportion de personnes atteintes de M dans l’échantillon diffère-t-elle
significativement de celle de la population ?
Démarche à suivre

1- Formuler les hypothèses à tester


2- Choisir le test statistique adapté
3- Calculer la statistique adéquate
4- Interpréter le résultat du test
Méthode hypothético-déductive
Démarche à suivre

1- Formuler les hypothèses à tester


2- Choisir le test statistique adapté
3- Calculer la statistique adéquate
4- Interpréter le résultat du test
1- Formuler les hypothèses :
Hypothèse nulle H0
1- Formuler les hypothèses :
Hypothèse alternative H1
Hypothèse alternative H1 unilatérale
Exemples d’hypothèses
• Comparaison de la fréquence du paludisme dans 2 régions africaines
- H0 : La fréquence du paludisme est identique dans les 2 régions
- H1 : les 2 fréquences sont différentes

H1 bilatérale
Exemples d’hypothèses
• Comparaison de la fréquence du paludisme entre groupe vacciné et
un groupe non-vacciné
- H0 : la fréquence du paludisme est identique dans les 2 groupes
- H1 : la fréquence du paludisme est inférieure dans le groupe vacciné

H1 unilatérale
Démarche à suivre

1- Formuler les hypothèses à tester


2- Choisir le test statistique adapté
3- Calculer la statistique adéquate
4- Interpréter le résultat du test
2- Choisir le test statistique adapté

• Il existe une très grande quantité de tests statistiques

• Le choix du test à utiliser dépend de nombreux facteurs

• Selon : la situation de comparaison, le type de séries comparées, la


nature de la variable, la taille de l’échantillon et les paramètres
comparés.
2- Choisir le test statistique adapté

• Situation de comparaison :

– Comparaison entre des paramètres observés sur un échantillon et


ceux d’une population de référence : test de conformité

– Comparaison entre deux ou plusieurs échantillons entre eux : test


d’homogénéité
2- Choisir le test statistique adapté
• Types de séries comparées :

• Deux séries sont indépendantes si les sujets de ces deux séries sont
totalement indépendants.

• Deux séries sont appariées si elles se correspondent par un élément


commun.
2- Choisir le test statistique adapté

• Nature des variables à comparer :


• Quantitative
• Qualitative binaire
• Qualitative nominale à plusieurs classes
• Qualitative ordinale.

• Paramètres étudiés :

• Moyennes • Pourcentages • Variances


2- Choisir le test statistique adapté

• Taille des échantillons :

• Grands • Petits

• Conditions d’application

• Normalité des distributions

• Égalité des variances

• Taille minimum des échantillons


Démarche à suivre

1- Formuler les hypothèses à tester


2- Choisir le test statistique adapté
3- Calculer la statistique adéquate
4- Interpréter le résultat du test
3- Calculer la statistique adéquate
• Une fois que les hypothèses sont clairement posées, le test est
appliqué. Tous les tests statistiques de comparaison consistent :
- à calculer une quantité mathématique exprimant l’écart entre les paramètres.

- à confronter cette quantité à un modèle de distribution théorique.


• On calcule une expression de la différence à étudier qui se rapproche
d’un modèle mathématique dont on connaît la loi de probabilité (loi de
Z, loi T de Student, loi du ꭓ² ).
• On examine si la valeur obtenue est probable ou au contraire si elle a
moins de 5 chances sur 100 d’être observée.
Démarche à suivre

1- Formuler les hypothèses à tester


2- Choisir le test statistique adapté
3- Calculer la statistique adéquate
4- Interpréter le résultat du test
4- Interpréter le résultat du test

• Selon les résultats du test, on peut se trouver dans deux situations :

1 - Soit la valeur trouvée est probable. On en conclut que la différence


observée entre les paramètres étudiés n’est pas significative. La
différence peut s’expliquer par les seules fluctuations d’échantillonnage.

On ne peut pas rejeter H0.


4- Interpréter le résultat du test

• Selon les résultats du test, on peut se trouver dans deux situations:

2 - Soit la valeur trouvée excède une valeur critique, qui la rend très
peu probable. Il est encore possible que ce résultat soit dû à une simple
fluctuation d’échantillonnage (il reste en effet α chances que cela soit
vrai). Mais on décide de ne pas tenir compte de cette faible probabilité.
On rejette l’hypothèse nulle H0 et on accepte l’hypothèse H1 d’une
différence réelle entre les paramètres étudiés.
Principe général d’un test statistique
Principe général d’un test statistique

1. C’est l’hypothèse nulle H0 qu’on teste


2. Si H0 n’est pas vérifiée,
a) on la rejette
b) on accepte l’hypothèse alternative H1
3. Sinon, on ne peut pas conclure. (on n’accepte jamais une hypothèse
nulle)
Les risques α et β

Lorsqu’on fait un test statistique de comparaison, on prend 2 risques :

α : celui d’affirmer une différence qui n’existe pas

β : celui de ne pas voir une différence qui pourtant existe


Les risques α et β
• Le risque α ou risque de première espèce :
Probabilité de conclure à une différence qui n’existe pas
Les risques α et β
• Le risque α ou risque de première espèce :
Les risques α et β
• Le risque α ou risque de première espèce :
Le degré de signification p

• Lorsque la valeur du test a montré une valeur inférieure au seuil de


5%, on affirme que la différence est significative.

• On ne se contente pas d’affirmer qu’on a moins de 5% de chances de


se tromper

• On désire afficher le risque ultime que l’on a pris.

• C’est à dire le risque correspondant à la valeur trouvée au test.


Le degré de signification p
Table de l’écart réduit Z
Démarche

• Calcul du test

• Si la valeur trouvée est supérieure au seuil de 5% on affirme que la


différence est significative

• On recherche ensuite la valeur de p

• On conclut à une différence significative avec p < 0,00..


• Le degré de signification p
Le risque α est un risque fixé a priori. Lorsque le calcul du test montre
que le seuil critique a été franchi, on rejette H0 avec un risque égal à α.
Mais on désire préciser la limite du risque pris.

On appelle degré de signification p cette limite a posteriori.

Le degré de signification indique la probabilité d’avoir rejeté H0 si on


avait fixé le risque de 1ère espèce égal à p au lieu de α.
Une différence déclarée significative veut dire qu’on affirme qu’il existe
une différence entre les paramètres comparés avec un risque p
inférieur à une certaine valeur.
Une différence déclarée non significative implique qu’on ne peut pas
conclure. Soit il n’existe pas de différence entre les paramètres
comparés, soit il existe peut-être une différence mais rien ne permet de
l’affirmer avec les données dont on dispose.
Les risques α et β
• Le risque β ou risque de deuxième espèce:
Probabilité de ne pas mettre en évidence une différence alors qu’elle
existe

• On ne sait pas calculer le risque d’erreur β


• C’est la raison pour laquelle on n’affirme jamais H0
Puissance d’un test

• On appelle puissance d’un test la valeur 1 – β

• La puissance d’un test est lié à la taille des échantillons

• Si on désire détecter une faible différence, il faut un test puissant, il


faut donc une taille d’échantillon élevée
Interprétation finale d’un test de comparaison

• L’hypothèse nulle n’est pas rejetée :

Cela signifie que rien ne permet d’affirmer que les paramètres


comparés sont différents. C’est d’ailleurs la seule chose que l’on peut
dire. On n’affirme jamais qu’une hypothèse nulle est vraie, car elle
aurait peut-être pu être rejetée si la puissance du test avait été plus
élevée.
Interprétation finale d’un test de comparaison

• On rejette H0 : Le corollaire de ce rejet est l’acceptation de


l’hypothèse H1.

• Si on avait choisi l’hypothèse alternative H1 bilatérale, on l’accepte en


affirmant que les paramètres étudiés sont différents.

• Si on avait choisi l’hypothèse alternative H1 unilatérale, on l’accepte


en affirmant que l’un des paramètres est inférieur (ou bien supérieur)
à l’autre.
Principaux tests
• Test Z : Test de la loi normale centrée réduite :
• Sert à comparer
• Une moyenne observée à une population de référence
• Deux moyennes observées
• Deux moyennes observées sur 2 séries appariées

• Condition d’application :
• La taille du ou des échantillons doit être supérieure à 30.
• Sinon : test T de Student
Principaux tests
Test T de Student : Lorsque la taille des échantillons est < 30

• Sert à comparer
• Une moyenne observée à une population de référence

• Deux moyennes observées

• Deux moyennes observées sur 2 séries appariées

Conditions d’applications plus strictes que pour le test Z :

1) La distribution de la variable doit être normale dans la population d’où provient l’échantillon
+++

2) Les variances doivent être identiques


Principaux tests
• Test de Chi² (ꭓ²) : Sert à étudier des variables qualitatives:

1) pour comparer :
• Une distribution observée à une distribution théorique : si variable binaire, % observé à %
théorique
• Deux distributions entre elles : si variable binaire, 2 pourcentages

• Plusieurs distributions entre elles : si variable binaire, plusieurs pourcentages

2) pour tester la liaison entre 2 variables


Comparaison de deux
pourcentages
Comparaison de deux pourcentages

• Comparaison d’un pourcentage à une valeur théorique

• Comparaison de deux pourcentages observés sur séries


indépendantes

• Comparaison de deux pourcentages observés sur séries appariées


Comparaison de deux pourcentages

• Comparaison d’un pourcentage à une valeur théorique

• Comparaison de deux pourcentages observés sur séries


indépendantes

• Comparaison de deux pourcentages observés sur séries appariées


Comparaison d’un pourcentage à une valeur
théorique
• Problème : déterminer si un pourcentage observé po sur un
échantillon de taille n est différent d’une valeur théorique Pth.

• Comparer P à Pth.
Comparaison d’un pourcentage à une valeur
théorique
• Exemple

• Parmi 400 habitants représentatifs d’une région, 92 (23%)


consomment des anti-dépresseurs.

• Ce pourcentage diffère-t-il de la valeur 20% donnée par les chiffres de


vente nationaux?
Comparaison d’un pourcentage à une valeur
théorique
1 - Formuler les hypothèses : Pour un test bilatéral :

• H0 : P = Pth

• H1 : P ≠ Pth

2 - Fixer le risque α

3 - Choisir le test statistique


Comparaison d’un pourcentage à une valeur
théorique
3 - Choisir le test statistique : Test du ꭓ² pour comparer un
pourcentage à une valeur théorique : ꭓ² de conformité
- Tableau de contingence :
Comparaison d’un pourcentage à une valeur
théorique
3 - Choisir le test statistique : Test du ꭓ² pour comparer un
pourcentage à une valeur théorique : ꭓ² de conformité
- Tableau de contingence :
Comparaison d’un pourcentage à une valeur
théorique
3 - Choisir le test statistique : Test du ꭓ² pour comparer un
pourcentage à une valeur théorique : ꭓ² de conformité
Comparaison d’un pourcentage à une valeur
théorique
3 - Choisir le test statistique : Test du ꭓ² pour comparer un
pourcentage à une valeur théorique : ꭓ² de conformité

Conclusion : On ne
met pas en évidence
une différence entre le
pourcentage de
consommateurs
d’antidépresseurs dans
la région et dans
l’ensemble du pays
Comparaison de deux pourcentages

• Comparaison d’un pourcentage à une valeur théorique

• Comparaison de deux pourcentages observés sur séries


indépendantes

• Comparaison de deux pourcentages observés sur séries appariées


Comparaison de deux pourcentages observés
sur séries indépendantes
• Problème : comparer 2 proportions (p1 et p2) dans 2 échantillons
indépendants de tailles n1 et n2. Comparer P1 à P2.
Comparaison de deux pourcentages observés
sur séries indépendantes
Exemple
On désire comparer l’efficacité de deux traitements T1 et T2 sur 100 patients
atteints d’une maladie M.
On tire au sort 2 deux groupes de 50 patients, un groupe est soumis à T1, le second
à T2.
Le pourcentage de guérison chez les patients soumis à T1 est de 30%, chez ceux
soumis à T2 de 40%.
Le taux de guérison est-il différent entre les 2 traitements ?
Comparaison de deux pourcentages observés
sur séries indépendantes
1 - Formuler les hypothèses : Pour un test bilatéral :

• H0 : P1 = P2

• H1 : P1 ≠ P2

P1 et P2 : pourcentages vrais de malades dans les populations 1 et 2

2 - Fixer le risque α

3 - Choisir le test statistique


Comparaison de deux pourcentages observés
sur séries indépendantes
3 - Choisir le test statistique : Test du ꭓ² pour comparer deux
pourcentages : Test de ꭓ² de Pearson
Comparaison de deux pourcentages observés
sur séries indépendantes
3 - Choisir le test statistique : Test du ꭓ² pour comparer deux
pourcentages : Test de ꭓ² de Pearson
Le test consiste à calculer :
Comparaison de deux pourcentages observés
sur séries indépendantes
3 - Choisir le test statistique : Test du ꭓ² pour comparer deux
pourcentages : Test de ꭓ² de Pearson
Comparaison de deux pourcentages observés
sur séries indépendantes
3 - Choisir le test statistique : Test du ꭓ² pour comparer deux
pourcentages : Test de ꭓ² de Pearson
- Cas des petits échantillons : Correction de Yates
- Un ou plusieurs des Cij inférieur à 5 : On ne peut plus utiliser le test de
ꭓ² : on utilise une formule du ꭓ² corrigée dit « ꭓ² corrigé de Yates »

- Conditions d’application : la correction de Yates est utilisée si un (au


moins) des Cij est < 5 et si tous les Cij ≥ 3
Comparaison de deux pourcentages observés
sur séries indépendantes
Exemple
On désire comparer l’efficacité de deux traitements T1 et T2 sur 100 patients
atteints d’une maladie M.
On tire au sort 2 deux groupes de 50 patients, un groupe est soumis à T1, le second
à T2.
Le pourcentage de guérison chez les patients soumis à T1 est de 30%, chez ceux
soumis à T2 de 40%.
Le taux de guérison est-il différent entre les 2 traitements ?
Comparaison de deux pourcentages observés
sur séries indépendantes
Exemple
• Données :
• Hypothèses : H0 : P1 = P2 ; H1 : P1 ≠ P2
• Calcul Guéris Non guéris Total
Groupe T1 15 (17,5) 35 (32,5) 50
Groupe T2 20 (17,5) 30 (32,5) 50
Total 35 65 100

• Conditions d’application vérifiées : Cij ≥ 5


(15 - 17,5) 2
(20 - 17,5) 2
(35  32,5) 2
(30  32,5) 2
χ2      1,10
17,5 17,5 32,5 32,5
Comparaison de deux pourcentages observés
sur séries indépendantes
Exemple
• Lecture

• χ  1,10  χ
2 2
1, 5%  3,84 : non rejet de H0
On ne met pas en évidence, au risque de 5%, de différence
significative entre les taux de guérison avec les 2 traitements
Comparaison de deux pourcentages

• Comparaison d’un pourcentage à une valeur théorique

• Comparaison de deux pourcentages observés sur séries


indépendantes

• Comparaison de deux pourcentages observés sur séries appariées


Comparaison de deux pourcentages observés
sur séries appariées
• Définition de l’appariement : On parle d’échantillons appariés (ou de
séries appariées) lorsque les sujets sont groupés « au moment où on
constitue les échantillons », « en paires » composées d’un sujet de
chaque échantillon.

• Problème : On s’intéresse aux taux de guérison chez des sujets ayant


reçus un traitement T1 et des sujets appariés ayant reçus un
traitement T2.
• On cherche à comparer p1 et p2 les taux de guérison avec T1 et T2.
Comparaison de deux pourcentages observés
sur séries appariées
1 - Formuler les hypothèses : Pour un test bilatéral :

• L’hypothèse nulle : H0 : P1 = P2 où Pj est le pourcentage vrai de succès


avec le TTTj.

• L’hypothèse alternative : H1 : P1 ≠ P2
Comparaison de deux pourcentages observés
sur séries appariées
Comparaison de deux pourcentages observés
sur séries appariées
• Les paires concordantes n’apportent pas
d’information sur la liaison entre le traitement et
la guérison : On doit donc se fonder sur la
répartition des paires discordantes.

Si l’hypothèse H0 est vraie, il doit y avoir autant


de paires discordantes du type +- que de type -+

• Tester H0 revient donc à tester si le pourcentage


observé de paires -+ est significativement
différent de la valeur théorique 0,5.
Comparaison de deux pourcentages observés
sur séries appariées
2 – Fixer le risque α
3 – Choisir le test statistique : Test de χ2 de McNemar = Test de χ2 de
comparaison de pourcentage de séries appariées :

2 2
 bc  bc
b -  c - 
2  (b  c)
2
χ 
2  2    
bc bc bc
2 2
Comparaison de deux pourcentages observés
sur séries appariées
3 – Choisir le test statistique : Test de χ2 de McNemar = Test de χ2 de
comparaison de pourcentage de séries appariées :
Comparaison de deux pourcentages observés
sur séries appariées
3 – Choisir le test statistique :
- Cas des petits échantillons: Correction de Yates
- Dans le cas où ces conditions ne sont pas satisfaites (petits
𝑏+c 𝑏+c
échantillons) ( < 5) et à condition que ≥ 3 on utilise la
2 2
correction de Yates qui donne :
2 2
 bc   bc 
 b- - 0,5   c - - 0,5 
χ0 
2  2    2    b  c  1 2

bc bc bc


2 2
Comparaison de deux pourcentages observés
sur séries appariées : Exemple
Comparaison de deux pourcentages observés
sur séries appariées
Comparaison de deux pourcentages observés
sur séries appariées
« Une toxi-infection alimentaire collective (TIAC) à bord d’un navire :
Il y a plus de malades chez les marins qui ont mangé de l’espadon
(42,5%) que chez ceux qui n’en ont pas mangé (5,9%).
Mais, il y a aussi plus de malades chez ceux qui ont mangé des
tomates (26,9%) que chez ceux qui n’en ont pas mangé (19,0 %) »
• Exemple :
Une toxi-infection alimentaire collective (TIAC) à bord d’un navire :
Il y a plus de malades chez les marins qui ont mangé de l’espadon
(42,5%) que chez ceux qui n’en ont pas mangé (5,9%).
• Exemple :
Il y a plus de malades chez ceux qui ont mangé des tomates (26,9%)
que chez ceux qui n’en ont pas mangé (19,0 %)
MERCI POUR VOTRE
ATTENTION

Vous aimerez peut-être aussi