0% ont trouvé ce document utile (0 vote)
16 vues108 pages

Method o Logie

Transféré par

eddaoudiamina24
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
16 vues108 pages

Method o Logie

Transféré par

eddaoudiamina24
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Pr E.

BOUAITI---Methodo 19/02/2020

Descriptif du sous module

Module 


Chapitre [Link] recherche clinique en sciences de la santé.
Chapitre 2. Le sujet de recherche clinique.
Chapitre 3. la recherche bibliographique.
Méthodologie de la recherche

 Chapitre 4. Différents types de design d’études cliniques et


épidémiologiques.
 Chapitre 5. Méthodes d’échantillonnage.
 Chapitre 6. Nombre de sujets nécessaires (NSN).
Chapitre 7. Méthodes d'analyse d'une étude descriptive.
Pr EL ARBI BOUAITI 

Chapitre 8. Les statistiques inférentielles.



Faculté de médecine et de pharmacie -
Rabat

19/02/2020 2

Plan

Chapitre 1 I. Introduction
II. Définition de la recherche clinique
La recherche clinique en III. Les objectifs de la recherche clinique
sciences de la santé. IV. La démarche de recherche clinique
Pr EL ARBI BOUAITI V. Les acteurs de la recherche clinique
Faculté de médecine et de pharmacie - VI. Étapes de la recherche clinique
Rabat

19/02/2020 4

I. Introduction I. Introduction
Différents types de recherche
 Quand on parle de « recherche clinique » on Recherche fondamentale
pense généralement à l'essai de nouveaux Études hors cliniques
médicaments : meilleure efficacité, meilleure
Recherche menée en vue de faire évoluer
tolérance, moindre toxicité, moindre coût ...
les connaissances plutôt que pour une application
pratique.
 La recherche clinique ne se limite pas à cela,
Recherche appliquée
surtout dans les centres hospitalo-universitaires
où se côtoient plusieurs types de recherches Études chez l’homme
interventionnelles et observationnelles. Recherche réalisée en vue de résoudre des problèmes
pratiques.

19/02/2020 5 19/02/2020 6

1
Pr [Link]---Methodo 19/02/2020

I. Introduction Plan

 La recherche clinique I. Introduction


 Réalisée sur l’homme par des équipes multidisciplinaires
 médecins, II. Définition de la recherche clinique
 pharmaciens,
III. Les objectifs de la recherche clinique
 techniciens de laboratoire,
 Infirmiers, IV. La démarche de recherche clinique
 autres personnels de santé.
 La connaissance des spécificités de la recherche
V. Les acteurs de la recherche clinique
clinique est un prérequis nécessaire pour participer à VI. Étapes de la recherche clinique
des projets de recherche, mais, également pour avoir
une analyse critique efficace lors de la lecture d'articles
scientifiques.

19/02/2020 7 19/02/2020 8

II. Définition de la recherche clinique II. Définition de la recherche clinique

 La recherche clinique : toute recherche ou


essai organisé et pratiqué sur l'être humain
en vue de développer les connaissances
biologiques ou médicales, ou pour répondre
à des préoccupations de santé publique.
 Elle interfère avec
 Épidémiologie
 Biostatistique
 Santé publique

19/02/2020 9 19/02/2020 10

Plan III. Les objectifs de la recherche


clinique
I. Introduction  La recherche clinique est une nécessité absolue :
 Apparition de maladies nouvelles,
II. Définition de la recherche clinique  Développement de résistances aux antibiotiques,
III. Les objectifs de la recherche clinique  Persistance de maladies non guérissables,
 Amélioration continue des techniques d’exploration et de soins,
IV. La démarche de recherche clinique  Besoin de vérification, de preuve scientifique (evidence-based
V. Les acteurs de la recherche clinique medicine EBM).
 ….. La prise en charge des patients
VI. Étapes de la recherche clinique  L’objectif de la recherche clinique :
 l’amélioration à plus ou moins long terme des méthodes
diagnostiques, thérapeutiques et prophylactiques
 et la compréhension de l’étiologie et de la pathogénèse des
maladies.
19/02/2020 11 19/02/2020 12

2
Pr [Link]---Methodo 19/02/2020

III. Les objectifs de la recherche III. Les objectifs de la recherche


clinique clinique
 Place de la Recherche Clinique dans la décision  D’une façon générale, l’objectif de la
médicale? recherche clinique est de fournir des preuves
scientifiques utiles à la pratique en terme :
 Diagnostique : Validation d’un nouveau test
 Thérapeutique : Validation d’un nouveau
traitement pharmacologique, dispositif médical,
autres traitements non pharmacologiques
(physiothérapie….)
 Epidémiologique : Facteurs de risque, Facteurs
pronostiques
La décision médicale selon JM Chabot
19/02/2020 13 19/02/2020 14

III. Les objectifs de la recherche clinique III. Les objectifs de la recherche


Exemple de Semmelweiss (1) clinique
 Constatations à l’Hôpital Général de Vienne, 1846  Exemple: étude CAST en 1989
 Observation d’une mortalité forte dans les suites de couche dans  Constat : Après infarctus, l'existence d'extra systoles
le Servicce de Klin (étudiants en médecine) que dans Service du ventriculaires (ESV) augmente le risque de mort subite.
Pr Bartch (sages-femmes)
 Hypothèse : la suppression des arythmies ventriculaires
 Premier constat : Les étudiants vont de la salle de
dans les suites d’un infarctus du myocarde améliore le
dissection à la salle d’accouchement sans précautions
pronostic et diminue le risque létal.
particulières (absence de lavage des mains)
 Arguments :
 Comment le résoudre ?
 Les arythmies ventriculaires fréquentes (> 10 ESV/h) augmentent
 Mise en place d’une étude scientifique
d’un facteur 4 le risque de décès post-infarctus
 Les nouveaux anti-arythmiques sont capables de diminuer la
fréquence des ESV post-infarctus.
Quel est le problème ?
The Cardiac Arrhythmia Suppression Trial (CAST) Investigators — Preliminary report : Effect of encainide and flecainide on mortality
in a randomized trial of arrhythmia suppression after myocardial infarction . N. Engl. J. Med ., 1989, 321 , 406-12.)

19/02/2020 15 19/02/2020 16

III. Les objectifs de la recherche III. Les objectifs de la recherche


clinique clinique
 Exemple : étude CAST 1989  Essai comparatif randomisé CAST (1989)
 A partir de ces données, ces traitements anti-
arythmiques ont été prescrits pour prévenir la mort n Décès Mortalité
subite... Groupe Antiarythmiques 432 39 9% RR=2,13

 Pas d’essais sur des critères cliniques mais uniquement Groupe Placebo 423 18 4%

sur des critères de rythme cardiaque : Ça marche il y a


moins de troubles du rythme sous traitement.
 Résultats Actuellement et grâce à des études de recherche clinique bien conçues, les
 Entre 50 et 80 000 décès induits par le traitement aux USA indications de traitement anti arythmique sont devenues très ciblés.
 Les effets indésirables du traitement étaient très supérieurs au
bénéfice via l’aggravation de l’insuffisance cardiaque : décès par
insuffisance aortique

19/02/2020 17 19/02/2020 18

3
Pr [Link]---Methodo 19/02/2020

La recherche clinique dans le monde Plan

La recherche clinique sur le médicament en I. Introduction


2017 II. Définition de la recherche clinique
 7 964 nouveaux essais prévoyant d’inclure 1 900 000
patients
III. Les objectifs de la recherche clinique
 47% impliquent les industriels (financement exclusif ou IV. La démarche de recherche clinique
mixte) V. Les acteurs de la recherche clinique
VI. Étapes de la recherche clinique

19/02/2020 19 19/02/2020 20

IV. La démarche de recherche clinique IV. La démarche de recherche clinique

Problème Mise en œuvre • recueil d’information


Problème
de de la • méthodes d’analyse
Initial • interprétation
recherche recherche/étude
 La démarche pratique de recherche clinique
veille à répondre à une problématique
(échantillon) en anticipant les risques de biais
afin d'obtenir des résultats qui se
Conclusion
rapprochent le plus possible de la réalité Discussion

(population).

19/02/2020 21 19/02/2020 22

IV. La démarche de recherche clinique IV. La démarche de recherche clinique

 D’une manière générale, la recherche 1. Hypothèse clinique


clinique est basée sur une double démarche :  Physiopathologie : Ex les IEC devraient faire baisser
la tension artérielle
 Scientifique et technique, qui demande une
méthodologie rigoureuse ;  Observation clinique
 Ethique, car il s’agit d’une recherche pratiquée sur  Intuition
l’homme, ce qui requière un corpus réglementaire 2. Significativité statistique
et législatif pour la régir.  Vérification statistique de l’hypothèse : Permet
d’affirmer avec un risque d’erreur connu que la
différence observée entre TTT n’est pas due au
hasard
 Nombre de patients!!
19/02/2020 23 19/02/2020 24

4
Pr [Link]---Methodo 19/02/2020

IV. La démarche de recherche clinique Plan

3. Significativité médicale I. Introduction


 Lien de cause à effet II. Définition de la recherche clinique
 Absence de biais
III. Les objectifs de la recherche clinique
 Extrapolation?
 Intérêt clinique IV. La démarche de recherche clinique
 Service Médical Attendu : L’intérêt du produit V. Les acteurs de la recherche clinique
 Effet thérapeutique, diagnostique,
 Effets indésirables VI. Étapes de la recherche clinique
 Les risques liées à son utilisation…
 Le Service Médical Rendu (SMR) : Intérêt pour la santé publique
 Son impact sur la santé de la population,
 Sa place dans la stratégie thérapeutique (notamment au regard
des autres thérapies disponibles)
19/02/2020 25 19/02/2020 26

VI. Les acteurs de la Recherche Clinique 1. Promoteur

 Recherche clinique = approche  La personne physique ou morale qui prend


pluridisciplinaire nécessitant l’intervention de l’initiative d’une recherche biomédicale,
différents acteurs :  Assume la responsabilité de sa mise en œuvre,
1. Promoteur de sa supervision et de son financement
2. Investigateur  et assure le respect des obligations qui y
3. Intervenants correspondent en application des dispositions
4. Personne participante de la loi
5. Comité d’éthique  Nature
 Public : CHU…
Article premier projet de loi n° 28-13 relative a la protection  Privé : Laboratoire industriel, …
Des Personnes participant aux recherches biomédicales
19/02/2020 27 19/02/2020 28

2. Investigateur 3. Intervenants

 Le médecin ou le médecin dentiste, selon le  La personne physique qui collabore avec


cas, qui dirige, surveille la réalisation pratique l’investigateur à la réalisation de la recherche
de la recherche biomédicale et participe à biomédicale.
l’analyse et à la publication de ses résultats.  Exemples
 Personnel médical et paramédical
 Attaché de recherche clinique (ARC)
 Biostatisticien
 Data-manager…

19/02/2020 29 19/02/2020 30

5
Pr [Link]---Methodo 19/02/2020

4. Personne participante 5. Comité d’éthique

 Toute personne sur laquelle une recherche  Evaluation:


biomédicale est effectuée.  Méthodologie de la recherche et de sa pertinence
générale
 Conformité aux dispositions relatives à la
 Examen médical préalable
protection des personnes
 Documents d’information et de recueil du
consentement

19/02/2020 31 19/02/2020 32

VI. Les acteurs de la Recherche Clinique Plan

I. Introduction
II. Définition de la recherche clinique
III. Les objectifs de la recherche clinique
IV. La démarche de recherche clinique
V. Les acteurs de la recherche clinique
VI. Étapes de la recherche clinique

19/02/2020 33 19/02/2020 34

VI. Étapes de la recherche clinique VI. Étapes de la recherche clinique

 D’une manière générale, on définit 6 étapes


de la recherche clinique, a savoir :
 Définition du sujet de recherche
• Publications
 Recherche documentaire • Communications aux
 Élaboration du protocole congrès,
• Rapports
 La réalisation de l’enquête
 Traitement et analyse des données
 Diffusion et publication

19/02/2020 35 19/02/2020 36

6
Pr [Link]---Methodo 19/02/2020

Plan

Chapitre 2. I. Définition du sujet de recherche


Choix du sujet de recherche
Le sujet de recherche clinique II.

III. Formulation de l’objectif


IV. Choix des critères de jugement (endpoints)
V. Définition des variables à mesurer
Pr EL ARBI BOUAITI
Faculté de médecine et de pharmacie - Rabat

19/02/2020 38

I. Définition du sujet de recherche Plan

 Avant de commencer un projet de recherche I. Définition du sujet de recherche


clinique, il est essentiel de définir le sujet de II. Choix du sujet de recherche
recherche et le transformer en une III. Formulation de l’objectif
question ou une hypothèse de recherche.
IV. Choix des critères de jugement (endpoints)
Idée? Définition des variables à mesurer
V.
Sujet de recherche
Question de recherche
L’hypothèse ou parfois les hypothèses

Le point fondamental
19/02/2020 39 19/02/2020 40

Plan II. Choix du sujet de recherche

I. Définition du sujet de recherche  Choix du sujet : Comment spécifier sa


II. Choix du sujet de recherche problématique ?
III. Formulation de l’objectif a. Trouver un problème initial

IV. Choix des critères de jugement (endpoints)


b. Définir correctement le sujet
V. Définition des variables à mesurer
c. Transformer le sujet en une « question (s) de
recherche »

Choix du sujet : 3 étapes


19/02/2020 41 19/02/2020 42

7
Pr [Link]---Methodo 19/02/2020

a. Trouver un problème initial a. Trouver un problème initial

 Motivation d’une recherche clinique : Deux sources


 répondre à une question,
 explorer une hypothèse,
 mettre en évidence des facteurs
Une question « terrain » qui
apparaît Une question « théorie » qui
pronostiques, au cours de votre pratique
et qui fait lien avec de la
fait sens avec votre
expérience professionnelle
 tester l’efficacité d’un traitement théorie

• un problème diagnostique /
 ... thérapeutique soulevé par le
problème initial milieu professionnel
• une situation problématique que
• une lecture qui vous inspire

vous diagnostiquez
19/02/2020 43 19/02/2020 44

a. Trouver un problème initial a. Trouver un problème initial

Deux sources

Une question « terrain » qui


apparaît Une question « théorie » qui
au cours de votre pratique fait sens avec votre
et qui fait lien avec de la expérience professionnelle
théorie

EXEMPLES ??? EXEMPLES ???

19/02/2020 45 19/02/2020 46

a. Trouver un problème initial b. Définir correctement le sujet

 Le sujet de recherche doit être :


 Justifiée : elle a fait l’objet d’une étude
bibliographique montrant que la question n’a pas déjà
été résolue ou qu’elle nécessite de nouvelles istigation
 Réalisable : l’investigateur principal a l’expérience
nécessaire pour la conduire, les contraintes éthiques
sont respectées;
 Utile : les résultats permettront une avancée
scientifique (au sens large), et elles pourront être
utilisées en pratique courante avec un niveau de
preuve suffisant.

19/02/2020 47 19/02/2020 48

8
Pr [Link]---Methodo 19/02/2020

b. Définir correctement le sujet b. Définir correctement le sujet

 Le sujet de recherche doit être :  Le sujet de recherche doit être :


 Justifiée : la question n’a pas déjà été résolue ou  Justifiée : la question n’a pas déjà été résolue ou
qu’elle nécessite de nouvelles investigations; qu’elle nécessite de nouvelles investigations ;

 Réalisable : l’investigateur principal a l’expérience  Réalisable : l’investigateur principal a l’expérience et


nécessaire pour la conduire, les contraintes éthiques les moyens nécessaires pour la conduire, les
sont respectées; contraintes éthiques sont respectées;
 Utile : les résultats permettront une avancée
scientifique (au sens large), et elles pourront être  Utile : les résultats permettront une avancée
utilisées en pratique courante avec un niveau de scientifique (au sens large), et elles pourront être
preuve suffisant. utilisées en pratique courante avec un niveau de
preuve suffisant.
19/02/2020 49 19/02/2020 50

b. Définir correctement le sujet b. Définir correctement le sujet

 Le sujet de recherche doit être :


 Justifiée : la question n’a pas déjà été résolue ou
qu’elle nécessite de nouvelles investigations ;

 Réalisable : l’investigateur principal a l’expérience


nécessaire pour la conduire, les contraintes éthiques
sont respectées;

 Utile : les résultats permettront une avancée


scientifique (au sens large), et elles pourront être
utilisées en pratique courante avec un niveau de
preuve suffisant.
19/02/2020 51 19/02/2020 52

b. Définir correctement le sujet c. Transformer le sujet en une « question (s)


de recherche »
 Traduire un problème initial en problématique
de recherche : hypothèses de la recherche

QUESTION(S) de RECHERCHE

Choix de l’étude

19/02/2020 53 19/02/2020 54

9
Pr [Link]---Methodo 19/02/2020

c. Transformer le sujet en une « question c. Transformer le sujet en une « question


(s) de recherche » (s) de recherche »
 Exemples : Deux interrogations fondamentales :
 Cause : Quels sont les déterminants de la maladie ?
Traitement : Comment le traitement change-t-il la progression de
• Quoi ? Décrire un phénomène

la maladie ?
 Diagnostic : Les tests utilisés pour le diagnostic sont-ils fiables et
valides ?
 Pronostic : Quelles sont les conséquences de la maladie?
• Pourquoi ? Rechercher la cause
 Coût : Quel est le coût de la prise en charge d’un malade?
d’un phénomène
(étiologie)

Le choix de l’étude dépend de la question

19/02/2020 55 19/02/2020 56

c. Transformer le sujet en une « question c. Transformer le sujet en une « question


(s) de recherche » (s) de recherche »

19/02/2020 57 19/02/2020 58

c. Transformer le sujet en une « question c. Transformer le sujet en une « question


(s) de recherche » (s) de recherche »
 La question de recherche doit être clairement  La question de recherche doit être clairement
formulée : L’acronyme PICO formulée : L’acronyme PICO
 Patient : à qui s’adresse l’intervention, la méthode  Comparaison : à quoi éventuellement doit être
à appliquer ? comparée l’intervention décrite ci-avant ?
 Intervention : cherche-t-on des renseignements Méthode de référence, alternative ?
sur un traitement médicamenteux, un traitement  Outcome : issue clinique, pratique recherchée.
physique, une action d’éducation à la santé ?

19/02/2020 59 19/02/2020 60

10
Pr [Link]---Methodo 19/02/2020

c. Transformer le sujet en une « question c. Transformer le sujet en une « question (s) de


recherche »
(s) de recherche » Exemple : Semmelweiss (2)
 La question de recherche doit être  Justification de la mise en place d’une étude
Mortalité des femmes en couches
clairement formulée : L’acronyme PICO 

 Problème grave et fréquent


 Exemple  Conséquences importantes pour l’enfant, la famille, la société

 Y a-t-il un intérêt (O) à vacciner contre la  Question de recherche :


varicelle (I) les enfants d’âge préscolaire (P)  Y a t-il une relation entre le lavage
(C) entre des des
le lavage mains et la(I)
mains mortalité
et la des
femmes
mortalitéen(O)couches ?
des femmes en couches (P) ?
plutôt que de laisser se développer
spontanément les épidémies en milieu  PICO : Patient, Intervention, Comparaison, Outcome
scolaire (C) ?

19/02/2020 61 19/02/2020 62

Plan III. Formulation de l’objectif

I. Définition du sujet de recherche


II. Choix du sujet de recherche Sujet de recherche

III. Formulation de l’objectif


IV. Choix des critères de jugement (endpoints) Hypothèse de recherche
V. Définition des variables à mesurer

Objectif

19/02/2020 63 19/02/2020 64

III. Formulation de l’objectif III. Formulation de l’objectif

 L’objectif d’un travail de recherche doit être  La formulation d’un objectif doit obéir à
bien défini et écrit de façon très précise. certaines règles :
 Un objectif mal défini ne pourra pas mener à  On utilise un verbe actif à l’infinitif
une enquête bien construite.
 De plus, cet objectif doit être pertinent et  Faire références aux critères T.P.L
participer à l’amélioration des connaissances
scientifiques.  Eviter de multiplier les objectifs

Recherche documentaire ++++


19/02/2020 65 19/02/2020 66

11
Pr [Link]---Methodo 19/02/2020

III. Formulation de l’objectif Exemple : Semmelweiss (3)

 Un objectif principal  Hypothèse


 Unique  Les étudiants en contact avec du matériel cadavérique
introduisent un «agent invisible» chez les femme en
 Permet de conclure sur la signification de l’étude.
couches en les examinant qui pourrait être source de
 Définit en fonction : mortalité
 du schéma de l’étude;  Le lavage des mains avant examen doit être suivi
 du critère de jugement principal; d’une diminution de la mortalité en suites de couche
 Taille de l’échantillon.
 Objectif
 Des objectifs secondaires : Leur nombre  Etudier l’impact du lavage systématique des mains à
devra être limité. l'aide d'une solution de chlorure de calcium sur la
 Les objectifs secondaires sont utiles pour élargir mortalité en suites de couche
la portée des résultats
19/02/2020 67 19/02/2020 68

III. Formulation de l’objectif III. Formulation de l’objectif

19/02/2020 69 19/02/2020 70

III. Formulation de l’objectif III. Formulation de l’objectif

 Lecture critique :
 L’objectif de l’étude est de déterminer les facteurs
prédictifs épidémiologiques, cliniques et
biologiques de survenue d’une infection sous
biothérapie.

 Objectif de l’étude est de décrire les complications


néonatales secondaires à une dystocie des
épaules.

19/02/2020 71 19/02/2020 72

12
Pr [Link]---Methodo 19/02/2020

Plan IV. Choix des critères de jugement


(endpoints)
I. Définition du sujet de recherche  Définition :
II. Choix du sujet de recherche  Traduction explicite, précise et quantifiable de
l’objectif.
III. Formulation de l’objectif
 Un objectif = un critère de jugement / facteur
IV. Choix des critères de jugement (endpoints) d'intérêt
V. Définition des variables à mesurer  Doit permettre de :
 répondre à la question posée
 mesurer l’effet du facteur étudié
 définir La maladie ou le problème étudié

19/02/2020 73 19/02/2020 74

IV. Choix des critères de jugement IV. Choix des critères de jugement
(endpoints) (endpoints)
 Le critère de jugement peut être très divers :
 Un marqueur biologique,
 Qualité de vie,
 Un comportement (activité physique, observance
thérapeutique),
 Un indicateur médico-économique (consommation
de produits de santé, hospitalisations en
urgence…).
 Exemples
 Evaluer l’obésité : IMC

19/02/2020 Poser le diagnostic du diabète : glycémie à jeun 75 19/02/2020 76

IV. Choix des critères de jugement IV. Choix des critères de jugement
(endpoints) (endpoints)
 Le critère principal de jugement : Exemple 1 Exemple 2

Sujet de recherche Éradication de Helicobacter Antiagrégant dans la


 de préférence unique pylori dans la dyspepsie prévention cardiovasculaire
 servira au calcul du nombre de sujets
Critère de jugement Disparition des symptômes Décès + infarctus + AVC
nécessaires. principal de dyspepsie

 limite le nombre de tests statistiques Critères de jugement • Score de sévérité de la • Mortalité totale
secondaires dyspepsie (Glasgow) • Mortalité coronarienne
• Score de qualité de vie • Mortalité
• Éradication de H. pylori cardiovasculaire
 Les critères de jugement secondaires • Recours à un traitement • Infarctus mortel et non
antisecrétoire mortel
 définir les analyses secondaires. • Infarctus non mortels
• AVC mortel et non mortel
• AVC non mortels

19/02/2020 77 19/02/2020 78

13
Pr [Link]---Methodo 19/02/2020

IV. Choix des critères de jugement VI. Choix des critères de jugement
(endpoints) (endpoints)
 Le critère de jugement doit être:
 cliniquement pertinent et admis par la communauté
scientifique internationale;
 Pertinent : par rapport à la maladie, au traitement, …à la
question posée (l’objectif principal).
 C’est le point majeur !
 Exemple : Evaluer l’évolution de l’artériopathie des membres
inférieurs : le critère de jugement est la mesure du périmètre de
marche :
 Augmentation significative de 20 m : Quel intérêt de passer de 200m à 220m.
 Fréquence du succès : fréquence des patients retrouvant sous traitement un
périmètre de marche de 500m.

19/02/2020 79 19/02/2020 80

IV. Choix des critères de jugement IV. Choix des critères de jugement
(endpoints) (endpoints)
 Le critère de jugement doit être:  Le critère de jugement doit être:
 Méthodologiquement acceptable :  répétable : même résultat si la mesure est
 clair : tous les médecins peuvent comprendre la même répétée par la même personne dans les
chose; mêmes conditions;
 de mesure aisée : obtenu, si possible facilement,
chez tous les sujets;  reproductible: même résultat si la mesure est
 validé: reconnu par la communauté scientifique; répétée par deux personnes différentes dans
 éthique les mêmes conditions;

19/02/2020 81 19/02/2020 82

VI. Choix des critères de jugement IV. Choix des critères de jugement
(endpoints) (endpoints)
 Parmi les différentes formes que peut revêtir un critère  Mesure des critères de jugement
de jugement, on préfèrera lorsque c’est possible :
 Les outils de mesure du critère de jugement
conditionnent l’intérêt des résultats.
 un critère objectif (mesuré, comme l’IMC ou
l’albuminémie) à un critère subjectif (apprécié, comme  On distingue deux types de mesure :
l’appétit ou la douleur) ;  Mesure objective : dosages, mensurations,
radiographies…
 un critère quantitatif à un critère qualitatif ;  Mesure subjective: appréciation de la douleur par
questionnaire….
 un critère unique, constitué par une seule mesure,
plutôt que composite (combinaison de paramètres,
scores...).
19/02/2020 83 19/02/2020 84

14
Pr [Link]---Methodo 19/02/2020

IV. Choix des critères de jugement VI. Choix des critères de jugement
(endpoints) (endpoints)
 La qualité d’un critère de jugement et de
l’outil pour le mesurer est déterminante.
 Une intervention efficace pourrait à tort ne
pas être démontrée par le choix
 d’un mauvais critère de jugement.
 ou d’un outil de mesure pas assez sensible.
 La recherche biographique ++++

Un choix parfois difficile


19/02/2020 85 19/02/2020 86

VI. Choix des critères de jugement Plan


(endpoints)
I. Définition du sujet de recherche
II. Choix du sujet de recherche
III. Formulation de l’objectif
IV. Choix des critères de jugement (endpoints)
V. Définition des variables à mesurer

19/02/2020 87 19/02/2020 88

V. Définition des variables à mesurer V. Définition des variables à mesurer

 Exemple : On s’intéresse à la douleur aiguë


dans un service des urgences d’une structure de
 Pour démarrer le projet de recherche, on doit soin.
définir les caractéristiques et les variables à  Objectif principal de l’étude : connaitre le taux de
mesurer pour répondre à l’objectif principale et patients douloureux.
les objectifs secondaires de l’étude.  Les variables mesurées : l’âge, le sexe, le motif
de consultation, les antécédents pathologiques,
siège de la douleur, intensité de la douleur,….

19/02/2020 89 19/02/2020 90

15
Pr [Link]---Methodo 19/02/2020

V. Définition des variables à mesurer V. Définition des variables à mesurer


Variables qualitatives
 Trois types de variables :  Une variable statistique est qualitative si
 ses valeurs correspondent à des « qualités » non
 Variables qualitatives, mesurables sur une échelle.
les réponses possibles s’expriment par des modalités
 Variables quantitatives,

(ou classes) : présence ou à l’absence d’une


 Variables censurées.
caractéristique.

 Exemple : Situation professionnelle : actif,


étudiant, retraité...

19/02/2020 91 19/02/2020 92

V. Définition des variables à mesurer V. Définition des variables à mesurer


Variables qualitatives Variables quantitatives
Variable qualitative nominale Variable qualitative ordinale  Une variable statistique est quantitative si ses
 C'est une variable qualitative  C'est une variable qualitative
dont les modalités ne sont pas dont les modalités sont valeurs sont représentées
ordonnées. naturellement ordonnées.  par des quantités,
 Exemples:  Exemples :  par des valeurs numériques
 Deux modalités possibles :  Niveau d’étude : Primaire,  sur lesquels les opérations arithmétiques (somme,
Dichotomique/ binaire secondaire, universitaire.
Sexe : homme ou femme
différence...) ont un sens.
  Stade de gravité d’une maladie
 État de santé : malade ou sain : Modéré, sévère, très sévère.
 Plus de deux modalités
possibles :
 Groupe sanguin A, B, AB, O
 Situation familiale : Célibataire,
marié, divorcé, veuf

19/02/2020 93 19/02/2020 94

V. Définition des variables à mesurer V. Définition des variables à mesurer


Variables quantitatives La discrétisation
Variable quantitative discrète Variable quantitative continue
ou discontinue
 Discrétisation : La transformation d'une
 C'est un caractère quantitatif  C'est un caractère quantitatif variable quantitative en variable
qui ne prend qu'un nombre fini
de valeurs.
qui peut prendre toutes les qualitative.
valeurs possibles d'un
 Les valeurs possibles sont des intervalle de l'ensemble des  Exemples
valeurs entières, nombres réels (Entre un
dénombrables et peuvent être minimum et un maximum).  Age < 20, [20-25[, [25-30[,  30.
donné sous la forme d’une  Nombre de cigarettes/j = 0, [1-10[, [11-20[, > 20.
liste. Exemples : Âge, poids, taille,
  Hémoglobine : Hg < 13 g/dl (anémie) ou Hg > 13 g/dl
 Exemple : Nombre d’enfants niveau de cholestérol,… .
d’une famille : 0, 1, 2, 3, 4, (pas d’anémie)
…10

19/02/2020 95 19/02/2020 96

16
Pr [Link]---Methodo 19/02/2020

V. Définition des variables à mesurer V. Définition des variables à mesurer


Variables censurées Variables censurées
 Ce sont des variables évoluant avec le temps.  L’événement correspond toujours à une variable d’état
de nature binaire.
 On les retrouve surtout dans les analyses de
survie concernant les « exclus-vivants » et les
 Le critère de jugement correspond au délai entre deux
« perdus de vue » dont on ne connaît pas l’état
dates : Date de début (date d’inclusion dans l’étude ou
au moment de la mesure. date diagnostic…) et la Date de fin (décès ou tout autre
 L’analyse des données censurée (on parle aussi événement de santé…).
des données de survie) correspond à l’étude de
l’apparition d’un évènement au cours du temps.  Exemples :
 Temps de survie après le diagnostic d’un cancer du sein.
 Durée de séropostivité sans symptômes chez les patients infectés par le
VIH.

19/02/2020 97 19/02/2020 98

V. Définition des variables à mesurer V. Définition des variables à mesurer


Variables censurées Exemples
Date d’origine) Date de point

Date de dernières
nouvelles
DDN

Date d’origine (DO) : Date à laquelle le sujet est considéré comme entrant dans
l’étude.
Date de point (DP) : Date à laquelle l’étude se termine (fin du recueil de données)
Date de dernières nouvelles (DDN) : lors d’un décès ou d’un perdu de vue

19/02/2020 99 19/02/2020 100

V. Définition des variables à mesurer 4. Les variables en résumé


Exemples
Binaires
Variables
qualitatives
Nominales

Variables Ordinales

Variables
Continues
quantitatives

Discrètes
Variables
censurées
19/02/2020 101 19/02/2020 102

17
Pr [Link]---Methodo 19/02/2020

Plan

Chapitre 3. I. Introduction
II. La recherche bibiographique
La recherche bibliographique III. Trouver les bons « mots clés »
IV. Les sources d’information
Pr EL ARBI BOUAITI V. Méthodes de la recherche bibliographique
Faculté de médecine et de pharmacie - VI. Les étapes de la recherche bibliographique
Rabat
[Link] gestion bibliographique

19/02/2020 104

I. Introduction I. Introduction

 La recherche bibliographique : • Sujet de recherche?


 Préalables à toute recherche clinique • Question(s) de recherche?
 Questionner son sujet de recherche: qui,
quand, quoi, où, comment, pourquoi ? • Objectif principal et objectifs secondaires?

QQQOCP • Critères de jugement et outils de mesure?


 Redéfinir le sujet de recherche : aller du
• Variables étudiées?
plus général au plus spécifique.
La recherche bibliographique
19/02/2020 105 19/02/2020 106

Plan II. La recherche bibliographique

I. Introduction  La recherche bibliographique est


II. La recherche bibiographique  une démarche systématique, qui consiste à
identifier, récupérer et traiter des données
III. Trouver les bons « mots clés » publiées ou non.
IV. Les sources d’information  une démarche intellectuelle dont l’objectif final est
V. Méthodes de la recherche bibliographique de trouver et de lire des documents sur un sujet
donné.
VI. Les étapes de la recherche bibliographique
 une étape indispensable à toute synthèse des
[Link] gestion bibliographique connaissances et revue de la littérature dans le
domaine médical.

19/02/2020 107 19/02/2020 108

18
Pr [Link]---Methodo 19/02/2020

II. La recherche bibliographique II. La recherche bibliographique


Objectifs Finalité
 Situer la recherche dans le champ des
connaissances actuelles : La finalité d'une bonne méthodologie de
 Que sait-on ?, Quelles sont les lacunes ?... recherche est de faciliter la production d'un
 Affiner la problématique / hypothèse de la travail universitaire alliant richesse
recherche documentaire et rigueur scientifique.
 Trouver les arguments de justification de
l’importance du problème
 Chercher une éventuelle modification de
résultats selon le moment de l’action
19/02/2020 109 19/02/2020 110

II. La recherche bibliographique Plan


Principes
Identification des mots clés
I. Introduction
Le choix des références scientifiques
II. La recherche bibiographique
III. Trouver les bons « mots clés »
Lecture des textes scientifiques (en anglais) IV. Les sources d’information
V. Méthodes de la recherche bibliographique
Identification des La définition et la Identification des VI. Les étapes de la recherche bibliographique
thèmes, sélection des outils et des
problématiques, variables (critères instruments de [Link] gestion bibliographique
questions, méthodes de jugement) à mesure.
de recherche. étudier.

La définition des méthodes et les outils statistiques


19/02/2020 111 19/02/2020 112

III. Trouver les bons « mots clés » III. Trouver les bons « mots clés »

 Les mots-clés sont ceux qui seront introduits Formuler sa question


dans le moteur de recherche afin d’identifier les Grossesses sous anticoagulants : L'anesthésie
locorégionale est-elle indiquée à l'accouchement ?
références bibliographiques qui vont servir a
améliorer votre travail de recherche. Femmes Accouchement
enceintes

anticoagulants
 Pour définir la liste des mots clés : locorégionale

Quoi ? Qui ? Quand ? Où ? Comment ? Anesthésie

Combien ? Pourquoi ?
La méthode QQQOCP

19/02/2020 113 19/02/2020 114

19
Pr [Link]---Methodo 19/02/2020

III. Trouver les bons « mots clés » III. Trouver les bons « mots clés »
Synonymes
 MEdical Subject Headings (MeSH):
Un principe : Faire simple !  Un thésaurus de mots-clés.
Un minimum de termes, le plus signifiants possibles  Un outil incontournable dans le monde médical.
 Les mots clés sont normalisés, hiérarchisés, et permettent de décrire le
Exemple : contenu des articles et interroger les bases de données (BDD).

Quels sont les examens disponibles pour le diagnostic du  La recherche des mots-clés dans le MeSH
cancer du côlon ?  Multiplie les chances de trouver les articles qui sont pertinents pour la
recherche
 Et permet d’effectuer des recherches plus fines (gestion des
Question : synonymes).
 Exemple :
Quelles sont les techniques actuelles de diagnostic du  Cardiac arrest = heart arrest = cardiopulmonary arrest
cancer du sein?
Outils informatiques +++
19/02/2020 115 19/02/2020 116

III. Trouver les bons « mots clés » III. Trouver les bons « mots clés »
Journal des mots clès Outils terminologiques
 Consigner les mots-clés dans un journal  U.S. National Library of Medicine:
 Exemple : Quels sont les impacts de la vaccination contre la
grippe de type A chez les enfants?
[Link]
 Pubmed:
Vaccin Grippe A Enfants [Link]
Vaccine Grippe de type A Child
 MeSH bilingue de l’INSERM:
Vaccinum Influenza A Children
[Link]
Influenza de type A Cette version bilingue est souvent utilisée comme outil de traduction, ainsi que
A-type influenza pour l'indexation et l'interrogation de bases de données en français.
Type A influenza  Cismef : Catalogue et Index des Sites Médicaux
Flu A Francophones.
Flu type A [Link]/cismef/
A flu type

19/02/2020 117 19/02/2020 118

Pubmed: Pubmed:
[Link] [Link]

19/02/2020 119 19/02/2020 120

20
Pr [Link]---Methodo 19/02/2020

Cismef : [Link]/cismef/ Cismef : [Link]/cismef/

19/02/2020 121 19/02/2020 122

Cismef : [Link]/cismef/ Plan

I. Introduction
II. La recherche bibiographique
III. Trouver les bons « mots clés »
IV. Les sources d’information
V. Méthodes de la recherche bibliographique
VI. Les étapes de la recherche bibliographique
[Link] gestion bibliographique

19/02/2020 123 19/02/2020 124

IV. Les sources d’information IV. Les sources d’information


Les différentes ressources
 Les «bons mots-clés trouvés »  Les documents
 Thèses
Les moteurs de  Articles de revue
recherche
 Ouvrages publiés
 Rapports,
 Résultats : nombre d’articles très élevé  ….
 Internet (moteurs de recherche)
Divers filtres peuvent être utilisés :
limite de date de publication, type de  Ressources « libres » = Accès web gratuit
publication (méta-analyse, essais  Ressources en accès restreint
cliniques), etc.
 Littérature grise (celle qui ne passe pas par un
éditeur)
19/02/2020 125 19/02/2020 126

21
Pr [Link]---Methodo 19/02/2020

IV. Les sources d’information CISMeF


Les moteurs de recherche
 CISMeF  CISMeF: Catalogue et Index des Sites
 PubMed / Medline Médicaux de langue Française
 Recense les principales ressources médicales francophones sur
 ClinicalKey le Web en accès libre et gratuit
 Science direct  Plus de 100 000 ressources
 Ressources = sites + documents
 Cochrane  Ressources sélectionnées => Qualité (sources institutionnelles
et universitaires)
 Google scholar  Public : Étudiants, patients, professionnels de santé

[Link]
[Link]
19/02/2020 127 19/02/2020 128

CISMeF Medline / PubMed

 Medline :
 Medical Literature Analysis and Retrieval System
Online
 U.S. National Library of Medicine
 Base de données bibliographiques (articles
uniquement)

[Link]

19/02/2020 129 19/02/2020 130

PubMed / Medline PubMed / Medline

 PubMed : principal accès gratuit à Medline


 Base de données gratuite via le site web du NCBI
(National Center for Biotechnology Information)

[Link]

19/02/2020 131 19/02/2020 132

22
Pr [Link]---Methodo 19/02/2020

ClinicalKey ClinicalKey

 ClinicalKey donne accès à plus de


 30 spécialités médicales.
 1 000 manuels,
 600 revues en texte intégral,
 des illustrations, des vidéos
 et des documents d’information
personnalisables destinés aux patients,
[Link]
19/02/2020 133 19/02/2020 134

ScienceDirect ScienceDirect

 Une des plus vastes collection d’articles


scientifiques du monde (plus de 2500 titres de
revues publiés)
 Des livres (plus de 6000)
 Texte intégral disponible
 DOMAINES COUVERTS
 Sciences Physiques et technologie
 Sciences de la vie
 Sciences de la santé
 Sciences Humaines et sociales
19/02/2020
[Link] 135 19/02/2020 136

Cochrane Cochrane

 Outil de référence pour la recherche d’essais


contrôlés randomisés.
 Ensemble de BDD de revues systématiques et
méta analyses produites par la « Cochrane
Collaboration », organisation internationale de
médecins ou chercheurs bénévoles depuis 1993.
 Références d’articles, de protocoles
thérapeutiques randomisés
 Des revues sur les études méthodologiques
(Methods Reviews) préparées la Cochrane Library
et selon le protocole PICO (Patient Intervention
Comparison Outcome).
19/02/2020 137 [Link]
19/02/2020 138

23
Pr [Link]---Methodo 19/02/2020

Cochrane Google scholar


 Lancé en 2004.
 Couverture : multidisciplinaire mais le domaine sciences
et techniques beaucoup plus représenté.
 Documents : articles de revues scientifiques,
prépublications, résumés, références bibliographiques
(Livres, thèses, citations), rapports techniques…
 A utiliser:
 Pour une première approche et une recherche non exhaustive sur un sujet.
 Pour une recherche croisée, multidisciplinaire.
 Pour trouver des ressources en texte intégral, en libre accès.
 Pour trouver un article spécifique dans un journal spécifique.

19/02/2020 139 19/02/2020 140

Google scholar Plan

I. Introduction
II. La recherche bibiographique
III. Trouver les bons « mots clés »
IV. Les sources d’information
V. Méthodes de la recherche bibliographique
VI. Les étapes de la recherche bibliographique
[Link] gestion bibliographique

19/02/2020 141 19/02/2020 142

V. Méthodes de la recherche bibliographique Recherche simple

 Préambule : Tenir un journal de la recherche.  A partir de la page d’accueil.


 Conserver les mots-clés et MeSH trouvés
 Noter les outils de recherche à utiliser  Utile pour un sujet très pointu et pour retrouver
 Noter les résultats (date de la requête, nombre de tous les articles.
résultats, etc.)
 Ou tout autre information pertinente  Se familiariser avec son sujet en lisant des textes
 Méthodes: généraux, d’introduction.
 Recherche simple
 Recherche avancée  Au besoin, réajuster les mots-clés selon les
résultats.
19/02/2020 143 19/02/2020 144

24
Pr [Link]---Methodo 19/02/2020

Recherche simple Recherche simple

 La troncature * : remplace plusieurs caractères à


partir de la racine d’un mot.
 Avant le mot étudié : *algie recherche tous les mots se
terminant par algie
 A la fin du mot étudié : Ado* recherche tous les mots qui " -- "  pour chercher une expression
commencent par ado exacte
Exemples: "complication du paludisme"
therap* ramène therapy, therapies, therapist,
therapists, therapeutic, therapeutically.
cardio* = cardiologie, cardiologies, cardiopathie,
cardiotoxins, cardiomyopathy

19/02/2020 145 19/02/2020 146

Recherche simple Recherche avancée


PubMed / Medline
 Pour croiser plusieurs termes et préciser la
typologie des ressources recherchées

19/02/2020 147 19/02/2020 148

Recherche avancée Recherche avancée


Combiner les mots clés Combiner les mots clés
Les opérateurs booléens
( )  pour construire des requêtes complexes; pour insérer une
 OU / OR : additionne les termes. requête dans une requête
Paludisme ou complication
Elargit la recherche avec des synonymes (paludisme OR malaria) AND (complication OR prognosis)

 ET / AND : combine 2 concepts différents.


Paludisme et complication

 SAUF / NOT : exclut un terme.

Paludisme sauf complication

19/02/2020 149 19/02/2020 150

25
Pr [Link]---Methodo 19/02/2020

Recherche avancée Recherche avancée


Combiner les mots clés PubMed / Medline
Exemple : Quels sont les impacts de la vaccination contre la
grippe de type A chez les enfants?

vaccin*
AND
("grippe A" OR "grippe de type A" OR "influenza A" OR "influenza de
type A" OR "A-type influenza" OR "type A influenza" OR "flu A" OR "flu
type A" OR
"A flu type" )
AND
(enfant* OR child*)
Recherche avancée

19/02/2020 151 19/02/2020 152

Recherche avancée Recherche avancée


PubMed / Medline PubMed / Medline

19/02/2020 153 19/02/2020 154

Plan V. Les étapes de la recherche bibliographique


1. Définition et Choix du sujet de recherche

I. Introduction 2. Identification des mots clés


II. La recherche bibiographique
3. Identification des synonymes des mots clés (français / anglais)
III. Trouver les bons « mots clés » (MeSH)

IV. Les sources d’information 4. Faire la recherche :


Identifier les sources d’information
V. Méthodes de la recherche bibliographique Le choix des moteurs de recherche (Pubmed)
VI. Les étapes de la recherche bibliographique
5. Évaluer les résultats :
[Link] gestion bibliographique Lecture des textes scientifiques
Le choix des références scientifiques

6. Utiliser les informations


19/02/2020 155 19/02/2020 156

26
Pr [Link]---Methodo 19/02/2020

Plan VI. La gestion bibliographique

I. Introduction  La gestion bibliographique : 2 éléments :


II. La recherche bibiographique  Références à citer dans le texte
 (1), [1], 1, (auteur, année)
III. Trouver les bons « mots clés »  Par ordre d’apparition dans le texte ou par ordre alphabétique
IV. Les sources d’information  À la fin du document: liste des références
bibliographiques en détail.
V. Méthodes de la recherche bibliographique
VI. Les étapes de la recherche bibliographique
[Link] gestion bibliographique

19/02/2020 157 19/02/2020 158

VI. La gestion bibliographique VI. La gestion bibliographique


Écrire une bibliographie Écrire une bibliographie
 Style VANCOUVER  Style VANCOUVER
 Articles: nom1 initial, nom 2 initial. Titre article. Revue  Livres: Auteur Initial. Titre. N° d’édition. Ville: Editeur;

abrégée année; volume (numéro): n° de pages année

Dumont A, Bessieres N, Benbassa A, et al. Dépistage du Baccino E. Médecine de la violence : Prise en charge
cancer du col utérin en milieu rural à Madagascar : des victimes et des agresseurs. Paris : Ed. Masson;
faisabilité , couverture et incidence. J Gynecol Obstet 2006.
Hum Reprod 2017;46(4):327–32.

19/02/2020 159 19/02/2020 160

VI. La gestion bibliographique VI. La gestion bibliographique


Les logiciels
 La gestion bibliographique :  Logiciels libres (open source) et gratuits :
 Zotero (payant avec un compte en ligne et un stockage de
Logiciel de gestion bibliographique références au- delà de 100 Mo)
 Connotea
 JabRef
est un logiciel destiné à établir, trier et utiliser des listes
 Bibus
de références bibliographiques d'articles, d'ouvrages
ou même de sites web concernant des publications  Logiciels propriétaires et gratuit :
scientifiques.  EndNote Basic
 Mendeley (payant si l’on souhaite profiter de davantage de
capacités et de fonctions)
L'objectif principal de ces logiciels est de faciliter la  Logiciels propriétaires et payants :
gestion des références nécessaires à un chercheur.  EndNote
 Refworks
19/02/2020 161 19/02/2020 162

27
Pr [Link]---Methodo 19/02/2020

VI. La gestion bibliographique


Les logiciels
Chapitre 4.
Différents types de design d’études
cliniques et épidémiologiques
Pr EL ARBI BOUAITI
[Link] Faculté de médecine et de pharmacie - Rabat

[Link]

19/02/2020 163

Plan I. Introduction

I. Introduction  La classification des études épidémiologiques


II. Classification des études cliniques et épidémiologiques repose sur différents critères :
III. Les études expérimentales  Les objectifs de l'étude : descriptive ou analytique.
IV. Les études descriptives  Le degré de contrôle de l'investigateur :
 L'investigateur contrôle tous les paramètres : étude
V. Les études de cohortes expérimentale.
VI. Les études cas témoins  L'investigateur ne contrôle pas tous les paramètres : étude

VII. Choix d’un type d’étude de recherche clinique observationnelle.


La situation dans le temps et le suivi : étude prospective ou
VIII. Les niveaux de preuves 
rétrospective.
 Le mode de sélection des sujets : exhaustive et échantillonnage.

19/02/2020 165 19/02/2020 166

I. Introduction I. Introduction

 Les différents types d’études cliniques


 Exploratoire : l’étude va servir à mieux connaître
une situation ou à déterminer l’effet d’une
intervention.
Exemple : essais thérapeutiques de phase i et ii
 Confirmatoire : l’objectif principal va être de

confirmer sur un plus grand nombre de sujets


l’hypothèse de départ, éventuellement proposée
par l’étude exploratoire.
Exemple : les essais thérapeutiques de phase iii

19/02/2020 167 19/02/2020 168

28
Pr [Link]---Methodo 19/02/2020

I. Introduction I. Introduction

 Les différents types d’études cliniques  Les différents types d’études cliniques
 Rétrospective : on utilise des données qui ont
déjà été recueillies (consultation de dossiers) ;  Quantitative : le critère de jugement est quantitatif
 Prospective : les données seront recueillies sur (valeurs continues) ;
les sujets après la mise en place de l’étude ;
 Transversale : les données sont recueillies une  Qualitative : le critère de jugement est qualitatif
seule fois ; (classes)
 Longitudinale : les mêmes données sont
recueillies avant, (pendant) et après l’intervention.

19/02/2020 169 19/02/2020 170

Plan II. Classification des études cliniques

I. Introduction  On distingue deux grands types d’études


II. Classification des études cliniques cliniques :
III. Les études expérimentales
IV. Les études descriptives
 Les études interventionnelles
V. Les études de cohortes
VI. Les études cas témoins
VII. Choix d’un type d’étude de recherche clinique  Les études non interventionnelles
VIII. Les niveaux de preuves

19/02/2020 171 19/02/2020 172

II. Classification des études cliniques II. Classification des études cliniques

Les recherches non interventionnelles ou observationnelle :


Aussi appelées études non expérimentales.
Elles peuvent être à visée descriptive ou étiologique.
Le choix en fonction de l’objectif Le chercheur va observer la réalité sans intervenir sur les
conditions d’exposition des sujets.

19/02/2020 173 19/02/2020 174

29
Pr [Link]---Methodo 19/02/2020

II. Classification des études cliniques II. Classification des études cliniques

Les recherches non interventionnelles ou observationnelle : Les recherches non interventionnelles ou observationnelle :
Visent à collecter des informations ou des données personnelles de santé sans Collections biologiques : réunion, à des fins scientifiques, de prélèvements biologiques
intervention directe sur la personne. effectués sur un groupe de personnes identifiées et sélectionnées en fonction des
Dans ce cas, aucune procédure supplémentaire de diagnostic ou de surveillance ne doit caractéristiques cliniques ou biologiques d’un ou plusieurs membres du groupe ainsi
être appliquée aux patients et des méthodes épidémiologiques sont utilisées pour que des dérivés de ces prélèvements
analyser les données recueillies. Observationnelle : suivi de cohorte - traitements, investigations, consultations de suivi
de la pratique courante
19/02/2020 175 Sur les données : aucune interférence avec le soin du malade
19/02/2020 176

II. Classification des études cliniques II. Classification des études cliniques

Les recherches interventionnelles: Les recherches interventionnelles:


- Soit des recherches comportant une intervention non incluse dans la prise en charge Recherches Biomédicales (RBM) Recherches organisées et pratiquées sur l’être
médicale habituelle des personnes ; humain en vue du développement des connaissances biologiques ou médicales.
- Soit des recherches comportant des risques et des contraintes négligeables et ne Recherches visant à évaluer les soins courants :
portant pas sur des médicaments ; - Recherches autres que celles portant sur les médicaments, lorsque les actes sont
- Soit des essais cliniques portant sur des médicaments expérimentaux ou des pratiqués et les produits utilisés de manière habituelle mais que des modalités
investigations cliniques portant sur des dispositifs médicaux, particulières de surveillance sont prévues par un protocole.
19/02/2020 177 19/02/2020 178

II. Classification des études cliniques II. Classification des études cliniques
Définition du schéma de l’étude Définition du schéma de l’étude
 Les études de cohorte sont observationnelles
sur l’être humain et prospectives.

 Les études de prévalence sont


observationnelles sur les données et
transversales.

 Les essais cliniques sont interventionnels (RBM)


et prospectifs.

19/02/2020 179 19/02/2020 180

30
Pr [Link]---Methodo 19/02/2020

Plan III. Les études expérimentales

I. Introduction  Dans les études expérimentales, l'investigateur


II. Classification des études cliniques contrôle tous les paramètres.
III. Les études expérimentales  Il peut intervenir sur :
IV. Les études descriptives  Le ou les facteurs d’exposition,
V. Les études de cohortes  Le moment d’exposition,
VI. Les études cas témoins  Les personnes exposées.
VII. Choix d’un type d’étude de recherche clinique
 L’intérêt des études expérimentales est de
VIII. Les niveaux de preuves
pouvoir donner une interprétation causale aux
associations observées entre exposition et
maladie.
19/02/2020 181 19/02/2020 182

III. Les études expérimentales III. Les études expérimentales

 Le schéma idéal est celui de l’expérimentation randomisée comme  Le principe de randomisation :


dans l’essai thérapeutique de phase III :  L’étude est dite randomisée si l’affectation des sujets à un groupe ou à un autre
 Dans un premier temps, les groupes vont être suivis puis comparés entre eux. est tirée au sort.
 C’est le hasard qui détermine donc l’appartenance du sujet à un groupe.
 Ainsi, seul le groupe d’appartenance des sujets semble pouvoir différencier les
sujets entre eux.
 La randomisation permet de limiter les biais des études.
 Les études ou essais randomisés sont qualifiés :
 D’ouverts quand le traitement est connu de tous,
 En simple aveugle (Insu) quand seuls les patients ignorent la nature du
traitement,
 En double aveugle (Insu) quand patients et médecins ignorent la
nature du traitement.

19/02/2020 183 19/02/2020 184

III. Les études expérimentales III. Les études expérimentales

19/02/2020 185 19/02/2020 186

31
Pr [Link]---Methodo 19/02/2020

Plan VI. Les études descriptives

I. Introduction  Le principal objectif des enquêtes à visée


II. Classification des études cliniques descriptive est de mesurer la fréquence d’un
III. Les études expérimentales problème sanitaire.
IV. Les études descriptives
 Elles sont destinées à répondre à des
V. Les études de cohortes
questions ou des hypothèses spécifiques.
VI. Les études cas témoins
VII. Choix d’un type d’étude de recherche clinique  Ceci implique le choix de populations
VIII. Les niveaux de preuves représentatives d’effectif suffisant afin d’avoir
une vision « exacte » de la réalité.

19/02/2020 187 19/02/2020 188

VI. Les études descriptives Les études de prévalence

 Les études de prévalence  Les études de prévalence permettent


d’observer la fréquence de survenue d’un
phénomène de santé, dans une population, à
un moment précis: Il s’agit d’enquêtes
 Les études d’incidence
transversales.

19/02/2020 189 19/02/2020 190

Les études de prévalence Les études de prévalence

 Le recueil d’information s’effectue sur une


période brève : « un jour donné ».
 La notion de suivi des patients dans le temps
est absente.

19/02/2020 191 19/02/2020 192

32
Pr [Link]---Methodo 19/02/2020

Les études de prévalence Les études de prévalence


prévalence au cours du temps prévalence au cours du temps

19/02/2020 193 19/02/2020 194

Les études de prévalence Les études de prévalence

Principaux avantages et inconvénients des études transversales


Avantages Inconvénients
Pas de suivi donc pas de perdus de vue Non adaptées aux évènements rares

Résultats rapides, faible coût Pas de mesure de l’incidence


Possibilité d’étudier plusieurs évènements Temporalité exposition / évènement
non établie
Exemple: Génération d’hypothèses UNIQUEMENT Adaptées aux objectifs descriptifs
•Enquête nationale sur les facteurs de risque cardio-vasculaires en 2001.
•33% des marocains âgés de plus de 20 ans avaient une HTA en 2001
(prévalence)

19/02/2020 195 19/02/2020 196

Les études d’incidence Les études d’incidence

 Les études d’incidence nécessitent  Incidence :


l’observation sur une période déterminée
d’un ou de groupes de sujets pour mesurer
les modifications de l’état de santé des
populations: études longitudinales.
 Exemple : mesure de l’incidence des cas de
grippe saisonnière chez le personnel d’un
hôpital en 2019.

19/02/2020 197 19/02/2020 198

33
Pr [Link]---Methodo 19/02/2020

Les études d’incidence Les études d’incidence

 Taux d’incidence (Densité d’incidence)  Taux d’incidence (Densité d’incidence)


 Population instable : nombreuses arrivées et départs,  CONCEPT PERSONNE–TEMPS

nombreux perdus de vue


 CONCEPT PERSONNE–TEMPS : Prend en compte

pour une population :


 le nombre d’individus qui deviennent malades

 les périodes « vécues » pendant lesquelles les


événements sont survenus
 Tous les individus ne pèsent pas le même poids

 Plus précise que l’incidence cumulée lorsque la


proportion de perdus de vue est élevée dans une
population d’étude.
19/02/2020 199 19/02/2020 200

Les études d’incidence Les études d’incidence

 Taux d’incidence (Densité d’incidence)  Taux d’incidence (Densité d’incidence)


 CONCEPT PERSONNE–TEMPS  CONCEPT PERSONNE–TEMPS

19/02/2020 201 19/02/2020 202

VI. Les études descriptives Population de l’étude


Déroulement
1. Identification de la population d’étude
• Population cible : Ensemble des sujets visés
par l’étude pour lesquels les résultats
pourront être généralisés.
• Population source : Ensemble des sujets à
partir desquels va être constitué l’échantillon.
• Population d’étude : Ensemble de la
population source ou échantillonnage
représentatif (Spécification des critères
d’inclusion/non inclusion /exclusion).
19/02/2020 203 19/02/2020 204

34
Pr [Link]---Methodo 19/02/2020

Population de l’étude Population de l’étude


Exemple
 En rapport avec l’objectif de l’étude  On veut réaliser une enquête sur l’obésité
 Définition d’une population : chez les jeunes de la région de Rabat en
 Les critères d’inclusion 2011
 Critères permettant de définir la population recrutée
Critères d’inclusion Critères d’exclusion
 Extrapolation des résultats ne pourra se faire qu’à cette
population
• Âge 5 - 12 ans • Âge : moins de 5 ans
• Sexe : 2 sexes ou plus de 12 ans
 Les critères d’exclusion • Région : Rabat • Sexe : 2 sexes
• Période : 2011 • Région : hors Rabat
• Période : hors 2011
• Diabète
• Trouble de croissance
19/02/2020 205 19/02/2020 206

19/02/2020 207 19/02/2020 208

VI. Les études descriptives VI. Les études descriptives


Déroulement Déroulement
1. Identification de la population d’étude 1. Identification de la population d’étude
2. Choix de l’évènement d’intérêt (critère 2. Choix de l’évènement d’intérêt (critère
de jugement) de jugement)
 Evènement d’intérêt peut être simple ou 3. Le recueil
composite (Mortalité ou morbidité, définition  Étude de prévalence : instantané
clinique, biologique, histologique).
 Étude d’incidence : Prospectif
 Précis et objectif : mesuré avec un outil validé
et fiable
 Standardisé : utilisation des mêmes outils pour
19/02/2020 209 19/02/2020tous les sujets 210

35
Pr [Link]---Methodo 19/02/2020

VI. Les études descriptives VI. Les études descriptives

19/02/2020 211 19/02/2020 212

Plan V. Les études de cohortes

I. Introduction  Les études de cohorte sont des études


II. Classification des études cliniques analytiques qui consistent à comparer deux
III. Les études expérimentales ou plusieurs groupes d’individus initialement
IV. Les études descriptives indemnes de la maladie et définis en fonction
V. Les études de cohortes de leur exposition à un facteur de risque.
VI. Les études cas témoins
VII. Choix d’un type d’étude de recherche clinique
 Le terme « cohorte » est utilisé pour désigner
VIII. Les niveaux de preuves
le ou les groupes de sujets suivis au cours du
temps.

19/02/2020 213 19/02/2020 214

V. Les études de cohortes V. Les études de cohortes

 Lorsque l’exposition est dichotomique et que


l’on compare l’incidence de la maladie d’un
groupe exposé à celle d’un groupe non
exposé, on parle d’enquête exposé-non
exposé.

19/02/2020 215 19/02/2020 216

36
Pr [Link]---Methodo 19/02/2020

V. Les études de cohortes V. Les études de cohortes


Principe
 Une phase initiale d’inclusion
 Dans les études de cohorte, on commence par le choix de la
population et la définition des individus exposés et non exposés
pour constituer les groupes de comparaison.
 L’inclusion dans l’étude et le recueil initial des informations sur
l’exposition peuvent se faire au moment de la mise en place de
l’enquête.
 L’inclusion peut également se faire à partir d’une date choisie
dans le passé (la répartition dans les groupes exposés et non
exposés étant antérieure au début de l’enquête): on parle alors
de cohorte historique.

19/02/2020 217 19/02/2020 218

V. Les études de cohortes V. Les études de cohortes


Principe Principe
 Une deuxième phase de suivi  La troisième phase
 Identique dans les deux groupes.  C’est la phase de comparaison
 La cohorte est alors suivie de manière prospective :  A la fin de la période de l’étude, on compare la
on parle de cohorte prospective. fréquence des événements dans les différents
 Au cours du suivi, le recueil d’information porte sur la groupes grâce à des outils statistiques.
mesure de l’évènement étudié (par exemple état de
santé).

19/02/2020 219 19/02/2020 220

V. Les études de cohortes V. Les études de cohortes


Déroulement Déroulement
1. Identification de la population d’étude 1. Identification de la population d’étude
• Population cible : Ensemble des sujets visés 2. Choix de l’évènement d’intérêt (critère
par l’étude pour lesquels les résultats de jugement)
pourront être généralisés.
 Evènement d’intérêt peut être simple ou
• Population source : Ensemble des sujets à composite (Mortalité ou morbidité, définition
partir desquels va être constitué l’échantillon. clinique, biologique, histologique).
• Population d’étude : Ensemble de la
population source ou échantillonnage
représentatif (Spécification des critères
d’inclusion/non inclusion /exclusion).
19/02/2020 221 19/02/2020 222

37
Pr [Link]---Methodo 19/02/2020

V. Les études de cohortes V. Les études de cohortes


Déroulement Déroulement
1. Identification de la population d’étude 1. Identification de la population d’étude
2. Choix de l’évènement d’intérêt (critère de 2. Choix de l’évènement d’intérêt (critère de jugement)
jugement) 3. Le recueil
4. Identification des facteurs d’exposition
3. Le recueil doit être:
 Mesures uniques
 Prospectif
 Qualité moindre en cas de recueil rétrospectif
 Précis et objectif : mesuré avec un outil validé et fiable
 Le recueil doit être: Précis et objectif, mesuré avec un
 Standardisé : utilisation des mêmes outils pour tous
outil validé et fiable (questionnaire, appareil de
les sujets
mesure, explorations fonctionnelles, prélèvements…)
 De préférence en aveugle du groupe d’exposition
 Daté au cours du suivi (importance de la temporalité
Exposition-Evènement)
19/02/2020 223 19/02/2020 224

V. Les études de cohortes V. Les études de cohortes


Déroulement Déroulement
1. Identification de la population d’étude 1. Identification de la population d’étude
2. Choix de l’évènement d’intérêt (critère de jugement) 2. Choix de l’évènement d’intérêt (critère de jugement)
3. Le recueil 3. Le recueil
4. Identification des facteurs d’exposition 4. Identification des facteurs d’exposition
5. Période d’observation 5. Période d’observation
 On définit tout d'abord une période 6. Groupe de sujets indemnes
d'observation dont la durée est généralement  On choisit ensuite un groupe de sujets qui sont tous

liée au délai susceptible de s'écouler entre indemnes de la maladie étudiée au début de la


période d'observation.
début de l'exposition et apparition de la
 Ce groupe est parfois composé de la totalité de la
maladie (parfois plusieurs années, voire des
population étudiée, mais le plus souvent il s'agit d'un
dizaines d'années). échantillon.
19/02/2020 225 19/02/2020 226

V. Les études de cohortes V. Les études de cohortes


Déroulement Déroulement
1. Identification de la population d’étude 1. Identification de la population d’étude
2. Choix de l’évènement d’intérêt (critère de jugement) 2. Choix de l’évènement d’intérêt (critère de jugement)
3. Le recueil
3. Le recueil
4. Identification des facteurs d’exposition
4. Identification des facteurs d’exposition 5. Période d’observation
5. Période d’observation 6. Groupe de sujets indemnes
6. Groupe de sujets indemnes 7. Répartition des sujets en fonction du niveau d'exposition
 Le groupe de sujets entrant sous observation fait l'objet, au début  Dans certains cas, il est possible de distinguer
de la période, d'un recueil de données les concernant d'emblée au sein de l'ensemble des sujets de l'étude
(notamment sur l'exposition au facteur de risque étudié, les un groupe exposé au facteur de risque et un groupe
facteurs de confusion possibles, l‘absence de la maladie et de
maladies associées). non-exposé (par exemple, les fumeurs et les non
fumeurs ).

19/02/2020 227 19/02/2020 228

38
Pr [Link]---Methodo 19/02/2020

V. Les études de cohortes V. Les études de cohortes


Déroulement Déroulement
1. Identification de la population d’étude 1. Identification de la population d’étude
2. Choix de l’évènement d’intérêt (critère de jugement) 2. Choix de l’évènement d’intérêt (critère de jugement)
3. Le recueil 3. Le recueil
4. Identification des facteurs d’exposition 4. Identification des facteurs d’exposition
5. Période d’observation 5. Période d’observation
6. Groupe de sujets indemnes 6. Groupe de sujets indemnes
7. Répartition des sujets en fonction du niveau d'exposition 7. Répartition des sujets en fonction du niveau d'exposition
 Dans d'autres cas, on ne fait pas de distinction entre  Ce niveau d'exposition peut être exprimé de façon
les sujets du groupe observé, et ce n'est qu'à la fin de quantitative (nombre de cigarettes fumé, par
la période d'étude, grâce aux données recueillies exemple), qualitative ou semi-qualitative (non-
individuellement sur les sujets, qu'on répartira ceux-ci exposés, peu exposés, moyennement exposés, etc.).
en fonction du niveau d'exposition.

19/02/2020 229 19/02/2020 230

V. Les études de cohortes V. Les études de cohortes


Déroulement Déroulement
1. Identification de la population d’étude 1. Identification de la population d’étude
2. Choix de l’évènement d’intérêt (critère de jugement) 2. Choix de l’évènement d’intérêt (critère de jugement)
3. Le recueil 3. Le recueil
4. Identification des facteurs d’exposition 4. Identification des facteurs d’exposition
5. Période d’observation 5. Période d’observation
6. Groupe de sujets indemnes 6. Groupe de sujets indemnes
7. Répartition des sujets en fonction du niveau d'exposition 7. Répartition des sujets en fonction du niveau d'exposition
8. Suivi des sujets - Mesure de l'incidence - Enquête prospective 8. Suivi des sujets - Mesure de l'incidence - Enquête prospective
 Pendant toute la durée de la période d'observation, les sujets  C'est parce que dans ce type d'enquête on attend la survenue de
sont systématiquement suivis afin (quand cela est nécessaire) de la maladie au fur et à mesure de l'écoulement du temps qu'on
mesurer d'éventuelles modifications d'exposition, et surtout l'appelle souvent enquête prospective.
d'observer l'incidence de la maladie étudiée.

19/02/2020 231 19/02/2020 232

V. Les études de cohortes V. Les études de cohortes


Déroulement
1. Identification de la population d’étude
2. Choix de l’évènement d’intérêt (critère de jugement)
3. Le recueil
4. Identification des facteurs d’exposition
5. Période d’observation
6. Groupe de sujets indemnes
7. Répartition des sujets en fonction du niveau d'exposition
8. Suivi des sujets - Mesure de l'incidence - Enquête prospective
 Mesure d’association : A la fin de la période d'observation, on
dispose alors de toutes les données utiles pour calculer les
risques relatifs: niveaux d'exposition et incidence dans les
groupes comparés.

19/02/2020 233 19/02/2020 234

39
Pr [Link]---Methodo 19/02/2020

V. Les études de cohortes V. Les études de cohortes


Principaux avantages et inconvénients des études de cohortes

Avantages Inconvénients
Particulièrement indiquées lors des Non adaptées aux maladies rares
expositions rares
Permettent d’examiner plusieurs Prospectives: longues et coûteuses
évènements
Temporalité établie entre exposition et Rétrospectives: nécessité de disposer de
évènement documents appropriés
Prospectives: limitation des biais de Validité des résultats dépendante de la
mesure de l’exposition et de la maladie qualité du Suivi
Mesures d’incidence dans chacun des
groupes

19/02/2020 235 19/02/2020 236

V. Les études de cohortes Plan

I. Introduction
II. Classification des études cliniques
III. Les études expérimentales
IV. Les études descriptives
V. Les études de cohortes
VI. Les études cas témoins
VII. Choix d’un type d’étude de recherche clinique
VIII. Les niveaux de preuves

19/02/2020 237 19/02/2020 238

VI. Les études cas témoins VI. Les études cas témoins

 Le principe de l’enquête cas-témoin est de


comparer la fréquence de l'exposition
antérieure à un facteur de risque dans un
groupe de sujets malades (les cas) et dans
un groupe de sujets témoins, indemnes de la
maladie étudiée

19/02/2020 239 19/02/2020 240

40
Pr [Link]---Methodo 19/02/2020

VI. Les études cas témoins VI. Les études cas témoins
Principe Principe
 La planification d’une enquête cas-témoins commence  Les cas et les témoins doivent être choisis dans la
par le choix de la population de l’étude dont seront issus même population.
les cas et les témoins:  Les caractéristiques du groupe « témoin » doivent être
 Les cas seront atteints de la pathologie étudiée et représentatifs, les plus proche possible du groupe « cas ».
pour l'exposition au facteur de risque, de l'ensemble des malades
ayant cette pathologie.  La seule différence observable entre les groupes devrait
 Le groupe témoin est construit pour servir de référence, ils sont être théoriquement l’absence de signes de la maladie.
représentatifs pour l'exposition au facteur de risque de la  Le recueil d’information est toujours rétrospectif dans ce
population dont sont issus les cas. cas.
 Les groupes sont ensuite comparés on utilisant des
méthodes statistiques.

19/02/2020 241 19/02/2020 242

VI. Les études cas témoins VI. Les études cas témoins
Déroulement
1. Identification de la population d’étude Principaux avantages et inconvénients des études cas - témoins
2. Groupe de sujets malades « cas »
3. Groupe de sujets indemnes « témoins» Avantages Inconvénients
Résultats rapides et coûts faibles Importance du recueil similaire de l’exposition
4. Choix de l’évènement d’intérêt (critère de jugement)
entre les cas et les témoins (biais)
5. Le recueil : rétrospective
Pas de perdus de vue Pas d’estimation d’incidence ni de prévalence
6. Période d’observation Pas d’estimation du RR
7. Mesure d’association Adapté aux évènements dont les Difficultés d’évaluer la relation temporelle
 A la fin de la période d'observation, on dispose alors de toutes les périodes de latence sont longues (Exposition et maladie) (biais)
données utiles pour calculer les fréquences d’exposition et les (Exposition et maladie)
Odds ratio. Adapté aux évènements rares Recueil rétrospectif de l’exposition (biais)
Étude de plusieurs facteurs Non indiqué pour les expositions rares
étiologiques pour un seul Un seul évènement d’intérêt
évènement

19/02/2020 243 19/02/2020 244

VI. Les études cas témoins VI. Les études cas témoins

19/02/2020 245 19/02/2020 246

41
Pr [Link]---Methodo 19/02/2020

Plan VII. Choix d’un type d’étude de


recherche clinique
I. Introduction  En plus des considérations théoriques, certains
II. Classification des études cliniques éléments permettent d'orienter le choix vers tel
III. Les études expérimentales ou tel type de recherche clinique :
IV. Les études descriptives  Une étude rétrospective constitue une bonne méthode au
début d'un travail pour vérifier une hypothèse de façon
V. Les études de cohortes préliminaire.
VI. Les études cas témoins  Plus la maladie est répandue, plus facile sera l'étude
VII. Choix d’un type d’étude de recherche clinique prospective.
Si la maladie est rare, seule l'étude rétrospective est utilisable.
VIII. Les niveaux de preuves 

 Plus court est l'intervalle entre la cause (facteur d'exposition) et


la conséquence (maladie), meilleure sera l'étude prospective.
 Pour les maladies à incubation longue, l'étude rétrospective
convient mieux.
19/02/2020 247 19/02/2020 248

VII. Choix d’un type d’étude de Plan


recherche clinique
 En plus des considérations théoriques, certains I. Introduction
éléments permettent d'orienter le choix vers tel II. Classification des études cliniques
ou tel type de recherche clinique : III. Les études expérimentales
 Plus la documentation est complète et exacte, meilleure sera IV. Les études descriptives
l'étude rétrospective (déclaration de la maladie, enregistrement,
classification diagnostique) ou historico-prospective.
V. Les études de cohortes
 Une association forte entre la cause probable et la maladie VI. Les études cas témoins
favorise une étude prospective. VII. Choix d’un type d’étude de recherche clinique
Si on s'attend à une grande fluctuation dans les cohortes, une

VIII. Les niveaux de preuves
étude rétrospective est préférable.

19/02/2020 249 19/02/2020 250

VIII. Les niveaux de preuves VIII. Les niveaux de preuves

 Pour la pratique clinique, des recommandations validées Le tableau ci-dessous regroupe les niveaux de preuves les plus utilisés
suivant l’enquête utilisée.
sont habituellement élaborées soit à partir de résultats
d'études, soit à partir de consensus d'experts.
 Le grade des recommandations est donc directement lié
aux niveaux de preuve des études ayant servi à leur
élaboration.
 La pertinence des résultats, donc le niveau de preuve
d’une étude épidémiologique est évaluée selon la
méthodologie employée.

19/02/2020 251 19/02/2020 252

42
Pr [Link]---Methodo 19/02/2020

Plan

Chapitre 5. I. Introduction
Méthodes d’échantillonnage II. Un peu de terminologie
III. Justification de l'échantillonnage
IV. Méthodes d'échantillonnage
Pr EL ARBI BOUAITI V. Représentativité
Faculté de médecine et de pharmacie - Rabat
VI. Limites des enquêtes par sondage

19/02/2020 254

I. Introduction I. Introduction

 Question : combien y a-t-il de personnes atteintes  Les études cliniques ou épidémiologiques


d’HTA parmi les malades diabétiques au Maroc?
reposent sur
 l’observation d’un échantillon de sujets,
 Réponse : 10% ? 40 % ? 75 % ?
 Inférence des résultats.
Il est impossible de les compter toutes en examinant

toute la population des diabétiques marocains.
 Les résultats observés sur un échantillon
n’auront de sens que s’ils sont rapportés à
 Il va être nécessaire d’utiliser une procédure particulière toute la population.
(l’échantillonnage) et des méthodes statistiques pour
estimer la précision du résultat (incertitude)

19/02/2020 255 19/02/2020 256

I. Introduction I. Introduction

 Echantillonner:
 c’est choisir une partie d’une population pour
représenter l’ensemble de la population
 et l’échantillon doit refléter le plus exactement
possible l'image de la population.

Échantillon
Population Caractéristiques
Caractéristiques Mais comment constituer un échantillon?
connues
inconnues

Échantillon & inférence statistique


19/02/2020 257 19/02/2020 258

43
Pr [Link]---Methodo 19/02/2020

Plan II. Un peu de terminologie

I. Introduction  Phénomène d’intérêt : c’est la caractéristique de santé qui fait


l’objet de l’étude
II. Un peu de terminologie  Sondage : toute forme d’échantillonnage qui permet de constituer
un échantillon à partir de la population
III. Justification de l'échantillonnage  Population cible : Toutes les personnes à qui les résultats doivent
IV. Méthodes d'échantillonnage s’appliquer. C’est la population totale pour laquelle on a besoin de
l’information.
V. Représentativité  Population source : la population à partir de laquelle on a constitué
un échantillon.
VI. Limites des enquêtes par sondage Cette population source est définie en fonction des critères
d’inclusion et des critères d’exclusion (ou critères de non inclusion).

19/02/2020 259 19/02/2020 260

II. Un peu de terminologie II. Un peu de terminologie

 Echantillon : Dans la plupart des cas, la taille de la


population est trop importante pour que l’on puisse
étudier tous les individus qui la composent. On étudie un
sous-groupe appelé échantillon.
 Unités statistique : Une unité d'observation ou de
mesure pour laquelle des données sont recueillies ou
dérivées.
 La base de sondage : Une liste exhaustive de toutes
les unités statistiques disponibles pour l'échantillonnage
 La taille de l’échantillon : Le nombre des sujets
composant un échantillon.

19/02/2020 261 19/02/2020 262

II. Un peu de terminologie Plan

I. Introduction
 Recensement / Echantillonnage
II. Un peu de terminologie
Recensement : Tous les sujets de la
population sont « examinés » III. Justification de l'échantillonnage
Echantillonnage : Une partie des sujets
de la population sont « examinés »
IV. Méthodes d'échantillonnage
Plusieurs échantillons peuvent être
constitués
V. Représentativité
L’échantillon en lui-même n’est pas
Population intéressant, ce sont les conclusions sur la
VI. Limites des enquêtes par sondage
population que l’on peut tirer de son
observation qui en font l’intérêt : Inférence

19/02/2020 263 19/02/2020 264

44
Pr [Link]---Methodo 19/02/2020

III. Justification de l'échantillonnage III. Justification de l'échantillonnage

 La mesurer du paramètre:  Le recueil de données sur


 dans l'ensemble de la population,  une population limitée,
 avoir une mesure non biaisée.  un sondage
 Mesure sur l'ensemble de la population n'est  Sondage échantillonnage
pas toujours possible :  diminuer les coûts,
 coût trop élevé  diminuer la durée de l'étude,
 manque de temps  recueillir un nombre plus important de données,
 manque de précision (si plusieurs enquêteurs font la  Mais : une réflexion préalable sur la méthode
mesure) d'échantillonnage utilisée afin de limiter les
 manque de faisabilité erreurs liées à l'échantillonnage.
19/02/2020 265 19/02/2020 266

Plan IV. Méthodes d'échantillonnage

I. Introduction  Dans la recherche clinique, les méthodes


II. Un peu de terminologie d'échantillonnage ou de sondage
III. Justification de l'échantillonnage correspondent aux différentes manières de
constituer un échantillon de la population
IV. Méthodes d'échantillonnage étudiée.
V. Représentativité  Il existe différentes méthodes
VI. Limites des enquêtes par sondage d'échantillonnage :
 Sondages aléatoires (probabiliste)
 Méthodes non aléatoires ou empirique (non
probabiliste)
19/02/2020 267 19/02/2020 268

IV. Méthodes d'échantillonnage Sondages aléatoires (probabilistes)


Deux approches pour construire un échantillon  Ensemble de méthodes appelées sondages
probabilistes, parce que chaque unité
échantillonnée a une probabilité connue à
Sondages aléatoires Sondages non aléatoires l’avance de figurer dans l’échantillon

(probabiliste) (non probabiliste)


 Ceci permet
Chaque unité a une  de généraliser l’estimation du phénomène à la
chance que l’on peut population dont est issu l’échantillon,
quantifier d’être  d’apprécier la marge d’erreur, le degré d’incertitude de
sélectionnée l’estimateur.

19/02/2020 269 19/02/2020 270

45
Pr [Link]---Methodo 19/02/2020

Les sondages aléatoires Sondage aléatoire simple

 Sondage aléatoire simple  Chaque sujet de la population a la même


 L’échantillonnage systématique probabilité d’être inclus dans l’échantillon
 Maximise la possibilité de conclure pour toute la
 L’échantillonnage avec une probabilité
population
proportionnelle à la taille
 Base de sondage : liste pré-établie des sujets
 L’échantillonnage stratifié
 Liste des malades
 L’échantillonnage en grappes  Liste des services cliniques
 L’échantillonnage à plusieurs degrés  …

19/02/2020 271 19/02/2020 272

Sondage aléatoire simple Sondage aléatoire simple

 Procéder à un tirage au sort des sujets dans la  Le sondage permet de limiter la taille de
base : l’investigation
 Programme informatique  Avantages :
 Tables de nombre au hasard  On peut espérer un échantillon «représentatif »
puisque la méthode donne à chaque individu de la
population une chance égale.
 Réduction des coûts d’investigation
 Délai d’obtention des résultats plus rapide
TAS  Limite :
 il est nécessaire d’avoir une base de sondage fiable
Échantillon
Population
19/02/2020 273 19/02/2020 274

Sondage aléatoire simple L’échantillonnage systématique


méthodes
 Procédure générale  L’échantillonnage systématique est une
1. on numérote tous les individus de la liste
2. en utilisant une table de nombres aléatoires ou
méthode qui exige aussi l’existence d’une
un programme informatique on obtient des liste de la population où chaque individu est
nombres aléatoires comportant le nombre de
chiffres désiré. numéroté de 1 jusqu’à N.
3. on sélectionne les nombres qui coïncident
avec la liste.  Notons n, le nombre d’individus que doit
4. on rejette les nombres qui ne coïncident pas comporter l’échantillon (la taille de
avec la liste ou qui se répètent,
5. on s’arrête après avoir sélectionné n individus
l’échantillon).
(n représentant le nombre d’individus
souhaités dans l’échantillon).

19/02/2020 275 19/02/2020 276

46
Pr [Link]---Methodo 19/02/2020

L’échantillonnage systématique L’échantillonnage systématique

 Pour constituer l’échantillon il faut :


 On calcul pas de sondage noté r : N/n
 Choisir au hasard un entier naturel d entre 1 et
r (cet entier sera le point de départ),
L’individu dont le numéro correspond à d est le premier
individu,
 Pour sélectionner les autres, il suffit d’ajouter à d le
pas de sondage : les individus choisis seront alors
ceux dont les numéros correspondent à
d + r; d + 2r; d + 3r; etc. r = 40/15 = 2,7

19/02/2020 277 19/02/2020 278

L’échantillonnage systématique L’échantillonnage systématique

r=3  Avantages : facile à sélectionner parce qu’un seul


individu est choisi au hasard.
 On peut obtenir une bonne précision parce que la
méthode permet de répartir l’échantillon dans
l’ensemble de la liste.
 Désavantages : Les données peuvent être biaisées
à cause de la périodicité.

+3
 Application : constituer un échantillon de taille
n=60 à partir de 300 malades consultants au service
des urgences.

19/02/2020 279 19/02/2020 280

Méthodes empirique ou non aléatoires Plan


(non probabiliste)
 L’échantillonnage par quotas ou proportionnel I. Introduction
C’est l’une des techniques les plus simples et les plus répandues. Elle

repose sur un principe simple : construire un échantillon qui ressemble à
II. Un peu de terminologie
la population cible à partir d’informations statistiques.
III. Justification de l'échantillonnage
 Les échantillons de volontaires
 Cette technique consiste à faire appel à des volontaires pour constituer IV. Méthodes d'échantillonnage
l’échantillon.
V. Représentativité
 Les échantillons « accidentels » ou à l’aveuglette
 Le chercheur constitue son échantillon en choisissant les individus (unités VI. Limites des enquêtes par sondage
statistiques) disponibles pour des raisons pratiques d’accessibilité et de
coût et non de manière aléatoire. L'échantillon est obtenu sans méthode
particulière.

19/02/2020 281 19/02/2020 282

47
Pr [Link]---Methodo 19/02/2020

V. Représentativité V. Représentativité

 Pour qu'il soit possible d'étudier une population à partir  Concrètement, cela signifie qu'on tire au sort les individus de
d'un échantillon, il faut que certaines contraintes soient l'échantillon parmi l'ensemble de la population.
respectées.:  Le tirage au sort s'accompagne d'une incertitude, et la composition
de l'échantillon peut différer de celle de la population du fait du
 l'échantillon doit être représentatif de la population étudiée hasard : ce phénomène est appelé fluctuation d'échantillonnage.
 effectif suffisant.
 La représentativité n’a de sens concret que vis-à-vis des  Exemple : dans une population qui comprendrait 50% d'hommes, un
phénomènes qu'on veut étudier dans la population. tirage au sort peut théoriquement sélectionner un pourcentage
d'hommes quelconque compris entre 0 et 100% ; cependant, toutes
 Un échantillon est représentatif de la population : toute
les valeurs n'ont pas la même probabilité d'apparaître, et on s'attend
personne appartenant à celle-ci puisse appartenir à à un pourcentage voisin de 50%, d'autant plus proche de ce chiffre
l'échantillon avec une probabilité connue. que l'échantillon est grand.

19/02/2020 283 19/02/2020 284

Plan VI. Limites des enquêtes par sondage

I. Introduction  Une limite des enquêtes par sondage est


II. Un peu de terminologie qu'elles sont mal adaptées à l'étude de
phénomènes rares.
III. Justification de l'échantillonnage  Certaines maladies, par exemple, ne touchent qu'une
IV. Méthodes d'échantillonnage personne sur 1 000 ou sur 10 000, voir moins encore.
V. Représentativité  Dans de tels cas, il faudrait des échantillons
considérables pour obtenir une précision d'estimation
VI. Limites des enquêtes par sondage suffisante, et il arrive parfois qu'une enquête par
sondage soit de ce fait impossible, obligeant à
recourir à l'enregistrement exhaustif.

19/02/2020 285 19/02/2020 286

Plan

Chapitre 6. I.

II.
Introduction.
Principes.
Nombre de sujets nécessaires III.

IV.
Éléments du calcul du nombre de sujets nécessaire.
Les hypothèses à formuler pour le calcul du NSN de calcul.
(NSN) V. Le calcul du nombre de sujets nécessaire dans une étude
descriptive.
VI. Le calcul du nombre de sujets nécessaire dans une étude cohorte
Pr EL ARBI BOUAITI prospective.
Faculté de médecine et de pharmacie - Rabat VII. Le calcul du nombre de sujets nécessaire dans une étude cas-
témoins.

19/02/2020 288

48
Pr [Link]---Methodo 19/02/2020

I. Introduction I. Introduction

 Les études cliniques ou épidémiologiques reposent sur  Il est donc nécessaire de calculer un nombre de
le plus souvent sur l’observation d’un échantillon de sujets nécessaires afin d’assurer à l’étude une
sujets.
puissance statistique suffisante et de mettre en
 Plus les échantillons aléatoires sont grands, plus on a de
évidence une différence.
chances de s’approcher des caractéristiques de la
population.  Le nombre de sujet nécessaire est souvent un
 De plus, en cas de répétition sur plusieurs échantillons, compromis entre
les observations fluctuent autour des vraies  le degré de précision à atteindre
caractéristiques de la population.  le budget de l’enquête
 autres contraintes opérationnelles (le temps)

19/02/2020 289 19/02/2020 290

I. Introduction Plan

I. Introduction.
II. Principes.
III. Éléments du calcul du nombre de sujets nécessaire.
Combien de sujets dois-je inclure dans mon IV. Les hypothèses à formuler pour le calcul du NSN de calcul.
V. Le calcul du nombre de sujets nécessaire dans une étude
échantillon pour que mon inférence soit descriptive.
correcte (marge d’erreur prédéfinie et VI. Le calcul du nombre de sujets nécessaire dans une étude cohorte
prospective.
acceptable) ?
VII. Le calcul du nombre de sujets nécessaire dans une étude cas-
témoins.

19/02/2020 291 19/02/2020 292

II. Principes II. Principes

 Le nombre de sujets nécessaire est le plus petit effectif  La définition des hypothèses de calcul du
théorique qui permettra de garantir l’observation d’une nombre de sujet nécessaire est primordiale
différence significative (moyennes, proportions, etc.).
pour des raisons
 Pour calculer un nombre de sujets nécessaires, il faut au  Éthiques :
préalable avoir défini un objectif principal associé à un  Si vous surestimez l’effet attendu, vous allez avoir moins de sujets
critère de jugement principal. à inclure mais vous minimisez la puissance statistique et vos
chances de répondre à la question posée.
 Les hypothèses du calcul du nombre de sujets
 Si vous sous-estimez l’effet attendu, vous allez devoir inclure
nécessaires seront faîtes sur ce critère principal. beaucoup plus de patients, ce qui fragilise la faisabilité de votre
 Il important de bien définir les hypothèses de calcul: la étude.
littérature.  Financiers et logistiques

19/02/2020 293 19/02/2020 294

49
Pr [Link]---Methodo 19/02/2020

II. Principes Plan

Introduction.
 Dans la pratique le calcul du NSN permet I.

II. Principes.
 de vérifier si los objectifs peuvent être atteints III. Éléments du calcul du nombre de sujets nécessaire.
avec le critère de jugement retenu, IV. Les hypothèses à formuler pour le calcul du NSN de calcul.
Le calcul du nombre de sujets nécessaire dans une étude
 éventuellement de s’orienter vers d’autres V.
descriptive.
critères, de changer les objectifs ou de VI. Le calcul du nombre de sujets nécessaire dans une étude cohorte
modifier le schéma d’étude. prospective.
VII. Le calcul du nombre de sujets nécessaire dans une étude cas-
témoins.

19/02/2020 295 19/02/2020 296

III. Éléments du calcul du NSN III. Éléments du calcul du NSN

 Le calcul du nombre de sujet nécessaire repose  Risques d’erreur:


notamment sur :  le risque alpha (5%): Risque de 1ère espèce.
 La variabilité des caractéristiques que l’on mesure  le risque β: Risque de 2ème espèce.
 Taille échantillon ↑ => variance ↓
 la puissance (1-β, au minimum à 80%).
 La valeur attendue du paramètre mesuré : déterminée
2 groupes ===> 2 observations différentes
par l'investigateur. Si la différence existe
 La précision de la mesure : l'écart attendu à la vraie ===> pouvoir séparer les 2 groupes
valeur du paramètre mesuré
La puissance : Capacité d'un test à montrer une
 Taille échantillon ↑ => Écart ↓ différence. Dépend:
 La taille de la population. • de la différence minimale d'intérêt D
• du nombre de sujets
 Les méthodes d’échantillonnage et d’estimation. • de la variance
• du risque alpha
19/02/2020 297 19/02/2020 298

III. Éléments du calcul du NSN III. Éléments du calcul du NSN

 La puissance : Analogie = le microscope  La puissance : Analogie = le microscope


Si le biologiste ne voit rien  Augmenter le grossissement
 augmenter le grossissement  Pour un test: dépend de l'effet mA-mB

 refaire le prélèvement  Refaire le prélèvement


 Pour un test: prendre plus de sujets

"ne rien voir" "n'existe pas" La puissance : Capacité d'un test à montrer une différence
Dépend:
• de la différence minimale d'intérêt D
• du nombre de sujets
• de la variance
• du risque alpha

19/02/2020 299 19/02/2020 300

50
Pr [Link]---Methodo 19/02/2020

Plan IV. Les hypothèses à formuler pour le


calcul du NSN de calcul.
I. Introduction.  Quelles sont les hypothèses à formuler ?
II. Principes.
III. Éléments du calcul du nombre de sujets nécessaire.
IV. Les hypothèses à formuler pour le calcul du NSN de calcul.  Comparaison d’un critère qualitatif (survenue
V. Le calcul du nombre de sujets nécessaire dans une étude d’une maladie…) entre deux groupes.
descriptive.
VI. Le calcul du nombre de sujets nécessaire dans une étude cohorte
prospective.  Comparaison d’un critère quantitatif (Pression
VII. Le calcul du nombre de sujets nécessaire dans une étude cas- artérielle systolique, données biologiques…) entre
témoins. deux groupes.

19/02/2020 301 19/02/2020 302

IV. Les hypothèses à formuler pour le Un critère qualitatif


calcul du NSN de calcul.
 Exemple : Complication du paludisme chez
les enfants
 Risque de complication :
 Avec le facteur de risque = 20%.
 Contre 10% dans la population de référence.
Un critère qualitatif Un critère quantitatif (Test bilatéral, puissance de 80%et seuil de
significativité fixé à 5%)

Nombre de sujet à inclure dans chaque


groupe?
19/02/2020 303 19/02/2020 304

Un critère qualitatif Un critère qualitatif

 Quelles sont les hypothèses à formuler ?  Comparaison de 2 pourcentages observées


 la fréquence (la proportion) de l’évènement dans (Test Bilatéral)
le groupe A,
 la fréquence de l’évènement dans le groupe B ou
la réduction relative du risque par rapport à la
fréquence de l’évènement dans le groupe A,
 le risque alpha (5%),
 la puissance (1-β, au minimum à 80%).

19/02/2020 305 19/02/2020 306

51
Pr [Link]---Methodo 19/02/2020

Un critère qualitatif Un critère qualitatif

 Comparaison de 2 pourcentages observées  Exemple : Complication du paludisme chez


(Test Bilatéral) les enfants
 Risque de complication :
 Avec le facteur de risque = 20%.
 Contre 10% dans la population de référence.
(Test bilatéral, puissance de 80%et seuil de
significativité fixé à 5%)

19/02/2020 307 19/02/2020 308

Un critère qualitatif Un critère quantitatif

 Exemple:
 Facteur de risque de paludisme chez les enfants.
 Critère de jugement : Parasitémie à P. falciparum.

Il faut inclure 195 enfants par groupe pour :


•avoir 80% de chance
•de détecter un effet de +10% (20% vs 10%)
•pour une probabilité de base de 10%
•avec un risque de α=5%
Nombre de sujet à inclure dans chaque
groupe?
19/02/2020 309 19/02/2020 310

Un critère quantitatif Un critère quantitatif

 Quelles sont les hypothèses à formuler ?  Nombre de sujets nécessaires par groupe :
 la différence attendue entre les moyennes du
groupe A et du groupe B,
 la variabilité de la réponse (s2) fournie par les
études antérieures.
 le risque alpha (5%),
 la puissance (1-β, au minimum à 80%).

19/02/2020 311 19/02/2020 312

52
Pr [Link]---Methodo 19/02/2020

Un critère quantitatif Un critère quantitatif

 La différence attendue : D=mA-mB  Calcul: nombre d'enfants nécessaire par


 Effet??? groupe
 Groupe A: mA= 5000 parasites /ml
 Groupe B: mB= 4500 parasites /ml
Pas d'intérêt
Il faut inclure 131 enfants par groupe pour que:
 Groupe A: mA= 5000 parasites /ml •on ait 80% de chance
•de détecter un effet de +3000
 Groupe B: mB= 600 parasites /ml •pour une variance de s2=75.106
Intérêt++ •et avec un risque de α=5%
19/02/2020 313 19/02/2020 314

Nombre de sujets nécessaires EpiInfo 7

 Une fois vos hypothèses de calcul définies,


vous pouvez calculer le nombre de sujets
nécessaires à l’aide :
 Logiciels statistiques
 EpiInfo….

 Sites internet:
[Link]

19/02/2020 315 19/02/2020 316

[Link] [Link]

19/02/2020 317 19/02/2020 318

53
Pr [Link]---Methodo 19/02/2020

Un critère qualitatif [Link]

 Exemple :
 Si vous souhaitez évaluer l’efficacité d’un
nouveau traitement sur la mortalité par rapport au
traitement de référence.
 Dans la littérature, vous avez pu trouver les
hypothèses suivantes :
 5% de décès avec le traitement de référence et 2% avec
le nouveau traitement.
 Pour un risque alpha à 5% et une puissance à
80%, il est nécessaire d’inclure 585 patients par
groupe soit un total de 1170 patients.
19/02/2020 319 19/02/2020 320

Un critère quantitatif [Link]

 Exemple :
 Si vous souhaitez évaluer l’efficacité d’un nouveau traitement sur
la pression artérielle systolique par rapport au traitement de
référence.
 Dans la littérature, vous avez pu trouver les hypothèses
suivantes : la pression artérielle systolique moyenne est de 150.2
± 40.6 mmHg (40.6 est l’écart-type) avec le traitement de
référence et de 140.5 mmHg avec le nouveau traitement avec un
écart-type identique.
 Pour un risque alpha à 5% et une puissance à 80%, il est
nécessaire d’inclure 276 patients par groupe soit un total de 552
patients.

19/02/2020 321 19/02/2020 322

Plan V. Le calcul du NSN dans une étude


descriptive
I. Introduction.  Dans le cas de l’étude descriptive transversale d’une
II. Principes. variable qualitative, n dépend principalement :
III. Éléments du calcul du nombre de sujets nécessaire.  De la prévalence (π) attendue de l’événement étudié dans la population
IV. Les hypothèses à formuler pour le calcul du NSN de calcul. cible. Elle est fixée à 50% si aucune information a priori n’est disponible.
V. Le calcul du nombre de sujets nécessaire dans une étude  Du risque de première espèce (α) choisi. Il est en règle générale fixé à
5%. Il peut être diminué si l’on souhaite une meilleure précision de
descriptive.
l’estimation.
VI. Le calcul du nombre de sujets nécessaire dans une étude cohorte  De la précision de l’estimation (ε) souhaitée.
prospective.
VII. Le calcul du nombre de sujets nécessaire dans une étude cas-
 Lorsque plusieurs variables sont décrites sur une
témoins. population, l'idéal est de calculer une taille d'échantillon
pour chaque variable, et de choisir la plus grande d'entre
elles pour déterminer le nombre de sujets à inclure.

19/02/2020 323 19/02/2020 324

54
Pr [Link]---Methodo 19/02/2020

V. Le calcul du NSN dans une étude VI. Le calcul du NSN dans une étude
descriptive cohorte prospective
 Plusieurs cas de figure sont possibles :
 Aucun calcul n’est réalisé, seul un calendrier
d’inclusions est fourni : justifier alors comment les
objectifs seront atteints et la taille de l’étude choisie.
 Le calcul du nombre de sujets est basé sur une
différence minimale attendue :
 Il faut alors estimer le ratio attendu entre le nombre de patients
présentant le facteur de risque par rapport aux patients ne présentant
pas le facteur de risque,
 Risque relatif,
 Le risque , le risque  et la puissance

19/02/2020 325 19/02/2020 326

VI. Le calcul du NSN dans une étude VII. Le calcul du NSN dans une étude
cohorte prospective cas-témoins
 Préciser si on souhaite inclure 1 cas + 1
témoin (1 :1), 1 cas + 2 témoins (1 :2), …
pour déterminer le nombre total de sujets.
 Définir le risque , le risque , la puissance,
la différence minimum attendue entre les
groupes.

19/02/2020 327 19/02/2020 328

VII. Le calcul du NSN dans une étude VII. Le calcul du NSN dans une étude
cas-témoins cas-témoins

19/02/2020 329 19/02/2020 330

55
Pr [Link]---Methodo 19/02/2020

Conclusion

Chapitre 7.
Nombre de sujets
nécessaire pour qu'un test statistique puisse
Méthodes d'analyse d'une
avoir la puissance suffisante étude descriptive.
pour montrer un effet minimum Pr EL ARBI BOUAITI
Faculté de médecine et de pharmacie -
Rabat

19/02/2020 331

Plan Analyse statistique

 Définition  Les statistiques descriptives


 Rappels
 Statistique descriptive : Variable qualitative
 Statistique descriptive : Variable quantitative
 Statistique à deux dimensions  Les statistiques analytiques
 Conclusion

19/02/2020 333 19/02/2020 334

La Statistique Descriptive La Statistique Descriptive


Définition Définition
 C’est l'ensemble des méthodes et techniques  Peut concerner :
permettant de
 Une variable à la fois : statistique à une
 Présenter
dimension
 Décrire
 Deux variables à la fois : statistique à
 et Résumer
deux dimensions
des données nombreuses et variées.
 Plus de deux variables à la fois :
statistique multidimensionnelle.

19/02/2020 335 19/02/2020 336

56
Pr [Link]---Methodo 19/02/2020

La Statistique Descriptive Plan


Définition
 Décrire les données par  Définition
 Des paramètres statistiques :  Rappels
 Réduction des données à quelques valeurs
numériques caractéristiques.
 Statistique descriptive : Variable qualitative
 Statistique descriptive : Variable quantitative
 Des tableaux : distributions de fréquences.  Statistique à deux dimensions
 Conclusion
 Des diagrammes : graphiques.

Pour la bien mener il faut savoir de quelle type


de variable s’agit-il
19/02/2020 337 19/02/2020 338

Rappels : Base de données Exemple : base de données


N°patient Prénom Circonstances delaiconsultation Sexe Age Annee orig_vil Dur_hosj type_brul ATCD
15 Sanae phlyctène : henné F 20 2 008 19 2 2
Série statistique = ensemble de mesures d’une ou plusieurs variables 208
125
Zineb
Fatima
liq_chd
flam_gaz
même jour
dans la semaine
F
F
20
21
2 004
2 006
21
45
0
0
2
2
faites sur une population ou un échantillon. 62 Fatima Zahra flamme même jour F 23 2 007 Kenitra 14 0 2
135 Maguat flamme F 24 2 006 Mauritanie 110 0 2
90 Mahjouba liq_chd après un mois F 24 2 006 Temara 12 0 2
223 Loubna flamme dans la semaine F 26 2 004 Casa Blanca 10 0 1
Nom Situation de Nombre Age sexe 252
18
Fatima Zahra
Fatima
liq_chd
ex_bo_gz
même jour
même jour
F
F
26
26
2 009
2 008
Rabat
Taounate
22
21
0
0
1
2
famille d’enfants 49 Houda dans la semaine F 27 2 007 Kenitra 21 0 2
58 Hanane ex_bo_gz dans la semaine F 27 2 007 Taounate 30 0 2
Patient 1 Marié 2 30 M 11
234
Najat
Hadhoum
liq_chd
liq_chd
après une semaine
même jour
F
F
27
28
2 008
2 004
Salé
Rabat
14
5
0
0
1
2
197 Rahma flam_gaz même jour F 28 2 005 88 0 2
Patient 2 Veuf 3 45 M 40 Halima liq_chd F 29 2 008 Kenitra 9 0 2
50 Amina liq_chd dans la semaine F 29 2 007 Kenitra 13 0 2

Patiente 3 Mariée 0 27 F 330


255
Saida
Zinba
flam_gaz
ex_bo_gz
dans la semaine
même jour
F
F
30
30
2 010
2 009
Midelt
Tadla
62
69
0
0
2
2
274 Kaoutar liq_chd après une semaine F 30 2 009 7 0 1
Patiente 4 Célibataire 0 32 F 102 Khadija flam_gaz même jour F 31 2 006 Khemissat 50 0 2
250 touriya liq_chd dans la semaine F 32 2 009 Salé 35 0 1

Patient 5 Marié 1 39 M 336


241
Fatima
Touria
flamme
flamme
même jour
même jour
F
F
32
32
2 010
2 004
Tiflet 92
13
0
0
2
1
133 Fatima Zahra ex_bo_gz après une semaine F 32 2 006 Eljadida 0 1
…. …. …. …. …. 142
149
Fatima
Najat
flamme
liq_chd
dans la semaine F
F
34
34
2 005
2 005
24
52
0
0
2
2
140 Hassna ex_bo_gz même jour F 35 2 005 Méknés 9 0 2

Le nombre d'individus étant généralement grand, une telle série brute est 283
103
Achoura
Lekheila
ex_bo_gz
flamme
même jour
dans la semaine
F
F
35
36
2 009
2 006
Tiflet
Mauritanie
93
27
0
0
2
2
difficilement lisible et interprétable. Il est indispensable de la résumer. 296 Amina liq_chd après une semaine F 36 2 010 Agadir 21 0 2

19/02/2020 339 19/02/2020 340

Rappels : variables Plan


Dichotomiqu
es - Sexe  Définition
Binaires  Rappels
Observables
Variables -Niveau
qualitatives Ordinales d’étude  Statistique descriptive : Variable qualitative
- Couleur
-Ville  Statistique descriptive : Variable quantitative
Nominales d’origine
Variables  Statistique à deux dimensions
-Taille
Continues -Poids  Conclusion
Variables
Mesurables quantitatives -Nombre
de
Discrètes patients

19/02/2020 341 19/02/2020 342

57
Pr [Link]---Methodo 19/02/2020

Statistique descriptive Statistique descriptive


Dichotomiqu
Variable qualitative
es - Sexe
 Un caractère qualitatif ne peut être
Binaires mesuré
Observables  D’où notion de fréquence
Variables -Niveau
qualitatives Ordinales d’étude  Fréquence absolue : effectif
 Nombre d’individus par classe : n
- Couleur
-Ville  100 sujets: 4 ont la maladie x
Nominales d’origine
 Fréquences relatives
Variables
-Taille
 Pour chaque classe, le rapport de son
Continues -Poids effectif au nombre total d’individus
Variables  Exprimées en pourcentage : P = 0,04
quantitatives -Nombre ou 4 %
Mesurables de
Discrètes patients

19/02/2020 343 19/02/2020 344

Statistiques descriptives Statistiques descriptives


variables qualitatives variables qualitatives
 On a noté la situation familiale des 150
patients d’une étude Modalités Effectifs (n)
Nom Situation de famille
Marié 80
Patient 1 Marié

Patient 2 Veuf Célibataire 30


Patiente 3 Mariée Veuf 20
Patiente 4 Célibataire
Divorcé 20
Patient 5 Divorcé

…. ….
Total 150
19/02/2020 345 19/02/2020 346

Statistiques descriptives Statistiques descriptives


variables qualitatives Variables quantitative discrète
Nombre de dents cariées
0
Modalités Effectifs (n) Pourcentage 0
0
Nombre de
0 n %
dents cariées
Marié 80 53,3% 1
1
0 4 20,0%
1
1 1 4 20,0%
Célibataire 30 20% 2
2 2 2 10,0%
3
Veuf 20 13,3% 3
3
3 7 35,0%
3 4 3 15,0%
Divorcé 20 13,3% 3
3
Total 20 100%
3
4
Total 150 100% 4
4

19/02/2020 347 19/02/2020 348

58
Pr [Link]---Methodo 19/02/2020

Statistique descriptive Statistiques descriptives


Variables quantitative continue
Age n
14 6
Fréquence absolue : effectif 15 4

16 12 Variable quantitative continue
17 8
 Fréquences relatives 18 15
19 20
20 10
21
22
5
3 Discrétisation
23 2
24 5
25 2
26 7
27 3
28
29
4
2
Variable quantitative discrète
30 2

19/02/2020 349 19/02/2020 350

Statistiques descriptives Statistiques descriptives


variables qualitatives variables quantitatives continues
Age n
14
15
6
4
Classe d'âge ni %
16 12 Variable quantitative continue [14-16[ 10 9,1%
17 8
18 15
19 20
[16-18[ 20 18,2%
20 10
Classes [18-20[ 35 31,8%
21
22
5
3 Discrétisation d’âge [20-22[ 15 13,6%
23 2
24 5
25 2 [22-24[ 5 4,5%
26 7
27 3 >24 25 22,7%
28 4 Variable quantitative discrète
29 2 Total 110 100,0%
30 2

19/02/2020 351 19/02/2020 352

Plan Statistique descriptive


Dichotomiqu
 Définition es - Sexe
Binaires
 Rappels Observables
Variables -Niveau
 Statistique descriptive : Variable qualitative qualitatives Ordinales d’étude

 Statistique descriptive : Variable quantitative - Couleur


-Ville
Nominales d’origine
 Statistique à deux dimensions Variables
-Taille
 Conclusion Continues -Poids
Variables
Mesurables quantitatives -Nombre
de
Discrètes patients

19/02/2020 353 19/02/2020 354

59
Pr [Link]---Methodo 19/02/2020

Statistiques descriptives Statistiques descriptives


variables quantitatives variables quantitatives
continues continues
 Paramètres de position : Mesures de la
tendance centrale
Position

 Paramètres de dispersion Dispersion

19/02/2020 355 19/02/2020 356

Paramètres de position Moyenne arithmétique

 Moyenne arithmétique 

 Médiane

 Mode

19/02/2020 357 19/02/2020 358

Moyenne arithmétique Moyenne arithmétique


Exemple données groupées
 Exemple: Calculer la moyenne des valeurs
suivantes : 10, 12, 18, 20, 25, 35 Tranches d’âge Nombre (ni)
[10-20[ 4
[20-30[ 6
[30-40[ 10
[40-50[ 4
[50-60[ 4
[60-70[ 2
Total (n) 30

19/02/2020 359 19/02/2020 360

60
Pr [Link]---Methodo 19/02/2020

Moyenne arithmétique Moyenne arithmétique


données groupées données groupées

Tranches Valeur
Nombre (ni) ni x xi
d’âge centrale (xi)
[10-20[ 4 15 60
[20-30[ 6 25 150
[30-40[ 10 35 350
[40-50[ 4 45 180
[50-60[ 4 55 220
[60-70[ 2 65 130
Total (n) 30 1090

19/02/2020 361 19/02/2020 362

Paramètres de position Médiane

 Moyenne arithmétique  La médiane est la valeur qui divise les


observations en 2 groupes de taille égale :
 Le premier contenant les valeurs inférieures à la
médiane
 Médiane  Et le second les valeurs supérieures à la médiane

 Mode La valeur qui partage la série en 2 parties de


même effectif (ordre croissant+++)

19/02/2020 363 19/02/2020 364

Médiane Médiane
exemples
 9 patients hospitalisés dans un service de 
médecine. Leurs durées de séjour (en jours)
sont les suivantes :

3; 15; 23; 46; 64; 126; 279; 623; 1350


n=4 n=4
 La médiane est la valeur de rang 5 : 64j

19/02/2020 365 19/02/2020 366

61
Pr [Link]---Methodo 19/02/2020

Médiane Médiane
exemples exemples
 Médiane d’un nombre impair de données  Médiane d’un nombre pair de données
10, 12, 18, 20, 25 10, 12, 18, 20, 25, 45
 Ranger les valeurs en ordre ascendant : 10, 12,  Ranger les valeurs en ordre ascendant : 10, 12,
18, 20, 25 18, 20, 25, 45
 Déterminer le point central de la série : (5 valeurs  Déterminer le point central de la série (6
+1)/ 2 = 3. valeurs+1)/2 = 7/2 = 3,5.
 La médiane est donc la valeur en 3ème position  La médiane est la valeur à mi-chemin entre le
dans la série 3ème et le 4ème chiffre : Le 3ème chiffre est 18 et le
 La 3ème valeur est 18. 4ème est 20.
 La médiane équivaut donc à 18.  La médiane est (18+20)/2 = 19.

19/02/2020 367 19/02/2020 368

Moyenne - Médiane Paramètres de position

 Moyenne arithmétique
Série de valeurs: Moyenne Médiane
10, 12, 18, 20, 25
17 18
 Médiane
10, 12, 18, 20, 45 21 18

La moyenne est sensible aux valeurs extrêmes  Mode


La médiane est insensible aux valeurs extrêmes

19/02/2020 369 19/02/2020 370

Mode Mode

 La valeur que l’on observe le plus  La valeur que l’on observe le plus
fréquemment dans une série de valeurs. fréquemment dans une série de valeurs.
La valeur dominante La valeur dominante

 Exemple 1 : Le mode des valeurs 10, 12, 12,  Exemple 2 : La série 10, 12, 12, 12, 18, 18,
12, 18, 18, 20, 25, 35 est 12 18, 20, 25, 35 à 2 modes, 12 et 18
 Une distribution est bimodale :
 Échantillon: deux populations différentes

19/02/2020 371 19/02/2020 372

62
Pr [Link]---Methodo 19/02/2020

Mode Mode, médiane, moyenne

 Si distribution unimodale, symétrique


Distribution unimodale Distribution
N N
bimodale
 les 3 coïncident Mode =
250
Médiane =
120
Moyenne
200

80 150 0.4

100 0.3

40

ddp
50 0.2

0
0.1
0
45 98 150 203 256 309 361 414 467 519 572 2.1 3.3 4.6 5.8 7.0 8.3 9.5 10.8 12.0 13.3 14.5
Créatinine (µmol/l) Glycémie (mmol/l)
0.0

-4 -2 0 2 4
19/02/2020 373 19/02/2020 18 22 23 25 27 374

Mode, médiane, moyenne Statistiques descriptives


variables quantitatives discrètes
 Si distribution asymétrique Nombre de consultation ni
à droite à gauche
0 15
mode < médiane < moyenne moyenne < médiane < mode 1 20
2 35
Mode Mode
3 20
Médiane Histogramme

20
18 Médiane 4 10
16
14
Moyenne Moyenne Total 100
12
10
%

8
6
4
Déterminer la moyenne, la médiane et le mode?
2
0
1 2 3 4 5 6 7 8 9 2 4 6 8 10
Notes
19/02/2020 PSA (ng/l) 375 19/02/2020 376

Statistiques descriptives Paramètres de dispersion


variables quantitatives
 Étendue
 Paramètres de position : Mesures de la
tendance centrale  Les quartiles
Position

 La variance
 Paramètres de dispersion Dispersion
 Écart-type

19/02/2020 377 19/02/2020 378

63
Pr [Link]---Methodo 19/02/2020

Étendue Paramètres de dispersion

 L’étendue indique la distance entre la plus  Étendue


grande et la plus petite valeur observée dans
la distribution.  Les quartiles
Quantifie l’étalement total des données

Étendue = valeur maximale - valeur minimale  La variance


 Exemple :
 Une série : 10, 12, 18, 20, 25, 35
 Écart-type
 Étendue : 25 (10 à 35).

19/02/2020 379 19/02/2020 380

Les quartiles Les quartiles

Ce sont des valeurs (Q1, Q2, Q3) qui séparent  Le premier quartile ou le quartile inférieur Q1
l’échantillon en 4 parties qui contiennent le = 25 % des valeurs sont inférieures à Q1 et
même nombre de données. 75 % lui sont supérieures

 Le troisième quartile ou le quartile supérieur


Q3 = 75 % des valeurs sont inférieures à Q3
et 25 % lui sont supérieures
25% 25% 25% 25%
 La médiane = le deuxième quartile Q2
Quart Quart Quart Quart
1 2 3 4
19/02/2020 381 19/02/2020 382

Les quartiles Les quartiles


exemple
 Données ordonnées : 10, 12, 18, 20, 25, 45
Médiane de la distribution
(15+1)/2 = 8e donnée
 Médiane Q2: (20 + 18)/2 = 19
1 2 3 4 5 6 7 8 9 10 11 12 13 14  Quartile inférieur Q1:
15
 la médiane de 10, 12, 18 = 12
3 4 4 5 5 5 6 6 6 6 8 8 10
 Quartile supérieur Q3:
Quart Quart
12 Q 15Quart Quart  la médiane de 20, 25, 45 = 25
1 2
2 3 4
Q1 Q3

Médiane des données Médiane des données qui


précédent Q2 suivent Q2

19/02/2020 383 19/02/2020 384

64
Pr [Link]---Methodo 19/02/2020

Paramètres de dispersion La variance

 Étendue  La variance :
 La moyenne des carrés des écarts à la moyenne
 Les quartiles  La somme des carrés des écarts à la moyenne
divisée par le nombre d'observations

 La variance
∑𝑛𝑖 (𝑥𝑖 − 𝑚)2
𝒔𝟐 =
 Écart-type 𝑛−1
Dispersion, Étalement, Variabilité des Valeurs

19/02/2020 385 19/02/2020 386

La variance La variance
méthode de calcul
x1  Calculer la moyenne m
x12 x3
x2
 Calculer la différence entre chaque
observation et la moyenne (xi - m)
x11
m x4  Porter chacune de ces différences au carré
(xi - m)2
x10 x5  Additionner tous ces carrés et diviser la
x9
x8
x7 x6 somme des carrés par le nombre
d’observations moins 1 (n -1)
Représente l ’écart moyen des données de
l’échantillon par rapport à la moyenne
19/02/2020 387 19/02/2020 388

La variance La variance
exemple exemple
 Calculer la variance s2 : 10, 12, 18, 20, 25, 35  Calculer la variance s2 : 10, 12, 18, 20, 25, 55
 Calculer la moyenne : m=20  Calculer la moyenne : m=23,3
Observations xi 10 12 18 20 25 35 Observations xi 10 12 18 20 25 55
Différence à la moyenne Différence à la moyenne
-10 -8 -2 0 +5 +15 -13,3 -11,3 -5,3 -3,3 1,7 31,7
xi- 20 xi- 20
Carré de la différence à Carré de la différence à
100 64 4 0 25 225 177,8 128,4 28,4 11,1 2,8 1002,8
la moyenne la moyenne

83,6 VS 200,6
19/02/2020 389 19/02/2020 390

65
Pr [Link]---Methodo 19/02/2020

La variance Paramètres de dispersion


exemple
 Série 1: 10, 12, 18, 20, 25, 35  Étendue
 La moyenne : m=20
 La variance: s2 = 83,6
 Les quartiles

 Série 2: 10, 12, 18, 20, 25, 55


 La variance
 La moyenne : m=23,3
 la variance: s2 = 200,6
 Écart-type
La variance : très sensible aux valeurs extrêmes
19/02/2020 391 19/02/2020 392

Écart-type Écart-type

 Mesure la dispersion autour de m 

 La mesure de dispersion la plus couramment


utilisée
 = Standard Deviation (SD)
 Calcul

∑𝑛𝑖 (𝑥𝑖 − 𝑚)2


s =𝑆𝐷 = 𝑛−1
Dispersion, Étalement, Variabilité des Valeurs

19/02/2020 393 19/02/2020 394

La signification probabiliste de l’écart- La signification probabiliste de l’écart-type


type
Echantillon 1 Echantillon 2 50 % des individus en-dessous de la moyenne et 50 % au-dessus
68 % des individus entre µ-1σ et µ+1σ
95 % des individus entre µ-1,96σ et µ+1,96σ
s2 < s1 99,7 % des individus entre µ -3σ et µ+3σ
s1
s2

m
19/02/2020 19/02/2020 396
395

66
Pr [Link]---Methodo 19/02/2020

La signification probabiliste de l’écart-type Statistiques descriptives


variables quantitatives
 Exemple : Chez le sujet adulte non diabétique continues
 La glycémie est distribuée selon une loi normale  Moyenne ± Ecart type
 Moyenne : 0,86 g/L
Le poids moyen est de 60 kg ± 5
 Écart - type 0,07 g/L

Médiane et Quartile

95 % des individus entre µ-1,96σ et µ+1,96σ
Médiane = 50 (Q1=30; Q3=70)
95 % des sujets « normaux » de
Intervalle interquartile : intervalle [Q1 , Q3]
cette population ont une glycémie
comprise entre 0,72 et 1,00 g/L
19/02/2020 397 19/02/2020 398

Plan Statistique descriptive


à 2 dimensions
 Définition  Objectif : mettre en évidence les relations qui
existent entre deux variables.
 Rappels  Nature des variables : les deux variables
 Statistique descriptive : Variable qualitative peuvent être
 Qualitatives
 Statistique descriptive : Variable quantitative  Quantitatives
Ou l'une quantitative et l'autre qualitative.
 Statistique à deux dimensions 

 Deux variables mesurées chez le même


 Conclusion individu
 Exemples :
 Présence d’un cancer et tabagisme...
 Poids et taille

19/02/2020 399 19/02/2020 400

Statistique descriptive Statistique descriptive à 2 dimensions


à 2 dimensions deux variables quantitatives
Durée
Patient Age (ans) d’hospitalisation (j)
1 32 5
2 25 14
Deux variables quantitatives 3
4
27
33
9
8
5 29 10
6 51 24
7 65 41
Position8du problème 70 32
On désire
9 savoir, dans une
48 population donnée,5 si
l’âge 10
(X) et la durée d’hospitalisation
53 (Y) d'un
13
individu
… sont deux variables
… indépendantes…ou non.
19/02/2020 401 19/02/2020 402

67
Pr [Link]---Methodo 19/02/2020

Statistique descriptive à 2 dimensions Coefficient de corrélation linéaire


deux variables quantitatives
 Corrélation : étudier les variations d’une  Notation
variable quantitative en fonction d’une autre  ρ : paramètre théorique (population)
variable quantitative.  r : paramètre observé sur un échantillon
 Sans unité

 Un indicateur de liaison:
 Le coefficient de corrélation linéaire Le coefficient de corrélation de Bravais-Pearson
Le coefficient de corrélation de Spearman

19/02/2020 403 19/02/2020 404

Coefficient de corrélation linéaire Estimation du coefficient de corrélation


Population échantillon
 Soit une population de N sujets pour laquelle  A partir d’un échantillon de taille n on estime la
les valeurs des variables X et Y sont (xi, yi) ⇒ covariance par :
 Coefficient de corrélation linéaire
COV(X, Y)
 X ,Y 
VAR(X)  VAR(Y)  Calcul r : Remplacer la covariance et les
 COV (X,Y) = moyenne des produits des écarts à variances par leurs estimations
la moyenne
cov (x, y)
r 
2
s X  s 2y
19/02/2020 405 19/02/2020 406

Coefficient de corrélation linéaire Coefficient de corrélation linéaire


Exercice
 Le coefficient de corrélation est symétrique : rx,y = ry,x  Une étude a été conduite sur un échantillon de
 Mesure l'intensité de la liaison linéaire entre X et Y
 Le coefficient de corrélation varie entre -1 et 1. 30 sujets pour déterminer si la valeur de la
 0 signifie une association nulle pression artérielle systolique dépendait de l’âge.
 Le signe indique le sens de la liaison / corrélation:  Les statistiques descriptives sont présentées
 Corrélation positive: les deux variables ont tendance à varier
dans le même sens. dans le tableau suivant:
 Corrélation négative: les deux variables ont tendance à varier en Age (ans) PAS (mmHg)
sens opposées
Moyenne 40 140
 |rx,y| Proche de 1  RELATION LINEAIRE FORTE entre
les deux variables. Ecart type 10 20
 |rx,y| Proche de 0  RELATION LINEAIRE FAIBLE entre Cov (Age*PAS) 120
les deux variables
cov (x, y) 120
r  r   0.6
2
19/02/2020 407 19/02/2020
s X s 2
y
102  20 2 408

68
Pr [Link]---Methodo 19/02/2020

Conclusion Statistique descriptive


Variables qualitatives
 La statistique descriptive Dichotomiques
Observables
 Première étape d’analyse biostatistique Binaires
Variables
Obligatoire Variables Ordinales
 qualitatives
 Variable qualitative
Nominales
 Effectif & Pourcentage
 Variable quantitative Fréquence absolue : effectif
 Moyenne ± écart- type Nombre d’individus par classe : n

 Médiane et quartiles Fréquences relatives


 Deux variables quantitatives : corrélation Pour chaque classe, le rapport de son effectif au nombre total d’individus
Exprimées en pourcentage

19/02/2020 409 19/02/2020 410

Statistique descriptive La Statistique Descriptive


Variables quantitatives Définition
 Décrire les données par
Mesurables  Des paramètres statistiques :
Continues
Variables  Réduction des données à quelques valeurs
Variables
quantitatives numériques caractéristiques.
Discrètes

 Des tableaux : distributions de fréquences.


Paramètres de position : Mesures Paramètres de dispersion
de la tendance centrale Étendue
Moyenne arithmétique Les quartiles
 Des diagrammes : graphiques.
Médiane La variance
Mode Écart-type
Pour la bien mener il faut savoir de quelle type
de variable s’agit-il
19/02/2020 411 19/02/2020 412

Tableau ou diagramme 1. Regroupement en classes

• Choix : Suivant le type de variable


Variables Variables
quantitatives Transformation quantitatives
• Classes ou modalités +++ continues discrètes
Discrétisation
(classes)
Variables
 Première étape : Tri des données
quantitatives Transformation Variables
 Variables qualitatives : modalités continues / qualitatives
 Variables quantitatives: Regroupement en discrètes (modalités)
classes
19/02/2020 413 19/02/2020 414

69
Pr [Link]---Methodo 19/02/2020

1. Regroupement en classes 1. Regroupement en classes


Variables
Variables Variables Variables
quantitatives
qualitatives quantitatives Transformation quantitatives
continues / Transformation
ordinales continues discrètes
discrètes Discrétisation
(modalités) (classes)
Exemple : PAS des patients (n=50) min = 120 mmHg, max = 200 mmHg
Exemple : âge des patients (n=50) min = 18 ans, max = 70 ans)
155 178 159 197 187 183 130 121 198 198
158 197 176 138 140 187 195 165 122 178 29 65 55 45 26 66 23 44 70 65
167 125 152 130 176 124 185 122 196 187 20 31 23 28 30 21 48 39 64 65
179 193 180 155 156 141 147 199 144 130 68 70 37 57 59 26 65 51 53 51
200 187 171 155 130 126 136 155 199 130 36 63 33 57 28 66 48 27 33 32
54 18 47 22 20 20 55 33 68 64
1 2 3 4
Borne inférieure 120 140 160 180
Borne supérieure 139 159 179 200 1 2 3
n 13 12 8 17 Classe d’âge [18-30] [31-50] [51-70]
Modalités Normale HTA légère HTA modérée HTA sévère Borne inférieure 18 31 51
Borne
19/02/2020 415 supérieure
19/02/2020 30 50 70 416
n 14 13 23

1. Regroupement en classes 1. Regroupement en classes

 Une classe correspond à un intervalle de  Regroupement en classes: Nombre de classe


valeurs d'une variable quantitative avec une (k)
borne inférieure et une borne supérieure.  Formule de Sturges-Huntsberger :
 Notation : [borne inférieure – borne supérieure [ k = 1 + 3,3× log10(n)
 Amplitude d’une classe = longueur de l’intervalle  Règle de Yule : k = 2 . 5 4 n
 Bornes d’une classe = valeurs minimale et  Formule de Brooks-Carruthers : k = 5 × log(N)
maximale de la classe
 K= 𝒏
19/02/2020 417 19/02/2020 418

1. Regroupement en classes 1. Regroupement en classes


4 règles 4 règles
La durée d’hospitalisation de 36 malades La durée d’hospitalisation de 36 malades

11 20 18 10 20 11 11 20 18 10 20 11
16 10 15 17 17 11 16 10 15 17 17 11
Calculer l’étendue E
11 12 12 11 20 13 E =20 – 10 = 10 11 12 12 11 20 13
Calculer l’étendue E
15 20 13 19 14 15 Intervalles de Classe (L): 15 20 13 19 14 15
E = maximale – minimale. 16 11 20 12 10 12 L = 10/6 =1,7 ≈2 16 11 20 12 10 12
Calculer l’Intervalles de
Classe (L):
18 10 13 16 16 13 Déterminer les classes: 18 10 13 16 16 13
1ère Classe = [10 – 12[
L=E/K
Déterminer les classes: 2ème Classe = [12 – 14[ Classe [10 – [12 – [14 – [16 – [18 – [20 –
1ère Classe = [min – mini+L[ Arrondir L selon précision 3ème Classe = [14 – 16[ 12[ 14[ 16[ 18[ 20[ 22[
2ème Classe = [min +L – min+2L[ voulue ⇒ diminution ou 4ème Classe = [16 – 18[ n 10 8 4 6 3 5
Dernière Classe =[maximale -L – maximale[ augmentation parfois de K de 1. 5ème Classe = [18 – 20[
6ème Classe = [20 – 22[
19/02/2020 419 19/02/2020 420

70
Pr [Link]---Methodo 19/02/2020

La Statistique Descriptive 2. Tableaux


Tableau ou diagramme
1. Regroupement en classes  Définition
2. Tableaux  Matrice comportant au moins deux entrées :
 Une horizontale : lignes
3. Graphiques
 Une verticale : colonnes
4. Boîte à moustaches
5. Diagramme de dispersion  Objectif
 Présenter les données de façon exacte

Présentation écrite des données


statistiques
19/02/2020 421 19/02/2020 422

2. Tableaux 2. Tableaux

 Les tableaux statistiques : xi ni fi


Chaque ligne
 Distribution de fréquences absolues : n correspond à une
 Distribution de fréquences relatives : % x1 n1 f1 modalité différente.
ni correspond au nombre
 Présentation
 Colonne 1 : Les classes de la variables x2 n2 f2 d’observations (effectif)
ayant comme valeur xi

 Colonne 2 : Les effectifs fi correspond à la


 Colonne 3 : Les fréquences … … … fréquence (pourcentage)
d’observations ayant
 Dernière ligne: Total des effectifs et total des xp np fp comme valeur xi
ni
fréquences (100%)
fi  X 100
p
19/02/2020
Éviter les données manquantes
423
S1 xi
19/02/2020
n 1 n
424

2. Tableaux 2. Tableaux

 Présentation  Variables qualitatives


Variable Effectif Fréquence relative

Variable 1
1ère modalité n1 p1
 Variables quantitatives
2ème modalité n2 p2  Discrètes
… … …  Continues Discrétisation
Variable 2
1ère modalité n1 p1
2ème modalité n2 p2  Deux variables ou plus
… …. …
….

Total n 100%

19/02/2020 425 19/02/2020 426

71
Pr [Link]---Methodo 19/02/2020

2. Tableaux 2. Tableaux
Exemple : V. qualitative Exemple : V. qualitative

Distribution des patientes selon les Distribution des patientes selon le


ATCDs médicaux (n=1000) degré de satisfaction (n=1000)
Pourcentage Pourcentage
Effectif des Le degré de Effectif des
ATCDs médicaux des patients des patients
patients (n) satisfaction patients (n)
(%) (%)
Grossesse 129 12,9% Non satisfait 80 8%
Diabète 483 48,3% Peu satisfait 300 30%
HTA 332 33,2% Satisfait 500 50%
Ménopause 56 5,6% Très satisfait 120 12%
Total
19/02/2020
1000 100,0% 427
Total
19/02/2020
1000 100,0% 428

2. Tableaux 2. Tableaux
Exemple : V. quantitative discrète Exemple : V. quantitative discrète
Distribution des foyers de la region de Rabat selon le nombre Distribution des foyers de la region de Rabat selon le nombre
d’enfants (n=1000) d’enfants (n=1000)
Nombre Fréquence Fréquence
Effectif (n) Fréquence Fréquence
d'enfants relative (%) cumulée (%) Nombre
Effectif (n)
0 129 12,9% 12,9% d'enfants relative (%) cumulée (%)
1 451 45,1% 58,0% 0 129 12,9% 12,9%
2 332 33,2% 91,2% Moins de 3
3 56 5,6% 96,8% enfants 839 83,9% 96,8%
4 21 2,1% 98,9% Entre 1 et 3 enfants
5 8 0,8% 99,7% Plus de 3 enfants 32 3,2% 100%
6 3 0,3% 100,0% Total 1000 100%
Total 1000 100%
19/02/2020 429 19/02/2020 430

2. Tableaux 2. Tableaux
Exemple : V. quantitative continues Exemple : V. quantitative continues
Une enquête épidémiologique a été réalisée pour étudier
l’âge des patients consultant dans un cabinet médical a Classe d'âge ni %
Rabat.
[14-16[ 15 12,50%
25,2 21,5 20,4 17,4 25,5
18,7 25,7 21,5 22,2 24,4
[16-18[ 20 16,67%
26,4 22,8 17,9 17,7 24,4
23,0 19,6 16,8 22,5 17,4
[18-20[ 35 29,17%
17,0 16,0 18,1 19,9 21,2
14,8 25,6 17,5 23,8 14,8
17,7 23,1 23,0 15,5 18,4
[20-22[ 15 12,50%
16,9 24,8 16,9 20,4 18,4
16,5 17,5 24,2 17,3 19,7
[22-24[ 10 8,33%
24,0 18,8 15,4 16,5 16,7
21,1 25,2 22,5 23,3 20,9
>24 25 20,83%
23,6 26,0 23,8 16,0 24,5
….
Total 120 100,00%
19/02/2020 431 19/02/2020 432

72
Pr [Link]---Methodo 19/02/2020

2. Tableaux La Statistique Descriptive


Exemple : 2 variables Tableau ou diagramme
Classe Hommes Femmes Total 1. Regroupement en classes
d'âge ni % ni % ni % 2. Tableaux
[14-16[ 11 15,7% 4 8,0% 15 12,5% 3. Graphiques
[16-18[ 10 14,3% 10 20,0% 20 16,7% 4. Boîte à moustaches
[18-20[ 19 27,1% 16 32,0% 35 29,2% 5. Diagramme de dispersion
[20-22[ 8 11,4% 7 14,0% 15 12,5%
[22-24[ 5 7,1% 5 10,0% 10 8,3%
>24 17 24,3% 8 16,0% 25 20,8%
Total 70 100,0% 50 100,0% 120 100,0%
19/02/2020 433 19/02/2020 434

3. Graphiques 3. Graphiques

 Définition  Deux axes :


 Images des données des études statistiques  Axe horizontal : abscisses
 Axe vertical : ordonnées
 Objectif
 Faire ressortir une vision synthétique du
phénomène étudié
 Permet de comparer d’un « coup d’œil » les
différentes modalités

19/02/2020 435 19/02/2020 436

3. Graphiques 3. Graphiques

 Deux axes :  Recommandation :


 Axe horizontal : abscisses  Graphique simple
 Les modalités  Compréhensible
 Axe vertical : ordonnées  Légendé (titre, axes, unités)
 Les effectifs (ou fréquences)  Honnête
 La hauteur de chaque bande  A éviter :
 Proportionnelle à l’effectif correspondant  Graphes 3D
 Les superpositions de multiples graphes sur une
même graphique
 La coloration abusive : dégradé de gris +++

19/02/2020 437 19/02/2020 438

73
Pr [Link]---Methodo 19/02/2020

3. Graphiques 3. Graphiques

 Types :
 Histogramme
 Polygone de fréquence
 Diagramme en barres Types de
 Diagramme en barres horizontales variables
 Camembert

19/02/2020 439 19/02/2020 440

Histogramme Histogramme

 Types de variables :  Un diagramme :


 Barres verticales contiguës
 Variables quantitatives discrètes  Ordonnées : effectifs / fréquences
 Abscisses : les classes de la variable
 Variables quantitatives continues : discrétisation  Échelle des abscisses :
 Variables continues : Les bornes des classes (intervalle
de la classe)
 Variables discrètes : Le centre de la barre

19/02/2020 441 19/02/2020 442

Histogramme Histogramme
Exemples Étendue des classes

Effectif :
Distribution de l'âge chez 120 sujets
nombre
de sujet
adultes
80
Nombre
60 de barre

?!
40
20
0
Variable quantitative : Age (ans)
19/02/2020 443 19/02/2020 444

74
Pr [Link]---Methodo 19/02/2020

Regroupement en classes Histogramme


4 règles
La durée d’hospitalisation de 36 malades

11 20 18 10 20 11 12 30,0% 27,8%
10
16 10 15 17 17 11 10 25,0% 22,2%
Calculer l’étendue E 8
E =20 – 10 = 10 11 12 12 11 20 13 8
6
20,0%
16,7%
13,9%
6 5 15,0%

Intervalles de Classe (L):


15 20 13 19 14 15 4
4
3 10,0%
11,1%
8,3%
L = 10/6 =1,7 ≈2 16 11 20 12 10 12 2 5,0%

Déterminer les classes: 18 10 13 16 16 13 0


[10 – 12[ [12 – 14[ [14 – 16[ [16 – 18[ [18 – 20[ [20 – 22[
0,0%
[10 – 12[ [12 – 14[ [14 – 16[ [16 – 18[ [18 – 20[ [20 – 22[
1ère Classe = [10 – 12[
2ème Classe = [12 – 14[ [10 – [12 – [14 – [16 – [18 – [20 –
Classe La durée d’hospitalisation de 36 malades
3ème Classe = [14 – 16[ 12[ 14[ 16[ 18[ 20[ 22[
4ème Classe = [16 – 18[
n 10 8 4 6 3 5
5ème Classe = [18 – 20[
6ème Classe = [20 – 22[ % 27,8% 22,2% 11,1% 16,7% 8,3% 13,9%
19/02/2020 445 19/02/2020 446

Polygone de fréquence Polygone de fréquence

 Type de variable :  Graphe linéaire :


 Ordonnée : effectifs ou fréquences
 Variable quantitative continue  Abscisse : valeurs du variable discrétisée
 Chaque point = effectif ou fréquence pour le
point central de la classe de la variable.
 Polygone de fréquence doit commencer et se
terminer à 0
 Intérêt : représenter sur un même graphique
plusieurs distributions.
19/02/2020 447 19/02/2020 448

Polygone de fréquence Polygone de fréquence


Exemples Exemples
Effectif : Effectif :
nombre nombre
de sujetDistribution de l'âge chez 120 sujets adultes de sujet
Distribution de l'âge selon le sexe
40 20

30 15
10
20
5
10 0
0 <14 [14-16[ [16-18[ [18-20[ [20-22[ [22-24[ >24
<14 [14-16[ [16-18[ [18-20[ [20-22[ [22-24[ >24 Hommes Femmes
Variable quantitative : Age (ans) Variable quantitative : Age (ans)
19/02/2020 449 19/02/2020 450

75
Pr [Link]---Methodo 19/02/2020

Polygone de fréquence Diagramme en barres


Exemples
 Type de variable :

 Variable qualitative ordinale +++

 Variable qualitative nominale

19/02/2020 451 19/02/2020 452

Diagramme en barres Diagramme en barres


Exemple
 Diagramme :
 Barres verticales disjointes
 Ordonnées : effectifs ou les fréquences
 Abscisses :
 Sans échelle numérique
 Libellés : modalités des variables
 Les barres :
 Largeur : identique

19/02/2020 453 19/02/2020 454

Diagramme en barres Diagramme en barres


Exemple Exemple

19/02/2020 455 19/02/2020 456

76
Pr [Link]---Methodo 19/02/2020

Diagramme en barres Diagramme en barres horizontales


Exemple
 Diagramme en barres horizontales
 Variable qualitative nominale
 Diagramme :
 Barres horizontales disjointes
 Ordonnées : Libellés des classes
 Abscisses : effectifs ou les fréquences

19/02/2020 457 19/02/2020 458

Camembert Camembert
(Pie chart) (Pie chart)
 Type de variable :  Camembert :
 Cercle divisé en secteurs
 Variable qualitative nominale  Chaque secteur : une classe de la variable
 La surface du secteur : proportionnelle à la
fréquence
 Permet de bien visualiser la part relative
de chaque modalité.  Nombre de secteurs : moyenne de 6

19/02/2020 459 19/02/2020 460

Camembert Diagramme en barres


horizontales Camembert
Exemple

5,80%

33,40%
60,70%

non fumeurs anciens fumeurs fumeurs actifs

19/02/2020 461 19/02/2020 462

77
Pr [Link]---Methodo 19/02/2020

La Statistique Descriptive 4. Boîte à moustaches


Tableau ou diagramme
1. Regroupement en classes  Définition:
2. Tableaux  Résume quelques caractéristiques de position du
caractère étudié (médiane, quartiles, minimum,
3. Graphiques maximum)
4. Boîte à moustaches
5. Diagramme de dispersion  Permet de faire une comparaison entre deux
populations

19/02/2020 463 19/02/2020 464

4. Boîte à moustaches 4. Boîte à moustaches

 Variables :

 Variables quantitatives

Médiane, Quartiles, Minimum, Maximum

19/02/2020 465 19/02/2020 466

4. Boîte à moustaches 4. Boîte à moustaches


Exemple : comparaison

19/02/2020 467 19/02/2020 468

78
Pr [Link]---Methodo 19/02/2020

La Statistique Descriptive 5. Diagramme de dispersion


Tableau ou diagramme Nuage de points
1. Regroupement en classes  Définition:
2. Tableaux  Outil pour représenter graphiquement la relation
entre deux variables quantitatives continues
3. Graphiques
4. Boîte à moustaches
 Deux mesures réalisées sur un même individu.
5. Diagramme de dispersion
 Permet de caractériser la direction, la force et la
forme de la relation.

19/02/2020 469 19/02/2020 470

5. Diagramme de dispersion 5. Diagramme de dispersion


Nuage de points Nuage de points
(X;Y)

X
19/02/2020 471 19/02/2020 472

Conclusion Organisation et Présentation des


données
Dichotomiques
Organisation et Observables
Présentation des Binaires
Variables
données Variables qualitatives Ordinales

Nominales

Tableaux de fréquences
Graphiques :
Type des variables Diagramme en barres
Diagramme en barres horizontales
Camembert

19/02/2020 473 19/02/2020 474

79
Pr [Link]---Methodo 19/02/2020

Organisation et Présentation des


données

Mesurables
Variables
Continues Statistique descriptive
Variables
quantitatives
Discrètes Estimation par intervalle
Intervalle de confiance à 95%
Tableaux de fréquences
Graphiques :
Histogramme
Polygone de fréquence
Boîte à moustaches

19/02/2020 475

Statistique descriptive 1. Introduction


Estimation par intervalle
1. Introduction  Si la population est trop nombreuse on ne
2. Fluctuation d’échantillonnage peut pas étudier toutes les unités statistiques
3. Estimation .
4. Intervalle de confiance d’une moyenne  On prend alors un échantillon de la
population.
5. Intervalle de confiance d’une proportion
6. Intervalle de confiance et la comparaison de Recensement ou Échantillonnage
deux groupes
 Recensement = vérité
 Échantillonnage = estimation de la vérité
19/02/2020 477 19/02/2020 478

Introduction 2. Fluctuation d’échantillonnage

Inférence statistique
 Échantillon
représentatif
Tirage au sort
Echantillon 1 : n1=4
170, 175, 180, 182
m=176,8

Echantillon 2 : n2=4
155, 170, 179, 186
m =172,5
Échantillonnage
Échantillon Echantillon 3 : n3=4
Population Observations 165, 174, 186, 190
Valeur théorique ou Valeur estimée Population
m =178,8
19/02/2020
vraie? 479 19/02/2020 480

80
Pr [Link]---Methodo 19/02/2020

2. Fluctuation d’échantillonnage 2. Fluctuation d’échantillonnage


En résumé
 Échantillon
représentatif  Extraction de n échantillons d’une population
Tirage au sort P
 Si l’on extrait plusieurs échantillons représentatifs
de taille n fixée, les différences observées entre
les résultats obtenus sont dues à des fluctuations
 Plusieurs échantillons d’échantillonnage.
peuvent être  A partir d’un échantillon, on n’a donc pas de
constitués certitudes mais des estimations de paramètres.

Fluctuation
Population d’échantillonnage
19/02/2020 481 19/02/2020 482

Statistique descriptive 3. Estimation


Estimation par intervalle
1. Introduction  Estimation ponctuelle
2. Fluctuation d’échantillonnage  On donne une unique valeur calculée à partir des
observations faites sur l'échantillon
3. Estimation
 Estimation par intervalle
4. Intervalle de confiance d’une moyenne
 On donne 2 valeurs entre lesquelles le paramètre
5. Intervalle de confiance d’une proportion peut se trouver
6. Intervalle de confiance et la comparaison de  On donne un intervalle qui a de "fortes chances"
deux groupes de contenir la vraie valeur.
 Intervalle de confiance à 95%

19/02/2020 483 19/02/2020 484

3. Estimation Estimation ponctuelle

Inférence statistique
 Estimation d’un pourcentage
 P = pourcentage vrai de malades dans la
population

 Echantillon comprenant n sujets dont k malades


 Estimation de P :

Échantillonnage
Échantillon
Population Observations
Valeur théorique ou vraie: P, μ, σ2, σ Valeur estimée : p0, m0, s2, s
19/02/2020 485 19/02/2020 486

81
Pr [Link]---Methodo 19/02/2020

Estimation ponctuelle Estimation ponctuelle

 Estimation d’une moyenne  Estimation d’une variance


 μ = moyenne vraie de X  μ = moyenne vraie de X
 Echantillon de n sujets tirés au sort dans la  σ2 variance vraie de X
population  Comme μ est inconnue
 Valeurs observées : x1, … , xn  Estimation de s2
 Estimation de μ :

 Autres expressions de s2 :

19/02/2020 487 19/02/2020 488

Estimation par intervalle Estimation par intervalle

Consiste à construire, autour de l’estimation


Population Échantillon aléatoire
ponctuelle, un intervalle qui aura une grande Je suis confiant à
probabilité (1-) de contenir la vraie valeur du Moyenne = 50 95% que m est entre
Moyenne, m, est 40 & 60.
paramètre. inconnue
Valeur de la
statistique
Intervalle de confiance calculée à
partir de Échantillon
l’échantillon

Limite inférieure Limite supérieure

5%
Intervalle de confiance 5%
19/02/2020 489 19/02/2020 490

Estimation par intervalle Statistique descriptive


Estimation par intervalle
Inférence statistique
Estimation 1. Introduction
Intervalle de confiance
2. Fluctuation d’échantillonnage
3. Estimation
4. Intervalle de confiance d’une moyenne
5. Intervalle de confiance d’une proportion
6. Intervalle de confiance et la comparaison de
Échantillon deux groupes
Observations
Population Valeur estimée
Valeur théorique ou vraie
po /mo
19/02/2020 P/μ? 491 19/02/2020 492

82
Pr [Link]---Methodo 19/02/2020

4. Intervalle de confiance d’une 4. Intervalle de confiance d’une moyenne


moyenne
1. mo est le plus souvent différent de μ
I.C. de m = m  i
2. mo « proche » de μ est « plus probable »
• Taille d’échantillon grande : n >30
intervalle  ponctuelle
« μ » va être estimée à partir de mobservée

Intervalle de confiance de μ = m0 ± i

mo + i - Fourchette
+i . Centrée sur mo
mo mo . i est la précision (la marge d'erreur)
- Risque d’erreur 
-i
19/02/2020 mo - i 493 19/02/2020 494

4. Intervalle de confiance d’une 4. Intervalle de confiance d’une moyenne


moyenne
Expression :
I.C. de m = m  i

Intervalle de confiance à 95 % pour μ :


• Taille d’échantillon petite: n <30
• et X suit une loi normale
s2 s2
[ m0 - 1,96 ; m0 + 1,96 ] s2
n n i = t/2(n-1) x n

s2 = variance n = effectif de l’échantillon


t/2 (n-1) = fonction  et degré de liberté (ddl)
19/02/2020 495 19/02/2020 Tables : loi du Student 496

4. Intervalle de confiance d’une 4. Intervalle de confiance d’une moyenne


moyenne Exemple
 Expression :  Taille à la naissance :
Intervalle de confiance à 95 % pour μ :  m0 = 49 cm s2 = 7,8 cm2
 Intervalle de confiance à 95% de la moyenne
des tailles de naissance observées sur un
s2 s2 échantillon de taille 400 :
[ m0 - t  , (n -1)
; m0 + t  ,(n -1) ]
2 n 2 n s2 s2
[ m 0 - 1,96 ; m 0 + 1,96 ]
n n

7,8 7,8
m  [ 49 - 1,96 ; 49  1,96 ]
400 400
19/02/2020 497 19/02/2020 498

83
Pr [Link]---Methodo 19/02/2020

4. Intervalle de confiance d’une moyenne Statistique descriptive


Exemple Estimation par intervalle
1. Introduction
IC95% = [48,7 – 49,3] 2. Fluctuation d’échantillonnage
3. Estimation
 Interprétation : 4. Intervalle de confiance d’une moyenne
Dans 95% des échantillons de 400 nouveau- 5. Intervalle de confiance d’une proportion
nés, la moyenne observée des tailles est 6. Intervalle de confiance et la comparaison de
comprise entre 48,73 cm et 49,27 cm. deux groupes

19/02/2020 499 19/02/2020 500

5. Intervalle de confiance d’une 5. Intervalle de confiance d’une


proportion proportion
1. po est le plus souvent différent de P I.C. de P = po  i
2. po « proche » de P est « plus probable »
– Si np et nq sont ≥ 5
intervalle  ponctuelle
« P » va être estimée à partir de pobservée

Intervalle de confiance de P = po ± i

po + i - Fourchette
+i . Centrée sur po
po po . i est la précision (la marge d'erreur)
- Risque d’erreur 
-i
19/02/2020 po - i 501 19/02/2020 502

5. Intervalle de confiance d’une 5. Intervalle de confiance d’une proportion


exemple
proportion
 Expression :  Au sein d'un échantillon de 40 sujets atteints
Intervalle de confiance à 95 % pour P : de cancer du sein, un nouveau traitement
permet d'obtenir un succès (réduction de la
taille de la tumeur de plus de 90% en trois
p0(1 - p0) p0(1 - p0) mois) chez 15 patients.
[ p0 - 1,96 ; p0 + 1,96 ] 1. Quel est l'intervalle de confiance à 95% de la
n n 

proportion observée de succès thérapeutique ?


 2. Interpréter le résultat

19/02/2020 503 19/02/2020 504

84
Pr [Link]---Methodo 19/02/2020

5. Intervalle de confiance d’une proportion 5. Intervalle de confiance d’une proportion


exemple exemple
 La proportion observée de succès thérapeutique :
I.C. de P = po  i  Nombre observé de succès thérapeutique : 15
 p0 = 15/40 = 37,5%
 np0 = 15 et nq0 = 25 sont ≥ 5
– Si np et nq sont ≥ 5
 On utilise la formule :
p 0 (1 - p 0 ) p 0 (1 - p 0 )
[ p 0 - 1,96 ; p 0 + 1,96 ]
n n
0,37(1 - 0,37) 0,37(1 - 0,37)
[ 0.37 - 1,96 ; 0.37 + 1,96 ]
40 40
 l’IC à 95% = [ 22,5% - 52,5% ]
 Interprétation :
 Dans 95% des échantillons de 40 sujets atteints de cancer du sein,
le pourcentage observé de succès thérapeutique avec le nouveau
traitement est compris entre 22,5% et 52,5%.
19/02/2020 505 19/02/2020 506

Intervalle de confiance d’une proportion

Petits échantillons :
np et nq sont < 5

Tables

19/02/2020 507 19/02/2020 508

6. Intervalle de confiance 6. Intervalle de confiance


comparaison de deux groupes comparaison de deux groupes
 On souhaite mesurer l'effet d'un médicament  Questions :
sur la migraine.  1. A l'aide d'intervalle de confiance au seuil de
 Pour cela, on constitue 2 groupes, chacun de 95%, que peut-on conclure quant à l'efficacité du
médicament?
100 personnes.
 2. Quelle taille aurait dû avoir chacun des 2
 Un groupe A reçoit le médicament
groupes, pour pouvoir conclure à l'efficacité du
 et un groupe B un placebo, c'est à dire un médicament, avec des fréquences identiques?
comprimé sans aucun principe actif.
 Dans le groupe A, 70 personnes ont vu leur
migraine diminuer et dans le groupe B, 60.

19/02/2020 509 19/02/2020 510

85
Pr [Link]---Methodo 19/02/2020

6. Intervalle de confiance 6. Intervalle de confiance


comparaison de deux groupes comparaison de deux groupes
 Traitement A : • Placebo :
 Nombre observé de succès – Nombre observé de succès
thérapeutique : 70 thérapeutique : 60 l’IC à 95% ttt A = [ 61% - 79% ]
 p0 = 70/100 = 70% – p0 = 60/100 = 60% l’IC à 95% placebo = [ 50,4% - 69,6% ]
 np0 = 70 et nq0 = 30 sont ≥ 5 – np0 = 60 et nq0 = 40 sont ≥ 5
On utilise la formule :
50,4% 61% 69,6% 79%
p 0 (1 - p 0 ) p 0 (1 - p 0 )
[ p 0 - 1,96 ; p 0 + 1,96 ]
n n placebo TTT A
 l’IC à 95% = [ 61% - 79% ] • l’IC à 95% = [ 50,4% - 69,6% ]
 Interprétation : • Interprétation : 1. A l'aide d'intervalle de confiance au seuil de 95%, que
 Dans 95% des échantillons de – Dans 95% des échantillons de peut-on conclure quant à l'efficacité du médicament?
100 sujets atteints de migraine, 100 sujets atteints de
le pourcentage observé de migraine, le pourcentage
succès thérapeutique avec le observé de succès Conclusion : Les 2 intervalles n’étant pas disjoints, on ne peut pas
traitement A est compris entre thérapeutique avec le placebo conclure à l’efficacité du médicament.
61% et 79%. est compris entre 50,4% et
19/02/2020 69,6%. 511 19/02/2020 512

6. Intervalle de confiance 6. Intervalle de confiance


comparaison de deux groupes comparaison de deux groupes
 2. Quelle taille aurait dû avoir chacun des 2 61% 79%
50,4% 69,6%
groupes, pour pouvoir conclure à l'efficacité
placebo TTT A
du médicament, avec des fréquences
identiques? placebo TTT A

61% 79% p 0 (1 - p 0 ) p 0 (1 - p 0 )
<
50,4% 69,6%
p 0 + 1.96 ] p 0 - 1.96
placebo TTT A n n

p 0 (1 - p 0 ) p 0 (1 - p 0 ) p 0 (1 - p 0 ) p 0 (1 - p 0 )
[ p 0 - 1.96 - p 0 + 1.96 ] [ p 0 - 1.96 - p 0 + 1.96 ]
n n n n

19/02/2020 513 19/02/2020 514

6. Intervalle de confiance 6. Intervalle de confiance


comparaison de deux groupes comparaison de deux groupes
50,4% 61% 69,6% 79% 0,9 0,96
placebo TTT A
0,6 +
𝑛 < 0,7 −
𝑛
TTT A 0,9 + 0,96
placebo

𝑛
< 0,7 − 0,6
p 0 (1 - p 0 ) p 0 (1 - p 0 )
p 0 + 1.96 ] < p 0 - 1.96 1,86
n n
0,1 < 𝑛

0,6 + 1,96
0,6 ∗ 0,4
𝑛
< 0,7 − 1,96
0,7 ∗ 0,3
𝑛
<
, 2
,
n
19/02/2020 515 19/02/2020 516

86
Pr [Link]---Methodo 19/02/2020

Conclusion
6. Intervalle de confiance
Échantillon : Inférence
comparaison de deux groupes
 2. Quelle taille aurait dû avoir chacun des 2
groupes, pour pouvoir conclure à l'efficacité
du médicament, avec des fréquences
identiques?

n>345,96 = 355 Échantillon


Population Caractéristiques
Caractéristiques connues
inconnues
Estimation par intervalle Estimation ponctuelle
IC à 95% p0 / m0

19/02/2020 517 19/02/2020 518

Plan

Chapitre 8. I. Introduction

Les statistiques inférentielles. II. Analyse bivariée : tests statistiques

Pr EL ARBI BOUAITI III. Analyse multivariée : régression


Faculté de médecine et de pharmacie -
Rabat

19/02/2020 520

I. Introduction I. Introduction

 Statistique analytique ou Statistique  Objectifs


inférentielle.  Déduire des renseignements sur une population à
partir de la connaissance d'un échantillon.
 Étudier la relation entre deux variables : permettent de
confirmer ou d’infirmer des hypothèses (ex : décider
si, au vu de l’échantillon, P(A)=P(B) est plausible).
Méthodes de tests d’hypothèses
 Expliquer et prévoir la valeur d’une variable a partir
des valeurs prises par d’autres:
Échantillon Méthodes de modélisation et prévision : y=f(x)+ε.
Population Caractéristiques
Caractéristiques Connues: m0, s0, p0
19/02/2020
inconnues µ, σ, P 521 19/02/2020 522

87
Pr [Link]---Methodo 19/02/2020

Plan

 Introduction
 Utilité des tests statistiques en santé
II. ANALYSE BIVARIÉE  Origine de la problématique
 Principe des tests statistiques
LES TESTS STATISTIQUES  La démarche dans les tests statistiques
MÉTHODES DE TESTS  Risques d’erreur en statistique
 Conditions d’application des tests
D’HYPOTHÈSES

19/02/2020 524

Introduction Introduction

 Finalité d’une étude statistique :  Test statistique :


 Tirer des conclusions sur la population à partir de  Procédure qui permet , avec un risque d’erreur
l’étude d’un échantillon issu de cette population. connu, d’effectuer un choix entre deux
hypothèses complémentaires (Ho et H1) au vu
des observations réalisées sur un échantillon.
 Obtention du résultat :
 Par les tests statistiques qui sont des tests
d’hypothèse.  Deux séries de tests différents :
 tests non paramétriques;
 tests paramétriques.

19/02/2020 525 19/02/2020 526

Plan Utilité des tests statistiques en santé

 Introduction  Lire et interpréter les études


 Utilité des tests statistiques en santé  Efficacité des nouveaux traitements (essai clinique)
 Origine de la problématique  Facteurs de risque des maladies (épidémiologie)

 Principe des tests statistiques  Critiquer les données cliniques : médicaments


 La démarche dans les tests statistiques  Pratiquer une médecine fondée sur les preuves
scientifiques (evidence-based medecine)
 Risques d’erreur en statistique
 Accessoirement
 Conditions d’application des tests
 Lecture critique d’articles
 Rédaction mémoire / thèse

19/02/2020 527 19/02/2020 528

88
Pr [Link]---Methodo 19/02/2020

Évaluation de l’efficacité des traitements Évaluation de l’efficacité des traitements

Infection urinaire Infection urinaire


(n=200 patients) (n=200 patients)

Tirage Tirage
au sort au sort

Traitement A Traitement B Traitement A Traitement B


(n=100 patients) (n=100 patients) (n=100 patients) (n=100 patients)

A=B A>B
Guérison Guérison Guérison Guérison
(30/100) (30/100) (40/100) (15/100)

19/02/2020 529 19/02/2020 530

Évaluation de l’efficacité des traitements Évaluation de l’efficacité des traitements


Traitement A Traitement B
1 55 31
Infection urinaire
2 55 10
(n=200 patients) 3
4
26
60
50
50 %:A=B
5 41 39
Tirage 6 70 20
au sort 7 69 69
8 45 60
9 18 43
Traitement A Traitement B
10
11
16
14
36
29
%:A>B
(n=100 patients) (n=100 patients) 12 52 46
13 24 28
14 46 14
A<B 15 18 26
16 34 53
Guérison
(20/100)
Guérison
(35/100)
17 61 61 %:A<B
18 59 28
19 69 35
19/02/2020 531
20
19/02/2020 29 49 532

Plan Origine de la problématique

 Introduction Effet du traitement = 0


 Utilité des tests statistiques en santé Efficacité réelle = 10% Efficacité réelle = 10%
 Origine de la problématique Groupe Groupe
 Principe des tests statistiques Traitement A Traitement B
 La démarche dans les tests statistiques
 Risques d’erreur en statistique
 Conditions d’application des tests Efficacité observée = 6% Efficacité observée = 12%
 Jugement de causalité
Différence observée = -6%

19/02/2020 533 19/02/2020 534

89
Pr [Link]---Methodo 19/02/2020

Origine de la problématique Origine de la problématique

Effet du traitement = 0  Quand on ignore la réalité, la différence


Efficacité réelle = ? Efficacité réelle = ? observée de -6% est-elle ?
 Une manifestation des fluctuations aléatoires,
Groupe Groupe
Traitement A Traitement B donc due uniquement au hasard
 La traduction d’une réelle différence entre les
deux groupes
 Comment départager ces 2 possibilités ?
Efficacité observée = 6% Efficacité observée = 12%  Solution : test statistique .

Différence observée = -6%

19/02/2020 535 19/02/2020 536

Origine de la problématique Plan

 Quel est le but des comparaisons ?  Introduction


 Utilité des tests statistiques en santé
Groupe
Traitement A : 6%
 Origine de la problématique
Conclure à l'existence Décider d'utiliser le  Principe des tests statistiques
Différence -6% d'une différence traitement B
 La démarche dans les tests statistiques
Groupe
Traitement B : 12%  Risques d’erreur en statistique
 Conditions d’application des tests

19/02/2020 537 19/02/2020 538

Principe des tests statistiques Principe des tests statistiques

 Test statistique :  Situations


 Outil statistique de comparaison  Comparer un échantillon observé à une
population de référence
 Comparer deux ou plusieurs échantillons entre
 Comparer 2 ou plusieurs séries de données eux
 On compare des paramètres estimés sur des
échantillons Population Population
de référence

Échantillon

Objectif du test statistique: Comparer des populations


19/02/2020 539 19/02/2020 540

90
Pr [Link]---Methodo 19/02/2020

Principe des tests statistiques Plan

 Situations  Introduction
 Comparer un échantillon observé à une  Utilité des tests statistiques en santé
population de référence  Origine de la problématique
 Comparer deux ou plusieurs échantillons entre  Principe des tests statistiques
eux
 La démarche dans les tests statistiques
Population Population  Risques d’erreur en statistique
de référence

Échantillon
 Conditions d’application des tests
Échantillon

Objectif du test statistique: Comparer des populations


19/02/2020 541 19/02/2020 542

La démarche dans les tests statistiques Etape 1 : Formuler les hypothèses

 Etape 1 : Formuler les hypothèses  Hypothèse H0 :


H0 : μ1 = μ2  Hypothèse nulle
H1 : μ1 ≠ μ2
 C’est toujours l’hypothèse que l’on cherche à
 Etape 2 : Déduire ce que devraient être les observations
invalider (rejeter)
si l’hypothèse nulle (H0) est vraie.
 H0 :
m1 ≈ m2 (fluctuations d’échantillonnage)
 μ1 = μ2
 Etape 3: Confrontation de l’hypothèse de travail et des
 Les paramètres des populations d’où sont issus les 2
observations (calcul de la statistique de test) échantillons sont identiques
 Etape 4 : Interprétation et conclusion

Non rejet de H0 : μ1 = μ2
Rejet de H0 : μ1 ≠ μ2 Attention !!! Les hypothèses sont toujours posées à partir des populations et
non des échantillons
19/02/2020 Une démarche hypothético-déductive 543 19/02/2020 544

Etape 1 : Formuler les hypothèses Etape 2 : Déduire ce que devraient être les
observations si l’hypothèse nulle (H0) est vraie

 Hypothèse H1 :  Sous H0 :
 Hypothèse alternative Paramètres Paramètres
=
 C’est toujours ce que l’on cherche à montrer Population 1 Population 2
 Sera retenue si H0 est rejetée μ1 = μ2
 H1 bilatérale : μ1 ≠ μ2 Paramètres Paramètres
Échantillon 1 = Échantillon 2
 Les paramètres sont différents
 H1 unilatérale : μ1 > μ2 ou μ1 < μ2 m1 = m2
 Un des paramètres est inférieur (ou supérieur) à l’autre.
Fluctuation d’échantillonnage
Attention !!! Les hypothèses sont toujours posées à partir des populations et
m1 - m2 ≈ 0 m1-m2 : R
non des échantillons
19/02/2020 545 19/02/2020 546

91
Pr [Link]---Methodo 19/02/2020

Etape 2 : Déduire ce que devraient être les Etape 3: Etape 3: Confrontation de


observations si l’hypothèse nulle (H0) est vraie l’hypothèse de travail et des observations
 Sous H0 (calcul de la statistique de test)
 Tests paramétriques
m1 - m2 ≈ 0  les conditions de validité (en particulier, une
distribution gaussienne de la variable)
Calculer la
Probabilité (m1 – m2) ≈ 0  Tests non paramétriques
 ne nécessite pas d’hypothèse sur la distribution

19/02/2020 547 19/02/2020 548

Etape 4 : Interprétation et conclusion Etape 4 : Interprétation et conclusion

 Fixer une règle de décision : fixer a priori un  Rejet de H0 H0 : μ1 = μ2


seuil alpha suffisamment petit  Acceptation de H1 : μ1 ≠ μ2
 Au dessous duquel : on rejette H0 et on accepte  Il existe une différence statistiquement
H1 significative entre m1 et m2 (échantillons)
 On conclut que μ1 ≠ μ2 (populations) avec un
risque d’erreur α
 Au dessus duquel : on ne peu pas rejeter H0

Classiquement : α =0.05 Classiquement : α =0.05


19/02/2020 549 19/02/2020 550

Etape 4 : Interprétation et conclusion Plan

 Non rejet de H0  Introduction


 On n’a pas mis en évidence de différence  Utilité des tests statistiques en santé
statistiquement significative entre m1 et m2  Origine de la problématique
(échantillons)
 Principe des tests statistiques
 On ne peut pas conclure que μ1 = μ2
(populations)  La démarche dans les tests statistiques
 Risques d’erreur en statistique
 Conditions d’application des tests

Classiquement : α =0.05
19/02/2020 551 19/02/2020 552

92
Pr [Link]---Methodo 19/02/2020

Risques d'erreur statistiques Risques d'erreur statistiques

p1 = 8%  Le risque de 1ère espèce : risque α


Quelle est la probabilité de commettre une erreur
 C’est la probabilité de rejeter H0, si H0 est vraie
si je conclus à partir de ces données
à l'existence d'une réelle différence
 C’est le risque de se tromper en rejetant H0
p0 = 15%
P(rejeter H0, si H0 est vraie) = α
Probabilité faible Probabilité forte

Conclusion Pas de conclusion

Conclure à l'existence d'une différence que si le risque de faire une


conclusion erronée est faible
19/02/2020 553 19/02/2020 554

Risques d'erreur statistiques Risques d'erreur statistiques

 Le risque de 2ème espèce : risque β


 Le risque de 1ère espèce : risque α  C’est la probabilité d’accepter H0 alors que H0 est
 Conclure à l'existence d'une différence qui n'existe fausse (ou H1 est vraie)
pas en réalité : faux positif  Egale à la probabilité de ne pas rejeter H0, si H1 est
vraie
Vrai valeur Échantillon 1  Méconnu : on ignore le risque de ne pas rejeter à tort
12% 8% H0
Différence
non réelle P(non rejet de H0 si H1 est vraie) = β

Vrai valeur Échantillon 2


12% 15%
19/02/2020 555 19/02/2020 556

Risques d'erreur statistiques Risques d'erreur statistiques

 Le risque de 2ème espèce : risque β  Risque alpha : risque de conclure à une


 Ne pas conclure à une différence qui existe différence qui n’existe pas
pourtant en réalité : faux négatif

 Risque bêta : risque de ne pas mettre en


Vrai valeur Échantillon 1 évidence une différence qui existe réellement
12% 15%

Fausse absence
de différence  Puissance : 1 - bêta : probabilité de mettre en
évidence une différence qui existe réellement
Vrai valeur Échantillon 2
19% 15%

19/02/2020 557 19/02/2020 558

93
Pr [Link]---Methodo 19/02/2020

Risques d'erreur statistiques Risques d'erreur statistiques

Décision (échantillon) Risque α Degré de


Non – rejet Seuil de signification signification
Rejet H0 (p-value)
H0
Risque de  Est fixé a priori  Est déterminer a
H0 vrai posteriori
1ère espèce 1- α
Réalité α  Nécessite le calcul de
(populatio  Est fixé à 5% en
H1 Risque de la valeur de Z0
n) Puissance santé et biologie
vraie 2ème espèce  p est une
1-β β quantification du
risque alpha
19/02/2020 559 19/02/2020 560

Risques d'erreur statistiques Signification statistique

 Test statistique : Calcul de la probabilité p p≤0.05


•Il est peu probable que la
 p : probabilité que "la différence observée soit différence observée soit due
due uniquement au hasard" au hasard
Différence Test
 p représente le risque de faire une conclusion observée statistique •On rejette H0 au risque α de
erronée si l'on décidait de conclure le faire à tort
 On ne conclut que si ce risque d'erreur est
•Conclusion : il existe une
suffisamment petit
différence statistiquement
significative entre les deux
populations.

19/02/2020 561 19/02/2020 562

Signification statistique Signification statistique

p>0.05
Absence réelle
• La probabilité que la d'effet
différence observée soit Résultat

Différence Test
due au hasard est forte non significatif ?
Manque de
observée statistique • On ne rejette pas H0 au puissance
risque β de le faire à tort
 Impossible de conclure
• Conclusion : On n’a pas  Ne pas conclure à l’absence de différence
mis en évidence de «L’absence de preuve n’est pas la preuve de

différence statistiquement
significative entre les deux l’absence»
populations
19/02/2020 563 19/02/2020 564

94
Pr [Link]---Methodo 19/02/2020

Plan Condition d’application des tests

 Introduction  Indépendance des observations


 Rappel
 Utilité des tests statistiques en santé  Les lois de distribution théorique
 Origine de la problématique  Loi normale
 Principe des tests  Loi de Student
 La démarche dans les tests statistiques  Loi du χ2
 Risques d’erreur en statistique
 Conditions d’application des tests  Nature des variables

15/09/2015
19/02/2020 565
565 19/02/2020 566

Indépendance des observations Les lois de distribution théorique

 Echantillons indépendants :  Les tests paramétriques


 Quand les 2 (ou plus) paramètres comparés sont mesurés sur  Effectif dans chaque groupe suffisant (n>30)
des individus différents
 Ex : Comparaison des poids moyens de 2 groupes  Distribution gaussienne du paramètre
échantillonné

 Echantillons dépendants (ou séries appariées) :  Les tests non paramétriques


 Quand les différents échantillons proviennent de mesures  Ne dépendent que des paramètres étudiés
effectuées chez les mêmes individus (moyenne, écart-type, …)
 Ex : Comparaison du poids moyen d’1 groupe d’individus, avant et
après régime  Et ne repose pas sur l’hypothèse d’une loi de
distribution particulière

19/02/2020 567 19/02/2020 568

Nature des variables Choix du test statistique

 Comparaison de pourcentage  Choix du test statistique en fonction des


 Deux variables qualitatives données du problème et de la (ou des)
variable(s) étudiée(s):
 nature de la (ou des) variable(s) (qualitative ou
 Comparaison de moyenne
quantitative)
 Deux variables quantitatives
 nombre d’échantillons
 si plus d’un échantillon, sont-ils indépendants ?
 taille des échantillons : grands (n ≥ 30) ou petits
(n < 30)

19/02/2020 569 19/02/2020 570

95
Pr [Link]---Methodo 19/02/2020

Choix des tests statistiques Conclusion

 2 variables qualitatives :  Les tests permettent seulement de conclure à


test du chi² ou test exact de Fisher

l'existence d'une différence
 1 variable qualitative et 1 variable quantitative: Tests de
comparaisons de moyenne
 distribution normale de la variable quantitative
 2 groupes : test t
 > 2 groupes : analyse de variance (ANOVA)  En cas de différence non significative
 > 2 groupes avec mesures répétées : analyse de variance (ANOVA) à  Impossible de conclure
mesures répétées.
 petits effectifs ou distributions non normales  Et ne permet surtout pas de conclure à l'absence de
 2 groupes : test de Mann Whitney différence vu que le risque d'erreur est inconnu
 > 2 groupes test de Kruskall Wallis  "L'absence de preuve n'est pas la preuve de l'absence"
 2 variables quantitatives
 coefficient de corrélation (régression)
19/02/2020 571 19/02/2020 572

Déroulement d’un test statistique


Une démarche hypothético-déductive

 Etape 1 : Formuler les hypothèses


H0 : μ1 = μ2
H1 : μ1 ≠ μ2 III. Analyse multivariée
 Etape 2 : Choix de α petit (typiquement 5%)
 Etape 3 : Choix du test statistique adapté (test
paramétrique ou non paramétrique) Les régressions
 Etape 4 : Calcul de la valeur expérimentale du test
statistique à partir des observations (échantillon).
 Etape 5 : Détermination de la valeur du petit p
 Etape 6 : Interprétation et conclusion
Non rejet de H0 : μ1 = μ2
Rejet de H0 : μ1 ≠ μ2
19/02/2020 573

Analyse multivariée Qu’est-ce que l’analyse de régression?

 L’objectif premier de l’analyse de régression,


 par opposition à l’analyse univariée est l’étude des relations de dépendance entre
un événement d’intérêt et plusieurs variables.
 Est-ce que le niveau de cholestérol est affecté si
 en complément d’une analyse univariée un individu suit une diète? Est-ce que d’autres
variables entrent en ligne de compte, comme
l’âge, le sexe, le conditionnement physique?

19/02/2020 575 19/02/2020 576

96
Pr [Link]---Methodo 19/02/2020

Principe de l ’analyse multivariée Principe de l ’analyse multivariée

Age Sexe Age Sexe


?S ?S ?S ?S

Réponse au traitement Réponse au traitement


(Evènement à expliquer) ?S (Evènement à expliquer) ?S
Génotype Génotype
viral viral
Stade ?S ?
S Stade ?S ?
S
histologique ?
NS ?S histologique ?
NS ?S

Charge virale Charge virale


Ancienneté Mode de Ancienneté Mode de
de l ’infection contamination de l ’infection contamination

Quels sont les facteurs indépendamment liés à l’événement ? Quels sont les facteurs indépendamment liés à l’événement ?

Principe de l ’analyse multivariée Principe de l ’analyse multivariée

Age Sexe  ANALYSES MULTIVARIÉES


?S ?S
 Les analyses multivariées permettent de prendre
Réponse au traitement en compte les facteurs de confusion
(Evènement à expliquer) ?S
Génotype Consommation Cancer du
viral
Stade ?S ?
S
de café pancréas
histologique ?
NS ?S

Charge virale
Ancienneté Mode de
de l ’infection contamination
TABAGISME

Quels sont les facteurs indépendamment liés à l’événement ? 19/02/2020 580

Principe de l ’analyse multivariée Principe de l ’analyse multivariée

 ANALYSES MULTIVARIÉES
Variable dépendante
 Les analyses multivariées permettent de prendre Variable à expliqué
en compte les facteurs de confusion

Deux solutions
Stratification : 2 groupes
Tabagisme oui : test

statistique entre la
consommation de café.
Tabagisme non : test Variables indépendantes
statistique entre la
consommation de café.
Variables explicatives

L’analyse multivariée +++

19/02/2020 581

97
Pr [Link]---Methodo 19/02/2020

Principe de l ’analyse multivariée Principe de l ’analyse multivariée

Sexe Sexe
Age Age Variables indépendantes
?S Variable dépendante?S ?S ?S
Variable à expliqué Variables explicatives

Réponse au traitement ?S Réponse au traitement ?S


(Evènement à expliquer) Génotype (Evènement à expliquer) Génotype
viral viral
Stade ?S ?
S Stade ?S ?
S
histologique ?
NS ?S histologique ?
NS ?S

Charge virale Charge virale


Ancienneté Mode de Ancienneté Mode de
de l ’infection contamination de l ’infection contamination

Quels sont les facteurs indépendamment liés à l’événement ? Quels sont les facteurs indépendamment liés à l’événement ?

Principe de l ’analyse multivariée Principe de l ’analyse multivariée


variable dépendante variable dépendante
Dichotomiques Variables Régression
Binaires
- Sexe qualitatives logistique
(binaire) (binaire)
Observables Observables
Variables -Niveau
qualitatives Ordinales d’étude

- Couleur
-Ville Variables
Variables Nominales d’origine

-Taille
Continues -Poids
Variables
Variables quantitatives Régression
quantitatives -Nombre
Mesurables Mesurables linéaire
Discrètes
de (continue)
patients

19/02/2020 Pr. BOUAITI (ebouaiti@[Link]) 585 19/02/2020 Pr. BOUAITI (ebouaiti@[Link]) 586

Principe de l ’analyse multivariée Principe de l ’analyse multivariée

 Régressions :

 Régression linéaire Nature de la


variable
dépendante
 Régression logistique

98
Pr [Link]---Methodo 19/02/2020

La régression linéaire simple Régression ou Corrélation:


Deux approches différentes
 On cherche à prédire les valeurs de la Corrélation Régression
variable dépendante à partir de celles de la
X et Y aléatoires X contrôlée, Y aléatoire
variable indépendante.
Question
Y a-t-il un lien? Corrélation Explication de Y par X:
Modèle linéaire simple

Lien Y = a + bx + e
Y = a + bx + e r: paramètre de la
(variation moyenne de la valeur
distribution de (X,Y) de Y pour une augmentation
d’une unité de X)
R2 : part de variation de
19/02/2020 589
Y expliquée par X

Prédiction de Y à partir de l’équation de la


Régression ou Corrélation: Régression
droite ouextrapolation
: Interpolation, Corrélation:
Deux approches différentes Deux approches différentes
Y Y
Une fois connue l’équation de la droite :
** ** Modèle
* *** r * *** f (X) yi  axi  b   i
* *** * *** ici une il est possible de calculer la valeur de y pour x donné
*** **** *** **** droite
***** *****
*** X *** X yi : variable dépendante
xi : variable independante
Nuage de points: X et Y sont Nuage de points : X et Y ne
interchangeables (rôles sont pas interchangeables b : intercept
identiques). Calcul du (rôles différents). Calcul des a : pente
coefficient de corrélation paramètres du modèle f(X).  i : erreur aléatoire
linéaire r X peut être contrôlée
a et b sont les coefficients de la régression

Régression linéaire Régression linéaire simple


Le Modèle linéaire simple Interprétation des coefficients
Si βi = 0 : le facteur βi n’a aucun effet sur la
Y= +X +  
valeur moyenne de la variable dépendante.
 Si βi > 0 : le facteur βi augmente la valeur
moyenne de la variable dépendante.
Variable à Paramètres Variable Erreur
expliquer du modèle explicative aléatoire  Si βi < 0 : le facteur βi décroît la valeur moyenne
de la variable dépendante.

Ecart au
f (X) modèle
Prévision du modèle Le signe du coefficient nous indique le sens de
la relation.

99
Pr [Link]---Methodo 19/02/2020

Régression linéaire simple Intervalle de confiance


Interprétation des coefficients
• L’intervalle de confiance de βi : β =0,6; IC 95%: 0,3-0,9
 Si l’intervalle de confiance (95 %) de βi ne contient pas la
valeur 0, on peut conclure.
0,3 0,6 0,9
 Si l’intervalle de confiance (95 %) de βi contient la valeur
0, on ne peut pas conclure : La vraie valeur de βi peut être Valeur estimée
inférieure, égale ou supérieure à 0.
β =0,6; IC 95%: -0,3-1,5

-0,3 1,5
0,6

Régression linéaire simple Régression linéaire simple


Les p-values La qualité du modèle : la force de la relation
Test statistique : On définit le coefficient de détermination
H0 : 0 R2
Y=+X
H1: #0 Ce coefficient représente la proportion de la
 Le risque alpha (appelé également le risque de variation de la variable dépendante expliquée
première espèce) = fixer à 5% : le risque de par la variable indépendante.
rejeter H0
 Le petit p (p-value) : lorsque le petit p (appelé
également degré de significativité) est inférieur
Y= +X
au risque alpha, on rejette l’hypothèse nulle de
nullité du coefficient.
19/02/2020 597 19/02/2020 598

Régression linéaire multiple

Régression linéaire multiple  Les données


 Y = variable à expliquer : quantitative (loi normale)
 X1,…, Xk = variables explicatives : qualitatives ou
quantitatives.
 Régression linéaire simple (k = 1)
 Régression linéaire multiple (k > 1)
 Régression: La connaissance de la valeur
prise par X permet-elle de prédire la valeur
prise par Y ? Y = f ( Xi )

100
Pr [Link]---Methodo 19/02/2020

Régression linéaire multiple Régression linéaire


Le Modèle linéaire multiple
Y = f ( Xi )
Y =  +  1X1 +  2X2+  3X3+..+

Y est la variable ‘à X est la variable


expliquer’ ou critère. Y ‘explicative’ ou Variable à Paramètres Variables Erreur
est la prévision de Y par prédicteur expliquer du modèle explicative aléatoire
X en utilisant le modèle s

Ecart au
MODELE : RECHERCHE DE f( ) LA PLUS APPROPRIEE. f (X) modèle
LINEAIRE, LOGARITHMIQUE, INVERSE,
Prévision du modèle
CUBIQUE, PUISSANCE, LOGISTIQUE, EXPONENTIELLE,…

Exemple Régression linéaire


Interprétation des coefficients
 On veut étudier l’influence de l’âge, le BMI et  Si βi = 0 : le facteur βi n’a aucun effet sur la
la ménopause sur la densité minérale valeur moyenne de la variable dépendante.
osseuse lombaire.  Si βi > 0 : le facteur βi augmente la valeur
 Variable dépendante? moyenne de la variable dépendante.
 Variables explicatives?  Si βi < 0 : le facteur βi décroît la valeur moyenne
de la variable dépendante.

Y =  +  1X1 +  2X2+  3X3+..+


Ajustement sur les autres variables

Régression linéaire multiple Intervalle de confiance


Interprétation des coefficients
• L’intervalle de confiance de βi : β =0,6; IC 95%: 0,3-0,9
 Si l’intervalle de confiance (95 %) de βi ne contient pas la
valeur 0, on peut conclure.
0,3 0,6 0,9
 Si l’intervalle de confiance (95 %) de βi contient la valeur
0, on ne peut pas conclure : La vraie valeur de βi peut être Valeur estimée
inférieure, égale ou supérieure à 0.
β =0,6; IC 95%: -0,3-1,5

Ajustement sur les autres variables -0,3


0,6 1,5

101
Pr [Link]---Methodo 19/02/2020

Régression linéaire multile Régression linéaire multiple


Les p-values La qualité du modèle : la force de la relation
H0 : i0 On définit le coefficient de détermination
H1: #0 R2ajusté
 Le risque alpha (appelé également le risque de Ce coefficient représente la proportion de la
première espèce) = fixer à 5% : le risque de variation de la variable dépendante expliquée
rejeter H0 par les variables indépendantes.
 Le petit p (p-value) : lorsque le petit p (appelé
également degré de significativité) est inférieur
au risque alpha, on rejette l’hypothèse nulle de
nullité du coefficient.
Y =  +  1X1 +  2X2+  3X3+..+
Y =  +  1X1 +  2X2+  3X3+..+
19/02/2020 607 19/02/2020 608

Comment présenter les résultats dans


Y (BMD): 1,35-0,04 (ménopause) -0,007 (age) +6,6 10-5 (ration calcique)
un tableau
 1/ chez les patientes ménopausées/NM, la BMD lombaire diminue Tableau 1: relation entre le nombre de grossesse et la densité minérale osseuse
de 0,04 à âge et ration calcique égale. Cette diminution est lombaire en analyse multivariée
cependant non significative (p: 0,12)

 2/ chez les patientes du même statut de ménopause, ayant la B IC 95%


même ration calcique, toute augmentation d’une année d'âge
s’accompagne d’une diminution de 0,007 g/cm2 de DMO. Cette Age -0,004 (-0.005, -0.002)
diminution est significative (p<0.001)
BMI 0,001 (-0.001, 0.003)
 3/ pour toute augmentation d’une unité de la ration calcique, en Parité
maintenant l'âge et le statut ménopausique constant, il existe une
augmentation de 6,6 10-5 de la ration calcique (non significative, groupe 1 0
p:0.052)
groupe 2 -0,005 (-0.057,0.048)
 C/C: en analyse multivariée, seule l’âge reste
indépendamment lié à la BMD lombaire groupe 3 -0,012 (-0,065,0.040)
groupe 4 -0,055 (-0.11,-0.001)
Y =  +  1X1 +  2X2+  3X3+..+ Analyse multivariée, variable dépendante: BMD lombaire.
Groupe 1: nulipare: groupe de référence

Régression linéaire multiple Comment réaliser des régressions


conditions d’application linéaires
 Une normalité de la distribution.  Sélectionnez la variable que vous souhaitez expliquer
(Y)
 Un nombre suffisant d’observations : Au  Sélectionner les variables (X):
moins 10 observations pour chaque variable  Les variables avec p-value < 0,3 (analyse univariée)
X introduite dans le modèle.  Les variables connues pour avoir une influence sur la variable à
expliquer
 Attention: ce n’est pas l’effectif total, mais
 Désélectionnez les facteurs qui n’ont pas de sens
c’est l’effectif des variables étudiées. clinique
 Exemple :  Vérifiez qu’il n’y a pas d’erreurs d’après l’analyse
 si l’effectif de l’étude est de 200 patients. descriptive
 5 variables explicatives : au moins 50 patients avec  Transformez les variables quantitatives .
données complètes.
19/02/2020 611 19/02/2020 612

102
Pr [Link]---Methodo 19/02/2020

La régression logistique

Régression logistique binaire  Modélisation d’une variable dépendante Y, de


type continue : la régression linéaire

 Que faut il faire quand la variable réponse


d’intérêt Y prend uniquement deux valeurs
possibles?,
une variable indicatrice binaire prenant les
valeurs 0 et 1.
Exemple : prédiction des fractures

Exemples Régression logistique binaire

 Est-ce que la patiente a présenté une  Les données


Y = variable à expliquer : qualitative à 2 modalités (binaire)
fracture ostéoporotique? Oui/non 

 X1,…, Xk = variables explicatives : qualitatives ou quantitatives.


 Régression logistique simple (k = 1)
 Régression logistique multiple (k > 1)
 Quels sont les facteurs prédicteurs de la
 On cherche à expliquer la survenue d’un évènement Y
survenue d’une fracture? (On cherche la probabilité de succès) : Odds Ratio OR
 Régression logistique simple (k = 1) : OR brut.
 Régression logistique multiple (k > 1) : OR ajusté.
 Le plus souvent appliquée à la santé:
 Identification des facteurs liés à une maladie
 Recherche des causes de décès ou de survie des patients

Le modèle de régression logistique Le modèle de régression logistique

•Prédire la probabilité de la valeur de Y à partir de variables


indépendantes x1,…, xk
E(Y) 1 ,0 • Y = 1: malade
• Y = 0: Ne pas être malade

e xp(-1 0 + 0 ,1X)
0 ,5 E (Y) =
1 + e xp(-10 + 0 ,1 X)

Odds ratio
0 ,0

50 10 0 15 0
X
Les  i sont des constantes inconnues à déterminer. Ils sont
calculés/estimés par des programmes.
618

103
Pr [Link]---Methodo 19/02/2020

Régression logistique binaire Intervalle de confiance


Interprétation des coefficients
 Odds ratio (ou « rapport des cotes ») OR: 0,6; IC 95%: 0,3-0,8
 OR=1 : la maladie est indépendante du symptôme (le
facteur n’a pas d’effet).
 OR>1 : la maladie est plus fréquente pour les 0,3 0,6 0,8

individus qui ont le symptôme (facteur de risque).


Valeur estimée
 OR<1 : la maladie est plus fréquente pour les
individus qui n’ont pas le symptôme (facteur
protecteur). OR: 0,6; IC 95%: 0,3-1,2

 L’intervalle de confiance de l’OR : Si l’intervalle de


confiance (95 %) de l’OR contient la valeur 1, on ne
peut pas conclure : La vraie valeur de l’OR peut être 0,3 1,2
0,6
inférieure, égale ou supérieure à 1.

Régression logistique binaire Régression logistique


Interprétation des coefficients Les p-values
 Variables qualitatives H0 : OR1
 Si Y peut prendre deux valeurs : 0 (la référence) H1:OR #1
et 1 et que X peut prendre deux valeurs : A et B :  Le risque alpha (appelé également le risque de
 Si l’odds ratio de B vs A est supérieur à 1, la première espèce) = fixer à 5% : le risque de
probabilité de Y=1 est plus élevé lorsque X=B que rejeter H0
lorsque X=A.
 Le petit p (p-value) : lorsque le petit p (appelé
 Variables quantitatives également degré de significativité) est inférieur
 si l’odds ratio est inférieur à 1, la variable X réduit au risque alpha, on rejette l’hypothèse nulle.
la probabilité que la variable Y=1.

19/02/2020 621 19/02/2020 622

Exemple Que signifie le résultat?


Variables dans l'équation
p OR
 On veut étudier le risque d’ostéoporose en B E.S. Wald ddl Signif. Exp(B)
IC pour Exp(B) 95,0%
Inférieur Supérieur

fonction de l'âge, de la ration calcique et du Etape


1
a MENOPAUS
RATIONCA
,769
,000
,588
,001
1,711
,002
1
1
,191
,960
2,157
1,000
,682
,999
6,822
1,001

total d’activité physique. AGE


TOTALAP
,094
,000
,018
,000
26,308
3,064
1
1
,000
,080
1,098
1,000
1,060
,999
1,138
1,000
Constante -6,905 1,120 37,982 1 ,000 ,001
a. Variable(s) entrées à l'étape 1: MENOPAUS, RATIONCA, AGE, TOTALAP.

Cela revient à répondre à la question suivante : les variables explicatives prises


simultanément sont-elles associées au risque de survenue de l’événement Interprétation
d’intérêt ? eB âge: 1.1 veut dire, qu’en ajustant sur la ration calcique , le total activité
physique et la ménopause, une augmentation d’une année de l’age
Par exemple, l’âge, la ration calcique, le total activité physique et la ménopause multiplie par 1.1 le risque d’ostéoporose (IC 1.06-1.13)
pris en compte simultanément influent-ils sur le risque d’ostéoporose ?
eB ménopause : 2.15 veut dire qu’en ajustant sur la ration calcique , le
total activité physique et l'âge, les patientes ménopausées ont 2.15 fois
plus de risque de faire une ostéoporose qu’une patiente non
ménopausée. Ce risque est non significatif, IC95% : 0.6-6.8

104
Pr [Link]---Methodo 19/02/2020

Facteurs de risque cliniques de la survenue de Régression logistique


fracture vertébrale : analyse multivariée conditions d’application
Odds ratio IC à 95% p • Un nombre suffisant d’observations : Au
Age 1.06 1.01-1.11 0.008 moins 10 observations pour chaque variable
Nombre total mois d’allaitement 1.00 0.99-1.00 0.92 X introduite dans le modèle.
Fracture périphérique 3.17 1.22-8.24 0.01
 Attention: ce n’est pas l’effectif total, mais
ATCD chute à répétition 0.82 0.24-2.80 0.75
c’est l’effectif des variables étudiées.
Nombre de chute par an 0.89 0.66-1.19 0.45  Exemple :
BMI 0.98 0.92-1.04 0.55  si l’effectif de l’étude est de 200 patients.
 5 variables explicatives : au moins 50 patients
Niveau d’instruction 1.05 0.77-1.45 0.71
avec données complètes.
Exposition solaire 1.04 072-1.51 0.80
19/02/2020 626

Comment réaliser des régression Exercice


logistiques
 Sélectionnez la variable que vous souhaitez expliquer  On cherche à étudier les facteurs de risque de survenue des infections du
site opératoire.
(Y)
 Pour cela, nous avons recueillis les variables ci-dessous chez 894 patients
 Sélectionner les variables (X): hospitalisés pendant la période de l’étude :
 Les variables avec p-value < 0,3 (analyse univariée)  L’infection du site opératoire (ISO) (0=absence d’iso, 1= présence d’iso),
 L’âge en années,
 Les variables connues pour avoir une influence sur la variable à
 Le sexe (0= femme, 1= homme),
expliquer  La durée de séjour en jours,
 Vérifiez qu’il n’y a pas d’erreurs d’après l’analyse  L’immuno-dépression (0= absence d’immuno-dépression, 1= présence d’immuno-
dépression),
descriptive
 Le cathétérisme vasculaire (0= absence de cathétérisme, 1= présence de
 Désélectionnez les facteurs qui n’ont pas de sens cathétérisme),
Le diabète (0= absence de diabète, 1= présence de diabète),
clinique 

 Antibiotique prescrit avant la survenue de l'infection (0= pas d’antibiotique


 Transformez les variables quantitative prescrit, 1= antibiotique prescrit)
 Le type de chirurgie (1=propre, 2= propre contaminée, 3=contaminée, 4=sale)
 Le taux de leucocytes (24 H avant l’intervention, 6 H après l’intervention, 24 H
19/02/2020 627 19/02/2020après l’intervention) 628

QUESTIONS – 1 Choix des tests statistiques

 On cherche à faire une comparaison entre les sujets qui


ont présenté l’ISO et ceux qui ne l’ont pas présenté en ce
qui concerne : • Comparer entre les  2 variables qualitatives :
sujets qui ont présenté
 L’âge l’ISO et ceux qui ne l’ont
 test du chi² ou test exact de Fisher
 La durée de séjour pas présenté en ce qui  1 variable qualitative et 1 variable quantitative:
 Le sexe concerne : Tests de comparaisons de moyenne
– L’âge distribution normale de la variable quantitative
 L’immuno-dépression 
– La durée de séjour  2 groupes : test t
 Le cathétérisme vasculaire – Le sexe  > 2 groupes : analyse de variance (ANOVA)
 Le diabète – L’immuno-dépression  > 2 groupes avec mesures répétées : analyse de
variance (ANOVA) à mesures répétées.
 la prescription d’antibiotique – Le cathétérisme
 petits effectifs ou distributions non normales
vasculaire
 Le type de chirurgie  2 groupes : test de Mann Whitney
– Le diabète
 Le taux de leucocytes – la prescription
 > 2 groupes test de Kruskall Wallis

 Question 1 : préciser le test statistique à utiliser dans d’antibiotique  2 variables quantitatives


chaque situation. – Le type de chirurgie  coefficient de corrélation (régression)

19/02/2020 629 19/02/2020 630

105
Pr [Link]---Methodo 19/02/2020

QUESTIONS – 2 Réponse

 Question 2 : Formulez explicitement les  Question 2. Formulez explicitement les


hypothèses du test statistique pour la hypothèses du test statistique
comparaison entre les sujets qui ont présenté La durée de séjour
l’ISO et ceux qui ne l’ont pas présenté en ce  Hypothèse nulle (H0) : µ1 = µ2
La durée moyenne de séjour (µ1) des sujets qui ont
qui concerne la durée de séjour et le diabète. 
présenté l’ISO ne diffère pas de la durée moyenne de
séjour (µ2) des sujets qui n’ont pas présenté l’ISO.
 Hypothèse alternative bilatérale (H1) : µ1 # µ2
 La durée moyenne de séjour (µ1) des sujets qui ont
présenté l’ISO diffère de la durée moyenne de séjour
(µ2) des sujets qui n’ont pas présenté l’ISO.

19/02/2020 631 19/02/2020 632

Réponse QUESTIONS – 3

 Question 2. Formulez explicitement les Variables Avec ISO Sans ISO p


hypothèses du test statistique • Les résultats des tests Age (ans)
n=124 n=770
47,32±13,37 45,01±13,67 0,08
Le diabète statistques sont Durée de séjour (jours) 16 (6-31) 10 (4-18,25) <0,001

représentés par le
 Hypothèse nulle (H0) : P1 = P2 tableau suivant.
Sexe
Femme 59 (47,6) 369 (47,9)
0,094

 La proportion du diabète (P1) chez les sujets qui ont Homme


Immuno-dépression
401 (52,1)
22(17,7)
65 (52,4)
132(17,1) 0,870
présenté l’ISO ne diffère pas de la proportion du Cathétérisme vasculaire 59(47,6) 129(16,8) <0,001
diabète (P2) chez les sujets qui n’ont pas présenté Question 3: Quelles sont Diabète 23 (18,5) 68 (9) 0,001
l’ISO.
les variables associées à Antibiotique avant l'infection 63 (50,8) 144 (19,1) <0,001

 Hypothèse alternative bilatérale (H1) : P1 # P2 i’ISO?. Type de chirurgie <0,001


Propre 46 (37,1) 568 (75,1)
 La proportion du diabète (P1) chez les sujets qui ont Propre contaminée 54 (43,5) 154 (20,4)
présenté l’ISO diffère de la proportion du diabète (P2) Contaminée
Sale
20 (16,1)
4 (3,2)
26 (3,4)
8 (1,1)
chez les sujets qui n’ont pas présenté l’ISO.

19/02/2020 633 19/02/2020 634

Réponse QUESTIONS – 4 & 5

Variables Avec ISO Sans ISO p Variables Avec ISO Sans ISO p
n=124 n=770 n=124 n=770
Age (ans) 47,32±13,37 45,01±13,67 0,08 Age (ans) 47,32±13,37 45,01±13,67 0,08
Durée de séjour (jours) 16 (6-31) 10 (4-18,25) <0,001  En analyse multivariée, Durée de séjour (jours) 16 (6-31) 10 (4-18,25) <0,001
on cherche à déterminer
Sexe 0,094 Sexe 0,094
Femme 59 (47,6) 369 (47,9) les facteurs associés à la Femme 59 (47,6) 369 (47,9)
• Les variables Homme 401 (52,1) 65 (52,4)
survenue d’ISO. Homme 401 (52,1) 65 (52,4)
associées à i’ISO sont Immuno-dépression 22(17,7) 132(17,1) 0,870 Immuno-dépression 22(17,7) 132(17,1) 0,870
Cathétérisme vasculaire 59(47,6) 129(16,8) <0,001  Question 4: préciser Cathétérisme vasculaire 59(47,6) 129(16,8) <0,001
les variables avec un
 L’événement dépendant
p-value < 0,05. Diabète 23 (18,5) 68 (9) 0,001 Diabète 23 (18,5) 68 (9) 0,001
Antibiotique avant l'infection 63 (50,8) 144 (19,1) <0,001  Et les événements Antibiotique avant l'infection 63 (50,8) 144 (19,1) <0,001

Type de chirurgie <0,001


indépendants Type de chirurgie <0,001
Propre 46 (37,1) 568 (75,1) Propre 46 (37,1) 568 (75,1)
Propre contaminée 54 (43,5) 154 (20,4)
 Question 5 : préciser le Propre contaminée 54 (43,5) 154 (20,4)
Contaminée 20 (16,1) 26 (3,4) type de l’analyse Contaminée 20 (16,1) 26 (3,4)
Sale 4 (3,2) 8 (1,1) Sale 4 (3,2) 8 (1,1)
multivariée.

19/02/2020 635 19/02/2020 636

106
Pr [Link]---Methodo 19/02/2020

Réponse QUESTION - 6

Variables Avec ISO Sans ISO p


n=124 n=770 Variables Analyse univariée Analyse multivariée
 L’événement dépendant: ISO Age (ans) 47,32±13,37 45,01±13,67 0,08 indépendantes OR IC 95% P OR IC 95% P
Durée de séjour (jours) 16 (6-31) 10 (4-18,25) <0,001 • Les résultats de Age 1,01 0,99– 1,26 0,080 1,02 1,00-1,03 0,015
 Les événements indépendants : Sexe 0,094 l’analyse multivariée
L’âge, la durée de séjour, le Sexe M 1,01 0,69 – 1,48 0,94
Femme 59 (47,6) 369 (47,9) sont représentés par
sexe, l’immuno- dépression, le Homme 401 (52,1) 65 (52,4) 1,03 1,02-1,05 <0,001
cathétérisme vasculaire, le Immuno-dépression 22(17,7) 132(17,1) 0,870
le tableau suivant. Durée de séjour 1,01 1,005-1,017 <0,001

diabète, la préscription Cathétérisme vasculaire 59(47,6) 129(16,8) <0,001 Immuno-dépression 1,04 0,63 – 1,71 0,87
d’antibiotique avant la survenue
de l'infection et le type de la Diabète 23 (18,5) 68 (9) 0,001 Cathétérisme 4,51 3,02 – 6,72 <0,001 5,51 3,51-8,64 <0,001
chirurgie. Antibiotique avant l'infection 63 (50,8) 144 (19,1) <0,001 Question 6: Quelles Diabète 2,31 1,38-3,88 0,001 0,78 0,42-1,44 0,436

Type de chirurgie <0,001


sont les variables Antibioprophylaxie 4,36 2,93-6,49 <0,001 4,14 2,60-6,59 <0,001
 Le type de l’analyse multivariée :
Régression logistique
Propre 46 (37,1) 568 (75,1) associées à l’ISO en
Propre contaminée 54 (43,5) 154 (20,4)
multiple. Contaminée 20 (16,1) 26 (3,4) analyse multivariée?.
Sale 4 (3,2) 8 (1,1)

19/02/2020 637 19/02/2020 638

Réponse QUESTIONS – 7 & 8

Variables Analyse univariée Analyse multivariée


indépendantes OR IC 95% P OR IC 95% P
 En analyse multivariée,
Age 1,01 0,99– 1,26 0,080 1,02 1,00-1,03 0,015
on cherche à déterminer
Les variables associées à
Sexe M 1,01 0,69 – 1,48 0,94 les facteurs associés à la
l’ISO en analyse multivariée Durée de séjour 1,01 1,005-1,017 <0,001 1,03 1,02-1,05 <0,001 durée de séjour.
sont les variables avec p- Immuno-dépression 1,04 0,63 – 1,71 0,87  Question 7: préciser
value<0,05.  L’événement dépendant
Cathétérisme 4,51 3,02 – 6,72 <0,001 5,51 3,51-8,64 <0,001

Diabète 2,31 1,38-3,88 0,001 0,78 0,42-1,44 0,436  Et les événements


Antibioprophylaxie 4,36 2,93-6,49 <0,001 4,14 2,60-6,59 <0,001 indépendants
 Question 8 : préciser le
type de l’analyse
multivariée.

19/02/2020 639 19/02/2020 640

Réponse QUESTION - 9

 L’événement dépendant
 La durée de séjour • Les résultats de
 Les événements l’analyse
indépendants : L’âge, le
sexe, l’immuno- dépression, multivariée sont
le cathétérisme vasculaire, représentés par le
l’ISO, le diabète, la
préscription d’antibiotique tableau suivant.
avant la survenue de
l'infection et le type de la
chirurgie. Question 9: Quelles
 Le type de l’analyse sont les variables
multivariée : Régression
linéaire multiple. associées à la durée
moyenne de séjour en
analyse multivariée?.

19/02/2020 641 19/02/2020 642

107
Pr [Link]---Methodo 19/02/2020

Réponse Conclusion

 Dans toutes études : recueil de données


Les variables pertinentes
associées à la
•la durée de séjour en jours,
durée moyenne •le sexe (0= femme, 1= homme),
de séjour en
analyse
• l’immuno-dépression (0= absence d’immuno-dépression, 1= présence
d’immuno-dépression),
 1ére étape : analyse univariée
multivariée sont •le cathétérisme vasculaire (0= absence de cathétérisme, 1= présence  Permet de déterminer les variables qui semblent liées à
de cathétérisme),
les variables avec l’événement
•l’infection du site opératoire (ISO) (0=absence d’ISO, 1= présence
p-value<0,05. d’ISO),  Étudie les relations entre les variables explicatives
•Antibiotique prescrit avant la survenue de l'infection (0= pas
d’antibiotique prescrit, 1= antibiotique prescrit)

 2ème étape : analyse multivariée


Durée de séjour = 0,07 * Sexe + 0,14*ID-0,128 CV+0,26
643  Permet de mettre en évidence les variables indépendamment
ISO+ 0,13 ATB + 11,28 (constante)
liées à l’événement étudié et leur poids (coefficient β, OR)
19/02/2020 19/02/2020 644

Conclusion Conclusion

 Le choix de la méthode de régression  Régressions :


 Variable dépendante  Régression linéaire
 Régression logistique
 Étapes :
 Le choix des variables indépendantes  Régression simple
 p value < 0,3 (en analyse univariée ou Puis
régression simple)  Régression multiple

19/02/2020 645 19/02/2020 646

108

Vous aimerez peut-être aussi