METHODOLOGIE
EPIDEMIOLOGIE
Dr Jacqueline DUFFOUR
I/EPIDEMIOLOGIE: Généralités
I-1 L’Epidémiologie
Définition: distribution temporelle et spatiale des états de santé des
populations
Historique:
Mesure de l’importance des épidémies (maladies infectieuses) XIX et début
XXème siècle
Elargissement du champ de compétences à partir des années 50 avec
apparition des maladies de civilisation (cancers, maladies C°V) 1ère étude
Doll et Hill: tabac et cancer
Classification
Selon la procédure: observationnelle ou expérimentale
Selon la finalité: descriptive, étiologique, évaluative
Selon la chronologie:
Transversale ou longitudinale
Rétrospective ou prospective
Selon la méthodologie
Cas/témoins, Cohortes exposés/non exposés
Essais thérapeutiques, randomisés ou non
A quoi sert l’épidémiologie ?
Analyse des besoins de santé de la population
Outil de diagnostic et d’évaluation en santé publique
Surveillance de la population. Veille & alerte sanitaire
Histoire naturelle de la maladie. Facteurs pronostiques
Recherche des causes des affections. Observation «
organisée »
Évaluation des interventions
I- 2 La DEMARCHE EPIDEMIOLOGIQUE
1-Enquête descriptive
Observation d’un phénomène
2 indicateurs: fréquence et mortalité
et d’un phénomène concomitant (étude écologique)
Formulation d’une hypothèse
2-Enquêtes étiologiques:
On cherche à vérifier l’hypothèse
2 étapes:
1- Cas/témoins
2- Exposés/non exposés
mise en évidence des facteurs de risque
3- Essais interventionnels:
Evaluation des mesures de prévention par le facteur
de risque (si celui-ci est protecteur)
1/Enquêtes Descriptives
Objectif principal: distribution des variables
Objectifs annexes:
populations ou sous groupes atteints
répartition dans le temps et espace des atteintes ...
Observation d’un phénomène
2 indicateurs: fréquence et mortalité
et d’un phénomène concomitant (étude
écologique)
Formulation d’une hypothèse
EXEMPLE: Importance du cancer de l’œsophage dans
une région, région où la consommation d’alcool est
forte
2/Enquêtes Analytiques ou étiologiques
Objectif principal:
Recherche de causes ou d’expositions à un facteur de risque par
comparaison de 2 groupes
II/ Groupe de malades/groupe de non malades = Cas/Témoins
Ex: des malades atteints de cancers de l’œsophage comparés à des
gens bien portants (concernant l’exposition à l’alcool)
Si cette étude montre une différence entre les cas et les témoins
concernant le risque: on poursuit la recherche
III/Groupe de personnes exposées au facteur de risque
supposé/ groupe de personnes non exposées
Ex: des personnes présentant un alcoolisme +++(exposés) comparés
à un groupe non exposé (concernant le nombre de cancers de
l’oesophage)
Objectifs annexes:
vérification des hypothèses des études descriptives
études des liens de causalité
3/ Essais interventionnels
Objectif principal:
Recherche et vérification par comparaison de 2
groupes de l’efficacité d’un facteur de protection
Deux groupes:
1 groupe exposé au facteur de protection
1 autre non
Ne peut être mise en œuvre que pour les
facteurs supposés protecteurs
Même principe pour les essais cliniques
I-3 La part des biostatistiques
I-3-1Notion d’échantillonnage
Les enquêtes épidémiologiques sont le plus souvent réalisées
sur un échantillon de la population cible
La représentativité de l’échantillon/population
cible+++
Échantillonnage par tirage au sort: la meilleure
A partir d’une liste exhaustive de la population cible
Problème: comme aucune liste n’est complète (PDV) risque
de biais de sélection
Les indicateurs (incidence, prévalence, Risque relatifs)
calculés sur ces échantillons sont des estimations
Toujours représentés avec leur intervalle de confiance à 95%
[IC-95%]
Ex: prévalence de l’insuffisance rénale chronique aux USA:
13.1% [IC 95%: 12.0%-14.1%]
La part des biostatistiques
I-3-2 L’usage des biostatistiques garantit la
rigueur méthodologique de ces études
Avant l’étude: protocole indispensable= véritable cahier
des charges des divers éléments de l’étude: matériel et
méthodes
nombre de sujets nécessaires, les fondements et modalités de
l’étude (mise en place, suivi, analyse)
les aspects temporels de l’étude
les documents de recueil des données
Techniques statistiques permettant de réduire la variabilité des
2 groupes à comparer
Appariements
Stratification…
Après l’étude: tests spécifiques permettant de conclure
(avec un certain degré d’erreur consenti) que les 2 groupes
diffèrent ou non significativement
II/ Les outils épidémiologiques
II-1/MESURE des INDICATEURS de SANTE
Mortalité
Morbidité (FREQUENCE d'une ATTEINTE)
dans le cadre de tous les types d’enquêtes
II-2 La Standardisation
II-3/Mesure de l’ASSOCIATION Atteinte /
Exposition = mesure du RISQUE
II-1 INDICATEURS de SANTE
(Pour tous les types d’étude)
II-1-1/ Indicateurs de mortalité
Taux brut de mortalité:
= Nombre de décès au cours de l’année dans une
population/population moyenne de cette année x 1000
= 9 pour 1000 environ
Ne tient pas compte de l’âge
Taux spécifiques de mortalité
Par âge
= Nombre de décès dans une tranche d’âge pdt 1 an/population
moyenne de tranche d’âge cette année là x 1000
Par sexe
Par cause
= Nombre de décès due à une cause pendant 1 an/population
moyenne cette année là x 1000
Taux de létalité par cause
= Nombre de décès due à une cause/nombre de patients atteints
de cette cause x 1000
II-1-2/ Indicateurs de morbidité
= Fréquence d'une Atteinte
information essentielle
va de pair avec:
la taille de la population ou de l'échantillon
la durée du temps du recueil
deux grandes catégories de fréquence
Incidence
Prévalence
1/ Prévalence
Nombre de cas de malades pendant une période
donnée
Le taux de prévalence = nombre de cas de malades
/population moyenne pendant cette période
Intérêt: permet d'estimer le risque (probabilité)
d'un individu d'être porteur de l'atteinte à un
moment donné
2/Incidence
Nombre de nouveaux cas de malades pendant une
période donnée
S’exprime par le nombre de nouveaux cas de malades
/population moyenne pendant cette période
3/Rapport entre les deux
P (prévalence) = I (incidence) x D (durée)
si l'incidence d'une maladie de longue durée est faible, la
prévalence pourra être forte mais ce ne sera pas péjoratif
( possibilités thérapeutiques)
si l'incidence d'une maladie de courte durée est forte,
c’est un élément péjoratif (progression de la maladie)
Ces 2 indicateurs sont complémentaires
Fréquence d'une Atteinte
Fréquence d'une Atteinte
INCIDENCE
2 notions:
Incidence Cumulative (IC): proportion
d'individus atteints en une période donnée
(définition précédente)
Taux d'Incidence (TI): nombre de
nouveaux cas atteints au cours d'une
période donnée divisé par la durée totale
d'observation individus-temps
INCIDENCE
Formule de l'Incidence Cumulée
nbre de nouveaux cas atteints
IC = pdt une période donnée
population totale
Formule du Taux d'Incidence
nbre de nouveaux cas atteints pendant une période donnée
TI = somme durées d'observation des individus avant atteinte
INCIDENCE
intérêt Taux d'Incidence
mesure à un instant donné la vitesse
d'apparition de l'atteinte
exemple: 5 individus
A suivi 1 an pas atteint, perdu de vue
au bout de 1 an
B suivi 3 ans atteint au bout des 3 ans
C suivi 5 ans pas atteint
D suivi 4 ans pas atteint
E suivi 2,5 ans atteint au bout des 2,5 ans
TI = 2 cas/15,5 individus-année = 12,9/100
individus-année
II-2 STANDARDISATION
Les indicateurs de mortalité ou
morbidité s’expriment par taux
La comparaison de ces taux bruts peut
conduire à des erreurs d’interprétation
Nécessité de standardiser ces taux
par âge, sexe, catégorie socio-
professionnelle…/ à une population
type
STANDARDISATION
Groupes Px Tx P’x T’x
d’âge répartition population Taux de Mortalité Répartition population Taux de Mortalité
Limousin (%) Limousin (0/00) France(%) France(0/00)
0-24 ans 31,5 1,2 36,4 1,15
25-54 ans 38,5 2,5 40,6 2,6
>55ans 30 34,5 23 34
Taux Brut de la Mortalité dans le Limousin:
T= Px X Tx = (31,5X1,2)+(38,5X2,5)+(30X34,5) = 11,54‰
100
Taux Brut de Mortalité en France:
T’= P’x X T’x = (36,4X1,15)+(40,6X2,6)+(23X34) = 9,29‰
100
Conclusion apparente: la mortalité est plus importante dans le Limousin
Utilisons la structure d’âge de la France et appliquons-la au Limousin:
T’’= P’xXTx = (36,4X1,2)+(40,6X2,5)+(23X34,5) = 9,27‰
100
II-3/ ASSOCIATION ATTEINTE/EXPOSTION
Mesure du risque (seulement dans les études
étiologiques)
II-3-1/Notion de risque et facteur de risque
II-3-2/les indicateurs de risque: RR et OR
II-3-3/ les facteurs de confusion
II-3-4/Recherche de la causalité
II-3-1 Notion de RISQUE et Facteur de
Risque
Le risque est la probabilité de survenue d’un
évènement (décès, maladie…)
Cette probabilité n’est pas la même pour tous les
individus d’une population
Elle varie en fonction d’un certain nombre de facteurs
(endogènes, environnementaux, comportementaux…)
Ces facteurs sont appelés: facteurs de risque
Un facteur F est un facteur de risque pour une
maladie M si l’exposition au facteur F modifie la
probabilité d’apparition (l’incidence) de la maladie M
II-3-2 Les Indicateurs de Risque
Pour vérifier l’hypothèse d’une relation
entre l’exposition à un facteur de
risque et la survenue de la maladie
II-3-2-1 -Le Risque Relatif
II-3-2-2-l’ODDS RATIO
II-3-2-3-L’excès de Risque
II-3-2-4-La fraction de Risque
attribuable
II-3-2-1-Le risque relatif
C’est le rapport des incidences
de la
maladie chez les exposés/ non exposés
IE / InE
Le risque = 1 le facteur est sans
influence
Le risque est >1 le facteur l’incidence
de la maladie
Le risque est <1 le facteur l’incidence
de la maladie
atteinte
oui non
oui a b a+b = nb exposés
exposition
non c d c+d = nb non exposés
a+c b+d a+b+c+d
= = =
nb atteints nb non atteints nb total individus
I exposés
RR =
I non exposés
IC exposés a / (a + b)
RR = =
IC non exposés c / (c + d)
RR ne s’utilise que dans les études de
cohorte exposées/ non exposées
EXEMPLE
Etude d’une cohorte de travailleurs exposés à un
contaminant / une population non exposée
lymphomes
oui non
60 1940 2000= nb exposés
oui
Exposition
à un contaminant
20 1980
non 2000= nb non exposés
80 3920
4000
= =
=
nb atteints nb non atteints
nb total individus
EXEMPLE
Etude d’une cohorte de travailleurs exposés à un
contaminant / une population non exposée
lymphomes
oui non
60 1940 2000= nb exposés
oui
Exposition
à un contaminant
20 1980
non 2000= nb non exposés
80 3920
4000
= =
=
nb atteints nb non atteints
nb total individus
IC exposés a / (a + b)
RR = =
IC non exposés c / (c + d)
I exposés: 60/2000 = 3/100
I non exposés: 20 / 2000 = 1/100
RR = 3/100: 1/100 = 3
Le RR doit être présenté avec un intervalle de confiance (IC) à
95%
Si l’IC95% ne contient pas le 1, l’association facteur –maladie est
significative
Si l’IC95% contient le 1, l’association facteur –maladie n’est pas
significative
Enquêtes de cohorte exposés / non exposés
Atteinte?
oui non
oui a b a+b = nb exposés
exposition
non c d c+d = nb non exposés
a+c b+d a+b+c+d
= = =
nb atteints nb non atteints nb total individus
Enquêtes Cas / Témoins
atteinte
oui non
oui a b a+b = nb exposés
Exposition?
non c d c+d = nb non exposés
a+c b+d a+b+c+d
= = =
nb atteints nb non atteints nb total individus
II-3-2-2-l’ODDS RATIO (OR)
OR = Odds de la maladie chez les exposés/odds
de la maladie chez les non exposés
L’odds de la maladie chez les exposés=
est la probabilité d’être malade/probabilité de ne
pas être malade chez les exposés
= a/a+b/b/a+b
L’odds chez les non exposés
= c/c+d/d/c+d
On démontre que:
OR = a/c/b/d = ad/bc
Quand la maladie est rare RR = OR
Interprétation de l’OR
OR = 1 le facteur est sans influence
OR >1 le facteur l’incidence de la
maladie
OR <1 le facteur l’incidence de la
maladie
L’OR doit être présenté avec un intervalle de confiance
(IC) à 95%
Si l’IC95% ne contient pas le 1, l’association facteur –
maladie est significative
Si l’IC95% contient le 1, l’association facteur –maladie n’est
pas significative
OR ne s’utilise que dans les études Cas/Témoins
Intervalle de confiance
II-3-2-2-3- L’excès de risque
Excès de risque ou R Attribuable = IE – InE
Exprime l’augmentation de l’incidence de la maladie attribuable à la
présence du facteur d’exposition
Fournit une estimation du nombre de cas qui pourraient être évités
si l’exposition était supprimée chez les exposés
II-3-2-2-4- Fraction de risque attribuable
FRA= PF (RR-1)/PFRR + (1- PF)
où PF est la fréquence d’exposition au facteur de risque dans
la population
Exemple
RR du tabac pour cancer du poumon: 14
Fréquence du tabagisme dans la population: 0.30
FRA= 0.30 x (14-1)/0.30 x 14 + (1-0.30) = 80%
CCl: la proportion de risque de décès par cancer du poumon
attribuable au tabac est de 80%
Si la fréquence du tabagisme avait été de 10%
FRA= 0.10 x (14-1)/0.10 x 14 + (1-0.10) = 56.5%
II-3-3/ les facteurs de confusion
liaison causale ?
Exposition Atteinte
Facteur
de
Confusion
Facteurs de Confusion
DEFINITION
confusion:
Si E est un facteur d’exposition
potentiel à une maladie M, un tiers
facteur est un facteur de confusion si
Il explique totalement ou partiellement
un effet apparent de E sur M
Il masque totalement ou partiellement
une association réelle entre E et M
Facteurs de Confusion
Exemple
évaluation des édulcorants (E) sur le cancer de
la vessie (CV)
E Augmentation CV
CV plus fréquent chez les fumeurs que chez les
non fumeurs
Les édulcorants sont-ils responsables à eux
seuls du CV?
Ou bien l’augmentation des CV constatée chez
les consommateurs d’édulcorants se fait-elle
par l’intermédiaire du tabac?
(les buveurs de thé et café fument)
MORTALITE par cancer de la vessie (‰ par an)
Consommation Consommation de tabac ( paquets/j)
d’édulcorants/j 0 1à2 >2 ensemble
0 4 9 15 6
1 à 10 6 10 13 8
> 10 5 9 16 12
ensemble 4 10 15
MORTALITE par cancer de la vessie (‰ par an)
Consommation Consommation de tabac ( paquets/j)
d’édulcorants/j 0 1à2 >2 ensemble
0 4 9 15 6
1 à 10 6 10 13 8
> 10 5 9 16 12
ensemble 4 10 15
Facteurs de Confusion
Conséquences
utiliser des méthodes pour limiter la
confusion
lors de la phase préparatoire
Randomisation (dans les essais d’intervention ou
thérapeutiques uniquement)
Restriction de la population à certaines
catégories
Appariement sur les facteurs de confusion déjà
connus (âge exemple:
Exemple: Étude édulcorants – cancer de la
vessie
facteurs de confusion: âge, sexe, tabagisme
une femme de 65 ans, grosse fumeuse atteinte
sera appariée à une femme de même âge et
habitudes non atteinte
Facteurs de Confusion
Analyse stratifiée
type : méthode de contrôle de la confusion lors de
la phase d'analyse
= évaluation de l'association dans les catégories
ou classes où la variable de confusion est répartie
de manière homogène
la valeur globale de l'association peut être calculée
par "moyenne pondérée" des associations
partielles (méthodes de Mantel-Haenszel)
exemple: si le sexe est un éventuel facteur de
confusion, l'association sera calculée séparément
pour les hommes et les femmes
Facteurs de Confusion
Analyse multivariée
1-Estréalisée après l’analyse univariée de
l’association Facteurs ou variable-Maladie
(chaque variable étant prise individuellement)
2-Sicette analyse met en évidence des
variables ou le risque significativement
3-on entre ces variables dans « le modèle de
Cox » (analyse des variables simultanément)
qui permet de confirmer la significativité (et
donc la mise en cause) des facteurs apparus
lors de la 1ère analyse
Facteurs de Confusion
Analyse univariée
Facteurs de Confusion
Analyse multivariée
II-3-4/Recherche de la causalité
Nécessité de certaines conditions
Existence d’un lien statistique entre le facteur et la
maladie
Cohérence chronologique
Constance et reproductibilité de l’association dans
d’autres études et populations
Force de l’association statistique (RR élevé)
Relation dose-effet
Une intervention visant à supprimer le facteur de risque
doit faire l’incidence de la maladie
Cohérence avec les connaissances expérimentales