Méthodologie des enquêtes quantitatives
Méthodologie des enquêtes quantitatives
EVALUATION A LA 2EME SESSION (si échec 1ère session : le même examen pour toutes et tous) :
• 1 examen de rattrapage sous forme d’un examen final (lorsque la moyenne à l’UE4 et la note en statistique du 1er
semestre sont inférieures à 10)
REFERENCES BIBLIOGRAPHIQUES :
BERTHIER N. (2000), Les techniques d’enquête. Méthode et exercices corrigés, Collection « Cursus sociologie », Paris : Armand Colin,
122p.
BLOSS T. et GROSSETTI M. (1999), Introduction aux méthodes statistiques en Sociologie, Collection « Le sociologue », Paris : PUF,
224p.
BOURSIN J. L. (1991), Comprendre la statistique descriptive, « Cursus sociologie », Paris : Armand Colin, 168p.
DROESBEKE J. J. (1997), Eléments de statistiques, Collection « Statistique et mathématiques appliquées », Bruxelles : Éd. de l'université
de Bruxelles / Paris : Ellipses, 510p. (3ème édition).
FOX W. (1999), Statistiques sociales, Laval : Presses de l’Université de Laval, 374p.
GOLDFARB B. et PARDOUX C. (1998), Introduction à la méthode statistique. Gestion. Economie, Collection « Ecu sup », Paris : Dunod,
368p. (4ème édition).
GRENON G. et VIAU S. (1999), Méthodes quantitatives en sciences humaines. Volume 1 : De l’échantillon vers la population,
Montréal : éd. Gaëtan Morin, 349p.
KLATZMANN J. (1992), Attention, statistiques ! : comment en déjouer les pièges, Collection « Cahiers Libres. Essais », Paris : La
Découverte, 248p. (2ème édition).
PY B. (1990), Statistiques descriptives, Paris : Economica, 341p.
ROSENTAL C. et MURPHY C. (2001), Introduction aux méthodes quantitatives en sciences sociales, Collection « Psycho sup », Paris :
Dunod, 176p.
TRUDEL R. et ANTONIUS R. (1991), Méthodes quantitatives appliquées aux sciences humaines, Montréal, éd. De la Chenelière inc.,
545p.
1
I. Pourquoi quantifier ?
Problématique
Observation/Démarche
Vérification
Généralisation
2
II. Les méthodes quantitatives et la statistique
Problématique
3
III. Choix des méthodes et des variables
Population = Ω
Taille = N = 850 étudiants
Echantillon = Ε
Taille = n = 50 étudiants interrogés
Exemples
1. Collecte de données (Enquêtes) sans échantillon
1.1 Les recensements de la population
1.2 Données statistiques annuellement compilées
« En 1999, 3572 hommes et 1243 femmes, âgés de 15-24 ans, sont décédés en France. Les accidents de la
circulation sont les principales causes de mortalité avec respectivement 44 % et 38 % des décès […] »
(Inserm, 1998-1999).
2. Enquêtes par échantillon
2.1 Enquête Budget des familles (INSEE, tous les 5 ans depuis 1978).
L'enquête a pour objectif l'étude des dépenses et des ressources des ménages. Elle permet de comparer les
niveaux de vie et les choix de consommation des diverses catégories de ménage.
2.2 Enquête Fécondité et Famille (1994), Etude des relations familiales et intergénérationnelles (2005/08), etc.
4
2. La classification des variables
1. Les variables
2. Les modalités
Exemples
Enquête sur les comportements et les représentations de la sexualité des étudiants des universités
strasbourgeoises en 2004/2005
Question 3.
Dans quelle université êtes-vous actuellement inscrit-e ?
1. Université Marc Bloch
2. Université Robert Schuman
3. Université Louis Pasteur
Question 21.
Qu’est-ce qui vous a, avant tout, poussé à ce 1er rapport sexuel ?
Veuillez cocher 1 case maximum !
1. L’amour, la tendresse
2. L’attirance, le désir physique
3. La curiosité
4. Le désir de faire comme vos copains/copines
5. Une consommation d’alcool ou de substances illicites
6. Vous avez été forcé/e
7. Autres : PRECISEZ….…………………………………………
5
IV. La collecte des données : les méthodes d’échantillonnage
Echantillon :
n = 2500 électeurs
Exemple
6
24737
Calcul du pas : = 10
2500
Chaque électeur se voit attribuer un numéro.
On détermine de façon aléatoire la 1ère unité de l’échantillon.
Pour obtenir le numéro des unités précédentes, la valeur du pas est soustraite au numéro de la 1ère unité de
l’échantillon.
Pour obtenir le numéro des unités suivantes, la valeur du pas est additionnée au numéro de la 1ère unité de
l’échantillon.
Si le numéro choisi de manière aléatoire simple est par exemple le 426, les personnes interrogées auront les n°
6,16, 26, 36, …, 406, 416, 426, 436, 446, …, 24706, 24716, 24726, 24736.
L’échantillon ainsi constitué sera de taille n= 2474.
Echantillon :
n = 10 quartiers
7
2.2.1 L’Echantillon accidentel ou à l’aveuglette
Exemple : Le candidat à la mairie fait le tour des différents centres commerciaux de la municipalité et
interroge 2500 électeurs.
Exemple complémentaire : Dans l’enquête effectuée par la faculté des sciences sociales en 1993 sur la
perception du sida par les jeunes, 406 jeunes de 18 à 24 ans ont été interrogés : 202 garçons et 204 filles.
Pourquoi avoir privilégié une enquête par quotas ?
8
V. L’organisation et le traitement des données : Tableaux et graphiques
Exemple
Lors d’une enquête sur le type d’émissions de TV préféré, 165 des 1034 personnes de 18 ans et plus
interrogées ont déclaré préférer les films. – Calcul du pourcentage
Exemple
Si, lors du sondage sur le type d’émissions de TV préféré, on a observé que 14,80 % des personnes interrogées
préfèrent les émissions culturelles, quel est le nombre d’unités statistiques/d’individus dans l’échantillon ayant
répondu préféré les émissions culturelles ?
9
2. Les Graphiques
2.1. Les variables qualitatives
Tableau 3 : Répartition des femmes âgées de 20-29 ans, 30-39 ans, 40-49 ans, selon la méthode
contraceptive utilisée (%), France, 2005
Situation Age à l'enquête (2005)
contraceptive 20-29 ans 30-39 ans 40-49 ans
Méthodes réversibles 78,5 75,7 56,9
dont: préservatif 5,2 6,4 4,9
pilule 66,3 42,8 25,8
stérilet 3,1 21,6 21,8
autres contraceptifs "modernes" 1,9 2,6 2,0
autres pratiques contraceptives 2,0 2,3 2,4
Méthodes irréversibles 0,1 0,4 1,8
dont: stérilisation féminine 0,1 0,4 1,7
stérilisation masculine 0,0 0,0 0,1
Infertilité 0,7 3,0 17,3
Sans contraception 20,7 20,9 24,0
Ensemble 100,0 100,0 100,0
Effectif non pondéré 844 1050 1047
Source : ERFI (2005)
Tableau 4 : Répartition des femmes âgées de 20-29 ans, selon la méthode contraceptive utilisée,
France, 2005
Situation Pour Angle
contraceptive 100 femmes (degré)
préservatif 5,2 19
pilule 66,3 239
stérilet 3,1 11
autres contraceptifs "modernes" 1,9 7
autres pratiques contraceptives 2,0 7
stérilisation féminine 0,1 0
stérilisation masculine 0,0 0
Infertilité 0,7 3
Sans contraception 20,7 75
Ensemble 100,0 360
10
Graphique 1 : Répartition des femmes âgées de 20-29 ans, selon la méthode contraceptive utilisée,
France, 2005
préservatif
5%
Sans contraception
Infertilité
21%
1%
autres pratiques
contraceptives
2%
Tableau 5 : Répartition des femmes âgées de 30-39 ans, selon la méthode contraceptive utilisée,
France, 2005
Situation Pour
contraceptive 100 femmes
préservatif 6,4
pilule 42,8
stérilet 21,6
autres contraceptifs "modernes" 2,6
autres pratiques contraceptives 2,3
stérilisation féminine 0,4
stérilisation masculine 0,0
Infertilité 3,0
Sans contraception 20,9
Ensemble 100,0
11
Graphique 2 : Répartition des femmes âgées de 30-39 ans, selon la méthode contraceptive utilisée,
France, 2005
45,0
40,0
35,0
30,0
Pour 100 femmes
25,0
20,0
15,0
10,0
5,0
0,0
préservatif pilule stérilet autres autres pratiques stérilisation Infertilité Sans
contraceptifs contraceptives féminine contraception
"modernes"
Méthodes contraceptives
Tableau 6 : Répartition des femmes âgées de 20-29 ans, 30-39 ans, 40-49 ans, selon leur nombre
d’enfant biologique (%), France, 2005
Nombre Age à l'enquête (2005)
d'enfant biologique 20-29 ans 30-39 ans 40-49 ans
0 74,7 20,1 11,8
1 16,6 24,0 18,2
2 6,5 35,6 37,2
3 2,1 15,3 23,3
4 0,1 4,0 6,8
5 0,0 0,8 1,5
6 0,0 0,1 0,7
7 0,0 0,1 0,2
8 0,0 0,0 0,0
9 0,0 0,0 0,3
Ensemble 100,0 100,0 100,0
Source : ERFI (2005)
12
Graphique 3 : Répartition des femmes âgées de 20-29 ans, selon leur nombre d’enfant biologique,
France, 2005
80,0
70,0
60,0
50,0
Pour 100 femmes
40,0
30,0
20,0
10,0
0,0
0 enfant 1 enfant 2 enfants 3 enfants 4 enfants
Nombre d'enfant biologique
Tableau 7 : Répartition des femmes âgées de 40-49 ans, ayant au moins un enfant biologique à l’enquête selon
leur âge à la 1ère naissance, France, 2005
13
Graphique 4 : Répartition des femmes âgées de 40-49 ans, ayant au moins un enfant biologique à l’enquête
selon leur âge à la 1ère naissance, France, 2005
300
250
200
Nombre de femmes
150
100
50
0
15 ans 20 ans 25 ans 30 ans 35 ans 40 ans 45 ans
14
HISTOGRAMME sans précise en compte des différences d’amplitude : INCORRECT => FAUX
200
180
160
140
Nombre de femmes
120
100
80
60
40
20
0
15 ans 18 ans 20 ans 23 ans 25 ans 29 ans 33 ans 40 ans 45 ans
60
50
Nombre de femmes
40
30
20
10
0
15 ans 18 ans 20 ans 23 ans 25 ans 29 ans 33 ans 40 ans 45 ans
15
Série statistique à deux dimensions
Tableau 8a : Répartition des hommes et des femmes sans enfant selon leur âge et intention de fécondité dans
les 3 ans, France, 2005 (effectifs non pondérés)
Age atteint Intention de fécondité dans les 3 années à venir
Sexe TOTAL
en 2005 OUI NON NSP
Homme 21-25 ans 23 94 136 253
26-30 ans 68 33 108 209
31-35 ans 41 27 69 137
36-40 ans 16 32 40 88
41-45 ans 16 63 16 95
Ensemble 21-45 ans 164 249 369 782
Femme 21-25 ans 69 128 177 374
26-30 ans 74 24 112 210
31-35 ans 46 17 49 112
36-40 ans 32 29 25 86
41-45 ans 10 55 6 71
Ensemble 21-45 ans 231 253 369 853
Tableau 8b : Répartition des hommes et des femmes sans enfant selon leur âge et intention de fécondité dans
les 3 ans, France, 2005 (pourcentages lignes)
Age atteint Intention de fécondité dans les 3 années à venir
Sexe TOTAL
en 2005 OUI NON NSP
Homme 21-25 ans 9,1 37,2 53,8 100,0
26-30 ans 32,5 15,8 51,7 100,0
31-35 ans 29,9 19,7 50,4 100,0
36-40 ans 18,2 36,4 45,5 100,0
41-45 ans 16,8 66,3 16,8 100,0
Femme 21-25 ans 18,4 34,2 47,3 100,0
26-30 ans 35,2 11,4 53,3 100,0
31-35 ans 41,1 15,2 43,8 100,0
36-40 ans 37,2 33,7 29,1 100,0
41-45 ans 14,1 77,5 8,5 100,0
Tableau 8c : Répartition des hommes et des femmes sans enfant selon leur âge et intention de fécondité dans
les 3 ans, France, 2005 (pourcentages colonnes)
Age atteint Intention de fécondité dans les 3 années à venir
Sexe
en 2005 OUI NON NSP
Homme 21-25 ans 14,0 37,8 36,9
26-30 ans 41,5 13,3 29,3
31-35 ans 25,0 10,8 18,7
36-40 ans 9,8 12,9 10,8
41-45 ans 9,8 25,3 4,3
Ensemble 21-45 ans 100,0 100,0 100,0
Femme 21-25 ans 29,9 50,6 48,0
26-30 ans 32,0 9,5 30,4
31-35 ans 19,9 6,7 13,3
36-40 ans 13,9 11,5 6,8
41-45 ans 4,3 21,7 1,6
Ensemble 21-45 ans 100,0 100,0 100,0
16
VI. Analyse des données et interprétation des résultats
Tableau 9 : Répartition des femmes et des hommes âgés de 40-49 ans à l’enquête, selon le nombre
d’enfant biologique, France, 2005
Nombre Nombre Nombre
d'enfant biologique (Xj) de femmes (nfj) d'hommes (nhj) xj * nfj xj * nhj
0 161 199 0 0
1 194 135 194 135
2 399 289 798 578
3 226 144 678 432
4 56 49 224 196
5 15 9 75 45
6 7 7 42 42
7 1 2 7 14
8 0 0 0 0
9 2 0 18 0
Ensemble 1061 834 2036 1442
Source : ERFI, 2005
k k
1
X=
n
* ∑nj =1
j *xj avec n= ∑n
j =1
j
Nombre moyen d’enfant par femme = 2036 / 1061 = 1,9189444 enfant = 1,92 enfant
Nombre moyen d’enfant par homme = 1442 / 834 = 1,7290168 enfant = 1,73 enfant
17
1.1.2. Moyenne d’une distribution groupée en classe
Tableau 10 : Répartition des femmes et des hommes âgés de 40-49 ans à l’enquête, ayant eu au
moins un enfant biologique, selon l’âge à la première naissance, France, 2005
Age moyen à la 1ère maternité = 23255 / 900 = 25,838889 ans = 25,8 ans
Age moyen à la 1ère paternité = 18068 / 632 = 28,588608 ans = 28,6 ans
18
1.2 La médiane
Définition : la médiane d’une série statistique est la valeur qui partage la série ordonnée (c’est à dire classée
de la plus forte valeur observée à la plus faible) en deux séries d’effectif égal.
La classe médiane est celle qui contient l’individu médian. La population est de taille 706, nombre pair. La
médiane est la moyenne prise par le 353ème individu (706/2) et celle du 354ème ((706/2) + 1))
Par lecture dans le tableau ci-dessus les 353ème et 354ème individus appartiennent à la 4ème classe ; la classe
médiane est donc [23 ;24]; M1/2 est comprise entre 23 ans et 25 ans.
* Pour déterminer la médiane par interpolation linéaire, on procède à une règle de trois en supposant que les
individus sont équirépartis dans la classe médiane. Ainsi :
- L’amplitude de la classe médiane : 2 ans
- Le nombre d’individus dans la classe médiane : 134 individus
- L’individu médian dans la classe médiane : 353-233 = 120ème individu (individu médian
moins individu se situant à la borne (limite) inférieure de la classe médiane).
- Par une règle de trois on obtient la médiane :
- à un écart de 2 ans correspondent 134 individus
- à quel intervalle correspondent 120 individus ?
Calcul : M ½ = 23 + (120*2)/134 = 23 + 1,79 ans = 24,79 ans
19
1.3. Le mode
Définition : Le mode, noté «Mo», d’une série statistique est la valeur de la variable qui apparaît le plus
souvent dans la série.
Deuxième cas : Mode < Médiane < Moyenne, la distribution est dite « étalée à droite » ou
« oblique à gauche ».
Troisième cas : Moyenne < Médiane < Mode, la distribution est dite « étalée à gauche » ou
« oblique à droite».
L’écart-type étant défini à partir de la variance ; il convient de définir tout d’abord la variance.
On appelle variance (notée V(X)) d’une variable statistique xj (j variant de 1 à k) à laquelle correspondent des
effectifs nj (n1, n2, …, nk), la moyenne arithmétique des carrés des écarts à la moyenne arithmétique.
ou :
∑ f (x )
k
2
V(X) = j j −x
j =1
20
ET :
σx= V(X) =
1 k
∑nj xj − x
n j =1
( )
2
ou :
∑ f (x )
k
2
σx= V(X) = j j −x
j =1
ou :
k
2
xj − x
2
V(X) = ∑f
j =1
j
ET :
1 k 2
njxj − x
2
σx= V(X) = ∑
n j =1
ou :
k
2
xj − x
2
σx= V(X) = ∑f
j =1
j
21
Calculs sur chiffres non arrondis
Méthode 1 :
σx= V(X) =
1 k
(
∑nj xj − x
n j =1
) 2
1
σx = *18991,1 =5,2 ans
706
Méthode 2 :
1 k 2
njxj − x
2
σx= V(X) = ∑
n j =1
1
σx = * 483567,7 − 25,65232 =5,2 ans
706
22
2.3 Le coefficient de variation
Le coefficient de variation est égal à l’écart-type rapporté à la moyenne. C’est une mesure relative de la
dispersion elle permet de comparer la dispersion au sein de deux sous populations exprimées dans des unités
différentes (par exemple : salaire en francs ou en euros) ou ayant des moyennes très différentes (par exemple
salaire moyen en France et salaire moyen en Inde).
Pour supprimer ces désavantages, il faut déterminer un nombre sans dimension appelé coefficient de
variation, qui est égal à :
σx
Cν =
x
23