1
Statistique Mathématique
(30 h)
Prof. RWENGE MBURANO
YAOUNDE, JANVIER 2020
2
PLAN DU COURS
Introduction
Chapitre 1 : Distribution d’échantillonnage
1.1 Théorie d’échantillonnage
1.2 Echantillons aléatoires
1.3 Echantillonnages exhaustifs et non exhaustifs
1.4 Quelques exemples de distribution d’échantillonnage
1.4.1 Distribution d’échantillonnage de la moyenne
1.4.2 Distribution d’échantillonnage des fréquences
1.4.3 Distribution d’échantillonnage des différences et sommes
1.4.4 Distribution d’échantillonnage des variances
1.4.5 Distribution d’échantillonnage du rapport de 2 variances
1.5 Erreurs quadratiques moyennes
Exercices
Chapitre 2 : Estimation
2.1 Estimation ponctuelle
2.1.1 Définition
2.1.2 Méthode des moments et du maximum de vraisemblance
[Link] Méthode des moments
[Link] Méthode du maximum de vraisemblance
2.2 Qualités d’un bon estimateur
2.2.1 Estimateurs sans biais
2.2.2 Estimateur de faible dispersion
2.2.3 La consistance
2.2.4 Estimateur asymptotiquement sans biais
2.3 Estimateur des principales caractéristiques d’une population
2.3.1 Estimateur de la moyenne d’une population
2.3.2 Estimateur de la variance d’une population
2.3.3 Estimateur d’une proportion
2.3.4 Estimateur d’une somme et d’un effectif
2.4 Estimation par intervalle de confiance (IC)
2.4.1 Définition et construction pratique
2.4.2 Intervalles classiques
[Link] IC d’une proportion
[Link] IC de l’espérance m d’une loi normale
[Link] IC de la différence des espérances m1 et m2
[Link] IC de la différence des proportions p1 et p2
[Link] IC de la variance d’une loi normale
2.5 Calcul de la taille de l’échantillon
3
Exercices
Chapitre 3: Tests d’hypothèses
3.1 Notions relatives aux tests
3.1.1 Hypothèses
3.1.2 Risque d’erreur
3.1.3 Région critique
3.1.4 Les différentes étapes de l’élaboration d’un test
3.2 Tests usuels
3.2.1 Tests portant sur une moyenne avec variance connue
3.2.2 Tests portant sur une moyenne avec variance inconnue
3.2.3 Tests sur une proportion pour des grands échantillons
3.2.4 Tests sur deux moyennes
[Link] Cas des échantillons indépendants
[Link] Cas des échantillons appariés
3.2.5 Tests sur deux proportions pour grands échantillons
Exercices
4
Introduction
La statistique permet d’étudier des phénomènes sociaux à partir des données, entre autres,
celles de recensement et d’enquêtes par sondage. On cherche à extraire du jeu de données
statistiques des connaissances ou des éléments significatifs, à détecter une structure dans
l’aléatoire, ou encore à confronter une théorie à la réalité.
Le recensement consiste en l’observation de la totalité des individus composant la population.
Comme la taille de celle-ci est généralement élevée, de telles opérations sont extrêmement
coûteuses. C’est pourquoi les chercheurs utilisent souvent les enquêtes par sondage. Il s’agit ici
d’observer des faits sur un échantillon. Si ce dernier est représentatif de la population étudiée,
alors, il est possible de raisonner au niveau de la population à partir des résultats de
l’échantillon, avec un niveau de confiance quantifiable. En d’autres termes, on peut dans ce cas
tirer des conclusions au niveau de la population à partir des données de l’échantillon.
On regroupe sous le nom d’inférence statistique les méthodes statistiques permettant de passer
de l’échantillon à la population. Ce cours de statistique mathématique présente quelques-unes
de ces méthodes qui, pour la plupart, traduisent en langage mathématique la démarche de
l’inférence statistique.
Dans le premier chapitre de ce cours, nous nous consacrons à la notion de distribution
d’échantillonnage, à l’étude des liaisons existant entre une population et ses échantillons et à
déterminer la distribution d’une statistique de l’échantillon à partir des informations qu’on
dispose sur la population. Dans le deuxième chapitre, nous étudions les méthodes statistiques
permettant d’estimer les paramètres de la population à partir des données de l’échantillon.
Enfin, un des rôles importants de la statistique étant de confronter la théorie à la réalité, nous
abordons, au dernier chapitre, la notion des tests d’hypothèses. Ces derniers permettent
d’accepter ou de rejeter une (des) hypothèse (s) concernant une théorie au vu des résultats de
l’échantillon en fixant à l’avance la probabilité de prendre une décision erronée.
5
Chapitre I
Distribution d’échantillonnage
Nous étudions dans ce chapitre comment se comporte un (des) échantillon (s) dans une
population dont on connaît les caractéristiques statistiques (entre autres, les lois) des variables
considérées.
1.1. La théorie de l’échantillonnage
La théorie de l’échantillonnage est l’étude des liaisons existant entre une population et les
échantillons de cette population. On mesure donc son importance. Elle est fondamentale pour
estimer les quantités qui caractérisent une population c’est-à-dire les paramètres d’une
population (moyenne, variance…) à partir des caractéristiques correspondantes de l’échantillon
(moyenne, variance…) que l’on appelle statistique de l’échantillon.
Soit X1, X2, …, Xn un échantillon aléatoire d’une variable aléatoire X. Une statistique est une
fonction h (X1, X2, …, Xn) ne dépendant que des variables aléatoires Xi.
Exemples : - La moyenne d’échantillon X = ∑ X
- La variance d’échantillon S² = ∑ (X − X )²
- La médiane d’échantillon, etc.
Puisque les Xi sont des variables aléatoires, toute statistique est aussi une variable aléatoire et
dans la théorie de l’échantillonnage on s’intéresse à sa distribution appelée distribution
d’échantillonnage. Celle-ci est l’ensemble des valeurs prises par une statistique (moyenne
d’échantillon, variance d’échantillon, etc.) sur chaque échantillon d’une même population.
Prenons tous les échantillons de taille n tirés d’une population de taille N. Pour chaque
échantillon, on peut calculer une statistique (moyenne, variance, etc…) qui variera avec
l’échantillon. Pour tous les échantillons on obtient alors une distribution de la statistique que
l’on nomme la distribution d’échantillonnage. Cependant, pour la validité des résultats, il est
important que les échantillons soient représentatifs de la population concernée.
6
La connaissance de la distribution d’une statistique permet de se rassurer qu’il est un bon
estimateur du paramètre correspondant dans la population. La théorie de l’échantillonnage
permet également de savoir si les différences observées entre deux échantillons sont dues au
hasard ou si elles sont réellement significatives. On étudiera le premier problème au chapitre
suivant, qui portera sur l’estimation, et le second problème fera l’objet du dernier chapitre, qui
portera sur les tests d’hypothèses.
1.2. Echantillons aléatoires
Comme nous l’avons déjà souligné ci-haut, pour que les conclusions de la théorie de
l’échantillonnage et de l’inférence statistique soient valables, les échantillons choisis doivent
être représentatifs de la population. On appelle plan d’expérience, l’étude des méthodes
d’échantillonnage et des problèmes qui s’y rattachent. Pour obtenir un échantillon représentatif,
on utilise un échantillonnage aléatoire. Ce qui revient à considérer que chaque élément de la
population a une chance égale d’appartenir à un même échantillon.
Exemple: On s’intéresse aux comportements contraceptifs des étudiants de niveau 2 de
Maîtrise (M2) dans une grande école, dont le nombre est de 39. Combien d’échantillons de 10
étudiants peuvent être isolés de cette population ?
1.3. Echantillons exhaustifs et non exhaustifs
Quand on tire un individu dans la population, avant de procéder à un nouveau tirage, on peut
soit l’y remettre, soit ne pas l’y remettre. Dans le deuxième cas, un individu ne peut sortir
qu’une seule fois. Quand chaque individu d’une population peut être tiré plus d’une fois,
l’échantillonnage est dit non exhaustif. Dans le cas contraire, il est dit exhaustif.
Une population peut être soit finie, soit infinie. Une population finie dans laquelle
l’échantillonnage est non exhaustif, peut théoriquement être considérée comme infinie puisque
chaque individu peut être extrait sans épuiser la population. Pour des raisons de commodité,
l’échantillonnage exhaustif d’une population finie, mais très nombreuse, peut être considérée
comme réalisée sur une population infinie.
1.4. Distribution d’échantillonnage de quelques statistiques
On considère tous les échantillons possibles de taille n, exhaustifs ou non, qu’on peut extraire
dans une population donnée de taille N. Pour chacun de ces échantillons, on peut calculer
7
certaines caractéristiques (moyenne, écart-type, etc…) qui varient d’un échantillon à l’autre.
Ces statistiques ont chacune une distribution d’échantillonnage. Dans le cas de la moyenne
d’un échantillon, la distribution correspondante est la distribution des moyennes de
l’échantillon ou encore la distribution d’échantillonnage des moyennes. On obtient de même, la
distribution d’échantillonnage des écarts-types, celle des médianes, celle des variances, celle
des fréquences, etc… Pour chaque distribution d’échantillonnage on peut calculer la moyenne,
l’écart-type, etc… On pourra ainsi parler de la moyenne de la distribution d’échantillonnage,
l’écart-type de la distribution d’échantillonnage, etc… Il convient d’être prudent sur les termes
utilisés car il est facile de se tromper. Par convention, on utilise souvent :
- µ, σ et σ² comme les symboles de la moyenne, de l’écart-type et de la variance d’une
population.
- X, S et S² comme les symboles de la moyenne, de l’écart-type et de la variance d’un
échantillon.
- μ , σ et σ² comme symboles de la moyenne, de l’écart-type et de la variance de la
distribution d’échantillonnage des moyennes.
- µs², σs² et σ²s² comme les symboles de la moyenne, de l’écart-type et de la variance de la
distribution d’échantillonnage des variances.
- etc…
1.4.1. Distribution d’échantillonnage des moyennes
Supposons que l’on extrait d’une population de taille N tous les échantillons exhaustifs de taille
n (n < N). On a alors
μ = μ et σ =
√
Si la population est infinie ou que l’échantillonnage est avec remise
μ = μ et σ =
√
A partir du théorème central limite, il est possible de montrer que la distribution
d’échantillonnage est asymptotiquement normale. En d’autres termes, pour n suffisamment
grand (n>30), la distribution d’échantillonnage se rapproche d’une distribution normale de
moyenne μ et d’écart-type σ .
8
Dans le cas des petits échantillons (n< 30), si X suit une loi normale de paramètres μ et σ
connu, donc les variables Xi (i=1, 2, …, n) suivent toutes la même loi ; sous l’hypothèse
d’indépendance des Xi, la somme S des Xi a aussi une distribution normale de paramètres nμ et
d’écart-type σ√n ainsi que X de paramètres μ et . Donc suit la loi N (0,1).
√
√
Dans le cas des petits échantillons (n< 30), si X suit une loi normale de paramètres μ et σ
inconnus, on démontre que suit une loi de Student à n-1 degrés de liberté, notée T (n-1).
√
Où S est la racine carrée de la variance empirique S² = ∑ (X − X)².
Exemple: Une population comporte 5 individus A, B, C, D et E dont les nombres d’heures
passées devant la télévision sont respectivement 7, 10, 20, 12 et 32h. On considère tous les
échantillons exhaustifs de taille 3 extraits de cette population. Vérifier les relations entre la
moyenne de la population et la moyenne de la distribution d’échantillonnage des moyennes et
entre l’écart-type de la population et l’écart-type de la distribution d’échantillonnage des
moyennes.
1.4.2. Distribution d’échantillonnage des fréquences
Supposons qu’une population soit infinie et que la probabilité de réalisation d’un évènement
soit p et la probabilité de sa non réalisation soit q= 1-p.
On considère tous les échantillons possibles de taille n extraits de cette population et pour
chaque échantillon, on détermine la probabilité p de succès. On obtient alors une distribution
d’échantillonnage des fréquences dont la moyenne µp et l’écart-type sont donnés par :
( )
= = =
Pour des grandes valeurs de n (n >30), la distribution d’échantillonnage est très proche d’une
loi normale. Toutefois, on remarquera que l’événement étudié suit une loi binomiale. Les deux
relations sus-présentées sont également valables pour une population finie où l’échantillonnage
est non exhaustif. Pour des populations finies où l’échantillonnage est exhaustif, on a les
relations suivantes :
9
( )
= = =
Exemple : Considérons une population constituée de 5 étudiants dans laquelle on extrait des
échantillons de taille 3. On s’intéresse à leur réussite à la composition de statistique descriptive.
N° de l’étudiant 16 4 19 28 23
Réussite OUI OUI NON NON NON
Déterminer la distribution d’échantillonnage des fréquences et calculer sa moyenne et son
écart-type. Vérifier les relations qui lient ces derniers aux paramètres correspondants de la
population.
1.4.3. Distribution d’échantillonnage des différences ou des sommes
Supposons que l’on ait deux sous-populations. Pour chaque échantillon de taille n1 extrait de la
première sous-population, calculons une statistique S1. Ceci fournit une distribution
d’échantillonnage de la statistique S1 dont la moyenne et l’écart-type sont: μ et σ .
De la même façon, pour chaque échantillon de taille n2 extrait de la deuxième sous-population,
calculons une statistique S2. Ceci fournit une distribution d’échantillonnage de la statistique S2
dont la moyenne et l’écart-type sont: μ et σ .
En procédant à toutes les combinaisons possibles des échantillons des deux sous-populations,
on peut obtenir une distribution des différences S1 – S2 appelée distribution d’échantillonnage
de la différence de ces statistiques. La moyenne et l’écart-type de cette distribution, désignés
respectivement par μ et σ , sont donnés par :
μ =μ −μ
σ = σ +σ
Sous l’hypothèse que les deux échantillons extraits sont indépendants entre eux.
Si S1 et S2 sont les moyennes X et X , respectivement de la première et la deuxième sous-
population, alors la distribution d’échantillonnage des différences des moyennes a pour
moyenne et écart-type :
10
a) Cas où l’échantillonnage est non-exhaustif
μ =μ − μ =μ − μ
σ = σ +σ = +
Où μ et σ sont respectivement la moyenne et l’écart-type dans la première
sous-population et μ et σ la moyenne et l’écart-type dans la deuxième sous-
population.
b) Cas où l’échantillonnage est exhaustif
μ =μ − μ =μ − μ
σ = σ +σ
Où σ² ²
σ² ²
On obtient des résultats analogues pour la distribution d’échantillonnage de la différence des
fréquences dans deux populations binomiales dont les paramètres sont notamment: p , q et p ,
q .
μ = μ −μ =p −p
p q p q
σ = σ +σ = +
n n
Dans tous les cas, la distribution d’échantillonnage de la différence des moyennes ou des
proportions suit une loi normale pour n1, n2>30.
Il est parfois utile de traiter la distribution d’échantillonnage de la somme des statistiques. Sa
moyenne et son écart-type sont alors
μ =μ +μ
σ = σ +σ
11
1.4.4. Distribution d’échantillonnage des variances
On considère tous les échantillons possibles de taille n extraits dans une population de taille N.
Pour chacun de ces échantillons, on calcule la variance S² qui peut varier d’un échantillon à
l’autre. On obtient alors la distribution d’échantillonnage des variances.
On peut démontrer que si X1, X2, …, Xn est un échantillon de taille n d’une variable aléatoire
normale de moyenne µ et de variance σ²,
( ) ² ∑ ( )²
W= où S² =
²
suit une loi de khi-deux à (n-1) degré de liberté.
E(W) = n-1 et V(W) = 2(n-1)
²
E(S²) = E ( W) = E(W) = σ²
²
V(S²) = V( W) = ( )
V(W) =
Remarque: dans le cas d’une variable aléatoire qui ne suit pas une loi normale:
V(S²) = σ4 ( + )
où =
µ4 = moment centré d’ordre 4
Exemple : Une population est constituée des nombres 2, 3, 6, 8. Si on extrait dans cette
population les échantillons de taille 2, déterminer la distribution d’échantillonnage de S² (la
variance empirique), calculer sa moyenne et sa variance. Que constatez-vous ?
1.4.5. Distribution d’échantillonnage du rapport de deux variances empiriques
On considère deux échantillons indépendants de taille n1 et n2 extraits dans deux populations
normales dont les paramètres sont respectivement µ1, σ1 et µ2, σ2.
On démontre que le rapport des variances empiriques suit la loi de Fisher à n1-1 et n2-1
degrés de liberté multiplié par . Il en découle que la statistique
12
suit une loi de Fisher à n1-1 et n2-1 degrés de liberté.
La moyenne et l’écart-type de cette statistique sont respectivement si > 2 et
( )
( ) ( )
si >4( ù = −1 = − 1).
1.5. Erreur quadratique moyenne
On appelle erreur quadratique moyenne le carré de l’écart-type de la distribution
d’échantillonnage d’une statistique. On donne dans le tableau ci-après ces erreurs pour les
distributions d’échantillonnage de statistiques variées en supposant que l’échantillonnage soit
aléatoire dans une population infinie ou non-exhaustive dans une population finie.
Tableau 1.4: Erreur quadratique moyenne de quelques distributions d’échantillonnage.
Distribution EQM Observations
d’échantillonnage
Moyennes = Ceci est vrai pour de grands ou petits
√ échantillons.
La distribution d’échantillonnage des
moyennes est très proche d’une
distribution normale quand ≥ 30
même quand la population n’est pas
normale. Dans tous les cas =µ,
moyenne de la population.
Fréquences ( ) Les remarques relatives aux moyennes
= = sont aussi valables ici. = .
Ecarts-types (1) = Pour ≥ 100 la distribution
√
d’échantillonnage de S est presque
(2) = normale.
est donné par la première relation
seulement si la population est normale.
Si la population n’est pas normale on
peut utiliser la deuxième relation. On
remarque que la deuxième relation
conduit à la première quand = et
= 3 (qui correspond aux
populations normales).
13
Variances Les remarques relatives à l’écart-type
(1) = sont encore valables ici. Notons que les
deux relations sont identiques lorsque la
(2) = population est normale.
( )
, qui est presque égal à
quand n grand.
Médianes Pour ≥ 30 la distribution
é = d’échantillonnage des médianes est
2
presque normale. Le résultat n’est
1,2533 valable que si la population est normale
é = ou approximativement normale.
√
Coefficient de variation = 1+2 ² Ici v = est le coefficient de variation
√
de la population. Le résultat est valable
pour de populations normales (ou
presque normales) et n> 100.
Exercices
1) Une population est constituée des nombres 3, 5, 7, 9, 12. On considère tous les échantillons
non-exhaustifs possibles de taille 2 de cette population. Trouver (a) la moyenne de la
population, (b) l’écart-type de la population, (c) la moyenne de la distribution
d’échantillonnage des moyennes, (d) l’écart-type de la distribution d’échantillonnage des
moyennes ou l’erreur quadratique moyenne des moyennes.
2) Résoudre le problème 1 dans le cas d’un échantillonnage exhaustif.
3) On suppose que le poids de 3000 étudiants d’une université suivent une loi normale de
moyenne 68Kg et d’écart-type 3Kg. Si l’on extrait 80 échantillons de 25 étudiants chacun,
quelle est la moyenne et l’écart-type de la distribution d’échantillonnage des moyennes
pour (a) un échantillonnage non-exhaustif, (b) un échantillonnage exhaustif ?
4) Pour combien d’échantillons du problème 3 peut-on s’attendre à trouver une moyenne (a)
comprise entre 66,8 et 68,3 Kg, (b) inférieure à 66,4 Kg ?
5) Lors d’élections réalisées dans un pays donné, les résultats ont montré qu’un des candidats
a obtenu 44 % des voix. Déterminer la probabilité pour que le vote de 200 personnes
14
choisies au hasard parmi le corps électoral donne une majorité de voix en faveur de ce
candidat.
6) Trouver la probabilité pour que dans l’ensemble des 200 prochains enfants à naître, on y
retrouve (a) moins de 40 % de garçons, (b) entre 43 % et 57 % de filles, (c) plus de 54% de
garçons. On supposera que la naissance d’un garçon et celle d’une fille sont équiprobables.
7) Soit U1 une variable qui représente n’importe quel élément de la population 5, 7, 9 et U2
une variable qui représente l’un des éléments de la population 4, 6. Calculer a) , (b) ,
(c) , (d) l’écart type de U1, (e) l’écart type de U2, (f) l’écart type de U1-U2.
8) Les femmes d’une région A donnée ont en moyenne 4,2 enfants avec un écart-type de 1,5
enfant et celles d’une région B ont en moyenne 3,4 enfants avec un écart-type de 1,1 enfant.
Quelle est la probabilité pour qu’un échantillon de 1000 femmes extrait dans A diffère d’un
échantillon de même taille extrait dans B de plus de 0,7 enfant ?
9) Dans une région donnée, la proportion de femmes de niveau secondaire ou supérieur
utilisant les méthodes contraceptives modernes est de 15 % et celle de femmes de niveau
primaire utilisant ces méthodes est de 12 %. Quelle est la probabilité que 725 femmes
sélectionnées dans le premier groupe aient une prévalence contraceptive plus élevée de
celle de 517 femmes sélectionnées dans le deuxième groupe d’au moins 5% ?