0% ont trouvé ce document utile (0 vote)
117 vues133 pages

Échantillonnage et Variables Aléatoires

Transféré par

Salwa Lamine
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
117 vues133 pages

Échantillonnage et Variables Aléatoires

Transféré par

Salwa Lamine
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Echantillonnage et estimations

Professeur : El Houcine El Bouchibti


[email protected]
•Informations pratiques:

•Cours magistral 1h30min


Questions à la fin du cours

•TD1h30min
Présence obligatoire
Faire (ou essayer de faire) les exercices avant de venir
en TD
Possibilité de contrôle

Bon courage
Professeur : El Houcine El Bouchibti
[email protected]
I- Notion de variables aléatoires
Une variable aléatoire est une grandeur numérique
attaché au résultat d’une expérience aléatoire. Chacune
de ses valeurs est associé à une probabilité d’apparition.
Exemple 1
On jette une pièce de monnaie deux fois et on s’intéresse
au nombre de fois que pile apparaît au cours des deux
jets. On à quatre résultats possibles : PP, PF, FP, FF
Le nombre de fois que Pile peut apparaître est 0, 1 ou 2.
La variable aléatoire retenue peut donc prendre ces trois
valeurs, son ensemble de définition est donc : {0, 1, 2}

Professeur : El Houcine El Bouchibti


[email protected]
Exemple 2
Soit une agence immobilière qui désire se lancer dans la
location à la journée de studios meublés. Elle étudie la
demande journalière possible X de location durant les mois
de juillet et août. Elle obtient les résultats suivants :

xi 0 1 2 3 4 5

p( X = xi ) 0.05 0.1 0.2 0.3 0.25 0.1

Professeur : El Houcine El Bouchibti


[email protected]
Une variable aléatoire peut être discrète ou continue :

Une VA est dite discrète si l'ensemble des


valeurs qu'elle est susceptible de prendre est
fini ou infini dénombrable.

Une VA est dite continue si elle peut prendre


toute valeur à l'intérieur d'un intervalle donné.
En règle générale, toutes les variables qui
résultent d’une mesure sont de type continu.

Professeur : El Houcine El Bouchibti


[email protected]
Les caractéristiques d’une variable aléatoire discrète:
a- Loi de probabilité
On appelle loi de probabilité d’une variable aléatoire X
l’ensemble des couple ( x i , p i ) / p i = p ( X. = x i )

b- Fonction de répartition

On appelle fonction de répartition, la fonction F définie par:

F : ℝ → [ 0,1]
x ֏ F ( x) = p( X ≤ x)

Professeur : El Houcine El Bouchibti


[email protected]
c- Espérance mathématique
On appelle espérance mathématique de la variable X et on note
E(X) la moyenne des valeurs possibles pondérées par leurs
probabilités.
E( X ) = ∑ xi pi
d- Variance
On appelle variance de la variable aléatoire X le nombre réel
définie par:

V ( X ) = E( X ) − E ( X )
2 2

Professeur : El Houcine El Bouchibti


[email protected]
e- Ecart-type

On appelle écart-type de la variable aléatoire X, la racine carrée


de sa variance.

∂X = V(X)

Professeur : El Houcine El Bouchibti


[email protected]
Exemple
Soit une agence immobilière qui désire se lancer dans la
location à la journée de studios meublés. Elle étudie la
demande journalière possible X de location durant les mois
de juillet et août. Elle obtient les résultats suivants :

xi 0 1 2 3 4 5

p( X = xi ) 0.05 0.1 0.2 0.3 0.25 0.1

E ( X ) = 0 .1 + 0 .4 + 0 .9 + 1 + 0 .5 = 2 .9
V ( X ) = (0 .1 + 0 .8 + 2 .7 + 4 + 2 .5) − ( 2 .9 ) = 1 .6 9 2

∂ X = 1 .3

Professeur : El Houcine El Bouchibti


[email protected]
Les caractéristiques d’une variable aléatoire continue:
a- Fonction de densité de probabilité

On appelle fonction de densité de probabilité toute


fonction satisfaisant aux 2 conditions suivantes :

1) ∀x ∈ ℝ f (x) ≥ 0
+∞
2) ∫ −∞
f ( x)dx = 1

Professeur : El Houcine El Bouchibti


[email protected]
b- Fonction de répartition
Soit X une VA continue et f sa densité de probabilité.
La fonction de répartition de X est la fonction F telle
que:
FX : ℝ → [ 0,1]
t
t ֏ FX (t ) = ∫ −∞
f ( x ) dx

c- Espérance mathématique

+∞
E(X ) = ∫ −∞
xf ( x)dx

Professeur : El Houcine El Bouchibti


[email protected]
d- Variance
+∞ +∞
V (X ) = ∫ x f ( x ) dx − ( ∫
2
xf ( x ) dx ) 2
−∞ −∞

On appelle écart type, la racine carrée de la


variance

Professeur : El Houcine El Bouchibti


[email protected]
II- Lois de probabilité :
Il existe de nombreuses lois de probabilités,
chacune s'appliquant dans des conditions
bien particulières.
Loi de BERNOULLI
La variable de BERNOULLI est une variable qui
prend les valeurs 0 et 1 avec les probabilités
respectives q et p (p + q =1). La valeur 1 est associé
à la réalisation de l’événement considéré ‘succès’
et la valeur 0 à sa non réalisation ‘échec’
Professeur : El Houcine El Bouchibti
[email protected]
Caractéristiques

E( X ) = ∑xi pi = p ⇒E( X ) = p

( )
2
V ( X ) = ∑xi pi − ∑xi pi = p − p = p(1− p) = pq
2 2 . ⇒V ( X ) = pq
.

Professeur : El Houcine El Bouchibti


[email protected]
Loi BINOMIALE
Une variable aléatoire est dite binomiale si elle
représente le nombre de succès obtenus dans une
expérience de n épreuves où la probabilité de succès
reste constante.
La fonction de probabilité d’une telle fonction
est donnée par :

P (X = k )= C n p q
k k n − k

Professeur : El Houcine El Bouchibti


[email protected]
La variable binomiale est entièrement
spécifiée par la connaissance de n et p.

La variable de BERNOULLI est un cas


particulier de la variable binomiale : n=1.

Professeur : El Houcine El Bouchibti


[email protected]
Conditions d’application de la variable
binomiale :
1ère condition : L’expérience consiste en une suite
d’épreuves se soldant à chaque fois soit par un succès
soit par un échec.
2ème condition : Les épreuves se répètent de manière
identique et dans les mêmes conditions.
3ème condition : La probabilité de succès reste
constante tout au long des n épreuves.

Professeur : El Houcine El Bouchibti


[email protected]
Caractéristiques de la variable binomiale
Soit X → Β(n, p ) . X peut-être décrite comme une somme de n
variables de BERNOULLI indépendantes :
X = X + X ,+.... + X n
( ) ( ) ( )
1 2
• E ( X ) = E X + X ,+.... + X n = E X + E X + ....... + E ( X n )
1 2 1 2
= p + p + .... + p = n. p ⇒ E ( X ) = n. p
• ( 1 2
) ( ) ( )
V ( X ) = V X + X ,+.... + X n = V X + V X + ....... + V ( X n )
1 2
= p.q + p.q + ........ + p.q = n. p.q ⇒ V ( X ) = n. p.q

Professeur : El Houcine El Bouchibti


[email protected]
Approximation de la loi binomiale :
1er cas : lorsque n est élevé et p n’est ni proche de 1
ni de 0, la loi binomiale est approché par la loi
normale.
2ème cas : Lorsque n est élevé et p est faible (p<0.1)
la loi binomiale est approché par la loi de poisson.

Professeur : El Houcine El Bouchibti


[email protected]
Exemple :

L’agence immobilière dispose d’un parc de 5 studios. La


probabilité de louer chacun d’eux au mois de juin est de
0.6. L’agence désire étudier la probabilité de location de
ce parc.

1- Quelle est la loi de probabilité suivie par cette variable


aléatoire ? Quels en sont les paramètres ?

2- Calculer la probabilité de louer 0, 1, 2 studios?

Professeur : El Houcine El Bouchibti


[email protected]
Loi de POISSON
La distribution de probabilité d’une V.A X est dite distribution de
POISSON si elle est définie par les couples (xi , pi) où x prend
les valeurs 0, 1, 2, ……avec les probabilités respectives
données par :

− λ λ x
P ( X = x) = e
x!
où λ est un paramètre réel positif.

Professeur : El Houcine El Bouchibti


[email protected]
Caractéristiques
E (X ) = λ

V (X ) = λ

Professeur : El Houcine El Bouchibti


[email protected]
Conditions d’application de la loi de Poisson :

Soit une approximation de la loi binomiale:

lorsque n est élevé et p très faible (proche de 0).


Généralement l'approximation est valable dés que n > 50 et
p < 0.1

X --> B(n;p) Po(λ= n.p)

Soit une résultante d’un processus aléatoire particulier , le


processus de Poisson

Professeur : El Houcine El Bouchibti


[email protected]
La loi de POISSON s'applique en particulier dans le cas d'événements
se réalisant de façon aléatoire dans le temps ou l'espace (pannes de
machines, arrivées de clients à un comptoir, appels téléphoniques sur une ligne ……). Si la
réalisation d'un événement donné vérifie les conditions suivantes :
Le nombre moyen de fois qu'un événement se réalise dans un
intervalle de temps ou dans un espace est connu λ,
La probabilité que cet événement se produise dans un intervalle de
temps est proportionnelle à la longueur de cet intervalle et ne
dépend en aucun cas du nombre d'événements qui se sont produits
antérieurement,
La probabilité que l'événement se produise plus d'une fois dans un
intervalle de temps très court est négligeable
alors le nombre X d'événements réalisés au cours d'une période de
temps t est une variable de POISSON ayant pour paramètre λ = p.t.

Professeur : El Houcine El Bouchibti


[email protected]
Exemple 1:
L’arrivé des clients à un supermarché est considérée
comme un processus de POISSON. On sait que le
nombre moyen de clients arrivant par minute au
supermarché est égale à 2.
Calculer la probabilité pour que pendant une période
particulière de 5 minutes il arrive 12 clients.

Professeur : El Houcine El Bouchibti


[email protected]
Exemple 2:
Une entreprise utilise des pots de peinture
dont 0.2% sont défectueux.
Quelle est la probabilité que sur les 1000 pots
qu’il utilise , il en trouve un défectueux?

Professeur : El Houcine El Bouchibti


[email protected]
Loi hypergéométrique
La loi hypergéométrique intervient dans le cas de plusieurs
expériences aléatoires dépendantes auxquelles on associe un
caractère étudié quelconque.

La probabilité de succès varie d’une expérience aléatoire à


l’autre. C’est le cas des prélèvements d’individus au hasard
dans une population finie, lorsque les individus ne sont pas
remis en place au fur et à mesure des prélèvements.

Professeur : El Houcine El Bouchibti


[email protected]
Désignons par N l’effectif total de la population dans
laquelle on prélève au hasard et sans remise n individus. La
population est composée d’individus qui possèdent le
caractère étudié, le nombre de ces individus se désigné par
n 1 on note par n 2 le nombre d’individus de la population
qui ne possèdent pas le caractère étudié.
N = n1 + n 2
k n−k
C C
p( X = k ) =
n1 n2
n
C N

Professeur : El Houcine El Bouchibti


[email protected]
Exemple :
Dans une population de 40 personnes, dont 6 personnes sont originaires du Sud,
14 du Nord, 12 de l'Est et 8 de l'Ouest, on choisit au hasard un échantillon de 4
personnes.
La variable aléatoire X désigne le nombre d'individus de l'échantillon qui sont
originaire du Nord.
La population étant finie et les prélèvements s'effectuent sans remise, la variable
X suit donc une loi hypergéométrique de paramètres :
N = effectif total de la population = 40
n1 = nombre d'individus de la population qui sont originaires du Nord = 14
n = nombre d'individus prélevés sans remise = 4
X = H(40, 14, 4)
Calculer la probabilité pour que trois personnes parmi les personnes choisis
soient originaires du Nord?

C143 × C 26
1
p ( X = 3) = 4
C 40

Professeur : El Houcine El Bouchibti


[email protected]
La loi normale
On parle de loi normale ou de loi de LAPLACE –
GAUSS, lorsque l’on a affaire à une variable
aléatoire continue dépendant d’un grand nombre
de causes indépendantes, dont les effets
s’additionnent et dont aucune n’est
prépondérante.

Exemple : une caractéristique de qualité, La durée d’un


trajet, les fluctuations accidentelles d’une grandeur ..

Professeur : El Houcine El Bouchibti


[email protected]
f(x)

x
m-σ m m+σ

Professeur : El Houcine El Bouchibti


[email protected]
Définition :

Une V.A continue X est dite distribuée selon une


loi normale si sa densité de probabilité est :

f(x) = 1 exp[− 1 ( x − m)²]


σ 2π 2 σ

La loi normale dépend de deux paramètres m et σ . On


note : X N(m;σ).

Professeur : El Houcine El Bouchibti


[email protected]
Fonction de répartition
La fonction de répartition d'une variable normale est
donnée par l'expression :
x 1 x 1 x−m 2
F( x) = p( X ≤ x) = ∫ f (x)dx = ∫ exp[− ( ) ]dx
−∞ σ 2π −∞ 2 σ

caractéristiques
E (X ) = m
V (X ) = σ 2

Professeur : El Houcine El Bouchibti


[email protected]
Propriétés :
Le graphique de la fonction de densité de probabilité de la
Loi normale est une courbe en cloche symétrique par
rapport au point d'abscisse x=m.

La droite verticale x=m divise l'aire comprise entre la


courbe et l'axe des abscisses en deux parties égales
P(X<m) = 0,5 et P(X>m) = 0,5.

La grande partie des observations se situe dans l'intervalle


[m-3σ ; m+3σ].

Professeur : El Houcine El Bouchibti


[email protected]
f(x)

x
m-σ m m+σ
m-2σ m+2σ

68%

m-3σ 95% m+3σ

99%

Professeur : El Houcine El Bouchibti


[email protected]
Intervalles remarquables :
2 2
p ( m − σ < X < m + σ ) ≃ 50%
3 3
p ( m − σ < X < m + σ ) ≃ 68%
p ( m − 2σ < X < m + 2σ ) ≃ 95%
p ( m − 3σ < X < m + 3σ ) ≃ 99, 74%

Professeur : El Houcine El Bouchibti


[email protected]
Calcul des probabilités
Pour une VA continue, on s'intéresse surtout à une
probabilité d'intervalle. La fonction de densité étant
compliquée, des tables ont été prévues pour faciliter ce
calcul.
Toutefois, étant donnée qu'il existe une infinité de lois
normales distinctes par leurs paramètres, une seule
variable normale est tabulée et sert de référence pour les
autres : il s'agit de la loi normale centrée réduite.

Professeur : El Houcine El Bouchibti


[email protected]
Le passage de la loi normale à la loi normale centrée
réduite s'effectue à l'aide du changement de variable
suivant :

X −m
z=
σ

La loi normale centrée réduite à pour


paramètre : m =0 et σ= 1.

Professeur : El Houcine El Bouchibti


[email protected]
Propriétés :
Le graphique de la fonction de densité de probabilité de la
LNCR est une courbe en cloche symétrique par rapport au
point d'abscisse z= 0.

La droite verticale z= 0 divise l'aire comprise entre la


courbe et l'axe des abscisses en deux parties égales
P(Z<0) = 0,5 et P(Z>0) = 0,5.

La grande partie des observations se situe dans l'intervalle


]-3 ;3[.

Professeur : El Houcine El Bouchibti


[email protected]
Intervalles remarquables :

2 2
p ( − < X < ) ≃ 50%
3 3
p ( −1 < X < 1) ≃ 68%
p ( −2 < X < 2) ≃ 95%
p ( −3 < X < 3) ≃ 99, 74%

Professeur : El Houcine El Bouchibti


[email protected]
Utilisation de la table N(O; 1)
Cette table nous donne les probabilités
de trouver une valeur inférieur à z.

Professeur : El Houcine El Bouchibti


[email protected]
Professeur : El Houcine El Bouchibti
[email protected]
Pour une variable normale quelconque X de paramètres m et σ:

X −m x−m
F (x) = p( X ≤ x) = p( ≤ )
σ σ
= p(Z ≤ z)
= Π (z)

Pour lire une valeur de П(z) dans la table, il suffit de lire l’intersection
entre la ligne correspondante à la valeur de z et la colonne
correspondante au deuxième chiffre après la virgule de z.

Professeur : El Houcine El Bouchibti


[email protected]
Exemple :
X suit une loi normale N(345; 167)
On souhaite connaître la probabilité pour que
X soit inférieur à 500.
On effectue le changement de variable:
Z = X − x = X − 345
σ 167

500 − 345
p( X < 500) = p(Z < )
167
= p ( Z < 0 .9 3 )
= Π ( 0 .9 3 )
= 0 .8 2 3 8
Professeur : El Houcine El Bouchibti
[email protected]
Exemple :

Le poids moyen de 500 colis est de 141kg et l’écart


type est de 15kg, en supposant que ces poids sont
normalement distribués, calculer le nombre de colis
pesant :
-Entre 120 et 155kg
-Plus de 185 kg

Professeur : El Houcine El Bouchibti


[email protected]
Loi de KHI-DEUX
On appelle variable de khi deux de Pearson, la variable χ qui varie
2

entre 0 et +∞ est définie par la fonction de densité de probabilité:


k x
− 1 −
f ( x ) = c × x 2
e 2

Le paramètre k est une constante entière positive appelée nombre de


degrés de liberté:2 on dit variable de Khi deux à k degrés de liberté,
désignée par χ à k d l . +∞

K est une constante telle que : ∫


0
f ( x)dx = 1

Professeur : El Houcine El Bouchibti


[email protected]
Caractéristiques

E (χ 2
à k dl ) = k
V (χ 2
à k dl ) = 2k
La table de la loi de Khi deux dépend du paramètre k, elle donne les
valeurs de χ 2
à k dl pour des valeurs de la fonction de répartition
(probabilités). Pour lire une valeur χ à k d l dans la table, il suffit de
2

lire l’intersection entre la colonne correspondante à la valeur de la


probabilité et la ligne correspondante au degré de liberté k.
Exemple :
La valeur χ 2
à 10 degrés de liberté et pour une probabilité 0.95 est:
χ 2
0 .9 5 à 1 0 d l = 1 8 .3
Professeur : El Houcine El Bouchibti
[email protected]
Loi de STUDENT
On appelle variable t de Student, la variable t définie par la fonction
de densité de probabilité:

t 2 − k 2+ 1
f ( t ) = c (1 + )
k
Le paramètre k est une constante entière positive appelée nombre de
degré de liberté: on dit variable Student t à k degrés de liberté,
désignée par t à k d l .
+∞

K est une constante telle que: ∫ f (t)dt =1


−∞

Professeur : El Houcine El Bouchibti


[email protected]
caractéristiques
E (t à k dl )= 0
k
V (t ) = pour k > 2
k − 2
à k dl

La table de la loi T de Student dépend du paramètre k, elle donne


les valeurs de t à k d l pour les valeurs de la fonction de répartition
(probabilités). Pour lire une valeur de t à k d l dans la table, il suffit
de lire l’intersection entre la colonne correspondante à la probabilité
et la ligne correspondante au degré de liberté.
Exemple :
La valeur de T à 10 degrés de liberté et pour une probabilité 0.95 est:
t 0 .9 5 à 1 0 d l = 1 . 8 1 2
Professeur : El Houcine El Bouchibti
[email protected]
Loi de FISCHER SNEDECOR
On appelle variable F de Fischer, la variable F définie par la fonction de
densité de probabilité:

k1 k1 + k 2
−1 −
f ( x ) = cx 2
( k1 x + k 2 ) 2

Les paramètres k1 et k2 sont deux constantes entières positives


appelées nombre de degrés de liberté: on dit F à k1 et k2 degrés de
liberté, désignée par F à k e t k d l .
1 2
+∞

K1 et k2 sont des constantes telle que: ∫ f (t)dt =1


0

Professeur : El Houcine El Bouchibti


[email protected]
caractéristiques
k2
E ( F à k1 e t k 2 d l ) = pour k2 > 2
k2 − 2
2 k 2 2 ( k1 + k 2 )
V ( F à k1 e t k 2 d l ) = pour k2 > 4
k 1 ( k 2 − 2 )( k 2 − 4 )

Il ya plusieurs tables de la loi de Fischer pour différentes valeurs de la


fonction de répartition(probabilités).
Chaque table de la loi F dépend des degrés de liberté k1 et k2.
Pour lire une valeur F à k e t k d l dans la table, il suffit de lire
1 2

l’intersection entre la colonne correspondante à la valeur de k1 et la


ligne correspondante à la valeur de k2.

Professeur : El Houcine El Bouchibti


[email protected]
Exemple :
La valeur de F à 10 et 15 dl pour une probabilité de 0.95 se

trouve dans la table de la loi F ( p = 0.95) : F à 10 et 15 dl = 2.54.

Professeur : El Houcine El Bouchibti


[email protected]
III- Théorème central limite
Le théorème central limite est une généralisation de la propriété
d’additivité. Toute somme de variables aléatoires indépendantes
tend à suivre une loi normale quelles que soient les lois de
probabilités suivies par ces variables.

Quelles que soient les variables aléatoires indépendantes


X 1 , X 2 , ...., X n de moyennes respectivement m 1 , m 2 , ...., m n
Nous avons:

(
X 1 + X 2 + ... + X n ≈ N m1 + m2 + ... + mn , σ 12 + σ 22 + ... + σ n2 )
Professeur : El Houcine El Bouchibti
[email protected]
Echantillonnage

Professeur : El Houcine El Bouchibti


[email protected]
Comment dénombrer ?

Question : combien y a-t-il de personnes atteintes de troubles de la


vue parmi les conducteurs automobiles au Maroc ?
Réponse : 10% ? 40 % ? 75 % ?

Il est impossible de les compter toutes en examinant toute la


population des conducteurs marocains
Il va être nécessaire d’utiliser une procédure particulière
(l’échantillonnage) et des méthodes statistiques pour estimer la
précision du résultat (incertitude)

Professeur : El Houcine El Bouchibti


[email protected]
Terminologie

Population : Toutes les personnes à qui les résultats


doivent s’appliquer

Echantillon : Dans la plupart des cas, la taille de la


population est trop importante pour que l’on puisse
étudier tous les individus qui la composent. On étudie un
sous-groupe appelé échantillon.

Unité de base : il peut s’agir d’une unité de sondage, c’est


l’élément pris en considération dans l’enquête.

Professeur : El Houcine El Bouchibti


[email protected]
Enquête: ensemble des opérations de collecte et de traitement
des données relatives à quelques domaines que ce soit.
Recensement: Enquête complète ou enquête exhaustive, c’est
une enquête au cours de laquelle toutes les unités de base de
la population sont observées.

Sondage: Enquête incomplète, enquête partielle ou enquête


par échantillonnage.

Echantillonnage: ensemble des opérations qui permettent de


sélectionner de façon organisée les éléments de l’échantillon.

Base de sondage: énumération ou présentation ordonnée de


toutes les unités de base constituant la population.

Professeur : El Houcine El Bouchibti


[email protected]
Erreur d’échantillonnage: écart entre les résultats obtenus
auprès d’un échantillon et ce que.

Fraction ou taux de sondage: proportion des unités de la


population qui font partie de l’échantillon. C’est le rapport
entre la taille de l’échantillon n, et la taille de la population
N.
n
f = × 100
N

Professeur : El Houcine El Bouchibti


[email protected]
Méthodes d’échantillonnage

I-Méthodes d’échantillonnage probabilistes


1. Echantillonnage aléatoire et simple
2. Echantillonnage stratifié
3. Echantillonnage par degrés
4. Echantillonnage systématique

II-Méthodes d’échantillonnage empiriques

1. Echantillonnage accidentel
2. Echantillonnage à priori
3. Echantillonnage « Boule de neige »
4. Echantillonnage par Quotas

Professeur : El Houcine El Bouchibti


[email protected]
I-Echantillonnage probabiliste
Ensemble de méthodes appelées sondages probabilistes,
parce que chaque unité échantillonnée a une probabilité
connue à l’avance de figurer dans l’échantillon.

Ceci permet
de généraliser l’estimation du phénomène à la population dont
est issu l’échantillon.
d’apprécier la marge d’erreur, le degré d’incertitude de
l’estimateur.

Professeur : El Houcine El Bouchibti


[email protected]
1-Echantillonnage aléatoire simple
Chaque sujet de la population a la même probabilité d’être
inclus dans l’échantillon
Maximise la possibilité de conclure pour toute la population
Base de sondage : liste préétablie des sujets
Liste des conducteurs
Liste des foyers
Liste des abonnés au téléphone

Professeur : El Houcine El Bouchibti


[email protected]
Procéder à un tirage au sort des sujets dans la base :
Programme informatique
Tables de nombre au hasard

TAS
Échantillon
Population

Professeur : El Houcine El Bouchibti


[email protected]
Le sondage permet de limiter la taille de l’investigation
Avantages :
Réduction des coûts d’investigation
Meilleure qualité de l’observation chez chaque sujet
(enquête, questionnaire, investigation )
Délai d’obtention des résultats plus rapide
Limite :
il est nécessaire d’avoir une base de sondage fiable

Professeur : El Houcine El Bouchibti


[email protected]
2-Echantillonnage stratifié
Dans certains cas, on peut craindre d’obtenir trop peu de sujets d’un
sous-groupe particulier (p.ex. les conducteurs occasionnels), alors
qu’on peut supposer une fréquence particulière du phénomène dans
ce sous-groupe.

On risque que l’échantillon de ce sous-groupe de la population ne


permette pas de calculer un estimateur suffisamment précis

Par le simple fait du hasard, on peut sous-estimer ou sur-estimer la


fréquence du phénomène dans ce sous-groupe

Professeur : El Houcine El Bouchibti


[email protected]
La méthode consiste à identifier les niveaux / catégories de la
variable qui caractérise cet aspect de la population

exemple 2 : on peut supposer que les personnes d’un même groupe


partagent des caractéristiques qui déterminent plus particulièrement
le phénomène
Les troubles de la vue peuvent comporter une composante d’origine
génétique : daltonisme, myopie
Les personnes d’une même famille ont donc une probabilité différente d’une
autre famille

Chaque famille définit une strate de la population

Professeur : El Houcine El Bouchibti


[email protected]
L’échantillon est constitué par un sondage
aléatoire simple par strate :
Tirage au sort des unités dans chaque strate

TAS Échantillon
Population

Professeur : El Houcine El Bouchibti


[email protected]
3-Echantillonnage par degrés
L’échantillonnage par degrés regroupe toute une série de plans
d’échantillonnage caractérisés par un système ramifié et hiérarchisé
d’unités.

L’échantillonnage par degrés s’impose lorsqu’il est impossible


d’inventorier les éléments de toute la population et qu’il est possible
d’énumérer les unités prélevées au premier degré. Il permet une
concentration du travail sur le terrain et donc une réduction des
coûts.

Pour un même nombre total d’observations, il faut citer sa plus faible


efficacité que l’échantillonnage aléatoire simple.

Professeur : El Houcine El Bouchibti


[email protected]
Exemple:
Pour étudier le niveau de consommation des
ménages d’une ville, on a tiré aléatoirement 5
quartiers. Dans chaque quartier sélectionné, on
retient une rue sur 5, dans chaque rue retenue, on
retient un immeuble sur 3, et dans chaque
immeuble, un ménage par étage sera questionné.

Professeur : El Houcine El Bouchibti


[email protected]
4-Echantillonnage systématique
L’échantillonnage systématique est une technique qui consiste à
prélever des unités d’échantillonnage situées à intervalles égaux. Le
choix du premier individu détermine la composition de tout
l’échantillon.

Si on connaît l’effectif total de la population N et qu’on souhaite


prélever un échantillon d’effectif n, l’intervalle entre deux unités
successives à sélectionner est donné par:

N
k = ( arrondi à l ' entier le plus proche)
n

Professeur : El Houcine El Bouchibti


[email protected]
L’échantillonnage systématique est facile à préparer et, en général
facile à exécuter, il réduit le temps consacré à la localisation des
unités sélectionnées.

Si les éléments de la population se présentent dans un ordre


aléatoire ( pas de tendance ) l’échantillonnage systématique est
équivalent à l’échantillonnage aléatoire et simple. Par contre si les
éléments de la population présentent une tendance,
l’échantillonnage systématique est plus précis que l’échantillonnage
aléatoire.

Exemple:
On veut sélectionner an échantillon de 30 entreprises au sein d’une
population de 1800 entreprises.
Professeur : El Houcine El Bouchibti
[email protected]
1800
k = = 60
30
Ainsi on va tirer une entreprise toutes les 60 en partant d’un nombre
tiré aléatoirement entre 1 et 60.

Supposons que ce nombre est le 15. On va donc sélectionner la 15


éme entreprise puis la 75 éme la 135 éme jusqu’à la 1755éme ce qui
nous donnera l’échantillon de 30 entreprises.

Professeur : El Houcine El Bouchibti


[email protected]
II-Echantillonnage Empiriques
1- Echantillonnage accidentel (De convenance)
Il s’agit d’un échantillon constitué d’individus qui se trouvaient
accidentellement à l’endroit et au moment où l’information a été
collectée.

Exemple:
- Enquêtes réalisées dans la rue, les lieux publiques, en sortie
de super marché…
- Questionnaires figurant dans les magasines et renvoyés
spontanément.

Professeur : El Houcine El Bouchibti


[email protected]
2- Echantillonnage à priori
C’est un échantillonnage par jugement à priori. Il consiste à
sélectionner des individus dont on pense, avant de les interroger,
qu’ils peuvent détenir l’information.

Le risque de ce type d’échantillonnage est de considérer des


individus, apparemment représentatifs de la population étudiée.

3- Echantillonnage « Boule de neige »


Cette méthode est réservée aux populations composées d’individus
dont l’identification est difficile ou qui possèdent des
caractéristiques rares.

Professeur : El Houcine El Bouchibti


[email protected]
4- Echantillonnage par Quotas
L’échantillonnage par quotas est l’échantillonnage non probabiliste le
plus connu, et finalement le mieux accepté comme substitut aux
méthodes probabilistes dans le cas où ces dernières rentreraient des
contraintes de base de sondage. Mais la représentativité de la
population reste douteuse.

Exemple:

Professeur : El Houcine El Bouchibti


[email protected]
Professeur : El Houcine El Bouchibti
[email protected]
Professeur : El Houcine El Bouchibti
[email protected]
Professeur : El Houcine El Bouchibti
[email protected]
III-Détermination de la taille de l’échantillon
A fin de déterminer la taille de l’échantillon, nous utilisons l’inégalité
de Bienaymé Tchebycheff ou la loi normale.

1-Utilisation de l’inégalité de Bienaymé Tchebycheff


Cette inégalité n’est utilisé que si la loi de la variable aléatoire est
complètement inconnue. Elle aboutit à des échantillons de taille
élevée.
L’inégalité de Bienaymé Tchybecheff dans le cas de la moyenne
s’écrit:
σ 2
p( X − m < ε ) ≥ 1 −
nε 2
Professeur : El Houcine El Bouchibti
[email protected]
n : la ta ille d e l ' é c h a n tillo n
ε : p r é c is io n s o u h a ité e
X : m o y e n n e d e l ' é c h a n tillo n
m : m o y e n n e d e la p o p u la tio n
σ : E c a r t − ty p e d e l ' é c h a n tillo n
Pour obtenir un maximum de fiabilité dans les résultats, on
commence par se fixer une marge d’erreur " ε " que l’on accepte.
On se fixe un seuil de confiance (1 − α ) , qui représente la
probabilité minimale pour que la moyenne calculée à partir de
l’échantillon ne s’écarte pas de la moyenne de la population de plus
de " ε " .
p( X − m < ε ) ≥ 1 − α

Professeur : El Houcine El Bouchibti


[email protected]
σ 2
n=
ε ×α
2

Exemple:
Un parc de loisirs souhaite estimer à 10dh prés le montant moyen
d’achats effectués par chaque visiteur, c’est-à-dire on se fixe une
marge d’erreur de 10 dans l’analyse des résultats: ε = 10

Une étude pilote menée sur 50 visiteurs choisis au hasard a montré


que l’écart-type des achats est: σ = 100dh
Si on se fixe un seuil de confiance 1 − α = 95%
La taille de l’échantillon est donc:
100 2
n= = 2000
10 × 0.05
2

Professeur : El Houcine El Bouchibti


[email protected]
L’inégalité de Bienaymé Tchybecheff dans le cas de la proportion
s’écrit:
pq
p ( fn − p < ε ) ≥ 1 −
nε 2

n : la ta ille d e l ' éch a n tillo n


ε : p récisio n so u h a itée
f n : p ro p o rtio n o u fréq u en ce rela tive d a n s l ' éch a n tillo n
p : p ro p o rtio n d a n s la p o p u la tio n ( q = 1 − p )

Professeur : El Houcine El Bouchibti


[email protected]
Pour obtenir un maximum de fiabilité dans les résultats, on
commence par se fixer une marge d’erreur " ε " que l’on accepte.
On se fixe un seuil de confiance (1 − α ) , qui représente la
probabilité minimale pour que la fréquence calculée à partir de
l’échantillon ne s’écarte pas de la proportion de la population de plus
de " ε " .
p ( fn − p < ε ) ≥ 1 − α

Et donc
pq
n= 2
ε ×α

Professeur : El Houcine El Bouchibti


[email protected]
Exemple:
Le parc souhaite estimer la proportion des visiteurs qui font des
achats à cinq points prés, c’est-à-dire on se fixe une marge d’erreur
de 5% dans l’analyse des résultats: ε = 0.05

L’enquête pilote a estimé cette proportion à 65%, c’et à dire p=0.65


Si on se fixe un seuil de confiance 1 − α = 95% .
La taille de l’échantillon est donc:

0.65 × 0.35
n= = 1820
0.05 × 0.05
2

Professeur : El Houcine El Bouchibti


[email protected]
2-Utilisation de la loi normale
On applique cette méthode si la variable suit une loi normale ou si
elle peut être approché par la loi normale.

2.1-Taille de l’échantillon pour estimer une moyenne


a – Cas des prélèvements dans une population finie avec remise ou dans
une population infinie sans remise

Pour obtenir un maximum de fiabilité dans les résultats, on


commence par se fixer une marge d’erreur " ε " que l’on accepte.
On fixe ensuite un seuil de confiance (1 − α ) , qui représente la
probabilité minimale pour que la moyenne calculée à partir de
l’échantillon ne s’écarte pas de la moyenne de la population de plus
de " ε " . Ceci s’écrit:

Professeur : El Houcine El Bouchibti


[email protected]
p( X − m < ε ) ≥ 1 − α

ε : p r é c is io n s o u h a ité e
X : m o y e n n e d e l ' é c h a n tillo n
m : m o y e n n e d e la p o p u la tio n
On se reporte à la table de distribution da la loi normale centrée
réduite, et on cherche la valeur correspondante à une probabilité
α
égale à 1 − , cette valeur de Z sera désignée par Z α . On a
2 1−
alors: 2

σ 2
n= Z 2
α
1−
2 ε 2

Professeur : El Houcine El Bouchibti


[email protected]
Exemple:
Reprenons l’exemple du parc de loisirs qui souhaite estimer à 10 dh
prés le montant moyen d’achats effectués par chaque visiteur, c’est-
à-dire on se fixe une marge d’erreur de 10 dans l’analyse des
résultats: ε = 1 0

Une étude pilote menée sur 50 visiteurs choisis au hasard a montré


que l’écart-type des achats est: σ = 1 0 0 d h
Si on se fixe un seuil de confiance (1 − α ) = 9 5 %
La taille de l’échantillon est donc:
2
100
n = 1.96 2 2
= 384,16 = 385
10

Professeur : El Houcine El Bouchibti


[email protected]
b – Cas des prélèvements dans une population finie sans remise

E( X n ) = m
N −n σ2
V ( Xn ) = ×
N −1 n
L’écart type de la moyenne est donc:

N −n σ σ n
σX = × ≈ × 1−
N −1 n n N

Professeur : El Houcine El Bouchibti


[email protected]
De la même manière, on arrive à:

Z 2
α σ 2
N
1−
n = 2
ε N + Z
2 2
α σ 2
1−
2

Professeur : El Houcine El Bouchibti


[email protected]
2.2-Taille de l’échantillon pour estimer une proportion
Pour obtenir un maximum de fiabilité dans les résultats, on
commence par se fixer une marge d’erreur " ε " que l’on accepte.
On fixe ensuite un seuil de confiance (1 − α ) , qui représente la
probabilité minimale pour que la moyenne calculée à partir de
l’échantillon ne s’écarte pas de la moyenne de la population de plus
de " ε " . Ceci s’écrit:
p( fn − p < ε ) ≥ 1 − α
n : la ta ille d e l ' éch a n tillo n
ε : p récisio n so u h a itée
f n : p ro p o rtio n o u fréq u en ce rela tive d a n s l ' éch a n tillo n
p : p ro p o rtio n d a n s la p o p u la tio n ( q = 1 − p )

Professeur : El Houcine El Bouchibti


[email protected]
La proportion est souvent inconnue, il faut avoir des informations
antérieures ou mener une étude pilote, sinon on utilise une
proportion de 50%.
a – Cas des prélèvements dans une population finie avec remise ou dans
une population infinie sans remise

E ( f n ) = p
p q
V ( f n ) =
n
On se reporte à la table de distribution de la loi normale centrée
réduite, et on cherche la valeur correspondante à une probabilité
α
égale à 1 − , cette valeur de Z sera désignée par: Z α
2 1−
2

Professeur : El Houcine El Bouchibti


[email protected]
On a alors:
pq
n= Z 2
α
1−
2 ε 2

Exemple:
Reprenons l’exemple du parc de loisirs qui souhaite estimer la
proportion des visiteurs qui font achats à cinq points prés, c’est-à-
dire on se fixe une marge d’erreur de 5 % dans l’analyse des
résultats:
Une étude pilote a estimé cette proportion à 65 %, c’est-à-dire
p=0,65. Si se fixe un seuil de confiance 1-α=95%, on se reporte à la
table de la distribution de la loi normale, et on cherche la valeur
correspondante à une probabilité 1- α/2= 0.975 ce qui donne Z=1.96

Professeur : El Houcine El Bouchibti


[email protected]
La taille de l’échantillon est donc:

0 .6 5 × 0 .3 5
n = 1, 9 6 × 2
2
= 3 4 9, 5 8 = 3 5 0
0 .0 5
b – Cas des prélèvements dans une population finie sans remise

E ( f n ) = p
N − n p q
V ( f ) = ×
N − 1
n
n

Professeur : El Houcine El Bouchibti


[email protected]
La taille de l’échantillon est donc:
2
Z α pqN
1−
n = 2
ε N + Z
2 2
α pq
1−
2

Professeur : El Houcine El Bouchibti


[email protected]
Exemple
Un enfant a réalisé 4040 lancers d’une pièce de monnaie, et il a
obtenu 2048 fois le résultat « Pile ».
Est-ce que cette pièce est équilibrée?
Réponse
La variable X sui une loi binomiale de paramètres n et p avec n=4040
et p=0.5.

L’intervalle de fluctuation, au seuil de 95% , pour une loi binomiale


 1 1 
de paramètres : n>25 et 0.2<p<0.8 est  p − , p + 
 n n 

Professeur : El Houcine El Bouchibti


[email protected]
Pour l’échantillon considéré, on obtient l’intervalle

 1 1 
I =  0.5 − ; 0.5 +  = [ 0.4843; 05157 ]
 4040 4040 

La fréquence observée dans l’échantillon est donnée par:


2048
f = ≃ 0.5096 ∈ I
4040

Donc on accepte l’hypothèse de pièce équilibrée.

Professeur : El Houcine El Bouchibti


[email protected]
IV-Distribution d’échantillonnage
La notion de distribution d’échantillonnage est la base des méthodes
d’inférence statistique dont les deux principales applications sont
les problèmes d’estimation et les testes d’hypothèses.

Les problèmes d’estimation ont but d’estimer, à partir d’un


échantillon, la valeur numérique d’un ou de plusieurs paramètres de
la population, et de déterminer la précision de cette ou des
estimations.

Les principales distributions d’échantillonnage sont la distribution


d’échantillonnage de la moyenne, de la variance et de la proportion.

Professeur : El Houcine El Bouchibti


[email protected]
A tout paramètre de la population θ, on peut associer une série
infinie de valeurs observées t, t’, t’’…, calculées à partir
d’échantillons successifs de même effectif (taille), prélevés dans des
conditions identiques.

Ces valeurs peuvent être considérées comme des valeurs observées


d’une même variable aléatoire T, et cette variable est une fonction
de différentes variables aléatoires correspondant à chacun des
individus de l’échantillon:

T = f ( X 1 , X 2 , ..., X n )

En supposant que l’échantillon est aléatoire simple, la variable


aléatoire T possède une distribution de probabilité, dite distribution
d’échantillonnage.
Professeur : El Houcine El Bouchibti
[email protected]
La distribution d’échantillonnage est donc la distribution des
différentes valeurs que peut prendre la variable aléatoire T, pour les
différents échantillons possibles. Son écart type σ T est appelé
erreur standard.
1-Distribution d’échantillonnage de la moyenne
Supposons que dans une population infinie quelconque, on ait
prélevé au hasard un premier échantillon de n observations:
x1 , x 2 , ..., x n
Et qu’on ait calculé la moyenne: n

∑ xi
x = i=1

n
Professeur : El Houcine El Bouchibti
[email protected]
Si on prélève, dans les mêmes conditions, un deuxième échantillon
de même effectif
x '1 , x ' 2 , . . . , x ' n
La moyenne correspondante n

∑ x 'i
x'= i =1

n
sera généralement différente de la première observée.
Les moyennes observées x , x ' , . . . sont alors des valeurs
observées d’une même variable aléatoire
n

∑ X i
X = i =1

Professeur : El Houcine El Bouchibti


[email protected]
On démontre alors:
E(X ) = m
σ 2
V (X ) =
n

σ
σX = est appelé erreur standard de la moyenne d’un échantillon
n
aléatoire et simple.

Dans le ca d’une population finie d’effectif N, au sein de laquelle est


prélevé, sans remise, un échantillon aléatoire et simple d’effectif n,
l’erreur standard est:
σ N −n
σX = ×
n N −1

Professeur : El Houcine El Bouchibti


[email protected]
Professeur : El Houcine El Bouchibti
[email protected]
2-Distribution d’échantillonnage de la proportion
Supposons que dans une population infinie quelconque, on prélève
un échantillon aléatoire et simple d’effectif n, on désigne par x le
nombre d’individus possédant, dans l’échantillon, le caractère étudié
Xn
fn = est la fréquence ou proportion des individus possédant le
n

caractère étudié.
Comme dans le cas de la moyenne on peut définir une variable
Xn
aléatoire Fn =
n

On peut démontrer que:

Professeur : El Houcine El Bouchibti


[email protected]
E ( Fn ) = p
pq
V ( Fn ) =
n
pq
σ Fn = est l’erreur standard de la proportion d’un
n
échantillon aléatoire et simple.
Dans le cas d’une population finie d’effectif N, au sein de laquelle est
prélevé, sans remise, un échantillon aléatoire et simple d’effectif n,
l’erreur standard est:
pq N −n
σF = ×
n
n N −1

Professeur : El Houcine El Bouchibti


[email protected]
Professeur : El Houcine El Bouchibti
[email protected]
Estimation

Professeur : El Houcine El Bouchibti


[email protected]
Les premiers problèmes d’inférence statistique auxquels s’applique
la théorie des distributions d’échantillonnage sont les problèmes
d’estimations. Le but poursuivi est d’estimer, à partir d’un
échantillon, la ou les valeurs numériques d’un ou de plusieurs
paramètres de la population considérée et de déterminer la
précision de cette ou de ces estimations.

On distingue deux formes d’estimations: l’estimation ponctuelle et


l’estimation par intervalle de confiance.

Professeur : El Houcine El Bouchibti


[email protected]
A partir des données de la population-mère, la théorie de
l’échantillonnage permet de déduire des résultats au sujet des
échantillons extraits de la population. Le problème de l’estimation est
le problème inverse.

A partir de données ( moyenne, variance, écart-type…) d’échantillons


représentatifs, on va induire des résultats pour la population mère.
D’un point de vue utilitaire, ce dernier problème est plus important
que le problème contraire, car devant la difficulté de recourir à des
recensements, le seul moyen dont dispose le statisticien pour
connaître les paramètres d’une population réside en l’estimation de
ceux-ci à partir d’échantillons significatifs de la population.

Professeur : El Houcine El Bouchibti


[email protected]
I-Estimation ponctuelle des paramètres.
1-Définition
L’estimation ponctuelle ou l’estimation de point d’un paramètre est la
connaissance de la seule valeur estimée de ce paramètre. Les
paramètres les plus recherchés sont la moyenne, la variance et la
proportion.

2-Estimateur
Soit une variable aléatoire X dont la loi de probabilité est caractérisée
par la densité de probabilité f ( x, θ ) , laquelle dépend d’un
paramètre θ à estimer. Soient x1 , x 2 , ..., x n les valeurs prises
par X dans un échantillon taille n.

Professeur : El Houcine El Bouchibti


[email protected]
On appelle estimateur Tn de θ , la fonction qui aux variables de
l’échantillon fait correspondre la valeur du paramètre θ :

Tn ( x1 , x2 ,..., xn ) = θ

La fonction Tn est une fonction numérique d’un échantillon aléatoire.


C’est donc une variable aléatoire.

3-Estimateur sans biais


Un estimateur Tn est dit sans biais, si l’espérance mathématique de
l’estimateur est égale à la vraie valeur du paramètre θ à estimer

E (Tn ) = θ

Professeur : El Houcine El Bouchibti


[email protected]
Un estimateur Tn est dit asymptotiquement sans biais, si:

lim E (Tn ) = θ
n →∞

4-Estimateur à variance minimum


Si on considère tous les estimateurs possibles dont les distributions
d’échantillonnage ont la même moyenne, l’estimateur le meilleur est
celui dont la variance est minimum à effectif égal de l’échantillon.

5- Inégalité de Cramer-Rao.
La variance de Tn possède une borne inférieure
1
V a r (T n ) ≥
I (θ )
Professeur : El Houcine El Bouchibti
[email protected]
Où I (θ) est la quantité d’information:

  ∂Log f ( x , θ )  2 
I (θ ) = n.E    
  ∂θ  
6-Estimateur efficace

Un estimateur Tn est dit efficace si:

1
Var (T ) =
I (θ )
Où I (θ) est la quantité d’information.

Professeur : El Houcine El Bouchibti


[email protected]
7- Construction d’un estimateur par la méthode du
maximum de vraisemblance
Considérons une variable aléatoire X qui suit une loi de probabilité
définie par sa densité de probabilité f ( x, θ ) , où θ est un paramètre
inconnu à estimer. On tire un échantillon au hasard de n valeurs de X:
x1 , x 2 , ..., x n
La fonction de vraisemblance de X est:
L ( x1 , x2 ,..., xn ) = f ( x1 , θ ) . f ( x2 , θ ) ... f ( xn , θ )
La valeur θɵ qui rend maximum la vraisemblance L est ainsi solution
de l’équation:
∂L og (L )
= 0 ⇒ θɵ
∂θ
Professeur : El Houcine El Bouchibti
[email protected]
Exercice:
On admet que la durée de vie d’un matériel est une variable aléatoire
suivant une loi continue de densité:
1 − at
f (t ) = e , t ≥ 0, a > 0,
a

a étant un paramètre inconnu que l’on veut estimer à l’aide


d’observations indépendantes: t 1 , t 2 , . . . . , t n .
1) Calculer E(T) et V(T).
2) Quelle est la borne inférieure de la variance de toute estimation
ponctuelle de a?
3) Montrer que l’estimation efficace de a est:

Professeur : El Houcine El Bouchibti


[email protected]
n

∑ t i
aɵ = i = 1

4) Retrouvez le résultat par la méthode du maximum de


vraisemblance.

Réponse:
1) l’espérance mathématique de la variable aléatoire considérée est
par définition:
+∞ +∞ t − at
E (T ) = ∫ 0
tf ( t ) d t = ∫ 0 a
e dt = a

Professeur : El Houcine El Bouchibti


[email protected]
La variance est par définition égale au moment simple du second
ordre, diminué du carré du moment simple du premier ordre:
+∞
V (T ) = ∫ 0
t 2 f ( t ) d t − ( E ( T )) 2
+∞t 2 − at
= ∫ e dt − a 2
0 a
= 2a2 − a2
= a2

2) Désignons par aɵ une estimation ponctuelle de a. nous savons que


l’inégalité de Cramer-Rao, donne une bonne inférieure de la variance
de l’estimateur: 1
ɵ
Var (a ) ≥ ,
I (a )
Professeur : El Houcine El Bouchibti
[email protected]
Où I(a) est la quantité d’information, définie par:

  ∂ L og f ( t , a )  2 
I ( a ) = n .E    
  ∂a  
Calculons I(a).
t
1 −
f (t, a ) = e a
a
t
L o g ( f (t, a )) = − − L o g (a )
a
∂ L o g ( f (t, a )) t 1 t − a
= − =
∂ a a 2
a a 2
 ∂ L o g ( f (t, a ))  (t − a )
2 2

  =
∂ a a 4

Professeur : El Houcine El Bouchibti


[email protected]
Prenons l’espérance mathématique:

 (T − a ) 
( )
2
1
 = 4 E (T − a )
2
E 
 a 4
 a
 
= 4  E (T 2 ) − 2 a E ( T
1
)+ a 2 
a
= 4 ( 2 a 2 − 2 a .a + a 2 )
1
a
1
= 2
a

Par suite:
n
I (a ) = 2
a
Professeur : El Houcine El Bouchibti
[email protected]
La borne inférieure de la variance de l’estimateur est ainsi:

2
1 a
V a r ( aɵ ) ≥ = .
I (a ) n

3) l’estimateur aɵ sera un estimateur efficace de a quand la variance de


l’estimateur sera égale à l’inverse de la quantité d’information:
2
1 a
V a r ( aɵ ) = =
I (a ) n
Pour que la quantité n

∑ ti
i=1
= aɵ
n
Professeur : El Houcine El Bouchibti
[email protected]
 n

Il faut montrer que:  ∑ t i 
a 2
Var  i =1
 =
 n  n
Nous avons  
 
1 1
2
Var ( t1 + t2 + ... + tn ) = 2 Var ( t1 ) +Var ( t2 ) + ... + Var ( tn ) 
n n
= 2 ( a + a + ... + a )
1 2 2 2

n
= 2 ( na2 )
1
n
2
a
=
n
Professeur : El Houcine El Bouchibti
[email protected]
4) Construisons l’estimateur de a par la méthode de vraisemblance.

La fonction de vraisemblance L de la variable aléatoire est:

L ( t1 , t 2 , ...., t n , a ) = f ( t1 , a ) . f ( t 2 , a ) ..... f ( t n , a )
t t t
1 − a1 1 − a2 1 − an
= e . e .............. e
a a a
 n 


∑ ti 

i =1
− 
 a 
1  
= n e  
a
Professeur : El Houcine El Bouchibti
[email protected]
Prenons le logarithme de L: n

∑ ti
Log (L ) = − i =1
− n L o g (a )
a

Dérivons cette quantité par rapport au paramètre a à estimer:


n n

∂Log (L ) ∑ ti
n ∑ (t i − na )
= i =1
− = i =1

∂a a2 a a2
La vraisemblance est maximale si:

Professeur : El Houcine El Bouchibti


[email protected]
n

∂ L o g (L ) ∑ (t i − na )
= 0 ⇒ i=1
= 0
∂a a 2

n
⇒ ∑i=1
t i − n aɵ = 0
n

∑ ti
⇒ aɵ = i=1

Professeur : El Houcine El Bouchibti


[email protected]
II-Estimation par intervalle de confiance.
1-Définition
Estimer un paramètre θ par un intervalle [a; b] contenant θ , avec
une certaine probabilité 1 − α, constitue une estimation par intervalle
de confiance:

p {θ ∈ [ a ; b ]} = 1 − α

le nombre 1 − α s’appelle le coefficient de confiance.

Professeur : El Houcine El Bouchibti


[email protected]
2-Estimation d’une proportion
Considérons une population dans laquelle une proportion p,
inconnue, des individus possèdent un caractère A. Dans un sondage
significatif de taille n, le caractère A est observé avec la fréquence f n

Si n est assez grand (n>30) ou si le caractère A suit une loi normale, on


sait que (cf. distribution d’ échantillonnage) la loi de probabilité de f n
 pq 
est une loi normale N  p,  .
 n 
 

Professeur : El Houcine El Bouchibti


[email protected]
Si on s’intéresse à la proportion p, l’estimation par intervalle de
confiance consiste à déterminer de part et d’autre de l’estimateur
Les bornes p 1 et p 2 d’un intervalle qui a un niveau de confiance Fn
1−α de contenir p.

p ( p1 ≤ p ≤ p 2 ) = 1 − α
Ou d’autre façon:
α
p ( p < p1 ) = p ( p > p2 ) =
2
Les limites de confiance peuvent être écrites:

p1 = f n − d 1 et p2 = fn − d 2

Professeur : El Houcine El Bouchibti


[email protected]
On peut écrire:
α
p ( p < f n − d1 ) = p ( p > f n + d 2 ) =
2
α
p ( f n − p > d1 ) = p ( p − f n > d 2 ) =
2
Comme, la distribution de la proportion suit une loi normale
 pq 
N  p ,  à condition que la taille de l’échantillon soit
 n 
Supérieure ou égale à 30 et le produit n . p ≥ 5, on peut écrire:

Professeur : El Houcine El Bouchibti


[email protected]
   
 f − p d   p − f d 
p  n
> 1  = p  n
> 2 
 p q p q   p q p q 
   
 n n   n n 
   
 d   d  α
p  Z 1 > 1  = p  Z 2 > 2  =
 p q   p q  2
   
 n   n 
   
 d   d  α
p  Z 1 < 1  = p  Z 2 < 2  = 1 −
 p q   p q  2
   
 n   n 
d 1 d
= 2
= Z α
p q p q 1−
2

n n

Professeur : El Houcine El Bouchibti


[email protected]
Il en résulte:
pq
d1 = d 2 = Z α
1− n
2

Les limites de confiances sont donc:


p(1− p) p(1− p)
p1 = fn −Z α
et p2 = fn + Z α
1− 1− 2
2
2 2
On notera l’intervalle de confiance:

 p (1 − p ) p (1 − p ) 
 f n − Z1− α ; fn + Z α
1−

 2 n 2 n 

Professeur : El Houcine El Bouchibti


[email protected]
Exemple:
On étudie le pourcentage d’utilisation d’une machine. 400
observations ont été effectuées qui ont donné le résultat suivant:

Machine marche: 320 observations.


machine arrêtée: 80 observations.

L’estimation ponctuelle de la proportion d’utilisation de la machine


est:
320
p = fn = = 0.8
400

Professeur : El Houcine El Bouchibti


[email protected]
Le taux d’utilisation de la machine est estimé à 80%.

L’intervalle de confiance de la proportion à niveau de confiance de 95


% est défini par:
 p (1 − p ) p (1 − p ) 
 f n − Z1− α ; fn + Z α
1−

 2 n 2 n 
La valeur de Z 1 − α = Z 0 ,9 7 5 = 1, 9 6 .
2

L’intervalle de [76%; 84%] a une probabilité de 95% de contenir de vrai


taux d’utilisation de la machine.

Professeur : El Houcine El Bouchibti


[email protected]
2-Estimation d’une moyenne
Si on s’intéresse à la moyenne inconnue m d’une population normale
d’écart type connu σ , l’estimation par intervalle de confiance
consiste à déterminer de part et d’autre part de l’estimateur X les
bornes X 1 et X 2 d’un intervalle qui a un niveau de confiance de
1 − α de contenir m.

Nous avons:
p (X 1 ≤ m ≤ X 2 )= 1 − α

Ou d’une autre façon:


α
p ( m < X 1 ) = p ( m > X 2 ) =
2

Professeur : El Houcine El Bouchibti


[email protected]
Les limites de confiance peuvent être écrites

σ σ
X 1 = X − Z α et X 2 = X + Z α
1− n 1− n
2 2

L’intervalle de confiance pour la moyenne est:

 σ σ 
 X − Z1− α ;X +Z α


 2 n 1
2 n

Professeur : El Houcine El Bouchibti


[email protected]
Exemple:
On veut estimer la moyenne m d’une variable aléatoire X suit une loi
normale, de variance connue σ 2
= 6, 25
A l’aide d’un échantillon de taille n=100 valeurs indépendantes. La
moyenne X observé est 4,3.
Construire un intervalle de confiance au seuil de confiance de 95%.
Réponse:
Un intervalle de confiance au seuil de 95% est de la forme:
 6, 25 6, 25 
4,3 − Z 0 ,9 7 5 × ; 4,3 + Z 0 ,9 7 5 × 
 100 100 
 6, 25 6, 25 
 4 , 3 − 1, 9 6 × ; 4 , 3 + 1, 9 6 × 
 100 100 
[3 , 8 1; 4 , 7 9 ]
Professeur : El Houcine El Bouchibti
[email protected]

Vous aimerez peut-être aussi