0% ont trouvé ce document utile (0 vote)
26 vues14 pages

Cours Stat de Gestion

Stats courses

Transféré par

youcefsimwa
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
26 vues14 pages

Cours Stat de Gestion

Stats courses

Transféré par

youcefsimwa
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

ECOLE DES HAUTES ETUDES COMMERCIALES

Module : Statistique de Gestion


Niveau : 1ère année Master TC
Année académique : 2024/2025
Enseignante : Dr MEGHARI BENADDA Randa

3ème Unité : Estimation

I. Introduction
II. Terminologie
III. Estimation et estimateur
Contenu IV. Types d’estimation

 Exercices d’application
Séries d’exercices

1 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
De manière générale, l’inférence statistique est l’étude des conclusions que l’on peut
tirer d’un échantillon issu d’une population, ainsi que leur degré de précision. Pour que ces
conclusions soient valables et fiables, il faut que l’échantillon choisi soit représentatif de la
population mère. Cela signifie qu’il doit être prélevé d’une manière aléatoire, c’est-à-dire que
tous les éléments de la population ont la même probabilité d’être choisis.

La théorie de la distribution d’échantillonnage trouve, un terrain d’application, les


problèmes d’estimation. A partir des valeurs observées dans un échantillon de taille n, on
cherche à avoir une idée sur la valeur d’un paramètre inconnu d’une population de taille N,
c’est pourquoi la question de précision se pose alors.

Le problème de l'estimation est de déduire des informations numériques sur la


population (paramètres) à partir des informations données par l'échantillon (statistiques). Il
est clair que lorsqu'on fait un sondage, on ne peut aboutir à une connaissance parfaite des
paramètres de la population.

I. Terminologie :

Terme Définition
Une estimation est une valeur particulière prise par un
Estimation estimateur.

Statistique définie à partir d’un échantillon (fonction des


Estimateur Xi de l’échantillon) qui permet d’estimer un paramètre.

La valeur de l’estimateur calculée à partir de l’échantillon


Estimation ponctuelle spécifique qui a été observé.

Au lieu d’estimer le paramètre par une seule valeur, on


préfèrera construire un intervalle de valeurs pour celui-ci.
Estimation par intervalle On pourra ainsi fixer un niveau de confiance à notre
de confiance estimation et déterminer le degré de précision ou la marge
d’erreur qui lui est associée.

Intervalle qui permet de définir une marge d'erreur entre


Intervalle de confiance les résultats d'un sondage et un relevé de la population.

Valeur ajoutée ou soustraite à l’estimation ponctuelle pour


Marge d’erreur construire l’intervalle de confiance d’un paramètre de la
population.

désigne un écart entre la valeur d’un paramètre et la


Biais valeur estimée de ce paramètre.

2 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
II. Estimation et estimateur :

1. Définitions :

 L’estimation est le procédé par lequel on détermine les valeurs inconnues des paramètres
de la population à partir des données de l’échantillon. Pour cela, on utilise des
distributions théoriques, c’est à dire des variables aléatoires dont on connait les lois de
probabilité.

 Un estimateur est une statistique permettant d'évaluer un paramètre inconnu relatif à une
loi de probabilité (comme son espérance ou sa variance). Il peut par exemple servir à
estimer certaines caractéristiques d'une population totale à partir de données obtenues sur
un échantillon.

Soient 𝑋1, X2,…, Xi...Xn, n réalisations indépendantes de la variable aléatoire X. On a


à estimer une caractéristique H dans la population et l’on dispose d’un échantillon de valeurs
x1, x2,…, xi,….xn.
H est un paramètre associé à la loi de probabilité suivie par X, l’estimateur du
paramètre H est une variable aléatoire, noté 𝜃 ; 𝜃 = 𝑓(x1, x2,…, xi,….xn). Cet estimateur
admet une espérance E (𝜃) et une variance V (𝜃).

2. Propriétés d’un estimateur :

Un estimateur doit posséder certaines qualités ou propriétés afin de fournir une bonne
estimation. Cet estimateur doit être sans biais, efficace et convergent.

A. Estimateur sans biais :

On dit que 𝜃 est un estimateur sans biais de H si : E (𝜃)= H

Le biais est la différence moyenne entre la valeur de l’estimateur et celle du paramètre


est égale à 0. Par conséquent, le biais doit être égal à 0 pour avoir un bon estimateur.

B (𝜃) = B (𝜃- H) = B (𝜃) – B(H) = B (𝜃) – H = 0

3 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
B. Estimateur convergent (robuste) :

L’estimateur 𝜃 doit tendre vers la valeur réelle du paramètre H lorsque le nombre


d’individus étudiés augmente. On dit que l’estimateur 𝜃 est convergent, si la limite, lorsque n
tend vers N, la variance de 𝜃 = 0

Lim V (𝜃 ) = 0
n  N

C. Variance d’un estimateur :


L’estimateur le plus efficace est celui qui a la variance la plus faible par rapport aux
variances des autres estimateurs sans biais.
V (𝜃) = E [ 𝜃- E(𝜃) ] 2

III. Types d’estimations :

A. Estimation ponctuelle :

Cette technique consiste à estimer un paramètre H de la population à l’aide d’un seul


nombre déduit des résultats de l’échantillon, ce nombre est appelé estimateur ponctuel. Les
estimations ponctuelles ne fournissent aucune information concernant la précision des
estimations. En d’autres termes, elles ne tiennent pas compte de l’erreur possible dans
l’estimation, erreur attribuable aux fluctuations d’échantillonnage.

La valeur de l’estimateur 𝜃 obtenue pour un échantillon précis de la population mère


est appelée estimation ponctuelle, au tour de cette valeur estimée sera construit un intervalle
de confiance.

1. Estimation ponctuelle de la moyenne m :

L’estimateur retenu pour estimer m est X .


H : m et 𝜃 : X

4 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
De cette démonstration, nous déduisons le théorème suivant :

Grandeurs Tirage non exhaustif Tirage exhaustif

Espérance E ( X) = m E ( X) = m

2   N n
2
Variance V ( X) = V ( X) =
n  
n  N 1 

2. Estimation ponctuelle de la variance σ2 :

S2 est un estimateur biaisé de σ2 car E (S2) ≠ σ2


L’estimateur retenu pour estimer σ2 est S`2 car E (S`2) = σ2
Il aurait fallu corriger le S2 (la variance de l’échantillon) par S`2

n
Avec S`2 = . S2
n 1
Tirage non exhaustif Tirage exhaustif
Espérance E ( X) = m E ( X) = m

Variance S2 S2  N n 
*
V ( X) = *
V ( X) =  
n 1 n 1  N 

Exercice d’application N° 01:


On reçoit 100 machines en panne dans un atelier de réparation, on en répare 10 au hasard,
sachant que le temps moyen de réparation d’une machine est de 85 minutes avec un écart type
de 15 minutes.
 A combien estime-t-on le temps moyen de réparation de 100 machines ?
 Estimer la variance de la variable aléatoire moyenne d’échantillons de n=10 ?

Solution :
N = 100
n = 10
𝑿 = 85
S = 15

5 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
m est estimée par 𝑋 = 85

𝒏
𝑵
> 0.05 ⇒ Echantillonnage exhaustif

V(X) = ×

V ∗ (X) = × = 22,5

3. Estimation ponctuelle de la proportion P :

Soit une population dans laquelle une proportion p des individus présente une certaine
propriété. Si X est le nombre d’individu présentant la propriété dans un échantillon de taille n.
pour n observations, nous avons : B (n,p) avec E(X) = np et V(X) = npq.

Nous pouvons trouver k au lieu X pour définir le nombre d’unités statistiques qui
portent le caractère étudié.

L’estimateur retenu pour estimer P est f

Grandeurs Tirage non exhaustif Tirage exhaustif


Espérance

Variance

f (1  f ) f (1  f )  N  n 
V*(fn) = V*(fn) =  
n 1 n 1  N 

6 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
Exercice d’application N° 02:
Le directeur commercial d’une entreprise a effectué un sondage sur un échantillon de 100
clients pris au hasard. Il a constaté que 12 clients règlent leurs achats par chèque.
 Estimer la proportion clients qui règlent leurs achats par chèque et calculer sa variance ?.

Solution :
X = 12
n = 100

P est estimée par f et f = = = 0.12

( )
V(f)=

( )
V ∗ (f)= = 0,001

B. Estimation par intervalle de confiance :

Au lieu d’estimer un paramètre à l’aide d’une valeur ponctuelle, il arrive fréquemment


que l’on fasse l’estimation en construisant un intervalle de valeurs, appelé intervalle de
confiance. Il est défini de telle sorte que l’on puisse affirmer avec un degré de confiance fixé
que le paramètre visé se trouve à l’intérieur de cet intervalle.
L’estimation par intervalle d’un paramètre inconnu H consiste à calculer à partir d’un
estimateur 𝜃 retenu, un intervalle dans lequel, on a un pourcentage de chance d’y trouver la
valeur correspondante au paramètre H. L’intervalle de confiance est défini par deux limites
auxquelles est associée une certaine probabilité de contenir la vraie valeur du paramètre H.

P (LI < H < LS) = 1 - 

LI: Limite inférieure de l’intervalle de confiance.


LS: Limite supérieure de l’intervalle de confiance.
 : Risque d’erreur accepté.
1- : La probabilité associée à l’intervalle d’encadrer la vraie valeur du paramètre, c’est le
niveau de confiance. L’intervalle est d’autant plus grand que la précision est faible.

L’estimation a pour but, à partir d’échantillons, de donner des valeurs numériques aux
paramètres de la population dont ces échantillons sont issus. Il peut s’agir d’estimation
ponctuelle ou d’estimation par intervalle.

7 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
Un intervalle de confiance au seuil α, pour le paramètre p0, est un intervalle qui
contient p0 avec une confiance de 1−α, cela veut dire que pour un grand nombre n
d’échantillons environ n*α des Iα ne contiennent pas p0 (en effet les intervalles de confiance
Iα dépendent de l’échantillon) Remarques Le seuil de risque α est toujours petit (α<0.1) : si on
vous demande un intervalle de confiance à 95%, cela veut dire que le seuil de risque est
α=0.05.
L’estimation d’une valeur par un intervalle de confiance comporte un risque, celui de
situer la valeur dans un intervalle où elle ne se trouve pas (c’est α qui détermine le risque
d’erreur). Plus on demande un risque faible et plus l’intervalle de confiance est grand.

1. Estimation de la moyenne par intervalle de confiance :

X → N (m,)

X → N (m,  ) X

p (- t/2< T < t/2) = 1 - 

Supposant que le tirage est non exhaustif avec remise, en effet :

X m X m
P(
 < t) = 1- P(-t <

< t) = 1-
n n

Par la suite, on pourra dégager un intervalle de confiance pour estimer la moyenne m


de sorte que :

p ( X - t/2 < m < X + t/2 ) = 1 - 


X X

D’où m [ X - t X , X + t X ]

La valeur X est calculée/estimée en fonction du type de tirage effectué.

Nous distinguons trois cas de figure possibles, à savoir :


 Dès que la taille de l’échantillon n dépasse 30, X suit la loi normale de moyenne m
et d’écart type X , la variable t suivra une loi normale N(0,1).

8 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
 n<30,  inconnu estimé, X→ N (m,) alors X suit une loi normale N (m,  X ), la
variable t suivra la loi Student Fisher à (n-1) degré de liberté.

 n<30,  inconnu estimé, X suit une loi quelconque alors X suit une loi normale N
(m,  X ), la variable t est calculée par l’égalité de BT (1- = 1 - )

Exercice d’application N° 03:

Un attaché de recherche commerciale a recueilli des données concernant 100 parmi 400
clients qui se sont rendus à son magasin.
Les 100 clients sélectionnés ont dépensé en moyenne 24,57 UM avec un écart type de 6,60
UM.
 Calculer l’écart type de la variable aléatoire moyenne d’échantillons de n=100 ?
 Etablir un intervalle de confiance au seuil de 95% pour estimer le montant moyen des
achats ?

Solution :

N= 400
n = 100
X = 24,57
S = 6,60

𝒏
𝑵
> 0.05 ⇒ Echantillonnage exhaustif

V(X) = ×

V ∗ (X) = × = 0.33

𝜎 = √0.33 = 0,57

p ( X - t/2 < m < X + t/2 ) = 1 - 


X X

n > 30  t N(0,1)  𝛼 = 0,05 , t sur la table de la loi normale N(0,1) = 1,96

P ( 23,45 < m < 25,68) = 0,95

9 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
2. Estimation de (m1-m2) par intervalle de confiance :

Il arrive que l’on ait besoin d’estimer non pas la moyenne d’une variable X mais la
différence de deux moyennes de la variable X dans deux populations différentes. L’estimateur

retenu pour estimer la différence de deux moyennes m1-m2 est : X 1- X 2

P (( X 1- X 2) - t/2 X 1- X 2<m1-m2< ( X 1- X 2) + t/2 X 1- X 2 ) = 1 - 

Nous distinguons trois cas de figure possibles pour le t, à savoir :

 Dès que la taille de deux échantillons n dépasse 30 (n1 > 30 , n2> 30), la variable t
suivra une loi normale N(0,1).

 n1<30 , n2<30, 1et 2 inconnus estimés , X → N (m,), la variable t suivra une loi
Student Fisher à (n1+ n2 – 2) degré de liberté ddl.

 n1<30 , n2<30, 1et 2 inconnus estimés, X suit une loi quelconque, le t est calculé par
l’égalité de BT.

Exercice d’application N° 04:

Sur un échantillon de 10 lampes d’une marque donnée, on a observé une durée de vie
moyenne de 4600 heures avec un écart type de 200 heures.
Sur un échantillon de 08 lampes d’une autre marque, on a observé une durée de vie moyenne
de 4000 heures avec un écart type de 250 heures.

 Etablir un intervalle de confiance au seuil de 90% pour estimer la différence des durées de
vie moyennes des lampes ?
Solution :

n = 10

X = 4600 h

S = 200 h

n = 08

X = 4000 h

S = 250 h

P (( X 1- X 2) - t/2 X 1- X 2<m1-m2< ( X 1- X 2) + t/2 X 1- X 2 ) = 1 - 


10 Statistique de gestion – 3ème Unité
Dr MEGHARI BENADDA - EHEC
𝐍𝟏 = ? 2 populations infinies ⇒ Echantillonnage non exhaustif
𝐍𝟐 = ?

E(X ) - E(X ) = m - m = 600


𝜎 𝟏 𝟐
= 𝑉(𝑋 ) + 𝑉(𝑋 ) = +

𝜎 𝟏 𝟐
= + = 115,64

n1<30 , n2<30, 1et 2 inconnus estimés , X → N (m,), la variable t sera lue sur la table
Student Fisher à (n1+ n2 – 2) degré de liberté ddl.

𝛼 = 0,10
Ddl = n1+ n2 – 2 = 16  t = 1.746

P(398,09 < m1-m2< 801,90) = 0,90

3. Estimation de la proportion par intervalle de confiance :

On cherche à construire un intervalle de confiance pour une proportion d’individus


possédant un caractère statistique dans une population donnée.

f p
f → N( p , f ) d'où → N ( 0 , 1) (si le tirage est avec remise )
pq
n

f p
→ N ( 0 , 1) (si le tirage est sans remise)
pq  N  n 
 
n  N 1 

P ( f - t/2f< p <f + t/2ff) = 1 - 

pq pq
P ( f - t < p <f+ t ) = 1 - (si le tirage est avec remise)
n n

Si le paramètre p est inconnu, on doit l’estimer, on aura alors :

f (1  f ) f (1  f )
P ( f - t/2 < p < f + t/2 ) = 1-
n 1 n 1

11 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
f (1  f ) f (1  f )
d’où : p  [f- t/2 , f+ t/2 ]
n 1 n 1

 Dès que la taille de l’échantillon n dépasse 30, la variable t suivra une loi normale
N(0,1).

 n<30,  inconnu estimé, X → N (m,) alors, la variable t suivra une loi Student
Fisher à n-1 degré de liberté.

 n<30,  inconnu estimé, X suit une loi quelconque, la variable t est calculée par
l’égalité de BT.

Exercice d’application N° 05:

Le directeur commercial d’une entreprise a effectué un sondage sur un échantillon de 100


clients pris au hasard. Il a constaté que 12 clients règlent leurs achats par chèque.
 Estimer la proportion clients qui règlent leurs achats par chèque et calculer sa variance ?
 Etablir un intervalle de confiance au seuil de 95% pour estimer la proportion des clients
qui règlent leurs achats par chèque ?

Solution :

X = 12

n = 100

f= = = 0.12

( )
V(f)=

( )
V ∗ (f)= = 0,001

n > 30  t N(0,1)  𝛼 = 0,05 t sur la table de la loi normale N(0,1) = 1,96

f (1  f ) f (1  f )
P ( f - t/2 < p < f + t/2 ) = 1-
n 1 n 1

P (0,06 < p < 0,17) = 0.95

12 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
4. Estimation de P1-P2 par intervalle de confiance :

Il arrive souvent qu’il faille estimer non pas une proportion d’une population donnée
mais la différence de deux proportions, de deux populations différentes. L’estimateur retenu
pour estimer la différence de deux moyennes P1-P2 est :f1-f2

P( (f1-f2) - t/2f1-f2<P1-P2 < (f1-f2) + t/2f1-f2) = 1 - 

Nous distinguons trois cas de figure possibles, à savoir :

 Dès que la taille de deux échantillons dépasse 30 (n1 > 30, n2> 30), la variable t suivra
une loi normale N(0,1).

 n1<30 , n2<30, 1et 2inconnus estimés , X → N (m,), la variable t suivra une loi
Student Fisher à (n1+ n2 – 2) degré de liberté.

 n1<30, n2<30, 1et 2 inconnus estimés, X suit une loi quelconque, le t est calculé par
l’égalité de BT.

Exercice d’application N° 06:

Dans une ville A, on a observé que 40 parmi 100 hommes préfèrent une marque donnée de
cigarette.

Dans une ville B, on a constaté que 60 parmi 200 hommes préfèrent la même marque.
 Etablir un intervalle de confiance au seuil de 90% pour estimer la différence des
proportions d’hommes qui préfèrent la marque étudiée ? .

Solution :

n = 100
f = 0,40
n = 200
f = 0,30

P( (f1-f2) - t/2f1-f2<P1-P2 < (f1-f2) + t/2f1-f2) = 1 - 


𝐍𝟏 = ? 2 populations infinies ⇒ Echantillonnage non exhaustif
𝐍𝟐 = ?

13 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC
f - f = 0,40 – 0,30 = 0,10

( ) ( )
𝜎 𝟏 𝟐
= 𝑉(𝑓 ) + 𝑉(𝑓 ) = +

n > 30  t N(0,1)  𝛼 = 0,10 t sur la table de la loi normale N(0,1) = 1,64

( ) ( )
𝜎∗ 𝟏 𝟐
= 𝑉 ∗ (𝑓 ) + 𝑉 ∗ (𝑓 ) = + = 0,081

P(4,88 * 10-3 <P1-P2 < 0,19 ) = 0,90

14 Statistique de gestion – 3ème Unité


Dr MEGHARI BENADDA - EHEC

Vous aimerez peut-être aussi