Statistiqueprobabilite 1
Statistiqueprobabilite 1
INTRODUCTION GENERALE
1. OBJECTIF DU COURS
2. PREREQUIS
Pour bien affronter et comprendre ce cours de statistique, il faut
avoir une base solide en mathématiques. En effet, la statistique est une
partie des mathématiques appliquées. En plus, il faut savoir utiliser les
calculatrices scientifiques et connaître les dessins pour les graphiques,
l’informatique et l’utilisation des ordinateurs notamment le tableau MS
EXCEL et grapheur.
2
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
3. PLAN DU COURS
INTRODUCTION GENERALE
4. CONDITIONS DE REUSSITE
Régularité et participation active au cours et aux travaux pratiques
Avoir la calculatrice scientifique, les tables statistiques et les papiers
millimètres pour tracer les graphiques, avoir l’ordinateur.
Consulter régulièrement les livres de statistique et probabilités à la
bibliothèque et à l’Internet.
5. ELEMENTS DE BIBLIOGRAPHIE
Confer fichier des livres de statistique à la Bibliothèque.
3
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
i : indice
N : taille de la population.
8
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
k
n=∑ ni où ∑
i=! est le signe de sommation. Ceci signifie somme des
effectifs de toutes les classes, ou somme n i pour i allant de 1 à k n = n1
+ n2 +n3 +…+ nk,
d= X max − X min
En pratique les formules suivantes sont utilisées pour les groupements des
données en classes :
10
k =1+ log n
Le nombre de classe ou modalités 3
k est arrondi à l’unité près.
9
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
d d
a= où a=
L’amplitude de casse k−1 k
La borne inférieure ou limite de la 1ère classe est donnée par :
a
Bii1 =X min− où Bic =X min
2
Limite ou borne supérieure d’une classe C : Bsc = Bic + a
Les classes doivent être contiguës et disjointes généralement à
intervalles fermés à gauche et ouverts à droite. Ainsi borne
supérieure de la classe précédente est égale à la borne inférieure de
la classe suivante Bsc précédente = Bic suivante
Bic + B sc
Xi=
- Centre de classe 2
ni
f i=
- n
L fréquence relative : où ni = effectif de la classe i, n = la
a. Caractère qualitatif
Tableau de distribution
⋮ ⋮ ⋮ ⋮ ⋮
TOTAL n 1 100
b. Caractère quantitatif
) Variable continue
0
TOTAL N 1 10 - - - - - -
0
2. Etude simultanée de plusieurs caractères.
Il est bien évident que pour le besoin d’une étude on peut s’intéresser
simultanément à plusieurs caractères. Lorsqu’on étudie simultanément
deux caractères par exemple, on aura une combinaison de deux partitions
que l’on appelle en terme mathématique un produit de partitions. Le plus
souvent on a recourt à un tableau rectangulaire appelé tableau de
contingence ou parfois tableau de corrélation dans lequel les différentes
lignes repèrent les modalités d’une partition et les colonnes celles de
l’autre partition.
11
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
nij ni n. j nij ni n. j
f ij = , f i= , f i= f ij = f i= f j=
n n n n n n
l l l l l c l c
∑ ∑ f ij =∑ f i= ∑ f j =1 ∑ ∑ f ij =∑ f i= ∑ f j =1
i=1 j =1 i =1 j =1 i =1 j=1 i =1 j=1
12
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
⋯ ⋯
Xi ni1 n2 nij nlc nl
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
⋯ ⋯
Xl nl1 n12 nij nlc nl
⋯ ⋯
TOTAL MARGINAL n.1 n.2 n.j n.c n
COLONNE
I.7. GRAPHIQUE
Le graphique est consacré à l’étude visuelle d’informations
quantitatives ou qualitatives. Diverses méthodes de représentation sont
possibles.
A. Caractère qualitatif
ni
Xi
2. Diagramme en secteurs
3. Diagramme figuratif
B. Caractère quantitatif
ni correspond (fi ou fi %). On relie les sommets des bâtonnets pour avoir le
polygone de fréquence. La courbe lissée est tracée en main levée en
suivant l’allure générale du polygone des fréquences.
Y Log Y Log Y
16
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
X X Log X
Echelle arithmétique Echelle semi-logarithmique Echelle logarithmique
I.8. EXERCICES
Echelle arithmétique, échelle semi logarithmique, échelle logarithmique
(log-log).
TRAVAUX PRATIQUES
N°j Nombre N°j Nombre N°j Nombre N°j Nombre N°j Nombre
de de de de de
chèques chèques chèques chèques chèque
traités traités traités traités s
traités
1 1 6 0 11 1 16 1 21 2
2 1 7 1 12 3 17 0 22 1
3 0 8 2 13 3 18 3 23 4
4 2 9 1 14 2 19 1 24 2
5 5 10 4 15 0 20 2 25 0
a. Quels sont :
la population étudiée, l’échantillon, l’individu statistique, le
caractère (Variable statistique), la nature du caractère, les
modalités.
b. Complétez cette distribution statistique, interprétez.
c. Représentez l’histogramme, le polygone de fréquence et la courbe
lissée, interprétez.
d. Représentez et interprétez les ogives.
2005 200 75
2006 185 90
2008 250 85
2009 240 80
2013 250 95
Année 184 185 186 187 188 189 190 191 1920 1930 1940 1950 1960
0 0 0 0 0 0 0 0
Populatio 17,1 23,2 31,4 39,8 50,2 60,9 76,0 92 105, 122, 131, 151,1 179,
22
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
n en 7 8 7 1 3
million
12. Les notes finales sur 100 de statistique obtenus par 80 étudiants au
cours d’une année académique sont rapportées dans le tableau suivant :
88 84 75 82 68 90 62 88 76 93
73 79 88 73 68 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 75 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 91 72 63 76 75 85 77
a. Quels sont :
- La cote maximale,
- L’étendue de la série ;
Trouvez :
CHAPITRE II :
SYNTHESE STATISTIQUE PAR LES PARAMETRES OU
INDICATEURS OU VALEURS CARACTERISTIQUES
II.1. CAS DES CARACTERES QUALITATIFS
Pour chaque modalité d’un caractère donné, on observe le nombre η i
d’éléments présentant la modalité i et on calcule la fréquence f i
correspondante. La fréquence est un paramètre susceptible de
ni
f i=
caractériser chaque modalité. n
- Les moyennes ;
- Le mode (
X^ , M 0 )
* Percentiles
- La médiane ( x̄ , Me
- Les quartiles : 1er quartile Q1, 2ème quartile Q2, 3ème quartile Q3
- L’intervalle interquartile II Q
- La variance ( V ( x ) , σ ( x ) , σ , s ) )
¿ 2 2
- L’écart-type ( σ ( x ), σ , s )
- Les moments
4°.Paramètres de concentration
La médiane (Mle)
La courbe de LORENTZ inscrite dans le carré de GINI, etc.
x ! + x2 +.. . x j +. ..+ x n
x̄=
n
n
1
x̄= ∑ x j
n j=1
n x +n x +.. . ni xi + .. . nk x k ∑
n1 x1
x̄= 1 1 2 2 = i =1k
n 1 +n2 +.. . n1 +. .. n k
∑ ni
i =1
k ni k
x̄=∑ xi ⇒ x̄=∑ f i x i
i =1 n i=1
k ni k
1
x̄=∑ xi = x̄= ∑ f i x i
i =1 n n i=1
k
1
X = ∑ ni X i
n i =i
Soit une série d’observations X1, X2, … Xn. On choisit une moyenne
provisoire X0 et on pose Zi -= Xi –X0Xi = Zi +X0.
n n n n
1 1 1 1
x̄=
n
∑ xi= n
∑ ( z i + x 0 )= ∑
n i=1
zi +
n
∑ x 0= x̄=1n ∑ z i +1n nx0 ⇒ X̄ = Z̄+ x 0
i=1 i=1 i=1
n n n n
1
x̄=
n
∑ nxi =1n ∑ ni ( z i + x 0) =1n ∑ n i z i +1n ∑ ni x 0= x̄=1n ∑ nzi +1n nx 0= x̄= z̄ + x 0
i=1 i=1 i=1 i=1
x̄= z̄ + x 0
* Usage d’une variable auxiliaire avec changement d’échelle. Si X0 est une
moyenne provisoire et « a » l’amplitude de k classe toute valeur Xi k peut s’écrire
sous la forme :
( x i −x 0 )
x i =x0 +a
a
x i −x 0
z i= ⇒ x i =x 0 +aZ i
a
k k k k
1 1 1
Or x̄ = ∑ ni x i= ∑ ni ( x 0 + aZ i ) =
n i=1 n i=1 n
∑ n1 x 0 + a 1n ∑ ni Z i ⇒ X̄ =x 0 +a Z̄
i=1 i=1
- Quelques propriétés de la x̄
- Une valeur type d’une distribution doit être définie d’une manière
objective de façon qu’elle ne puisse pas laisser la place à
l’interprétation subjective.
- La valeur type doit représenter autant que possible toutes les
données de la série.
- La valeur type doit se prêter à des calculs simples.
- La valeur type doit avoir une signification concrète et aisée à
comprendre.
- La valeur type de l’échantillon représentatif doit être proche que
possible de la valeur type de la population. Elle ne doit donc pas
être sensible aux fluctuations de l’échantillonnage.
n n
⇒ n X̄−n X̄ ⇒ ∑ xi −∑ x i=0
i=1 i =1
- Série simple
√
n n
G= n√ x 1 . x 2 . .. x 1 .. . x n ⇒ G= π x i avec π signe de produit (produit allant de 1 à n )
i=1
1
G=( x ! . x 2 . .. x n ) n
1
log G=
n
[ log x 1+log x 2+. ..+log x n ]
n
1
log G= ∑ log x 1
n i=1
( )
n
1
n ∑ log x1
i=1
G=10
- Série groupée
30
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
G= √ χ 1n1 . χ n2 2 .. . χ nk
k ou
√
n
k
n
G= π χ i i
i=i
[( ]
1
log G=log
n1 n2
)
nk n
x 1 . x 2 .. . x k
1
log G= [ n log x 1+n 2 log x2 +.. . nk log x k ]
n 1
k
1
log G= ∑ n log x 1
n i=1 1
( )
k
1
∑ n log xi
2 i=1 i
G=10
Propriétés de la moyenne géométrique.
n Pn n
Pn =P0 (1+ r ) ⇒ =( 1+r )
P0
⇒
√
n Pn
P0
=1+r ⇒ r=
√ n Pn
P0
−1
√ √
n n
1 1
Q=
n
∑ x 2i Q p= ∑ p x2
p i =1 i i
- Pour une série simple : i=1
La Q pondérée
√
n
1
Q= ∑
n i=1
ni xi2
- Pour une série groupée :
n
H= n
∑ x1
- Pour une série simple : i =1 i
n n
H= k
H= k
n n
∑ xi ∑ xi
- Pour une série groupée : i =1 i i =1 i
32
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
p
H p= n pi n
∑ xi
p=∑ p i
i=1 i=1
La moyenne harmonique pondérée : avec
Solution
e e l total
V = ⇒t= V =
A…B B…A
t v t total
21 en km
V=
1 en km 1 en km
+
l1 l2 l = t1VAB
30 km/h 60 km/h
t1 t2 l = t2VBA
21
V=
1 1
+
30 km/h 60 km/h
VBA = 60 km/h
33
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
1 1
t 1= t 2=
e = v.t
30 km/h 60 km/h t = t1 + t2
2 1 1 2 2
= + V= =
Espace total =
t 30 km/h 60 km/ h 1 1
+
1
30 60 km/h ( 1 1 h
+
30 60 km) ( )
2 2 2×60
V= km/ h= km/ h= km/ h=40 km/h
2+1 3 3
60 60
X1 = VAB = 30 km/h
X2 = VBA = 60 km/h
n = 2 (données observées)
n 2 2
H= ⇒ H= = =40 km/ h
n
1 1 1 1 1
∑ X1
+
x1 x2
+
30 km/ h 60 km /h
i =1
X̄ = 45 km/h Q = ?
√
n n 2
G= π x 1 =√30×60=42 , 43 km/h
i=1
Q=
√ 1
2 √
( (30 )2 + ( 60 )2 )= 1 ( 900+3600 )=47 , 43 km/h
2
H≤G≤ X̄ ≤Q
~ ~ 5+6
X = X̄ de 5 et 6 X= =5 , 5
2
n
−n ↑inf . cl ~x
~ ~ 2 1
X =Licl { x +a ¿
n1 cl ~x
~
Licl X = limite inférieure de la classe médiane
~
a = amplitude de la classe médiane nicl x = Effectif ni de la classe
médiane
35
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
C. LE MODE OU LE DOMINANT ( X^ , M 0 )
Le mode c’est la valeur du caractère correspondant à la
fréquence maximale. Une distribution peut présenter plusieurs dominants.
On dit qu’elle est plurimodale ou multimodale. Quand c’est seulement
deux modes, on parle d’une distribution bimodale.
- Pour une série simple le mode c’est la valeur qui s’est répétée le
plus de fois.
Δ1
X^ =Licl { x^ +a ¿
- Pour une série groupée, Δ1+ Δ2
Remarques :
- Relation entre X̄ , ~
X et X^
36
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
caractéristiques X̄ , ~
X et X^ , peuvent donner une indication de l’allure de la
courbe du point de vue forme.
double inégalité : X̄ ∠ ~
X et ∠ X^ .
37
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
D. LES PERCENTILES
Le Pième percentile est la valeur du
caractère Cp tel que :
- L’ensemble des individus dont le caractère est au plus égal à Cp
représente les P% de l’effectif total.
- L’ensemble des individus dont le caractère est au moins égal à
Cp représente les (100-p)% de l’effectif total. Parmi les
percentiles nous distinguons les centiles pour lesquels p = 1,2,3,
…99 : Cp
p
nx −ni↑inf clcp
100
C P=Liclcp+ a
Formule générale n , clcp
Q3 −Q1
IIQR=
Q2 intervalle interquartile relatif
2
d) La variance et l’écart type σ ( x ) , σ ( x )
Développons :
n
1
2
V ( x ) =σ =
n
∑ ( xi − X̄ ) 2
i=1
n n n
1 1 −1 21
V x=σ 2 =
n
∑ ( x2i −2 x 1 x̄ +( x̄ ) )=
2
∑
n i=1
xi2−2 x
n
∑ x i +( x̄ ) n
∑1
i=1 i=1
1
- Pour une série groupée :
V ( x )=σ 2=
n
∑ ni ( x i − x̄ ) 2
- Développons :
39
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
k k k
1 1 1 2 1
σ = ∑ ni ( x 2i −2 x1 x̄ + ( x̄ ) )= ∑ x i x 2i −2+ X̄ ∑ ni . x i + ( X̄ ) . . ∑ ni
2 2
n i=1 n i=1 n n i=1
k
1 2 1
¿ ∑ n i x 2i −2 ( x̄ ) + ( x̄ ) = ∑ ni x 2i − ( x̄ ) ⇒ V ( X )=σ 2= X̄ 2 −( X̄ )
2 2 2
n n i=0
V ( x )=σ 2= x̄ 2 −( x̄ )2
Remarque :
l k k
21 1 1
a
n
∑ ni Z 2i +2 ax 0
n
∑ ni z i + x 20
n
∑ ni
i=1 i=1 i =1
V ( x )=σ 2= X 2− ( X̄ )2 =a2 z 2 +2 ax 0 z̄ + x 20 −[ a 2 ( z̄ )2 +2 ax 0 z̄ + x 20 ]
a 2 z 2 +2 ax 0 z̄ + x 20 −a 2 ( z̄ 2 ) −2 ax 0 z̄ −x20 ⇒ a 2 z2 −a 2 ( z̄ )2 =a2 [ z 2 −( z̄ )2 ]
40
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Quelques propriétés
68,26 % ∈ [ x̄±σ ]
95,44 % ∈ [ x̄±2 σ ]
X̄ −25 X̄ −5 X̄ X̄ +5 X̄ +25 X
88,26
95,44 %
2. L’écart-type caractérise la dispersion de la population et l’écart-
type s caractérise la dispersion de l’échantillon. On démontre en
statistique mathématique que l’estimateur s² de la variance ² est
non biaisé lorsqu’il est caractérisé par la formule suivante :
n
1
S2 = ∑ ( x − x̄ ) 2
n−1 i=1 1
Pour une série simple.
k
1
S2 = ∑ n ( X − X̄ )2
n−1 i=1 i i
Pour une série groupée
41
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
S= √ s 2
σ 2 et s2
Il existe une relation entre
n
1
σ 2= ∑ ( x − x̄ ) 2
n i=1 1
n
nσ 2 ( n−1 ) s2
nσ 2=∑ ( xi − x̄ ) =( n−1 ) s2
2
s2= σ 2=
i =1 n−1 n
k k
1
2
σ = ∑ n ( x − x̄ ) 2
n i=1 i 1
nσ =∑ ni ( X i − X̄ ) =( n−1 ) s
2 2 2
i =1
a2
σ 2c=σ 2 − ; σ c =√ σ 2c
Correction de SHEPPARD de la variance 12
3. Une faible valeur de et de s indique une forte accumulation des
observations autour de la moyenne arithmétique : une grande valeur
de ou de s indique un étalement considérable des observations
autour de la moyenne.
X̄ X̄ x
4. Dans une distribution normale très légèrement dissymétrique on a
les relations suivantes lorsque n est grand :
4 4
EAM = . S= σ
5 5
Q3 −Q1 2 2
EAM = ≈ ≈ σ
2 3 3
f. Les moments
1
mq=
n
∑ ni ( x i −x 0 ) q
Cas particuliers
1
m1 = ∑ n x = x̄
n i i i
a. Si X0 = 0 et q = 1,
1
x̄ et q =2 , m2 = ∑
n i
ni ( x i− x̄ )2 =σ 2
b. Si X0- =
c. Si X0 = x̄ ⇒ les moments centrés Mq par rapport à la moyenne
arithmétique.
1
=∑ ni ( X i− X̄ )q
Mq n i
d. Si X0 = 0, on parle de moments initiaux ou moments simples mqs.
1 1
μ0 = ∑
n i
ni ( x i− x̄ ) =1 m0 s 2= ∑ ni x 1 =1
0
n i
0
1 1
μ1 = ∑
n i
ni ( xi − x̄ ) =0 m1 s= ∑ ni x i = X̄
1
n i
1
1 1
μ2 = ∑
n i
n i ( xi − x̄ ) =σ 2 m2 s= ∑ ni x 2i = X̄ 2 ← X̄ 2
2
n i
1
µ2 =X 2 −( x̄ )
2
m3 s= ∑
n i
ni x 31= X 3 ← X̄ 3
1
µ2 =m2s −m2LS m4 s = ∑
n i
n i x 14 =X 4 ← X 4
1
μ3 = ∑
n i
3
ni ( x i− x̄ ) = m3 s −3 m1 S m2 s +2 m31 s
1
μ4 = ∑ n ( x − x̄ )4= m4 s −4 m1 S m3 s +6 m21 s m2s −3 m41 s
n i i i
μ 23 μ23 µ23
β 1= = =
μ 32 ( σ 2 )3 σ6
μ3
γ 1 =±√ β1 =
σ3
44
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
μ4 μ4 μ4
β 2= 2
= γ 2 =β 2−3= −3
μ2 σ4 σ4
A D fi %
46
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Effectif 0 3 8 18 31 51 69 84 95 99 10 0
0
Classe ]−ω,−3[ [3, 4[[−3, 4[ [ 4,11[ [11 ,18[ [18,25[ [25,32[ [32,39[
Effectif ni 0 0 2 4 7 18 13
Effectif ni 6 0 0
1. [ X̄ ±σ ]
2. [ X̄ ±1, 2σ ]
3. [ X̄ ±3 σ ]
5. Calculer les paramètres de forme :
2. SORTES D’INDICES
A. L’indice élémentaire
1. Notion
It ( X )
0
= indice de la valeur de x au temps t par rapport à la valeur de x à
Pt
I t ( P )=
0
P0
Solution
380000
L Avril . 99 ( P )= . 100=158 , 33 %
Avril . 98
240000
Interprétation :
2. Propriétés
a) L’identité
I t =1
t
b) La réversibilité
rapport à la période 0.
1
I t ( X )=
0
I0
(X)
t
Cherchons à présent
1 t
I t ( P )= =1 , 5833=
0
0 , 6315789474 I0
t
c) La transférabilité
Iu I u xlt It 3 It 3 It 2
= soit t 1 ,t 2 , t 3 = x
1 t 1 t1 t2 t1
Exemple : soit le prix d’une bouteille d’huile de palme (72 cl) au cours de 3
palme)
Solution
Iu I mars février 1 , 7 1 ,5 1 ,7
= xI = × = =1 , 4166
1 février janvier 1 , 5 1 ,2 1 , 2
%.
56
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
d. Autres propriétés
Exercice
a. Indice de quantité
élémentaires de quantité.
b. Indice de valeur
La valeur d’un bien vendu au cours d’une période (ou fabriqué ou acheté)
est égale au produit de son prix par la quantité vendue (ou achetée ou
Pt Q t
I t ( V )= ∗100
0
P 0 Q0
3 , 4×22 74 , 8
1 kg de sucre= = =1 ,1688×100=116 , 88 %
3 , 2×20 64 ,
0 ,7×31 21 ,7
500 g de sel= = =1 , 3563×100=135 ,62 %
0 ,5×32 16
6 ,5×24 156
1 seau de haricot= = =1 , 1429×100=114 ,29 %
6 ,5×21 136 ,5
2 ,5×30 7 ,5
1 seau de farine de manioc= = =0 , 9058×100=90 , 58 %
2 ,3×36 82, 8
1 , 5×218 327
72 cl d ' huile de palme= = =1 ,5571×100=155 ,71 %
1 ,×210 210
5×650 3250
1 kg de viande= = =0 , 9690×100=96 , 89 %
4 ,3×780 3354
Interprétation
At 1
( Q )= 591, 63=98 , 6 %
0 6
At 1
( V )= 709 ,67=118 ,33 %
0 6
b. Indice de moyenne géométrique
L’indice de G est constitué par la moyenne géométrique simple
de n indices élémentaires d’une grandeur x c’est-à-dire la racine nième du
produit de n indices élémentaires G.
√
n
Gt ( X ( j ) ) =n t ( X( j))
π I
En revenant à l’exemple précédent : 0 j =1 0
√
6
Gt ( X ) = ∑ I mars
( j) n 6
( p )=√ 106 ,25×140×100×108 , 69×150×116 ,28 x
0 j=1 février
G mars 6
( Q )= √110×96 ,87×114 , 29×103 , 81×83 ,33×83 , 33=97 ,85 %
février
G mars
( V )= 6√116 , 88×135 , 62×114 , 28×90 ,58×155 ,71×96 , 89=116, 30
février
√
n
Qt ( X )= 1 ∑ I 2 t ( X ( j ) )
( j)
Q mars
février
( p )=
√ 1
6
( ( 106 , 25 )2+ ( 140 )2+ ( 100 )2+ (108 ,69 )2 +( 150 )2+ (116 , 28 )2) =121 ,60 %
Q mars
février
( Q )=
√( 1
6
( 110 )2 + ( 96 , 87 )2 + ( 114 ,29 )2 + ( 83 , 33 )2 ( 103 , 81 )2 + ( 83 . 33 )2 ) =99 . 34
Q mars
février
( V )=
√[ 1
6
( 116, 88 )2 + (135 ,62 )2 + ( 114 ,29 )2 + ( 155 ,71 )2 + ( 90 , 58 )2 + ( 96 , 80 )2 ] =120 ,38
Ht = n
[ ]
0 n
1
∑ It
j=1 ( X ( i ))
0
H mars 6
( P )= =117 ,59 %
février 1 1 1 1 1 1
+ + + + +
106 ,25 140 100 108 , 69 150 116, 28
H mars 6
( Q )= =97 , 09 %
février 1 1 1 1 1 1
+ + + + +
110 96 ,87 114 ,29 83 , 33 103 , 81 83 , 33
H mars
( V )= 6 =114 , 36 %
février 1 1 1 1 1 1
+ + + + +
116 , 88 135 , 62 114 , 29 90 , 58 155 , 71 96 , 89
Prix Quantité Valeur
En effet, le prix de différents biens par exemple varie d’une période à une
autre généralement à la hausse. Cette variation n’est pas uniforme.
Indice de PAASCHE ;
Indice de LASPEYRES ;
Indice de FISHER ;
a. Indice de prix
b. Indices de quantité
n
∑ P(t j ) Q(t j )
Pt ( Q )= j=1
n
0
∑ P(t j ) Q(0j )
j=1
3. Indice de FISHER
Il est possible de combiner les effets des indices des prix et des
quantités pour déterminer l’évolution de la dépense globale en valeur
suite à la variation des prix et de quantités d’une période à une autre.
C’est l’indice
n
∑ Pt( j ) . Q(t j )
I t ( V )= j=1
n
0
∑ P (0j ) . Q(0j )
j=1
Exemple :
65
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
L1 ( P ) =
∑ Q 0 . P1 L2 ( Q ) =
∑ Q1 . P 2
1. 0 ∑ Q 0 . P0 1. 0 ∑ Q1 . P 1
( 1×0 ,7 )+ ( 4×1 ) + ( 2×1 , 5 ) + ( 4×1 , 7 ) + ( 6×5 ) + ( 10×2 ,5 )+ ( 6×6 ,5 )+ ( 8×1 ) + ( 4×3 ,8 )+ ( 12×0 , 9 )
( 1×0 ,5 )+ ( 4×0 , 9 ) + ( 2×1 , 2 ) + ( 4×1 , 3 ) + ( 6×4 ,5 )+ ( 10×2 , 3 ) + ( 6×6 , 5 ) + ( 8×0 , 9 ) + ( 4×3 , 5 ) + ( 12×0 ,75 )
P2 ( P )=
∑ Q2 . P2 =( 1×0 , 7 )+ (3×1 ) +( 2×1 , 5 ) +( 4×1 , 7 ) +( 8×2 , 5 ) +( 7×6 ,5 )+ ( 6×1 ) +( 2×3 , 8 )
1 ∑ Q2 . P1 ( 1×0 , 5 ) +( 3×0 , 9 ) +( 2×1 , 2 ) +( 4×1 , 3 ) +( 8×2 ,3 )+ ( 7×6 ,5 )+ (6×0 , 9 )+ (2×3 , 5 )
( 10×0 , 9 ) + ( 20×0 , 4 ) + ( 8×0 , 3 ) + ( 4×5 ) 132
= =1 ,09816=109 , 816 %=109 , 82 %
( 10×0 ,75 )+ ( 20×0 , 3 ) + ( 8×0 , 2 ) + ( 4×4 , 5 ) 120 ,2
L2 ( Q ) :
∑ P1 Q 2
1 ∑ P1 Q 1
L1 ( Q ) =
∑ P0 Q 1
4. 0 ∑ P0 Q 0
( 0 ,5×1 ) + ( 0 , 9×3 )+ ( 1, 2×2 )+ ( 1, 3×4 )+ ( 4 ,5×4 ) + ( 2 ,3×8 ) + ( 6 ,5×7 ) + ( 0 , 9×6 ) + ( 3 , 5×2 )
=
( 0 ,5×1 ) + ( 0 , 9×4 )+ (1 , 2×2 )+ ( 1 , 3×4 )+ ( 4 , 5×6 ) + ( 2 , 3×10 ) + ( 6 ,5×6 ) + ( 0 , 9×8 ) + ( 3 , 5×4 )
P2 ( Q )=
∑ P2 . P2 = ( 0 ,7×1 ) +( 1×3 )+ ( 1, 5×2 )+ ( 1, 7×4 ) +( 5×4 )+ (2 , 5×8 ) +( 6 , 5×7 )+ ( 1×6 )
5. 1 ∑ Q2 . P 1 ( 0 ,7×1 ) +( 1×4 ) +( 1 , 5×2 )+ (1 , 7×4 )+ ( 5×6 )+ ( 2 ,5×10 ) +( 6 , 5×6 ) +( 1×8 )
( 3 , 8×2 )+ ( 0 , 9×10 ) + ( 0 , 4×20 ) + ( 0 , 3×8 ) 132
= =0 , 8554×100=85 ,55 %
( 3 ,8×4 ) + ( 0 , 9×12 )+ ( 0 , 4×25 ) + ( 0 , 3×6 ) 154 , 3
L2 ( V ) =
∑ Q2 . P 2 =132 =0 ,945558=94 ,55 %
7. 1 ∑ P1 .Q1 139 , 6
c. Pratique des indices
1. Les indices enchaînés
Par indices enchaînés il faut entendre les indices pour lesquels la
période de base est toujours la période précédente. Les comparaisons sont
donc faites entre les valeurs d’une grandeur en pourcentage des 2
périodes successives. Ces rapports permettent de mettre en évidence les
variations d’une période à une autre.
Soient P1, P2, P3, P4… les prix correspondant à des intervalles de
temps successifs 1,2,3,4,… On aura une chaîne d’indices élémentaires.
P2 P3 P4 Pn
, , . .. .. .
P1 P2 P3 Pn−1
Prix 8 12 15 18
L’indice élémentaire d’une période donnée par rapport à une autre prise
comme base peut toujours s’exprimer en fonction des indices en chaîne
(recours à la propriété de transférabilité). Ainsi, on peut déterminer, en
référence à l’exemple précédent, l’indice de prix de l’année 2016 par
rapport à l’année 2013.
2. Changement de base
Mais une méthode plus simple consiste à diviser les indices des
différentes années ou périodes correspondantes à l’ancienne période de
référence, par les indices correspondants à la nouvelle période de
référence et exprimer les résultats en pourcentage.
EXEMPLE :
68
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
134 +125+139+143
x̄= =135 , 25 puis chqaue indice par rapport à la moyenne 135,25
4
Année 200 200 200 200 200 201 201 201 201 2014 2015 2016
5 6 7 8 9 0 1 2 3
Indice de 73,9 76,8 71,7 82,8 88,7 91,6 99,1 92,4 103 105, 105, 99,1
productio 7 7 0
n
Yt 1 −Yt 0
T=
Yt 0
EXEMPLE
262−250
T 2016 = =0 , 048=4 ,8 %
2015
250
2015 à 2016
même période l’indice du coût de la vie est passé de 100 % à 200 % c’est-
150
%=75 %
2016 représentera 2
à-dire s’il a doublé, le revenu réel en
100
∗75=75 $ en 2016 .
100
5
Indices 100 107, 106, 107, 116, 118, 119, 120, 119, 121, 125, 129,
recalculé 6 6 6 2 8 8 2 9 7 9 3
s coût de
la vie
Salaire 1,19 1,24 1,35 1,46 1,51 1,55 1,58 1,61 1,64 1,75 1,81 1,89
horaire
réel
De 2005 à 2016, le salaire apparent passe de 1,19 à 2,45 soit une hausse
En 2016, le pouvoir d’achat par rapport à 2005 est de 0,77. Cela signifie
que 1 $ en 2016 ne permet que 77 % de ce que permettait d’acheter 1 $
en 2005 en d’autres termes, 1 $ de 2016 ne vaut que 77 % de la valeur de
1 $ en 2005. Les données exprimées en fonction de la valeur du dollar à
une période déterminée sont alors dites exprimées en dollar constant par
rapport à cette période prise comme référence.
72
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Indice de Bradstreet
n
∑ x (t j )
t
B ( x )= i=1
n
0
∑ x (0j )
i=1
73
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
3. Voici les prix (en $) et les quantités vendues dans un point de vente de
19 septembre 2015 et le 26 septembre 2015.
74
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
P1 19 septembre Q1 P2 26 septembre Q2
Prix Quantité
Quantité Prix
1 kg de sucre 1,5 6 3,5 2
1 kg de riz 0,7 10 1,2 3
1 savon cristal 0,5 7 1,8 2
A paire de pile 1,2 8 2 2
Œuf/pièce 0,25 12 0,4 5
Sel 0,4 10 1,5 3
Résolution
a) Indices élémentaires
A B C D
( P ) ' I 2016 1,4 1,5 1,2 1,33
2013
1 1
A2016 = ( 1 , 4 +1 ,5+1 , 2+1 ,33 )=1 ,3575 ( 0 , 8+1 , 67+1 , 8+1 )=1 , 3175
2013
4 4
4 4
G 2016 =√ 1 , 4×1 ,5×1 ,2×1 ,33=1 ,3530 √ 0 , 8×1 , 67×1, 8×1=1 , 2452
2013
Q2016 =
2013
√ 1 (
4
[ 1 , 4 )2 + ( 1 ,5 )2 + ( 1 ,2 )2 + ( 1 ,33 )2 ]=1 , 3618
√ 1
4
[ ( 0 , 8 )2 + ( 1 , 67 )2 + ( 1, 8 )2 + ( 1 )2 ] =1 ,3846
4 4
H 2016 = =1 ,34685 =1 , 1749
1 1 1 1 1 1 1 1
2013 + + + + + +
1 , 4 1 , 5 1 ,2 1, 33 0 , 8 1, 67 1 1 ,8
H≤G≤ X̄ ≤Q
a. Indices synthétiques pondérés
100×7+15×30+50×12+200×4 5×80+20×25+10×90+3×200
L2016 = =1 , 3421 =1 ,2632
2013
100×5+15×20+50×10+200×3 5×100+20×15+10×50+3×200
80×7+25×30+90×12+200×4 7×80+30×25+12×90+4×200
P2016 = =1 , 3292 =1 , 251
2013
80×5+25×20+90×10+200×3 7×100+30×15+12×50+4×200
Prix moyen au détail du gravier 14,9 14,9 15,1 15,6 16,28 16,5
en fr/tonne 5 4 0 5 3
Résolution
15 , 65
I 2014 = ×100=104 , 68 %
2011
14 , 95
16 , 53
I 2016 = ×100=110 ,57 %
2011
14 , 95
b.
14 , 95+14 , 94+15 , 10
=15
3
Résolution
a.
b.
Prix
×100
Ainsi moyenne arithmétique : 125
1
B→ ( 6 ,15+6 , 22 )=6 , 185
b. 2
1
L→ ( 0 ,395 +0 , 389 )=0 , 392
2
1
F → ( 3 , 48+3 ,54 )=3 , 51
2
I EP =
∑ p2018 = 0 , 413+5 , 97+3 ,89 =10 , 273 =101, 84 %
∑ p 2009−2010 0 ,392+6 ,185+3 , 51 10 , 087
9. Expliquer pourquoi les indices obtenus à l’exercice précédent sont les
mesures impropres du prix à des articles considérés :
I 2018 L B F
2009
R) = 104,56
R) = 104,297
13. Avec les données sur les produits laitiers calculer l’indice de Laspeyres
pour l’année 2018 en prenant 2009 comme année de base, l’indice de
Paasche de prix.
L2018 =
∑ q 09 . P18 = 9 ,675×0 , 413+ 117 , 7×5 ,97 +77 , 99×3 , 89 =101 ,10
2009 ∑ q 09 . P09 9 ,675×0 , 397+117 ,7×15+77 ,933×3 , 48
P2018 =
∑ q18 . P18 =10 , 436×0 , 413+115 , 5×5 , 97+ 82 ,79×3 ,39 =101 , 33
2009 ∑ q18 , P09 10 , 436×0 , 395+115 ,5×6 , 15+82 , 79×3 , 48
14. Calculez l’indice de Fischer de l’exercice précédent.
15. Le tableau suivant indique les salaires moyens horaires en dollars des
cheminots d’un pays pendant les années 2007-2018 ainsi que l’indice de
prix à la consommation (indice du coût de la vie) pour la même période,
rapportée à la période de référence 2007-2009. Déterminer les salaires
réellement touchés par les cheminots pendant les années 2007-2018 par
rapport à leurs salaires en 2007.
Année 200 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
7
Salaire en $/H 1,19 1,33 1,44 1,57 1,75 1,84 1,89 1,94 1,97 2,13 2,28 2,45
Indice du coût de 95,5 102, 101, 102, 111, 113, 114, 114, 114, 116, 120, 123,
la vie de 2007- 8 8 8 0 5 4 8 5 2 2 5
2009 = 100
Année 200 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
7
81
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Indice du coût de la 100 107, 106, 107, 116, 118, 119, 120, 119, 121, 125, 129,
vie 2007 = ³00 6 6 6 2 8 8 2 9 7 8 3
Salaire réel 1,19 1,24 1,35 1,46 1,51 1,55 1,58 1,61 1,64 1,75 1,81 1,89
a. b. c.
X X X
1 1
Y= ou =a 0 +a 1 x ( hyperbole )
a 0 + a1 x y
1
Y= + g ( fonction logistique )
ab x
Y = a0 + a1(logX) + a2(logX)²
Etc.
Points de vente 1 2 3 4 5 6 7 8 9 10
Quantités vendues 825 215 107 550 480 920 135 325 670 121
86
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Quantités vendues
0 0 5
a) Graphique
1600
1400
800
600
400
200
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
Y i −Y^ i=E i
Y i =Y^ i + Ei
Y i =f ( x i ) + Ei
i=1 i=1
Quand une droite vérifie cette propriété, on dit qu’elle ajuste les
données au sens des moindres carrés. On a alors la droite des moindres
ΔY
b=
b représente la pente de la droite ΔX
2. LA DROITE DE REGRESSION
Soient les observations x1, x2…xn et y1, y2,…, yn telles que les
points de cordonnées (Xi,Yi) forme un nuage des points sensiblement
linéaire. Le diagramme peut donc être ajusté par une droite d’équation
^y =a+bx . Cette droite est appelée droite d’estimation de y en fonction de
x, ou droite d’ajustement de y en fonction de x, ou encore droite de
régression de y en x. Le problème revient à déterminer les paramètres a
et b pour que la somme des carrés des écarts des points du nuage à cette
droite soit minimale. Ses coefficients sont donnés par les égalités :
89
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
n
∑ X i Y i −n X̄ Ȳ
b=i=1
n
∑ X i2−n ( X̄ )2
i=1
a= ȳ−b x̄
EXEMPLES –EXERCICES
1 2 3 4 5 6 7 8 9 10
MATH 75 80 93 65 87 71 98 68 84 77
STAT 82 78 86 72 91 80 95 72 89 74
100
90 f(x) = 0.661290322580645 x + 29.1290322580645
80 R² = 0.760555642333526
70
60
50
40
30
20
10
0
60 65 70 75 80 85 90 95 100
90
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Le nuage des points est allongé, laissant présager l’existence d’une liaison
linéaire entre les cotes de math et de stat. l’allure croissante du
diagramme indiquerait une liaison positive entre les cotes de math et celle
de sta évoluant ainsi dans le même sens.
Y^ =a+bx
b=
∑ x i y i−n X̄ Ȳ
∑ x 2i −n ( x̄ )2
91
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
6645−10(79 , 8)(81 , 9)
b=
64722−10 (79 ,8 )2
66045−65356 , 2
b=
64722−63680 , 4
688 , 8
b= =0 ,661290322≈0 , 66
1041 ,6
x^ =a +by
b=
∑ xi yi
∑ y 2i −n ( ȳ )2
a= x̄−b ȳ
66045−65356 ,2 688 ,8
b= = =1 ,150108532≈1 ,15
67675−67076 ,1 598 ,8
Semaine 1 2 3 4 5 6 7 8
Coût de publicité en $ 20 16 34 23 27 32 18 22
Question s a, b, cf exercice 1.
100
90
f(x) = 1.49659863945578 x + 40.0816326530612
80 R² = 0.743231829978041
70
Quantité vendue
60
50
40
30
20
10
0
15 20 25 30 35
Publicité
^y i =a+bx
a= ȳ−b x̄
n
∑ xi y 1 −n . x̄ ȳ
b= i=1n
∑ x 2i −n ( x )2
i =1
94
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
a = 76-1,50 x 24 = 76-36 = 40
^y i =40+1 , 50 x
c)
^y i =40+1 , 5∗30=40+45=85 ^y ( 30 )=40+1 ,5×30=85 x̄ i=a+by
X^ i =a+ by
a= x̄−b ȳ
n
∑ xi y i −n x̄ ȳ
15032−14592 440
b= i=1n = = =0 , 4966139955=0 , 5
47094−46208 886
∑ y 2i −n ( ȳ )2
i=1
X^ =−14+0,5 y
X^ =? ⇒ X^ ( 112 )
Pour Y = 112
3. LE COEFFICIENT DE CORRELATION ET LE
COEFFICIENT DE DETERMINATION
Le coefficient de corrélation « r » est un nombre indice qui
mesure le degré de dépendance entre deux caractères statistiques. Ce
coefficient mesure la précision de l’ajustement linéaire pour des écarts
résiduels faibles ; r est donné par la formule suivante :
n n n
n ∑ xiyi−∑ xi ∑ yi
i=1 i=1 i=1
r=
√ ( )√ (∑ )
n n 2 n n 2
n ∑ x 2i − ∑ xi n ∑ y 2i − yi
i=1 i=1 i=1 i=1
n
∑ xiyi−n x̄ ȳ
i=1
r=
√(∑ )(∑ )
n n
2 2 ¿
x i −n ( x̄ ) y (Ȳ )
i=1 i=1
n
cov ( x , y ) 1
r=
σx . σy
où cov ( xy )=
n
∑ ( X i − X̄ )( Y i −Ȳ )
i=1
15032−14592
r=
√ ( 4902−4608 ) ( 47094−46208 )
440
r= =0 , 862108943
510 ,3763317
Le coefficient de corrélation r = 0,8621 est positif. Il existe donc
une liaison de dépendance entre la publicité et la vente de cartons de
96
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
EXEMPLE – EXERCICE
97
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Rang 1 2 3 4 5 6 7 8 9 1 1 1 13 14 1 1 1 1 1 2
0 1 2 5 6 7 8 9 0
Revenu en $US 69 11 7 1 1 87 3 6 2 5 4 5 25 92 3 5 7 5 4 1
0 7 6 4 7 9 4 5 8 2 9 2 5 7 6 2 7
Consommation 6,9 12,2 9,1 2,4 2,3 17,1 4,3 5,7 2,5 6,8 6,3 5,3 29,1 13,5 3,3 8 1 7,1 5,4 2,9
de viande/kg 3
Solution
35
Consommation de viande en
30
f(x) = 0.114989083706588 x + 0.754703009295731
R² = 0.900108755947847
25
20
15
10
5
Kg
0
0 50 100 150 200 250 300
Revenu en $
Interprétation
Le nuage des points est allongé. L’allure est croissante. Cela veut
dire que la liaison positive entre le nombre de Kg de valeur consommée et
le revenu. Il serait donc en dépendance linéaire positive. (Variation dans le
même sens).
98
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
99
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
n
∑ xi y i −n x̄ ȳ 16640 , 7−20 . ( 64 , 4×8 , 16 ) 16640 , 7−10510 , 08 6130 ,62
b= i=1n = = = =0 ,114989083=0 , 115
136262−20 ( 64 , 4 )2 136262−82947 , 2 53314 , 8
∑ x 2i −n ( x̄ )2
i =1
Y^ =0 ,754 +0 , 115 x
100
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Interprétation
n ∑ fu x u y −( ∑ f x u x )( ∑ f y u y )
r=
√ [ n∑ f 2
x u x− (∑ f x u y)
2
][ n ∑ f 2
y u y− (∑ f y u y)
2
]
f = fréquence
u = variables changées
N.B : S’il y a des ex-aequo (= valeurs qui occupent le même rang) pour les
Xi ou Yi on attribue à ces valeurs la moyenne de leur rang.
TRAVAUX PRATIQUES
1. Au cours des épreuves d’un examen, 12 candidats ont obtenu les cotes
suivantes sur 10 en 2 matières différentes : statistique et mathématique.
N °candidat 1 2 3 4 5 6 7 8 9 10 11 12
Cote Math 9
8
7 f(x) = 0.68421052631579 x + 1.14473684210526
6
5
4
3
2
1
0
2 3 4 5 6 7 8 9 10
Cote Stat
10
Cote Stat 9
f(x) = 1.07216494845361 x + 0.371134020618557
8
7
6
5
4
3
2
1
0
2 3 4 5 6 7 8 9
Cote Math
103
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Y = ax + b
n ∑ xy−∑ x ∑ y 12×404−72×63
a= = =0 , 684210526
n ∑ x 2−( ∑ x )
2
12×470−( 72 )2
n ∑ xy−∑ x ∑ y 12×404−72 . 63
a '= = =1 , 072164948
n ∑ y 2 −( ∑ y ) 12×355−( 63 )2
∑x ∑y 72∗63
∑ xy−n i i 404−
12
r= = =0 , 856449≈0 , 856
√[ ][∑ ][ ][ ]
( 72 )2 ( 63 )2
(∑ y i )
2
(∑ x) 470− 335−
∑ x 21− n
y 2i −
n
12 12
1 1
Cov ( x , y )=
n
∑ x i y i− x̄ ȳ= 404−6×5 , 25=2 ,16666667
12
6 ∑ D2i 6∗35 ,5
rang=1− =1−
n ( n −1 )
2 12 (144−1 )
donc le premier.
5,731
SY . X =SY √1−r²
Essayons de calculer aussi les écarts-types liés :
105
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
S X .Y =S X √ 1−r ² σ X .Y =σ X √1−r ²
mathématique ;
à 60 ;
106
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
interpréter ;
de physique.
Résolution
a) 4 étudiants b) 47 étudiants/100 étudiants = 0,47 = 47 % d’étudiants
c) 22 étudiants d) 66 % d’étudiants
Remarque :
Dans l’énoncé si on a demandé le pourcentage des étudiants qui avaient eu une cote supérieure à 60 en
mathématique ou en physique, ce pourcentage serait 83.
Y Notes de mathématique
centre X 44,5 54,5 64,5 74,5 84,5 94,5 Ny ou f yU y Somme des
f y U 2y nombres en
centre fy
Ux -2 -1 0 1 2 3 coin pour
Notes de physique
Uy chaque ligne
94,5 2 2 4 4 16 4 24 10 20 40 44
84,5 1 1 0 4 4 6 12 5 15 16 16 16 31
74,5 0 5 0 10 0 8 0 1 0 24 0 0 0
64,5 -1 1 2 4 4 9 0 5 -5 2 -4 21 -21 21 -3
54,5 -2 3 12 6 12 6 0 2 -4 17 -34 68 20
44,5 -3 3 18 5 15 4 0 12 -36 108 33
Ny ou fx 7 15 25 23 20 10 100
∑ f x u y ∑ f x u2x 125
-55 253 ∑ fux uY
FxUx -14 -15 0 23 40 30
∑ f x ux
VERIFICATIO
64
FxU²x 28 15 0 23 80 90
∑ f x u2x
236
Somme des 32 31 0 -1 24 39
∑ f x ux u1
N
nombres en
coin pour
108
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
chaque
colonne 125
109
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
n ∑ f x u x u y−( ∑ f x u x )( ∑ f y u y ) 6 6 6 6
R= ∑ ∑ f =∑ f x=∑ f y=100
√ [ n∑ f 2
x u x− ( ∑ f x ux)
2
][ n ∑ f 2
y u y− (∑ f y u y)
2
] i =1 i=1 i=1 i=1
n = 100
x i−x 0
u x= , x 0=64 , 5
ax
x−64 ,5 y i− y 0
u x= car a=10 uY = y 0 =74 ,5
10 ay
100×125−( 64 ) (−55 )
16020
= =0 , 768584835
√( 19504 )×( 22275 )
= 0,76858
sy sx
y− ȳ=r ( x − x̄ ) et x− x̄=r ( y− ȳ )
sx sy
√ ( )
2
s
r = xy =
cov ( x , y )
où s x=a x
∑ f xux − ∑ f x ux 2
s x s y σxσy n n
√ (
∑ f y u2y − ∑ f y u y
) [ (
∑ fux u y − ∑ f x u x ∑ f y u y
)( )]
2
SY =a Y S xy=qa y
n n n n n
110
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
S xy=10∗10
[ ( ) ( )]
125 64
− ∗
−55
100 100 100
=160 , 2
S x=10
√
236 64 2
−
100 100 ( )
=13 , 9656722
S y=10
√
253 −55 2
−
100 100 ( )
=14 ,92481156
160 ,2
r= =0 ,768584835
13 , 9656722∗14 , 92481156
Vérification :
64
x̄=x 0 +a y ū x =64 , 5+10 =70 , 9
100
−55 s
ȳ= y 0 +a x ū y=74 , 5+10 =69 → y− ȳ=r y ( x− x̄ )
100 sx
0 , 7685848635×14 , 92481156 (
y−69= x−70 , 9 ) ⇒ y=0 , 82136995 x+10 , 76486973
13 , 9656722
sx 0 , 7668584835×13 , 96656722
x− x̄=r ( y− ȳ ) ⇒ x−70 , 9= ( y−69 )
sy 14 , 92481156
x = 0,719y +21,275759
x = 0,719y +21,276
h. On démontre que :
L’écart type lié ou erreur quadratique moyenne d’un estimateur est une
mesure de la dispersion autour de la droite de régression. Il a les mêmes
propriétés que l’écart type.
111
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
112
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
2. REPRESENTATION GRAPHIQUE
EXEMPLE
Année 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
Production 50 36,5 43 44,5 38,9 38,1 32,6 38,7 41,7 41,1 33,8
(en tonnes)
Graphique
60
50
R² = 0.264102031736616
30
20
10
0
Temps en années
6 7 8 9 0 1 2 3 4 5 6
2 00 2 00 2 00 2 00 2 01 2 01 2 01 2 01 2 01 2 01 2 01
e e e e e e e e e e e
né né né né né né né né né né né
An An An An An An An An An An An
Exemple : - Les ventes des cadeaux à l’occasion des fêtes de fin d’année
particulièrement ;
115
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
B. Objet :
C. Formulation du modèle
Modèle multiplicative: Yt = Tt x St x Ct x At
1. Le trend
a. La méthode graphique :
T
117
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
y 1 + y 2 +. . .+ y k y 2 + y 3 +. ..+ y k +1 y 3 + y 4 +.. .+ y k +2
, , , .. .
k k k
Un certain nombre d’observations est remplacé par une moyenne mobile.
En reliant ces moyennes on obtient la tendance.
1 2 3 4 5 6 7 8
10 12 9 11 12 8 6 13
On peut décider de déterminer des moyennes mobiles d’ordre 4.
c. La méthode analytique
tendance exponentielle
Y =a+bt avec b=
∑ t i y i−n ī ȳ et a= ȳ−b ī
∑ t 2i −n ( ī )2
t = temps
n
1
t̄ = ∑ t i
n i=1
n
1
ȳ= ∑Y
n i=1 i
EXEMPLE
T Année 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
Y Production en tonnes 50 36,5 43 44,5 38,9 38,1 32,6 38,7 41,7 41,1
Graphique
60
50
Production en tonne
20
10
0
7 8 9 0 1 2 3 4 5 6 Temps en années
2 00 2 00 2 00 2 01 2 01 2 01 2 01 2 01 2 01 2 01
e e e e e e e e e e
né né né né né né né né né né
An An An An An An An An An An
119
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
120
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
35
30
25
20 Année 2014
Année1990
Année 2015
Année1991
15 Année1992
Année 2016
10
0
1 2 3 4 5 6 7 8 9 10 11 12
au fil de
notable. Les productions de thé sec sont influencées par les mois
ces trois années. Les productions les plus élevées sont réalisées au mois
d’octobre, les moins élevées en Avril les productions moyennes en Février,
Mai, Août, l’équation d’estimation de production est donnée par
^y =15, 42−0,08t .
122
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Mois J F M Av M J J A S O N D
Anné
e
2014 15,3 15,2 15,1 15,1 15,0 14,9 14,8 14,7 14,7 14,6 14,5 14,4
4 6 8 2 4 6 8 2 4 6
2015 14,3 14,3 14,2 14,1 14,0 13,9 13,9 13,8 13,7 13,6 13,5 13,5
8 2 4 6 8 2 4 6 8
2016 13,4 13,3 13,2 13,1 13,1 13,0 12,9 12,8 12,7 12,7 12,6 12,5
2 4 6 8 2 4 6 8 2 4
Divisons les données observées par les données estimées (en %) pour
Nous n’allons donc pas ajuster les coefficients saisonniers. La norme des
3. Variations cycliques
124
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
4. Variations aléatoires
E.LA PRÉVISION
Un des buts de l’analyse chronologique est de prédire l’évolution
d’une observation à travers les données analysées. Celles-ci ont permis de
déceler les mouvements propres à la série ; mouvements qui
interviendront encore dans la réalisation future de la série. Dès lors la
phase de prédiction se base essentiellement à des résultats obtenus de la
phase de l’analyse, résultat intégré dans le modèle supposé de la série
(additif, multiplicatif ou mixte).
n
1
∑ ( Y −Ȳ
n i=1 t
)( Z t − Z̄ )
r= −1≤ r≤1
√[∑ ( ][ ∑ ( ]
n n
1
Y t −Ȳ ) 2 Z t − Z̄ )2
n t =1 t =t
126
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
T T T
1 1 1
ȳ=
T
∑ yi z̄ =
T
∑ zi S2Y =
T
∑ ( y i − ȳ )2
i =1 i =1 i=1
T
1
S2Z=
T
∑ ( Z t − Z̄ )
2
T =n
i =1
Yt ou Zt
Yt
Zt
√[ ( )]
T T
1
T ∑ ( Y t −Ȳ ) ∑ ( Z t −Z̄ ) 2
2
t =1 t =1
Yt −Ȳ Zt − Z̄
yt= zt=
σy σz
T
1
r = ∑ yt . zt
T i=1
Si les fluctuations des deux séries sont similaires mais qu’il existe entre les
deux séries un décalage constant le temps (T P = période), on mesurera la
corrélation entre les deux séries décalées.
Le coefficient de corrélation de r
T −t
∑ ( Z t − Z̄ t )( Y t +1− Ȳ τ )
i =1
r τ=
√ ( )
T −τ T −t 2
∑ ( Z t − Z̄ T ) ∑ ( Y 1+T −Ȳ )
2
i=1 1+1
AUTOCORRELATION ET CORRELOGRAMME
Les idées du paragraphe précédent peuvent être adaptées afin
de faire apparaître des autocorrélations éventuelles qui peuvent exister au
sein d’une série chronologique (ou chronique).
T −τ
∑ ( Y t −Ȳ )( Y 1+t −Ȳ )
r τ = i=1 T −τ
∑ ( Y t −Ȳ )2
i =1
Principe général
Exemple
P
Impair f
T C P
f
C
P
P f
P
f
Autre exemple :
A. Arrangement
I. Définition
On appelle arrangement de n éléments p à p (p n), tout
ensemble ordonné ordonné de p de ces éléments, tous distincts. Un
arrangement est donc caractérisé par la nature des éléments ou par leur
ordre.
Exemple :
132
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Ensemble de 4 lettres a, b, c, d.
Calcul de
AnP
On désigne
AnP le nombre total d’arrangement distincts de n éléments p à
p Tout arrangement de p objets peut être construit de la manière
suivante : on considère p cases, numérotées de 1 à p (p n).
Dans la deuxième case, on place un autre objet choisi parmi les (n-1)
objets restants, cela donne (n-1) choix possibles. De la même manière, on
obtient (n-2) choix possibles pour la 3 ème case, et ainsi de suite, jusqu’à la
pième case pour laquelle il ne reste plus que (n-p+1) choix possibles.
Exemple
P 3
Nombre de tiercés dans l’ordre dans une course de 10 chevaux
A n A
= 10
10.9.8 = 720
Notation factorielle
10 !
A310= =10 . 9 .8=720
7!
Exemple
AnP =n !
α Pn =n p . . . ( VI . 5 )
Exemples :
2 2
α =3
1. Arrangements d’ordre 2 des 3 lettres a, b, c,… 3
=9
B. Permutations
I. Définition
Une permutation de n objets est un ensemble ordonné de ces n
objets. Les permutations de n objets constituent un cas particulier des
134
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Exemple :
Les permutations possibles de 3 lettres a, b, c, sont abc, bca, cab, acb, bac
cba.
Pn = Ann =n ! ( VI . 6 )
Autre exemple
P8 =8 !=40320
II. Permutations avec répétition
Il arrive que, parmi les n objets dont on cherche le nombre de
permutations, certains d’entre eux, au nombre de r par exemple, soient
tous semblables. Auquel cas rien ne distingue les permutations de ces r
objets entre eux. Pour calculer le nombre de permutations possibles, il faut
donc diviser le nombre de permutation des n objets sans répétition, par le
nombre de permutations des r objets entre eux, soit P n (avec répétition r)
Pn n !
=. . . =
Pr r !
Géralisation à plusieurs répétitions
On considère n objets, parmi lesquels r1 sont semblables entre eux, r 2 sont
semblables entre eux…rk sont semblables entre eux, avec r 1 +r2+ …rk = n.
On appelle permutation de n objets avec répétitions (r 1, r2,…rk) toute
partition de ces n objets en k parties telles que la i ème partie ait ri éléments
135
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
acd. Calcul de
C np
On désigne par …
C np … le nombre total de combinaisons de n objet p à p.
En remarquant que le nombre d’arrangements de n objets p à p n’est
autre que le produit du nombre de combinaisons des n objets p à p, par le
nombre de permutations des P éléments de chaque combinaison, soit
Anp =C np × p ! ( VI . 8 )
A np n ( n−1 )( n−2 ) .. . ( n− p+1 ) n!
C np = = = (VI .9 )
On en déduit p! p! ( n− p ) ! p !
136
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Remarques
1. On note aussi
p
Cn =¿ ( n ¿ ) ¿ ¿ ¿
¿
2. En utilisant l’expression (VI.9), on peut démontrer les relations
suivantes
C np =C n−
n
p
→C np =C Pn−1 +Cn−1
p−1
( VI . 10 )
Exemples
1. Nombre de tiercés dans le désordre dans une course de 10 chevaux :
10 .9 . 8
C 310= =120
1. 2 .3
2. Nombre de mains différentes de 8 cartes dans un jeu de 32 cartes
32. 31. 30 . 29. 28 . 27. 26 . 25
C 832= =10518300
1. 2 .3 . 4 . 5 .6 . 7 . 8
II. Permutations avec répétitions et combinaisons
Une permutation de n objets avec répétition r 1=p et r2=n-p (où
pn) est une partition de ces n objets en deux ensembles, l’un de p
éléments, l’autre de n-p éléments ; se donner une telle permutation
revient donc au même que se donner une partie de ces éléments parmi n,
c’est-àdire une combinaison de n éléments pris p à p, on a donc
C np =Pn ( p . n− p ) ( VI .11 )
Remarques
C np=¿ ( n¿) ¿ ¿¿
combinaison généralisée. De même que l’on a …… ¿
( )
n
Pn ( r 1 r 2 ...r k ) =r 1 ,r 2 ...,r k
On note
III. Binôme de Newton
137
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
La relation (VI.10)
C np =C Pn−1 +C n−1
p−1
permet une détermination
Colonne 0
1 Ligne 0
1 1 Colnne
p
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
Ligne n
p−1 p
C n−1 C n−1
C np
Cette disposition symétrique du triangle de Pascal permet non seulement
de calculer les coefficients du binôme, mais aussi de démontrer
concrètement par récurrence des formules relatives à ces coefficients.
Ces rappels trouveront leur utilisation ultérieurement, à l’occasion de la loi
de probabilité dite loi binomiale.
IV. Combinaison avec répétition
Supposons que l’on étudie la répartition de n objets en fonction
de r critères, et que l’on cherche le nombre de telles répartitions possibles.
Une telle répartition est appelée combinaison avec répétition d’ordre r. Le
[ n ¿] ¿ ¿ ¿
nombre de ces combinaisons avec répétitions est ¿
En effet soit s1, x2,…xn les objets. Une répartition de ces objets suivant les
critères peut être représentée ainsi :
x1x2x3/x4/x5x6/x7/…./xn1xn/
Le nombre de combinaisons avec répétition est don égal au nombre de
manières de séparer les xi par r frontières. C’est donc le nombre des
manières de choisir r objets parmi n+r-1 sans tenir compte de l’ordre.
Exemple :
Lors d’un sondage dans une université, on pose à une centaine d’étudiants
une question comportant 3 réponses possibles. Quel est le nombre de
configurations différentes qu’on peut obtenir ?
139
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
[ n ¿] ¿ ¿ ¿
¿
TRAVAUX PRATIQUES
1. De combien de manières peut-on placer trois dossiers différents
dans 15 casiers vides en raison d’un dossier par casier ?
Solution
D’après le principe général, il y a 15 façons de placer le premier
dossier. Celui-ci étant placé,, il ne reste plus que 14 casiers vides, il
y a 14 façons de placer le deuxième dossier et enfin, 13 façons de
placer le troisième.
D’où N =
A315=15×14×13=2730 manières différentes.
2. On considère un jeu forain où 4 souris numérotées de 1 à 4 se
dirigent vers cinq cases, A,B,C,D,E. Plusieurs souris pouvant choisir
la même case. Sur chaque billet, le joueur inscrit une répartition des
souris dans les cases et il gagne lorsque son pronostic se réalise.
Combien de billets de joueur doit acheter pour être assuré de
gagner ?
Solution
Il s’agit d’un arrangement avec répétition de 5 objets pris 4 à 4. Il y
a 5 possibilités qui s’offrent à la souris n°1 ; de même pour les 3
autres. Au total il y a
α 45 =5 4 =625 séquences possibles. Le joueur
doit donc acheter 625 billets.
3. A propos d’une course de chevaux, les rumeurs publiques accordent
à 4 chevaux particuliers une chance égale de gagner. Quel est le
nombre de quartés différents que l’on peut établir à partir de ces 4
chevaux ?
Solution
Le nombre de quartés distincts possibles est le nombre de
permutations des 4 chevaux favoris : P4 = 4 x 3 x 2 x 1 = 4 ! = 24
140
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
3. Il y a
C 23 façons de former l’équipe masculine et C 23 façons de
CHAPITRE VII :
Rpair = r2, r4, r6 qui est la réunion des évènements R2, R4 et R6.
Exemple
A A
B B
AB AB
B. PROBABILITE
Deux démarches différentes peuvent conduire à la définition axiomatique
d’une probabilité.
1
P ( Ri ) = p=
On en déduit 6. La probabilité est dite uniforme, les
évènements sont dits équiprobables ou équipossibles ou encore
équirépartis.
card E
p ( E )= ou p ( E ) = ≠E
évènements élémentaires distincts, on a card S ¿S
On exprime cette relation en disant que, dans le cas d’une
probabilité uniforme, la probabilité d’un évènement est égale au nombre
de cas favorables à la réalisation de cet évènement (card E) divisé par le
nombre de résultats possibles de l’expérience (card S).
Il est clair que fn(A) dépend de la série des n épreuves : Deux séries
différentes peuvent conduire à des résultats différents ; il est cependant
raisonnable de penser que fn(A) tend vers une limite lorsque le nombre
d’épreuves n tend vers l’infini. On dit que la probabilité P(A) de
l’évènement A est cette limite.
P : P ( S ) → [ 0 ;1 ] telle que :
148
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
1 °) p ( s )=1 et p ( φ )=0
2 °) ∀ A ∈ P ( S ) , ∀ B ∈ P ( S ) tels que A∩B=φ
P ( A∪B ) =P ( A )+P ( B )
3 °) Si A0 , A1 . . . An. .. est une suite d'évènements incompatibles deux à deux
∞
[ ]
∞
(i. e . ∀ n , ∀ m , An∩ Am=φ ) alors : p U A n = ∑ P ( A n )
n=0 n=0
Remarques :
Par récurrence, on déduit du second axiome que si A0, A1…An est une
suite finie d’évènements incompatibles deux à deux alors :
[ ]
n n
p U Ai =∑ P ( Ai)
n=1 n=1
Conséquences
(On dit qu’une probabilité est une application croissante sur P(S). En effet
( Ā )
On a :
149
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
card A
∀ A ∈ P(S ),P( A )= . En effet si S={r 1 ,r 2 .. .. . .r n } et A= {r 1 , r 2 . .. .. . r k } ( k≤n )
card S
1 1 k card A
P ( A )=P ( {r 1 })+. .. . .. ..+P ( {r k })= +. . .. ..+ = =
alors n n n card S
La définition axiomatique est donc cohérente avec l’hypothèse du
paragraphe I
Exemples :
card A
P ( A )= on obtient successivement P ( A )=P ( R ) = 4 = 1
card S 32 8
8 1 card ( A∪C ) 11
P (C)= = P ( A∪C )= =
32 4 card S 32
28 7 0 1
P ( Ā )= = P ( A∩R )= =0 P ( A∩C )=
32 8 32 32
2. Expérience aléatoire : tirer 2 cartes à la fois d’un jeu de 32 cartes.
Probabilité pour que ces 2 cartes soient 2 rois.
150
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
C. PROBABILITES TOTALES
Le second axiome de définition d’une probabilité donne la
probabilité de la réunion de deux évènements lorsqu’ils sont
151
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Exemple :
On tire une carte au hasard d’un jeu de 32 cartes. Quelle est la probabilité
pour que cette carte soit un as ou un cœur ?
A : « la carte est un as »
On a :
A 8 card ( A∪B ) 11
E=A∪B et P ( A )= P ( B )= P ( E )= =
32 32 card S 32
Les ensembles A et B n’étant pas disjoints, pour ne pas compter
deux fois l’as de cœur, il convient de remarquer que : card (AB) = card A
+ card B – card (AB). On en déduit que : P(AB) = P(A) + P(B) – P(AB).
Demonstration
II. Généralisation
[ ] [ ]
n n n
P UAi =∑ p ( A 1 ) −∑ ∑ P ( A i∩ A j ) +∑ ∑ ∑ P ( Ai ∩ A j ∩A k )−. ..+ (−1 )
n+1
P UAi
i=1 i=1 i i≠1 i j≠i k ≠i i=1
Remarque :
P ( A1 ∪ A2 )=P ( A 1 ) + P ( A 2 ) −P ( A 1 ∩A 2 )
P ( A∩B )
P ( A / B )=
P ( B)
On en déduit :
P ( A∩B ) =P ( B ) P ( A /B )
Généralisation
153
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
[ ] ( )
n An
P ¿ Ai = P ( A1 ) .. P ( A 2 / A 1 ) . . P ( A3 / A1 ∩ A2 ) .. .. P n−1
Ai
i=1
¿
i=1
Exemple :
Probabilité de tirer un as, puis un roi d’un jeu de 32 cartes, sans remettre
la 1ère carte en jeu (tirage exhaustif).
B/A : la 2ème carte tirée est un roi, sachant que la 1 ère (non remise) est un
as.
4 4 1 4
P ( A∩B ) =P ( A ) . P ( B / A )= × = P ( B/ A ) =
32 31 62 31
1. Si P(A) 0 et P (B) 0
P(B/A) = P(B) P(A/B) = P(A)
2. Si P(A) 0
P(B/A)= P(B) P(AB) = P(A)P(B)
Définition
Exemple
154
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
4
P ( B / A )=P ( B )=
Dans ce cas, 32
4 4 1
P ( A∩B ) =P ( A ) . P ( B ) = . =
32 32 64
155
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
1. Exemple
Classe A Classe B
Effectif 26 32
Nombre de reçus 18 14
18
P ( R/ A )=
26
8
P ( R / A )=
26
1
P ( A )=
2
1
P ( B )=
2
14
P ( R/ B )=
32
18
P ( R̄/ B )=
32
156
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
18 1
×
P (R / A ). P ( A ) 26 2
( )
P A/R = = =0 , 613
P ( R/ A ) . P ( A )+ P ( R/ B ) . P ( B ) 18 1 14 1
× + ×
26 2 32 x 2
Théorème
P ( Ak ) . P ( E / Ak )
P ( A k / E )= n
∑ P ( A1 ) P ( E / A i )
i=1
Démonstration
n
P ( E )=∑ P ( E / A n ) P ( A 1 )
Remarquons tout d’abord que i=1
n n
U A1 =E on a : E= U [ E∩ A1 ]
En effet, comme : i=1 i =1
( )
n n
P ( E )=∑ P ( E / A i ) . P ( A i ) cfr P UAi =∑ P ( A i )
On a donc i=1 i=1
157
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
P ( A k ∩E ) P ( A k ) . P ( E/ A k )
P ( A k / E )= = d'après ce ui précède.
P(E) n
∑ P ( E / A 1) P ( A i )
i =1
E. EXEMPLES COMPLEMENTAIRES
1. Loi binominale
Une urne contient 100 boules dont 10 blanches. On réalise une
série de 5 tirages successifs non exhaustifs d’une boule (c’est-à-dire que
l’on remet la boule après chaque tirage, de manière que la probabilité ne
change pas d’un tirage à l’autre). Quelle est la probabilité pour que 3
boules de la série de 5 soient blanches ?
10
P ( A )= =0 , 1
A : tirer une boule blanche 100
ordre déterminé tel que AAA Ā Ā , est donnée par l’axiome des probabilités
composées.
5!
P ( E )=C 35 ( 0 , 1 )3 ( 0 , 9 )2 = ( 0 ,1 )3 ( 0 , 9 )2=0 , 0081
( 5−3 ) !3 !
Généralisation
1
P ( k )=Ckn P k q n−k avec p=q=
l’expression (P(k) = 2 C’est une loi à 2
paramètres n et p, notée (n,p).
( )( )
3
1 1 2 5 . 4 .3 . 1 1 5
P ( 3 )=C 35 = . . = =0 , 3 !25
2 2 1 .2 . 3. 8 4 16
2. Loi hypergéométrique
TRAVAUX PRATIQUES
N 2 60
P ( x=2 )= = =0 , 30 .
200 200 On vérifie que P(x=0) + P(x=1) + P(x=2) =
1
Solution : C
On considère les évènements :
P
M : « l’ouvrier est maçon »
C : « l’ouvrier est carreleur »
P : « l’ouvrier est plombier »
MC
Card (MC) = 15 card(C) = 7 +15 = 22
Card M = 23 +15 = 38 card P =5
38 5 43
M ∩P=φ on a P ( M ∪P )=P ( M )+ P ( P ) = + =
1) Puisque 80 80 80
P(MP) 0,5375
38 22 15 45
P ( M ∪C )=P ( M )+ P ( C )−P ( M ∩C )= + − =
2) 80 80 80 80
P(MP) 0,562
3. Parmi 1000 moteurs d’une certaine fabrication, 725 moteurs ont
fonctionné sans problème pendant les 3 premières années et 375
les 5 premières années. Quelle est la probabilité pour qu’un moteur
n’ayant pas eu de problème pendant les 3 premières années
fonctionne encore pendant 2 ans.
Solution
A E
161
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Card E = 1000 ; card (A) = 725 ; card (B) = 375 = card (AB)
375
p= =0 , 517
D’où 725
2ème méthode
725
P ( A )= =0 , 725
1000 . La probabilité pour qu’un moteur fonctionne 5
ans est :
325
P ( A∩B ) = =0 ,375
1000 . Par conséquent, la probabilité pour qu’un
moteur n’ayant pas eu de problème pendant les 3 premières années,
P ( A∩B ) 0 ,375
P ( B / A )= = =0 ,517 .
fonctionne encore 2 ans est : P(A) 0 ,725
15 25
P= × =0 , 0375
100 100 Soit 3,25 % de vacanciers de Butembo vont à
Goma.
Solution
P ( A )×P ( D/ A )
P ( A / D )=
P ( A )×P ( D/ A ) + P ( B )×P ( D/ B ) + P (C )×P ( D/ C )
0 ,50×0 , 05 0 , 025 2 ,5
P ( A / D )= = = ≈0 , 658
D’où 0 , 50×0 ,05+0 ,30×0 , 3+0 , 2×0 ,02 0 , 038 3 ,8
2ème méthode
163
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
¿¿¿
Sur 100 moteurs ¿
Nombre de moteurs défectueux venant de A 2 ,5 2 ,5
P ( A / D )= = = =0 ,658
Nombre de moteurs défectueux 2 , 5+0 , 9+0 , 4 3 ,8
6. Une partie des accidents des étudiants est due à des accidents de
qui accompagnent les produits qu’ils manipulent. Parmi ceux qui lisent, 10
% ont tout de même des accidents par manque de précaution. Quelle est,
Solution
A : « l’étudiant a un accident »
Ā
« l’étudiant n’a pas un accident »
164
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
L : « l’étudiant a lu la notice »
L̄
: « l’étudiant n’a pas lu la notice »
P ( L̄ )×P ( A / L̄ )
P ( L̄/ A )=
P ( L )×P ( A / L̄ )+ P ( L )×P ( A /L )
P ( A / L̄ )
On doit calculer : Probabilité d’avoir un accident pour un
0 , 25×P ( A / L̄ )
0 , 7273=
0 , 25×P ( A / L̄ ) +0 , 75×0 ,10
On en déduit :
2ème méthode
x 20
P ( A / L̄ )= = =0 , 80
25 25
C12 ×C 36 2×20
P ( 1 )= = ≈0 , 572
C84 70
C 02 ×C64 1×15 3
P ( 0 )= = = ≈0 , 214
C 48 70 14
Solution
Diagramme en arbre
1
P ( A )=P ( B )=
2
¼ D/A
3 1
P ( D/ A )= = ¾
12 4
A ½ N/A
5
P ( D/B )= B½ 5/16 D/B
16
11/16 N/B
9 3
P ( N / A )= =
12 4
11
P ( N /B )=
16
1 1 1 1 3 3
P ( A∩D )= × = P ( A∩N )= × =
2 4 8 2 4 8
1 5 5 1 11 11
P ( B∩D )= × = P ( N∩B )= × =
2 16 32 2 16 32
indépendants.
1 5 9
P ( E )=P [ ( A∩D )∪( B∩D ) ] =P ( A∩D )+ P ( B∩D )= + =
8 32 32
168
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
* Pour une V.A fini : x(s) = x1, x2,…, xn la l.p de x est entièrement
n
Pi ≥0 , ∑ P i =1
i=1
n ; on a pour tout i = 1,… n
N*
∞
Pi ≥0 , ∑ P i =1
i=1
Si x(s) est fini ou dénombrable, x est dite discrète.
* Pour V.A continue : x est dite continu si x(s) est une réunion
P ( X≤x ) , ∀ x ∈ R
par la donnée des probabilités . Si x est une v.a définie sur
∀ x ∈ R , F ( x )=P ( X ≤x )
l’application FR par
170
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
point x R, des dérivées f(x) sauf peut être à un nombre fini de points, et
x
∫−∞ f ( t ) dt
si xR, p(x x) = F(x) = . On dit que X est une variable aléatoire
fonction de distribution de x.
b +∞
∀ a ∈ R , ∀ b ∈ R , P ( a≤x≤b )=∫a f ( t ) dt=F ( b )−F ( a ) ∫−∞ f ( t ) dt=1 et ∀ t ∈ R , f ( t )≥0 .
k
F ( x )=∑ P ( x =xi ) , si x k≤ x≤x k +1
i=1
et F est une fonction en escalier.
F(x)
171
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
10
9
8
7
6
5
4
3
2
1
0
X1 X2 X3 X4 X5 … Xn
on parle de loi de probabilité d’une v.a. Les lois des variables aléatoires se
moments,…
-
Pour une v.a fini l’espérance mathématique ou moyenne
n
E ( x )=∑ x i p ( X =x1 )
i =1
arithmétique de x :
172
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
∞
E ( x )=∑ x i p ( X =x1 )
- i=1
Pour une v.a dénombrable
+∞
-
E ( x )=∫−∞ xf ( x ) dx
Pour une v.a absolument continue :
√ σ 2=σ
La racine carrée de la variance est l’écart-type
1
t2
t) .
173
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Ai, associons une v.a.xi. Ces variables aléatoires ont même espérance
n
1
Y n= ∑X
n i=1 i
σ2 σ
V (Y n )= ; σ ( Y n )=
n √n
(
P |Y n −m|¿
tσ
√n t)
1
∠ 2
ε=
tσ
√n
p (|y n−m|¿ ε ) ¿¿
En posant on a
⇒t= √ ⇒ =
1σ ε n 1 σ 1 σ2
ε= ⇒ 2= 2 lim ( P|Y n −m|¿ ε )=0
√n σ t ε √n t ε n n→+∞
174
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
5. TRAVAUX PRATIQUES
aléatoire Xi est le nombre des points marqués lors du ième jet du dé.
Déterminer :
a) la loi de probabilité
b) l’espérance mathématique
c) la variance
d) l’écart-type
Solution
1
P ( x= χ i )= ∀ χ i ( i=1 , .. .6 ) ⇒ équiréparation
6
a) Loi de probabilité
i 1 2 3 4 5 6
175
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Pi ≥0 et ∑ Pi=1
b) L’espérance mathématique
x 2i pi
x1 P1 xipi P(xxi) =
F(x)
n
n ( n+1 ) 6 ( 6+1 )
E ( X )=∑ x i p ( x =xi ) = =21
i=1 2 2
21 7
E ( X )= = =3 , 5
6 2
91
V ( x )=σ 2=μ2 = −( 3 , 5 )2=2, 916666667≈2 , 9167
6
Pi = P(x-xi)
1/6
1 2 3 4 5 6 x
F(x)
177
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
1
1
5/6
5/6
2/3
2/3
1/2
1/2
1/3
1/3
1/6
1/6
0
1 2 3 4 5 6
Xi
n
1
y n= ∑x
n i=1 i
pour que l’on ait au moins 8 chances sur 10 que la moyenne
Solution
(
P |Yn−m|∠
1
10 )
≥1−
100 σ 2
n
On a , d’après la loi des grands nombres,
σ2
P (|Y n −m|¿ ε ) ∠ 2
nε
P¿¿
Nous souhaitons que
178
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
100 σ 2 8
1− ≥
n 10
n−291 , 67 8
≥ ⇒ 10 n−2916 , 7≥8 n
n 10
10n – 8 n 2916,7
2n 2916,7
2916 , 7
n≥
2
n 1458,35
n 1458,35
n 1458
suppose que
Bernoulli
Solution
Xi 0 1
x 2i
V(x) = E(x²)-(E(x))²E(x²) = p(x=xi)
E(x²) = 0² (1-P)+1²P=P
σ ( X ) =√ P ( 1−P )
V(x) = p-p² = p(1-p)
b) Mk = E(X-E(x)k=(X-E(x))k p(x=xi)
n
∑ ( X− E( X )) ² p ( X= X )
i=1
V(X) = µ2 = ² = E(X-E(X))² =
V(X) = (0-p)²(1-p)+(1-p)²p=p²(1-p)+(1-p)²p
a) Déterminez f en fonctgion de a et de b
d) Représentez graphiquement f.
e) Représentez graphiquement F
Solution
a) f(x) 0
−∞
∫−∞ f ( x ) dx=1; f ( x ) est constante sur [ a,b ]
Soit la valeur constante
f(x) = c
+∞ h
∫−∞ f ( x ) dx=∫t cdx=c [ x ]ba=c [ a−b ]
181
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
+∞ 1
∫−∞ f ( x ) dx=1⇒ c [ b−a ] =1⇒ c= b−a
1 1 ( b−a )( b +a ) b+ a
E( X )= [ b ²−a ² ] = ⇒ E( X )=
2 ( b−a ) 2 ( b−a ) 2
b +a
E ( X )=
2
[]
2 3 b
+∞ x b 1 h 2 1 x
E ( X ² )=∫−∞ x f ( x ) dx ⇒ E ( X )=∫a
2 2
dx= ∫ x dx= b−a 3
b−a b−a t a
( 2 2
)
E ( X 2 )=
1 ( b3 −a 3 ) = ( b−a ) b + ab+ a
3 ( b−a ) 3 ( b−a )
b 2 +ab+ a2
E ( X 2 )=
3
b 2 +ab+ a2 ( b+ a )2
V ( x )=E [( X−E ( X ) ) ] =E ( X )−( E ( X ) ) =
2 2 2
−
3 4
4 b2 + 4 ab+4 a2 −3 b2 −6 ab−3 a2 b 2 −2 ab+a 2 ( b−a )2
= = =
12 12 12
( b−a )2
V ( x )=
12
σ ( X ) =√ V ( X )=
12 √
( b−a )2 b−a
=
√ 12
x
c) F ( x)=∫−∞ f ( t )
x1 1
dt=∫a dt= [ t ]ax
b−a b−a ¿
F ( x )=¿ ¿ ¿
¿
¿
182
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
d) Graphique de f
f(x) F(x)
1
b−a 1
½
a+b
2
X a b X
183
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
CHAPITRES IX ET X :
DISRIBUTION DES PROBABILITES OU LOIS DES
PROBABILITES ET UTILISATION DES TABLES
STATISTIQUES
la loi binomiale
la loi hypergéométrique
la loi de Poisson
la loi normale
la loi de Student
la loi du Khi-deux
la loi de Fisher Snedecor
1. La loi binomiale
kN, P(x=k)
{k k n−k
{
=¿ Cn P (1−P ) pour0≤k≤n¿ ¿ ¿¿¿
184
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
X (n,p) q = 1-p
√ npq
V(x) = npq (x) =
Exemple :
5!
C 25 ( 0 , 55 )2 ( 0 , 45 )3 = ( 0 , 55 )2 ( 0 , 45 )2=10×0 , 3025∗0 ,091125
2! 3!
P(X=2) =
La probabilité d’avoir 2 garçons parmi les 5 nouveaux nés est 0,28 soit 28
%.
Lorsque
( X-np )
n→+∞ et que →t où t est fini et p+q =1 alors √ npq β ( n , x ) →ℓ ( t ) où ℓ ( t )
√ npq
La loi de Poisson
2. La loi de Poisson
X p()
√λ
E (x) = V(x) = (x) =
Exercice
Solution
P(x = 2) n = 75
187
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
x (n=75 ; p = 0,04)
2 75×75
P ( x )=C75 ( 0 , 04 )2 ( 0 , 96 )73= ( 0 , 04 )2 ( 0 ,96 )73
2×1
3 2 −3
p( x=2 )= e =0 , 2240418077≈0 ,224
2!
probabilité cherchée devient donc
3. La loi Normale
− ( )
2
1 x−m
1 2 σ
= e
xR rf(x) σ √ 2 π
(1)
Notation
x−m
t=
En effectuant le changement de variable σ
188
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
t2
1 −2
∀ t ∈ R , p (t )= e
on définit une nouvelle densité de probabilité √2π
(2)
P(t)
m- m m+ X
E(X)
x−m
T=
-1 E(T) =0 1 σ
x−u x−E ( x )
z= =
G(t) ou G(z) t ou σ σ (x)
F(x) = g(t)
P(m X x) = p (0 T t) = G(t)
Fonction de répartition
x
F(X) = P(x x) = ∫−∞ f ( x ) d ( x )
x−m
T=
Soit en effectuant un changement de variable σ
x−m
x=
F(x) = p(x x) = ∫−∞ σ
p(t )dt
t
∫
Par conséquent (t)= −∞ p(t )d(t ) pourra être tabulée et servir au calcul des
probabilités attachées à n’importe quelle variable aléatoire X distribuée
normalement.
+∞
Comme ∫−∞ f ( x ) dx=1 alors:
190
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
m
∫−∞ f ( x)dx=0,5
+∞ 0
∫m f ( x ) dx=0,5⇒∫−∞ p ( t ) dt=0,5
+∞ +∞
∫m f ( x ) dx=0,5⇒∫0 p ( t ) dt=0 ,5
0 1
ζ (t )=∫−∞ p ( t ) dt+∫0 P ( t ) dt=0,5+G(t )
x−m x− x̄
T= =
-2 -1 0 1 2 σ σ
68,26 %
95,44 %
P( x̄−σ ≤x≤ x̄ +σ )
La loi normale occupe une place de choix parmi les différentes lois de
probabilité. En effet, un grand nombre de lois de distribution courante se
rapprochent de la loi normale.
191
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Travaux pratiques
Quel est le nombre d’individus ayant une taille comprise entre 140 cm et
170 cm si l’effectif total de l’établissement est de 1000 individus.
Solution
x̄ = 150 cm m = = 150 cm
x = 20 cm
x−m x− x̄
T= =
-0,5 0 1 σ σ
ni
f i= ↦ pi ⇒ni =nf i =np ( 140≤x≤170 )=nPi
n
=np (140−150
20
≤T ≤
170−150
20 )=np (−0 ,5≤T ≤1)
= 1000 P(0 t 0,5) + P(0 T 1) = 1000 0,1915 + 0,3413
ni = 533 individus dont la taille est comprise entre 140 cm et 170 cm.
192
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Solution
150 Xm x
x−m
T=
0 Tm = ? σ
σ . t m=x m− x̄ ⇒ x m= x̄+ σ .t m
Gtm = 0,3
¿¿¿
¿
t m−0 , 84 0 , 3−0 , 2995
=
0 , 85−0 , 84 0 , 3023−0 , 2995
0 , 3−0 ,2995
t m= ( 0 ,85−0 , 84 )+0 ,84
0 , 3023−0 ,2995
tm = 0,841785714
1200 autres ont été mis au chômage. Quelle est la probabilité pour que
sur 6 personnes recherchant un emploi, il n’y ait pas plus de 2 personnes
qui aient déjà travaillé ?
4. A partir de la vente de 100 postes de télévision, ayant fonctionné le
même nombre d’heures pendant une année, on a pu établir le tableau
suivant reliant le nombre Ni des postes vendus au nombre Ki
d’intervention du réparateur.
Nombre d’intervention Ki 0 1 2 3 4
Nombre de postes Ni 61 30 7 2 0
a) Représentez graphiquement le diagramme en bâtons plus le
polygone des fréquences, les ogives en escaliers.
b) Calculer et interpréter la moyenne arithmétique, la variance, l’écart
type ;
c) Comparez les valeurs observées de Ni déduites d’une loi de Poisson
ayant même valeur moyenne.
4. En 1961, le professeur Lampman a étudié la pauvreté dans les sociétés
industrialisées. Il aboutit à la conclusion que 19 % de la population
américaine peut être considérée comme pauvre si le seuil de pauvreté
pour le revenu annuel d’une famille citadine de 4 personnes est fixé à
2500 $
a) En supposant que la répartition des revenus annuels suit une loi
normale de valeur moyenne 9540 $, quel est l’écart-type de cette
distribution ?
b) Si seulement 10 % de la population peut être considéré comme riche
entre quelles limites doit se situer le revenu annuel d’une famille citadine
pour qu’elle puisse être considérée comme ayant un revenu x moyen tel
que X1 X X2 et X1, X2 étant définis par p(x x1) = 0,19 et p (x x2)
= 0,10 ?
6. En 1965 dans la région parisienne 11 % des revenus individuels était
supérieur à 20000 F et 3 % des revenus inférieurs à 3000 F. En supposant
que la loi de répartition des revenus suit une loi normale.
a. Quel est le revenu individuel moyen et quel est l’écart type ?
194
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
I. ECHANTILLONNAGE
La théorie de l’échantillonnage a pour objet l’étude des relations
qui existent entre la distribution d’un caractère dans une population dite :
population mère, et les distributions de ce caractère dans tous les
différents échantillons prélevés dans cette population. Pour que ces
relations soient valables, il faut que l’échantillon soit prélevé d’une
196
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
différents échantillons : { X̄ 1 , X̄ 2 . .. X̄ k }
V (X ) σ ( X) σ
E ( X̄ )=E ( X )=µ var ( X̄ )= σ ( X̄ ) = =
n √n √n
b. Echantillonnage exhaustif
On démontre que :
197
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
n N!
k =C N =
( N−n ) !n !
√
E( X̄ )=µ σ ( X̄ )=
σ N−n
√n N−1
quand N →+∞ ,.
√
N-n
N-1
tend vers 1
χ 2i = i=1
σ
2 x ij
où est la valeur du caractère du jième individu de
{ χ 21 , χ 22 , .. . χ 21 , .. . χ 2k }
du KHI-DEUX :
II. ESTIMATION
Si l’échantillonnage étudie les relations qui existent entre une
population et tous ses échantillons de même taille n, l’estimation se
préoccupe de la représentativité de la population par un échantillon. Il
199
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
1. Estimation ponctuelle
) et
Considérons une distribution dans une population mère (N,µ,
X̄ 1
de cette population. On suppose que et i sont connus et on cherche µ
et .
2°. Il convient de plus que, sur la série (théorique) de tous les échantillons
de taille n, la moyenne des estimateurs soit égale au paramètre de la
population mère (estimation sans biais). Cela est encore vrai pour X̄ et f
2
mais ne l’est pas pour la distribution des σ 1 .
[ ]
n n
1 1
S¿i 2= ∑
n−1 j=1
( X ij− X̄ i )
2
S¿i 2=
n−1
∑ ( X ij )2−n ( X̄ i ) 2
j =i à partir des valeurs du
caractère observé sur l’échantillon i. Le dénominateur n-1 est appelé
nombre de degré de liberté de l’estimation.
¿2
σ2
Remarque : Si n est élevé Si est presque égale à i ( S ¿i 2≈ σ i )
Interprétation
P ( X̄−1 , 96 σ ≤X ≤ X̄ +1 , 96 σ )=0 , 95
Nous avons un seuil de confiance de 95 % pour que la valeur
X̄ -1,96 X̄ −σ X̄ X̄ + σ X̄ +1 , 96 σ X
62,26 %
95 %
X̄−µ
t=
σ
On introduit le caractère t donné par √n qui associe à
chaque échantillon i l’écart réduit ti. i = 1,…,k.
A
f ( t )= γ +1
( )
1+
t²
γ
2
où est le nombre de liberté.
b
P ( a≤t i ,≤b )=∫a f ( x ) dx
A = une constante dépendant de ; c’est-à-dire
confiance).
X̄ 1 est un élément de la distribution d’échantillonnage des
moyennes.
σ
E( X̄ )=µ σ ( x̄ )=
√n
a) n 30 : grands échantillons
203
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
b) n 30 : Petits échantillons
E( X̄ )=µ et σ ( X̄ )=
√
σ N −n
√ n N−1
204
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Il vient l’encadrement :
X̄ 1 −t
σ
√n √ N−n
N−1
≤μ≤ X̄ 1 + t
σ
√n √ N −n
N −1
TRAVAUX PRATIQUES
1. Dans une fabrication portant sur 50000 articles, un sondage sur 400
articles a donné un poids moyen par article de 200 g avec un écart type
de 50 g. Estimer le poids moyen dans la fabrication au seuil de confiance
de 95 %.
Résolution
N = 50000 ; n = 400 ;
X̄ 1 = 200 g ; = 50 g ; S¿1 ≈σ 1 1- = 95 % = 5
1
σ1 σ1
X̄ t −t α ≤µ≤ X̄+ t α
√n √n
50 50
200−1 ,96 . ≤µ≤200+1 , 96
√ 400 √ 400
195 , 1≤µ≤204 , 9 µ∈ [ 195 , 1 ;204 , 9 ] P (195 , 1≤µ≤204 , 9 )=0 , 95
Interprétation
Résolution :
0 , 422365786 0 , 422365786
⇔20 , 1125−2 , 365. ≤µ≤20 , 1125+2 ,365 .
√8 √8
19 , 76≤µ≤20 , 47 P (19 ,76≤µ≤20 , 47 )=0 ,95
Interprétation
P−t α
√ p.q
n
≤f i ≤ p+t α
p.q
n √
206
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
avec
S=
√ f 1 ( 1−f 1 )
n
⇒
I.C. devient
f 1−t α S≤p≤f 1 +t α S
σ ( f )=
√ √
pq N−n
n
.
N−1 et estimer p par f1 ; q par 1-f1.
T.P
Résolution :
f 1−t α S≤p≤f 1 +t α S or S=
√ f 1 ( 1−f 1 )
n
⇒ S=
√ 0 ,2×0 , 8
35
=0 , 067612
.
0,067 p 0,3325
différence entre
X̄ 1 et µ l’écart entre l’échantillon et la population est très
grand pour être attribué aux fluctuations d’échantillonnage.
X̄ 1−µ
t 0=
σ
Le critère de test est la déviation réduite √n
Sous l’hypothèse H0, ce critère présente des fluctuations d’échantillonnage
qui, pour n 30, sont distribuées normalement. En considérant par
exemple un seuil de 5 %, on est conduit à adopter la règle de décision
suivante :
différence
X̄ 1 −µ est significative (non due au hasard) au seuil de
signification de 5 %, ou encore que l’échantillon n’est pas
représentatif de la population, au mêle seuil.
Dans ce cas, une erreur peut être commise, qui consiste à rejeter
l’hypothèse H0 alors que celle-ci est exacte. On dit qu’il s’agit d’un risque
d’erreur de première espèce. Il est égal au seuil de signification choisi, et
par conséquent adopter un faible seuil revient à limiter la
probabilité de rejeter à tort l’hypothèse nulle.
2. Test de conformité
a. Comparaison d’une moyenne observée à une moyenne
théorique
209
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
X̄ 1−µ
t 0=
σ
1°. Si est connu, le critère du test H0 est l’écart réduit : √n
2°. Si n’est pas connu, on utilise son estimateur S* et t 0 devient :
X̄ 1−µ
t 0= ¿
S∗¿
√n
Dans les 2 cas, il faut tester t0 à l’aide de l’intervalle de confiance I.C
déterminé par :
T.P. n°1
Résolution
n = 40 30
X̄ 1 =260 = 50 jours µ = 240
260−240
t 0= =2 , 53
50
√ 40
t 0 =2 ,53 ∉ [−1 , 96 ;1 , 96 ] Rejetons : H . Ainsi nous acceptons H .
0 1
T.P. n°2
Solution :
S* = 0,42236578
20 ,1125−19 , 6
t 0= =3 , 43
0 , 42236578
2. Test statistique : √8
Région critique I.C ?
= 0,05
f 1−P
t 0=
Résolution :
n = 80
ni 18
ni =18 f i= = =0 ,225
n 80
P = 0,15
= 0,05
Test statistique
f 1− p 0 , 225−0 , 15
t 0= = =1 , 88
√ √
p.q
n
0 ,15 . 0 , 85
80
1-
α α
2 2
tα tα
−
2 0 2 X
( )
P −t a ≤T ≤t a =1−α
2 2
2°.Test unilatéral
Règle de décision
Si t0 I.C (c’est-à-dire si t0 t) on ne rejette pas H0. Mais si t0 I.C
(c’est-à-dire si t0 t) on doit rejeter H0. Dans ce cas on accepte donc H1.
1-
0 t T
-t 0 T
P ( T ≥−t α ) =1−α
Remarque : Les limites de l’I.C à ne sont pas les mêmes suivant que le
test est bilatéral ou unilatéral. Le tableau suivant donne quelques valeurs
de t pour une distribution normale de l’écart réduit t.
Risque 0,5 % 1% 5% 10 %
3. Test d’homogénéité :
a. Comparaison de 2 moyennes observées :
Soient
X̄ 1 et X̄ 2 les moyennes des valeurs d’un caractère
et (n2,
X̄ 2 , ) et les 2 populations par (µ , ) et (µ , ).
2 1 p1 2 P2
X̄ 1 ,− X̄ 2
normales. Sous l’hypothèse H0, n ( ) est distribué normalement avec
σ 2p1 σ 2p2
V X̄ X̄ =V X̄ 1 +V X̄ 2 = +
1 2 n1 n2
σ X̄
1
− X̄ 2=
√ σ 2p t
n1
+
σ 2p1
n2
X̄ 1 − X̄ 2
t n=
√
2 2
σp σP
1 2
+
n1 n2
L’écart réduit à tester est donc
σp σp
1 2
Si les écarts-types et sont inconnus, on les remplace par leurs
S¿1 S¿2
estimateurs et . En particulier, si les échantillons sont très grands, on
peut prendre :
S¿1 S¿2
= 1 et = 2. On poursuit alors le test en utilisant l’I.C correspondant
décision habituelle.
S¿ 2 σ2
L’estimateur de est donné par :
√ 1 1
+
n1 n 2
A 65 13,2 1,8
B 85 12,5 1,6
Résolution :
n1 = 65 n2 = 85
13 ,2−12 ,5
t n=
√ ( 1, 8 )2 ( 1 , 6 )2
65
+
85
217
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
S¿1 =σ 1 et S ¿2=σ 2
Ici on a adopté l’approximation étant donné qu’on
Règle de décision :
risque de 1 %.
b. Comparaison de 2 fréquences
PB.
p.q p.q
V t −t =V t 1 +V t 2 = +
1 2 n1 n2
puisque sous l’hypothèse nulle nous disons
PA=PB=P.
f 1 −f 2
t n=
significative au seuil de 5 %.
Résolution :
n t1 48
n1 =800 et nt 1=48⇒ f 1 = = =0 , 06 .
n1 800
n 32
n2 =400 et nt =32⇒ f 2 = 1 = =0 , 08
2 n2 400
√ p .q
( n1 + n1 )
1 2 √ 0 , 06667 . 0 , 93333
1
(+
1
800 400 )
H0 : les pourcentages sont égaux c’est-à-dire la différence observée est
due au hasard : P1 = P2
220
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Pour chercher l’I.C, examinons d’abord les produits n.p et n.a ; n.p et n.q
X̄ i X̄ i
caractérisée par (n, ) où est la moyenne du caractère X dans
χ ¿i = i=1 2
σ
x ij
Où est la valeur du caractère du jè individu de l’échantillon i.
χ 2i
que lorsque la population est distribuée normalement, le caractère suit
221
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
2 ( 2)
γ 2
−1 χ
f ( χ ) =A ( χ )
2
.e 2
χ 2α
valeur de ayant la probabilité d’être égalée ou dépassée, en fonction
paramètre
√ 2 χ2
est distribué approximativement suivant une loi normale
de moyenne
√ 2 ∂−1 et d’écart-type égale à 1.
B. Test de conformité
2
r
( n k−npk )
χ =∑
2
k =1 npk
n = effectif de l’échantillon
χ 2α
pour déterminer la valeur de ayant la probabilité d’être dépassé et
χ 2 ≤ χ 2α
; l’hypothèse H0 est valable.
χ 2 ¿ χ 2α ¿
; l’hypothèse H0 est à rejeter.
Résolution :
223
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
éliminés : 3 modalités ;
- Hypothèse nulle H0 : il y a conformité entre les résultats de
χ 2 ¿ χ 2α ¿
Règle de décision : rejeter H0 si
χ 20 , 01=9 , 21
= r-1 =3-1 = 2 Pr = 1 % 9,21
χ 2 0 =13 , 82
1
00
Pr = 1 ‰ 13,82
χ2
1 %= 9 , 21 ¿ ¿
de 1 %.
224
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
C. Test d’homogénéité
ligne i par le total des effectifs da la colonne k divisé par l’effectif total.
( )( ∑ )
ℓ r
∑ nik nik
i=1 k=1
t ik=
n
Soit
( nik −t ik ) 2
χ =∑
2
ik t ik
Le ² relatif à l’ensemble des données est :
86
Résolution :
calculer tik.
2 3
∑ nik ∑ nik ( nik −tik )2
t ik= i=1 k =1
χ ²=∑
n ik t ik
160×115
t 12= =46 χ 2=5 ,072704512
100
etc . χ 2≈5,075
χ 2 ¿ χ 2α ¿
→ χ 210 % ( 2 )=4 , 61
Rejet de H0 si = (I-1) (r-1) = 0,1
226
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
→ χ 25 % ( 2 )=5 , 99
= (2-1) (3-1) = 2 = 0,05
a) Test de l’hypothèse = 0
- Hypothèse nulle H0 : = 0
- Hypothèse alternative H1 : 0
équivalentes :
rα √ ϑ
tα=
√ 1−r 2α
Le critère de test est alors
I . C rαϑ I . C rαϑ
Si r , on rejette H0. Si r , on ne peut rejeter H0.
Résolution
H0 : = 0
H1 : 0
rα √ ϑ 0 , 856 √12−2
tα= = =5 ,236046957≈5 , 24
1ère méthode :
√ 1−r α 2
√1− ( 0 , 856 )
fortement corrélées.
b) Test de l’hypothèse =
1
µZ = ln
2 [ ]
1+ ρ0
1− ρ0
et σ Z =
1
√ n−3
Il existe une table qui donne les valeurs des variables de Fisher Z pour les
|Z 0 −µZ| |Z 0 −µZ|
Z= =
√
σZ 1
- n−3
Le critère de test est alors : ;
-
Déterminer l’I.C sur la table de la loi normale ;
%?
Résolution
H1 : P 0,90
Critère de test :
Z 0= ln
[
1 1+0 , 856
2 1−0 , 856 ] 1 1+0 ,9
=1 , 278182807 µZ = ln
2 1−0 , 9 [
=1 , 47221949
]
1 1
σ Z= = =0 , 3333333
√ n−3 √12−3
|1 , 278182807−1 , 473219491|
⇒ Z= =0 ,582110100
0 , 3333333
231
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
-t = -1,645
Donc nous ne pouvons rejeter H0. Ici les notes sont fortement
corrélées à 0,90.
Résolution :
L’I.C. à 95 % du µz est :
Z0-Zzµz Z0 + Zz
0,33333
0,63 µz 1,93
|Z 0−µ Z|
z= ⇔ Z 0 −Zσ Z ≤u Z ≤Z 0+ Zσ Z
σZ
VI.1. INTRODUCTION
On considère une expérimentation agricole au cours de
laquelle trois variétés de maïs sont cultivées dans plusieurs champs de
dimension égale et leurs récoltes par champ sont prélevées. On est
intéressé à tester l’hypothèse nulle selon laquelle les 3 variétés de maïs
produisent en moyenne des récoltes égales en quantité.
variété des maïs est appelée ANOVA I. Si les observations sont classées
d’après deux critères tels que la variété du maïs et le type d’engrais, nous
avons à faire à ce qu’on appelle une ANOVA à deux facteurs soit ANOVA II.
VOCABULAIRE
- Facteur : c’est une variable explicative qui intervient dans l’analyse.
S’il n’est pas qualitatif, il est quantitatif.
μ , σ 2 : Y i → N ( μ i , σ 2i )
n1 n1
1 1
∑Y
ni j=1 ij 2
n1−1 ∑
( y ij− ȳ i )2
i
Ŷ i= et s =
1) ŷi→N(
( )μi
σ 2i
ni
S
i2
σ 2 X (2ni−1 )
2) (n1-1) →
2 2
1 k
3) ŷ1,…,ŷket, …, S , …, S sont des variables indépendantes. On définit
encore la moyenne générale de toutes les observations par :
ni 1
1 1
N ∑i =1 ∑
k
j=1
Y ij
N
∑ ni .
ŷ= = ŷi.(6.1)
^y . . .
a) Ecart entre une observation Yij et la moyenne générale
k ni k ni k ni
∑ ∑ Y ij− ) =∑2
∑ ( ∑ ∑ ( y ij
i=1 j=1 i=1 j =1= i=1 j=1
ŷ.. ŷi-ŷ..)2+ -ŷ1..)2(6.2).
Schématiquement on a : SSTO=SSTR+SSE.
k n k y
1 . .. 2
∑ ∑ Y ij2− n ∑ Y i2− kn
i=1 i=1
j=1
. Si n1=n2=…ni=…nk=n, on a :SSTO=
k 2 k ni k
1 y ... 1
∑
n i =1
y 2i −
n
∑∑ Y 2ij−
n i=1
∑ yi 2=SSTO−SSTR.
i=1 j=1
SSTR= SSE=
. SSTO=SSTR+SSE.
Si n1≠n2≠…≠n1, ≠… nk≠n, on a :
k ni 2
y
∑ ∑ Y 2ij− N
i=1 j=1
SSTO=
k
Y 1i y 2
∑ ni N
−
i=1
SSTR=
k
∑ ni
i=1
N=
k k k
y 2i
∑ ∑ y 2ij −∑ ni
=SSTO−SSTR
i=1 i=1 i =1
SSE=
SSE
σ2
est une valeur de la variable aléatoire ayant pour moyenne N-k et en
SSE
N −K σ2
conséquence Peut servir comme estimateur non biaisé de .
238
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Cette quantité est appelée le carré moyen résiduel et est noté par MSE,
SSE
( )=E( MSE )=σ 2
N −k
d’où l’espérance mathématique E
SSTR
k−1 σ2
Le rapport fournit le 27ème estimateur sans biais de . Cette nouvelle
quantité est appelée le carré moyen factoriel et est noté par MSTR. Si Ho
est vraie alors, on a :
SSTR
(
k−1 σ2
E )=E(MSTR)=
MSE et MSTR sont des variables indépendantes. Au cas où l’Ho est fausse,
et selon la propriété des estimateurs biaisés, on a :
1
σ 2+
k−1
∑ ni ai 2 où
E(MSTR)= ai=ii-i
SSTR SSTR
( h−1 ) σ 2 k−1 MSTR
f c= = =
SSE SSE MSE
k ( n−1 ) σ 2
k ( n−1 ) k ( n−1 )=kn−k =n−k
avec
fc
est une valeur d’une variable aléatoire ayant une distribution de FISHER
avec k-1 et k(n-1) degrés de liberté.
239
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
2
γ1 χ γ1
χ2
γ1 γ1
f c= = ⇒ F ( γ1 , γ 2 )
2
γ2 χ 2
γ2
χ
γ2 γ2
TABLEAU D’ANOVA I :
SSB
SSW
Fc= dans les ouvrages anglo-saxons. MSTR=SSB MSE=SSW.
SSB
SSW
f c= dans les ouvrages anglo-saxons.
Groupes
240
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
marque I II III IV V
d’aspirin A 5 4 8 6 3 Y1.=2 2
1
Y =676
e 6
B 9 7 8 6 9 Y2.=3 2
2
Y =152
9
1
C 3 5 2 3 7 Y3.=2 2
3
Y =400
0
D 2 3 4 1 4 Y4.=1 2
4
Y =196
4
E 7 6 9 4 7 Y5.=3 2
5
Y =108
3
9
Données
Y 2. . .
=(132)2=17424
Y2=(132)2=17424
n=5
k=5
N=kn=25
k ni
∑ ∑ Y 2ij
i=1 i =1
=25+16+64+36+9+81+49+64+36+81+9+25+4+9+49+4+9+1
6+1+16+49+36+81+16+49=834
k ni
y2
∑∑ yij2
N =kn
i=1 j=1
SSTO= -
17424 20850−17424
= =137 , 04
25 25
SSTO=834-
k
1 y2 1 17424
∑
n i=1
2
y i − = 3882−
N 5 25
=776 , 4−696 , 96=79 ;44
SSTR=
SSE=SSTO-SSTR=137,04-79,44=57,6
TABLEAU ANOVA I
Fa{(k-1),k(n-1)}=fa{(k-1),(N-k)}
F0,05(4,20)=2,87
μ
Soit la moyenne d’heures de soulagement procurée par les aspirines de
la ièmé marque :
Fα [ ( k −1 ) , k ( n−1 ) ]
4° Rejeter Ho si Fc>
26
=5 , 2
5
Ŷ1.=
39
=7 , 8
5
Ŷ2=
20
=4
5
Ŷ3=
15
=2 ,8
5
Ŷ4=
243
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
33
=6 , 6
5
Ŷ5=
Ŷ2≥Ŷ5≥Ŷ1≥Ŷ3≥Ŷ4
7,8≥6,6≥5,2≥4≥2,8
C1 14 6 12 10 8
C2 16 14 8 8 14
C3 14 16 14 14 12
Y1.=50
3
∑ Y i =180
i=1
2
1
Y =2500
Y2=60
Y2=1802=32.400
Y3=70
244
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Y22=3600
Y32=4900
k ni
+256+196+64+64+196+196+256+196+196+144=2304
32400
=144
15
SSTO=2304-
1 y2
n
∑ i N
y 2
−
SSTR= =2200-2160=40
SSE=SSTO-SSTR=144-40=104
TRAITEMENT 40 2 20 2,3
Totale 144 14 - -
f0,05(2,12)=3,89.
Ex3. Il semble que les voitures très chères sont assemblées avec
beaucoup plus de délicatesse que les voitures moins chères. Pour
245
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Modèle de voitures
A 4 7 6 6
B 5 1 3 5 3 4
C 8 6 8 9 5
23
=5 ,75
4
Ў1=
21
=3 ,5
6
Ŷ2=
36
Ȳ 3 = 5 =7 , 2
Une des particularités ici, c’est que les n sont différents n 1≠n2≠n3.
Résolution :
k ni 2
y
∑∑ yij2 −
N
i=1 j=1
SSTO=
k
y2 y2
∑ −
ni N
i=1
SSTR= SSE=SSTO-SSTR
246
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
k k
yi2
∑ yij2 − ∑ ni
i=1 i =1
SSE=
6400
=65 , 33
15
SSTO=492-
6400
15
SSTR=(529/4+441/6+1296/5)-
6400
15
SSTR=132,25+73,5+259,2-
6400
=38 , 28
15
SSTR=464,95-
SSE=65,33-38,28=492-464,96=27,05.
k ni
Y1=23→y21=529
2
2 =441
Y2=21→y
2
3 =1296
Y3=36→y
∑ Y 1=80
∑ Y i=80
Y2=(80)2=6400
∑ Y 2i =2266
TABLEAU D’ANOVA I.
f0,05(2,12)=3,89
1 2 3 4
1 2 4 8
2 4 1 7
3 5 7 9
3 4
Traitement : 4 concentrations.
Niveau de facteur : 4
1 ȳ 1 =2
1 2 3 y 1=6
2 ȳ 2 =4
2 4 5 3 6 Y 2=20
248
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
3 ȳ 1 =4
4 1 7 4 y 3=16
4 ȳ 4 =8
8 7 9 Y 4=24
2
1 =36
Y1=6→y
2
2 =400
Y2=20→y
2
3 =256
Y3=16→y
24 =576
Y4=24→y
∑ yi =66
∑ yi )2= y 2=(66 )2=4356
(
k ni
k ni 2
y 4356
∑ ∑ yij2− N =380−15 =89 , 6
i=1 j=1
SSTO=
k
y 2i y 2 36 400 256 576 y 2 4356
∑ ni N
− = +
3 5
+
4
+
3
− =348−
N 15
=57 , 6
i=1
SSTR=
SSE=89,6-57,6=32.
ERREUR 32 11 2,91
249
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Totale 89,6 14 -
Le test que nous devons utiliser, appelé le test de BARTLETT est basé sur
une statistique dont la distribution d’échantillonnage fournit les valeurs
exactes quand les tailles d’échantillons sont égales. Ces valeurs critiques
pour les échantillons de tailles égales peuvent alors être utilisées pour
250
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
obtenir des biens meilleures approximations des valeurs critiques pour des
échantillons de tailles inégales.
2 2 2
1 , S 2 , . .. . , S k
D’abord calculons les k variances des échantillons S . Des
k
∑ ni=N
i=1
échantillons de tailles n1, n2,…., nk avec .
Maintenant
Quand les tailles d’échantillons sont inégales, l’hypothèse nulle est rejetée
α α α
au seuil de signification de si b<bk (bk ( ; n1, n2…..nk) ; où bk ( ; n1, n2,
1
n[ 1 k
b k ( α ;n1 , n2 , . .. , nk )≃ n b ( α , n1 ) +n2 b k ( α ,n 2 ) +n k b k ( α , nk ) ]
…., nk) est donnée par
A 4 7 6 6
B 5 1 3 5 3 4
251
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
C 8 6 8 9 5
Solution :
σ 21=σ 22 =σ 23
1° Ho :
σ 21≠σ 22 ou σ 22≠σ 23 ou σ 21 ≠σ 23
Ha :
α
2° =0,05
α
Nous rejetons Ho si b<bk( , n1, n2, n3)→b<b3(0,05 ;4,6,5)
1 1
] 15 [
[4 b3 (0 , 05 ;4 )+6 b3 4 ( 0 , 4699 ) +6 ( 0 , 6483 ) +5 ( 0 , 5762 ) ]
15 3
= (0,05 ;6)+5b (0,05 ;5) =
b<b3(0,05 ;4,6,5)=0,5767
n1 ∑ x 21−( ∑ x 1 )
2
( 4 )( 137 )−( 529 )
S21 = = =1 , 5833
n1 ( n1−1 ) ( 4 )( 3 )
n2 ∑ x 22 −( ∑ x 2 )
2
( 6 ) ( 85 ) −( 441 )
S22 = = =2 , 3
n2 ( n2 −1 ) ( 6) ( 5)
n3 ∑ x 23 −( ∑ x 3 )
2
( 5 )( 270 ) −( 1296 )
S23 = = =2 , 7
n3 ( n3 −1 ) ( 5) ( 4 )
S2p
Calculs de
Calculs de b :
252
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
1
1
[ n −1 2 n −1 2 n −1
b= 2 ( S 21 ) 1 ⋅( S2 ) 2 ¿ ( S 3) 3
Sp
] N−k
1
1
[3 5
b= 2 ( S 21 ) ⋅( S22 ) ⋅( S23 )
Sp
4
]
12
1
1 2 , 210032478
b=
2, 2542
[ (1 , 5833 )3⋅( 2 ,3 )5⋅( 2 , 7 )4 ]12 =
2 , 2542
=b=0 , 9804
… … … … …
Yij=μ+σi+βj+εy
{i=1,.. .,k¿¿¿¿
k n
1
μ= ∑ ∑ Y ij
kn i=1 j=1
Ici μ est la moyenne générale qui équivaut :
n
∑ B j =0
j=1
Les effets de blocs Bj sont tels que , les effets de
k
∑ α j=0
j=1
traitements σi sont tels que et les εij sont des variables
indépendantes des distributions normales avec pour moyennes
respectives 0 et pour variance comme σ 2. Dans l’équation Yij=μij+εij, Y ij-
μij= εij, les εij mesurent la déviation écart de la valeur observée Y ij de la
moyenne de la population μij où μij=u+ σi+ βj et εij = Yij- μij. Les moyennes
de populations valent respectivement en admettant que les σ i et βj sont
additives :
n k
1 1
μi = ∑ ( μ+ α i + β j ) =μ+ α i μ j= ∑ ( μ +α i + βi )=μ+ β j
n j=1 k d=1
;
X 1 =X 2=. .. X k=0
H0 :
254
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Xi
Ha : au moins un des n’est pas nul.
H0 : β1= β2 = …= βn=0
k n
y.2. . 1
k
y 2.. .
=∑ ∑ y 2ij − = ∑ y i.−
2
1
n
y 2. ..
k∑
2
= y .j −
j=1 kn
SSB
k n
2
=∑ ∑ ( y ij − ȳ i.− ȳ . j + ȳ . . )
i=1 j=1
SSE
SSE=SSTO-SSTR-SSB
SSTR SSE
σ2 σ2
Au cas où H'0 est vraie alors et sont des valeurs
MSTR
fα [ ( k −1 ) ; ( n−1 ) ( k −1 ) ] oùf Tr =
MSE
255
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
SSB SSE
σ2 σ2
De manière similaire, si h''0 est vraie, alors et sont
χ2
des valeurs de VA indépendantes ayant de distributions de avec n=1 et
(n-1) (k-1) ddl. Si H0'' n’est pas vraie, dans ce cas SSB va également
βj
refléter la variation parmi les variations et d’après le théorème cité un
peu plus haut, nous rejetons
MSB
f B≥f α [ ( n−1 ) ; ( n−1 ) ( k−1 ) ] où f B =
MSE
H"0 si
Route 1 2 1 3 4 5
Route 2 1 1 4 2 2
Route 3 4 5 5 3 3
Route 4 1 5 4 3 2
Calculs totaux
y 25 =( 12 )2 =144 ∑ y 2j =752
i=1 y=60⇒ y 2=3600
k n 2
y
∑ ∑ y 2ij− kn
i=1 i=1
SSTO= n= (colonne) ; k (ligne).
k n
∑ ∑ y 2ij=
i=1 j=1
4+1+9+16+25+1+1+16+4+4+16+25+25+9+9+1+25+16+9+
4=220
3600
SSTO=220− =40
20
k
1 y2 1 3600
= ∑
n i=1
y 21− = 950−
N 5 20
=190−180=10
SSTR
n
1 y2 1
= ∑ y 2
−
k j=1 j N 4
= x 752−180=8
SSB
SSE=SSTO-SSTR-SSB=40-10-8=22
257
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Blocs 8 4 8 MSB 2
(colonnes)
2⇒ f β= = =1 , 09
4 MSE 1 , 83
Erreurs 22 12 22 -
(résidus)
1 , 83⇒
12
totale 40 19 - -
Solution
α i=0 , i=1 , .. . , 4
1. H'0 :
'
''
H a : β j=0 , j=1 ,2 , 3 , 4 , 5
''
H a : β j≠0 pour au moins une valeur de βj
α
2. Seuil =0,05
Variétés de
maïs
Engrais V1 V2 V3
t1 64 72 74
t2 55 57 47
t3 59 66 58
t4 58 57 53
'
H0
Tester l’hypothèse nulle au seuil de 5% qu’il n’y a
aucune différence dans les récoltes moyennes de maïs lorsque les
différentes sortes d’engrais sont utilisées. Tester également l’hypothèse
H '0'
nulle qu’il n’existe aucune différence dans les récoltes moyennes de 3
variétés de maïs.
Calculs
K=4,n=3
k n
y .. .2 518400
∑∑ =[ ( 64 ) + (72 ) +.. .+ ( 53 ) ]−
2 2 2
y 2ij− =43862−43200=662
i=1 j=1 nk 3x4
SSTO=
1
k
y 2. . 1
= ∑ y i − = x 131094−43200=498
2
n i=1 nk 3
SSTR
259
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
1
n
y 2.. . 1
= ∑ y j − = x 173024−43200=56
2
k j=1 nk 4
SSB
SSE=SSTO-SSTR-SSB=662-498-56=108
Erreurs SSE=108 6 18 -
(résiduels)
TOTALE SSTO=662 11 - -
'
H 0 : α 1 =α 2=α 3 =α 4 =0
1.
'
H a: αi
au moins un n’est pas nul
H '0' : β 1 =β2 =β 3 =0
''
H a : au moins β j
n’est pas nul.
α
2°: = 0,05
260
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
MSTR MSB
F Tr= et F B=
MSE MSE
H0
4. Rejeter pour le traitement soit H'0 si
5. calcul
H '0'
6. Décision : puisque ftr =9,22>4,76, nous rejetons au seuil de 5%,
nous concluons qu’il existe une différence significative dans les récoltes
moyennes de maïs lorsque les différentes sortes d’engrais sont utilisées
ȳ 1 ≻ ȳ 3≻ ȳ 4 ≻ ȳ 2 ⇒ 70≻61≻56≻53
et puisque fB =1,56<5,14, nous acceptons
H '0'
au seuil de 5% et nous concluons que les récoltes moyennes de 3
variétés de maïs ne diffèrent pas significativement.
ȳ 1 = ȳ 2 = ȳ 3 ⇒59≈63≈59 , ȳ=60
261
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Calcul
Totaux
262
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
r c
∑ ∑ y 2ij .=48841+ 62500+60516+56169+ 63504+ 48400
i=1 j=1
r c n
y 2. .
SSTO=∑ ∑ ∑ y 2ijk −
i=1 j=1 k =1 rcn
∑ ∑ ∑ y 2ijk= [70 2+792 + 722 +832 +892 +78 2 +812 + 862 +79 2 ]
+ [772+812+792+772+872+882+742+692+772]
+ [822+782+802+942+832+792+722+792+752]
263
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
+ [852+902+872+842+902+882+682+712+692] =
232 000
y 2 =( 2880 )2 =8294400
1
r
y 2. . 2073. 878 8294400
SSR= ∑ y 1. .−
2
= − =30 , 89
cn i=1 rcn 9 36
1
c
y 2.. 1
rn ∑
2
SSC= . y .j. − = . 2772. 000−230 . 400=600
j=1 rcn 12
r c
1 y2
SS ( RC )= ∑ ∑
n i=1 j=1
y 2ij .−SSR−SSC−
rcn
1 8294 . 400
= . 694694−30 , 89−600− =
3 36
231564,7-30,89-600-
230.400=533,78
SSE=SSTO-SSR-SSC-SS(RC) =
1600-30,89-600-533,78 = 435,33
264
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Totale SSTO=160 35 - -
0
b)¿¿¿
c)¿¿¿
2° = = 5 % = 0,05
H0¿ {si flignes≻fα[(r−1);rc(n−1)]=f 0,05[4−1;4 x3(3−1)]=f0,05(3;24)=3,01¿ {sif colon es≻f α[(c−1);rc(n−1)]=f 0,05[2;24]=3,40 ¿¿¿
5° Calcul (voir ci-haut)
f colonnes=16 ,54≻3 , 40 H }0 } } { ¿¿ ¿
b) Comme , nous rejetons au seuil de
5% et concluons qu’au moins un des β j # 0.
10,6 5,3
7,1 3,9
Solution
ȳ 2,425 4,875
y 2. . .=( 53 ,2 )2 =2830 , 24
r c n
∑ ∑ ∑ y 2ijk =
i=1 j=1 k =1
(9,8)2+(10,6)2+62+(5,3)2+(6,2)2+(7,1)2+(4,3)2+(3,9)2=395,0
4
rcn=8
2830 ,24
SSTO=395 ,04− =41 ,26
8
1
r
y 2.. .
cn ∑
2
SSR= y i... −
i=1 rcn
r
∑ yi2.. .=( 31 , 7 )2 + ( 21, 5 )2 =1467 , 14
i=1
1 2030 , 24
SSR= 1467 , 14− =13 , 005
4 8
1
c
y 2. . .
SSC= ∑ y . j .−
2
rn j=1 rcn
c
∑ y .2j.=( 33 , 7 )2+ ( 19 ,5 )2=1515 , 94
j=1
1 2830 , 24
.1515 , 94− =25 , 205
4 8
SSC=
1
r c
y 2.. .
SS ( RC )= ∑ ∑ y ij .−SSR−SSC−
2
n i=1 j =1 rcn
∑∑ y ij
268
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
20, 11,
4 3
13, 8,2
3
SSE=SSTO-SSR-SSC-SS(RC)= 41,26-13,005-25,205-2=1,05
269
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Total 41,26 7 - -
b)¿¿¿
c)¿ { H '''0 : αi β j =0 ¿ ¿¿
2° = = 0,01
4° Règle de décision :
H '0
Rejeter si Fc ligne > Fth à 0,01 (1.4) = 21,20
H }0 } } { ¿¿ ¿
Rejeter si Fc col>Fth0,01 ; (1 ;4)=21,20
H 0'} } } { ¿¿ ¿
Rejeter si Fc > Fth0,01 ; (1 ;4)= 21,20
270
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
6° Décision :
1 2 3 4
1 A B C D Lignes i
2 B C D A
3 C D A B
4 D A B C
Colonnes (j)
271
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
rxr où les
Y ijk dénotent d’une observation dans la ième ligne et dans la
jème colonne, correspondant à la kè lettre. Il faut noter une fois que i et j
sont spécifiés par un carré latin particulier, nous connaissons
automatiquement la lettre donnée par K.
grande moyenne et
ε ijk l’erreur aléatoire expérimentale, alors nous
pouvons écrire :
r c=r r
∑ αi =∑ β j= ∑ τ k =0 Y ijk sont supposés être les
i=1 j =1 k =1 Comme au paravent, les
valeurs des variables aléatoires v.a indépendantes ayant des distributions
dire
τ A =τ B =τ C =τ D=0 , nous pouvons soustraire de la somme des carrés
des erreurs une somme additionnelle des carrées avec r-l ddl désignée par
SSTR laquelle mesure la variabilité associée aux différents traitements.
D’où la somme des carrées totale suffit.
r r r
y 2. . . 1
2
y 2
=∑ ∑ ∑ 2
y ijk − 2 = ∑ y 2. . . k − .2. .
SSTO i j k r SSTR r k =1 r
r 2
1 y
= ∑ y 2i .. .− .2..
SSR r i=1 r SSE=SSTO-SSR-SSTR-SSC
r 2
1 y
= ∑ y 2. j.− .2. .
SSC r j=1 r
273
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Où
y i. . . est la somme des observations dans la ième ligne, Y . j.
TOTALE SSTO r 2 −l - -
Exemple
'
a) H 0 : il n’y a pas de différence dans les moyennes de
récoltes de maïs lorsque les différents types d’engrais sont utilisés.
274
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
''
b) H 0 : il n’existe aucune différence dans les récoltes
moyennes de maïs dues aux différentes années.
' ''
c) H 0 : il n’existe aucune différence dans les récoltes
moyennes de maïs dues aux différentes variétés.
Engrais ANNEXES
(traitement)
t1 A B C D 29
4
…………70 …………75 ………..68 ………..81
t2 D A B C 24
3
………….66 …………..5 ………….5 …………63
9 5
t3 C D A B 20
6
…………59 …………..6 ………….3 ………….4
6 9 2
t4 B C D A 19
2
…………..4 …………..5 …………39 ………….5
1 7 5
Résolution
5°Calculs :
Y 2. 4 =( 241 )2 =58081
SSTO=57.139-54639,0625=2499,9375
2
1 2 Y 1
= ∑ Y i − 2 = 224785−54639 , 0625
SSR r r 4
SSR=56196,25-54639,0625=1557,1875
2
1 2 Y 1
= ∑ Y 1 − 2 = 220227−54639 , 0625
SSC r r 4
SSC=417,6875
1 y2 1
= ∑ y k− 2 = x 219611−54639 , 0625=263 , 6875
2
SSTR r r 4
SSE= SSTO-SSR-SSC-SSTR=SSE=261,375
2. =0,05
4. Règle :
Totale 2499,9375 2
15=r −1 - -
' '
α
1° a) H 0 : α 1 =α 2=α 3 =α 4 =0 . H a : au moins un des i n’est pas nul
''
β = β2 =β 3 =β 4 =0
b) H 0 : 1
' ''
c) H 0 : τ A =τ B =τ C =τ D=0
H a : au moins un des τ k
''' est ≠0
6. Décision et conclusion
' ''
- Comme Fr=11,92>4,76, nous rejetons H o au seuil de =5%
moins un des
α i qui n’est pas nul.
278
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
' ''
Puisque FC=3,2<4,76 nous acceptons H 0 au seuil =5% et concluons
qu’il n’existe aucune différence significative dans les moyennes de récolte
de maïs due aux différentes années.
' ''
Vu que FTR =2,02<4,76, nous acceptons H α au seuil =5% et concluons
qu’il n’existe aucune différence significative dans les moyennes de récolte
de 4 variétés de maïs.
sondage ?
sondage).
moins nombreux. Vous avez votre chiffre ? Très bien, nous pouvons
continuer…
280
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
vous êtes prêts à prendre, car les réponses que vous obtiendrez pour
à 10 %.
que l’échantillon que vous avez choisi ait influencé les résultats que vous
descendre en dessous de 90 %.
aurez besoin.
100 50 80 99 74 80 88
+
282
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
population.
mon sondage ?
important, plus l’analyse est précise et.. coûteuse. Mais le gain marginal
t 2 p ( 1− p )
n=
d %2
concerne une proportion : .
sur le sujet. Quand on ignore tout, on prend 0,5 faute de mieux. Quant à d,
0,5 (on détermine alors n pour une proportion variant entre 0,48 et 0,52).
Précisio Taille
2% 2401
3% 1067
4% 600
285
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
5% 384
6% 267
t2σ 2
n=
d2
(CV) estimé.
t 2 ( CV )2
n=
d %2
d’achèvement envisagé…
286
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
Caractéristiques multiples
Crédit scoring
admet alors des échantillons plus petits (S. Tufféry donne une limite de
Etudes marketing
étudier.
lorsqu’il est improbable qu’il puisse être obtenu par un simple hasard.
utilisent un seuil plus restrictif à 0,01 voire 0,001), ce qui signifie que le
hasard.
vlue de 0,05 ou même 0,1% c’est-à-dire une chance sur mille d’être dû au
hasard.
données (échantillon).
une face donnée). Dans cette situation, l’approche par test d’hypothèse
test
nulle alors que cette hypothèse est vraie est beaucoup plus coûteux que
par exemple à tester le fait qu’un certain paramètre vaut une certaine
valeur 0 cette probabilité a priori sera une loi de probabilité sur qui
sont souvent d’une mise en œuvre plus complexe que les tests
D. Classification
valeur d’un certain paramètre. Ces test sont généralement les tests les
plus simples. Les tests non paramétriques quant à eux ne font pas
tests d’adéquations :
deux moyennes ;
dans le cas d’un tes d’adéquation( ou conformité), on veut
loi.
première espèce ;
5. si la valeur p est plus grande que , le test est non concluant, ce qui
revient à dire que l’on ne peut rien affirmer. Si la valeur p est plus
on peut citer :
aléatoires continues.
STATISTIQUE.......................................................................................................... 1
INTRODUCTION NGENERALE.................................................................................. 1
1. OBJECTIF DU COURS........................................................................................ 1
294
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS
2. PREREQUIS...................................................................................................... 1
3. PLAN DU COURS.............................................................................................. 1
4. CONDITIONS DE REUSSITE..............................................................................2
5. ELEMENTS DE BIBLIOGRAPHIE........................................................................2
PREMIERE PARTIE : STATISTIQUE DESCRIPTIVE......................................................3
CHAPITRE I : OBSERVATION STATISTIQUE, COLLECTE DES INFORMATIONS,
TABLEAUX ET GRAPHIQUES.................................................................................... 3
I.1. HISTORIQUE.................................................................................................. 3
I.2. DEFINITION ET VOCABULAIRE DE STATISTIQUE.............................................4
I.3. LA METHODE STATISTIQUE............................................................................5
I.4. LA COLLECTE DES INFORMATIONS OU DES DONNEES..................................5
I.5. DEPOUILLEMENT DES INFORMATIONS, DISTRIBUTION D’EFFECTIF ET
GROUPEMENT DES DONNEES EN CLASSES.........................................................6
I.6. TABLEAU STATISTIQUE.................................................................................. 9
I.7. GRAPHIQUE................................................................................................. 11
I.8. EXERCICES.................................................................................................. 15
CHAPITRE II :........................................................................................................ 23
SYNTHESE STATISTIQUE PAR LES PARAMETRES OU INDICATEURS OU VALEURS
CARACTERISTIQUES............................................................................................. 23
II.1. CAS DES CARACTERES QUALITATIFS..........................................................23
II.2. CAS DES CARACTERES QUANTITATIFS.......................................................23
II.2.1. Paramètres de position........................................................................24
II.2.2. Paramètres de dispersion.....................................................................34
II.2.3. Paramètres de forme........................................................................... 40
III.2.4. Paramètres de concentration..............................................................41
CHAPITRE III : INDICES STATISTIQUES..................................................................48
1. DEFINITION................................................................................................. 48
2. SORTES D’INDICES...................................................................................... 48
A. L’indice élémentaire............................................................................. 48
CHAPITRE IV : REGRESSION ET CORRELATION.....................................................75
INTRODUCTION................................................................................................. 75
1. LA METHODE DES MOINDRES CARRES..........................................................79
2. LA DROITE DE REGRESSION..........................................................................81
3. LE COEFFICIENT DE CORRELATION ET LE COEFFICIENT DE DETERMINATION87
4. TABLEAU DE CORRÉLATION : COEFFICIENT DE CORRÉLATION DES DONNÉES
GROUPÉES......................................................................................................... 91
295
STATISTIQUE et PROBABILITE KAMATE MULUME FRANCOIS