Introduction à la statistique et probabilités
Introduction à la statistique et probabilités
Introduction 4
1
Table des matières
3 Analyse combinatoire 34
3.1 Arrangement (sans répétition) . . . . . . . . . . . . . . . . . . 34
3.2 Arrangement (avec répétition) . . . . . . . . . . . . . . . . . . 35
3.3 Permutation (sans répétition) . . . . . . . . . . . . . . . . . . 35
3.4 Permutation (avec répétition) . . . . . . . . . . . . . . . . . . 35
3.5 Combinaison (sans répétition) . . . . . . . . . . . . . . . . . . 36
3.6 Combinaison (avec répétition) . . . . . . . . . . . . . . . . . . 36
2
Dédicaces
Bibliographie 47
3
Introduction
L’objectif assigné à ce cours est l’initiation des étudiants des troncs com-
muns des sciences et techniques aux traitements des données liées à leurs
thématiques de travail via les statistiques et aux principes de base des pro-
babilités.
Le cours vise principalement à introduire et faire méditer les concepts
fondamentaux et méthodes élémentaires de la statistique et des probabilités
pour permettre un apprentissage autonome ultérieur de méthodes complé-
mentaires.
On veut développer le sens critique nécessaire lors de la mise en œuvre et
de l’interprétation d’un traitement statistique. Pour cela, on introduira et uti-
lisera un cadre mathématique rigoureux. Nous fournirons autant d’exemples
et de …gures nécessaires a…n d’obtenir une meilleure compréhension du cours.
La statistique descriptive a pour but d’étudier un phénomène à partir
de données. Cette description se fait à travers la présentation des données
(la plus synthétique possible), leur représentation graphique et le calcul de
résumés numériques.
Les probabilités sont la branche des mathématiques qui calcule la proba-
bilité d’un événement, c’est-à-dire la fréquence d’un événement par rapport
4
Chapitre 0. Introduction
à l’ensemble des cas possibles. Cette branche des mathématiques est née des
jeux du hasard, plus précisément du désir de prévoir l’imprévisible ou de
quanti…er l’incertain.
5
Introduction générale
1
CHAPITRE 1
1.1 Introduction
La statistique est l’étude de la collecte de données, leur analyse, leur
traitement, l’interprétation des résultats et leur présentation a…n de rendre
les données compréhensibles par tous. C’est à la fois une science, une méthode
et un ensemble de techniques. La statistique consiste à :
–Recueillir des données.
–Présenter et résumer ces données.
–Tirer des conclusions sur la population étudiée et d’aider à la prise de
décision.
–En présence de données dépendant du temps, nous essayons de faire de
la prévision.
2
Chapitre 1. Statistique descriptive à une seule variable
1.2 Vocabulaire
Les statistiques consistent en diverses méthodes de classement des don-
nées telles que les tableaux, les histogrammes et les graphiques, permettant
d’organiser un grand nombre de données. Les statistiques se sont dévelop-
pées dans la deuxième moitié du XIXe siècle dans le domaine des sciences
humaines (sociologie, économie, anthropologie, ...). Elles se sont dotées d’un
vocabulaire particulier.
1.2.1 Population
Dé…nition
3
Chapitre 1. Statistique descriptive à une seule variable
circuler dans cette ville à une date donnée. Dans ce cas = ensemble des
véhicules.
Dé…nition
Dé…nition
4
Chapitre 1. Statistique descriptive à une seule variable
Exemple
Taille, température, nationalité, couleur des yeux, catégorie socioprofes-
sionnelle ...
1.2.4 Modalités
Les modalités d’une variable statistique sont les di¤érentes valeurs que
peut prendre celle-ci.
Exemple
–La variable est " situation familiale "
Les modalités sont " célibataire, marié, divorcé "
–La variable est" statut d’interrupteur "
Les modalités sont " 0 et 1 ".
–La variable est " catégories socio-professionnelles "
Les modalités sont " Employés, ouvriers, retraités,... "
Les caractères qualitatifs sont ceux dont les modalités ne peuvent pas être
ordonnées, c’est-à-dire que si l’on considère deux caractères pris au hasard,
on ne peut pas dire de l’un des caractères qu’il est inférieur ou égal à l’autre.
Plus précisément, nous avons la dé…nition suivante.
Dé…nition
5
Chapitre 1. Statistique descriptive à une seule variable
Les éléments de C sont représentés par autre chose que des chi¤res (ils
ne sont pas mesurables).
Exemple
L’état d’une maison : on peut considérer les modalités suivantes :
–Ancienne.
–Dégradée.
–Nouvelle.
–Rénovée.
Les caractères quantitatifs sont des caractères dont les modalités peuvent
être ordonnées. Ainsi, l’âge, la taille ou le salaire d’un individu sont des
caractères quantitatifs. Donc, nous avons la dé…nition suivante.
Dé…nition
L’ensemble des valeurs est représenté par des chi¤res. De même, il est
partagé en deux sortes de caractères, discret et continu (voir l’exemple).
Exemple
–Le salaire d’employés d’une usine.
Modalités : 10000da , 20000da...
Type : discret.
–La moyenne des étudiants.
Modalités : [10; 12] ; :::
Type : continu.
6
Chapitre 1. Statistique descriptive à une seule variable
Nombre de carries xi 0 1 2 3 4
Nombre d’élèves ni (e¤ectif) 24 28 16 18 8
ni = Card f! 2 : X (!) = xi g :
7
Chapitre 1. Statistique descriptive à une seule variable
Nombre de carries xi 0 1 2 3 4
nci % 24 52 68 86 94
Fréquence relative
8
Chapitre 1. Statistique descriptive à une seule variable
xi 0 1 ...
ni 24 28 ...
24 28
fi 94
= 0:2553 94
= 0:2979 ...
fic %= f1 + f2 + ::: + fi
Remarque : Nous avons vu que les tableaux sont un moyen souvent in-
dispensable, en tous cas très utile, de classi…cation et de présentation des
unités d’une population statistique. Dans le paragraphe suivant, nous allons
voir comment on traduit ses tableaux en graphique permettant aussi de ré-
sumer d’une manière visuelle les données.
9
Chapitre 1. Statistique descriptive à une seule variable
N ! 360°
ni ! di (degré de la modalité i)
Donc,
ni 360°
di = :
N
10
Chapitre 1. Statistique descriptive à une seule variable
Nombre de carries xi 0 1 2 3 4
Nombre d’élèves ni (e¤ectif) 24 28 16 18 8
Diagramme en bâtons
On veut représenter cette répartition sous la forme d’un diagramme en
bâtons. À chaque modalité correspond un bâton. Les hauteurs des bâtons
sont proportionnelles aux e¤ectifs représentés (voir la …gure suivante). Le
plygône des e¤ectifs passe par les sommets bâtons.
11
Chapitre 1. Statistique descriptive à une seule variable
Cette courbe s’appelle "la courbe cumulative des e¤ectifs cumulés crois-
sants et décroissants". La courbe cumulative est une courbe en escalier re-
présentant les e¤ectifs cumulés.
Le mode
Le mode d’une V.S est la valeur qui a le plus grand e¤ectif partiel (ou la
plus grande fréquence relative) et il est dénoté par Mo .
12
Chapitre 1. Statistique descriptive à une seule variable
La médiane
La moyenne
1 X X
k k
x= ni xi = fi xi
N i=1 i=1
13
Chapitre 1. Statistique descriptive à une seule variable
14
Chapitre 1. Statistique descriptive à une seule variable
L’étendue
E = xmax xmin
La variance
1 X
k
2
V (X) = X =( ni x2i ) (x)2
N i=1
L’écart-type
La quantité
p
X = V (X):
15
Chapitre 1. Statistique descriptive à une seule variable
X
Cvx = 100%:
x
1;2853
On trouve Cvx = 1;553
100% = 82; 76% (l’exemple précédant).
L’écart interquartile
IQR = Q3 Q1 :
16
Chapitre 1. Statistique descriptive à une seule variable
Dé…nition
On appelle V.S continue (ou caractère continu) toute application de et
à valeurs réelles et qui prend un nombre "important" de valeurs.
Exemple
Soit l’ensemble des nouveaux nés au C.H.U d’une ville pendant les 3
premiers mois de 2021. Nous désignons par X le poids des nouveaux nés. On
suppose que xmin = 2.701 et xmax = 5.001.
Remarque : Comment étudier ce caractère ?
Réponse : Partager les valeurs prises par X en classes de valeurs.
Classe de valeurs
Dé…nition
On appelle classe de valeurs de X un intervalle de type [a; b[ tel que X 2
[a; b[ si et seulement si ahX (!) hb, c’est à dire, que les valeurs du caractère
sont dans la classe [a; b[ :
Dès qu’un caractère est identi…é en tant que continu, ces modalités Ci =
[Li ; Li+1 [ sont des intervalles avec :
- Li : borne inférieure.
- Li+1 : borne supérieure.
- ai = Li+1 Li : son amplitude, son pas ou sa longueur.
- Ci = xi = (Li + Li+1 ) =2 : son centre, où i = 1; :::; k et k est le nombre
de classes.
Nombre de classes
17
Chapitre 1. Statistique descriptive à une seule variable
de classes
p
k' N:
Exemple
p
Considérons 30 valeurs entre 56.5 cm et 97.8 cm. Dans ce cas, k = 30
et on prend k = 6.
k = 1 + 3:3log10 (N ):
18
Chapitre 1. Statistique descriptive à une seule variable
Dé…nition
Le nombre
E = xmax xmin
ni : est le nombre d’individus dont les valeurs des caractères sont dans la
classe Ci.
19
Chapitre 1. Statistique descriptive à une seule variable
N N
n(i+1)c nic nic nic
tg b = ai+1 ai
= 2
M e ai
=) M e = ai + 2
n(i+1)c nic
(ai+1 ai ) :
N 3N
De la même façon on calcule Q1 pour 4
et Q3 pour 4
:
20
CHAPITRE 2
Dans le chapitre précédent, nous avons présenté les méthodes qui per-
mettent de résumer et représenter les informations relatives à une variable.
Un même individu peut être étudié à l’aide de plusieurs caractères (ou va-
riables). Par exemple, les salariés en regardant leur ancienneté et leur niveau
d’étude, la croissance d’un enfant en regardant son poids et sa taille. Dans
la suite, nous introduisons l’étude globale des relations entre deux variables
(en nous limitant au cas de deux variables). Donc, soit une population et
Z : ! R2 ;
ou directement
(X; Y ) : ! R2 ;
! 7 ! (X (!) ; Y (!)) :
21
Chapitre 2. Statistique descriptive à deux variables
Dans ce cas, Z est dite variable statistique à deux dimensions avec Card( ) =
N , et N un entier …ni. Le couple (X; Y ) est appelé le couple de la variable
statistique.
Exemples :
–On observe simultanément sur un échantillon de 200 foyers, le nombre
d’enfants X et le nombre de chambres Y .
–On observe sur un échantillon de 20 foyers, le revenu mensuel X en Da
et les dépenses mensuelles Y .
–Auprès des étudiants pris au hasard parmi une section de L2 génie civil,
on observe les notes de math3 X et de statistique Y .
– Une entreprise mène une étude sur la liaison entre les dépenses men-
suelles en publicité X et le volume des ventes Y qu’elle réalis.
! i ! (xi ; yi ) :
!i !1 !2 ... ! N
Variable X X (! 1 ) X (! 2 ) ... X (! N )
Variable Y Y (! 1 ) Y (! 2 ) ... Y (! N )
22
Chapitre 2. Statistique descriptive à deux variables
xi := X (! i ) et yi := Y (! i ) :
Exemple
Soit l’ensemble de 8 étudiants. Nous avons le tableau suivant :
!i !1 !2 !3 !4 !5 !6 !7 !8
X (!) 8 2 6 6 11 10 7 2
Y (!) 9 10 11 7 14 16 12 5
avec X représente le nombre d’heures passées à préparer l’examen de
statistique par étudiant et Y représente la note sur 20 obtenue à l’examen
par l’étudiant.
Lors de cette représentation, nous pouvons traduire le tableau associé
dans une …gure appelée "le nuage de points" ou "diagramme de dispersion".
Cette représentation est obtenue en mettant dans un repère cartésien chaque
couple d’observation (xi ; yj ) par un point.
Présentation 2
Soit la variable statistique Z donnée par le couple (X; Y ). Soient x1 ; :::; xk
et y1 ; :::; yl les valeurs prises respectivement par X et Y . Dans ce cas, nous
dé…nissons les valeurs de Z comme suite, pour i allant de 1 à k et pour j
allant de 1 à l,
zij := (xi ; yj ) :
23
Chapitre 2. Statistique descriptive à deux variables
nij
fij = ;
N
avec
X
k X
l
N = Card ( ) = nij :
i=1 j=1
Lois marginales
Sur la marge du tableau de contingence, on peut extraire les données
seulement par rapport à X et seulement par rapport à Y (voir le tableau de
contingence établi auparavant).
1. E¤ectifs et fréquences relatives marginales par rapport à X : nous
avons, pour i = 1:::k,
X
l
ni = nij ;
j=1
et
24
Chapitre 2. Statistique descriptive à deux variables
ni X l
fi = = fij
N j=1
X
k
nj= nij ;
i=1
et
nj X
k
fj= = fij
N i=1
Remarque
X
k X
l X
k X
l
ni = n j = N et fi = fj=1
i=1 j=1 i=1 j=1
1 X X
k k
_
x= ni xi = fi xi (moyenne de X),
N i=1 i=1
et
1 X X
l l
_
y= n j yj = f j yj (moyenne de Y ).
N j=1 j=1
Remarque
25
Chapitre 2. Statistique descriptive à deux variables
1 X X
k k
_ 2 _ 2
V (X) = ni x2i x = fi x2i x ;
N i=1 i=1
et
1 X X
l l
_ 2 _ 2
V (Y ) = n j yj2 y = f j yj2 y :
N j=1 j=1
p p
X = V (X) et Y = V (Y ):
nij fij
fi=j = = :
nj fj
_
Nous avons aussi la moyenne conditionnelle xj , c’est à dire la moyenne
des valeurs de X sous la condition yj , elle est dé…nie par
26
Chapitre 2. Statistique descriptive à deux variables
_ X
k
1 X
k
xj = fi=j xi = nij xi :
i=1
n j i=1
p
Pour l’écart-type conditionnel, nous avons Xj = V (Xj ) avec
q X
k
_
V (Xj ) = fi=j (xi xj )2 :
i=1
Elle est notée par Y =xi (ou Yi ) et on dit que c’est la série conditionnelle de
Y sachant que X = xi . Nous calculons aussi dans ce cas la fréquence relative
conditionnelle fj=i (fj sachant i), pour j = 1; :::; l, par
nij fij
fj=i = = :
ni fi
_
Nous avons aussi la moyenne conditionnelle y i , c’est à dire la moyenne
des valeurs de Y sous la condition xi , elle est dé…nie par
_ X
l
1 X
l
yi = fj=i yj = nij yj :
j=1
n i j=1
p
Pour l’écart-type conditionnel, nous avons Yi = V (Yi ) avec
p X
l
_
V (Yi ) = fj=i (yj y i )2 :
j=1
27
Chapitre 2. Statistique descriptive à deux variables
1 XX
k l
__
Cov (X; Y ) = nij xi yj xy
N i=1 j=1
Remarque
Dans le cas où nous avons un tableau des données brutes "representation
1" (nous n’avons pas d’e¤ectifs), nous avons les formules suivantes :
1 X 1 X
n n
_ _
x= xi ety = yi :
N i=1 N i=1
Remarque
La covariance est une notion qui généralise la variance, En e¤et,
Dé…nition
On dit que deux variables statistiques X et Y sont indépendantes si et
seulement si, pour tout i et j,
Il su¢ t que cette égalité ne soit pas véri…ée dans une seule cellule pour
que les deux variables ne soient pas indépendantes.
28
Chapitre 2. Statistique descriptive à deux variables
Dé…nition
La quantité
Cov (X; Y )
R (X; Y ) = ;
X Y
Proposition
Le coe¢ cient R (X; Y ) est compris entre [-1, 1], ou encore
jR (X; Y )j 1:
29
Chapitre 2. Statistique descriptive à deux variables
Remarque
Par dé…nition, si R (X; Y )= 0, alors Cov(X; Y ) = 0:
30
Chapitre 2. Statistique descriptive à deux variables
X
n
e2i = U (a; b) ;
i=1
@U @U
= = 0;
@a @b
avec
X
n
U (a; b) = (yi axi b)2 :
i=1
@U
L’équation @b
= 0 donne
X
n
2 (yi axi b) = 0:
i=1
31
Chapitre 2. Statistique descriptive à deux variables
y ax b = 0;
c’est à dire,
b=y ax:
@U
De même, après calcule, @a
= 0 on trouve que
Cov (X; Y )
a= :
V (X)
Donc, la droite de régression, qui rend la distance entre elle et les points
minimale, est donnée par
D (Y =X) : Y = aX + b;
avec
Cov (X; Y )
a= et b = y ax:
V (X)
Ou bien
D (X=Y ) : X = aY + b;
avec
Cov (X; Y )
a= et b = x ay:
V (Y )
32
Chapitre 2. Statistique descriptive à deux variables
Remarque
Le coe¢ cient de corrélation R (X; Y ) permet de justi…er le fait de l’ajus-
tement linéaire. On adopte les critères numériques suivants :
–Si jR (X; Y )j< 0.7, alors l’ajustement linéaire est refusé (droite refusée).
–Si jR (X; Y )j 0.7, alors l’ajustement linéaire est accepté (droite accep-
tée).
33
CHAPITRE 3
Analyse combinatoire
n!
Apn = n(n 1):::(n p + 1) = :
(n p)!
Exemple : les arrangements sans répétition à deux éléments de l’ensemble
f1; 2; 3g sont : (1; 2) ; (1; 3) ; (2; 1) ; (2; 3) ; (3; 1) ; (3; 2) ; donc 6 possibilités ou
3!
bien Apn = A23 = (3 2)!
=6 possibilités.
34
Chapitre 3. Analyse combinatoire
Apn = np avec 1 p n:
35
Chapitre 3. Analyse combinatoire
n!
Pn (r1 ; r2 ; :::; rk ) = :
r1 !r2 !:::rk !
Exemple : considérons le mot "cellule". Le nombre de mots possibles (avec
ou sans signi…cation) que l’on peut écrire en permutant ces 7 lettres est :
7!
P7 (1; 2; 3; 1) = ;
1!2!3!1!
Apn n!
Cnp = p = :
Ap p! (n p)!
Exemple : les combinaisons sans répétition à 2 éléments de l’ensemble
f1; 2; 3g sont (1; 2) ; (1; 3) ; (2; 3) ; donc 3 possibilités ou bien C32 =3 possibili-
tés.
p
Knp = Cn+p 1:
36
CHAPITRE 4
4.1 Dé…nitions
37
Chapitre 4. Calcul des probabilités
38
Chapitre 4. Calcul des probabilités
P (A [ B) = P A \ B + P (B) : (1)
D’autre part, on a A \ B [ (A \ B) = A et A \ B \ (A \ B) = ?,
alors on peut écrire
P A \ B + P (A \ B) = P (A) :
D’où
P A \ B = P (A) P (A \ B) : (2)
1 = P ( ) = P A [ A = P (A) + P A , P A = 1 P (A) :
39
Chapitre 4. Calcul des probabilités
X
n
n; 0hpi h1 et pi = 1:
i=1
Dé…nition : P est appelée probabilité uniforme si 8 i = 1;..., n;
pi = n1 : Dans ce cas les f! i g sont équiprobables.
Généralement, dans le cas d’une probabilité uniforme, on utilise la règle
suivante :
4.5.1 Propriété
40
Chapitre 4. Calcul des probabilités
4.6.1 Remarques
41
Chapitre 4. Calcul des probabilités
A [ B = A \ B:
A \ B = A [ B:
42
CHAPITRE 5
5.1 Dé…nition
( ; F; P ) étant un espace probabilisé, on appelle : variable aléatoire notée
(v. a) toute application X dé…nit sur dans R telle que :
X : 7! R
! 7! X (!)
= fP P; F P; P F; F F g
X (!) = f0; 1; 2g
43
Chapitre 5. Les variables aléatoires
5.2.1 Dé…nition
On appelle v.a discrète une v. a dont l’univers image X (!) est …ni et
dénombrable.
Dé…nition
pi = P (X = xi ) ; i 2 N:
La loi de probabilité d’une v.a discrète est souvent présentée sous forme
d’un tableau.
Dé…nition
Espérance mathématique
44
Chapitre 5. Les variables aléatoires
X
n
E (X) = xi P (X = xi ) :
i=1
Variance
2
X
n
V (X) = E [X E (X)] = [xi E (X)]2 P (X = xi ) :
i=1
45
Chapitre 5. Les variables aléatoires
Z x
F (x) = P (X x) = f (x) dx:
1
Espérance mathématique
Z +1
E (x) = xf (x) dx:
1
Variance
46
BIBLIOGRAPHIE
47