0% ont trouvé ce document utile (0 vote)
63 vues52 pages

Introduction à la statistique et probabilités

Le document décrit les concepts fondamentaux de la statistique descriptive à une et deux variables ainsi que les bases des probabilités. Il présente notamment le vocabulaire statistique, les types de variables, les mesures de tendance centrale et de dispersion pour une variable, et l'étude des relations entre deux variables.

Transféré par

rezak.tounekti
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
63 vues52 pages

Introduction à la statistique et probabilités

Le document décrit les concepts fondamentaux de la statistique descriptive à une et deux variables ainsi que les bases des probabilités. Il présente notamment le vocabulaire statistique, les types de variables, les mesures de tendance centrale et de dispersion pour une variable, et l'étude des relations entre deux variables.

Transféré par

rezak.tounekti
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TABLE DES MATIÈRES

Introduction 4

1 Statistique descriptive à une seule variable 2


1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Population . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Individu (unité statistique) . . . . . . . . . . . . . . . . 4
1.2.3 Caractère (variable statistique) . . . . . . . . . . . . . 4
1.2.4 Modalités . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Types de caractères . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.1 Caractère qualitatif . . . . . . . . . . . . . . . . . . . . 5
1.3.2 Caractère quantitatif . . . . . . . . . . . . . . . . . . . 6
1.4 Étude d’une variable statistique discrète . . . . . . . . . . . . 7
1.4.1 E¤ectif partiel - e¤ectif cumulé croissant . . . . . . . . 7
1.4.2 Fréquence relative - Fréquence relative cumulée crois-
sante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.3 Représentation graphique des séries statistiques . . . . 9

1
Table des matières

1.4.4 Paramètres de position (caractéristiques de tendance


centrale) . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4.5 Paramètres de dispersion (variabilité) . . . . . . . . . . 14
1.5 Étude d’une variable statistique continue . . . . . . . . . . . . 16
1.5.1 Caractère continu . . . . . . . . . . . . . . . . . . . . . 17
1.5.2 Représentation graphique d’un caractère continu . . . . 19

2 Statistique descriptive à deux variables 21


2.1 Représentation des séries statistiques à deux variables . . . . . 22
2.2 Description numérique . . . . . . . . . . . . . . . . . . . . . . 25
2.2.1 Caractéristiques des séries marginales . . . . . . . . . . 25
2.2.2 Série conditionnelle . . . . . . . . . . . . . . . . . . . . 26
2.2.3 Notion de covariance . . . . . . . . . . . . . . . . . . . 27
2.3 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.1 Coe¢ cient de corrélation . . . . . . . . . . . . . . . . . 29
2.3.2 Droite de régression . . . . . . . . . . . . . . . . . . . . 30

3 Analyse combinatoire 34
3.1 Arrangement (sans répétition) . . . . . . . . . . . . . . . . . . 34
3.2 Arrangement (avec répétition) . . . . . . . . . . . . . . . . . . 35
3.3 Permutation (sans répétition) . . . . . . . . . . . . . . . . . . 35
3.4 Permutation (avec répétition) . . . . . . . . . . . . . . . . . . 35
3.5 Combinaison (sans répétition) . . . . . . . . . . . . . . . . . . 36
3.6 Combinaison (avec répétition) . . . . . . . . . . . . . . . . . . 36

4 Calcul des probabilités 37


4.1 Dé…nitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.1.1 Dé…nition 1 (expérience aléatoire) . . . . . . . . . . . . 37
4.1.2 Dé…nition 2 (espace fondamental) . . . . . . . . . . . . 37

2
Dédicaces

4.1.3 Dé…nition 3 (événement) . . . . . . . . . . . . . . . . . 37


4.2 Opérations sur les événements . . . . . . . . . . . . . . . . . . 38
4.3 Propriétés des probabilités . . . . . . . . . . . . . . . . . . . . 39
4.4 Probabilité uniforme . . . . . . . . . . . . . . . . . . . . . . . 40
4.5 Probabilité conditionnelle . . . . . . . . . . . . . . . . . . . . 40
4.5.1 Propriété . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.6 Evénements indépendants . . . . . . . . . . . . . . . . . . . . 41
4.6.1 Remarques . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.7 Théorème de Bayes . . . . . . . . . . . . . . . . . . . . . . . . 41
4.8 Lois de De Morgan . . . . . . . . . . . . . . . . . . . . . . . . 42

5 Les variables aléatoires 43


5.1 Dé…nition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.2 Variables aléatoires discrètes . . . . . . . . . . . . . . . . . . . 44
5.2.1 Dé…nition . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.2.2 Loi de probabilité d’une v.a. discrète . . . . . . . . . . 44
5.2.3 Fonction de répartition d’une v.a discrète . . . . . . . . 44
5.2.4 Moments d’une v.a discrète . . . . . . . . . . . . . . . 44
5.3 Variables aléatoires continues . . . . . . . . . . . . . . . . . . 45
5.3.1 Dé…nition (v.a.c) . . . . . . . . . . . . . . . . . . . . . 45
5.3.2 Dé…nition (densité de probabilité) . . . . . . . . . . . . 45
5.3.3 Loi de probabilité d’une v.a continue . . . . . . . . . . 46
5.3.4 Moments d’une v.a continue . . . . . . . . . . . . . . . 46

Bibliographie 47

3
Introduction

L’objectif assigné à ce cours est l’initiation des étudiants des troncs com-
muns des sciences et techniques aux traitements des données liées à leurs
thématiques de travail via les statistiques et aux principes de base des pro-
babilités.
Le cours vise principalement à introduire et faire méditer les concepts
fondamentaux et méthodes élémentaires de la statistique et des probabilités
pour permettre un apprentissage autonome ultérieur de méthodes complé-
mentaires.
On veut développer le sens critique nécessaire lors de la mise en œuvre et
de l’interprétation d’un traitement statistique. Pour cela, on introduira et uti-
lisera un cadre mathématique rigoureux. Nous fournirons autant d’exemples
et de …gures nécessaires a…n d’obtenir une meilleure compréhension du cours.
La statistique descriptive a pour but d’étudier un phénomène à partir
de données. Cette description se fait à travers la présentation des données
(la plus synthétique possible), leur représentation graphique et le calcul de
résumés numériques.
Les probabilités sont la branche des mathématiques qui calcule la proba-
bilité d’un événement, c’est-à-dire la fréquence d’un événement par rapport

4
Chapitre 0. Introduction

à l’ensemble des cas possibles. Cette branche des mathématiques est née des
jeux du hasard, plus précisément du désir de prévoir l’imprévisible ou de
quanti…er l’incertain.

Conforme aux programmes LMD (Licence-Master-Doctorat), Le polyco-


pié contient cinq chapitres.
Le premier chapitre aborde la statistique descriptive à une seule variable,
qui est un ensemble d’outils permettant de décrire et d’analyser des phéno-
mènes susceptibles d’être dénombrés et classés, elle a pour but de décrire et
non d’expliquer.
Le deuxième chapitre aborde la statistique descriptive à deux variables,
en introduisant l’étude globale des relations entre deux caractères.
Le troisième chapitre est consacré à l’introduction des méthodes de dé-
nombrements d’objets statistiques (analyse combinatoire) utiles en théorie
des probabilités, qui sera abordée dans le chapitre suivant.
La théorie des probabilités, a été abordée dans le chapitre quatre.
En…n, Le chapitre cinq se penche sur la théorie des variables aléatoires
discrètes et continues.
Cet ouvrage s’adresse principalement aux étudiants de la deuxième année
licence tronc commun sciences et techniques, mais pourra être utile à un cercle
de lecteurs très étendue : étudiants en mathématiques et en sciences de la
nature et de la vie.

5
Introduction générale

1
CHAPITRE 1

Statistique descriptive à une seule variable

1.1 Introduction
La statistique est l’étude de la collecte de données, leur analyse, leur
traitement, l’interprétation des résultats et leur présentation a…n de rendre
les données compréhensibles par tous. C’est à la fois une science, une méthode
et un ensemble de techniques. La statistique consiste à :
–Recueillir des données.
–Présenter et résumer ces données.
–Tirer des conclusions sur la population étudiée et d’aider à la prise de
décision.
–En présence de données dépendant du temps, nous essayons de faire de
la prévision.

2
Chapitre 1. Statistique descriptive à une seule variable

1.2 Vocabulaire
Les statistiques consistent en diverses méthodes de classement des don-
nées telles que les tableaux, les histogrammes et les graphiques, permettant
d’organiser un grand nombre de données. Les statistiques se sont dévelop-
pées dans la deuxième moitié du XIXe siècle dans le domaine des sciences
humaines (sociologie, économie, anthropologie, ...). Elles se sont dotées d’un
vocabulaire particulier.

1.2.1 Population

En statistique, on travaille sur des populations. Ce terme vient du fait


que la démographie, étude des populations humaines, a occupé une place
centrale aux débuts de la statistique, notamment au travers des recensements
de population. Mais, en statistique, le terme de population s’applique à tout
objet statistique étudié, qu’il s’agisse d’étudiants (d’une université ou d’un
pays), de ménages ou de n’importe quel autre ensemble sur lequel on fait des
observations statistiques. Nous dé…nissons la notion de population.

Dé…nition

On appelle population l’ensemble sur lequel porte notre étude statistique.


Cet ensemble est noté :
Exemple
– On considère l’ensemble des étudiants de la section A. On s’intéresse
aux nombre de frères et sœurs de chaque étudiant. Dans ce cas = ensemble
des étudiants.
–Si l’on s’intéresse maintenant à la circulation automobile dans une ville,
la population est alors constituée de l’ensemble des véhicules susceptibles de

3
Chapitre 1. Statistique descriptive à une seule variable

circuler dans cette ville à une date donnée. Dans ce cas = ensemble des
véhicules.

1.2.2 Individu (unité statistique)

Une population est composée d’individus. Les individus qui composent


une population statistique sont appelés unités statistiques.

Dé…nition

On appelle individu tout élément de la population , il est noté ! (dans


).
Exemple
– Dans l’exemple indiqué ci-dessus, un individu est tout étudiant de la
section.
–Si on étudie la production annuelle d’une usine de boîtes de boisson en
métal (canettes). La population est l’ensemble des boîtes produites durant
l’année et une boîte constitue un individu.

1.2.3 Caractère (variable statistique)

La statistique «descriptive» , comme son nom l’indique cherche à décrire


une population donnée. Nous nous intéressons aux caractéristiques des unités
qui peuvent prendre di¤érentes valeurs.

Dé…nition

On appelle caractère (ou variable statistique, dénotée V.S) toute applica-


tion X : ! C: L’ensemble C est dit : ensemble des valeurs du caractère X
(c’est ce qui est mesuré ou observé sur les individus).

4
Chapitre 1. Statistique descriptive à une seule variable

Exemple
Taille, température, nationalité, couleur des yeux, catégorie socioprofes-
sionnelle ...

1.2.4 Modalités

Les modalités d’une variable statistique sont les di¤érentes valeurs que
peut prendre celle-ci.
Exemple
–La variable est " situation familiale "
Les modalités sont " célibataire, marié, divorcé "
–La variable est" statut d’interrupteur "
Les modalités sont " 0 et 1 ".
–La variable est " catégories socio-professionnelles "
Les modalités sont " Employés, ouvriers, retraités,... "

1.3 Types de caractères


Nous distinguons deux catégories de caractères : les caractères qualitatifs
et les caractères quantitatifs.

1.3.1 Caractère qualitatif

Les caractères qualitatifs sont ceux dont les modalités ne peuvent pas être
ordonnées, c’est-à-dire que si l’on considère deux caractères pris au hasard,
on ne peut pas dire de l’un des caractères qu’il est inférieur ou égal à l’autre.
Plus précisément, nous avons la dé…nition suivante.
Dé…nition

5
Chapitre 1. Statistique descriptive à une seule variable

Les éléments de C sont représentés par autre chose que des chi¤res (ils
ne sont pas mesurables).
Exemple
L’état d’une maison : on peut considérer les modalités suivantes :
–Ancienne.
–Dégradée.
–Nouvelle.
–Rénovée.

1.3.2 Caractère quantitatif

Les caractères quantitatifs sont des caractères dont les modalités peuvent
être ordonnées. Ainsi, l’âge, la taille ou le salaire d’un individu sont des
caractères quantitatifs. Donc, nous avons la dé…nition suivante.
Dé…nition
L’ensemble des valeurs est représenté par des chi¤res. De même, il est
partagé en deux sortes de caractères, discret et continu (voir l’exemple).
Exemple
–Le salaire d’employés d’une usine.
Modalités : 10000da , 20000da...
Type : discret.
–La moyenne des étudiants.
Modalités : [10; 12] ; :::
Type : continu.

6
Chapitre 1. Statistique descriptive à une seule variable

1.4 Étude d’une variable statistique discrète


Le caractère statistique peut prendre un nombre …ni raisonnable de va-
leurs (nombre d’enfants, nombre de pièces, ...). Dans ce cas, le caractère
statistique étudié est alors appelé un caractère discret.
Dans toute la suite du chapitre, nous considérons la situation suivante :
X: ! fx1 ; x2 ; :::; xk g ; avec Card( ) = N est le nombre d’individus dans
notre étude.
Nous allons utiliser souvent l’exemple ci-dessous pour illustrer les énoncés
de ce chapitre.
Exemple
Le tableau suivant est le résultat d’une étude sur le nombre de carries
dentaires de 94 élèves :

Nombre de carries xi 0 1 2 3 4
Nombre d’élèves ni (e¤ectif) 24 28 16 18 8

1.4.1 E¤ectif partiel - e¤ectif cumulé croissant

E¤ectif partiel (fréquence absolue)

Dé…nition : Pour chaque valeur xi , on pose par dé…nition

ni = Card f! 2 : X (!) = xi g :

ni : le nombre d’individus qui ont le même xi , s’appelle e¤ectif partiel de


xi .
Remarque : dans l’exemple précédant 16 est le nombre d’élèves qui ont 2
carries dentaires.

7
Chapitre 1. Statistique descriptive à une seule variable

E¤ectif cumulé croissant

Dé…nition : Pour chaque valeur xi , on pose par dé…nition

nci %= n1 + n2 + ::: + ni où i = 1; :::; k:

L’e¤ectif cumulé croissant nci % d’une valeur est la somme de l’e¤ectif


de cette valeur et de tous les e¤ectifs des valeurs qui précèdent.

Exemple : dans l’exemple précédant : 52 est le nombre d’élèves qui ont


un nombre de carries dentaires inférieur à 1: Nous le regardons dans le tableau
suivant :

Nombre de carries xi 0 1 2 3 4
nci % 24 52 68 86 94

1.4.2 Fréquence relative - Fréquence relative cumulée


croissante

Typiquement les e¤ectifs ni sont grands et il est intéressant de calculer


des grandeurs permettant de résumer la série.

Fréquence relative

Dé…nition : Pour chaque valeur xi , on pose par dé…nition fi = nNi :


Remarque : On peut remplacer fi par fi 100 qui représente alors un
pourcentage pi .
Exemple : dans l’exemple précédant 0:2979 = 29:79%, il ya 29:79%
d’élèves dont le nombre de carries dentaires égale à 1: Ce pourcentage est
calculé de la façon suivante :

8
Chapitre 1. Statistique descriptive à une seule variable

xi 0 1 ...
ni 24 28 ...
24 28
fi 94
= 0:2553 94
= 0:2979 ...

Fréquence relative cumulée croissante

Dé…nition : Pour chaque valeur xi , on pose par dé…nition

fic %= f1 + f2 + ::: + fi

La quantité fic % s’appelle la fréquence relative cumulée croissante de xi .


Interprétation : fic % est le pourcentage des ! tel que la valeur X (!)
est inférieure ou égale à xi .
Exemple : dans l’exemple précédant, 0:7234 représente 72:34% d’élèves
dont le nombre de carries est inférieur ou égal à 2.

Remarque : Nous avons vu que les tableaux sont un moyen souvent in-
dispensable, en tous cas très utile, de classi…cation et de présentation des
unités d’une population statistique. Dans le paragraphe suivant, nous allons
voir comment on traduit ses tableaux en graphique permettant aussi de ré-
sumer d’une manière visuelle les données.

1.4.3 Représentation graphique des séries statistiques

On distingue les méthodes de représentation d’une variable statistique


en fonction de la nature de cette variable (qualitative ou quantitative). Les
représentations recommandées et les plus fréquentes sont les tableaux et les
diagrammes (graphes).

9
Chapitre 1. Statistique descriptive à une seule variable

Distribution à caractère qualitatif

À partir de l’observation d’une variable qualitative, deux diagrammes


permettent de représenter cette variable : le diagramme en bandes (dit tuyaux
d’orgue) et le diagramme à secteurs angulaires (dit camembert).
Tuyaux d’orgues
Nous portons en abscisses les modalités, de façon arbitraire. Nous portons
en ordonnées des rectangles dont la longueur est proportionnelle aux e¤ectifs,
ou aux fréquences relatives, de chaque modalité.

Diagramme par secteur (diagramme circulaire)


Les diagrammes circulaires, ou semi-circulaires, consistent à partager un
disque ou un demi-disque, en tranches, ou secteurs, correspondant aux mo-
dalités observées et dont la surface est proportionnelle à l’e¤ectif, ou à la
fréquence, de la modalité.

Le degré d’un secteur est déterminé à l’aide de la règle de trois de la


manière suivante :

N ! 360°

ni ! di (degré de la modalité i)

Donc,

ni 360°
di = :
N

Distribution à caractère quantitatif discret

À partir de l’observation d’une variable quantitative discrète, deux dia-


grammes permettent de représenter cette variable : le diagramme en bâtons

10
Chapitre 1. Statistique descriptive à une seule variable

et le diagramme cumulatif (voir ci-dessous). Pour l’illustration, nous prenons


l’exemple précédent de départ (nombre de carries par élève). Nous rappelons
le tableau statistique précédant :

Nombre de carries xi 0 1 2 3 4
Nombre d’élèves ni (e¤ectif) 24 28 16 18 8
Diagramme en bâtons
On veut représenter cette répartition sous la forme d’un diagramme en
bâtons. À chaque modalité correspond un bâton. Les hauteurs des bâtons
sont proportionnelles aux e¤ectifs représentés (voir la …gure suivante). Le
plygône des e¤ectifs passe par les sommets bâtons.

Diagramme et plygône de l’exemple

Diagramme cumulatif (courbe des e¤ectifs cumulés croissants et


décroissants)

11
Chapitre 1. Statistique descriptive à une seule variable

Courbe des e¤ectifs cumulés croissants et décroissants

Cette courbe s’appelle "la courbe cumulative des e¤ectifs cumulés crois-
sants et décroissants". La courbe cumulative est une courbe en escalier re-
présentant les e¤ectifs cumulés.

1.4.4 Paramètres de position (caractéristiques de ten-


dance centrale)

Les indicateurs statistiques de tendance centrale (dits aussi de position)


considérés fréquemment sont la moyenne, la médiane et le mode.

Le mode

Le mode d’une V.S est la valeur qui a le plus grand e¤ectif partiel (ou la
plus grande fréquence relative) et il est dénoté par Mo .

12
Chapitre 1. Statistique descriptive à une seule variable

Exemple : Dans l’exemple précédent, le mode est égal à 1 qui corres-


pondant au plus grand e¤ectif (ni max = 28) .
Remarque : On peut avoir plus d’un mode ou rien.

La médiane

La médiane partage la série statistique en deux groupes de même e¤ectif.


N
Exemple : Dans l’exemple précédent, Me = Q2 ! 2
(50%)
N N
la médiane est calculée pour 2
; 2
= 47 (entier).
X N +X N +1
X47 +X48 1+1
Donc Q2 = 2
2
2
= 2
= 2
= 1 carrie:
*Les quartiles : Q1 ; Q2 ; Q3
Q1 partage la série statistique en quatre groupes de même e¤ectif.
N
Exemple : Dans l’exemple précédent, Q1 ! 4
(25%)
N N
le premier quartile est calculé pour 4
; 4
= 23:5 (n’est pas entier).
Donc Q1 = X[ N ]+1 = X23+1 = X24 = 0:
4

De la même façon on calcule Q3 : Q3 v 3N


4
= 70; 5 (n0 est entier)
=) Q3 = x[ 3N ]+1 = x71 = 3 carries:
4

Le Q2 c’est la médiane calculée précédemment.

La moyenne

On appelle moyenne de X, la quantité

1 X X
k k
x= ni xi = fi xi
N i=1 i=1

avec Card( ) = N . On peut donc exprimer et calculer la moyenne dite


"arithmétique" avec des e¤ectifs ou avec des fréquences relatives.
Exemple : Si on applique la formule on trouve x = 1:553, alors nous
avons au moyenne 1.553 carries dentaires.
Voici le tableau statistique :

13
Chapitre 1. Statistique descriptive à une seule variable

xi ni nci % nci & ni xi ni x2i


0 24 24 94 0 0
1 28 52 70 28 28
2 16 68 42 32 64
3 18 86 26 54 162
4 8 94 8 32 128
Total N=94 146 382
La valeur de la moyenne est abstraite. Comme dans l’exemple précédent,
x = 1:553 est un chi¤re qui ne correspond pas à un fait concret.
La moyenne arithmétique dont on vient d’indiquer la formule est dite
moyenne pondérée ; cela signi…e que chaque valeur de la variable est multipliée
(pondérée) par un coe¢ cient, ici par l’e¤ectif ni qui lui correspond. Dans ce
cas, chaque valeur xi de la variable intervient dans le calcul de la moyenne
autant de fois qu’elle a été observée. On parle de moyenne arithmétique
simple quand on n’e¤ectue pas de pondération. Par exemple, si 5 étudiants
ont pour âge respectif 18, 19, 20, 21 et 22 ans, leur âge moyen est donné par
(18 + 19 + 20 + 21 + 22)/5 = 20 ans.
Remarque : Nous mentionnons qu’il existe d’autres moyennes que la
moyenne arithmétique.

1.4.5 Paramètres de dispersion (variabilité)

Les indicateurs statistiques de dispersion usuels sont l’étendue, la va-


riance, l’écart-type, le coe¢ cient de variation et l’écart interquartile.

14
Chapitre 1. Statistique descriptive à une seule variable

L’étendue

La di¤érence entre la plus grande valeur et la plus petite valeur du carac-


tère, donnée par la quantité

E = xmax xmin

s’appelle l’étendue de la V.S X. Le calcul de l’étendue est très simple. Il donne


une première idée de la dispersion des observations. C’est un indicateur très
rudimentaire et il existe des indicateurs de dispersion plus élaborés (voir
ci-dessous).
Pour notre exemple E = xmax xmin = 4 0=4

La variance

On appelle variance de cette série statistique X, le nombre

1 X
k
2
V (X) = X =( ni x2i ) (x)2
N i=1

Toujours avec le même exemple on trouve que la variance :


Pk
V (x) = N1 ni x2i x2 =) V (x) = 382
94
(1; 553)2 = 1; 652
i=1

L’écart-type

La quantité
p
X = V (X):

s’appelle l’écart-type de la V.S X.


p
L’écart-type : X = V (x) = 1; 2853:
Remarque :

15
Chapitre 1. Statistique descriptive à une seule variable

Le paramètre X mesure la distance moyenne entre x et les valeurs de X.


Il sert à mesurer la dispersion d’une série statistique autour de sa moyenne.
–Plus il est petit, plus les caractères sont concentrés autour de la moyenne
(on dit que la série est homogène).
–Plus il est grand, plus les caractères sont dispersés autour de la moyenne
(on dit que la série est hétérogène).

Le coe¢ cient de variation

Il est donné par la formule suivante

X
Cvx = 100%:
x
1;2853
On trouve Cvx = 1;553
100% = 82; 76% (l’exemple précédant).

L’écart interquartile

Il est donné par la formule suivante

IQR = Q3 Q1 :

IQR = Q3 Q1 = 3 0 = 3 (l’exemple précédant).

1.5 Étude d’une variable statistique continue

Nous rappelons qu’une variable statistique (V.S) quantitative concerne


une grandeur mesurable. Ses valeurs sont des nombres exprimant une quan-
tité et sur lesquelles les opérations arithmétiques (addition, multiplication,
etc,...) ont un sens. Nous allons dans cette section se focaliser sur la V.S
quantitative continue.

16
Chapitre 1. Statistique descriptive à une seule variable

1.5.1 Caractère continu

Dé…nition
On appelle V.S continue (ou caractère continu) toute application de et
à valeurs réelles et qui prend un nombre "important" de valeurs.
Exemple
Soit l’ensemble des nouveaux nés au C.H.U d’une ville pendant les 3
premiers mois de 2021. Nous désignons par X le poids des nouveaux nés. On
suppose que xmin = 2.701 et xmax = 5.001.
Remarque : Comment étudier ce caractère ?
Réponse : Partager les valeurs prises par X en classes de valeurs.

Classe de valeurs

Dé…nition
On appelle classe de valeurs de X un intervalle de type [a; b[ tel que X 2
[a; b[ si et seulement si ahX (!) hb, c’est à dire, que les valeurs du caractère
sont dans la classe [a; b[ :
Dès qu’un caractère est identi…é en tant que continu, ces modalités Ci =
[Li ; Li+1 [ sont des intervalles avec :
- Li : borne inférieure.
- Li+1 : borne supérieure.
- ai = Li+1 Li : son amplitude, son pas ou sa longueur.
- Ci = xi = (Li + Li+1 ) =2 : son centre, où i = 1; :::; k et k est le nombre
de classes.

Nombre de classes

En combien de classes partageons-nous les valeurs ? La réponse n’est pas


unique. Soit N l’e¤ectif total. Nous pouvons considérer dans ce cours trois

17
Chapitre 1. Statistique descriptive à une seule variable

réponses à titre d’exemple.


p hp i hp i
Réponse 1 : N , N (partie entière) ou N + 1: Donc, le nombre

de classes

p
k' N:

Exemple
p
Considérons 30 valeurs entre 56.5 cm et 97.8 cm. Dans ce cas, k = 30
et on prend k = 6.

Réponse 2 : la formule de Sturge

k = 1 + 3:3log10 (N ):

Réponse 3 : la formule de Yule


p
4
k = 2:5 N :

Remarque : De ce fait, on peut avoir plusieurs tableaux statistiques


selon le nombre de classes.
Exemple
Si on prend N = 30, alors le nombre de classes est donné, par exemple,
par

- Soit la formule de Sturge k = 1 + 3:3log10 (30) ' 6;


p
- Soit la formule de Yule k = 2:5 4 30 ' 6:
Nous mentionnons que les deux formules sont presque pareils si N hh 200:
Nous rappelons maintenant la dé…nition de l’étendu. De plus, dans le cas
continu nous parlons aussi du pas ou de la longueur de la classe.

18
Chapitre 1. Statistique descriptive à une seule variable

Dé…nition
Le nombre

E = xmax xmin

s’appelle étendu de X. Dans ce cas, on peut dé…nir le pas par

étendu xmax xmin


ai = = :
nombre de classes k

1.5.2 Représentation graphique d’un caractère continu

Histogramme des fréquences relatives (ou e¤ectifs)

Nous pouvons représenter le tableau statistique par un histogramme.


Nous reportons les classes sur l’axe des abscisses et, au-dessus de chacune
d’elles, nous traçons un rectangle dont l’aire est proportionnelle à la fréquence
relative fi (ou l’e¤ectif ni ) associée. Ce graphique est appelé l’histogramme
des fréquences relatives (ou des e¤ectifs).

ni : est le nombre d’individus dont les valeurs des caractères sont dans la
classe Ci.

Courbe des fréquences relatives cumulées croissantes (ou e¤ectifs


cumulés croissants)

On obtient le polygone des e¤ectifs cumulés croissants en joignant, par


des segments droits, les points ayant pour abscisse les bornes supérieurs des
classes et pour ordonnés les e¤ectifs cumulés (ou les fréquences relatives cu-
mulées) croissants correspondant à la classe considérée. Le premier point est
(a0 ; 0).

19
Chapitre 1. Statistique descriptive à une seule variable

Paramètres de position et de dispersion

On a les mêmes formules précédentes (moyenne, variance...), sauf on rem-


place xi par Ci, et pour le calcul du mode on prend le centre de la classe
modale.
Le seul changement est dans les quartiles.
On calcule la médiane Q2 ; la lecture du tableau nous permet de déterminer
la classe à partir de laquelle la moitié des e¤ectifs est atteinte. La médiane
appartient donc à cette classe. Cette dernière est appelée classe médiane. La
valeur exacte de la médiane est calculée en utilisant l’interpolation linéaire.
Si [ai ; ai+1 [ est la classe médiane, alors on a,

N N
n(i+1)c nic nic nic
tg b = ai+1 ai
= 2
M e ai
=) M e = ai + 2
n(i+1)c nic
(ai+1 ai ) :
N 3N
De la même façon on calcule Q1 pour 4
et Q3 pour 4
:

20
CHAPITRE 2

Statistique descriptive à deux variables

Dans le chapitre précédent, nous avons présenté les méthodes qui per-
mettent de résumer et représenter les informations relatives à une variable.
Un même individu peut être étudié à l’aide de plusieurs caractères (ou va-
riables). Par exemple, les salariés en regardant leur ancienneté et leur niveau
d’étude, la croissance d’un enfant en regardant son poids et sa taille. Dans
la suite, nous introduisons l’étude globale des relations entre deux variables
(en nous limitant au cas de deux variables). Donc, soit une population et

Z : ! R2 ;

! 7 ! Z (!) = (X (!) ; Y (!)) ;

ou directement

(X; Y ) : ! R2 ;

! 7 ! (X (!) ; Y (!)) :

21
Chapitre 2. Statistique descriptive à deux variables

Dans ce cas, Z est dite variable statistique à deux dimensions avec Card( ) =
N , et N un entier …ni. Le couple (X; Y ) est appelé le couple de la variable
statistique.
Exemples :
–On observe simultanément sur un échantillon de 200 foyers, le nombre
d’enfants X et le nombre de chambres Y .
–On observe sur un échantillon de 20 foyers, le revenu mensuel X en Da
et les dépenses mensuelles Y .
–Auprès des étudiants pris au hasard parmi une section de L2 génie civil,
on observe les notes de math3 X et de statistique Y .
– Une entreprise mène une étude sur la liaison entre les dépenses men-
suelles en publicité X et le volume des ventes Y qu’elle réalis.

2.1 Représentation des séries statistiques à


deux variables
Les séries statistiques à deux variables peuvent être présentées de deux
façons :
Présentation 1
A chaque ! i ; on associe (xi ; yi ) ; c’est à dire,

! i ! (xi ; yi ) :

On rassemblera les données comme dans le tableau suivant

!i !1 !2 ... ! N
Variable X X (! 1 ) X (! 2 ) ... X (! N )
Variable Y Y (! 1 ) Y (! 2 ) ... Y (! N )

22
Chapitre 2. Statistique descriptive à deux variables

Cette représentation on la notera "présentation 1". Nous allons utiliser


toujours les notations suivantes :

xi := X (! i ) et yi := Y (! i ) :

Exemple
Soit l’ensemble de 8 étudiants. Nous avons le tableau suivant :

!i !1 !2 !3 !4 !5 !6 !7 !8
X (!) 8 2 6 6 11 10 7 2
Y (!) 9 10 11 7 14 16 12 5
avec X représente le nombre d’heures passées à préparer l’examen de
statistique par étudiant et Y représente la note sur 20 obtenue à l’examen
par l’étudiant.
Lors de cette représentation, nous pouvons traduire le tableau associé
dans une …gure appelée "le nuage de points" ou "diagramme de dispersion".
Cette représentation est obtenue en mettant dans un repère cartésien chaque
couple d’observation (xi ; yj ) par un point.

Présentation 2
Soit la variable statistique Z donnée par le couple (X; Y ). Soient x1 ; :::; xk
et y1 ; :::; yl les valeurs prises respectivement par X et Y . Dans ce cas, nous
dé…nissons les valeurs de Z comme suite, pour i allant de 1 à k et pour j
allant de 1 à l,

zij := (xi ; yj ) :

La variable statistique Z prend k l valeurs.


Lors de cette étude, nous avons le tableau à double entrée (ou tableau de
contingence) suivant (discrète ou continue)

23
Chapitre 2. Statistique descriptive à deux variables

XnY C1 ou y1 ::: Cl ou yl Marginale % à X


C1 (centre de la 1ère classe) ou x1 n11 ou f11 ... n1l ou f1l n1 ou f1
.. .. .. .. ..
. . . . .
Ck ou xk nk1 ou fk1 ... nkl ou fkl nk ou fk
Marginale % à Y n 1 ou f 1 ... n l ou f l N

Cette représentation on la notera "présentation 2". chaque couple (xi ; yj ),


on a nij est l’e¤ectif qui représente le nombre d’individus qui prennent en
même temps la valeur xi et yj .
Nous notons par fij la fréquence du coulpe (xi ; yj ). Cette fréquence est
donnée par

nij
fij = ;
N
avec

X
k X
l
N = Card ( ) = nij :
i=1 j=1

Lois marginales
Sur la marge du tableau de contingence, on peut extraire les données
seulement par rapport à X et seulement par rapport à Y (voir le tableau de
contingence établi auparavant).
1. E¤ectifs et fréquences relatives marginales par rapport à X : nous
avons, pour i = 1:::k,

X
l
ni = nij ;
j=1

et

24
Chapitre 2. Statistique descriptive à deux variables

ni X l
fi = = fij
N j=1

2. E¤ectifs et fréquences relatives marginales par rapport à Y : nous avons,


pour j = 1:::l,

X
k
nj= nij ;
i=1

et

nj X
k
fj= = fij
N i=1

Remarque

X
k X
l X
k X
l
ni = n j = N et fi = fj=1
i=1 j=1 i=1 j=1

2.2 Description numérique

2.2.1 Caractéristiques des séries marginales

Dans le cas d’une variable statistique à deux dimensions X et Y , les


moyennes sont données respectivement par

1 X X
k k
_
x= ni xi = fi xi (moyenne de X),
N i=1 i=1

et

1 X X
l l
_
y= n j yj = f j yj (moyenne de Y ).
N j=1 j=1

Remarque

25
Chapitre 2. Statistique descriptive à deux variables

Dans le cas continu, xi et yj représentent respectivement le centre des


classes de X et Y .
Nous dé…nissions maintenant la variance de X et la variance de Y comme
suit,

1 X X
k k
_ 2 _ 2
V (X) = ni x2i x = fi x2i x ;
N i=1 i=1

et

1 X X
l l
_ 2 _ 2
V (Y ) = n j yj2 y = f j yj2 y :
N j=1 j=1

Les écarts-type de X et de Y sont donnés, respectivement, par

p p
X = V (X) et Y = V (Y ):

2.2.2 Série conditionnelle

La notion de série conditionnelle est essentielle pour comprendre l’analyse


de la régression. Un tableau de contingence se compose en autant de séries
conditionnelles suivant chaque ligne et chaque colonne.
Série conditionnelle par rapport à X
Elle est notée par X=yj (ou Xj ) et on dit que c’est la série conditionnelle
de X sachant que Y = yj . Nous calculons dans ce cas la fréquence relative
conditionnelle fi=j (fi sachant j), pour i = 1; :::; k; par

nij fij
fi=j = = :
nj fj
_
Nous avons aussi la moyenne conditionnelle xj , c’est à dire la moyenne
des valeurs de X sous la condition yj , elle est dé…nie par

26
Chapitre 2. Statistique descriptive à deux variables

_ X
k
1 X
k
xj = fi=j xi = nij xi :
i=1
n j i=1
p
Pour l’écart-type conditionnel, nous avons Xj = V (Xj ) avec

q X
k
_
V (Xj ) = fi=j (xi xj )2 :
i=1

Série conditionnelle par rapport à Y

Elle est notée par Y =xi (ou Yi ) et on dit que c’est la série conditionnelle de
Y sachant que X = xi . Nous calculons aussi dans ce cas la fréquence relative
conditionnelle fj=i (fj sachant i), pour j = 1; :::; l, par

nij fij
fj=i = = :
ni fi

_
Nous avons aussi la moyenne conditionnelle y i , c’est à dire la moyenne
des valeurs de Y sous la condition xi , elle est dé…nie par

_ X
l
1 X
l
yi = fj=i yj = nij yj :
j=1
n i j=1
p
Pour l’écart-type conditionnel, nous avons Yi = V (Yi ) avec

p X
l
_
V (Yi ) = fj=i (yj y i )2 :
j=1

2.2.3 Notion de covariance

Nous notons par Cov(X; Y ) la covariance entre les variables X et Y . La


covariance est un paramètre qui donne la variabilité de X par rapport à Y .
La covariance se calcule par l’expression suivante :

27
Chapitre 2. Statistique descriptive à deux variables

1 XX
k l
__
Cov (X; Y ) = nij xi yj xy
N i=1 j=1

Remarque
Dans le cas où nous avons un tableau des données brutes "representation
1" (nous n’avons pas d’e¤ectifs), nous avons les formules suivantes :

1 X 1 X
n n
_ _
x= xi ety = yi :
N i=1 N i=1

Remarque
La covariance est une notion qui généralise la variance, En e¤et,

Cov (X; X) = V (X) et Cov (Y; Y ) = V (Y ) :

Cela provient de la dé…nition.

Dé…nition
On dit que deux variables statistiques X et Y sont indépendantes si et
seulement si, pour tout i et j,

fij = fi f j ou bien nij = ni n j:

Il su¢ t que cette égalité ne soit pas véri…ée dans une seule cellule pour
que les deux variables ne soient pas indépendantes.

28
Chapitre 2. Statistique descriptive à deux variables

2.3 Ajustement linéaire

Dans le cas où on peut mettre en évidence l’existence d’une relation li-


néaire signi…cative entre deux caractères quantitatifs X et Y (la silhouette du
nuage de points est étirée dans une direction), on peut chercher à formaliser
la relation moyenne qui unit ces deux variables à l’aide d’une équation de
droite qui résume cette relation. Nous appelons cette démarche l’ajustement
linéaire.

2.3.1 Coe¢ cient de corrélation

Les coe¢ cients de corrélation permettent de donner une mesure synthé-


tique de l’intensité de la relation entre deux caractères et de son sens lorsque
cette relation est monotone. Le coe¢ cient de corrélation de Pearson permet
d’analyser les relations linéaires (voir ci-dessous). Il existe d’autres coe¢ -
cients pour les relations non-linéaires et non-monotones, mais ils ne seront
pas étudiés dans le cadre de ce cours.

Dé…nition
La quantité

Cov (X; Y )
R (X; Y ) = ;
X Y

s’appelle le coe¢ cient de corrélation.

Proposition
Le coe¢ cient R (X; Y ) est compris entre [-1, 1], ou encore

jR (X; Y )j 1:

29
Chapitre 2. Statistique descriptive à deux variables

Le coe¢ cient R (X; Y ) mesure le degré de liaison linéaire entre X et Y .


Nous avons les deux caractéristiques suivantes :

– Plus le module de R (X; Y ) est proche de 1 plus X et Y sont liées


linéairement.
– Plus le module de R (X; Y ) est proche de 0 plus il y a l’absence de
liaison linéaire entre X et Y:

Remarque
Par dé…nition, si R (X; Y )= 0, alors Cov(X; Y ) = 0:

2.3.2 Droite de régression

L’idée est de transformer un nuage de point en une droite. Celle-ci doit


être la plus proche possible de chacun des points. On cherchera donc à mini-
miser les écarts entre les points et la droite.
Pour cela, on utilise la méthode des moindres carrées. Cette méthode
vise à expliquer un nuage de points par une droite qui lie Y à X, c’est à dire
Y = aX + b, telle que la distance entre le nuage de points et la droite soit
minimale. Cette distance matérialise l’erreur, c’est à dire la di¤érence entre
le point réellement observé et le point prédit par la droite. Si la droite passe
au milieu des points, cette erreur sera alternativement positive et négative, la
somme des erreurs étant par dé…nition nulle. Ainsi, la méthode des moindres
carrés consiste à chercher la valeur des paramètres a et b qui minimise la
somme des erreurs élevées au carré.
On pose

30
Chapitre 2. Statistique descriptive à deux variables

X
n
e2i = U (a; b) ;
i=1

avec ei est l’erreur commise sur chaque observation, c’est à dire,

jei j = jyi yi j = jyi axi bj :

La méthode des moindres carrées consiste donc à minimiser la fonction U


(la somme des erreurs commises). Nous avons la condition de minimisation
suivante,

@U @U
= = 0;
@a @b
avec

X
n
U (a; b) = (yi axi b)2 :
i=1

@U
L’équation @b
= 0 donne

X
n
2 (yi axi b) = 0:
i=1

Ce qui implique que


!
X
n X
n X
n
1
yi a xi b 1=0 :
i=1 i=1 i=1
N

Par conséquent, nous obtenons

31
Chapitre 2. Statistique descriptive à deux variables

y ax b = 0;

c’est à dire,

b=y ax:

@U
De même, après calcule, @a
= 0 on trouve que

Cov (X; Y )
a= :
V (X)

Donc, la droite de régression, qui rend la distance entre elle et les points
minimale, est donnée par

D (Y =X) : Y = aX + b;

avec

Cov (X; Y )
a= et b = y ax:
V (X)
Ou bien

D (X=Y ) : X = aY + b;

avec

Cov (X; Y )
a= et b = x ay:
V (Y )

32
Chapitre 2. Statistique descriptive à deux variables

Remarque
Le coe¢ cient de corrélation R (X; Y ) permet de justi…er le fait de l’ajus-
tement linéaire. On adopte les critères numériques suivants :
–Si jR (X; Y )j< 0.7, alors l’ajustement linéaire est refusé (droite refusée).
–Si jR (X; Y )j 0.7, alors l’ajustement linéaire est accepté (droite accep-
tée).

33
CHAPITRE 3

Analyse combinatoire

L’analyse combinatoire est une branche des mathématiques qui étudie


comment compter les objets. Elle fournit des méthodes de dénombrement
particulièrement utiles en théorie des probabilités.
Soit une expérience aléatoire E.

3.1 Arrangement (sans répétition)


Dé…nition : Le nombre d’arrangements sans répétition de p éléments
pris parmi les n éléments de E, est

n!
Apn = n(n 1):::(n p + 1) = :
(n p)!
Exemple : les arrangements sans répétition à deux éléments de l’ensemble
f1; 2; 3g sont : (1; 2) ; (1; 3) ; (2; 1) ; (2; 3) ; (3; 1) ; (3; 2) ; donc 6 possibilités ou
3!
bien Apn = A23 = (3 2)!
=6 possibilités.

34
Chapitre 3. Analyse combinatoire

3.2 Arrangement (avec répétition)


Dé…nition : Lorsqu’un élément peut être choisi plusieurs fois dans un
arrangement , le nombre d’arrangements avec répétition de p éléments pris
parmi n est alors :

Apn = np avec 1 p n:

3.3 Permutation (sans répétition)


Dé…nition : On appelle permutation des n éléments de l’ensemble E
toute disposition ordonnée de ces n éléments. Les permutations de n éléments
constituent un cas particulier des arrangements sans répétition, c’est le cas
où n = p: Le nombre de permutations sans répétition est donc égal à Ann = n!:
Exemple : les permutations sans répétition de l’ensemble f1; 2; 3g sont
(1; 2; 3) ; (1; 3; 2) ; (2; 1; 3) ; (2; 3; 1) ; (3; 1; 2) ; (3; 2; 1) ; donc 6 possibilités ou bien
Ann = A33 = 3! =6 possibilités.

3.4 Permutation (avec répétition)


Dé…nition : On considère n objets, parmi lesquels r1 sont semblables
entre eux, r2 sont semblables entre eux,..., rk sont semblables entre eux, avec
r1 + r2 + ::: + rk = n: On appelle permutation avec répétition (r1 ; r2 ; :::; rk ) de
n objets, toutes partition de ces n objets entre objets entre k parties tel que
la ieme partie ait ri éléments i = 1; :::; k: Le nombre total de ces permutations
est

35
Chapitre 3. Analyse combinatoire

n!
Pn (r1 ; r2 ; :::; rk ) = :
r1 !r2 !:::rk !
Exemple : considérons le mot "cellule". Le nombre de mots possibles (avec
ou sans signi…cation) que l’on peut écrire en permutant ces 7 lettres est :

7!
P7 (1; 2; 3; 1) = ;
1!2!3!1!

Où r1 = 1 (lettre c), r2 = 2 (lettre e), r3 = 3 (lettre l), r4 = 1 (lettre u).

3.5 Combinaison (sans répétition)


Dé…nition : Le nombre de combinaisons sans répétition de p éléments
pris parmi les n éléments de E toute disposition non ordonnée de p éléments
de E , noté par Cnp où

Apn n!
Cnp = p = :
Ap p! (n p)!
Exemple : les combinaisons sans répétition à 2 éléments de l’ensemble
f1; 2; 3g sont (1; 2) ; (1; 3) ; (2; 3) ; donc 3 possibilités ou bien C32 =3 possibili-
tés.

3.6 Combinaison (avec répétition)


Dé…nition : Le nombre de combinaisons avec répétition de p éléments
pris parmi n est donné par la formule suivante :

p
Knp = Cn+p 1:

36
CHAPITRE 4

Calcul des probabilités

4.1 Dé…nitions

4.1.1 Dé…nition 1 (expérience aléatoire)

On appelle expérience aléatoire, toute expérience dont le résultat ne peut


être prévu, c-à-d, une expérience, qui est répétée plusieurs fois dans des
conditions apparemment identiques, peut conduire à des résultats di¤érents.

4.1.2 Dé…nition 2 (espace fondamental)

L’ensemble de tous les résultats possibles d’une expérience aléatoire s’ap-


pelle espace fondamental. Cet ensemble est noté par :

4.1.3 Dé…nition 3 (événement)

*Un événement est un résultat d’une expérience aléatoire. Donc il est


une partie de :

37
Chapitre 4. Calcul des probabilités

*Toute partie de réduite à un seul élément est appelée événement


élémentaire.
*Un événement composé est une partie de contenant plusieurs élé-
ments. Il peut donc se réaliser de plusieurs manières.
Exemple 1 : Si on lance un dé à 6 faces, l’ensemble fondamental est
composé de six faces, = f1; 2; 3; 4; 5; 6g :
Exemple 2 : Si on lance trois fois une pièce, sera composé des 23
arrangements avec répétition des 2 faces distinctes notées P et F : =
fPPP,PPF,PFP,PFF,FPP,FPF,FFP,FFFg :
Exemple 3 : Si on lance 3 pièces identiques simultanément, est composé
des trois combinaisons avec répétition des deux faces distinctes notées P et
F (K23 = 4) : = fPPP,PPF,FFP,FFFg :

4.2 Opérations sur les événements


Le tableau suivant résume les principales opérations sur les événements
Langage ensembliste Langage probabiliste
L’ensemble : événement certain, il est toujours réalisé.
L’ensemble ?: événement impossible, il n’est jamais réalisé.
B = A: B événement contraire de A:
C = A \ B: A et B sont simultanément réalisé.
D = A [ B: A ou B est réalisé ssi au moins l’un des 2 soit réalisé.
? = A \ B: A et B sont incompatibles.
= A [ B et ? = A \ B: A ou B est certain et A et B est impossible (système complet).

Remarque : Deux événements contraires sont incompatibles, mais la


réciproque est fausse.

38
Chapitre 4. Calcul des probabilités

4.3 Propriétés des probabilités


Propriété 1 (théorème) : 8A, B 2 P ( ) ; P (A [ B) = P (A) + P (B)
P (A \ B) :
Demonstration
On sait que A[B = A \ B [B avec A \ B et B sont deux événements
incompatibles. Alors,

P (A [ B) = P A \ B + P (B) : (1)

D’autre part, on a A \ B [ (A \ B) = A et A \ B \ (A \ B) = ?,
alors on peut écrire

P A \ B + P (A \ B) = P (A) :

D’où

P A \ B = P (A) P (A \ B) : (2)

De (1) et (2), on obtient le résultat voulu.


Propriété 2 : Pour tout A dans P ( ) ; on a P A = 1 P (A) :
Demonstration
En e¤et, comme A et A sont des événements incompatibles, donc

1 = P ( ) = P A [ A = P (A) + P A , P A = 1 P (A) :

Propriété 3 : A B ) P (A) P (B) :


Demonstration
Comme A B alors on peut écrire que B = A [ A \ B : Mais ? =
A \ A \ B , par conséquent

39
Chapitre 4. Calcul des probabilités

P (B) = P (A) + P (A \ B) P (A) :

4.4 Probabilité uniforme


Soit = f! 1 , ! 2 ; ...; ! n g un univers …ni. On dé…nit sur l’espace probabi-

liste ( ; P ( )) une probabilité P , en posant P (f! i g) = pi tel que 8 i = 1;...,

X
n
n; 0hpi h1 et pi = 1:
i=1
Dé…nition : P est appelée probabilité uniforme si 8 i = 1;..., n;
pi = n1 : Dans ce cas les f! i g sont équiprobables.
Généralement, dans le cas d’une probabilité uniforme, on utilise la règle
suivante :

Card A nombre de cas favorables


Pour tout A dans P ( ) ; P (A) = = :
Card nombre de cas possibles

4.5 Probabilité conditionnelle


Dé…nition : Soient ( ; P ( ) ; P ) un espace probabilisé …ni et A un

événement tel que P (A)i0. L’application PA dé…nie de P ( ) dans [0; 1] par :


P (A\B)
PA (B) = P (A)
; est appelée probabilité conditionnelle. PA (B) peut
être écrit P (B=A) et on dit "la probabilité de B sachant A".

4.5.1 Propriété

Pour tout A et B dans P ( ), tel que P (A) ; P (B)i0, on a

40
Chapitre 4. Calcul des probabilités

P (A \ B) = P (B=A) :P (A) = P (A=B) :P (B) :

4.6 Evénements indépendants


On dit que A et B sont indépendants par rapport à la probabilité P si
et seulement si P (A \ B) = P (A) :P (B) :

4.6.1 Remarques

1* Si A et B sont indépendants alors

P (A)i0 on a P (B=A) = P (B) :

P (B)i0 on a P (A=B) = P (A) :

2* A et B sont indépendants, A et B sont indépendants.


, A et B sont indépendants.
, A et B sont indépendants.

4.7 Théorème de Bayes


Soient ( ; P ( ) ; P ) un espace probabilisé …ni et E; A1 ; A2 ; :::; An ; (n + 1)
événements, tel que P (E)i0 et fA1 ; A2 ; :::; An g forme un système complet,
c.à.d
1*P (E)i0 et P (Ai )i0 pour tout i:
2*Les Ai sont deux à deux incompatibles.
3*[ni=1 Ai = :
Alors, on a pour tout k = 1; :::; n
P (E=Ak ) :P (Ak )
P (Ak =E) = Pn :
i=1 P (E=Ai ) :P (Ai )

41
Chapitre 4. Calcul des probabilités

Comme les Ai sont deux à deux incompatibles, alors on peut écrire


Pn
i=1 P (E=Ai ) :P (Ai ) = P (E) :

Cette relation est appelée formule de probabilité totale.

4.8 Lois de De Morgan


Les lois de De Morgan sont des identités entre propositions logiques. Elles
ont été formulées par le mathématicien britannique Augustus De Morgan
(1806-1871) :

A [ B = A \ B:

A \ B = A [ B:

42
CHAPITRE 5

Les variables aléatoires

5.1 Dé…nition
( ; F; P ) étant un espace probabilisé, on appelle : variable aléatoire notée
(v. a) toute application X dé…nit sur dans R telle que :

X : 7! R

! 7! X (!)

X (!) est appelé l’univers images.


Exemple : Lancer une pièce de monnaie deux fois, l’espace fondamental
est constitué des évènements suivants :

= fP P; F P; P F; F F g

Intéressons-nous au nombre de "faces" après les 2 lancers. Alors

X (!) = f0; 1; 2g

43
Chapitre 5. Les variables aléatoires

5.2 Variables aléatoires discrètes

5.2.1 Dé…nition

On appelle v.a discrète une v. a dont l’univers image X (!) est …ni et
dénombrable.

5.2.2 Loi de probabilité d’une v.a. discrète

Dé…nition

On appelle distribution ou loi de probabilité de la v.a X l’ensemble des


couples (xi ; pi ), i 2 N telle que :

pi = P (X = xi ) ; i 2 N:

La loi de probabilité d’une v.a discrète est souvent présentée sous forme
d’un tableau.

5.2.3 Fonction de répartition d’une v.a discrète

Dé…nition

On appelle fonction de répartition de la v.a X, la fonction F dé…nie pour


tout réel x par :
X
F (x) = P (X x) = P (X = xi ) :
xi x

5.2.4 Moments d’une v.a discrète

Espérance mathématique

Dé…nition On appelle espérance mathématique de la v.a X la quantité, si


elle existe :

44
Chapitre 5. Les variables aléatoires

X
n
E (X) = xi P (X = xi ) :
i=1

Variance

Il s’agit d’un indicateur mesurant la dispersion des valeurs xi autour de


E (X) :

2
X
n
V (X) = E [X E (X)] = [xi E (X)]2 P (X = xi ) :
i=1

Lorsque cette quantité existe, elle s’écrit aussi :

V (X) = E [X E (X)]2 = E X 2 [E (X)]2 :

5.3 Variables aléatoires continues

5.3.1 Dé…nition (v.a.c)

On appelle v. a continue, une v. a dont X (!) est une partie de R (inter-


valle).

5.3.2 Dé…nition (densité de probabilité)

La fonction f est dite densité de probabilité de X si et seulement si


8
>
> f 0; 8x 2 R
>
<
f est continue par morceau
>
> R +1
>
:
1
f (x) dx = 1

45
Chapitre 5. Les variables aléatoires

5.3.3 Loi de probabilité d’une v.a continue

La loi de probabilité d’une v.a continue est déterminée par la fonction de


répartition F , dé…nie pour tout réel x par :

Z x
F (x) = P (X x) = f (x) dx:
1

5.3.4 Moments d’une v.a continue

Espérance mathématique

Elle est dé…nie par :

Z +1
E (x) = xf (x) dx:
1

Variance

Elle est dé…nie par :

V (X) = E [X E (X)]2 = E X 2 [E (X)]2 :

46
BIBLIOGRAPHIE

[1] G. Calot, Cours de statistique descriptive, Dunod, 1969.

[2] A. Chekroun, Polycopié de statistiques descriptives cours et exercices,


2017-2018.

[3] J.-J. Droesbeke, Éléments de statistiques, Ellipses, 2001.

[4] N. khodja, Polycopié de Biostatistiques cours et exercices, 2021-2022.

[5] L. Leboucher and M.-J. Voisin, Introduction à la statistique descriptive,


2013.

[6] B. Oukacha et M. Benmessaoud, Statistique descriptive et calcul des


probabilités, 2013.

[7] J.-Y. Ouvrard, Probabilités : Tome 1, 2001.

[8] P. Roger, Probabilités, statistique et processus stochastiques, Pearson


Education, 2004.

[9] M. Tenenhaus, statistique : Méthodes pour décrire, expliquer et prévoir,


Dunod, 2006.

[10] J. Vaillant, Eléments de Statistique descriptive, 2015.

47

Vous aimerez peut-être aussi