COURS DE STAT.
ET PROBA
SOMMAIRE
PARTIE I : STATISTIQUE DESCRIPTIVE
I- ANALYSE UNIVARIEE................................................................................2
1-Analyse sur variables quantitatives..............................................................2
a-Indicateurs de position...........................................................................2
b-Indicateurs de dispersion.......................................................................5
2-Analyse sur variables qualitatives......................................................................9
3-Représentations graphiques................................................................................9
a-Caractère quantitatif..............................................................................9
b-Caractère qualitatif..............................................................................12
PARTIE II : CALCULS DE PROBABILITES
PARTIE III: VARIABLES ALEATOIRES
PARTIE IV : LOIS FONDAMENTALES DE PROBABILITE
1
PARTIE I : STATISTIQUE DESCRIPTIVE
La statistique descriptive est l’ensemble des méthodes d’analyses qui permettent de
synthétiser l’information contenue dans une base de données. Elles sont réalisées en fonction
du nombre et du type de variables dont on dispose.
Ainsi distinguera-t-on les analyses univariées (sur variables quantitatives et
qualitatives), les analyses bivariées (tableaux croisés, tableaux de moyenne et corrélations) et
les analyses multivariées (ACP, AFC, ACM).
I. ANALYSES UNIVARIEES
Les analyses univariées concernent le traitement d’une seule variable. Elles ont pour
objet de synthétiser et d’analyser les informations disponibles sur cette variable. Elles
dépendent du type de variables ou de données en présence.
1. Analyse sur données quantitatives
Dans le cadre d’un questionnaire, des données quantitatives apparaissent chaque fois
que la personne interrogée se voit demander la valeur (mesure, quantité) qu’elle donne à la
variable concernée. La synthèse de ces données peut être réalisée à travers le calcul de divers
indicateurs qui sont regroupés en deux grandes catégories : les indicateurs de position et les
indicateurs de dispersion.
a. Les indicateurs de position
Ces indicateurs sont le mode, la médiane et la moyenne. Ils permettent de savoir
autour de quelle valeur se situent les valeurs d’une variable statistique.
Le mode
Le mode est la valeur de la variable qui présente l’effectif le plus élevé (ou la
fréquence la plus élevée).
Exemple 1 : cas d’une variable discrète
Déterminons le mode de la variable relative à cette distribution statistique du
personnel d’une entreprise d’après le nombre d’enfants à charge
Nombre d’enfants Effectifs
(xi) (ni)
0 4
1 15
2 29
3 18
4 10
5 3
6 1
2
Total 80
Le mode est 2 enfant car l’effectif correspondant, 29, est le plus élevé de tous les
effectifs observés
Exemple 2 : cas d’une variable continue
Dans ce cas, la détermination du mode diffère légèrement. Pour chaque classe on
calcul le rapport . Celle qui détient le rapport le plus élevé est alors la classe
modale ou intervalle modal.
Déterminons la classe modale dans la distribution statistique suivante des ouvriers
d’une entreprise d’après leur salaire horaire.
Salaire Effectifs Rappor
horaire (ni) t
[47,50 ;
10 2
52,50[
[52,50 ;
30 6
57,50[
[57,50 ;
60 20
60,50[
[60,50 ;
72 24
63,50[
[63,50 ;
40 10
67,50[
[67,50 ;
24 4
73,50[
[73,50 ;
14 2
80,50[
Total 250
La classe modale est [60,5 ; 63,5[ car elle présente le rapport le plus élevé (24).
L’intérêt du mode est évident puisqu’il désigne la valeur de la variable qui revient le
plus souvent à l’occasion des observations faites.
Il n’a de signification véritable que si l’effectif correspondant est nettement supérieur
aux effectifs présentés par les autres valeurs de la variable.
Il ne doit être retenu que s’il est unique (série unimodale).
La médiane
3
La médiane est la valeur de la variable telle que le total des effectifs correspondant à
des valeurs de la variable inférieure à cette médiane, soit égal au total des effectifs
correspondant à des valeurs de la variable supérieure à cette médiane.
Variable discrète
Un candidat a obtenu les notes suivantes, sur 20, à l’occasion des épreuves qu’il a dû
subir.
Note Cœfficien
s t
14 1
8 1
11 1
12 3
10 1
7 2
Total 9
Rangeons dans l’ordre croissant (ou décroissant) les notes obtenues par ce candidat, la
note sept dont le coefficient est 2, étant écrite deux fois, la note 12 dont le coefficient 3, étant
écrite 3 fois, les autres notes étant écrite une fois.
7 7 8 10 11 12 12 12 14
Dans la série écrite qui compte 9 termes (nombre impair) étant la somme des
cœfficients, ou somme des effectifs, la note médiane est 11.
Si le candidat avait une épreuve supplémentaire, avec coefficient 1 et obtenu à cette
épreuve la note 6, l’ordre croissant des notes sera :
6 7 7 8 10 11 12 12 12 14
Les notes étant cette fois au nombre de 10 (nombre pair) on obtient un intervalle
médian [10 ; 11] ou la rigueur à une médiane égale à 10,5.
Variable continue
Pour l’illustration de cette partie reprenons des 250 ouvriers d’une entreprise classée
d’après leur salaire horaire.
Salaire Effectif Effectifs Effectifs
horaire s cumulés cumulés
4
(ni) croissants Décroissants
[47,50 ; 250
10 10
52,50[
[52,50 ; 240
30 40
57,50[
[57,50 ; 210
60 100
60,50[
[60,50 ; 150
72 172
63,50[
[63,50 ; 78
40 212
67,50[
[67,50 ; 38
24 236
73,50[
[73,50 ; 14
14 250
80,50[
Total 250
On recherche le salaire du 125e ouvrier ( ). Le nombre 125 étant
compris entre 100 et 172 l’intervalle médian est [60,50 ; 63,50[
Pour déterminer la médiane on procède par interpolation linéaire.
100 125 172
60,50 Me 63,50
Me = 61,54 F
La moyenne
La moyenne est le rapport de la somme des valeurs prises par la variable pondérée de
leur effectif par l’effectif total.
Exemple :
Nombre d’enfants Effectifs xi.n
5
(xi) (ni) i
0 4 0
1 15 15
2 29 58
3 18 54
4 10 40
5 3 15
6 1 6
Total 80 188
Enfants
Application : déterminer la moyenne arithmétique de la distribution des salaires
horaires des 250 ouvriers
b. Les indicateurs de dispersions
L’étendu (ou range)
L’étendu est la différence entre la valeur la plus élevée et la valeur la plus faible prise
par une variable.
Dans le cas de la distribution des salaires horaires des 250 employés l’étendu est
L’intervalle interquartile
La définition de l’intervalle interquartile suppose la connaissance préalable de la
notion de quartile.
On appelle premier quartile (ou quartile inférieur) d’une distribution statistique, et on
désigne par Q1, la valeur telle que 25% des valeur prises par la variable, donc 25% de
l’effectif total étudié, lui soient inférieures, et 75% supérieures.
On appelle troisième quartile (ou quartile supérieur) d’une distribution statistique, et
on désigne par Q3, la valeur telle que 75% des valeur prises par la variable, lui soient
inférieures, et 25% supérieures.
En conséquence de ces définitions le second quartile, Q2, se confond évidemment
avec la valeur médiane.
L’intervalle interquartile est la différence du troisième quartile et du premier
quartile.
Un quart des effectifs présentant des valeurs de la variable inférieure au premier
quartile, et un quart de ces effectifs présentant des valeurs supérieures au troisième quartile,
l’intervalle interquartile contient des valeurs de la variable présentée par la moitié centrale des
effectifs observés.
6
Exemple de détermination des quartiles Q1 et Q3, et de l’intervalle interquartile
(distribution des salaires horaires de 250 ouvriers)
Utilisons la colonne des effectifs cumulés croissants
Effectif Effectifs
Salaire
s cumulés
horaire
(ni) croissants
[47,50 ;
10 10
52,50[
[52,50 ;
30 40
57,50[
[57,50 ;
60 100
60,50[
[60,50 ;
72 172
63,50[
[63,50 ;
40 212
67,50[
[67,50 ;
24 236
73,50[
[73,50 ;
14 250
80,50[
Total 250
Le premier quartile, Q1, est le salaire correspondant à la 62,5e observation
, les observations étant rangées par ordre de valeurs croissantes. Il se situe
dans l’intervalle [57,50 ; 60,50[.
Nous aurons, alors
40 125 100
57,50 Q1 60,50
Le troisième quartile Q3, est le salaire correspondant à la
observation. Il se trouve dans l’intervalle [63,50 ; 67,50[.
7
L’intervalle interquartile est donc
NB : de manière analogue, on détermine l’intervalle interdécile (D9 – D1)
Ecart moyen
Les caractéristiques de dispersion ont pour objectif de permettre d’apprécier la
dispersion (l’étalement) des valeurs observées d’une variable statistique autour de ses valeurs
centrales.
Si nous retenons comme valeur centrale la moyenne arithmétique nous sommes
conduits à calculer, pour chaque valeur xi, l’écart entre cette valeur et la moyenne
arithmétique , à multiplier chacun de ces écarts par l’effectif correspondant, à totaliser les
produits obtenus, à diviser enfin le
total obtenu par l’effectif de la population. On obtient ainsi l’écart moyen (em) :
ou
Exemple de calcul de l’écart moyen (avec )
Centre des Effectif
Salaire horaire
Classes s
(xi)
(xi) (ni)
50 12,17 121,760
[47,50 ; 52,50[ 10
6
[52,50 ; 57,50[ 55 30 7,176 215,280
[57,50 ; 60,50[ 59 60 3,176 190,560
[60,50 ; 63,50[ 62 72 0,176 12,672
65,50 132,960
[63,50 ; 67,50[ 40 3,324
[67,50 ; 73,50[ 70,50 24 8,324 199,776
77 14,82 207,536
[73,50 ; 80,50[ 14
4
Total 250 1080,544
D’où . Ainsi en moyenne, les salaires horaires considérés
s’écartent d’environ 4,322 F du salaire moyen.
Variance, Ecart-type
8
La variance est la moyenne arithmétique des carrés des écarts des valeurs de la
variable à leur moyenne arithmétique. On désigne par (lire "sigma carré"), ou par
L’écart-type, désigné par , est la racine carrée positive de la variance.
Exemple de calcul d’une variance et d’un écart-type avec
Centre des Effectif
Salaire horaire
Classes s
(xi)
(xi) (ni)
[47,50 ; 52,50[ 50 10 -12,176 148,254 1482,550
[52,50 ; 57,50[ 55 30 -7,176 51,495 1544,850
[57,50 ; 60,50[ 59 60 -3,176 10,087 605,219
[60,50 ; 63,50[ 62 72 -0,176 0,0310 2,230
65,50 11,049 441,952
[63,50 ; 67,50[ 40 +3,324
[67,50 ; 73,50[ 70,50 24 +8,324 69,289 1662,935
77 +14,82 219,751 3076,514
[73,50 ; 80,50[ 14
4
Total 250 8816,256
D’où Variance et Ecart-type
Coefficient de variation
Les indicateurs présentés précédemment s’exprime dans la même unité que la variable
étudiée. Ils ne sont pas adéquats pour comparer la dispersion de deux distributions qui ne
s’exprime pas dans la même unité. Le coefficient de variation supprime ce défaut. Il se calcul
comme le rapport de l’écart-type à la moyenne.
C’est donc un indicateur de dispersion affranchit de dimension. Cette propriété fait du
coefficient de variation un indicateur utile pour comparer les distributions exprimer dans
différentes unités. De deux distributions, la plus dispersée sera celle dont le coefficient de
variation est le plus élevé. On peut ainsi comparer la dispersion des salaires entre les
employés de deux entreprises.
9
2. Analyse sur données qualitatives
L’analyse sur données qualitatives se fait par détermination des pourcentages des
individus appartenant aux différentes modalités.
Exemple : sur 250 personnes interrogées
13 sont veufs
96 mariés
112 célibataires
29 divorcés
La distribution des 250 élèves en fonction des années de préparations du concours est
la suivante :
Effectif %tage Angle (°)
Années
(ni) (%)
Divorcés 29 11,6 42
Célibataires 112 44,8 161
Mariés 96 38,4 138
Veufs 13 5,2 19
Total 250 100 360
1. Représentation graphique
La représentation graphique des données relatives à un caractère unique repose sur la
proportionnalité des longueurs, ou des aires, des graphiques, aux effectifs, ou aux fréquences,
des différentes modalités du caractère.
a. Caractère qualitatif
Pour un caractère qualitatif, on utilise principalement trois types de représentation
graphique : la représentation par tuyaux d'orgue, la représentation par secteurs et la
représentation en barre
La représentation par tuyaux d’orgue
Au niveau de la représentation par tuyaux d’orgue on porte également en abscisses les
modalités de la variable, de façon arbitraire mais en ordonnées des rectangles dont la longueur
est proportionnelle aux effectifs, ou aux fréquences, de chaque modalité.
Exemple
10
Effectifs, pourcentage
TUYAUX D'ORGUE
120
100
80
60
40
20
0
Divorcés célibataires Mariés Veufs
Situatuation matrimoniale
La représentation par secteur
Les diagrammes circulaires, ou semi-circulaires, consistent à partager un disque ou un
demi-disque, en tranches, ou secteurs, correspondant aux modalités observées et dont la
surface est proportionnelle à l'effectif, ou à la fréquence, de la modalité.
Exemple
DIAGRAMME PAR SECTEUR
5% 12%
Divorcés
38% célibataires
Mariés
45% Veufs
Le diagramme en barres
Le diagramme en barres se réalise par le partage d’une barre en plusieurs rectangles
dont les hauteurs sont proportionnelles aux pourcentages données les différentes modalités de
la variable.
Exemple
11
DIAGRAMME EN BARRE
100% 5.2
90%
80%
38.4
70%
Veufs
60%
Mariés
50%
célibataires
40%
44.8 Divorcés
30%
20%
10%
11.6
0%
1
b. Caractère quantitatif
La représentation graphique d’un caractère quantitatif se fait selon le fait qu’il soit
discret ou continue. Ainsi utilise-on le diagramme en bâton lorsqu’il est discret,
l’histogramme et les polygones cumulatifs croissant ou décroissant s’il est continu.
Le diagramme en bâton
En chacun des points correspondant aux valeurs prisent par la variable, on trace
parallèlement à l’axe des ordonnées un bâton de longueur proportionnelle à l’effectif
correspondant. Nous obtenons ainsi un diagramme en bâton.
Exemple
12
L’histogramme
Un histogramme est un ensemble de rectangles accolées dont les bases sont les
amplitudes des classes et les hauteurs les différents rapports Effectifs / amplitudes relatifs.
Exemple
Amplitude Effectifs Effectif Effectif /
Effectif
Salaire horaire (Base des Cumulés cumulés amplitude
s
(xi) rectangles croissants décroissants (hauteur des
(ni)
) rectangles)
[47,50 ; 52,50[ 5 10 10 250 2
[52,50 ; 57,50[ 5 30 40 240 6
[57,50 ; 60,50[ 3 60 100 210 20
[60,50 ; 63,50[ 3 72 172 150 24
[63,50 ; 67,50[ 4 40 212 78 10
[67,50 ; 73,50[ 6 24 236 38 4
[73,50 ; 80,50[ 7 14 250 14 2
Total 250
13
Le polygone cumulatif croissant
Un polygone cumulatif croissant s’établit en construisant dans un repère cartésien
orthogonal les points de coordonnées : (47,50 ; 0) ; (52,50 ;10) ; (57,50 ;40) ; (60,50 ;100) ;
(63,50 ;172) ; (67,50 ;212) ; (73,50 ;236) ; (80,50 ;250) points dont les abscisses sont égales
aux bornes supérieures des classes, sauf pour le premier point, et dont les ordonnées sont les
effectifs cumulés croissants correspondants. Puis en les joignant par des segments de droite.
Le polygone cumulatif décroissant
Il a le même principe de construction que celui qui précède à la seule différence que
les abscisses sont égales aux bornes inférieure des classes, sauf pour le dernier point et dont
les ordonnées sont les effectifs cumulés décroissants correspondants.
14
PARTIE II : CALCULS DE PROBABILITES
L’objet de la théorie des probabilités est l’étude des phénomènes aléatoires et des lois
qui les régissent. Elle s’attache à exprimer le nombre de réalisation (probabilité) du ou des
résultat(s) d’une expérience (épreuve) reproduite maintes fois.
I- RAPPEL DE DENOMBREMENT (ANALYSE COMBINATOIRE)
L’analyse combinatoire permet de recenser les dispositions qu’il est possible de
former à partir d’un ensemble donné d’éléments.
La distinction entre ces dispositions se fonde sur la notion d’ordre.
Deux ou plusieurs dispositions comportant les mêmes éléments seront différents si les
places affectées à ces éléments ne sont pas les mêmes. Ainsi (x,y) et (y,x) sont différentes s’il
s’agit de dispositions ordonnées.
Dans le cas de dispositions non ordonnées, (x,y) et (y,x) sont identiques car elle
comporte les mêmes éléments.
Trois formes de dispositions doivent être distinguées :
- Les permutations ;
- Les arrangements ;
- Les combinaisons.
1/ Si l’énoncé contient le mot successif, il faut tenir compte de tous les ordres dans
lesquels on peut obtenir un événement donné.
Dans certains cas, il est possible de multiplier par le nombre d’ordres possibles le
résultat trouvé pour un ordre déterminé.
2/ Si l’énoncé contient les mots successifs et avec remise, cela signifie que l’ordre
dans lequel on considère les éléments a de l’importance et qu’un élément peut éventuellement
être répété.
Le modèle mathématique mis en évidence est la p-liste ou la notion de p-uplets.
15
Le nombre de p-uplets d’un ensemble à n éléments est np.
3/ Si l’énoncé contient les mots successifs et sans remise, cela signifie que l’ordre
dans lequel on considère les éléments a de l’importance mais que tous les éléments considérés
sont distincts (ou qu’il n’y a pas de répétition d’éléments).
Le modèle mathématique mis en évidence est l’arrangement.
On appelle arrangement de p éléments une disposition ordonnée de p éléments choisis
parmi n éléments, avec p ≤ n.
Le nombre d’arrangement de n objets pris p à p est
4/ Si l’énoncé contient les mots successifs et sans remise, cela signifie que l’ordre
dans lequel on considère les éléments a de l’importance mais que tous les éléments considérés
sont distincts (ou qu’il n’y a pas de répétition d’éléments).
Le modèle mathématique mis en évidence est la permutation.
On appelle permutation de n éléments distincts toute suite ordonnée de ces n éléments
en plaçant les n éléments, les uns à la suite des autres avec p = n.
NB : La permutation de n éléments n’est donc qu’un cas particulier des arrangements,
celui de n éléments pris parmi n éléments.
5/ Si l’énoncé contient les mots simultanément, cela signifie que l’ordre dans lequel
on considère les éléments n’a pas d’importance.
Le modèle mathématique mis en évidence est la combinaison.
Une combinaison est une disposition non ordonnée de p éléments choisis parmi n
éléments.
Le nombre de combinaison de p éléments choisis parmi n est le réel
16
Le schéma ci-dessous récapitule ces différentes situations :
L’ordre a-t-il de l’importance ?
OUI NO
La répétition est-elle permise ? Combinaison
OUI NO
p-liste P=n
OUI NO
Permutation Arrangement
II- TERMINOLOGIE
1- Epreuve aléatoire
Une épreuve aléatoire est une expérience dont le résultat est imprévisible, et dû au
hasard (lancé d’une pièce, jet d’un dé, etc.)
2- Ensemble fondamental ou univers
L’ensemble fondamental ou univers, noté Ω, d’une épreuve aléatoire est l’ensemble de
tous les résultats possibles de l’épreuve.
3- Une éventualité
17
Une éventualité est un résultat possible d’une expérience aléatoire.
4- Un évènement
On appelle évènement E un ensemble d’éventualités c’est-à-dire une partie ou un sous
ensemble de l’univers Ω.
5- Evènements équiprobables
Deux évènements élémentaires A et B sont dits équiprobables lorsque, avant
l’épreuve, ils ont les mêmes chances de réalisation.
6- Evènements somme ou union de deux évènements A et B
L’évènement somme ou union de deux évènements A et B est un évènement qui se
réalise si A se réalise ou B se réalise ou les deux se réalisent.
On le note (A b), (A ou B), (A+B)
7- Evènements produit ou intersection de deux évènements A et B
C’est un évènement qui se réalise si A et B se réalisent en même temps. On le note (A
B), (A et B), (A x B). En termes d’ensemble, on parle de disjonction.
III- RELATIONS LOGIQUES ENTRE EVENEMENTS
1- Evènements complémentaires
Soit E une partie de Ω. Le complémentaire de E, également partie de Ω est noté , est
l’ensemble des résultats qui conduit à la réalisation de l’évènement contraire « non E ». Il est
constitué de tous les éléments de Ω qui n’appartiennent pas à E.
, et
2- Evènements simultanés et incompatibles
L’évènement C, réalisé si les deux évènements A et B sont réalisés simultanément, est
représenté par l’intersection de A et B.
18
3- Réunion
L’évènement D réalisé si A et B est réalisé, est représenté par la réunion de A et B :
4- Evènement impossible ou incertain
Un évènement I est dit impossible si l’ensemble associé à cet évènement est vide.
5- Implication des évènements
L’évènement A implique l’évènement B signifie que la réalisation de A entraîne celle
de B. Cette relation est traduite par l’inclusion
6- Univers probabilisé.
Soit Ω un univers et P(Ω) l’ensemble des évènements de Ω
On dit que cet espace est probabilisé si l’on définit une application « p » de l’ensemble
P(Ω) de l’intervalle définissant pour tous évènement A une probabilité P(A) et telle
que des évènements incompatibles A et B, M et P( )=P(A)+P(B) et P(Ω)=1
IV- DEFINITIONS ET PROPRIETES
1- Définitions
Si dans une population statistique, on observe qu’une sous-population représente une
fréquence fi ou une proportion pi en pourcentage (fi=pi/100), alors cette fréquence fi peut être
assimilée à la probabilité de tirer ou d’obtenir un élément de cette sous-population.
Si on désigne par Ei un élément de cette population ; P(Ei) = fi.
2- Propriétés
19
-
- Si alors
- Si A et B sont incompatibles ( ) alors
V- PROBABILITES COMPOSEES
Le théorème des probabilités composées permet de déterminer la probabilité de
réalisation simultanée de deux évènements. Ce théorème s’obtient à partir de la définition de
la probabilité conditionnelle d’un événement.
1- Probabilités conditionnelles
Soit Ω un ensemble d’événements sur lequel est définie une probabilité de A sachant
B ou encore de probabilité de A liée par B, a pour expression :
NB : est souvent noté P(A/B)
2- Théorème des probabilités composées
Soient deux événements A et B tels que et . La probabilité de
réalisation simultanée de A et B est égale à :
20
Si A et B sont indépendants, le théorème des probabilités composées devient :
NB : Deux événements A et B sont dits indépendants si la réalisation de l’un n’a
aucune influence sur celle de l’autre. Dans ce cas et
PARTIE II : VARIABLES ALEATOIRES
La variable aléatoire (VA) est une fonction définie sur l’ensemble des résultats
possibles d’une expérience aléatoire telle qu’il soit possible de déterminer la probabilité pour
qu’elle prenne une valeur dans un intervalle donné.
En mathématique et plus précisément en théorie des probabilités, une variable
aléatoire est une fonction mesurable définie sur un espace de probabilités. La mesure image
correspondante est appelé loi de variable aléatoire. Ce type de fonction permet de modéliser
un phénomène aléatoire, comme par exemple le résultat d’un jet de dés.
Il convient de distinguer deux types de variables aléatoires :
- Les variables aléatoires discrètes (ou discontinue) dont l’ensemble des valeurs
possible est fini ou dénombrables. Ces valeurs correspondent à des nombres
entiers.
- Les variables aléatoires continues dont l’ensemble des valeurs est infini ou non
dénombrable. L’ensemble de définition correspond à un ensemble réel.
I- Variables aléatoires discrètes
a- Définitions
Soit Ω un ensemble d’événements liés à une expérience aléatoire
21
, on appelle variable aléatoire, toute application notée, X de Ω
vers R :
Soit pi la probabilité associée à chaque valeur de x i prise par la variable aléatoire X,
La probabilité que la variable aléatoire X soit égale à xi est notée :
P(X=xi)=Pi avec et Pi
b- Loi de probabilité (fonction de distribution)
C’est l’ensemble des couples (xi,Pi) de la variable aléatoire X autrement dit, la loi de
probabilité est décrite par :
- L’ensemble des valeurs possibles de la variable aléatoire X.
- Les probabilités respectives que X prenne chacune des valeurs x1, x2, …..,xn
c- Représentation graphique
La loi de probabilité ou fonction de distribution est représentée par le diagramme en
bâtons où figurent les valeurs de X et les probabilités qui leur sont associées.
d- Fonction de répartition
On appelle fonction de répartition F(x), la probabilité que la variable X prenne une
valeur inférieure ou égale à x.
Sa représentation graphique s’effectue à partir des probabilités cumulées croissantes.
Elle est définie par :
22
F(x) est monotone croissante de 0 à 1. Elle est constante par intervalle, fermée à droite
et ouvert à gauche. Sa représentation graphique prend la forme d’un diagramme en escalier.
e- Propriétés de la fonction de répartition
F est une fonction croissante :
f- Espérance mathématique
L’espérance mathématique d’une variable aléatoire discrète x notée E(X) est la
moyenne arithmétique des valeurs xi pondérées par les probabilités Pi.
g- Variance et écart-type
On appelle variance la moyenne arithmétique des carrés par rapport à l’espérance
mathématique.
L’écart-type est la moyenne des écarts entre les valeurs observées x i et leur moyenne
arithmétique
II- Variables aléatoires continues
a- Définitions
23
Une variable aléatoire continue est une variable aléatoire susceptible de prendre toutes
les valeurs situées à l’intérieur d’un intervalle de R donné.
b- Fonctions de répartition
On définit la fonction de répartition de la même façon que dans le cas d’une variable
aléatoire discrète.
F(x) est la probabilité que X soit inférieure ou égale à x.
Si l’intervalle , on a :
F est continue, positif et croissante.
On a également avec :
La représentation graphique de F(x) prend la forme d’une courbe cumulative
c- Fonction densité de probabilité (ddp)
Soit , la probabilité que la variable X appartienne à I a été définie
précédemment par :
24
La densité moyenne de probabilité sur I est donnée par le rapport de la probabilité
précédente à l’amplitude de l’intervalle.
Considérons à présent un intervalle infiniment plus petit que I. Sa densité
de probabilité est :
ou
F(x) est une fonction de répartition de X.
La probabilité que la variable aléatoire X prenne une valeur dans l’intervalle réduit de
longueur dx est :
Soit ,
Propriétés
25
Si est un intervalle dans ou dans et F(x) une fonction dérivable
alors
d- Espérance mathématique et variance
PARTIE III : LOIS FONDAMENTALES DE PROBABILITE
Le recours aux lois de probabilité permet au-delà de la simple observation et de
l’analyse sommaire, en termes de caractéristiques de tendance centrale et de dispersion, des
phénomènes statistiques. Bien qu’indispensables, ces caractéristiques ne permettent pas le
calcul des probabilités de certains événements ou une quelconque extrapolation prospective.
Elles constituent cependant un point de repère nécessaire à l’association d’une loi théorique
aux phénomènes statistiques observés.
I- Lois de probabilité discrètes
1- Loi binomiale ou loi des épreuves répétées
Une variable aléatoire qui suit une loi binomiale est dite variable aléatoire binomiale.
Elle constitue la somme de n variables de Bernoulli.
a- Loi de Bernoulli et ses caractéristiques
Une variable de Bernoulli ne traduit que deux alternatives possibles : succès ou échec,
avec les probabilités respectives p et q.
Comme p et q sont complémentaires alors p+q=1 et q=1-p
Une variable de Bernoulli ne peut prendre que deux valeurs :
26
1 avec la probabilité p (succès)
0 avec la probabilité q (échec)
Espérance mathématique d’une variable de Bernoulli
Variance d’une variable de Bernoulli
(Après développement)
b- Définition de la loi Binomiale
L’épreuve de Bernoulli considérée précédemment est reproduite n fois. La variable
aléatoire X symbolise le nombre de succès ou de réalisations d’un événement, au cours des n
épreuves indépendantes.
La probabilité qu’il y ait k succès parmi ces n épreuves c’est-à-dire P(X=k) est :
avec
On dit que X suit une loi binomiale des paramètres (n,p) et est notée
Il est important de préciser que :
- Le nombre n d’épreuves est fixé et connu
- A chaque épreuve, il n’existe qu’un résultat : succès ou échec
- La probabilité p d’obtention d’un succès dans les différentes épreuves est
constante (on dit que les n épreuves sont mutuellement indépendantes)
27
c- Caractéristiques de la loi binomiale
Les caractéristiques de la loi Binomiale se déduisent aisément de celles spécifiques
aux variables de Bernoulli.
L’espérance mathématique est donnée par la variance par
2- Loi de poisson
Elle est appelée loi des événements rares ou loi des petits nombres. Elle est associée à
la description des événements dont les probabilités de réalisation sont faibles.
a- Définition
Soit une variable aléatoire discrète X et , un nombre réel strictement positif.
X est dite variable de poisson si la loi est définie par :
avec et e = 2,71828
On note
Correspond au nombre de réalisation d’un événement dans la période déterminée.
b- Caractéristiques de la loi de poisson
L’espérance mathématique et la variance sont :
c- Comment reconnaitre une loi de poisson ?
Si X est une variable aléatoire discrète prenant des valeurs dans N et est telle que :
28
La loi de poisson implique que la réalisation d’un événement soit liée à la variable
temps. Son existence est fondée sur la réunion des 3 conditions suivantes :
- La probabilité de réalisation de l’événement considéré au cours d’un intervalle de
temps infiniment petit est proportionnelle à sa durée ;
- Cette probabilité est indépendante du nombre de réalisations antérieurs de
l’événement, et demeure constante au cours de la période d’observation ;
- La probabilité que l’événement se réalise plus d’une fois dans le même intervalle
de temps dt est négligeable.
Le nombre X d’événements réalisés au cours d’un intervalle de temps T est une
variable aléatoire de poisson de paramètre =p.n avec = rapport de proportionnalité
entre T et dt
P= nombre constant de réalisation au cours de l’intervalle de temps dt.
Exemple d’événements traduisant une loi de poisson
Le nombre d’arrivée :
- D’appels téléphoniques à un standard
- De véhicule à un pont de péage
- De clients à un guichet
- D’avions à un aéroport
- De camions à un poste de chargement ou de déchargement
- Etc…
II- Lois de probabilité continues
1- Loi normale ou loi de Laplace-Gauss
29
La loi normale s’applique au cas d’une variable statistique qui résulte d’un grand
nombre de causes indépendantes dont aucune n’exerce un effet prépondérant. Elle traduit des
situations pratiques très fréquentes, qui font de cette loi l’une des distributions statistiques
majeures.
a- Définition
Une variable aléatoire continue X obéit à une loi normale, ou loi de Laplace-Gauss, de
moyenne m et d’écart-type , si X admet une fonction de densité définie par :
, Elle est notée
Avec ; ; e=2,71828 ; =3,14159 ;
b- Fonction de répartition
C’est la probabilité que la variable aléatoire X prenne une valeur inférieure à x.
c- Caractéristiques
La courbe de densité est symétrique par rapport à l’axe vertical x=m
On montre que E(X) = m et
30
2- Loi normal centrée réduite
Le calcul des valeurs à partir de la fonction de répartition de la variable nominale X, notée
, n’est pas aisé. Les paramètres m et prennent une infinité de valeurs
auxquels correspond un nombre tout aussi grand de configuration de courbes. Celles-ci se
réduisent à une seule, représentative de la variable obtenue par le changement de variable
suivant :
Soit T la variable obtenue à par partir de X : .
La variable T est dite normée si elle présente les deux propriétés suivantes :
- La moyenne est nulle : E(T) = 0
- L’écart-type est égal à l’unité :
La variable aléatoire obéit à une loi normale :
- Centrée, car
- Réduire, car
D’où la notation
a- Définition
Une variable aléatoire T obéit à une loi normale centrée réduite de moyenne m = 0 et d’écart-
type , si T admet une fonction de densité définie par :
b- Fonction de répartition
31
Elle est notée
NB :
32