0% ont trouvé ce document utile (0 vote)
77 vues32 pages

Statistique et Probabilités : Cours Complet

Ce document présente une introduction à la statistique descriptive. Il contient une description des analyses univariées, bivariées et multivariées ainsi qu'une explication détaillée des indicateurs de position et de dispersion pour les variables quantitatives.

Transféré par

diephor phorel hamana
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • Population,
  • Loi binomiale,
  • Analyse univariée,
  • Indicateurs de dispersion,
  • Échantillons,
  • Écart-type,
  • Analyse bivariée,
  • Événements indépendants,
  • Statistique descriptive,
  • Analyse multivariée
0% ont trouvé ce document utile (0 vote)
77 vues32 pages

Statistique et Probabilités : Cours Complet

Ce document présente une introduction à la statistique descriptive. Il contient une description des analyses univariées, bivariées et multivariées ainsi qu'une explication détaillée des indicateurs de position et de dispersion pour les variables quantitatives.

Transféré par

diephor phorel hamana
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Thèmes abordés

  • Population,
  • Loi binomiale,
  • Analyse univariée,
  • Indicateurs de dispersion,
  • Échantillons,
  • Écart-type,
  • Analyse bivariée,
  • Événements indépendants,
  • Statistique descriptive,
  • Analyse multivariée

COURS DE STAT.

ET PROBA
SOMMAIRE

PARTIE I : STATISTIQUE DESCRIPTIVE

I- ANALYSE UNIVARIEE................................................................................2
1-Analyse sur variables quantitatives..............................................................2
a-Indicateurs de position...........................................................................2
b-Indicateurs de dispersion.......................................................................5
2-Analyse sur variables qualitatives......................................................................9
3-Représentations graphiques................................................................................9
a-Caractère quantitatif..............................................................................9
b-Caractère qualitatif..............................................................................12

PARTIE II : CALCULS DE PROBABILITES

PARTIE III: VARIABLES ALEATOIRES

PARTIE IV : LOIS FONDAMENTALES DE PROBABILITE

1
PARTIE I : STATISTIQUE DESCRIPTIVE
La statistique descriptive est l’ensemble des méthodes d’analyses qui permettent de
synthétiser l’information contenue dans une base de données. Elles sont réalisées en fonction
du nombre et du type de variables dont on dispose.

Ainsi distinguera-t-on les analyses univariées (sur variables quantitatives et


qualitatives), les analyses bivariées (tableaux croisés, tableaux de moyenne et corrélations) et
les analyses multivariées (ACP, AFC, ACM).

I. ANALYSES UNIVARIEES

Les analyses univariées concernent le traitement d’une seule variable. Elles ont pour
objet de synthétiser et d’analyser les informations disponibles sur cette variable. Elles
dépendent du type de variables ou de données en présence.

1. Analyse sur données quantitatives

Dans le cadre d’un questionnaire, des données quantitatives apparaissent chaque fois
que la personne interrogée se voit demander la valeur (mesure, quantité) qu’elle donne à la
variable concernée. La synthèse de ces données peut être réalisée à travers le calcul de divers
indicateurs qui sont regroupés en deux grandes catégories : les indicateurs de position et les
indicateurs de dispersion.

a. Les indicateurs de position

Ces indicateurs sont le mode, la médiane et la moyenne. Ils permettent de savoir


autour de quelle valeur se situent les valeurs d’une variable statistique.

 Le mode

Le mode est la valeur de la variable qui présente l’effectif le plus élevé (ou la
fréquence la plus élevée).

Exemple 1 : cas d’une variable discrète

Déterminons le mode de la variable relative à cette distribution statistique du


personnel d’une entreprise d’après le nombre d’enfants à charge
Nombre d’enfants Effectifs
(xi) (ni)
0 4
1 15
2 29
3 18
4 10
5 3
6 1

2
Total 80

Le mode est 2 enfant car l’effectif correspondant, 29, est le plus élevé de tous les
effectifs observés

Exemple 2 : cas d’une variable continue

Dans ce cas, la détermination du mode diffère légèrement. Pour chaque classe on

calcul le rapport . Celle qui détient le rapport le plus élevé est alors la classe
modale ou intervalle modal.

Déterminons la classe modale dans la distribution statistique suivante des ouvriers


d’une entreprise d’après leur salaire horaire.

Salaire Effectifs Rappor


horaire (ni) t
[47,50 ;
10 2
52,50[
[52,50 ;
30 6
57,50[
[57,50 ;
60 20
60,50[
[60,50 ;
72 24
63,50[
[63,50 ;
40 10
67,50[
[67,50 ;
24 4
73,50[
[73,50 ;
14 2
80,50[
Total 250

La classe modale est [60,5 ; 63,5[ car elle présente le rapport le plus élevé (24).

L’intérêt du mode est évident puisqu’il désigne la valeur de la variable qui revient le
plus souvent à l’occasion des observations faites.

Il n’a de signification véritable que si l’effectif correspondant est nettement supérieur


aux effectifs présentés par les autres valeurs de la variable.

Il ne doit être retenu que s’il est unique (série unimodale).

 La médiane

3
La médiane est la valeur de la variable telle que le total des effectifs correspondant à
des valeurs de la variable inférieure à cette médiane, soit égal au total des effectifs
correspondant à des valeurs de la variable supérieure à cette médiane.

 Variable discrète

Un candidat a obtenu les notes suivantes, sur 20, à l’occasion des épreuves qu’il a dû
subir.
Note Cœfficien
s t
14 1
8 1
11 1
12 3
10 1
7 2
Total 9

Rangeons dans l’ordre croissant (ou décroissant) les notes obtenues par ce candidat, la
note sept dont le coefficient est 2, étant écrite deux fois, la note 12 dont le coefficient 3, étant
écrite 3 fois, les autres notes étant écrite une fois.

7 7 8 10 11 12 12 12 14

Dans la série écrite qui compte 9 termes (nombre impair) étant la somme des
cœfficients, ou somme des effectifs, la note médiane est 11.

Si le candidat avait une épreuve supplémentaire, avec coefficient 1 et obtenu à cette


épreuve la note 6, l’ordre croissant des notes sera :

6 7 7 8 10 11 12 12 12 14

Les notes étant cette fois au nombre de 10 (nombre pair) on obtient un intervalle
médian [10 ; 11] ou la rigueur à une médiane égale à 10,5.

 Variable continue

Pour l’illustration de cette partie reprenons des 250 ouvriers d’une entreprise classée
d’après leur salaire horaire.
Salaire Effectif Effectifs Effectifs
horaire s cumulés cumulés
4
(ni) croissants Décroissants
[47,50 ; 250
10 10
52,50[
[52,50 ; 240
30 40
57,50[
[57,50 ; 210
60 100
60,50[
[60,50 ; 150
72 172
63,50[
[63,50 ; 78
40 212
67,50[
[67,50 ; 38
24 236
73,50[
[73,50 ; 14
14 250
80,50[
Total 250

On recherche le salaire du 125e ouvrier ( ). Le nombre 125 étant


compris entre 100 et 172 l’intervalle médian est [60,50 ; 63,50[

Pour déterminer la médiane on procède par interpolation linéaire.

100 125 172

60,50 Me 63,50

Me = 61,54 F

La moyenne

La moyenne est le rapport de la somme des valeurs prises par la variable pondérée de
leur effectif par l’effectif total.

Exemple :
Nombre d’enfants Effectifs xi.n

5
(xi) (ni) i
0 4 0
1 15 15
2 29 58
3 18 54
4 10 40
5 3 15
6 1 6
Total 80 188

Enfants

Application : déterminer la moyenne arithmétique de la distribution des salaires


horaires des 250 ouvriers

b. Les indicateurs de dispersions

 L’étendu (ou range)

L’étendu est la différence entre la valeur la plus élevée et la valeur la plus faible prise
par une variable.

Dans le cas de la distribution des salaires horaires des 250 employés l’étendu est

 L’intervalle interquartile

La définition de l’intervalle interquartile suppose la connaissance préalable de la


notion de quartile.

On appelle premier quartile (ou quartile inférieur) d’une distribution statistique, et on


désigne par Q1, la valeur telle que 25% des valeur prises par la variable, donc 25% de
l’effectif total étudié, lui soient inférieures, et 75% supérieures.

On appelle troisième quartile (ou quartile supérieur) d’une distribution statistique, et


on désigne par Q3, la valeur telle que 75% des valeur prises par la variable, lui soient
inférieures, et 25% supérieures.

En conséquence de ces définitions le second quartile, Q2, se confond évidemment


avec la valeur médiane.

L’intervalle interquartile est la différence du troisième quartile et du premier


quartile.

Un quart des effectifs présentant des valeurs de la variable inférieure au premier


quartile, et un quart de ces effectifs présentant des valeurs supérieures au troisième quartile,
l’intervalle interquartile contient des valeurs de la variable présentée par la moitié centrale des
effectifs observés.

6
Exemple de détermination des quartiles Q1 et Q3, et de l’intervalle interquartile
(distribution des salaires horaires de 250 ouvriers)

Utilisons la colonne des effectifs cumulés croissants


Effectif Effectifs
Salaire
s cumulés
horaire
(ni) croissants
[47,50 ;
10 10
52,50[
[52,50 ;
30 40
57,50[
[57,50 ;
60 100
60,50[
[60,50 ;
72 172
63,50[
[63,50 ;
40 212
67,50[
[67,50 ;
24 236
73,50[
[73,50 ;
14 250
80,50[
Total 250

Le premier quartile, Q1, est le salaire correspondant à la 62,5e observation

, les observations étant rangées par ordre de valeurs croissantes. Il se situe


dans l’intervalle [57,50 ; 60,50[.

Nous aurons, alors

40 125 100

57,50 Q1 60,50

Le troisième quartile Q3, est le salaire correspondant à la


observation. Il se trouve dans l’intervalle [63,50 ; 67,50[.

7
L’intervalle interquartile est donc

NB : de manière analogue, on détermine l’intervalle interdécile (D9 – D1)

 Ecart moyen

Les caractéristiques de dispersion ont pour objectif de permettre d’apprécier la


dispersion (l’étalement) des valeurs observées d’une variable statistique autour de ses valeurs
centrales.

Si nous retenons comme valeur centrale la moyenne arithmétique nous sommes


conduits à calculer, pour chaque valeur xi, l’écart entre cette valeur et la moyenne

arithmétique , à multiplier chacun de ces écarts par l’effectif correspondant, à totaliser les
produits obtenus, à diviser enfin le

total obtenu par l’effectif de la population. On obtient ainsi l’écart moyen (em) :

ou

Exemple de calcul de l’écart moyen (avec )


Centre des Effectif
Salaire horaire
Classes s
(xi)
(xi) (ni)
50 12,17 121,760
[47,50 ; 52,50[ 10
6
[52,50 ; 57,50[ 55 30 7,176 215,280
[57,50 ; 60,50[ 59 60 3,176 190,560
[60,50 ; 63,50[ 62 72 0,176 12,672
65,50 132,960
[63,50 ; 67,50[ 40 3,324
[67,50 ; 73,50[ 70,50 24 8,324 199,776
77 14,82 207,536
[73,50 ; 80,50[ 14
4
Total 250 1080,544

D’où . Ainsi en moyenne, les salaires horaires considérés


s’écartent d’environ 4,322 F du salaire moyen.

 Variance, Ecart-type

8
La variance est la moyenne arithmétique des carrés des écarts des valeurs de la

variable à leur moyenne arithmétique. On désigne par (lire "sigma carré"), ou par

L’écart-type, désigné par , est la racine carrée positive de la variance.

Exemple de calcul d’une variance et d’un écart-type avec


Centre des Effectif
Salaire horaire
Classes s
(xi)
(xi) (ni)
[47,50 ; 52,50[ 50 10 -12,176 148,254 1482,550
[52,50 ; 57,50[ 55 30 -7,176 51,495 1544,850
[57,50 ; 60,50[ 59 60 -3,176 10,087 605,219
[60,50 ; 63,50[ 62 72 -0,176 0,0310 2,230
65,50 11,049 441,952
[63,50 ; 67,50[ 40 +3,324
[67,50 ; 73,50[ 70,50 24 +8,324 69,289 1662,935
77 +14,82 219,751 3076,514
[73,50 ; 80,50[ 14
4
Total 250 8816,256

D’où Variance et Ecart-type

 Coefficient de variation

Les indicateurs présentés précédemment s’exprime dans la même unité que la variable
étudiée. Ils ne sont pas adéquats pour comparer la dispersion de deux distributions qui ne
s’exprime pas dans la même unité. Le coefficient de variation supprime ce défaut. Il se calcul
comme le rapport de l’écart-type à la moyenne.

C’est donc un indicateur de dispersion affranchit de dimension. Cette propriété fait du


coefficient de variation un indicateur utile pour comparer les distributions exprimer dans
différentes unités. De deux distributions, la plus dispersée sera celle dont le coefficient de
variation est le plus élevé. On peut ainsi comparer la dispersion des salaires entre les
employés de deux entreprises.

9
2. Analyse sur données qualitatives

L’analyse sur données qualitatives se fait par détermination des pourcentages des
individus appartenant aux différentes modalités.

Exemple : sur 250 personnes interrogées


 13 sont veufs
 96 mariés
 112 célibataires
 29 divorcés

La distribution des 250 élèves en fonction des années de préparations du concours est
la suivante :
Effectif %tage Angle (°)
Années
(ni) (%)
Divorcés 29 11,6 42
Célibataires 112 44,8 161
Mariés 96 38,4 138
Veufs 13 5,2 19
Total 250 100 360

1. Représentation graphique

La représentation graphique des données relatives à un caractère unique repose sur la


proportionnalité des longueurs, ou des aires, des graphiques, aux effectifs, ou aux fréquences,
des différentes modalités du caractère.

a. Caractère qualitatif

Pour un caractère qualitatif, on utilise principalement trois types de représentation


graphique : la représentation par tuyaux d'orgue, la représentation par secteurs et la
représentation en barre

 La représentation par tuyaux d’orgue

Au niveau de la représentation par tuyaux d’orgue on porte également en abscisses les


modalités de la variable, de façon arbitraire mais en ordonnées des rectangles dont la longueur
est proportionnelle aux effectifs, ou aux fréquences, de chaque modalité.

Exemple

10
Effectifs, pourcentage
TUYAUX D'ORGUE

120
100
80
60
40
20
0
Divorcés célibataires Mariés Veufs
Situatuation matrimoniale

 La représentation par secteur

Les diagrammes circulaires, ou semi-circulaires, consistent à partager un disque ou un


demi-disque, en tranches, ou secteurs, correspondant aux modalités observées et dont la
surface est proportionnelle à l'effectif, ou à la fréquence, de la modalité.

Exemple

DIAGRAMME PAR SECTEUR

5% 12%
Divorcés
38% célibataires
Mariés
45% Veufs

 Le diagramme en barres

Le diagramme en barres se réalise par le partage d’une barre en plusieurs rectangles


dont les hauteurs sont proportionnelles aux pourcentages données les différentes modalités de
la variable.

Exemple

11
DIAGRAMME EN BARRE

100% 5.2
90%
80%
38.4
70%
Veufs
60%
Mariés
50%
célibataires
40%
44.8 Divorcés
30%
20%
10%
11.6
0%
1

b. Caractère quantitatif

La représentation graphique d’un caractère quantitatif se fait selon le fait qu’il soit
discret ou continue. Ainsi utilise-on le diagramme en bâton lorsqu’il est discret,
l’histogramme et les polygones cumulatifs croissant ou décroissant s’il est continu.

 Le diagramme en bâton

En chacun des points correspondant aux valeurs prisent par la variable, on trace
parallèlement à l’axe des ordonnées un bâton de longueur proportionnelle à l’effectif
correspondant. Nous obtenons ainsi un diagramme en bâton.

Exemple

12
 L’histogramme

Un histogramme est un ensemble de rectangles accolées dont les bases sont les
amplitudes des classes et les hauteurs les différents rapports Effectifs / amplitudes relatifs.

Exemple
Amplitude Effectifs Effectif Effectif /
Effectif
Salaire horaire (Base des Cumulés cumulés amplitude
s
(xi) rectangles croissants décroissants (hauteur des
(ni)
) rectangles)
[47,50 ; 52,50[ 5 10 10 250 2
[52,50 ; 57,50[ 5 30 40 240 6
[57,50 ; 60,50[ 3 60 100 210 20
[60,50 ; 63,50[ 3 72 172 150 24
[63,50 ; 67,50[ 4 40 212 78 10
[67,50 ; 73,50[ 6 24 236 38 4
[73,50 ; 80,50[ 7 14 250 14 2
Total 250

13
 Le polygone cumulatif croissant

Un polygone cumulatif croissant s’établit en construisant dans un repère cartésien


orthogonal les points de coordonnées : (47,50 ; 0) ; (52,50 ;10) ; (57,50 ;40) ; (60,50 ;100) ;
(63,50 ;172) ; (67,50 ;212) ; (73,50 ;236) ; (80,50 ;250) points dont les abscisses sont égales
aux bornes supérieures des classes, sauf pour le premier point, et dont les ordonnées sont les
effectifs cumulés croissants correspondants. Puis en les joignant par des segments de droite.

 Le polygone cumulatif décroissant

Il a le même principe de construction que celui qui précède à la seule différence que
les abscisses sont égales aux bornes inférieure des classes, sauf pour le dernier point et dont
les ordonnées sont les effectifs cumulés décroissants correspondants.

14
PARTIE II : CALCULS DE PROBABILITES

L’objet de la théorie des probabilités est l’étude des phénomènes aléatoires et des lois
qui les régissent. Elle s’attache à exprimer le nombre de réalisation (probabilité) du ou des
résultat(s) d’une expérience (épreuve) reproduite maintes fois.

I- RAPPEL DE DENOMBREMENT (ANALYSE COMBINATOIRE)

L’analyse combinatoire permet de recenser les dispositions qu’il est possible de


former à partir d’un ensemble donné d’éléments.

La distinction entre ces dispositions se fonde sur la notion d’ordre.

Deux ou plusieurs dispositions comportant les mêmes éléments seront différents si les
places affectées à ces éléments ne sont pas les mêmes. Ainsi (x,y) et (y,x) sont différentes s’il
s’agit de dispositions ordonnées.

Dans le cas de dispositions non ordonnées, (x,y) et (y,x) sont identiques car elle
comporte les mêmes éléments.

Trois formes de dispositions doivent être distinguées :

- Les permutations ;

- Les arrangements ;

- Les combinaisons.

1/ Si l’énoncé contient le mot successif, il faut tenir compte de tous les ordres dans
lesquels on peut obtenir un événement donné.

Dans certains cas, il est possible de multiplier par le nombre d’ordres possibles le
résultat trouvé pour un ordre déterminé.

2/ Si l’énoncé contient les mots successifs et avec remise, cela signifie que l’ordre
dans lequel on considère les éléments a de l’importance et qu’un élément peut éventuellement
être répété.

Le modèle mathématique mis en évidence est la p-liste ou la notion de p-uplets.

15
Le nombre de p-uplets d’un ensemble à n éléments est np.

3/ Si l’énoncé contient les mots successifs et sans remise, cela signifie que l’ordre
dans lequel on considère les éléments a de l’importance mais que tous les éléments considérés
sont distincts (ou qu’il n’y a pas de répétition d’éléments).

Le modèle mathématique mis en évidence est l’arrangement.

On appelle arrangement de p éléments une disposition ordonnée de p éléments choisis


parmi n éléments, avec p ≤ n.

Le nombre d’arrangement de n objets pris p à p est

4/ Si l’énoncé contient les mots successifs et sans remise, cela signifie que l’ordre
dans lequel on considère les éléments a de l’importance mais que tous les éléments considérés
sont distincts (ou qu’il n’y a pas de répétition d’éléments).

Le modèle mathématique mis en évidence est la permutation.

On appelle permutation de n éléments distincts toute suite ordonnée de ces n éléments


en plaçant les n éléments, les uns à la suite des autres avec p = n.

NB : La permutation de n éléments n’est donc qu’un cas particulier des arrangements,


celui de n éléments pris parmi n éléments.

5/ Si l’énoncé contient les mots simultanément, cela signifie que l’ordre dans lequel
on considère les éléments n’a pas d’importance.

Le modèle mathématique mis en évidence est la combinaison.

Une combinaison est une disposition non ordonnée de p éléments choisis parmi n
éléments.

Le nombre de combinaison de p éléments choisis parmi n est le réel

16
Le schéma ci-dessous récapitule ces différentes situations :

L’ordre a-t-il de l’importance ?

OUI NO

La répétition est-elle permise ? Combinaison

OUI NO

p-liste P=n

OUI NO

Permutation Arrangement

II- TERMINOLOGIE

1- Epreuve aléatoire

Une épreuve aléatoire est une expérience dont le résultat est imprévisible, et dû au
hasard (lancé d’une pièce, jet d’un dé, etc.)

2- Ensemble fondamental ou univers

L’ensemble fondamental ou univers, noté Ω, d’une épreuve aléatoire est l’ensemble de


tous les résultats possibles de l’épreuve.

3- Une éventualité

17
Une éventualité est un résultat possible d’une expérience aléatoire.

4- Un évènement

On appelle évènement E un ensemble d’éventualités c’est-à-dire une partie ou un sous


ensemble de l’univers Ω.

5- Evènements équiprobables

Deux évènements élémentaires A et B sont dits équiprobables lorsque, avant


l’épreuve, ils ont les mêmes chances de réalisation.

6- Evènements somme ou union de deux évènements A et B

L’évènement somme ou union de deux évènements A et B est un évènement qui se


réalise si A se réalise ou B se réalise ou les deux se réalisent.

On le note (A b), (A ou B), (A+B)

7- Evènements produit ou intersection de deux évènements A et B

C’est un évènement qui se réalise si A et B se réalisent en même temps. On le note (A

B), (A et B), (A x B). En termes d’ensemble, on parle de disjonction.

III- RELATIONS LOGIQUES ENTRE EVENEMENTS

1- Evènements complémentaires

Soit E une partie de Ω. Le complémentaire de E, également partie de Ω est noté , est


l’ensemble des résultats qui conduit à la réalisation de l’évènement contraire « non E ». Il est
constitué de tous les éléments de Ω qui n’appartiennent pas à E.

, et

2- Evènements simultanés et incompatibles

L’évènement C, réalisé si les deux évènements A et B sont réalisés simultanément, est


représenté par l’intersection de A et B.

18
3- Réunion

L’évènement D réalisé si A et B est réalisé, est représenté par la réunion de A et B :

4- Evènement impossible ou incertain

Un évènement I est dit impossible si l’ensemble associé à cet évènement est vide.

5- Implication des évènements

L’évènement A implique l’évènement B signifie que la réalisation de A entraîne celle

de B. Cette relation est traduite par l’inclusion

6- Univers probabilisé.

Soit Ω un univers et P(Ω) l’ensemble des évènements de Ω

On dit que cet espace est probabilisé si l’on définit une application « p » de l’ensemble

P(Ω) de l’intervalle définissant pour tous évènement A une probabilité P(A) et telle

que des évènements incompatibles A et B, M et P( )=P(A)+P(B) et P(Ω)=1

IV- DEFINITIONS ET PROPRIETES

1- Définitions

Si dans une population statistique, on observe qu’une sous-population représente une


fréquence fi ou une proportion pi en pourcentage (fi=pi/100), alors cette fréquence fi peut être
assimilée à la probabilité de tirer ou d’obtenir un élément de cette sous-population.

Si on désigne par Ei un élément de cette population ; P(Ei) = fi.

2- Propriétés

19
-

- Si alors

- Si A et B sont incompatibles ( ) alors

V- PROBABILITES COMPOSEES

Le théorème des probabilités composées permet de déterminer la probabilité de


réalisation simultanée de deux évènements. Ce théorème s’obtient à partir de la définition de
la probabilité conditionnelle d’un événement.

1- Probabilités conditionnelles

Soit Ω un ensemble d’événements sur lequel est définie une probabilité de A sachant
B ou encore de probabilité de A liée par B, a pour expression :

NB : est souvent noté P(A/B)

2- Théorème des probabilités composées

Soient deux événements A et B tels que et . La probabilité de


réalisation simultanée de A et B est égale à :

20
Si A et B sont indépendants, le théorème des probabilités composées devient :

NB : Deux événements A et B sont dits indépendants si la réalisation de l’un n’a

aucune influence sur celle de l’autre. Dans ce cas et

PARTIE II : VARIABLES ALEATOIRES

La variable aléatoire (VA) est une fonction définie sur l’ensemble des résultats
possibles d’une expérience aléatoire telle qu’il soit possible de déterminer la probabilité pour
qu’elle prenne une valeur dans un intervalle donné.

En mathématique et plus précisément en théorie des probabilités, une variable


aléatoire est une fonction mesurable définie sur un espace de probabilités. La mesure image
correspondante est appelé loi de variable aléatoire. Ce type de fonction permet de modéliser
un phénomène aléatoire, comme par exemple le résultat d’un jet de dés.

Il convient de distinguer deux types de variables aléatoires :

- Les variables aléatoires discrètes (ou discontinue) dont l’ensemble des valeurs
possible est fini ou dénombrables. Ces valeurs correspondent à des nombres
entiers.

- Les variables aléatoires continues dont l’ensemble des valeurs est infini ou non
dénombrable. L’ensemble de définition correspond à un ensemble réel.

I- Variables aléatoires discrètes

a- Définitions

Soit Ω un ensemble d’événements liés à une expérience aléatoire

21
, on appelle variable aléatoire, toute application notée, X de Ω
vers R :

Soit pi la probabilité associée à chaque valeur de x i prise par la variable aléatoire X,

La probabilité que la variable aléatoire X soit égale à xi est notée :

P(X=xi)=Pi avec et Pi

b- Loi de probabilité (fonction de distribution)

C’est l’ensemble des couples (xi,Pi) de la variable aléatoire X autrement dit, la loi de
probabilité est décrite par :

- L’ensemble des valeurs possibles de la variable aléatoire X.

- Les probabilités respectives que X prenne chacune des valeurs x1, x2, …..,xn

c- Représentation graphique

La loi de probabilité ou fonction de distribution est représentée par le diagramme en


bâtons où figurent les valeurs de X et les probabilités qui leur sont associées.

d- Fonction de répartition

On appelle fonction de répartition F(x), la probabilité que la variable X prenne une


valeur inférieure ou égale à x.

Sa représentation graphique s’effectue à partir des probabilités cumulées croissantes.


Elle est définie par :

22
F(x) est monotone croissante de 0 à 1. Elle est constante par intervalle, fermée à droite
et ouvert à gauche. Sa représentation graphique prend la forme d’un diagramme en escalier.

e- Propriétés de la fonction de répartition

F est une fonction croissante :

f- Espérance mathématique

L’espérance mathématique d’une variable aléatoire discrète x notée E(X) est la


moyenne arithmétique des valeurs xi pondérées par les probabilités Pi.

g- Variance et écart-type

On appelle variance la moyenne arithmétique des carrés par rapport à l’espérance


mathématique.

L’écart-type est la moyenne des écarts entre les valeurs observées x i et leur moyenne

arithmétique

II- Variables aléatoires continues

a- Définitions

23
Une variable aléatoire continue est une variable aléatoire susceptible de prendre toutes
les valeurs situées à l’intérieur d’un intervalle de R donné.

b- Fonctions de répartition

On définit la fonction de répartition de la même façon que dans le cas d’une variable
aléatoire discrète.

F(x) est la probabilité que X soit inférieure ou égale à x.

Si l’intervalle , on a :

F est continue, positif et croissante.

On a également avec :

La représentation graphique de F(x) prend la forme d’une courbe cumulative

c- Fonction densité de probabilité (ddp)

Soit , la probabilité que la variable X appartienne à I a été définie

précédemment par :

24
La densité moyenne de probabilité sur I est donnée par le rapport de la probabilité
précédente à l’amplitude de l’intervalle.

Considérons à présent un intervalle infiniment plus petit que I. Sa densité


de probabilité est :

ou

F(x) est une fonction de répartition de X.

La probabilité que la variable aléatoire X prenne une valeur dans l’intervalle réduit de

longueur dx est :

Soit ,

Propriétés

25
Si est un intervalle dans ou dans et F(x) une fonction dérivable

alors

d- Espérance mathématique et variance

PARTIE III : LOIS FONDAMENTALES DE PROBABILITE

Le recours aux lois de probabilité permet au-delà de la simple observation et de


l’analyse sommaire, en termes de caractéristiques de tendance centrale et de dispersion, des
phénomènes statistiques. Bien qu’indispensables, ces caractéristiques ne permettent pas le
calcul des probabilités de certains événements ou une quelconque extrapolation prospective.
Elles constituent cependant un point de repère nécessaire à l’association d’une loi théorique
aux phénomènes statistiques observés.

I- Lois de probabilité discrètes

1- Loi binomiale ou loi des épreuves répétées

Une variable aléatoire qui suit une loi binomiale est dite variable aléatoire binomiale.
Elle constitue la somme de n variables de Bernoulli.

a- Loi de Bernoulli et ses caractéristiques

Une variable de Bernoulli ne traduit que deux alternatives possibles : succès ou échec,
avec les probabilités respectives p et q.

Comme p et q sont complémentaires alors p+q=1 et q=1-p

Une variable de Bernoulli ne peut prendre que deux valeurs :

26
1 avec la probabilité p (succès)

0 avec la probabilité q (échec)

Espérance mathématique d’une variable de Bernoulli

Variance d’une variable de Bernoulli

(Après développement)

b- Définition de la loi Binomiale

L’épreuve de Bernoulli considérée précédemment est reproduite n fois. La variable


aléatoire X symbolise le nombre de succès ou de réalisations d’un événement, au cours des n
épreuves indépendantes.

La probabilité qu’il y ait k succès parmi ces n épreuves c’est-à-dire P(X=k) est :

avec

On dit que X suit une loi binomiale des paramètres (n,p) et est notée

Il est important de préciser que :

- Le nombre n d’épreuves est fixé et connu

- A chaque épreuve, il n’existe qu’un résultat : succès ou échec

- La probabilité p d’obtention d’un succès dans les différentes épreuves est


constante (on dit que les n épreuves sont mutuellement indépendantes)

27
c- Caractéristiques de la loi binomiale

Les caractéristiques de la loi Binomiale se déduisent aisément de celles spécifiques


aux variables de Bernoulli.

L’espérance mathématique est donnée par la variance par

2- Loi de poisson

Elle est appelée loi des événements rares ou loi des petits nombres. Elle est associée à
la description des événements dont les probabilités de réalisation sont faibles.

a- Définition

Soit une variable aléatoire discrète X et , un nombre réel strictement positif.

X est dite variable de poisson si la loi est définie par :

avec et e = 2,71828

On note

Correspond au nombre de réalisation d’un événement dans la période déterminée.

b- Caractéristiques de la loi de poisson

L’espérance mathématique et la variance sont :

c- Comment reconnaitre une loi de poisson ?

Si X est une variable aléatoire discrète prenant des valeurs dans N et est telle que :

28
La loi de poisson implique que la réalisation d’un événement soit liée à la variable
temps. Son existence est fondée sur la réunion des 3 conditions suivantes :

- La probabilité de réalisation de l’événement considéré au cours d’un intervalle de


temps infiniment petit est proportionnelle à sa durée ;

- Cette probabilité est indépendante du nombre de réalisations antérieurs de


l’événement, et demeure constante au cours de la période d’observation ;

- La probabilité que l’événement se réalise plus d’une fois dans le même intervalle
de temps dt est négligeable.

Le nombre X d’événements réalisés au cours d’un intervalle de temps T est une

variable aléatoire de poisson de paramètre =p.n avec = rapport de proportionnalité


entre T et dt

P= nombre constant de réalisation au cours de l’intervalle de temps dt.

Exemple d’événements traduisant une loi de poisson

Le nombre d’arrivée :

- D’appels téléphoniques à un standard

- De véhicule à un pont de péage

- De clients à un guichet

- D’avions à un aéroport

- De camions à un poste de chargement ou de déchargement

- Etc…

II- Lois de probabilité continues

1- Loi normale ou loi de Laplace-Gauss

29
La loi normale s’applique au cas d’une variable statistique qui résulte d’un grand
nombre de causes indépendantes dont aucune n’exerce un effet prépondérant. Elle traduit des
situations pratiques très fréquentes, qui font de cette loi l’une des distributions statistiques
majeures.

a- Définition

Une variable aléatoire continue X obéit à une loi normale, ou loi de Laplace-Gauss, de

moyenne m et d’écart-type , si X admet une fonction de densité définie par :

, Elle est notée

Avec ; ; e=2,71828 ; =3,14159 ;

b- Fonction de répartition

C’est la probabilité que la variable aléatoire X prenne une valeur inférieure à x.

c- Caractéristiques

La courbe de densité est symétrique par rapport à l’axe vertical x=m

On montre que E(X) = m et

30
2- Loi normal centrée réduite

Le calcul des valeurs à partir de la fonction de répartition de la variable nominale X, notée

, n’est pas aisé. Les paramètres m et prennent une infinité de valeurs


auxquels correspond un nombre tout aussi grand de configuration de courbes. Celles-ci se
réduisent à une seule, représentative de la variable obtenue par le changement de variable
suivant :

Soit T la variable obtenue à par partir de X : .

La variable T est dite normée si elle présente les deux propriétés suivantes :

- La moyenne est nulle : E(T) = 0

- L’écart-type est égal à l’unité :

La variable aléatoire obéit à une loi normale :

- Centrée, car

- Réduire, car

D’où la notation

a- Définition

Une variable aléatoire T obéit à une loi normale centrée réduite de moyenne m = 0 et d’écart-

type , si T admet une fonction de densité définie par :

b- Fonction de répartition

31
Elle est notée

NB :

32

Vous aimerez peut-être aussi