INSTITUT DE FORMATION ET DE RECHERCHE EN INFORMATIQUE
Licence 2
Probabilité
Dr. Ariane HOUETOHOSSOU & Dr. Souand TAHI
IA and Machine learning | Biostatistic | Statistic and Probability
souandtahi@[Link]/ harianecalmet@[Link]
PLAN
q Introduction
• Définition de la probabilité
• Principes fondamentaux de dénombrement
q Variables aléatoires
• Variables aléatoires discrètes
• Variables aléatoires continues
q Variables aléatoires multivariées
• Vecteurs aléatoires
• Fonctions de masse et de densité conjointes
• Covariance et corrélation
q Lois et modèles de probabilité
• Loi binomiale
• Loi normale (ou Gaussienne)
• Loi de Poisson
Objectifs
Objectif général
Résoudre des problèmes statistiques en appliquant les lois de probabilité et les techniques d'analyse
appropriées.
Objectifs spécifiques
ü Rappeler les concepts fondamentaux des probabilités
ü Utiliser les variables aléatoires discrètes et continues dans des contextes divers
ü Expliquer les variables aléatoires multivariées et leurs relations à travers la covariance et la
corrélation
ü Appliquer les principales lois de probabilité pour modéliser des phénomènes aléatoires et
résoudre des problèmes pratiques
Introduction
Définition
● Science qui fournit des modèles mathématiques permettant l’étude d'expériences dont le résultat
ne peut être prévu avec une totale certitude (Charles SUQUET, 2003).
● Mesure mathématique qui quantifie l'incertitude ou le degré de certitude associé à un événement
ou à un résultat particulier.
● La probabilité mesure la chance ou la vraisemblance qu'un événement particulier se produise
dans un ensemble d'événements possibles.
● Probabilité d’un événement A est noté P(A) comprise entre comprise entre 0 et 1.
Introduction
Définition
Introduction
Définition
● Bien que le résultat précis de chacune de ces expériences soit imprévisible, l’observation et
l’intuition nous amènent à penser que ces phénomènes obéissent à certaines lois.
● Si on jette 6000 fois le dé, on s'attend à ce que le nombre d’apparitions de la face « 3 » soit voisin
de 1000.
● La théorie des probabilités permet de donner un sens précis à ces considérations un peu vagues.
Introduction aux probabilités
Événement : élémentaire, certain, impossible
Ω, ensemble dont les éléments représentent tous les résultats possibles ou évènements élémentaires
d’une expérience aléatoire donnée.
Les évènements (ou évènements composés) seront représentés par des parties (sous-ensembles) de Ω.
Ces évènements élémentaires contiennent l’information maximale qu’il est possible d’obtenir de
l'expérience.
Exemple 1: On jette un dé, l’événement A : obtention d’un chiffre pair n'est pas élémentaire.
Il est composé des trois événements élémentaires 2, 4, 6 : A = {2, 4, 6}.
Ici Ω = {1, 2, 3, 4, 5, 6}.
Exemple 2: On lance trois fois une pièce de monnaie, les événements élémentaires sont des triplets
comme (p,f,p) indiquant le résultat précis de chacun des trois lancers. Ici Ω = {f, p}^3. L'événement B
« obtention de pile au deuxième des trois lancers » est composé : B = {(f, p, f); (f, p, p); (p, p, f); (p, p,
p)}.
Introduction
Probabilité : définition axiomatique et propriétés fondamentales
Axiome de Kolmogorov:
1. Pour tout événement A, 0≤P(A)≤1.
2. P(Ω)=1 (La probabilité de l'univers ou de l'événement certain est 1).
3. Si A1, A2, A3, … sont des événements mutuellement exclusifs (c’est-à-dire qu’ils ne peuvent
pas se produire en même temps), alors P(A1 ∪ A2 ∪ A3 ∪…)= P(A1)+P(A2)+P(A3)....
Propriétés fondamentales :
1. P(Ac)=1-P(A) où Ac est le complémentaire de A
2. Pour deux événements quelconques A et B, P(A∪B)=P(A)+P(B)-P(A∩B)
Introduction
Principes fondamentaux de dénombrement
Théorème : Principe additif
Soient � et � deux événements incompatibles. S’il y a � différentes issues de l’événement � et �
issues de l’évènement � , alors il y a � +� différentes issues de soit � ou � . Dans de nombreux
problèmes de dénombrement, on peut utiliser le principe additif avec d’autres principes de
dénombrement.
Définition : Combinaisons et arrangements
Arrangements : Nombre de façons d'organiser p éléments parmi n sans répétition.
� �!
�� =
�−� !
Combinaisons : Nombre de façons de choisir p éléments parmi n sans se soucier de l’ordre.
� �!
�� =
�! � − � !
Variables aléatoires
Variable aléatoire: fonction associée au résultat d'une expérience aléatoire à un nombre réel. Peut
prendre plusieurs valeurs, chacune associée à une probabilité.
Définition et exemples
Variable aléatoire X est dite discrète si elle ne peut prendre qu'un nombre fini ou dénombrable de
valeurs.
Exemple1: Lancer d'un dé : Si X représente le chiffre obtenu après avoir lancé un dé équilibré, alors
X est une variable aléatoire discrète qui peut prendre les valeurs {1,2,3,4,5,6}, chacune avec une
probabilité de 1/6.
Exemple 2: Nombre de fois qu'une pièce est lancée avant d'obtenir pile : Si nous lançons une pièce
de monnaie jusqu'à ce que la face pile apparaisse et si Y est le nombre de lancers nécessaires, alors Y
est une variable aléatoire discrète.
Variables aléatoires
Variable aléatoire discrète
La fonction de répartition d'une variable aléatoire discrète X est une fonction qui attribue à chaque
valeur réelle x une probabilité cumulative correspondante.
Elle permet de décrire la probabilité que la variable aléatoire X prenne une valeur inférieure ou égale à
x.
Formellement, la fonction de répartition de X, notée F(x), est définie comme suit : F(x) = P(X ≤ x)
Cela signifie que F(x) donne la probabilité que la variable aléatoire X soit inférieure ou égale à la
valeur x.
En d'autres termes, F(x) vous donne la probabilité que X prenne une valeur dans l'intervalle (-∞, x].
Variables aléatoires
Variable aléatoire discrète
Soit X une v.a. discrète de support R_X = {x1, x2, x3, . . .}. La fonction de masse ou de probabilité de
X est la fonction pX définie par pX(x) = P(X = x) pour tout x ∈ R_X
La fonction de masse satisfait aux conditions
0 ≤ �� � ≤ 1 ���� ���� � ∈ ��
�� �� = 1
�� ∈��
� �∈� = � �� ���� � ⊆ ��
�� ∈�
Exercice: Une boîte contient 5 DVDs parmi lesquels 2 sont défectueux. Un ́échantillon de 2 disques
est prélevé (sans remise) de la boîte. Soit X : le nombre de DVDs défectueux dans l'échantillon.
1. Déterminer la fonction de masse de la v.a. X.
2. Évaluer les probabilités P(X > 1), P(X ≥ 1), P(X < 2).
Variables aléatoires
Espérance, variance et écart type
Soit une variable aléatoire discrète X définie sur un univers Ω et prenant les valeurs x1, x2, ..., xn.
L'espérance (ou valeur attendue) de X est la moyenne pondérée des valeurs possibles que cette
variable peut prendre. Pour une variable aléatoire discrète X avec fonction de masse de probabilité f:
�
� � = �. � � = �
�
� � = �1 ∗ 1 + �2 ∗ 2 + �3 ∗ 3 + . . . + �� ∗ �
Variance et Écart Type
La variance mesure la dispersion des valeurs de la variable aléatoire autour de son espérance. L'écart
type est la racine carrée de la variance.
� � =� �−� � 2
� � = � �2 − � � 2
Variables aléatoires
Variables aléatoires continues
Définition et exemples
Une variable aléatoire est dite continue si elle peut prendre toute valeur dans un intervalle donné de
nombres réels.
Sa fonction de répartition F(x) est définie comme suit :F(x) = P(X ≤ x) Où :
F(x) est la fonction de répartition de X.
x est la valeur à laquelle nous voulons évaluer la probabilité.
P(X ≤ x) est la probabilité que la variable aléatoire X prenne une valeur inférieure ou égale à x.
Variables aléatoires
Variables aléatoires continues
La fonction de densité de probabilité (FDP) d'une variable aléatoire continue décrit la répartition
des probabilités de cette variable sur un ensemble continu de valeurs.
La fonction de densité permet de calculer la probabilité qu'une variable aléatoire continue � prenne
des valeurs dans un intervalle donné (� ≤� ≤� )
La probabilité est donnée par l'intégrale de la fonction de densité sur cet intervalle
�
� �≤�≤� = �� � ��
�
∀� ∈ ℝ, � � ≥ 0
+∞
� � �� = 1
−∞
Variables aléatoires
Variable continue
Propriété intéressante
Propriété 1: �� � ��� ����������
Propriété 2: lim �� � = 1
�→+∞
Propriété 3: lim �� � = 0
�→−∞
�
∀� ∈ ℝ, � � ≤ � = �� � = � � ��
−∞
Variables aléatoires
Fonction de densité
∀� ∈ ℝ, � � ≥ 0
+∞
� � �� = 1
−∞
Espérance
L'espérance (ou valeur attendue) d'une variable aléatoire continue est analogue à celle d'une
variable aléatoire discrète, mais au lieu de sommer sur un ensemble de valeurs discrètes, on intègre
sur l'ensemble des valeurs possibles que la variable peut prendre.
Variance
La variance représente l'intégrale du carré de l'écart à la moyenne pondéré par la probabilité de
chaque valeur, sur toutes les valeurs possibles de X.
+∞ +∞
� � = �� � �� � �2 = �2 � � ��
−∞
−∞
Variables aléatoires
Variables aléatoires
Exemple1: Temps d'attente : Supposons que X représente le temps d'attente (en heures) à un arrêt
de bus. Comme le temps d'attente peut être n'importe quel nombre non négatif (0, 0.5, 0.001, 2.678,
etc.), X est une variable aléatoire continue.
Variables aléatoires multivariées
A. Vecteurs aléatoires
Un vecteur aléatoire est un ensemble de deux ou plusieurs variables aléatoires.
Si nous considérons deux variables aléatoires (X,Y) représente leurs valeurs combinées.
Exemple : Considérez une expérience où nous mesurons à la fois la taille et le poids d'un individu. X
pourrait représenter la taille et Y le poids. Le couple (X,Y) est un exemple de vecteur aléatoire.
Variables aléatoires multivariées
B. Fonctions de masse et de densité conjointes
Pour des variables aléatoires discrètes, la fonction de masse de probabilité conjointe � �, � donne la
probabilité que � = � et � = � simultanément.
� �, � = � � = �, � = �
Fonction de Densité de Probabilité Conjointe : Pour des variables aléatoires continues, la
fonction de densité de probabilité conjointe f �, � est utilisée. La probabilité que �, �
appartienne à un ensemble A est donnée par :
� �, � ∈ � = �� �, � ����
Variables aléatoires multivariées
C. Covariance et corrélation
Covariance : La covariance mesure le degré de variation conjointe de deux variables aléatoires. Elle
est définie par :
��� �, � = � � − � � � − � �
Si la covariance est positive, cela signifie que lorsque X augmente, Y a tendance à augmenter
également, et vice versa. Si elle est négative, cela signifie que lorsque X augmente, Y a tendance à
diminuer.
Corrélation : La corrélation est une mesure normalisée de la relation linéaire entre deux variables
aléatoires. Elle est définie comme : ρ �, � = � � � � ��� �, � .
ρ �, � varie entre -1 et 1.
Une valeur de 1 indique une corrélation positive parfaite, -1 une corrélation négative parfaite, et 0
indique l'absence de corrélation.
� � et � � les écarts types des variables X et Y respectivement.
Lois et Modèles de Probabilité
Loi Binomiale
La loi binomiale est une distribution de probabilité discrète qui décrit le nombre de succès dans une
séquence de n essais indépendants de Bernoulli (c'est-à-dire des essais avec deux issues possibles) avec
une probabilité constante p de succès.
Modélisation d'Expériences Répétitives (Bernoulli):Une expérience de Bernoulli est une expérience
aléatoire avec exactement deux issues possibles, couramment appelées "succès" (avec probabilité p) et
"échec" (avec probabilité 1−p).
Lorsque nous répétons une expérience de Bernoulli n fois, la distribution des succès suit une loi
binomiale.
Les paramètres de la loi binomiale sont n (le nombre d'essais) et p (la probabilité de succès pour un
essai individuel).
Espérance : E � = ��
Variance : ��� � = �� 1 − �
Lois et Modèles de Probabilité
La loi binomiale trouve son application dans divers domaines:Tests de Qualité, Sondages, Scénarios
Médicaux etc.
Exemple de Tests de Qualité: Supposons qu'une entreprise fabrique des ampoules, et qu'elle sait que
5% d'entre elles sont défectueuses. Si elle prélève un échantillon de 100 ampoules, la distribution du
nombre d'ampoules défectueuses dans cet échantillon suit une loi binomiale avec n=100 et p=0,05.
Exemple de Sondages: Lors de la réalisation d'un sondage sur, par exemple, l'intention de vote, si 60%
des personnes interrogées indiquent qu'elles voteront pour un candidat particulier, alors le nombre de
personnes sur un échantillon de 1000 qui voteront pour ce candidat suit une loi binomiale avec n=1000
et p=0,6.
Exemple de Scénarios Médicaux: Si un traitement a une probabilité de 70% de succès, et si 50
patients sont traités, le nombre de patients pour lesquels le traitement sera couronné de succès suit une
loi binomiale avec n=50 et p=0,7.
Lois et Modèles de Probabilité
Loi normale (ou Gaussienne)
Introduction et Importance dans la Théorie des Probabilités
La loi normale, souvent appelée distribution Gaussienne, est l'une des distributions les plus importantes
en théorie des probabilités et en statistiques.
Elle est définie par sa moyenne μ et sa variance �2 . Sa densité de probabilité est donnée par : f(x) = (1 /
(σ * √(2π))) * exp[-(x - μ)² / (2σ²)]
Elle est symétrique autour de sa moyenne μ.
L'importance de la loi normale provient de sa capacité à modéliser une variété de phénomènes naturels
et sociaux.
Elle est aussi au cœur de nombreux tests statistiques et méthodes d'estimation.
Lois et Modèles de Probabilité
Propriétés et Table de la Loi Normale
Propriétés Principales :
Elle est définie sur tout l'ensemble des réels.
La courbe de la loi normale est en forme de cloche.
Environ 68% des observations d'une distribution normale se situent à une distance d'un écart-type de la
moyenne, 95% à deux écarts-types et 99.7% à trois écarts-types.
Table de la Loi Normale (ou Table Z) :
La table Z donne la probabilité que la variable aléatoire Z, suivant une loi normale standard (moyenne
0 et variance 1), soit inférieure à une certaine valeur.
Elle est souvent utilisée pour trouver des probabilités et des percentiles pour une distribution normale.
Lois et Modèles de Probabilité
Théorème Central Limite
Le Théorème Central Limite (TCL) est l'une des théories fondamentales de la statistique et des
probabilités. Il stipule que, sous certaines conditions, la somme de variables aléatoires indépendantes et
identiquement distribuées (i.i.d) tend vers une distribution normale, quelle que soit la forme de la
distribution originale, à condition que cette distribution ait une moyenne et une variance finies.
Plus formellement, si X1 ,X2,... Xn sont des variables i.i.d avec moyenne
μ et variance σ2, alors, pour un n suffisamment grand :
�
�
�=1 �
− ��
� �
tend vers une distribution normale standard.
Lois et Modèles de Probabilité
Implications :
Le TCL justifie l'utilisation de la loi normale pour approximer la distribution d'autres statistiques,
comme la moyenne d'un échantillon.
Il fournit également une base solide pour l'inférence statistique, permettant l'utilisation de techniques
basées sur la distribution normale même lorsque la distribution sous-jacente n'est pas normale, à
condition que la taille de l'échantillon soit suffisamment grande.
Lois et Modèles de Probabilité
Loi de Poisson
La loi de Poisson ou modèle de Poisson permet la modélisation de l’observation d’un phénomène qui
produit des événements à un rythme connu.
soit X la v.a. qui donne le nombre d’événements observés dans une unité de temps. On a alors un
phénomène de Poisson et la variable aléatoire qui donne le nombre d’événements par unité de temps
suit une loi de Poisson, notée �~� � , où λ est le nombre moyen d’événements par unité de temps.
Modélisation d'événements rares
Soit S = {0, 1, 2, . . .}, les valeurs possibles de la variable aléatoire.
�−� ��
La loi de probabilité est donnée par: �� � = pour x=0,1,2,...
�!
e est la fonction exponentielle au point 1 : e ≃ 2,71828.
Lois et Modèles de Probabilité
Les principales caractéristiques numériques sont :
Moyenne : � � = λ,
Variance : ��� � = λ,
Ecart type: ����� ���� � = �
Remarque: La loi de Poisson permet de modéliser des phénomènes rares lorsqu'on peut connaître la
moyenne pour un laps de temps relativement grand. Elle peut ainsi servir à modéliser le nombre de cas
d'une maladie rare dans une grande population, le nombre d'homicides par année dans une ville de
grandeur moyenne, le nombre de personnes ayant un certain profil génétique dans une population, etc.
Lois et Modèles de Probabilité
Ecercice1:
Une ville a deux hôpitaux. Dans le plus grand des deux, 45 bébés naissent tous les jours,
comparativement à 15 dans l’autre.
Même si la proportion des naissances est la même pour les deux sexes, la proportion de garçons (filles)
variera d’une journée à l’autre, étant tantôt plus grande que 50 %, tantôt plus petite.
A la fin de l’année, quel hôpital aura enregistré le plus grand nombre de journées avec 60 % ou
plus de naissances de garçons.
Exercice2:
Dans le ciel au mois d'août il y a en moyenne 1000 étoiles filantes dans l'espace d'une heure.
Quelle est la probabilité d'en voir plus de 10 en 1 minute ?
Lois et Modèles de Probabilité
Ecercice3
Une machine déréglée produit 1/3 de pièces défectueuses. Dans un lot de 9 pièces fabriquées par cette
machine, calculer
a) Le nombre moyen de pièces défectueuses ;
b) La probabilité associée à ce nombre moyen.
Ecercice4
La probabilité pour qu’une ampoule électrique ait une durée de vie supérieure à 2 ans est égale à 0.2.
Sachant qu’un lustre possède 5 ampoules, calculer la probabilité
a) De ne pas changer d’ampoule en 2 ans ;
b) De changer deux ampoules en 2 ans ;
De changer toutes les ampoules en 2 ans.