Naive Bayes
Classifier
Proposé par : M. Hamda El kabtane Présenter par :
Fatima Ezzahrae Mairik
Fatima Zahra Iqich
Fatima Ezzahra Elaakari
Hanae Achebbak
Fatima Zahra Benlmalik
PLAN
Classificateur
01 Introduction
Le 02 Naïve Bayes
fonctionnement Les types de
03 du classificateur 04 classificateur
Naïve Bayes Naïve Bayes
05 Les Applications 06 Avantages et inconvénient
07 Conclusion
01
Introduction
Quelle est L’importance des
algorithmes de classification ?
02
classificateur Naïve Bayes
Définition
Naive Bayes est une technique de classification statistique basée sur le théorème de
Bayes. Il s'agit de l'un des algorithmes d'apprentissage supervisé les plus simples. Le
classificateur Naive Bayes est un algorithme rapide, précis et fiable. Les
classificateurs Naive Bayes ont une précision et une vitesse élevées sur les grands
ensembles de données.
03
Le fonctionnement du
classificateur Naive Bayes
Théorème de Bayes
Quelle est la probabilité qu’un événement se produise sachant qu’un autre
événement s’est déjà produit ???
P(A∣B)
•P(A∣B) : Probabilité de A sachant que B est vrai.
•P(B∣A): Probabilité de B sachant que A est vrai.
•P(A) : Probabilité a priori de A (avant de prendre en
compte B).
•P(B) : Probabilité a priori de B
Exemple
Fille (A) Garçon (/A) Total
Français(B) 10 7 17
Autre langue 4 9 13
que français(/B)
Total 14 16 30
P(Français | Fille)==
P(A) est la probabilité de prendre au hasard une fille de la
population des élèves de la classe.
On appelle P(A) prior probability
P(A)= =
P(B
Ce qui donne:
P(B |A)=
classificateur Naive Bayes
Naïve Bayes applique le théorème de Bayes à plusieurs variables
X=(x1,x2,…,xn), en supposant que ces variables sont indépendantes
conditionnellement à la classe Y.
P(Y | X1,X2,…,Xn)=
Exemple
petit Non Pas
Type Long sucré Jaune Total
( pas long) sucré jaune
Banane 400 100 350 150 450 50 500
Orange 0 300 150 150 300 0 300
Autre fruit 100 100 150 50 50 150 200
Total 500 500 650 350 800 200 1000
Supposons que quelqu’un nous demande de lui donner le type d’un
fruit qu’il a. Ses caractéristiques sont les suivantes :
• Il est jaune
• Il est long
• Il est sucré
Pour savoir s’il s’agit d’une banane, ou d’une orange ou d’un autre fruit, il
faut calculer ses trois probabilités :
• P(Banane | long, jaune, sucre)
• P(Orange |long, jaune, sucre)
• P(Autre fruit |long, jaune, sucre)
P(banane)=
P(banane | long, jaune, sucre)=
P(long |banane)=
P(jaune |banane)=0.7
P(sucre |banane)=0.9
Donc:
P(banane |long, jaune, sucre)=0.962
Avec même logique on obtient :
P(orange |long, jaune, sucre)=0
P(Autre |long, jaune, sucre)=0.072
On remarque que la
probabilité que notre fruit
soit une banane est
largement plus grande que
celle des autres
04
Les types de classificateur
Naïve Bayes
Naive Bayes
Multinomial
Le classificateur Naive Bayes
Multinomial est souvent utilisé pour la
classification de documents où les
données sont des fréquences de mots.
Ce modèle est bien adapté aux
données discrètes, telles que les
décomptes de mots ou les
événements. Il suppose que les
caractéristiques suivent une
distribution multinomiale, ce qui est
approprié pour les tâches de
classification de texte où les
caractéristiques sont des occurrences
de mots.
Naive Bayes
Gaussien
Le classificateur Naive Bayes
Gaussien est utilisé lorsque les
attributs sont continus et suivent
une distribution normale. Ce type de
classificateur est particulièrement
utile dans des contextes où les
variables continues sont présentes
et peuvent être modélisées par une
distribution gaussienne. L’hypothèse
sous-jacente est que les données de
chaque classe sont distribuées selon
une loi normale (ou gaussienne).
Naive Bayes
Bernoullien
Le classificateur Naive Bayes Bernoullien
est adapté aux variables binaires
(présence ou absence d’une
caractéristique). Ce modèle est
principalement utilisé pour les tâches de
classification de texte où les
caractéristiques sont des indicateurs
binaires (0 ou 1) représentant la présence
ou l’absence d’un mot particulier.
05
Les applications du Naïve Bayes
classifier
Filtrage des Spams:
Dans les services de messagerie
électronique, le filtrage des spams
consiste à différencier les e-mails
indésirables (spams) des messages
légitimes. Le Naïve Bayes analyse les
mots d'un e-mail et estime la
probabilité qu’il appartienne à la
catégorie "spam" ou "non-spam".
Exemple: Gmail, Yahoo…
Analyse de
Sentiments:
L’analyse de sentiments consiste à
identifier l’émotion exprimée dans un
texte, qu’elle soit positive, négative ou
neutre. Le Naïve Bayes utilise des
mots-clés comme "excellent" ou
"horrible" pour déterminer à quelle
catégorie appartient un texte.
Exemple: Amazon, Twitter…
Systèmes de Recommandation:
Les systèmes de recommandation,
comme ceux de Netflix ou Spotify,
utilisent le Naïve Bayes pour
suggérer des contenus adaptés aux
préférences des utilisateurs. En
analysant l’historique des choix, le
modèle estime la probabilité qu’un
utilisateur apprécie un contenu
spécifique.
Détection de Fraudes:
La détection de fraudes repose sur
l’analyse de transactions inhabituelles. Le
Naïve Bayes examine des caractéristiques
comme le montant, la localisation et la
fréquence des paiements pour calculer la
probabilité qu’une transaction soit
frauduleuse. Par exemple, une carte
utilisée simultanément dans deux pays
différents serait signalée comme suspecte
Prévisions Médicales
et Diagnostiques:
Dans le domaine médical, le Naïve
Bayes aide à prédire les maladies en
analysant des symptômes et des
antécédents médicaux. Par exemple, il
peut estimer la probabilité qu’un
patient souffre de grippe en fonction de
symptômes comme la fièvre et la
fatigue.
06
Avantages et limitations
Avantages de Naïve Bayes :
- Simple et rapide à entraîner.
- Performant pour les grands ensembles de données.
- Bonne efficacité pour les problèmes de classification binaire
ou multiclasse.
- Fonctionne bien avec des données catégoriques.
- Moins sensible au surapprentissage.
Limitations de Naïve Bayes :
- Hypothèse d'indépendance forte souvent
irréaliste.
- Peu performant avec des données corrélées.
- Sensible aux données déséquilibrées.
- Peut donner de mauvaises probabilités en sortie.
- Moins adapté aux données numériques
complexes.
07
Conclusion
Le classificateur Naïve Bayes est un algorithme
puissant et simple basé sur le théorème de Bayes,
largement utilisé en machine learning pour la
classification. Malgré son hypothèse d'indépendance
des variables, il est efficace dans divers domaines tels
que la détection de spam, l'analyse des sentiments et
le diagnostic médical en raison de sa rapidité et de sa
capacité à traiter de grandes quantités de données.
Cependant, ses performances peuvent être limitées
lorsque les données présentent des corrélations
significatives entre les variables.
Merci pour votre
attention