0% ont trouvé ce document utile (0 vote)
113 vues30 pages

Naive Bayes

Le classificateur Naïve Bayes est une technique de classification statistique basée sur le théorème de Bayes, connue pour sa rapidité et sa précision, surtout sur de grands ensembles de données. Il existe plusieurs types de classificateurs Naïve Bayes, adaptés à différents types de données, et il est utilisé dans des applications variées telles que le filtrage de spam et l'analyse de sentiments. Malgré ses avantages, il présente des limitations, notamment l'hypothèse d'indépendance des variables, qui peut affecter ses performances dans certains contextes.

Transféré par

f.mairik1801
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
113 vues30 pages

Naive Bayes

Le classificateur Naïve Bayes est une technique de classification statistique basée sur le théorème de Bayes, connue pour sa rapidité et sa précision, surtout sur de grands ensembles de données. Il existe plusieurs types de classificateurs Naïve Bayes, adaptés à différents types de données, et il est utilisé dans des applications variées telles que le filtrage de spam et l'analyse de sentiments. Malgré ses avantages, il présente des limitations, notamment l'hypothèse d'indépendance des variables, qui peut affecter ses performances dans certains contextes.

Transféré par

f.mairik1801
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

Naive Bayes

Classifier
Proposé par : M. Hamda El kabtane Présenter par :
Fatima Ezzahrae Mairik
Fatima Zahra Iqich
Fatima Ezzahra Elaakari
Hanae Achebbak
Fatima Zahra Benlmalik
PLAN
Classificateur
01 Introduction
Le 02 Naïve Bayes

fonctionnement Les types de


03 du classificateur 04 classificateur
Naïve Bayes Naïve Bayes

05 Les Applications 06 Avantages et inconvénient


07 Conclusion
01
Introduction
Quelle est L’importance des
algorithmes de classification ?
02
classificateur Naïve Bayes
Définition
Naive Bayes est une technique de classification statistique basée sur le théorème de
Bayes. Il s'agit de l'un des algorithmes d'apprentissage supervisé les plus simples. Le
classificateur Naive Bayes est un algorithme rapide, précis et fiable. Les
classificateurs Naive Bayes ont une précision et une vitesse élevées sur les grands
ensembles de données.
03
Le fonctionnement du
classificateur Naive Bayes
Théorème de Bayes
Quelle est la probabilité qu’un événement se produise sachant qu’un autre
événement s’est déjà produit ???

P(A∣B)

•P(A∣B) : Probabilité de A sachant que B est vrai.


•P(B∣A): Probabilité de B sachant que A est vrai.
•P(A) : Probabilité a priori de A (avant de prendre en
compte B).
•P(B) : Probabilité a priori de B
Exemple
Fille (A) Garçon (/A) Total

Français(B) 10 7 17

Autre langue 4 9 13
que français(/B)
Total 14 16 30

P(Français | Fille)=​=

P(A) est la probabilité de prendre au hasard une fille de la


population des élèves de la classe.
On appelle P(A) prior probability
P(A)= =

P(B

Ce qui donne:

P(B |A)=
classificateur Naive Bayes

Naïve Bayes applique le théorème de Bayes à plusieurs variables


X=(x1,x2,…,xn), en supposant que ces variables sont indépendantes
conditionnellement à la classe Y.

P(Y | X1​,X2​,…,Xn​)=
Exemple

petit Non Pas


Type Long sucré Jaune Total
( pas long) sucré jaune

Banane 400 100 350 150 450 50 500

Orange 0 300 150 150 300 0 300

Autre fruit 100 100 150 50 50 150 200

Total 500 500 650 350 800 200 1000


Supposons que quelqu’un nous demande de lui donner le type d’un
fruit qu’il a. Ses caractéristiques sont les suivantes :
• Il est jaune
• Il est long
• Il est sucré

Pour savoir s’il s’agit d’une banane, ou d’une orange ou d’un autre fruit, il
faut calculer ses trois probabilités :
• P(Banane | long, jaune, sucre)
• P(Orange |long, jaune, sucre)
• P(Autre fruit |long, jaune, sucre)
P(banane)=

P(banane | long, jaune, sucre)=

P(long |banane)=

P(jaune |banane)=0.7
P(sucre |banane)=0.9
Donc:

P(banane |long, jaune, sucre)=0.962

Avec même logique on obtient :


P(orange |long, jaune, sucre)=0
P(Autre |long, jaune, sucre)=0.072
On remarque que la
probabilité que notre fruit
soit une banane est
largement plus grande que
celle des autres
04
Les types de classificateur
Naïve Bayes
Naive Bayes
Multinomial
Le classificateur Naive Bayes
Multinomial est souvent utilisé pour la
classification de documents où les
données sont des fréquences de mots.
Ce modèle est bien adapté aux
données discrètes, telles que les
décomptes de mots ou les
événements. Il suppose que les
caractéristiques suivent une
distribution multinomiale, ce qui est
approprié pour les tâches de
classification de texte où les
caractéristiques sont des occurrences
de mots.
Naive Bayes
Gaussien
Le classificateur Naive Bayes
Gaussien est utilisé lorsque les
attributs sont continus et suivent
une distribution normale. Ce type de
classificateur est particulièrement
utile dans des contextes où les
variables continues sont présentes
et peuvent être modélisées par une
distribution gaussienne. L’hypothèse
sous-jacente est que les données de
chaque classe sont distribuées selon
une loi normale (ou gaussienne).
Naive Bayes
Bernoullien
Le classificateur Naive Bayes Bernoullien
est adapté aux variables binaires
(présence ou absence d’une
caractéristique). Ce modèle est
principalement utilisé pour les tâches de
classification de texte où les
caractéristiques sont des indicateurs
binaires (0 ou 1) représentant la présence
ou l’absence d’un mot particulier.
05
Les applications du Naïve Bayes
classifier
Filtrage des Spams:

Dans les services de messagerie


électronique, le filtrage des spams
consiste à différencier les e-mails
indésirables (spams) des messages
légitimes. Le Naïve Bayes analyse les
mots d'un e-mail et estime la
probabilité qu’il appartienne à la
catégorie "spam" ou "non-spam".
Exemple: Gmail, Yahoo…
Analyse de
Sentiments:
L’analyse de sentiments consiste à
identifier l’émotion exprimée dans un
texte, qu’elle soit positive, négative ou
neutre. Le Naïve Bayes utilise des
mots-clés comme "excellent" ou
"horrible" pour déterminer à quelle
catégorie appartient un texte.
Exemple: Amazon, Twitter…
Systèmes de Recommandation:

Les systèmes de recommandation,


comme ceux de Netflix ou Spotify,
utilisent le Naïve Bayes pour
suggérer des contenus adaptés aux
préférences des utilisateurs. En
analysant l’historique des choix, le
modèle estime la probabilité qu’un
utilisateur apprécie un contenu
spécifique.
Détection de Fraudes:

La détection de fraudes repose sur


l’analyse de transactions inhabituelles. Le
Naïve Bayes examine des caractéristiques
comme le montant, la localisation et la
fréquence des paiements pour calculer la
probabilité qu’une transaction soit
frauduleuse. Par exemple, une carte
utilisée simultanément dans deux pays
différents serait signalée comme suspecte
Prévisions Médicales
et Diagnostiques:

Dans le domaine médical, le Naïve


Bayes aide à prédire les maladies en
analysant des symptômes et des
antécédents médicaux. Par exemple, il
peut estimer la probabilité qu’un
patient souffre de grippe en fonction de
symptômes comme la fièvre et la
fatigue.
06
Avantages et limitations
Avantages de Naïve Bayes :

- Simple et rapide à entraîner.


- Performant pour les grands ensembles de données.
- Bonne efficacité pour les problèmes de classification binaire
ou multiclasse.
- Fonctionne bien avec des données catégoriques.
- Moins sensible au surapprentissage.
Limitations de Naïve Bayes :
- Hypothèse d'indépendance forte souvent
irréaliste.
- Peu performant avec des données corrélées.
- Sensible aux données déséquilibrées.
- Peut donner de mauvaises probabilités en sortie.
- Moins adapté aux données numériques
complexes.
07
Conclusion
Le classificateur Naïve Bayes est un algorithme
puissant et simple basé sur le théorème de Bayes,
largement utilisé en machine learning pour la
classification. Malgré son hypothèse d'indépendance
des variables, il est efficace dans divers domaines tels
que la détection de spam, l'analyse des sentiments et
le diagnostic médical en raison de sa rapidité et de sa
capacité à traiter de grandes quantités de données.
Cependant, ses performances peuvent être limitées
lorsque les données présentent des corrélations
significatives entre les variables.
Merci pour votre
attention

Vous aimerez peut-être aussi