0% ont trouvé ce document utile (0 vote)
377 vues15 pages

Sentiment Emotion Analysis

Transféré par

Kezhan Shi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
377 vues15 pages

Sentiment Emotion Analysis

Transféré par

Kezhan Shi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

SENTIMENTS

AND EMOTIONS
ANALYSIS
PHIMPHRACHANH, RAPSODE, REN, YAN
Contexte: Début de l'Analyse des
Sentiments
L'analyse de sentiment consiste à déterminer et évaluer les émotions ou les opinions exprimées dans un texte. Elle peut être utilisée pour
comprendre si un texte transmet une émotion positive, négative ou neutre, par exemple dans les avis des utilisateurs sur un produit ou
dans les commentaires sur les réseaux sociaux.

L'analyse d'émotions va plus loin en identifiant spécifiquement les émotions telles que la joie, la colère, la tristesse, la peur, etc., dans un
texte donné. Elle vise à détecter les nuances émotionnelles et peut être utilisée pour des applications plus précises, comme l'analyse des
réponses émotionnelles des clients à un produit ou un service.

Web 2.0 Big DATA

Émergence dans les années 90 avec l'expansion Nécessité d'analyser le contenu textuel
d'Internet et des médias sociaux. croissant généré par les utilisateurs.
Chronologie
Années 2010 2023 - Emergence ChatGPT

2006 - Twitter

Techniques basées sur des Deep Learning, Développements


lexiques et modele de réseaux neuronaux et LLM récents et en
machine learning Transformers cours

2017 - Emergence
Transformers
google
Années 2000
2004 - Facebook Années 2020
Techniques basées sur le
lexique puis sur le
dictionnaire et le corpus
L’utilisation d’un lexique général ou fixe peut ne pas saisir les nuances et les subtilités du texte et peut conduire à
des résultats inexacts ou incohérents. Par exemple le mot bonne change de sens selon sa forme grammaticale.
Comme nom, il peut désigner une domestique, tandis que comme adjectif, il signifie "qui est de bonne qualité" ou
"agréable"​.

Inconvenients Avantages
Advantages
Attribution de Valeurs Sentimentales: Inconvenients
Chaque mot positif ou négatif reçoit un score Fonction de normalisation : Une fonction combinatoire de sentiment qui, en
sentimental. se basant sur le sentiment des mots individuels, fournit le sentiment absolu
Evaluation Globale: Utilisation de la somme du message sous forme de valeur normalisée allant de -100 à 100.
ou de la moyenne des scores pour évaluer le Approche basée sur le dictionnaire : Utilisation d'un dictionnaire de mots
sentiment d'une phrase ou d'un document. de base (seed words) avec leurs polarités. Mise à jour par l'ajout de
Gestion de la Négation: Inversion de la synonymes et d'antonymes.
polarité du mot adjacent au négateur. Exemple Approche basée sur le corpus : Inclusion de mots sentimentaux spécifiques à
: "bon" = 100, "pas bon" = -100. un domaine, avec attribution de polarité selon le contexte ou le domaine.
Gestion des Intensificateurs: Identification et L’orientation sémantique (OS) : Mesure de la subjectivité et de l'opinion
classification des intensificateurs en positifs et dans un texte. Elle capture généralement un facteur évaluatif (positif ou
négatifs, ajustement du score sentiment négatif) ainsi que la puissance ou l'intensité du mot.
associé.
Techniques basées sur le
lexique puis sur le
dictionnaire et le corpus
EXEMPLES:
SentiWordNet (Esuli et Sebastiani 2006) et Valence Aware Dictionary and Sentiment Reasoner (VADER)
(Hutto et Gilbert 2014) sont des lexiques populaires en analyse des sentiments.
Jha et al. (2018) ont tenté d'étendre l'application du lexique à plusieurs domaines en créant un dictionnaire de
sentiments appelé Hindi Multi-Domain Sentiment Aware Dictionary (HMDSAD) pour l'analyse des
sentiments au niveau des documents. Ce dictionnaire peut être utilisé pour annoter les avis en positif et
négatif.
Un exemple spécifique de corpus pour l'analyse de sentiment dans le domaine de l'e-commerce est le corpus
des "Amazon Product Review". Ce corpus contient un grand nombre d'avis de produits rédigés par les clients
d'Amazon, offrant ainsi des données riches et spécifiques au domaine.
Techniques basées sur le
Machine Learning
Ces techniques impliquent généralement des approches supervisées où les modèles sont entraînés sur des
ensembles de données annotés. L’analyse des sentiments et des émotions comprennent l'utilisation d'algorithmes
d'apprentissage automatique pour classifier les textes en fonction de leur contenu émotionnel ou sentimental.

Défis
Inconvenients Avantages
Inconvenients
Adaptabilité: Peuvent être adaptés à Compréhension Contextuelle: Excellente
différents types de données et de tâches. capacité à comprendre le contexte et la nuance.
Efficacité sur des données structurées: Performance sur de grandes données: Efficace
Performants sur des données bien pour traiter de grands volumes de données
structurées. textuelles.
Moins de ressources nécessaires: Moins Adaptabilité: Peuvent être ajustés pour des
gourmands en ressources tâches spécifiques via un entraînement
computationnelles que les approches de complémentaire (fine-tuning).
deep learning
Techniques basées sur le
Machine Learning
COMPARAISON:
Approches Basées sur des Règles: Les modèles ML surpassent les approches basées sur des règles en
termes de flexibilité et de capacité à apprendre des caractéristiques complexes.

Deep Learning et Transformers: Les techniques ML traditionnelles sont souvent moins complexes et moins
coûteuses en ressources, mais peuvent être moins performantes sur des tâches complexes ou des données
non structurées.

EXEMPLES:
Support Vector Machines (SVM) : Utilisé pour classer les textes en sentiments positifs ou négatifs.

Arbres de décision : Employés pour segmenter un ensemble de données en sous-ensembles basés sur des
caractéristiques spécifiques, utiles pour l'analyse de sentiments.

Réseaux Bayésiens : Utilisés pour prédire la probabilité de certaines émotions ou sentiments basés sur des
caractéristiques textuelles.
Techniques basées sur le
Techniques basées sur le
Deep Learning
Deep Learning

Le Deep Learning utilise des réseaux de neurones profonds pour apprendre des représentations de données
à partir de grandes quantités de données non structurées. Dans l'analyse des sentiments et des émotions,
ces techniques permettent une compréhension approfondie et nuancée des textes en saisissant des
caractéristiques complexes comme l'ironie ou le sarcasme.

Défis Avantages
Advantages Inconvenients
Capacité à traiter des données
Besoin de grandes quantités de
complexes: Excellente pour analyser
données: Nécessite d'importantes
des nuances dans le langage.
quantités de données pour un
Apprentissage de caractéristiques de
entraînement efficace.
haut niveau: Peut apprendre
Coûteux en ressources: Nécessite des
automatiquement des caractéristiques
ressources computationnelles
importantes à partir de données
significatives.
brutes.
Complexité de mise en œuvre: Plus
Adaptabilité: Peut être adapté pour de
complexes à configurer et à entraîner
que les modèles ML traditionnels. nombreuses tâches différentes en NLP
Techniques basées sur le
Deep Learning

COMPARAISON:
Machine Learning Traditionnel : Les techniques de deep learning surpassent les méthodes traditionnelles
dans la gestion des données textuelles complexes et non structurées.
Approches Basées sur des Règles : Elles offrent une flexibilité et une adaptation aux nouvelles données
supérieures.

EXEMPLES:
Réseaux de Neurones Convolutionnels (CNN) : Bien que principalement utilisés en traitement d'images,
ils sont également efficaces pour l'analyse de textes.
Réseaux de Neurones Récurrents (RNN) et LSTM (Long Short-Term Memory) : Excellents pour traiter
des séquences de données, comme des phrases ou des paragraphes.
Techniques basées sur les
Transformers

Les Transformers sont une architecture de modèle de traitement du langage naturel (NLP). Ils se distinguent
par leur mécanisme d'attention, permettant au modèle de se concentrer sur différentes parties d'une phrase
pour mieux comprendre le contexte.

Défis Avantages
Advantages Inconvenients
Compréhension Contextuelle:
Ressources Requises: Nécessitent
Excellente capacité à comprendre le
beaucoup de ressources
contexte et la nuance.
computationnelles pour l'entraînement.
Performance sur de grandes
Complexité de mise en œuvre: Plus
données: Efficace pour traiter de
complexes à configurer et à entraîner
grands volumes de données textuelles.
que des modèles plus simples.
Adaptabilité: Peuvent être ajustés
pour des tâches spécifiques via un
entraînement complémentaire (fine-
tuning).
Techniques basées sur les
Transformers

COMPARAISON:
Réseaux de Neurones Traditionnels : Les Transformers surpassent les RNN en gérant les dépendances à
longue distance dans le texte.
Approches basées sur des Règles : Ils sont plus flexibles et puissants, capables de comprendre des
nuances et des contextes complexes.
Machine Learning Traditionnel: Ils offrent une compréhension plus profonde et contextuelle du langage,
une flexibilité accrue dans le traitement des tâches, et une meilleure performance avec de grandes
quantités de données, surpassant ainsi de nombreuses méthodes traditionnelles de machine learning en
NLP.

EXEMPLE:
Techniques basées sur les
LLM
L'analyse des sentiments en NLP utilisant des modèles de langage de grande taille (LLM) est une approche avancée
pour comprendre les opinions, les sentiments et les émotions exprimés dans le texte. C’est un type avancé de
modèle d'intelligence artificielle spécifiquement conçu pour comprendre, générer et interagir avec le langage
humain.

Défis Avantages
Biais Potentiels : Les LLM peuvent refléter des biais
présents dans leurs données d'entraînement. Compréhension Profonde du Langage :
Limitations dans des Cas Spécifiques : Moins efficaces Aptitude à détecter des nuances subtiles et à
pour des tâches extrêmement spécialisées ou pour des comprendre des contextes complexes.
langues peu représentées dans les données Polyvalence : Capacité à s'adapter à différents
d'entraînement. domaines et styles de texte sans entraînement
Complexité et Coûts : Les LLM sont complexes et spécifique.
peuvent nécessiter des ressources computationnelles Rapidité et Efficacité : Analyse rapide de grands
importantes. volumes de texte.
Techniques basées sur les
LLM

COMPARAISON:
Machine Learning Traditionnelle : L'analyse des sentiments via les LLM, tels que GPT et BERT, représente
une avancée significative par rapport aux méthodes traditionnelles de ML, en en termes de
contextualisation et de traitement des subtilités. Les LLM s'adaptent facilement à divers types de textes et
peuvent effectuer des analyses sans entraînement spécifique, mais requièrent d'importantes ressources
computationnelles. En comparaison, le ML, bien que moins exigeantes en ressources et plus simples à
implémenter, se concentrent sur des tâches plus structurées et nécessitent une préparation méticuleuse
des données.

EXEMPLE:
Comparaison d’analyse de
sentiments et d’émotions

COMPARAISON:

polarity dataset v2.0 : 1000 positives and 1000 negatives movies reviews.

Technique Méthode utilisée Accuracy

Approche basée sur le lexique Lexique SentiWordNet 0.62

Machine Learning SVM 0.86

Deep Learning CNN 0.75

LLM/Transformers BERT Base Uncased 0.91


References

Techniques basées sur le lexique Techniques basées sur le Machine


Learning
A review on sentiment analysis and emotion detection from
Thumbs Up or Thumbs Down? Semantic Orientation Applied to
text Pansy Nandwani, Rupali Verma, 2021
Unsupervised Classification of Reviews Peter D. Turney

Emotion Analysis Techniques basées sur le Deep Learning


Predicting Stock Market Indicators Through Twitter “I hope it is not as bad as I
fear” Xue Zhang1,2*, Hauke Fuehres2 , Peter A. Gloor2
Deep Learning and Sentiment Analysis-Based Cryptocurrency
Survey on sentiment analysis: evolution of research methods and topics Price Prediction
Sentiment Analysis in the Era of Large Language Models: A Reality Check

Techniques basées sur les Transformers Techniques basées sur les LLM
Transformers: State-of-the-Art Natural Language Processing, BERT: Pre-training of Deep Bidirectional Transformers for
Hugging Face Language Understanding Jacob Devlin, Ming-Wei Chang,
Attention Is All You Need, Vaswani et al. en 2017 Kenton Lee, Kristina Toutanova

Vous aimerez peut-être aussi