0% ont trouvé ce document utile (0 vote)

53 vues4 pages

Résumé NLP

Le traitement automatique du langage naturel (NLP) permet aux ordinateurs de comprendre le langage humain, avec des objectifs tels que l'extraction de la sémantique et l'amélioration de l'interaction homme-machine. Les défis incluent les variations linguistiques et l'ambiguïté sémantique, tandis que les applications vont de la traduction automatique aux chatbots. Des techniques comme le prétraitement des données, la normalisation et les modèles de représentation des mots comme Word2Vec sont essentielles pour le NLP.

Transféré par

ayoubtaoussi2022

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

53 vues4 pages

Résumé NLP

Transféré par

ayoubtaoussi2022

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Résumé : Traitement Automatique du

Langage Naturel (NLP)

Introduction
Le traitement automatique du langage naturel (NLP) permet aux ordina-
teurs de comprendre et traiter le langage humain.
Objectifs :

• Extraire la sémantique des textes.

• Enrichir les textes avec des bases de connaissances.

• Améliorer l’interaction homme-machine.

Défis :

• Variations syntaxiques et linguistiques.

• Ambiguı̈té sémantique.

• Multilinguisme.

Domaines d’application
Le NLP est utilisé pour :

• Traduction automatique (ex. : Google Translate).

• Analyse de sentiments : ”Ce produit est excellent.” → Sentiment :

positif.

• Chatbots : Réponses automatiques aux utilisateurs.

• Correction orthographique (ex. : Grammarly).

1
Pré-traitement des données
1. Nettoyage des données
• Suppression des éléments inutiles (URL, émojis, stopwords).

• Exemple : Texte brut : ”Bonjour ! Je vais sur [Link]

Nettoyé : ”Bonjour !”

Code :
1 from nltk . corpus import stopwords
2 from nltk . tokenize import word_tokenize
3

4 texte = " Le traitement du langage naturel est important

pour l ’ IA . "
5 stop_words = set ( stopwords . words ( ’ french ’) )
6 tokens = word_tokenize ( texte )
7 tok e n s _ s a n s _ s t o p w o r d s = [ mot for mot in tokens if mot .
lower () not in stop_words ]
8 print ( t o k e n s _ s a n s _ s t o p w o r d s )

Résultat : [’traitement’, ’langage’, ’naturel’, ’important’, ’IA’,

’.’]

2. Représentation des données

Exemple de bi-grammes : ”Bonjour, comment ça va ?” → [(’Bonjour’,
’,’), (’,’, ’comment’), (’comment’, ’ça’), (’ça’, ’va’)]
Code :
1 from nltk import ngrams
2 tokens = [ ’ Bonjour ’ , ’ , ’ , ’ comment ’ , ’ a ’ , ’ va ’]
3 bigrams = list ( ngrams ( tokens , 2) )
4 print ( bigrams )

3. Normalisation
• Tokenisation : Diviser en mots ou phrases.

• Stemming : Réduction à la racine (”courir”, ”couru” → ”cour”).

• Lemmatisation : Forme canonique (”courir”, ”couru” → ”courir”).

2
Code :
1 import spacy
2 nlp = spacy . load ( " fr_core_news_sm " )
3 texte = " Les chats mangent et courent rapidement . "
4 doc = nlp ( texte )
5 lemmas = [ token . lemma_ for token in doc ]
6 print ( lemmas )

Résultat : [’le’, ’chat’, ’manger’, ’et’, ’courir’, ’rapidement’,

’.’]

Word Embedding
Définition
Les mots sont représentés par des vecteurs dans un espace de dimensions
réduites. Des mots proches sémantiquement seront également proches dans
cet espace.
Exemple : ”Chat” et ”chien” auront des vecteurs similaires : [0.2,
0.8, -0.5, ...].

Modèles Word2Vec
• CBOW : Prédire un mot à partir de son contexte. Exemple : ”Le chat
dort” → Prédire ”chat” avec ”Le” et ”dort”.

• Skip-Gram : Prédire les mots contextuels autour d’un mot cible. Ex-
emple : ”chat” → Prédire ”Le” et ”dort”.

Bibliothèques Python pour NLP

• NLTK : Prétraitement (tokenisation, stopwords, stemming).

• spaCy : Analyse linguistique rapide.

• scikit-learn : Classification et représentation vectorielle.

• fastText : Représentation rapide des mots.

• Polyglot : Support multilingue.

3
Conclusion
Le NLP facilite l’interaction homme-machine et l’exploitation des données
textuelles. Grâce aux outils comme spaCy et aux modèles avancés comme
Word2Vec, il est possible de résoudre des problèmes complexes tels que la
traduction, l’analyse de sentiments et les chatbots.

Vous aimerez peut-être aussi

Système de Suggestion de Tags NLP
Pas encore d'évaluation
Système de Suggestion de Tags NLP
14 pages
Digital Huamnities Synthesis
Pas encore d'évaluation
Digital Huamnities Synthesis
3 pages
Document AI 3 Enrichi
Pas encore d'évaluation
Document AI 3 Enrichi
1 page
Cheat Sheet NLP : spaCy et Techniques
Pas encore d'évaluation
Cheat Sheet NLP : spaCy et Techniques
5 pages
Partie2CoursTALN UM6SS MasterBD-IA 2022
Pas encore d'évaluation
Partie2CoursTALN UM6SS MasterBD-IA 2022
33 pages
FICHE de LECTURE Natural Language Processing With Python
Pas encore d'évaluation
FICHE de LECTURE Natural Language Processing With Python
3 pages
NLP 2
Pas encore d'évaluation
NLP 2
17 pages
Linguistique NLP
Pas encore d'évaluation
Linguistique NLP
6 pages
Fake News Detection
Pas encore d'évaluation
Fake News Detection
51 pages
0 Sommaire Cours NLP Master2 de Mila 2023
Pas encore d'évaluation
0 Sommaire Cours NLP Master2 de Mila 2023
3 pages
Purple White Modern Artificial Intelligence Presentation 1
Pas encore d'évaluation
Purple White Modern Artificial Intelligence Presentation 1
32 pages
B08KRRPG1Q
Pas encore d'évaluation
B08KRRPG1Q
216 pages
LNLP
Pas encore d'évaluation
LNLP
28 pages
Intro NLP 01 07 18
Pas encore d'évaluation
Intro NLP 01 07 18
35 pages
Au Coeur Des LLM, Sans Les Maths-1
Pas encore d'évaluation
Au Coeur Des LLM, Sans Les Maths-1
19 pages
Plan Du Cours
Pas encore d'évaluation
Plan Du Cours
5 pages
TPE SIA 417 Version 1.0
Pas encore d'évaluation
TPE SIA 417 Version 1.0
28 pages
RAG Python
100% (1)
RAG Python
4 pages
Ingénierie des Prompts en IA
Pas encore d'évaluation
Ingénierie des Prompts en IA
58 pages
NLP Pres
Pas encore d'évaluation
NLP Pres
6 pages
tp1 2022
Pas encore d'évaluation
tp1 2022
4 pages
Classification Tweets Catastrophes
Pas encore d'évaluation
Classification Tweets Catastrophes
14 pages
Avancées et Défis du Traitement du Langage Naturel
Pas encore d'évaluation
Avancées et Défis du Traitement du Langage Naturel
8 pages
Les Bibliotheques Python Les Bibliotheques Python Les Bibliotheques Python Les Bibliotheques Python
Pas encore d'évaluation
Les Bibliotheques Python Les Bibliotheques Python Les Bibliotheques Python Les Bibliotheques Python
32 pages
Introduction au NLP et IA Générative
Pas encore d'évaluation
Introduction au NLP et IA Générative
35 pages
Traitement Automatique des Langues Naturelles
Pas encore d'évaluation
Traitement Automatique des Langues Naturelles
19 pages
NLTK FR
Pas encore d'évaluation
NLTK FR
16 pages
Chatgpt 1
Pas encore d'évaluation
Chatgpt 1
25 pages
Examen Master 2022/2023 en TALN
100% (3)
Examen Master 2022/2023 en TALN
3 pages
Examen Master 2022/2023 en TALN
Pas encore d'évaluation
Examen Master 2022/2023 en TALN
3 pages
QCM sur le NLP - Niveau 1
100% (1)
QCM sur le NLP - Niveau 1
3 pages
Tutoriel Traitement de Texte Python
Pas encore d'évaluation
Tutoriel Traitement de Texte Python
55 pages
Transformers
Pas encore d'évaluation
Transformers
36 pages
Introduction Au Traitement Du Langage Naturel NLP
Pas encore d'évaluation
Introduction Au Traitement Du Langage Naturel NLP
21 pages
NLP Natural Language Processing
Pas encore d'évaluation
NLP Natural Language Processing
2 pages
Classification de Sentiments avec Word2Vec
Pas encore d'évaluation
Classification de Sentiments avec Word2Vec
11 pages
Traitement de Données Sémantiques
Pas encore d'évaluation
Traitement de Données Sémantiques
17 pages
Cours RNN
Pas encore d'évaluation
Cours RNN
8 pages
Correction QST Examen NLP 1
Pas encore d'évaluation
Correction QST Examen NLP 1
9 pages
nlp06 MLP LM Classification
Pas encore d'évaluation
nlp06 MLP LM Classification
21 pages
Traitement du langage naturel avec Azure
Pas encore d'évaluation
Traitement du langage naturel avec Azure
62 pages
1-Traitement Du Langage Naturel - Cours de PNL Sur Le Visage Enlacé
Pas encore d'évaluation
1-Traitement Du Langage Naturel - Cours de PNL Sur Le Visage Enlacé
2 pages
Approches mathématiques en traitement sémantique
Pas encore d'évaluation
Approches mathématiques en traitement sémantique
3 pages
Memoire David Krame Kadurha (Ulpgl 2021-2022)
Pas encore d'évaluation
Memoire David Krame Kadurha (Ulpgl 2021-2022)
142 pages
Madjid Khichane - Natural Language Processing (NLP) Avec Python 2022 Web 1080P X264
Pas encore d'évaluation
Madjid Khichane - Natural Language Processing (NLP) Avec Python 2022 Web 1080P X264
2 pages
Introduction au Traitement du Langage Naturel
Pas encore d'évaluation
Introduction au Traitement du Langage Naturel
39 pages
Cours Text Mining LIAA3
0% (1)
Cours Text Mining LIAA3
28 pages
Approches mathématiques en NLP
Pas encore d'évaluation
Approches mathématiques en NLP
3 pages
Projet IML 7 - Rapport
Pas encore d'évaluation
Projet IML 7 - Rapport
15 pages
Modèles NLP et Expressions Régulières
Pas encore d'évaluation
Modèles NLP et Expressions Régulières
101 pages
Analyse de sentiments avec TF-IDF et Word2Vec
Pas encore d'évaluation
Analyse de sentiments avec TF-IDF et Word2Vec
10 pages
Chatbot IA : Automatisation et Modélisation
Pas encore d'évaluation
Chatbot IA : Automatisation et Modélisation
2 pages
Bases NLP: Bibliothèques et Manipulation
Pas encore d'évaluation
Bases NLP: Bibliothèques et Manipulation
28 pages
Web Sémantique et NLP en Python
Pas encore d'évaluation
Web Sémantique et NLP en Python
16 pages
TP NLP GenAI PDF
Pas encore d'évaluation
TP NLP GenAI PDF
6 pages
TB Lucas - Gulen
Pas encore d'évaluation
TB Lucas - Gulen
92 pages
Prj01 Clustering
Pas encore d'évaluation
Prj01 Clustering
2 pages
Compte Rendu Tp2
Pas encore d'évaluation
Compte Rendu Tp2
4 pages
Exercices d'Arithmétique et PGCD
Pas encore d'évaluation
Exercices d'Arithmétique et PGCD
1 page
CCB 2022
Pas encore d'évaluation
CCB 2022
4 pages
TMEL - Automatisme Schèma A3
Pas encore d'évaluation
TMEL - Automatisme Schèma A3
4 pages
Puissance ELEC PDF
Pas encore d'évaluation
Puissance ELEC PDF
8 pages
Chariot Élévateur Électrique EFG 110-115
Pas encore d'évaluation
Chariot Élévateur Électrique EFG 110-115
4 pages
TD2-grue MODELISATION
Pas encore d'évaluation
TD2-grue MODELISATION
4 pages
12 Brochure TD
100% (2)
12 Brochure TD
22 pages
Cinétique et Catalyse en Génie des Procédés
Pas encore d'évaluation
Cinétique et Catalyse en Génie des Procédés
126 pages
TS Ex. Sur Les Limites de Fonctions Par Comparaison
Pas encore d'évaluation
TS Ex. Sur Les Limites de Fonctions Par Comparaison
4 pages
Introduction aux Codes Cycliques
Pas encore d'évaluation
Introduction aux Codes Cycliques
17 pages
Les Paroles Rapportées
Pas encore d'évaluation
Les Paroles Rapportées
3 pages
Exercices d'Algèbre Linéaire - TD 1
Pas encore d'évaluation
Exercices d'Algèbre Linéaire - TD 1
8 pages
Exercices Sur La Resistance Au Cisaillement
Pas encore d'évaluation
Exercices Sur La Resistance Au Cisaillement
4 pages
Diagnostic Des Machines Tournantes
Pas encore d'évaluation
Diagnostic Des Machines Tournantes
8 pages
Système de Stéganographie d'Images
100% (1)
Système de Stéganographie d'Images
101 pages
COURS MDC2 - Terre Cuite
100% (1)
COURS MDC2 - Terre Cuite
5 pages
TP C++
Pas encore d'évaluation
TP C++
2 pages
3.1.2.12 Lab - Building A Switched Network With Redundant Links
Pas encore d'évaluation
3.1.2.12 Lab - Building A Switched Network With Redundant Links
9 pages
TP Systèmes Asservis : Études et Simulations
100% (1)
TP Systèmes Asservis : Études et Simulations
11 pages
Contre-réaction en électronique fondamentale
Pas encore d'évaluation
Contre-réaction en électronique fondamentale
7 pages
Cours 2 Atelier de Programmation Les Structures de Controle Conditionnelles
Pas encore d'évaluation
Cours 2 Atelier de Programmation Les Structures de Controle Conditionnelles
14 pages
11-Dimensionnement Hydraulique Des Petits Ouvrages de Rétablissement
80% (25)
11-Dimensionnement Hydraulique Des Petits Ouvrages de Rétablissement
10 pages
DS1 Math
Pas encore d'évaluation
DS1 Math
4 pages
Emploi Du Temps GM S1 2025 - 2026 V16
Pas encore d'évaluation
Emploi Du Temps GM S1 2025 - 2026 V16
8 pages
Introduction aux Équations Différentielles
Pas encore d'évaluation
Introduction aux Équations Différentielles
110 pages
Méthodes Numériques en Génie Civil
Pas encore d'évaluation
Méthodes Numériques en Génie Civil
3 pages
Bilan Radiatif de la Terre
Pas encore d'évaluation
Bilan Radiatif de la Terre
2 pages
Analyse: Espaces de Hilbert et Séries de Fourier
Pas encore d'évaluation
Analyse: Espaces de Hilbert et Séries de Fourier
55 pages
Dm5eme (1) - Copie
Pas encore d'évaluation
Dm5eme (1) - Copie
2 pages
Questionnaire Portant Sur La Photosynthèse 2
Pas encore d'évaluation
Questionnaire Portant Sur La Photosynthèse 2
2 pages