Tutoriel sur le traitement du langage naturel : Qu'est-ce que la PNL ? Exemples
Qu'est-ce que le traitement du langage naturel?
Traitement du langage naturel (PNL) est une branche de l'IA qui aide les ordinateurs ร comprendre, interprรฉter et manipuler les langues humaines comme l'anglais ou l'hindi pour analyser et en dรฉduire leur signification. La PNL aide les dรฉveloppeurs ร organiser et structurer les connaissances pour effectuer des tรขches telles que la traduction, le rรฉsumรฉ, la reconnaissance d'entitรฉs nommรฉes, l'extraction de relations, la reconnaissance vocale, la segmentation de sujets, etc.
Histoire de la PNL
Voici quelques รฉvรฉnements importants dans lโhistoire du traitement du langage naturel :
1950- La PNL a dรฉbutรฉ lorsqu'Alan Turing a publiรฉ un article intitulรฉ ยซ Machine et intelligence ยป.
1950- Tentatives d'automatisation de la traduction entre le russe et l'anglais
1960- Les travaux de Chomsky et d'autres sur la thรฉorie du langage formel et la syntaxe gรฉnรฉrative
1990- Les modรจles probabilistes et basรฉs sur les donnรฉes รฉtaient devenus assez standards
2000- Une grande quantitรฉ de donnรฉes orales et textuelles devient disponible
Ensuite, dans ce didacticiel PNL, nous apprendrons comment fonctionne la PNL.
Comment fonctionne la PNL ?
Avant d'apprendre comment fonctionne la PNL, comprenons comment les humains utilisent le langage.
Chaque jour, nous prononรงons des milliers de mots que dโautres personnes interprรจtent comme faisant dโinnombrables choses. Nous considรฉrons cela comme une simple communication, mais nous savons tous que les mots ont une portรฉe bien plus profonde que cela. Il y a toujours un certain contexte que nous tirons de ce que nous disons et de la maniรจre dont nous le disons., PNL en Intelligence Artificielle ne se concentre jamais sur la modulation de la voix ; il s'appuie sur des modรจles contextuels.
Exemple :
Man is to woman as king is to __________? Meaning (king) โ meaning (man) + meaning ( woman)=? The answer is- queen
Ici, nous pouvons facilement รฉtablir une relation car lโhomme est de genre masculin et la femme est de genre fรฉminin. De la mรชme maniรจre, le roi est de genre masculin et son genre fรฉminin est la reine.
Exemple :
Is King to kings as the queen is to_______? The answer is--- queens
Ici, nous pouvons voir deux mots rois et rois oรน lโun est au singulier et lโautre au pluriel. Par consรฉquent, lorsque la reine du monde arrive, elle est automatiquement en relation avec les reines ร nouveau au singulier pluriel.
Ici, la plus grande question est la suivante : comment savoir ce que signifient les mots ? Disons qui l'appellera reine ?
La rรฉponse est que nous apprenons cela grรขce ร lโexpรฉrience. Cependant, ici, la question principale est la suivante : comment lโordinateur sait-il la mรชme chose ?
Nous devons fournir suffisamment de donnรฉes pour que les machines puissent apprendre par l'expรฉrience. Nous pouvons fournir des dรฉtails tels que
- Sa Majestรฉ la Reine.
- Discours de la Reine lors de la visite d'รtat
- La couronne de la reine Elizabeth
- La mรจre des reines
- La reine est gรฉnรฉreuse.
Avec les exemples ci-dessus, la machine comprend l'entitรฉ Reine.
La machine crรฉe des vecteurs de mots comme ci-dessous. Un vecteur de mots est construit ร partir des mots environnants.
La machine crรฉe ces vecteurs
- En apprenant ร partir de plusieurs ensembles de donnรฉes
- Utiliser l'apprentissage automatique (par exemple, les algorithmes de Deep Learning)
- Un vecteur de mots est construit ร partir des mots environnants.
Voici la formule:
Signification (roi) โ signification (homme) + signification (femme) = ?
Cela revient ร effectuer des opรฉrations algรฉbriques simples sur des vecteurs de mots :
Vecteur (roi) โ vecteur (homme) + vecteur (femme) = vecteur (?)
A quoi la machine rรฉpond reine.
Ensuite, dans ce didacticiel sur le traitement du langage naturel, nous dรฉcouvrirons les composants du PNL.
Composantes de la PNL
Les cinq composants principaux du traitement du langage naturel dans lโIA sont :
- Analyse Morphologique et Lexicale
- Analyse syntaxique
- Analyse sรฉmantique
- Intรฉgration du discours
- Analyse pragmatique

Analyse Morphologique et Lexicale
L'analyse lexicale est un vocabulaire qui comprend ses mots et ses expressions. Il dรฉcrit l'analyse, l'identification et la description de la structure des mots. Cela comprend la division d'un texte en paragraphes, mots et phrases
Les mots individuels sont analysรฉs dans leurs composants, et les jetons non-mots tels que les ponctuations sont sรฉparรฉs des mots.
Analyse sรฉmantique
L'analyse sรฉmantique est une structure crรฉรฉe par l'analyseur syntaxique qui attribue des significations. Ce composant transfรจre des sรฉquences linรฉaires de mots en structures. Il montre comment les mots sont associรฉs les uns aux autres.
La sรฉmantique se concentre uniquement sur le sens littรฉral des mots, des expressions et des phrases. Cela ne fait qu'abstraire la signification du dictionnaire ou la signification rรฉelle du contexte donnรฉ. Les structures attribuรฉes par l'analyseur syntaxique ont toujours une signification attribuรฉe
Par exemple. "Idรฉe verte incolore." Ceci serait rejetรฉ par l'analyse Symantec comme incolore Ici; le vert n'a aucun sens.
Analyse pragmatique
L'analyse pragmatique traite du contenu communicatif et social global et de son effet sur l'interprรฉtation. Cela signifie faire abstraction ou dรฉriver lโutilisation significative du langage dans des situations. Dans cette analyse, l'accent est toujours mis sur ce qui a รฉtรฉ dit et rรฉinterprรฉtรฉ sur ce que l'on entend.
L'analyse pragmatique aide les utilisateurs ร dรฉcouvrir cet effet recherchรฉ en appliquant un ensemble de rรจgles qui caractรฉrisent les dialogues coopรฉratifs.
Par exemple, ยซ fermer la fenรชtre ? ยป doit รชtre interprรฉtรฉ comme une demande plutรดt que comme un ordre.
Analyse syntaxique
Les mots sont communรฉment acceptรฉs comme รฉtant les plus petites unitรฉs syntaxiques. La syntaxe fait rรฉfรฉrence aux principes et aux rรจgles qui rรฉgissent la structure des phrases de toute langue individuelle.
La syntaxe se concentre sur l'ordre appropriรฉ des mots qui peut affecter leur signification. Cela implique l'analyse des mots d'une phrase en suivant la structure grammaticale de la phrase. Les mots sont transformรฉs en structure pour montrer comment les mots sont liรฉs les uns aux autres.
Intรฉgration du discours
Cela signifie une idรฉe du contexte. Le sens de toute phrase unique qui dรฉpend de ces phrases. Il considรจre รฉgalement le sens de la phrase suivante.
Par exemple, le mot ยซ cela ยป dans la phrase ยซ Il voulait cela ยป dรฉpend du contexte du discours antรฉrieur.
Ensuite, dans ce didacticiel PNL, nous dรฉcouvrirons la PNL et les systรจmes d'รฉcriture.
PNL et systรจmes d'รฉcriture
Le type de systรจme dโรฉcriture utilisรฉ pour une langue est lโun des facteurs dรฉcisifs pour dรฉterminer la meilleure approche de prรฉtraitement du texte. Les systรจmes d'รฉcriture peuvent รชtre
- Logographique : un grand nombre de symboles individuels reprรฉsentent des mots. Exemple japonais, mandarin
- Syllabique : les symboles individuels reprรฉsentent des syllabes
- Alphabรฉtique : les symboles individuels reprรฉsentent le son
La majoritรฉ des systรจmes d'รฉcriture utilisent le systรจme syllabique ou alphabรฉtique. Mรชme l'anglais, avec son systรจme d'รฉcriture relativement simple basรฉ sur l'alphabet romain, utilise des symboles logographiques qui incluent des chiffres arabes, des symboles monรฉtaires (S, ยฃ) et d'autres symboles spรฉciaux.
Cela pose les dรฉfis suivants
- Extraire le sens (sรฉmantique) dโun texte est un dรฉfi
- La PNL en IA dรฉpend de la qualitรฉ du corpus. Si le domaine est vaste, il est difficile de comprendre le contexte.
- Il existe une dรฉpendance au jeu de caractรจres et ร la langue
Comment mettre en ลuvre la PNL
Ci-dessous, vous trouverez les mรฉthodes populaires utilisรฉes pour le processus d'apprentissage naturel :
Apprentissage automatique: Les procรฉdures d'apprentissage NLP utilisรฉes lors de l'apprentissage automatique. Il se concentre automatiquement sur les cas les plus courants. Ainsi, lorsque nous รฉcrivons des rรจgles ร la main, ce nโest souvent pas correct du tout, en raison des erreurs humaines.
Infรฉrence statistique: La PNL peut utiliser des algorithmes d'infรฉrence statistique. Cela vous aide ร produire des modรจles robustes. par exemple, contenant des mots ou des structures connus de tous.
Exemples de PNL
Aujourdโhui, la technologie dโapprentissage des processus naturels est une technologie largement utilisรฉe.
Voici les techniques courantes de traitement du langage naturel :
Rรฉcupรฉration d'informations et recherche sur le Web
Google, Yahoo, Bing et autres moteurs de recherche basent leur technologie de traduction automatique sur des modรจles dโapprentissage profond PNL. Il permet aux algorithmes de lire le texte dโune page Web, dโinterprรฉter sa signification et de le traduire dans une autre langue.
Correction grammaticale :
La technique PNL est largement utilisรฉe par les logiciels de traitement de texte comme MS-Word pour la correction orthographique et la vรฉrification grammaticale.
Question Rรฉpondant
Tapez des mots-clรฉs pour poser des questions en langage naturel.
Synthรจse de texte
Le processus de rรฉsumรฉ des informations importantes d'une source pour produire une version abrรฉgรฉe
Traduction automatique
Utilisation d'applications informatiques pour traduire du texte ou de la parole d'une langue naturelle ร une autre.
Analyse des sentiments
La PNL aide les entreprises ร analyser un grand nombre dโavis sur un produit. Cela permet รฉgalement ร leurs clients de donner leur avis sur un produit particulier.
L'avenir de la PNL
- Le traitement du langage naturel lisible par lโhomme est le plus gros problรจme dโAl. Cela revient ร rรฉsoudre le problรจme central de lโintelligence artificielle et ร rendre les ordinateurs aussi intelligents que les humains.
- Les futurs ordinateurs ou machines utilisant la PNL pourront apprendre des informations en ligne et les appliquer dans le monde rรฉel, cependant, beaucoup de travail reste ร faire ร cet รฉgard.
- La boรฎte ร outils en langage naturel ou nltk devient plus efficace
- Combinรฉs ร la gรฉnรฉration de langage naturel, les ordinateurs deviendront plus capables de recevoir et de fournir des informations ou des donnรฉes utiles et ingรฉnieuses.
Langage naturel vs langage informatique
Vous trouverez ci-dessous les principales diffรฉrences entre le langage naturel et le langage informatique :
| Paramรจtres | Langage naturel | Langage informatique |
|---|---|---|
| Ambigu | Ils sont de nature ambiguรซ. | Ils sont conรงus pour รชtre sans ambiguรฏtรฉ. |
| Redondance | Les langues naturelles emploient beaucoup de redondance. | Les langages formels sont moins redondants. |
| Littรฉralitรฉ | Les langues naturelles sont faites d'idiomes et de mรฉtaphores | Les langages formels signifient exactement ce qu'ils veulent dire |
Avantages de la PNL
- Les utilisateurs peuvent poser des questions sur n'importe quel sujet et obtenir une rรฉponse directe en quelques secondes.
- Le systรจme PNL fournit des rรฉponses aux questions en langage naturel
- Le systรจme PNL offre des rรฉponses exactes aux questions, sans informations inutiles ou indรฉsirables
- L'exactitude des rรฉponses augmente avec la quantitรฉ d'informations pertinentes fournies dans la question.
- Le processus PNL aide les ordinateurs ร communiquer avec les humains dans leur langue et permet d'adapter d'autres tรขches liรฉes ร la langue.
- Vous permet d'exรฉcuter davantage de donnรฉes basรฉes sur le langage par rapport ร un รชtre humain sans fatigue et de maniรจre impartiale et cohรฉrente.
- Structurer une source de donnรฉes hautement non structurรฉe
Inconvรฉnients de la PNL
- Langage de requรชte complexe : le systรจme peut ne pas รชtre en mesure de fournir la rรฉponse correcte ร une question mal formulรฉe ou ambiguรซ.
- Le systรจme est conรงu pour une tรขche unique et spรฉcifique uniquement ; il est incapable de s'adapter ร de nouveaux domaines et problรจmes en raison de fonctions limitรฉes.
- Le systรจme NLP n'a pas d'interface utilisateur dรฉpourvue de fonctionnalitรฉs permettant aux utilisateurs d'interagir davantage avec le systรจme.
Rรฉsumรฉ
- Le traitement du langage naturel est une branche de l'IA qui aide les ordinateurs ร comprendre, interprรฉter et manipuler le langage humain.
- La PNL a dรฉbutรฉ lorsqu'Alan Turing a publiรฉ un article intitulรฉ ยซ Machine et intelligence ยป.
- La PNL ne se concentre jamais sur la modulation vocale ; il s'appuie sur des modรจles contextuels
- Cinq composants essentiels du traitement du langage naturel dans l'intelligence artificielle sont 1) Analyse morphologique et lexicale 2) Analyse syntaxique 3) Analyse sรฉmantique 4) Intรฉgration du discours 5) Analyse pragmatique
- Trois types de systรจme d'รฉcriture de processus naturel sont 1) Logographique 2) Syllabique 3) Alphabรฉtique
- L'apprentissage automatique et l'infรฉrence statistique sont deux mรฉthodes de mise en ลuvre de l'apprentissage des processus naturels.
- Les applications essentielles de la PNL sont la recherche d'informations et la recherche sur le Web, la rรฉponse aux questions de correction grammaticale, le rรฉsumรฉ de texte, la traduction automatique, etc.
- Futurs ordinateurs ou machines avec l'aide de la PNL et Sciences des donnรฉes sera capable d'apprendre des informations en ligne et de les appliquer dans le monde rรฉel, cependant, beaucoup de travail reste ร faire ร cet รฉgard.
- Le NLP est ambigu alors que le langage informatique open source est conรงu pour รชtre sans ambiguรฏtรฉ.
- Le plus grand avantage du systรจme PNL dans lโIntelligence Artificielle est quโil offre des rรฉponses exactes aux questions, sans informations inutiles ou indรฉsirables.
- Le plus gros inconvรฉnient du systรจme PNL est quโil est conรงu pour une tรขche unique et spรฉcifique. Il est donc incapable de sโadapter ร de nouveaux domaines et problรจmes en raison de ses fonctions limitรฉes.




