L’apprentissage supervisé :
Popularité de la publicité: La sélection des publicités qui
fonctionnent bien est souvent une tâche d'apprentissage
supervisé. De nombreuses publicités que vous voyez lorsque
vous naviguez sur Internet y sont placées car un algorithme
d'apprentissage a déclaré qu'elles étaient d'une popularité (et
d'une cliquabilité) raisonnables. De plus, son placement
associé sur un certain site ou à une certaine requête (si vous
vous retrouvez à utiliser un moteur de recherche) est en
grande partie dû à un algorithme appris disant que la mise en
correspondance entre l'annonce et le placement sera efficace.
Classification du spam: si vous utilisez un système de
messagerie moderne, il est probable que vous ayez rencontré
un filtre anti-spam. Ce filtre anti-spam est un système
d'apprentissage supervisé. Nourris d'exemples et d'étiquettes
d'e-mails (spam / non spam), ces systèmes apprennent à
filtrer de manière préventive les e-mails malveillants afin que
leur utilisateur ne soit pas harcelé par eux. Beaucoup d'entre
eux se comportent également de telle sorte qu'un utilisateur
peut fournir de nouvelles étiquettes au système et il peut
apprendre les préférences de l'utilisateur.
Reconnaissance faciale: utilisez-vous Facebook? Très
probablement, votre visage a été utilisé dans un algorithme
d'apprentissage supervisé qui est formé pour reconnaître
votre visage. Avoir un système qui prend une photo, trouve
des visages et devine qui est sur la photo (suggérant une
étiquette) est un processus supervisé. Il comporte plusieurs
couches, trouvant des visages puis les identifiant, mais il est
toujours supervisé.
L’apprentissage non supervisé :
Systèmes de recommandation: Si vous avez déjà
utilisé YouTube ou Netflix, vous avez probablement
rencontré un système de recommandation vidéo. Ces
systèmes sont souvent placés dans le domaine non
supervisé. Nous savons des choses sur les vidéos, peut-être
leur durée, leur genre, etc. Nous connaissons également
l'historique de visionnage de nombreux utilisateurs. En
tenant compte des utilisateurs qui ont regardé des vidéos
similaires à celles de vous et qui ont ensuite apprécié
d'autres vidéos que vous n'avez pas encore vues, un
système de recommandation peut voir cette relation dans
les données et vous proposer une telle suggestion.
Habitudes d'achat: Il est probable que vos habitudes
d'achat soient contenues dans une base de données
quelque part et que les données soient achetées et vendues
activement en ce moment. Ces habitudes d'achat peuvent
être utilisées dans des algorithmes d'apprentissage non
supervisés pour regrouper les clients dans des segments
d'achat similaires. Cela aide les entreprises à
commercialiser ces segments groupés et peut même
ressembler à des systèmes de recommandation.
Regroupement des journaux des utilisateurs: Moins
de contacts avec les utilisateurs, mais toujours très
pertinents, nous pouvons utiliser l'apprentissage non
supervisé pour regrouper les journaux et les problèmes des
utilisateurs. Cela peut aider les entreprises à identifier les
thèmes centraux des problèmes auxquels leurs clients sont
confrontés et à les résoudre, en améliorant un produit ou
en concevant une FAQ pour traiter les problèmes courants.
Quoi qu'il en soit, c'est quelque chose qui est activement
fait et si vous avez déjà soumis un problème avec un
produit ou soumis un rapport de bogue, il est probable qu'il
ait été transmis à un algorithme d'apprentissage non
supervisé pour le regrouper avec d'autres problèmes
similaires.
L'apprentissage par renforcement :
Jeu de Mario : Dans le jeu de Mario, notre agent est
notre algorithme d'apprentissage et notre est le jeu
(probablement un niveau spécifique). Notre agent a un
ensemble d'actions. Ce seront nos états de bouton. Notre
état mis à jour sera chaque image de jeu au fil du temps et
notre signal de récompense sera le changement de score.
Tant que nous connectons tous ces composants ensemble,
nous aurons mis en place un scénario d'apprentissage par
renforcement pour jouer au jeu Mario.
Jeux vidéo: L'un des endroits les plus courants pour
étudier l'apprentissage par renforcement est d'apprendre à
jouer à des jeux. Regardez l'application d'apprentissage par
renforcement de Google, AlphaZero et AlphaGo, qui a
appris à jouer au jeu Go. Notre exemple Mario est
également un exemple courant. Actuellement, je ne
connais aucun jeu de qualité production doté d'un agent
d'apprentissage par renforcement comme IA de jeu, mais
je peux imaginer que ce sera bientôt une option
intéressante pour les développeurs de jeux.
Simulation industrielle: pour de nombreuses
applications robotiques (pensez aux chaînes de montage),
il est utile que nos machines apprennent à effectuer leurs
tâches sans avoir à coder en dur leurs processus. Cela peut
être une option moins chère et plus sûre; il peut même être
moins sujet à l'échec. Nous pouvons également inciter nos
machines à utiliser moins d'électricité, afin de nous faire
économiser de l'argent. De plus, nous pouvons commencer
tout cela dans une simulation afin de ne pas gaspiller
d'argent si nous cassons potentiellement notre machine.
Gestion des ressources: l'apprentissage par
renforcement est bon pour naviguer dans des
environnements complexes. Il peut gérer la nécessité
d'équilibrer certaines exigences. Prenons, par exemple, les
centres de données de Google. Ils ont utilisé
l'apprentissage par renforcement pour équilibrer le besoin
de satisfaire nos besoins en énergie, mais le faire aussi
efficacement que possible, en réduisant les coûts
importants. Comment cela nous affecte-t-il, nous et la
personne moyenne? Des coûts de stockage de données
moins chers pour nous aussi et moins d'impact sur
l'environnement que nous partageons tous.
L'apprentissage par renforcement est utilisé dans
plusieurs applications : robotique, gestion de ressources, vol
d'hélicoptères, chimie. Cette méthode a été appliquée avec
succès à des problèmes variés, tels que le contrôle robotique, le
pendule inversé, la planification de tâches, les
télécommunications, le backgammon et les échecs.
NLP :
a. Email filters
Les emails filters (filtres de messagerie) sont l'une des
applications les plus basiques et les plus initiales de la NLP en ligne. Tout
a commencé avec des filtres anti-spam, découvrir certains mots ou
phrases qui signalent un message de spam. Mais le filtrage s'est amélioré,
tout comme au début adaptations de la NLP.
L'une des applications les plus courantes et les plus récentes de la NLP se
trouve dans la classification des e-mails de Gmail.
Le système reconnaît si les e-mails appartiennent à l'une des trois
catégories (principale, sociale ou promotionnelle) en fonction de leur
contenu.
Pour tous les utilisateurs de Gmail, cela maintient votre boîte de
réception à une taille gérable avec les e-mails importants et pertinents
que vous souhaitez consulter et répondre rapidement.
b. Smart assistants
Des assistants intelligents comme Siri d'Apple et Alexa
d'Amazon reconnaissent les modèles de parole grâce à la reconnaissance
vocale, puis déduire un sens et fournir une réponse utile.
Nous nous sommes habitués au fait que nous pouvons dire «Hey Siri»,
posez une question, et elle comprend ce que nous avons dit et répond
avec des réponses pertinentes basées sur le contexte.
Et nous nous habituons à voir Siri ou Alexa apparaître dans toute notre
maison et notre vie quotidienne alors que nous discutons avec eux à
travers des éléments tels que le thermostat, les interrupteurs d'éclairage,
la voiture, etc.
c. Search results
Les moteurs de recherche utilisent la NLP pour afficher des
résultats pertinents basés sur des comportements de recherche similaires
ou des intentions de l'utilisateur afin que la personne moyenne trouve ce
dont elle a besoin sans être un assistant de recherche.
Par exemple, Google prédit non seulement quelles recherches
populaires peuvent s'appliquer à votre requête lorsque vous commencez
à taper, mais il regarde l'image dans son ensemble et reconnaît ce que
vous essayez de dire plutôt que les mots de recherche exacts.
Quelqu'un pourrait mettre un numéro de vol dans Google et obtenir le
statut du vol, taper un symbole boursier et recevoir des informations
boursières, ou une calculatrice peut apparaître lors de la saisie d'une
équation mathématique.
Voici quelques variantes que vous pouvez voir lorsque vous effectuez une
recherche, car la NLP dans la recherche associe la requête ambiguë à une
entité relative et fournit des résultats utiles.
d. Predictive text
Des choses comme la correction automatique, la saisie semi-
automatique et le texte prédictif sont si courantes sur nos smartphones
que nous les prenons pour acquis. Le texte de saisie semi-automatique et
prédictif est similaire aux moteurs de recherche en ce sens qu'ils
prédisent les choses à dire en fonction de ce que vous tapez, en terminant
le mot ou en suggérant un mot pertinent.
Et la correction automatique changera parfois même les mots pour que le
message global ait plus de sens.
Ils apprennent également de vous. Le texte prédictif s'adapte à vos
particularités linguistiques personnelles au fur et à mesure que vous
l'utilisez.
e. Language translation
Avec la NLP, les traducteurs en ligne peuvent traduire des
langues plus précisément et présenter des résultats grammaticalement
corrects.
Ceci est infiniment utile lorsque vous essayez de communiquer avec
quelqu'un dans une autre langue.
Non seulement cela, mais lors de la traduction d'une autre langue vers la
vôtre, les outils reconnaissent désormais la langue en fonction du texte
saisi et le traduisent.
f. D’autres exemples :
Digital phone calls/ Data analysis/ Text analytics/
Chatbots/ Sentiment Analysis