Table des matières
1. Définition.........................................................................................................................................3
2. Applications de l'IA Générative........................................................................................................3
3. Modalités.........................................................................................................................................4
4. Articles connexes.............................................................................................................................7
Définition
L'intelligence artificielle générative ou IA générative (ou GenAI) est un type de système
d'intelligence artificielle (IA) capable de générer du texte, des images ou d'autres médias en
réponse à des invites (ou prompts en anglais). Les modèles génératifs apprennent les modèles
et la structure des données d'entrée, puis génèrent un nouveau contenu similaire aux données
d'apprentissage mais avec un certain degré de nouveauté (plutôt que de simplement classer ou
prédire les données) 1.
L'IA générative peut être unimodale ou multimodale ; les systèmes unimodaux n'acceptent
qu'un seul type d'entrée (par exemple, du texte), tandis que les systèmes multimodaux peuvent
accepter plusieurs types d'entrée (par exemple, du texte et des images).
Les cadres les plus importants pour aborder l'IA générative comprennent les réseaux
antagonistes génératifs (GAN) et les transformateurs génératifs pré-entraînés (GPT) 2. Les
GAN se composent de deux parties : un réseau générateur qui crée de nouveaux échantillons
de données et un réseau discriminateur qui évalue si les échantillons sont réels ou faux. Les
deux réseaux sont formés ensemble dans le cadre d'un processus concurrentiel, le réseau
générateur essayant continuellement de produire des échantillons de meilleure qualité et plus
réalistes, tandis que le réseau discriminateur s'efforce d'identifier avec précision les faux
échantillons. Les GPT sont des réseaux de neurones artificiels fondés sur l'architecture du
transformateur, pré-entraînés sur de grands ensembles de données de texte non étiqueté et
capables de générer un nouveau texte de type humain3. Ils utilisent de grands modèles de
langage (abrégés LLM, pour large language model) pour produire des données fondées sur
l'ensemble de données d'entraînement qui a été utilisé pour les créer.
Applications de l'IA Générative
L'IA générative a de nombreuses applications potentielles, notamment dans des domaines
créatifs tels que l'art, la musique et l'écriture, ainsi que dans des domaines tels que les soins
de santé, la finance et les jeux. Cependant, il existe également des inquiétudes quant à
l'utilisation abusive potentielle de l'IA générative, par exemple dans la création de fausses
nouvelles (fake news en anglais) ou de deepfakes, qui peuvent être utilisées pour tromper ou
manipuler les gens4.
1 « Artificial Intelligence Glossary: Neural Networks and Other Terms Explained », The New York Times, 27 mars 2023 consulté le
22 avril 2023)
2 [Link]
3 [Link]
4 « Risques de cybersécurité liés à l'IA générative » [archive], sur [Link], 26 juillet 2023 (consulté le 27 août 2023)
Les systèmes d'IA génératifs notables incluent ChatGPT (et sa variante Bing Chat), un chatbot
(agent conversationnel programmable) construit par OpenAI à l'aide de ses grands modèles de
langage fondateurs GPT-3 et GPT-4, et Bard, un chatbot construit par Google à l'aide de son
modèle fondateur LaMDA. D'autres modèles d'IA générative incluent des systèmes artistiques
d'intelligence artificielle tels que Stable Diffusion, Midjourney et DALLE 5.
L'IA générative a des applications potentielles dans un large domaine d'industries, parmi
lesquelles le développement de logiciels, le marketing et la mode. L'investissement dans l'IA
générative bondit au début des années 2020, avec de grandes entreprises telles que Microsoft,
Google et Baidu ainsi que de nombreuses petites entreprises développant des modèles d'IA
générative6.
Modalités
Un système d'IA générative est construit en appliquant un apprentissage automatique non
supervisé ou auto-supervisé à un ensemble de données. Les capacités d'un système d'IA
générative dépendent de la modalité ou du type d'ensemble de données utilisé.
▪ Texte : les systèmes d'IA générative formés sur des mots ou des jetons de mots
(tokens) incluent GPT-3, LaMDA, LLaMA, BLOOM, GPT-4 et d'autres. Ils sont
capables de traiter du langage naturel, de faire de la traduction automatique et de
générer du langage naturel et peuvent être utilisés comme modèles de base pour
d'autres tâches.
Les principaux ensembles de données sont BookCorpus, Wikipédia et d'autres.
▪ Code : Outre les textes en langage naturel, de grands modèles de langage peuvent être
entraînés sur du texte en langage de programmation, ce qui leur permet de générer du
code source de nouveaux programmes informatiques.
Images : Les systèmes d'IA générative formés sur
des ensembles d'images avec des légendes textuelles
comprennent Imagen, DALL-E, Midjourney, Stable
Diffusion et autres. Ils sont couramment utilisés pour
la génération de texte en image et le transfert de style
5 Roose, « A Coming-Out Party for Generative A.I., Silicon Valley's New Craze » [archive], The New York Times, 21 octobre 2022
(consulté le 14 mars 2023)
6 Yang et Gokturk, « Google Cloud brings generative AI to developers, businesses, and governments » [archive], 14 mars 2023
neuronal7. Les jeux de données sont notamment LAION-5B et
d'autres.
▪ Molécules : Les systèmes d'IA générative peuvent être entraînés sur des séquences
d'acides aminés ou des représentations moléculaires telles que SMILES représentant
l'ADN ou les protéines. Ces systèmes, comme AlphaFold, sont utilisés pour la
prédiction de la structure des protéines et la découverte de médicaments. Les
ensembles de données comprennent divers ensembles de données biologiques.
▪ Musique : les systèmes d'IA générative tels que MusicLM peuvent être formés sur les
formes d'ondes sonores de la musique enregistrée avec des annotations textuelles afin
de générer de nouveaux échantillons musicaux fondés sur des descriptions de texte
telles qu'« une mélodie de violon apaisante soutenue par un riff de guitare distordu ».
▪ Vidéo : L'IA générative entraînée sur une vidéo annotée peut générer des clips vidéo
cohérents dans le temps. Des IA comme Gen1 par RunwayML19 et Make-A-Video de
Meta20 peuvent générer des vidéos de cette manière.
▪ Multimodal : un système d'IA générative peut être construit à partir de plusieurs
modèles génératifs, ou d'un modèle entraîné sur plusieurs types de données. Par
exemple, une version du GPT-4 d'OpenAI accepte à la fois les entrées de texte et
d'image8.
Modalité Capacités Ensembles de
Exemples de
données
systèmes IA
générative
7 Aditya Ramesh et Mikhail Pavlov « Zero-shot text-to-image generation » (2021)
— « (ibid.) », dans International Conference on Machine Learning, PMLR, p. 8821–8831
8 « Explainer: What is Generative AI, the technology behind OpenAI's ChatGPT? », Reuters, 17 mars 2023 (lire en ligne [archive],
consulté le 17 mars 2023)
Texte GPT-3, LaMDA, BookCorpus,
Traitement du
LLaMA, BLOOM, GPT- Wikipédia, etc.
4, etc. langage naturel,
traduction, génération
de texte
Code
Grands modèles de Génération de code Texte en langage de
langage source programmation
Images LAION-5B, etc.
Imagen, DALL-E, Génération de texte
Midjourney, Stable en image, transfert de
Diffusion, etc. style
Molécules AlphaFold Ensembles de
Prédiction de la
données biologiques
structure des
protéines, découverte
de médicaments
Musique MusicLM Formes d'ondes
Génération de
sonores de la
musique basée sur
musique enregistrée
des descriptions de
texte
Vidéo Gen1, Make-A-Video Vidéo annotée
Génération de clips
vidéo cohérents dans
le temps
Multimodal GPT-4 d'OpenAI -
Accepte à la fois les
entrées de texte et
d'image
Articles connexes
Arts de l'intelligence artificielle
Réseau antagoniste génératif
Transformateur génératif pré-entraîné
Grand modèle de langage