Module : Culture digitale
Intelligence
artificielle
générative
Réalisé par : ERRAHA REDA
Encadré par : Pr. Khalid Kandali
Année Universitaire 2024 – 2025
Table des matières
1. Définition ......................................................................................................................................... 1
2. Applications de l'IA Générative ........................................................................................................ 1
3. Modalités ......................................................................................................................................... 2
4. Articles connexes ............................................................................................................................. 5
IA générative
1. Définition
L'intelligence artificielle générative ou IA générative (ou GenAI) est un type de système
d'intelligence artificielle (IA) capable de générer du texte, des images ou d'autres médias en
réponse à des invites (ou prompts en anglais). Les modèles génératifs apprennent les modèles
et la structure des données d'entrée, puis génèrent un nouveau contenu similaire aux
données d'apprentissage mais avec un certain degré de nouveauté (plutôt que de simplement
classer ou prédire les données) 1.
L'IA générative peut être unimodale ou multimodale ; les systèmes unimodaux n'acceptent
qu'un seul type d'entrée (par exemple, du texte), tandis que les systèmes multimodaux
peuvent accepter plusieurs types d'entrée (par exemple, du texte et des images).
Les cadres les plus importants pour aborder l'IA générative comprennent les réseaux
antagonistes génératifs (GAN) et les transformateurs génératifs pré-entraînés (GPT)2. Les GAN
se composent de deux parties : un réseau générateur qui crée de nouveaux échantillons de
données et un réseau discriminateur qui évalue si les échantillons sont réels ou faux. Les deux
réseaux sont formés ensemble dans le cadre d'un processus concurrentiel, le réseau
générateur essayant continuellement de produire des échantillons de meilleure qualité et
plus réalistes, tandis que le réseau discriminateur s'efforce d'identifier avec précision les faux
échantillons. Les GPT sont des réseaux de neurones artificiels fondés sur l'architecture du
transformateur, pré-entraînés sur de grands ensembles de données de texte non étiqueté et
capables de générer un nouveau texte de type humain3. Ils utilisent de grands modèles de
langage (abrégés LLM, pour large language model) pour produire des données fondées sur
l'ensemble de données d'entraînement qui a été utilisé pour les créer.
2. Applications de l'IA Générative
L'IA générative a de nombreuses applications potentielles, notamment dans des domaines
créatifs tels que l'art, la musique et l'écriture, ainsi que dans des domaines tels que les soins
1« Artificial Intelligence Glossary: Neural Networks and Other Terms Explained », The New York Times, 27 mars 2023 consulté le
22 avril 2023)
2 [Link]
3 [Link]
1 Année universitaire 2023-2024
IA générative
de santé, la finance et les jeux. Cependant, il existe également des inquiétudes quant à
l'utilisation abusive potentielle de l'IA générative, par exemple dans la création de fausses
nouvelles (fake news en anglais) ou de deepfakes, qui peuvent être utilisées pour tromper ou
manipuler les gens4.
Les systèmes d'IA génératifs notables incluent ChatGPT (et sa variante Bing Chat), un
chatbot (agent conversationnel programmable) construit par OpenAI à l'aide de ses grands
modèles de langage fondateurs GPT-3 et GPT-4, et Bard, un chatbot construit par Google à
l'aide de son modèle fondateur LaMDA. D'autres modèles d'IA générative incluent des
systèmes artistiques d'intelligence artificielle tels que Stable Diffusion, Midjourney et DALL-
E5.
L'IA générative a des applications potentielles dans un large domaine d'industries, parmi
lesquelles le développement de logiciels, le marketing et la mode. L'investissement dans l'IA
générative bondit au début des années 2020, avec de grandes entreprises telles que
Microsoft, Google et Baidu ainsi que de nombreuses petites entreprises développant des
modèles d'IA générative6.
3. Modalités
Un système d'IA générative est construit en appliquant un apprentissage automatique non
supervisé ou auto-supervisé à un ensemble de données. Les capacités d'un système d'IA
générative dépendent de la modalité ou du type d'ensemble de données utilisé.
Texte : les systèmes d'IA générative formés sur des mots ou des jetons de mots
(tokens) incluent GPT-3, LaMDA, LLaMA, BLOOM, GPT-4 et d'autres. Ils sont capables
de traiter du langage naturel, de faire de la traduction automatique et de générer du
langage naturel et peuvent être utilisés comme modèles de base pour d'autres tâches.
Les principaux ensembles de données sont BookCorpus, Wikipédia et d'autres.
4 « Risques de cybersécurité liés à l'IA générative » [archive], sur [Link], 26 juillet 2023 (consulté le 27 août 2023)
5 Roose, « A Coming-Out Party for Generative A.I., Silicon Valley's New Craze » [archive], The New York Times, 21 octobre 2022
(consulté le 14 mars 2023)
6 Yang et Gokturk, « Google Cloud brings generative AI to developers, businesses, and governments » [archive], 14 mars 2023
2 Année universitaire 2023-2024
IA générative
Code : Outre les textes en langage naturel, de grands modèles de langage peuvent
être entraînés sur du texte en langage de programmation, ce qui leur permet de
générer du code source de nouveaux programmes informatiques.
Images : Les systèmes d'IA générative formés sur
des ensembles d'images avec des légendes
textuelles comprennent Imagen, DALL-E,
Midjourney, Stable Diffusion et autres. Ils sont
couramment utilisés pour la génération de texte en
image et le transfert de style neuronal7. Les jeux de
données sont notamment LAION-5B et d'autres.
Molécules : Les systèmes d'IA générative peuvent être entraînés sur des séquences
d'acides aminés ou des représentations moléculaires telles que SMILES représentant
l'ADN ou les protéines. Ces systèmes, comme AlphaFold, sont utilisés pour la
prédiction de la structure des protéines et la découverte de médicaments. Les
ensembles de données comprennent divers ensembles de données biologiques.
Musique : les systèmes d'IA générative tels que MusicLM peuvent être formés sur les
formes d'ondes sonores de la musique enregistrée avec des annotations textuelles
afin de générer de nouveaux échantillons musicaux fondés sur des descriptions de
texte telles qu'« une mélodie de violon apaisante soutenue par un riff de guitare
distordu ».
Vidéo : L'IA générative entraînée sur une vidéo annotée peut générer des clips vidéo
cohérents dans le temps. Des IA comme Gen1 par RunwayML19 et Make-A-Video de
Meta20 peuvent générer des vidéos de cette manière.
Multimodal : un système d'IA générative peut être construit à partir de plusieurs
modèles génératifs, ou d'un modèle entraîné sur plusieurs types de données. Par
7 Aditya Ramesh et Mikhail Pavlov « Zero-shot text-to-image generation » (2021)
— « (ibid.) », dans International Conference on Machine Learning, PMLR, p. 8821–883
3 Année universitaire 2023-2024
IA générative
Exemple, une version du GPT-4 d'OpenAI accepte à la fois les entrées de texte et
d'image8.
Modalité Exemples de Capacités Ensembles de
systèmes IA données
générative
Texte GPT-3, LaMDA, Traitement du BookCorpus,
LLaMA, BLOOM, GPT- langage naturel, Wikipédia, etc.
traduction,
4, etc.
génération de texte
Code Grands modèles de Génération de code Texte en langage de
langage source programmation
Images Imagen, DALL-E, Génération de texte LAION-5B, etc.
Midjourney, Stable en image, transfert de
Diffusion, etc. style
Molécules AlphaFold Prédiction de la Ensembles de
structure des données biologiques
protéines, découverte
de médicaments
Musique MusicLM Génération de Formes d'ondes
musique basée sur sonores de la
des descriptions de musique enregistrée
texte
8 « Explainer: What is Generative AI, the technology behind OpenAI's ChatGPT? », Reuters, 17 mars 2023 (lire en ligne [archive],
consulté le 17 mars 2023)
4 Année universitaire 2023-2024
IA générative
Vidéo Gen1, Make-A-Video Génération de clips Vidéo annotée
vidéo cohérents dans
le temps
Multimodal GPT-4 d'OpenAI Accepte à la fois les -
entrées de texte et
d'image
4. Articles connexes
Arts de l'intelligence artificielle
Réseau antagoniste génératif
Transformateur génératif pré-entraîné
Grand modèle de langage
5 Année universitaire 2023-2024