0% ont trouvé ce document utile (0 vote)

160 vues20 pages

Large Language Models

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

160 vues20 pages

Large Language Models

Transféré par

tsidy miboela

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Les Large

language
models (LLM)

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Qu’est-ce qu’un LLM ?

Un LLM est un modèle d’intelligence

artificielle capable de comprendre
et générer du texte en langage
naturel

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Une banque de connaissances
Les LLM sont entraînés sur des
milliards de mots pour apprendre à
prédire et générer du texte cohérent

Revue de presse,
Données du Web
papiers scientifiques

Livres (Corpus Autres documentations

littéraires et (données multilingues,
éducatifs, etc.) structures, etc.)

LLM

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Comment ça fonctionne ?

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Tout commence avec
les tokens

Le LLM décompose une phrase en

tokens

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Les tokens deviennent
des vecteurs
Chaque token est traduit en un
vecteur numérique, une "empreinte"
que le modèle peut manipuler.

{
'text': 'Il a battu l\'électricien en le mettant à terre’,
'vector': [0.34, -1.02, 0.34, 1.2, ..., 1.14, -0.03]
}

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Le LLM calcule la probabilité
d’apparition du prochain mot

Le modèle analyse les vecteurs pour

estimer les mots les plus probables
à venir

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Du coup le modèle choisit
toujours le mot le plus
probable ?
Non ! Le choix est influencé par la
« Température »

Plus la température est basse, plus

le modèle choisira un mot probable.

Plus elle est élevée, plus le modèle

sera créatif et choisira des options
variées et moins évidentes

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Pour être à 100% sûr du mot à
venir :

Le modèle prend aussi en compte le

contexte grâce au mécanisme
d’attention.

Ce qui lui permet d’identifier les

mots importants dans une phrase
pour ajuster ses prédictions

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Prenons un exemple
concret

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
1 Départ : "La pluie tombe..."

L’IA commence par analyser les

tokens :

Tokens Characters
5 14

La pluie tombe

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
2 Calcul des probabilités

Elle prévoit :

1) "doucement" : 60%

2) "fortement" : 30%

3) "bruyamment" : 10%.

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
3 Mécanisme d’attention

L’IA attribue un poids à chaque

mot précédent.

Ici, "tombe" influence fortement

le choix, car il est directement lié
au contexte.

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
4 Choix du mot suivant

Avec une température basse, elle

choisira « doucement » (60%).

Avec une température haute, elle

pourrait choisir « fortement »
(30%) ou « bruyamment » (10%)

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
5 Ajout d’un nouveau mot

La phrase devient "La pluie

tombe doucement..." et le
processus recommence pour
prédire la suite

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
5 Résultat final

Après plusieurs itérations, l’IA

produit :

"La pluie tombe doucement sur

les toits en ardoise."

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Les limites des LLM

Les résultats ne sont pas toujours

bons, l’IA peut inventer des
informations.

➔ On appelle ça les hallucinations

Cela est dû à des biais dans les

données qui sont imparfaites

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Finalement, tout est une
question de données
Plus les données seront de qualité, plus le
LLM sera performant

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Pour aller plus loin
Je vous recommande cette vidéo où
l’ancienne CTO d’Open AI et le
fondateur de Runway explique
comment fonctionne un LLM

How Chatbots and Large Language Models work

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis
Vous avez
trouvé ça utile ?

Likez Commentez Partagez

Et suivez-moi pour ne
pas louper la suite

Edouard Willemsen
Formateur et Chef de projet IA

C1 - Public Natixis

Vous aimerez peut-être aussi

0 Sommaire Cours NLP Master2 de Mila 2023
Pas encore d'évaluation
0 Sommaire Cours NLP Master2 de Mila 2023
3 pages
Formation IA : Éviter le Formatage par l'IA
Pas encore d'évaluation
Formation IA : Éviter le Formatage par l'IA
110 pages
Introduction à JUnit pour tests Java
Pas encore d'évaluation
Introduction à JUnit pour tests Java
43 pages
Modélisation de la Programmation Linéaire
Pas encore d'évaluation
Modélisation de la Programmation Linéaire
15 pages
Analyse Et Conception Des Systèmes D'information - V. Rajaraman
Pas encore d'évaluation
Analyse Et Conception Des Systèmes D'information - V. Rajaraman
20 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
139 pages
Programmation Concurrente Java
Pas encore d'évaluation
Programmation Concurrente Java
97 pages
Struts en PDF et Java
100% (1)
Struts en PDF et Java
34 pages
Emmanuel Jakobowicz Python Pour Le Data Scientist Des Bases Du Langage Au Machine Learning 2018
Pas encore d'évaluation
Emmanuel Jakobowicz Python Pour Le Data Scientist Des Bases Du Langage Au Machine Learning 2018
304 pages
Quiz Programmation Web USTHB
Pas encore d'évaluation
Quiz Programmation Web USTHB
8 pages
Générateur MGEN : Tests de Trafic Réseau
Pas encore d'évaluation
Générateur MGEN : Tests de Trafic Réseau
18 pages
Threads et Programmation Android
Pas encore d'évaluation
Threads et Programmation Android
38 pages
Introduction à la cryptographie et algorithmes
Pas encore d'évaluation
Introduction à la cryptographie et algorithmes
46 pages
SR-Chapitre 1
Pas encore d'évaluation
SR-Chapitre 1
45 pages
TD SD DA2I - Exclusion Mutuelle PDF
Pas encore d'évaluation
TD SD DA2I - Exclusion Mutuelle PDF
1 page
Intergiciels et communication à distance
Pas encore d'évaluation
Intergiciels et communication à distance
65 pages
Cha Crypto Introdction-Corrigé
0% (1)
Cha Crypto Introdction-Corrigé
68 pages
Reseaux Du Futur IA Dans Les Reseaux Janv2020
Pas encore d'évaluation
Reseaux Du Futur IA Dans Les Reseaux Janv2020
12 pages
Sécurité Informatique pour Étudiants
Pas encore d'évaluation
Sécurité Informatique pour Étudiants
20 pages
Cours Sur Les Fondements de L'IA en Master 2
Pas encore d'évaluation
Cours Sur Les Fondements de L'IA en Master 2
5 pages
Chapitre 2
100% (1)
Chapitre 2
12 pages
INF5171 Programmation Concurrente Et Parallèle Notes de Cours. Guy Tremblay
Pas encore d'évaluation
INF5171 Programmation Concurrente Et Parallèle Notes de Cours. Guy Tremblay
480 pages
Modèle Entité-Association en BDD
Pas encore d'évaluation
Modèle Entité-Association en BDD
22 pages
Introduction à l'Algorithmique Objet
100% (1)
Introduction à l'Algorithmique Objet
103 pages
Introduction Aux Technologies Web
Pas encore d'évaluation
Introduction Aux Technologies Web
54 pages
Glo-4000 A14 87249
100% (1)
Glo-4000 A14 87249
14 pages
Introduction aux systèmes de gestion de contenu
Pas encore d'évaluation
Introduction aux systèmes de gestion de contenu
6 pages
Partie 1 LPWAN Et IoRa
Pas encore d'évaluation
Partie 1 LPWAN Et IoRa
9 pages
Approche Agile - Gestion de Version Et Qualité Du Code
Pas encore d'évaluation
Approche Agile - Gestion de Version Et Qualité Du Code
84 pages
Cours Arch v2
Pas encore d'évaluation
Cours Arch v2
84 pages
Developpement Mobile Chap1
Pas encore d'évaluation
Developpement Mobile Chap1
44 pages
TP1: Python et Machine Learning
Pas encore d'évaluation
TP1: Python et Machine Learning
2 pages
"Le Futur du Web : Sémantique et IA"
Pas encore d'évaluation
"Le Futur du Web : Sémantique et IA"
30 pages
Formation sur le Framework .NET Core
Pas encore d'évaluation
Formation sur le Framework .NET Core
10 pages
Comparaison ML et DL en IA
Pas encore d'évaluation
Comparaison ML et DL en IA
1 page
Programmation Parallèle Haute Performance PDF
Pas encore d'évaluation
Programmation Parallèle Haute Performance PDF
795 pages
Intégration d'Applications d'Entreprise
Pas encore d'évaluation
Intégration d'Applications d'Entreprise
65 pages
Introduction aux Réseaux de Neurones
Pas encore d'évaluation
Introduction aux Réseaux de Neurones
13 pages
Cours-Reseaux-Generalites Partie2
Pas encore d'évaluation
Cours-Reseaux-Generalites Partie2
21 pages
Les Reseax D'entreprise Par La Pratique PDF
Pas encore d'évaluation
Les Reseax D'entreprise Par La Pratique PDF
577 pages
Gestion des Threads en Informatique
Pas encore d'évaluation
Gestion des Threads en Informatique
7 pages
Examen Apprentissage - Profond
Pas encore d'évaluation
Examen Apprentissage - Profond
3 pages
Introduction aux Compilateurs et Analyse Lexicale
0% (1)
Introduction aux Compilateurs et Analyse Lexicale
48 pages
Chapitre 3 - Diagrammes de Séquences
Pas encore d'évaluation
Chapitre 3 - Diagrammes de Séquences
35 pages
Gestion des processus sous Linux
Pas encore d'évaluation
Gestion des processus sous Linux
18 pages
CoursLangageAssembleur (P1)
Pas encore d'évaluation
CoursLangageAssembleur (P1)
31 pages
Guide Complet sur l'Administration Réseaux
Pas encore d'évaluation
Guide Complet sur l'Administration Réseaux
40 pages
Grammaire Anglaise: Structure et Phrases
Pas encore d'évaluation
Grammaire Anglaise: Structure et Phrases
5 pages
Technologie Des Supports
Pas encore d'évaluation
Technologie Des Supports
52 pages
TP 6 - Gestion Fichiers - (Correction)
Pas encore d'évaluation
TP 6 - Gestion Fichiers - (Correction)
7 pages
Initiation à OpenERP pour la gestion d'entreprise
Pas encore d'évaluation
Initiation à OpenERP pour la gestion d'entreprise
8 pages
? 60 Exercices Corrigés en Python & POO??
Pas encore d'évaluation
? 60 Exercices Corrigés en Python & POO??
22 pages
Rapport PFE Taha Mesrati
Pas encore d'évaluation
Rapport PFE Taha Mesrati
84 pages
Master en Systèmes d'Information et Génie Logiciel
Pas encore d'évaluation
Master en Systèmes d'Information et Génie Logiciel
43 pages
Cours Datawarehouse 2009-2010
0% (1)
Cours Datawarehouse 2009-2010
17 pages
Lexique IA Explique
Pas encore d'évaluation
Lexique IA Explique
19 pages
Guide Formation IA & Prompt Engineering
Pas encore d'évaluation
Guide Formation IA & Prompt Engineering
32 pages
LLM Presentation
Pas encore d'évaluation
LLM Presentation
20 pages
AI & LLM - LLM (Qu'est-Ce Qu'un Grand Modèle de Langage)
Pas encore d'évaluation
AI & LLM - LLM (Qu'est-Ce Qu'un Grand Modèle de Langage)
5 pages
Guide IA
Pas encore d'évaluation
Guide IA
11 pages
Présentation de La Filièr1
100% (1)
Présentation de La Filièr1
23 pages
Présentation de La Formation
Pas encore d'évaluation
Présentation de La Formation
2 pages
Exercices sur les polynômes et leurs racines
Pas encore d'évaluation
Exercices sur les polynômes et leurs racines
1 page
Étude des sons en français pour enfants
Pas encore d'évaluation
Étude des sons en français pour enfants
10 pages
TD sur l'ordonnancement en temps réel
0% (1)
TD sur l'ordonnancement en temps réel
3 pages
5-Ingénieur FISE-2024-08-02
Pas encore d'évaluation
5-Ingénieur FISE-2024-08-02
1 page
Introduction à la recherche opérationnelle
Pas encore d'évaluation
Introduction à la recherche opérationnelle
102 pages
DMG TT140
Pas encore d'évaluation
DMG TT140
16 pages
Contrats Commerciaux en Français Et en Anglai
83% (6)
Contrats Commerciaux en Français Et en Anglai
334 pages
Atelier Bennis Hive
Pas encore d'évaluation
Atelier Bennis Hive
2 pages
Montpellier 4
100% (5)
Montpellier 4
12 pages
Tri et Recherche en C : TP Algorithmique
Pas encore d'évaluation
Tri et Recherche en C : TP Algorithmique
3 pages
L'Impact de La Communication Digitale Sur La Gestion de La Relation Client
Pas encore d'évaluation
L'Impact de La Communication Digitale Sur La Gestion de La Relation Client
107 pages
Institutions et Marchés Financiers ECN-1030
Pas encore d'évaluation
Institutions et Marchés Financiers ECN-1030
10 pages
Pe Base de Données
Pas encore d'évaluation
Pe Base de Données
1 page
Rapport Data Science
100% (1)
Rapport Data Science
5 pages
Installation de Vagrant sur CentOS 7
Pas encore d'évaluation
Installation de Vagrant sur CentOS 7
2 pages
Compte Rendu TP 2 Linux
100% (1)
Compte Rendu TP 2 Linux
10 pages
Étude Et Automatisation D'un Ascenseur À Usage D'habitation R+8
100% (1)
Étude Et Automatisation D'un Ascenseur À Usage D'habitation R+8
163 pages
Commande Floue d'un Robot Équilibriste
Pas encore d'évaluation
Commande Floue d'un Robot Équilibriste
80 pages
Programmation Lineaire
Pas encore d'évaluation
Programmation Lineaire
6 pages
BDSaS 2015 - 2016 PDF
Pas encore d'évaluation
BDSaS 2015 - 2016 PDF
1 page
Chapitre 1 Introduction Générale Sur La Gestion Budgetaire
Pas encore d'évaluation
Chapitre 1 Introduction Générale Sur La Gestion Budgetaire
4 pages
4 Bigdata-2024 Traduit
Pas encore d'évaluation
4 Bigdata-2024 Traduit
9 pages
Urbanisation Des Si
Pas encore d'évaluation
Urbanisation Des Si
8 pages
Examen sur les principes des réseaux
Pas encore d'évaluation
Examen sur les principes des réseaux
3 pages
Kajoor au XIXe : Pouvoir et Colonisation
Pas encore d'évaluation
Kajoor au XIXe : Pouvoir et Colonisation
2 pages
Manuel D'utilisation de La Machine À Crème Glacée
Pas encore d'évaluation
Manuel D'utilisation de La Machine À Crème Glacée
16 pages
Droit des TIC et vie privée : Guide complet
Pas encore d'évaluation
Droit des TIC et vie privée : Guide complet
22 pages