100% ont trouvé ce document utile (1 vote)

71 vues4 pages

RAG Python

Introduction RAG

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

100% ont trouvé ce document utile (1 vote)

71 vues4 pages

RAG Python

Introduction RAG

Transféré par

elyahfrisco7

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Système de Question-Réponse basé sur un

Document en Python
Votre Nom
November 14, 2024

Contents
1 Introduction 2

2 Étapes principales 2
2.1 Charger la leçon . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2 Indexer les passages . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2.1 Division du texte en segments . . . . . . . . . . . . . . . . 2
2.2.2 Création des embeddings . . . . . . . . . . . . . . . . . . 3
2.3 Faire des requêtes sur l’index . . . . . . . . . . . . . . . . . . . . 3
2.4 Générer la réponse . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3 IA Utilisées 4

4 Conclusion 4

1
1 Introduction
Ce document décrit les étapes nécessaires pour créer un système de question-
réponse basé sur un document en utilisant Python. Ce système extrait des
réponses d’un texte donné (par exemple, une leçon) en utilisant des modèles
de traitement du langage naturel (NLP) et des techniques de récupération
d’information.

2 Étapes principales
2.1 Charger la leçon
La première étape consiste à charger le texte ou le document sur lequel le système
répondra aux questions. Dans cet exemple, nous utilisons un court extrait de
texte pour démontrer le processus.

Charger la leçon

1 lecon = """
2 L ’ intelligence artificielle ( IA ) est la simulation de
processus d ’ intelligence humaine par des machines ,
3 surtout des s y s t m e s informatiques . Elle inclut l ’
apprentissage automatique , le traitement du langage
naturel ,
4 et la reconnaissance des formes .
5 """

2.2 Indexer les passages

Pour faciliter la recherche de réponses, le texte est divisé en segments appelés
passages, puis converti en vecteurs numériques (embeddings) pour permettre
une recherche rapide par similarité.

2.2.1 Division du texte en segments

Le texte est divisé en phrases en utilisant la bibliothèque nltk.

Division du texte en segments

1 import nltk
2

3 nltk . download ( ’ punkt ’)

4 passages = nltk . tokenize . sent_tokenize ( lecon )

2
2.2.2 Création des embeddings
Nous utilisons le modèle sentence-transformers/all-MiniLM-L6-v2 pour créer
des embeddings pour chaque passage.

Création des embeddings

1 from transformers import AutoTokenizer , AutoModel

2 import torch
3

4 model_name = " sentence - transformers / all - MiniLM - L6 - v2 "

5 tokenizer = AutoTokenizer . from_pretrained ( model_name )
6 model = AutoModel . from_pretrained ( model_name )
7

8 def embed_texts ( texts ) :

9 inputs = tokenizer ( texts , padding = True , truncation =
True , return_tensors = " pt " )
10 with torch . no_grad () :
11 embeddings = model (** inputs ) . last_hidden_state .
mean ( dim =1)
12 return embeddings . numpy ()
13

14 embeddings = embed_texts ( passages )

2.3 Faire des requêtes sur l’index

Avec les embeddings créés, nous utilisons la bibliothèque FAISS pour indexer
les passages et faciliter la recherche de similarités avec la question posée.

Indexation avec FAISS

1 import faiss
2

3 index = faiss . IndexFlatL2 ( embeddings . shape [1])

4 index . add ( embeddings )
5

6 def r e t r i e v e _ r e l e v a n t _ p a s s a g e s ( question , k =2) :

7 question_embedding = embed_texts ([ question ])
8 _ , indices = index . search ( question_embedding , k )
9 return [ passages [ idx ] for idx in indices [0]]

2.4 Générer la réponse

Pour générer une réponse en fonction des passages les plus pertinents, nous
combinons ces passages en un seul contexte et utilisons un modèle de question-
réponse.

3
Générer la réponse avec un modèle de question-réponse

1 from transformers import pipeline

3 qa_pipeline = pipeline ( " question - answering " , model = "

deepset / roberta - base - squad2 " )
4

5 def answer_question ( question ) :

6 relevant_passages = r e t r i e v e _ r e l e v a n t _ p a s s a g e s (
question )
7 context = " " . join ( relevant_passages )
8 result = qa_pipeline ( question = question , context =
context )
9 return result [ ’ answer ’]
10

11 question = " Qu ’est - ce que l ’ intelligence artificielle ?

"
12 print ( " Question : " , question )
13 print ( " R p o n s e : " , answer_question ( question ) )

3 IA Utilisées
• Modèle d’embedding : Utilisé pour transformer chaque passage en
vecteur numérique.
• FAISS : Permet une recherche rapide et efficace des passages pertinents
en fonction des embeddings.

• Modèle de question-réponse : Utilisé pour générer des réponses basées

sur le contexte extrait.

4 Conclusion
En utilisant ces étapes, nous avons créé un système de question-réponse capable
d’extraire des informations spécifiques d’un document. Cette approche combine
le traitement du langage naturel avec des techniques de recherche d’information
pour fournir des réponses précises en fonction du contexte.

Vous aimerez peut-être aussi

NLP 6
Pas encore d'évaluation
NLP 6
5 pages
IA API Evolutive Vocale
Pas encore d'évaluation
IA API Evolutive Vocale
4 pages
Ia Personnelle
Pas encore d'évaluation
Ia Personnelle
8 pages
B08KRRPG1Q
Pas encore d'évaluation
B08KRRPG1Q
216 pages
Purple White Modern Artificial Intelligence Presentation 1
Pas encore d'évaluation
Purple White Modern Artificial Intelligence Presentation 1
32 pages
TP2 RS Ic
Pas encore d'évaluation
TP2 RS Ic
2 pages
Chatbot IA : Automatisation et Modélisation
Pas encore d'évaluation
Chatbot IA : Automatisation et Modélisation
2 pages
Cours IA - Seance2
Pas encore d'évaluation
Cours IA - Seance2
53 pages
Ingénierie des Prompts en IA
Pas encore d'évaluation
Ingénierie des Prompts en IA
58 pages
Web Sémantique et NLP en Python
Pas encore d'évaluation
Web Sémantique et NLP en Python
16 pages
Résumé NLP
Pas encore d'évaluation
Résumé NLP
4 pages
Projet ML 1
Pas encore d'évaluation
Projet ML 1
8 pages
Au Coeur Des LLM, Sans Les Maths-1
Pas encore d'évaluation
Au Coeur Des LLM, Sans Les Maths-1
19 pages
Fake News Detection
Pas encore d'évaluation
Fake News Detection
51 pages
Poo Proje
Pas encore d'évaluation
Poo Proje
5 pages
Gen Ai - Multi Mofdal Rag Enset
Pas encore d'évaluation
Gen Ai - Multi Mofdal Rag Enset
191 pages
L'Art Du Prompt Engineering - Vincent ASANI
Pas encore d'évaluation
L'Art Du Prompt Engineering - Vincent ASANI
20 pages
Travail - Note
Pas encore d'évaluation
Travail - Note
4 pages
NLTK FR
Pas encore d'évaluation
NLTK FR
16 pages
1) Introduction À Intelligence Artificielle - 20 - 09
Pas encore d'évaluation
1) Introduction À Intelligence Artificielle - 20 - 09
8 pages
Python Reseau Neuronal
Pas encore d'évaluation
Python Reseau Neuronal
10 pages
BERT
Pas encore d'évaluation
BERT
19 pages
Introduction à l'Intelligence Artificielle
Pas encore d'évaluation
Introduction à l'Intelligence Artificielle
23 pages
Corr Exm TALN 23-24
Pas encore d'évaluation
Corr Exm TALN 23-24
6 pages
Digital Huamnities Synthesis
Pas encore d'évaluation
Digital Huamnities Synthesis
3 pages
Document 10
Pas encore d'évaluation
Document 10
7 pages
Introduction à l'Intelligence Artificielle
Pas encore d'évaluation
Introduction à l'Intelligence Artificielle
54 pages
TP1 Compréhension Et Préparation Des Données
Pas encore d'évaluation
TP1 Compréhension Et Préparation Des Données
5 pages
TPE SIA 417 Version 1.0
Pas encore d'évaluation
TPE SIA 417 Version 1.0
28 pages
2024 01 11 Ia Gen Merit Vincent Guigue
Pas encore d'évaluation
2024 01 11 Ia Gen Merit Vincent Guigue
121 pages
Memoire David Krame Kadurha (Ulpgl 2021-2022)
Pas encore d'évaluation
Memoire David Krame Kadurha (Ulpgl 2021-2022)
142 pages
Cours Jour 03
Pas encore d'évaluation
Cours Jour 03
10 pages
Le Guide Du Prompt Engineering Pour ChatGPT Ou N'importe Quel Chatbot
Pas encore d'évaluation
Le Guide Du Prompt Engineering Pour ChatGPT Ou N'importe Quel Chatbot
8 pages
Naili
Pas encore d'évaluation
Naili
5 pages
Chat GPT
Pas encore d'évaluation
Chat GPT
31 pages
Stress Technique
Pas encore d'évaluation
Stress Technique
3 pages
Séance 1: Introduction À l'IA Et Aux Concepts de Base
Pas encore d'évaluation
Séance 1: Introduction À l'IA Et Aux Concepts de Base
17 pages
NLP Pres
Pas encore d'évaluation
NLP Pres
6 pages
Rapport
Pas encore d'évaluation
Rapport
30 pages
Intelligence Artificiell1
Pas encore d'évaluation
Intelligence Artificiell1
7 pages
Chapitre - 01 - Notions de Base Sur L IA
Pas encore d'évaluation
Chapitre - 01 - Notions de Base Sur L IA
6 pages
Optimiser les Prompts pour LLMs
Pas encore d'évaluation
Optimiser les Prompts pour LLMs
2 pages
Mise en Place de L'environnemnt Python For Deep Learning
Pas encore d'évaluation
Mise en Place de L'environnemnt Python For Deep Learning
6 pages
IA pour l'autonomie des seniors
Pas encore d'évaluation
IA pour l'autonomie des seniors
9 pages
BERT : De l'NLP à l'IA Générative
Pas encore d'évaluation
BERT : De l'NLP à l'IA Générative
15 pages
Sortie
Pas encore d'évaluation
Sortie
21 pages
Formation IA Travaux - PPT V2
Pas encore d'évaluation
Formation IA Travaux - PPT V2
21 pages
Séquence 4 - Lintelligence Artificielle VF
Pas encore d'évaluation
Séquence 4 - Lintelligence Artificielle VF
37 pages
Examen TALN Master ESI 2022/2023
Pas encore d'évaluation
Examen TALN Master ESI 2022/2023
3 pages
Complet Machine Learning Course
Pas encore d'évaluation
Complet Machine Learning Course
877 pages
Mathématiques et Sémantique Textuelle
Pas encore d'évaluation
Mathématiques et Sémantique Textuelle
3 pages
Reconnaissance Chiffre
Pas encore d'évaluation
Reconnaissance Chiffre
5 pages
Projet Métier PlagiaScope
Pas encore d'évaluation
Projet Métier PlagiaScope
38 pages
Introduction à la Recherche d'Information
Pas encore d'évaluation
Introduction à la Recherche d'Information
7 pages
IA ML SEIOT Partie1
Pas encore d'évaluation
IA ML SEIOT Partie1
95 pages
TD4-search-algos - 2017
Pas encore d'évaluation
TD4-search-algos - 2017
3 pages
Article Sécurité Des LLM
Pas encore d'évaluation
Article Sécurité Des LLM
7 pages
Rapport IA
Pas encore d'évaluation
Rapport IA
6 pages
Document Sans Titre
Pas encore d'évaluation
Document Sans Titre
9 pages
Tips Pour Bien Debuger
Pas encore d'évaluation
Tips Pour Bien Debuger
3 pages
Spread Operator
Pas encore d'évaluation
Spread Operator
3 pages
Guide D'analyse Détaillé Pour Les Projets de Digitalisation
Pas encore d'évaluation
Guide D'analyse Détaillé Pour Les Projets de Digitalisation
12 pages
Test en Ingénierie Logiciel
Pas encore d'évaluation
Test en Ingénierie Logiciel
4 pages
Pédagogique Active
Pas encore d'évaluation
Pédagogique Active
6 pages
Créer Une Marque Personnelle
Pas encore d'évaluation
Créer Une Marque Personnelle
3 pages
Paradigme de La Progmmation
Pas encore d'évaluation
Paradigme de La Progmmation
11 pages
Sécuriser Laravel : Gestion des failles
Pas encore d'évaluation
Sécuriser Laravel : Gestion des failles
4 pages
Introduction Aux Bases de Donnees Relationnelles
Pas encore d'évaluation
Introduction Aux Bases de Donnees Relationnelles
11 pages
Guide Du Débutant en Freelance
100% (1)
Guide Du Débutant en Freelance
2 pages
Paradigmes de Programmation Décryptés
Pas encore d'évaluation
Paradigmes de Programmation Décryptés
5 pages
Apprentissage Adaptatif
Pas encore d'évaluation
Apprentissage Adaptatif
2 pages
تقنيات التعبير
Pas encore d'évaluation
تقنيات التعبير
9 pages
IA Générative
Pas encore d'évaluation
IA Générative
4 pages
Téléchargement
Pas encore d'évaluation
Téléchargement
6 pages
Introduction à l'Intelligence Artificielle
Pas encore d'évaluation
Introduction à l'Intelligence Artificielle
3 pages
Conception de Niveau en Jeux Vidéo
Pas encore d'évaluation
Conception de Niveau en Jeux Vidéo
14 pages
En Attendant Les Robots Enquête Sur Le Travail Du Clic
0% (1)
En Attendant Les Robots Enquête Sur Le Travail Du Clic
38 pages
Syllabus+Data+Scientist+ +DataScientest+ (FR)
Pas encore d'évaluation
Syllabus+Data+Scientist+ +DataScientest+ (FR)
36 pages
Rapport 1
Pas encore d'évaluation
Rapport 1
6 pages
Analyse Prédictive Dans Les Prévisions Financières
Pas encore d'évaluation
Analyse Prédictive Dans Les Prévisions Financières
8 pages
Chapitre 01
Pas encore d'évaluation
Chapitre 01
26 pages
Chapitre 3 Sources Détaillées
Pas encore d'évaluation
Chapitre 3 Sources Détaillées
12 pages
Examen Normalisé Français 6AEP 2024
Pas encore d'évaluation
Examen Normalisé Français 6AEP 2024
6 pages
Programme détaillé 3e cycle créole
Pas encore d'évaluation
Programme détaillé 3e cycle créole
87 pages
Topcomputing-Livre Blanc
Pas encore d'évaluation
Topcomputing-Livre Blanc
18 pages
Changement Organisationnel Et Performance de L'organisation
Pas encore d'évaluation
Changement Organisationnel Et Performance de L'organisation
19 pages
Percept Ron
Pas encore d'évaluation
Percept Ron
33 pages
Chapitre Intoductif
Pas encore d'évaluation
Chapitre Intoductif
60 pages
Colloque IA Et Pratiques Manageriales en Afrique1 6888a30bf0c87
Pas encore d'évaluation
Colloque IA Et Pratiques Manageriales en Afrique1 6888a30bf0c87
5 pages
Spark ML: Réalisé Par: Sadok Guermazi Amina Boukhdhir
Pas encore d'évaluation
Spark ML: Réalisé Par: Sadok Guermazi Amina Boukhdhir
21 pages
Rapport de Stage
Pas encore d'évaluation
Rapport de Stage
14 pages
Les Agents Logiciels
Pas encore d'évaluation
Les Agents Logiciels
29 pages
Introduction de Memoire
Pas encore d'évaluation
Introduction de Memoire
4 pages
UrbaEA2017 Data Governance 2.1 Version Publique
Pas encore d'évaluation
UrbaEA2017 Data Governance 2.1 Version Publique
49 pages
Secteurs Porteurs Pour L'avenir en Afrique
Pas encore d'évaluation
Secteurs Porteurs Pour L'avenir en Afrique
4 pages
Memoire RAG Malgache
Pas encore d'évaluation
Memoire RAG Malgache
14 pages
examenIAMRSession1 Exemple1
0% (1)
examenIAMRSession1 Exemple1
2 pages
Hutzli Vanissla Final Juin
Pas encore d'évaluation
Hutzli Vanissla Final Juin
88 pages
Guide - Intelligence Artificielle Et Droit e FR
Pas encore d'évaluation
Guide - Intelligence Artificielle Et Droit e FR
22 pages