Qu'est-ce que la génération augmentée par récupération (RAG) dans l'IA ?

Rédigé par

Sarah Chudleigh

Chercheur et responsable du contenu IA

Table des matières

Qu'est-ce que la génération assistée par récupération ?

Exemples de cas d'utilisation des RAG

Avantages du RAG

Comment fonctionne le RAG ?

Fonctionnalités avancées du RAG

Créer un agent RAG AI personnalisé

FAQ

Résumé

RAG combine l'extraction de données fiables avec la génération de LLM , ce qui garantit que les réponses de l'IA sont précises, pertinentes et fondées sur des connaissances commerciales réelles.
Contrairement aux LLMs purs, RAG réduit les hallucinations en ancrant les réponses dans des documents spécifiques, des bases de données ou des contenus approuvés.
RAG prend en charge les informations actualisées, ce qui permet aux systèmes d'intelligence artificielle de répondre à des questions sur des changements récents ou des sujets de niche au-delà des données d'apprentissage statiques d'un LLM.
La maintenance d'un système RAG implique de conserver des données fraîches, de contrôler les résultats et d'affiner les méthodes d'extraction pour obtenir les meilleures performances au fil du temps.

RAG permet aux organisations de mettre l'IA au travail - avec moins de risques que l'utilisation traditionnelle de LLM .

La génération augmentée par récupération devient de plus en plus populaire à mesure que de plus en plus d'entreprises introduisent des solutions d'IA. Les premiers chatbots d'entreprise ont connu des erreurs risquées et des hallucinations.

RAG permet aux entreprises d'exploiter la puissance de LLMs tout en ancrant les résultats génératifs dans leur connaissance spécifique de l'entreprise.

Construire l'IA Chatbots

Créer des chatbots personnalisés

Commencer maintenant

Qu'est-ce que la génération assistée par récupération ?

Dans le domaine de l'IA, la génération augmentée par récupération (RAG) est une technique qui combine a) la récupération d'informations externes pertinentes et b) des réponses générées par l'IA, améliorant ainsi la précision et la pertinence.

La génération augmentée par récupération est une combinaison de la récupération et de la génération.

Au lieu de s'appuyer sur la génération de grands modèles de langage (LLMs), les réponses des modèles RAG s'appuient sur des bases de connaissances dictées par l'agent IA créateur - comme la page web d'une entreprise ou un document sur la politique des ressources humaines.

Le RAG fonctionne en deux étapes principales :

1. Récupération

Le modèle recherche et récupère des données pertinentes à partir de sources structurées ou non structurées (par exemple, des bases de données, des PDF, des fichiers HTML ou d'autres documents). Ces sources peuvent être structurées (par exemple, des tableaux) ou non structurées (par exemple, des sites web approuvés).

2. Génération

Une fois extraites, les informations sont introduites dans le site LLM. Le site LLM utilise les informations pour générer une réponse en langage naturel, en combinant les données approuvées avec ses propres capacités linguistiques pour créer des réponses précises, semblables à celles d'un être humain et conformes à la marque.

Exemples de cas d'utilisation des RAG

Quel est l'intérêt du RAG ? Il permet aux organisations de fournir des résultats pertinents, informatifs et exacts.

Le RAG est un moyen direct de réduire le risque de résultats imprécis ou d'hallucinations sur le site LLM .

Exemple 1 : Cabinet d'avocats

Un cabinet d'avocats peut utiliser un RAG dans un système d'IA pour.. :

Rechercher des cas de jurisprudence, des précédents et des décisions juridiques pertinents dans des bases de données documentaires au cours de la recherche.
Générer des résumés d'affaires en extrayant les faits essentiels des dossiers et des décisions antérieures.
Fournir automatiquement aux employés les mises à jour réglementaires pertinentes.

Exemple 2 : Agence immobilière

Une agence immobilière peut utiliser un RAG dans un système d'intelligence artificielle pour.. :

Résumer les données issues de l'historique des transactions immobilières et des statistiques de la criminalité dans le quartier.
Répondre aux questions juridiques concernant les transactions immobilières en citant les lois et réglementations locales en matière de propriété.
Rationaliser les processus d'évaluation en extrayant des données des rapports sur l'état des biens, des tendances du marché et de l'historique des ventes.

Exemple 3 : Boutique de commerce électronique

Un commerce électronique pourrait utiliser un RAG dans un système d'IA pour.. :

Recueillir des informations, des spécifications et des avis sur les produits à partir de la base de données de l'entreprise afin de formuler des recommandations personnalisées sur les produits.
Récupérer l'historique des commandes pour créer des expériences d'achat personnalisées en fonction des préférences de l'utilisateur.
Générer des campagnes d'e-mailing ciblées en récupérant les données de segmentation des clients et en les combinant avec les habitudes d'achat récentes.

Avantages du RAG

Comme le savent tous ceux qui ont interrogé ChatGPT ou Claude le sait, LLMs n'offre que des garanties minimales.

Sans un contrôle approprié, ils peuvent produire des informations inexactes, voire nuisibles, ce qui les rend peu fiables pour les déploiements dans le monde réel.

RAG offre une solution en fondant les réponses sur des sources de données fiables et actualisées, ce qui réduit considérablement ces risques.

Prévenir les hallucinations et les imprécisions

Les modèles linguistiques traditionnels génèrent souvent des hallucinations, c'est-à-dire des réponses qui semblent convaincantes mais qui sont factuellement incorrectes ou non pertinentes.

RAG atténue les hallucinations en fondant les réponses sur des sources de données fiables et hyper pertinentes.

L'étape d'extraction garantit que le modèle fait référence à des informations précises et actualisées, ce qui réduit considérablement le risque d'hallucinations et accroît la fiabilité.

Récupérer des informations actualisées

Bien que LLMs soit un outil puissant pour de nombreuses tâches, il n'est pas en mesure de fournir des informations précises sur les informations rares ou récentes, y compris les connaissances professionnelles sur mesure.

Mais RAG permet au modèle d'obtenir des informations en temps réel à partir de n'importe quelle source, y compris un site web, des tableaux ou des bases de données.

Cela garantit que, tant qu'une source de vérité est mise à jour, le modèle répondra avec des informations actualisées.

Communiquer dans des contextes complexes

Une autre faiblesse de l'utilisation traditionnelle du LLM est la perte d'informations contextuelles.

LLMs ont du mal à maintenir le contexte dans des conversations longues ou complexes. Cela se traduit souvent par des réponses incomplètes ou fragmentées.

Mais un modèle RAG permet de prendre en compte le contexte en tirant des informations directement de sources de données sémantiquement liées.

Avec des informations supplémentaires visant spécifiquement les besoins des utilisateurs - comme un chatbot de vente équipé d'un catalogue de produits - RAG permet aux agents d'IA de participer à des conversations contextuelles.

Comment fonctionne le RAG ?

1. Téléchargement du document

Tout d'abord, le site créateur télécharge un document ou un fichier dans la bibliothèque de son agent d'intelligence artificielle. Le fichier peut être une page web, un PDF ou un autre format pris en charge, qui fait partie de la base de connaissances de l'IA.

2. Conversion de documents

Comme il existe de nombreux types de fichiers - PDF, pages web, etc. - le système convertit ces fichiers dans un format texte standardisé, ce qui facilite leur traitement par l'IA et l'extraction d'informations pertinentes.

Déployer des agents d'intelligence artificielle ?

Lire notre schéma directeur pour la mise en œuvre d'un agent d'IA

3. Regroupement et stockage

Le document converti est ensuite divisé en morceaux plus petits et plus faciles à gérer, ou "chunks". Ces morceaux sont stockés dans une base de données, ce qui permet à l'agent d'intelligence artificielle de rechercher et d'extraire efficacement les sections pertinentes lors d'une requête.

4. Requête de l'utilisateur

Une fois les bases de connaissances mises en place, l'utilisateur peut poser une question à l'agent d'intelligence artificielle. La requête est traitée à l'aide du traitement du langage naturel (NLP) afin de comprendre ce que l'utilisateur demande.

5. Recherche de connaissances

L'agent d'intelligence artificielle effectue une recherche dans les morceaux stockés, en utilisant des algorithmes de recherche pour trouver les éléments d'information les plus pertinents dans les documents téléchargés qui peuvent répondre à la question de l'utilisateur.

6. Génération

Enfin, l'agent d'intelligence artificielle génère une réponse en combinant les informations extraites avec les capacités de son modèle linguistique, en élaborant une réponse cohérente et contextuellement précise sur la base de la requête et des données extraites.

Fonctionnalités avancées du RAG

Si vous n'êtes pas développeur, vous serez peut-être surpris d'apprendre que tous les RAG ne se valent pas.

Des systèmes différents construiront des modèles RAG différents, en fonction de leurs besoins, de leur cas d'utilisation ou de leurs compétences.

Certaines plateformes d'IA offrent des fonctions RAG avancées qui peuvent encore améliorer la précision et la fiabilité de votre logiciel d'IA.

Chunking sémantique ou naïf

Le découpage naïf consiste à diviser un document en morceaux de taille fixe, par exemple en découpant un texte en sections de 500 mots, sans tenir compte du sens ou du contexte.

Le découpage sémantique, quant à lui, divise le document en sections significatives basées sur le contenu.

Il prend en compte les ruptures naturelles, telles que les paragraphes ou les rubriques, en veillant à ce que chaque morceau contienne un élément d'information cohérent.

Citations obligatoires

Pour les industries qui automatisent les conversations à haut risque avec l'IA - comme la finance ou la santé - les citations peuvent contribuer à inspirer confiance aux utilisateurs lorsqu'ils reçoivent des informations.

Les développeurs peuvent demander à leurs modèles RAG de fournir des citations pour toute information envoyée.

Par exemple, si un employé demande à un chatbot IA des informations sur les prestations de santé, le chatbot peut lui répondre et lui fournir un lien vers le document correspondant.

Créer un agent RAG AI personnalisé

Combinez la puissance de la dernière version de LLMs avec votre connaissance unique de l'entreprise.

Botpress est une plateforme de chatbot flexible et extensible à l'infini.

Il permet aux utilisateurs de construire n'importe quel type d'agent IA ou de chatbot pour n'importe quel cas d'utilisation - et il offre le système RAG le plus avancé du marché.

Intégrez votre chatbot à n'importe quelle plateforme ou canal, ou choisissez parmi notre bibliothèque d'intégration prédéfinie. Commencez par les tutoriels de la chaîne YouTube Botpress ou par les cours gratuits de Botpress Academy .

Commencez à construire dès aujourd'hui. C'est gratuit.

Construire l'IA Chatbots

Créer des chatbots personnalisés

Commencer maintenant

FAQ

1. En quoi le RAG diffère-t-il du réglage fin d'un LLM?

RAG (Retrieval-Augmented Generation) is different from fine-tuning because RAG keeps the original LLM unchanged and injects external knowledge at runtime by retrieving relevant documents. Fine-tuning modifies the model's weights using training data, which requires more compute and must be repeated for every update.

2. What kinds of data sources are not suitable for RAG?

Data sources that are unsuitable for RAG include non-text formats like scanned documents, image-based PDFs, audio files without transcripts, and outdated or conflicting content. These types of data reduce the accuracy of retrieved context.

3. Comment la méthode RAG se compare-t-elle aux techniques d'apprentissage en contexte telles que l'ingénierie d'incitation ?

RAG differs from prompt engineering by retrieving relevant content from a large indexed knowledge base at query time, rather than relying on static, manually embedded examples in the prompt. This allows RAG to scale better and maintain up-to-date knowledge without retraining.

4. Puis-je utiliser RAG avec des LLMs tiers comme OpenAI, Anthropic ou Mistral ?

Yes, you can use RAG with LLMs from OpenAI, Anthropic, Mistral, or others by handling the retrieval pipeline independently and sending the retrieved context to the LLM via its API. RAG is model-agnostic as long as the LLM supports receiving contextual input through prompts.

5. À quoi ressemble la maintenance continue d'un agent d'IA doté de RAG ?

Ongoing maintenance for a RAG-enabled AI agent includes updating the knowledge base with new or corrected documents, re-indexing content periodically, evaluating retrieval quality, tuning chunk size and embedding methods, and monitoring the agent's responses for drift or hallucination issues.