Was versteht man unter retrieval-augmented generation (RAG) in der KI?

Geschrieben von

Sarah Chudleigh

Forscher und Leiter für KI-Inhalte

Inhaltsübersicht

Was ist eine abrufunterstützte Generierung?

Beispiele für RAG Use Cases

Vorteile von RAG

Wie funktioniert die RAG?

Erweiterte RAG-Funktionen

Erstellen eines benutzerdefinierten RAG AI-Agenten

FAQs

Zusammenfassung

RAG kombiniert den Abruf von vertrauenswürdigen Daten mit der LLM und stellt so sicher, dass die KI-Antworten präzise und relevant sind und auf echtem Geschäftswissen beruhen.
Im Gegensatz zu reinen LLMs reduziert die RAG Halluzinationen, indem sie Antworten in bestimmten Dokumenten, Datenbanken oder freigegebenen Inhalten verankert.
RAG unterstützt aktuelle Informationen und ermöglicht es KI-Systemen, Fragen zu aktuellen Veränderungen oder Nischenthemen zu beantworten, die über die statischen Trainingsdaten eines LLMhinausgehen.
Zur Pflege eines RAG-Systems gehört es, die Daten auf dem neuesten Stand zu halten, die Ergebnisse zu überwachen und die Abrufmethoden zu verfeinern, um im Laufe der Zeit die beste Leistung zu erzielen.

RAG ermöglicht es Unternehmen, KI einzusetzen - mit weniger Risiko als bei der herkömmlichen Nutzung von LLM .

Die Retrieval-augmented Generation wird immer beliebter, da immer mehr Unternehmen KI-Lösungen einführen. Frühe Unternehmens-Chatbots sahen riskante Fehler und Halluzinationen.

RAG ermöglicht es Unternehmen, die Leistungsfähigkeit von LLMs zu nutzen und gleichzeitig die generativen Ergebnisse auf ihr spezifisches Geschäftswissen zu stützen.

AI aufbauen Chatbots

Erstellen Sie benutzerdefinierte agenturische Chatbots

Jetzt anfangen

Was ist eine abrufunterstützte Generierung?

Retrieval-augmented generation (RAG) in der KI ist eine Technik, die a) das Abrufen relevanter externer Informationen und b) KI-generierte Antworten kombiniert, um Genauigkeit und Relevanz zu verbessern.

Retrieval-augmented Generation ist eine Kombination aus Retrieval und Generation

Anstatt sich auf die Generierung großer Sprachmodelle (LLMs) zu stützen, werden die Antworten der RAG-Modelle durch Wissensdatenbanken informiert, die vom Ersteller des KI-Agenten vorgegeben werden - wie die Webseite eines Unternehmens oder ein Dokument zur Personalpolitik.

Die RAG arbeitet in zwei Hauptschritten:

1. Abruf

Das Modell sucht und findet relevante Daten aus strukturierten oder unstrukturierten Quellen (z. B. Datenbanken, PDFs, HTML-Dateien oder anderen Dokumenten). Diese Quellen können strukturiert (z. B. Tabellen) oder unstrukturiert (z. B. freigegebene Websites) sein.

2. Generation

Nach dem Abruf werden die Informationen in LLM eingespeist. LLM verwendet die Informationen, um eine Antwort in natürlicher Sprache zu generieren, indem es die freigegebenen Daten mit seinen eigenen linguistischen Fähigkeiten kombiniert, um genaue, menschenähnliche und markengerechte Antworten zu erstellen.

Beispiele für RAG Use Cases

Was ist der Sinn von RAG? Sie ermöglicht es Organisationen, relevante, informative und genaue Ergebnisse zu liefern.

RAG ist ein direkter Weg, um das Risiko einer ungenauen LLM Ausgabe oder von Halluzinationen zu verringern.

Beispiel 1: Anwaltskanzlei

Eine Anwaltskanzlei könnte eine RAG in einem KI-System verwenden, um:

Suchen Sie bei der Recherche in Dokumentendatenbanken nach einschlägiger Rechtsprechung, Präzedenzfällen und Gerichtsurteilen.
Erstellung von Fallzusammenfassungen durch Extraktion von Schlüsselfakten aus Fallakten und früheren Urteilen.
Versorgen Sie Ihre Mitarbeiter automatisch mit relevanten Aktualisierungen der Rechtsvorschriften.

Beispiel 2: Immobilienbüro

Ein Immobilienbüro könnte eine RAG in einem KI-System verwenden, um:

Fassen Sie Daten aus Immobilientransaktionen und Kriminalitätsstatistiken aus der Nachbarschaft zusammen.
Beantworten Sie rechtliche Fragen zu Immobilientransaktionen unter Bezugnahme auf die örtlichen Immobiliengesetze und -vorschriften.
Optimieren Sie den Bewertungsprozess, indem Sie Daten aus Immobilienzustandsberichten, Markttrends und historischen Verkäufen abrufen.

Beispiel 3: E-Commerce-Geschäft

Ein E-Commerce-Unternehmen könnte eine RAG in einem KI-System verwenden, um:

Sammeln Sie Produktinformationen, Spezifikationen und Bewertungen aus der Unternehmensdatenbank, um personalisierte Produktempfehlungen zu erstellen.
Rufen Sie die Bestellhistorie ab, um individuelle, auf die Präferenzen der Nutzer zugeschnittene Einkaufserlebnisse zu schaffen.
Generieren Sie zielgerichtete E-Mail-Kampagnen, indem Sie Daten zur Kundensegmentierung abrufen und mit dem aktuellen Kaufverhalten kombinieren.

Vorteile von RAG

Wie jeder weiß, der eine Anfrage an ChatGPT oder Claude weiß, hat LLMs nur minimale Sicherheitsvorkehrungen eingebaut.

Ohne angemessene Überwachung können sie ungenaue oder sogar schädliche Informationen liefern, was sie für reale Einsätze unzuverlässig macht.

Die RAG bietet eine Lösung, indem sie die Antworten auf vertrauenswürdige, aktuelle Datenquellen stützt und so diese Risiken erheblich reduziert.

Verhinderung von Halluzinationen und Ungenauigkeiten

Herkömmliche Sprachmodelle erzeugen oft Halluzinationen - Antworten, die überzeugend klingen, aber sachlich falsch oder irrelevant sind.

RAG mildert Halluzinationen, indem es die Antworten auf verlässliche und hyperrelevante Datenquellen stützt.

Der Abrufschritt stellt sicher, dass das Modell auf genaue, aktuelle Informationen verweist, was die Wahrscheinlichkeit von Halluzinationen deutlich verringert und die Zuverlässigkeit erhöht.

Abrufen von aktuellen Informationen

LLMs ist zwar ein leistungsfähiges Werkzeug für viele Aufgaben, aber es ist nicht in der Lage, genaue Informationen über seltene oder aktuelle Informationen zu liefern - einschließlich maßgeschneidertem Geschäftswissen.

Mit RAG kann das Modell jedoch Echtzeitinformationen aus beliebigen Quellen abrufen, einschließlich Websites, Tabellen oder Datenbanken.

Dadurch wird sichergestellt, dass das Modell mit aktuellen Informationen reagiert, solange eine Quelle der Wahrheit aktualisiert wird.

In komplexen Kontexten kommunizieren

Ein weiterer Schwachpunkt der traditionellen LLM ist der Verlust von Kontextinformationen.

LLMs haben Schwierigkeiten, in langen oder komplexen Gesprächen den Zusammenhang zu wahren. Dies führt oft zu unvollständigen oder bruchstückhaften Antworten.

Ein RAG-Modell ermöglicht jedoch ein Kontextbewusstsein, indem es Informationen direkt aus semantisch verknüpften Datenquellen bezieht.

Mit zusätzlichen Informationen, die speziell auf die Bedürfnisse der Nutzer ausgerichtet sind - wie ein mit einem Produktkatalog ausgestatteter Vertriebs-Chatbot - ermöglicht RAG den KI-Agenten die Teilnahme an kontextbezogenen Konversationen.

Wie funktioniert die RAG?

1. Dokument hochladen

Zunächst lädt der Bauherr ein Dokument oder eine Datei in die Bibliothek seines KI-Agenten hoch. Bei der Datei kann es sich um eine Webseite, eine PDF-Datei oder ein anderes unterstütztes Format handeln, das Teil der Wissensbasis der KI ist.

2. Dokumentenkonvertierung

Da es viele Arten von Dateien gibt - PDFs, Webseiten usw. - konvertiert das System diese Dateien in ein standardisiertes Textformat, so dass sie von der KI leichter verarbeitet und relevante Informationen abgerufen werden können.

Einsatz von KI-Agenten?

Lesen Sie unseren Leitfaden für die Implementierung von AI-Agenten

Jetzt lesen

3. Chunking und Speicherung

Das konvertierte Dokument wird dann in kleinere, überschaubare Teile, so genannte Chunks, zerlegt. Diese Teile werden in einer Datenbank gespeichert, so dass der KI-Agent bei einer Abfrage effizient nach relevanten Abschnitten suchen und diese abrufen kann.

4. Benutzerabfrage

Nachdem die Wissensdatenbanken eingerichtet sind, kann ein Nutzer dem KI-Agenten eine Frage stellen. Die Anfrage wird mithilfe der Verarbeitung natürlicher Sprache (NLP) verarbeitet, um zu verstehen, was der Benutzer fragt.

5. Wissensabfrage

Der KI-Agent durchsucht die gespeicherten Chunks mit Hilfe von Retrieval-Algorithmen, um die relevantesten Informationen aus den hochgeladenen Dokumenten zu finden, die die Frage des Nutzers beantworten können.

6. Generation

Schließlich erzeugt der KI-Agent eine Antwort, indem er die abgerufenen Informationen mit seinen Sprachmodellfähigkeiten kombiniert und auf der Grundlage der Anfrage und der abgerufenen Daten eine kohärente, kontextgenaue Antwort formuliert.

Erweiterte RAG-Funktionen

Wenn Sie kein Entwickler sind, wird es Sie vielleicht überraschen, dass nicht alle RAGs gleich sind.

Verschiedene Systeme werden je nach Bedarf, Anwendungsfall oder Fähigkeiten unterschiedliche RAG-Modelle erstellen.

Einige KI-Plattformen bieten erweiterte RAG-Funktionen, die die Genauigkeit und Zuverlässigkeit Ihrer KI-Software weiter verbessern können.

Semantisches vs. naives Chunking

Beim naiven Chunking wird ein Dokument in Teile fester Größe zerlegt, z. B. in Abschnitte von 500 Wörtern, unabhängig von Bedeutung und Kontext.

Beim semantischen Chunking hingegen wird das Dokument auf der Grundlage des Inhalts in sinnvolle Abschnitte unterteilt.

Es berücksichtigt natürliche Unterbrechungen, wie Absätze oder Themen, und stellt sicher, dass jeder Abschnitt ein zusammenhängendes Stück Information enthält.

Obligatorische Zitate

In Branchen, die risikoreiche Konversationen mit KI automatisieren - wie im Finanz- oder Gesundheitswesen - können Zitate dazu beitragen, das Vertrauen der Nutzer in den Erhalt von Informationen zu stärken.

Die Entwickler können ihre RAG-Modelle anweisen, Zitate für alle übermittelten Informationen zu liefern.

Fragt ein Mitarbeiter beispielsweise einen KI-Chatbot nach Informationen über Gesundheitsleistungen, kann der Chatbot antworten und einen Link zu dem entsprechenden Dokument mit den Sozialleistungen bereitstellen.

Erstellen eines benutzerdefinierten RAG AI-Agenten

Kombinieren Sie die Leistungsfähigkeit der neuesten LLMs mit Ihrem einzigartigen Unternehmenswissen.

Botpress ist eine flexible und unendlich erweiterbare KI-Chatbot-Plattform.

Es ermöglicht Benutzern, jede Art von KI-Agent oder Chatbot für jeden Anwendungsfall zu erstellen - und es bietet das fortschrittlichste RAG-System auf dem Markt.

Integrieren Sie Ihren Chatbot in eine beliebige Plattform oder einen Kanal, oder wählen Sie aus unserer vorgefertigten Integrationsbibliothek. Beginnen Sie mit Tutorials auf dem Botpress YouTube-Kanal oder mit kostenlosen Kursen auf Botpress Academy .

Beginnen Sie noch heute mit dem Bau. Es ist kostenlos.

AI aufbauen Chatbots

Erstellen Sie benutzerdefinierte agenturische Chatbots

Jetzt anfangen

FAQs

1. Wie unterscheidet sich die RAG von der Feinabstimmung eines LLM?

Mit RAG können Sie das LLM unangetastet lassen und nur relevante Informationen zum Zeitpunkt der Abfrage abrufen, während die Feinabstimmung das Modell durch Training auf Ihren Daten tatsächlich ändert. RAG ist viel schneller und flexibler bei Aktualisierungen.

2. Welche Arten von Datenquellen sind nicht für die RAG geeignet?

Unordentliche, veraltete oder übermäßig komplexe Dokumente (wie gescannte Bilder oder PDF-Dateien ohne Text) können problematisch sein, ebenso wie Quellen mit zu vielen unklaren oder widersprüchlichen Informationen.

3. Wie schneidet RAG im Vergleich zu kontextbezogenen Lerntechniken wie Prompt Engineering ab?

Prompt-Engineering funktioniert, indem man Beispiele direkt in die Eingabeaufforderung packt, aber RAG skaliert besser, indem es externes Wissen dynamisch einbezieht, so dass man nicht so schnell an Token-Grenzen stößt und auf eine viel größere Informationsbasis zurückgreifen kann.

4. Kann ich RAG mit LLMs von Drittanbietern wie OpenAI, Anthropic oder Mistral verwenden?

Natürlich können Sie ein RAG-System in die meisten gängigen LLMs über deren APIs einbinden. Sie kümmern sich selbst um die Abfrage und senden nur die endgültige Aufforderung (mit Kontext) an das Modell.

5. Wie sieht die laufende Wartung eines RAG-fähigen KI-Agenten aus?

Sie sollten Ihre Wissensdatenbank auf dem neuesten Stand halten, indem Sie neue Dokumente neu indizieren, die Leistung überwachen, um schlechte oder fehlende Antworten zu erkennen, und gelegentlich die Chunking- oder Abrufeinstellungen anpassen, um die Relevanz zu verbessern.