Czym jest generowanie wspomagane wyszukiwaniem (RAG) w sztucznej inteligencji?

Napisany przez

Sarah Chudleigh

Badacz i lider ds. treści AI

Spis treści

Czym jest generowanie wspomagane odzyskiwaniem?

Przykłady przypadków użycia RAG

Korzyści z RAG

Jak działa RAG?

Zaawansowane funkcje RAG

Tworzenie niestandardowego agenta RAG AI

Najczęściej zadawane pytania

Podsumowanie

RAG łączy wyszukiwanie z zaufanych danych z generowaniem LLM , zapewniając, że odpowiedzi AI są dokładne, trafne i oparte na rzeczywistej wiedzy biznesowej.
W przeciwieństwie do czystego LLMs, RAG redukuje halucynacje poprzez zakotwiczenie odpowiedzi w określonych dokumentach, bazach danych lub zatwierdzonych treściach.
RAG obsługuje aktualne informacje, umożliwiając systemom sztucznej inteligencji odpowiadanie na pytania dotyczące ostatnich zmian lub niszowych tematów wykraczających poza statyczne dane szkoleniowe LLM.
Utrzymanie systemu RAG obejmuje utrzymywanie świeżości danych, monitorowanie wyników i udoskonalanie metod wyszukiwania w celu uzyskania najlepszej wydajności w czasie.

RAG pozwala organizacjom wykorzystać sztuczną inteligencję do pracy - przy mniejszym ryzyku niż tradycyjne wykorzystanie LLM .

Generowanie rozszerzone staje się coraz bardziej popularne, ponieważ coraz więcej firm wprowadza rozwiązania AI. Wczesne chatboty korporacyjne były świadkami ryzykownych błędów i halucynacji.

RAG pozwala firmom wykorzystać moc LLMs przy jednoczesnym ugruntowaniu generatywnych wyników w ich specyficznej wiedzy biznesowej.

Budowanie sztucznej inteligencji Chatbots

Tworzenie niestandardowych chatbotów agentowych

Zacznij teraz

Czym jest generowanie wspomagane odzyskiwaniem?

Retrieval-augmented generation (RAG) w sztucznej inteligencji to technika, która łączy a) pobieranie odpowiednich informacji zewnętrznych i b) odpowiedzi generowane przez sztuczną inteligencję, poprawiając dokładność i trafność.

Generowanie wspomagane pobieraniem to połączenie pobierania i generowania

Zamiast polegać na generowaniu dużych modeli językowych (LLMs), odpowiedzi z modeli RAG są oparte na bazach wiedzy dyktowanych przez twórcę agenta AI - takich jak strona internetowa firmy lub dokument polityki kadrowej.

RAG działa w dwóch głównych etapach:

1. Pobieranie

Model wyszukuje i pobiera odpowiednie dane z ustrukturyzowanych lub nieustrukturyzowanych źródeł (np. baz danych, plików PDF, HTML lub innych dokumentów). Źródła te mogą być ustrukturyzowane (np. tabele) lub nieustrukturyzowane (np. zatwierdzone strony internetowe).

2. Generacja

Po wyszukaniu informacje są wprowadzane do LLM. LLM wykorzystuje informacje do generowania odpowiedzi w języku naturalnym, łącząc zatwierdzone dane z własnymi możliwościami językowymi w celu tworzenia dokładnych, podobnych do ludzkich i zgodnych z marką odpowiedzi.

Przykłady przypadków użycia RAG

Jaki jest cel RAG? Umożliwia organizacjom dostarczanie istotnych, pouczających i dokładnych wyników.

RAG to bezpośredni sposób na zmniejszenie ryzyka niedokładnych wyników LLM lub halucynacji.

Przykład 1: Firma prawnicza

Firma prawnicza może używać RAG w systemie AI do:

Wyszukiwanie odpowiednich przepisów, precedensów i orzeczeń prawnych w bazach danych dokumentów podczas badań.
Generowanie podsumowań spraw poprzez wyodrębnianie kluczowych faktów z akt sprawy i wcześniejszych orzeczeń.
Automatycznie dostarczaj pracownikom odpowiednie aktualizacje przepisów.

Przykład 2: Agencja nieruchomości

Agencja nieruchomości może używać RAG w systemie AI do:

Podsumowanie danych z historii transakcji dotyczących nieruchomości i statystyk dotyczących przestępczości w okolicy.
Odpowiadaj na pytania prawne dotyczące transakcji dotyczących nieruchomości, powołując się na lokalne przepisy i regulacje dotyczące nieruchomości.
Usprawnij procesy wyceny, pobierając dane z raportów o stanie nieruchomości, trendów rynkowych i historycznych sprzedaży.

Przykład 3: Sklep internetowy

Handel elektroniczny może wykorzystywać RAG w systemie sztucznej inteligencji do:

Zbieranie informacji o produktach, specyfikacji i recenzji z bazy danych firmy w celu informowania o spersonalizowanych rekomendacjach produktów.
Pobieranie historii zamówień w celu generowania spersonalizowanych doświadczeń zakupowych dostosowanych do preferencji użytkownika.
Generuj ukierunkowane kampanie e-mailowe, pobierając dane segmentacji klientów i łącząc je z ostatnimi wzorcami zakupów.

Korzyści z RAG

3 zalety RAG: zapobieganie halucynacjom, odzyskiwanie aktualnych informacji, komunikacja w złożonych kontekstach

Jak każdy, kto zapytał ChatGPT lub Claude, LLMs ma wbudowane minimalne zabezpieczenia.

Bez odpowiedniego nadzoru mogą one generować niedokładne lub nawet szkodliwe informacje, co czyni je niewiarygodnymi dla rzeczywistych wdrożeń.

RAG oferuje rozwiązanie, opierając odpowiedzi na zaufanych, aktualnych źródłach danych, znacznie zmniejszając to ryzyko.

Zapobieganie halucynacjom i nieścisłościom

Tradycyjne modele językowe często generują halucynacje - odpowiedzi, które brzmią przekonująco, ale są niepoprawne lub nieistotne.

RAG łagodzi halucynacje, opierając odpowiedzi na wiarygodnych i hiperistotnych źródłach danych.

Etap wyszukiwania zapewnia, że model odwołuje się do dokładnych, aktualnych informacji, co znacznie zmniejsza ryzyko wystąpienia halucynacji i zwiększa niezawodność.

Pobieranie aktualnych informacji

Chociaż LLMs jest potężnym narzędziem do wielu zadań, nie jest w stanie dostarczyć dokładnych informacji o rzadkich lub najnowszych informacjach - w tym wiedzy biznesowej na zamówienie.

Jednak RAG pozwala modelowi pobierać informacje w czasie rzeczywistym z dowolnego źródła, w tym ze strony internetowej, tabel lub baz danych.

Gwarantuje to, że tak długo, jak źródło prawdy jest aktualizowane, model będzie odpowiadał aktualnymi informacjami.

Komunikacja w złożonych kontekstach

Kolejną słabością tradycyjnego LLM jest utrata informacji kontekstowych.

LLMs mają trudności z utrzymaniem kontekstu w długich lub złożonych rozmowach. Często skutkuje to niekompletnymi lub fragmentarycznymi odpowiedziami.

Model RAG pozwala jednak na uzyskanie świadomości kontekstu poprzez pobieranie informacji bezpośrednio z semantycznie powiązanych źródeł danych.

Dzięki dodatkowym informacjom ukierunkowanym specjalnie na potrzeby użytkowników - takim jak chatbot sprzedażowy wyposażony w katalog produktów - RAG pozwala agentom AI uczestniczyć w rozmowach kontekstowych.

Jak działa RAG?

1. Przesyłanie dokumentów

Najpierw konstruktor przesyła dokument lub plik do biblioteki swojego agenta AI. Plik może być stroną internetową, plikiem PDF lub innym obsługiwanym formatem, który stanowi część bazy wiedzy AI.

2. Konwersja dokumentów

Ponieważ istnieje wiele rodzajów plików - PDF, strony internetowe itp. - system konwertuje te pliki do znormalizowanego formatu tekstowego, ułatwiając sztucznej inteligencji przetwarzanie i pobieranie z nich istotnych informacji.

Wdrażanie agentów AI?

Przeczytaj nasz plan wdrożenia agenta AI

Czytaj teraz

3. Grupowanie i przechowywanie

Przekonwertowany dokument jest następnie dzielony na mniejsze, łatwe do zarządzania fragmenty. Fragmenty te są przechowywane w bazie danych, umożliwiając agentowi AI efektywne wyszukiwanie i pobieranie odpowiednich sekcji podczas zapytania.

4. Zapytanie użytkownika

Po skonfigurowaniu baz wiedzy użytkownik może zadać agentowi AI pytanie. Zapytanie jest przetwarzane przy użyciu przetwarzania języka naturalnego (NLP), aby zrozumieć, o co pyta użytkownik.

5. Pobieranie wiedzy

Agent AI przeszukuje przechowywane fragmenty, wykorzystując algorytmy wyszukiwania, aby znaleźć najbardziej istotne informacje z przesłanych dokumentów, które mogą odpowiedzieć na pytanie użytkownika.

6. Generacja

Na koniec agent AI wygeneruje odpowiedź, łącząc pobrane informacje ze swoimi możliwościami modelu językowego, tworząc spójną, kontekstowo dokładną odpowiedź na podstawie zapytania i pobranych danych.

Zaawansowane funkcje RAG

Jeśli nie jesteś deweloperem, możesz być zaskoczony, gdy dowiesz się, że nie wszystkie RAG są sobie równe.

Różne systemy będą tworzyć różne modele RAG, w zależności od ich potrzeb, przypadków użycia lub umiejętności.

Niektóre platformy AI oferują zaawansowane funkcje RAG, które mogą dodatkowo zwiększyć dokładność i niezawodność oprogramowania AI.

Chunking semantyczny a naiwny

Naiwny chunking ma miejsce, gdy dokument jest dzielony na fragmenty o stałym rozmiarze, takie jak cięcie tekstu na sekcje po 500 słów, niezależnie od znaczenia lub kontekstu.

Z drugiej strony, chunking semantyczny dzieli dokument na znaczące sekcje w oparciu o treść.

Uwzględnia naturalne przerwy, takie jak akapity lub tematy, zapewniając, że każdy fragment zawiera spójną informację.

Obowiązkowe cytaty

W branżach automatyzujących rozmowy wysokiego ryzyka za pomocą sztucznej inteligencji - takich jak finanse czy opieka zdrowotna - cytaty mogą pomóc wzbudzić zaufanie użytkowników podczas otrzymywania informacji.

Deweloperzy mogą poinstruować swoje modele RAG, aby zapewniały cytaty dla każdej przesłanej informacji.

Na przykład, jeśli pracownik poprosi chatbota AI o informacje na temat świadczeń zdrowotnych, chatbot może odpowiedzieć i podać link do odpowiedniego dokumentu dotyczącego świadczeń pracowniczych.

Tworzenie niestandardowego agenta RAG AI

Połącz moc najnowszej strony LLMs z unikalną wiedzą o przedsiębiorstwie.

Botpress to elastyczna i nieskończenie rozszerzalna platforma chatbotów AI.

Umożliwia użytkownikom tworzenie dowolnego typu agenta AI lub chatbota dla dowolnego przypadku użycia - i oferuje najbardziej zaawansowany system RAG na rynku.

Zintegruj swojego chatbota z dowolną platformą lub kanałem albo wybierz jedną z naszych gotowych bibliotek integracji. Zacznij od samouczków z kanału YouTube Botpress lub bezpłatnych kursów z Botpress Academy .

Zacznij budować już dziś. To nic nie kosztuje.

Budowanie sztucznej inteligencji Chatbots

Tworzenie niestandardowych chatbotów agentowych

Zacznij teraz

Najczęściej zadawane pytania

1. Czym różni się RAG od dostrajania LLM?

RAG pozwala zachować bazowy LLM nietknięty i po prostu pobrać odpowiednie informacje w czasie zapytania, podczas gdy dostrajanie faktycznie zmienia model poprzez trenowanie go na danych. RAG jest znacznie szybszy i bardziej elastyczny w przypadku aktualizacji.

2. Jakie rodzaje źródeł danych nie są odpowiednie dla RAG?

Nieuporządkowane, nieaktualne lub zbyt złożone dokumenty (takie jak zeskanowane obrazy lub nietekstowe pliki PDF) mogą stanowić problem, podobnie jak źródła zawierające zbyt wiele niejasności lub sprzecznych informacji.

3. Jak RAG wypada w porównaniu z technikami uczenia się w kontekście, takimi jak inżynieria podpowiedzi?

Prompt engineering działa poprzez umieszczanie przykładów bezpośrednio w podpowiedzi, ale RAG skaluje się lepiej, dynamicznie pobierając zewnętrzną wiedzę, dzięki czemu nie osiągasz limitów tokenów tak szybko i możesz wykorzystać znacznie większą bazę informacji.

4. Czy mogę używać RAG z LLMs innych firm, takimi jak OpenAI, Anthropic lub Mistral?

Oczywiście można podłączyć system RAG do większości popularnych LLMs za pośrednictwem ich interfejsów API. Samodzielnie zajmujesz się pobieraniem danych i po prostu wysyłasz końcowy monit (z kontekstem) do modelu.

5. Jak wygląda bieżąca konserwacja agenta AI z obsługą RAG?

Będziesz chciał zachować świeżość swojej bazy wiedzy poprzez ponowne indeksowanie nowych dokumentów, monitorowanie wydajności w celu wychwycenia złych lub brakujących odpowiedzi, a od czasu do czasu dostosowywać ustawienia grupowania lub wyszukiwania w celu poprawy trafności.