AIにおけるRAG（retrieval-augmented generation）とは？

執筆者

Sarah Chudleigh

研究者＆AIコンテンツリーダー

概要

RAGは、信頼できるデータからの検索とLLM 生成を組み合わせ、AIの応答が正確で、適切で、実際のビジネス知識に基づいたものであることを保証する。
純粋なLLMs異なり、RAGは特定の文書、データベース、または承認されたコンテンツに答えを固定することで、幻覚を減らす。
RAGは最新の情報をサポートし、LLM静的な学習データを超えて、AIシステムが最近の変化やニッチなトピックに関する質問に答えることを可能にする。
RAGシステムを維持するには、データを常に新鮮な状態に保ち、出力を監視し、長期にわたって最高のパフォーマンスを発揮できるように検索方法を改良する必要がある。

RAGは、従来のLLM よりも少ないリスクで、企業がAIを活用することを可能にする。

より多くの企業がAIソリューションを導入するにつれて、検索拡張世代が普及している。初期の企業向けチャットボットでは、危険なミスや幻覚が見られた。

RAGは、企業がLLMs の力を活用することを可能にすると同時に、特定のビジネス知識に基づいた生成的なアウトプットを可能にする。

ビルドAIChatbots

カスタムエージェントチャットボットの構築

今すぐ始める

検索機能付き世代とは？

AIにおけるRAG（Retrieval-augmented Generation）とは、a)関連する外部情報を検索し、b)AIが生成した応答を組み合わせることで、精度と関連性を向上させる手法である。

大規模な言語モデル(LLMs)の生成に依存する代わりに、RAGモデルからの応答は、AIエージェントビルダーによって指示された知識ベース（企業のウェブページや人事ポリシー文書のような）によって情報提供される。

RAGは主に2つのステップで運営されている：

1.検索

このモデルは、構造化または非構造化ソース（データベース、PDF、HTMLファイル、その他の文書など）から関連データを検索し、取得する。これらのソースは、構造化されたもの (テーブルなど) も非構造化されたもの (承認済み Web サイトなど) もあります。

2.世代

検索後、情報はLLM に入力される。LLM はその情報を使って自然言語による応答を生成する。承認されたデータと独自の言語能力を組み合わせることで、正確で人間のような、ブランドに合った応答を作成する。

RAGの使用例

RAGのポイントは？それは、組織が適切で、有益で、正確なアウトプットを提供できるようにすることです。

RAGは、不正確なLLM 出力や幻覚のリスクを減らす直接的な方法である。

例 1：法律事務所

法律事務所がAIシステムでRAGを使用するのは、次のような場合である：

リサーチ中に、関連する判例、先例、法的判断を文書データベースから検索する。
事件ファイルや過去の判決から重要な事実を抽出し、事件概要を作成。
関連する規制の最新情報を従業員に自動的に提供。

例 2：不動産会社

不動産会社はAIシステムでRAGを使うかもしれない：

不動産取引履歴や近隣の犯罪統計のデータをまとめる。
不動産取引に関する法的な質問に、現地の不動産関連法規を引用して回答する。
物件状況報告書、市場動向、過去の販売履歴からデータを抽出し、鑑定プロセスを合理化します。

例3：Eコマース・ストア

eコマースは、AIシステムでRAGを使うかもしれない：

会社のデータベースから製品情報、仕様、レビューを収集し、パーソナライズされた製品の推奨に役立てる。
注文履歴を取得し、ユーザーの好みに合わせてカスタマイズされたショッピング体験を生成。
顧客のセグメンテーションデータを取得し、最近の購入パターンと組み合わせることで、ターゲットを絞ったEメールキャンペーンを実施。

RAGのメリット

RAGの3つの利点：幻覚の防止、最新情報の検索、複雑な文脈でのコミュニケーション

問い合わせをしたことのある人なら誰でも知っているように ChatGPTクロードが知っているように、LLMs には最小限のセーフガードが組み込まれている。

適切な監視がなければ、不正確な情報、あるいは有害な情報さえ生み出す可能性があり、実戦配備には信頼できない。

RAGは、信頼できる最新のデータソースに基づいた回答を行うことで、こうしたリスクを大幅に軽減するソリューションを提供します。

幻覚や不正確さを防ぐ

従来の言語モデルは、しばしば幻覚（説得力があるように聞こえるが、事実とは正しくない、あるいは無関係な回答）を生み出す。

RAGは、信頼性が高く関連性の高いデータソースに根拠を置くことで、幻覚を軽減する。

検索ステップは、モデルが正確で最新の情報を参照することを保証し、幻覚の可能性を大幅に減らし、信頼性を高める。

複雑な文脈でのコミュニケーション

従来のLLM 使用のもう一つの弱点は、文脈情報が失われることである。

LLMs 長い会話や複雑な会話で文脈を維持するのに苦労する。その結果、応答が不完全になったり、断片的になったりすることがよくある。

しかし、RAGモデルでは、セマンティックにリンクされたデータソースから直接情報を引き出すことで、コンテキストを認識することができる。

製品カタログを備えたセールス・チャットボットのように、ユーザーのニーズに特化した追加情報によって、RAGはAIエージェントが文脈に沿った会話に参加することを可能にする。

RAGはどのように機能するのか？

1.ドキュメントのアップロード

まず、ビルダーはドキュメントやファイルをAIエージェントのライブラリにアップロードします。ファイルはウェブページ、PDF、またはその他のサポートされるフォーマットで、AIの知識ベースの一部を形成します。

2.文書の変換

PDFやウェブページなど、ファイルには多くの種類があります。- システムはこれらのファイルを標準化されたテキスト・フォーマットに変換し、AIが処理しやすく、関連情報を取り出しやすくします。

AIエージェントの導入？

AIエージェント導入の青写真を読む

今すぐ読む

3.チャンキングと保管

変換されたドキュメントは、管理可能な小さな断片（チャンク）に分解される。これらのチャンクはデータベースに保存され、AIエージェントはクエリー中に関連するセクションを効率的に検索して取り出すことができる。

4.ユーザークエリ

知識ベースが設定された後、ユーザーはAIエージェントに質問をすることができる。その質問は、自然言語処理（NLP）を使って処理され、ユーザーの質問内容を理解する。

5.知識検索

AIエージェントは、保存されたチャンクを検索アルゴリズムを使って検索し、アップロードされた文書からユーザーの質問に答えられる最も関連性の高い情報を探し出す。

6.世代

最後に、AIエージェントは、検索された情報を言語モデル機能と組み合わせることで、クエリと検索されたデータに基づいて、首尾一貫した、文脈的に正確な回答を作成し、回答を生成する。

高度なRAG機能

もしあなたが開発者でないなら、すべてのRAGが同じように作られているわけではないことを知って驚くかもしれない。

異なるシステムは、その必要性、ユースケース、スキル能力に応じて、異なるRAGモデルを構築する。

一部のAIプラットフォームは、AIソフトウェアの精度と信頼性をさらに高めることができる高度なRAG機能を提供しています。

セマンティック・チャンキングとナイーブ・チャンキング

ナイーブ・チャンキングとは、意味や文脈に関係なく、テキストを500語のセクションに分割するように、ドキュメントを固定サイズの断片に分割することである。

一方、セマンティック・チャンキングは、内容に基づいて文書を意味のあるセクションに分割する。

段落やトピックのような自然な区切りを考慮し、各チャンクに首尾一貫した情報が含まれるようにする。

強制引用

金融や医療など、リスクの高い会話をAIで自動化する業界にとって、引用は情報を受け取る際にユーザーに信頼を与えるのに役立つ。

開発者はRAGモデルに、送信された情報の引用を指示することができる。

例えば、従業員がAIチャットボットに福利厚生に関する情報を求めた場合、チャットボットはそれに答え、関連する福利厚生文書へのリンクを提供することができる。

カスタムRAG AIエージェントの構築

最新のLLMs のパワーと独自の企業知識を組み合わせてください。

Botpress 柔軟で無限に拡張可能なAIチャットボットプラットフォームです。

また、市場で最も先進的なRAGシステムを提供している。

チャットボットを任意のプラットフォームやチャネルに統合するか、事前に構築された統合ライブラリから選択します。Botpress YouTube チャンネルのチュートリアル、またはBotpress Academy の無料コースで始めましょう。

今日から始めよう。無料です。

ビルドAIChatbots

カスタムエージェントチャットボットの構築

今すぐ始める

よくあるご質問

1.RAGはLLM微調整とどう違うのですか？

RAGでは、ベースとなるLLM そのままで、クエリー時に関連する情報を取り込むことができます。RAGの方がはるかに高速で柔軟な更新が可能です。

2.どのようなデータソースがRAGに適していないのか？

乱雑な文書、古くなった文書、複雑すぎる文書（スキャンした画像やテキストでないPDFなど）は、あいまいな情報や矛盾する情報が多すぎる情報源と同様に、問題になる可能性があります。

3.RAGは、プロンプト・エンジニアリングのような文脈内学習技法と比較してどうですか？

プロンプト・エンジニアリングは、プロンプトに直接例を詰め込むことで機能するが、RAGは外部の知識を動的に取り込むことでより良いスケールを実現する。

4.OpenAI、Anthropic、MistralのようなサードパーティのLLMs RAGを使うことはできますか？

もちろん、RAGシステムをAPI経由でほとんどの一般的なLLMs プラグインすることができる。あなたは検索部分を自分で処理し、最終的なプロンプト（コンテキスト付き）をモデルに送るだけです。

5.RAG対応AIエージェントの継続的なメンテナンスとはどのようなものでしょうか？

新しいドキュメントのインデックスを再作成することで、ナレッジベースを常に新鮮な状態に保ち、パフォーマンスを監視して不良回答や欠落回答を検出し、関連性を向上させるためにチャンキングや検索設定を時折調整します。

AIにおけるRAG（retrieval-augmented generation）とは？

検索機能付き世代とは？

1.検索

2.世代

RAGの使用例

例 1：法律事務所

例 2：不動産会社

例3：Eコマース・ストア

RAGのメリット

幻覚や不正確さを防ぐ

最新情報の取得

複雑な文脈でのコミュニケーション

RAGはどのように機能するのか？

1.ドキュメントのアップロード

2.文書の変換

3.チャンキングと保管

4.ユーザークエリ

5.知識検索

6.世代

高度なRAG機能

セマンティック・チャンキングとナイーブ・チャンキング

強制引用

カスタムRAG AIエージェントの構築

よくあるご質問

1.RAGはLLM微調整とどう違うのですか？

2.どのようなデータソースがRAGに適していないのか？

3.RAGは、プロンプト・エンジニアリングのような文脈内学習技法と比較してどうですか？

4.OpenAI、Anthropic、MistralのようなサードパーティのLLMs RAGを使うことはできますか？

5.RAG対応AIエージェントの継続的なメンテナンスとはどのようなものでしょうか？