1. How is RAG different from fine-tuning an LLM?

RAG (Retrieval-Augmented Generation) is different from fine-tuning because RAG keeps the original LLM unchanged and injects external knowledge at runtime by retrieving relevant documents. Fine-tuning modifies the model's weights using training data, which requires more compute and must be repeated for every update.

2. What kinds of data sources are not suitable for RAG?

Data sources that are unsuitable for RAG include non-text formats like scanned documents, image-based PDFs, audio files without transcripts, and outdated or conflicting content. These types of data reduce the accuracy of retrieved context.

3. How does RAG compare to in-context learning techniques like prompt engineering?

RAG differs from prompt engineering by retrieving relevant content from a large indexed knowledge base at query time, rather than relying on static, manually embedded examples in the prompt. This allows RAG to scale better and maintain up-to-date knowledge without retraining.

4. Can I use RAG with third-party LLMs like OpenAI, Anthropic, or Mistral?

Yes, you can use RAG with LLMs from OpenAI, Anthropic, Mistral, or others by handling the retrieval pipeline independently and sending the retrieved context to the LLM via its API. RAG is model-agnostic as long as the LLM supports receiving contextual input through prompts.

5. What does ongoing maintenance look like for a RAG-enabled AI agent?

Ongoing maintenance for a RAG-enabled AI agent includes updating the knowledge base with new or corrected documents, re-indexing content periodically, evaluating retrieval quality, tuning chunk size and embedding methods, and monitoring the agent's responses for drift or hallucination issues.

RAG (retrieval-augmented generation) ใน AI คืออะไร?

เขียนโดย

Sarah Chudleigh

นักวิจัย & หัวหน้าคอนเทนต์ AI

สารบัญ

สรุป

RAG ผสานการค้นหาข้อมูลจากแหล่งที่เชื่อถือได้เข้ากับการสร้างข้อความโดย LLM เพื่อให้คำตอบของ AI แม่นยำ ตรงประเด็น และอ้างอิงจากความรู้จริงของธุรกิจ
ต่างจาก LLMs แบบเดิม RAG ลดปัญหาข้อมูลหลอน (hallucinations) ด้วยการยึดคำตอบกับเอกสาร ฐานข้อมูล หรือเนื้อหาที่ได้รับอนุมัติ
RAG รองรับข้อมูลล่าสุด ทำให้ AI ตอบคำถามเกี่ยวกับการเปลี่ยนแปลงใหม่ ๆ หรือหัวข้อเฉพาะทางที่อยู่นอกเหนือข้อมูลฝึกของ LLM ได้
การดูแลระบบ RAG ต้องอัปเดตข้อมูล ตรวจสอบผลลัพธ์ และปรับปรุงวิธีการค้นหาเพื่อให้ได้ประสิทธิภาพสูงสุดในระยะยาว

RAG ช่วยให้องค์กรนำ AI มาใช้ได้อย่างมั่นใจ โดยมีความเสี่ยงน้อยกว่าการใช้ LLM แบบเดิม

Retrieval-augmented generation กำลังได้รับความนิยมมากขึ้นเมื่อธุรกิจต่าง ๆ เริ่มใช้ AI ตัวอย่างแรก ๆ อย่าง แชทบอทสำหรับองค์กร เคยเกิดข้อผิดพลาดและข้อมูลหลอนบ่อยครั้ง

RAG ช่วยให้บริษัทใช้ศักยภาพของ LLMs พร้อมกับยึดเนื้อหาที่สร้างขึ้นกับความรู้เฉพาะของธุรกิจตนเอง

สร้างแชทบอท AI

สร้างแชทบอทอัจฉริยะที่ปรับแต่งได้เอง

เริ่มเลย

Retrieval-augmented generation คืออะไร?

Retrieval-augmented generation (RAG) ใน AI คือเทคนิคที่ผสมผสานระหว่าง a) การค้นหาข้อมูลภายนอกที่เกี่ยวข้อง และ b) การสร้างคำตอบโดย AI เพื่อเพิ่มความแม่นยำและความเกี่ยวข้อง

Retrieval-augmented generation is a combination of retrieval and generation

แทนที่จะพึ่งแค่การสร้างคำตอบจาก LLM คำตอบจาก RAG จะอ้างอิงจากฐานความรู้ที่ผู้สร้าง AI agent กำหนด เช่น หน้าเว็บบริษัท หรือเอกสารนโยบาย HR

RAG ทำงานหลัก ๆ สองขั้นตอน:

1. การค้นหา (Retrieval)

โมเดลจะค้นหาและดึงข้อมูลที่เกี่ยวข้องจากแหล่งข้อมูลที่มีโครงสร้างหรือไม่มีโครงสร้าง (เช่น ฐานข้อมูล, PDF, ไฟล์ HTML หรือเอกสารอื่น ๆ) แหล่งข้อมูลเหล่านี้อาจเป็นแบบมีโครงสร้าง (เช่น ตาราง) หรือไม่มีโครงสร้าง (เช่น เว็บไซต์ที่ได้รับอนุมัติ)

2. การสร้างข้อความ (Generation)

หลังจากค้นหา ข้อมูลจะถูกส่งเข้า LLM ซึ่ง LLM จะใช้ข้อมูลนั้นสร้างคำตอบเป็นภาษาธรรมชาติ โดยผสมผสานข้อมูลที่ได้รับอนุมัติกับความสามารถด้านภาษา เพื่อให้ได้คำตอบที่แม่นยำ เป็นธรรมชาติ และสอดคล้องกับแบรนด์

ตัวอย่างการใช้งาน RAG

RAG มีประโยชน์อย่างไร? ช่วยให้องค์กรให้ข้อมูลที่เกี่ยวข้อง ให้ความรู้ และให้ข้อมูลที่แม่นยำ

RAG เป็นวิธีตรงไปตรงมาในการลดความเสี่ยงจากข้อมูลผิดพลาดหรือหลอนของ LLM

ตัวอย่างที่ 1: สำนักงานกฎหมาย

สำนักงานกฎหมายอาจใช้ RAG ในระบบ AI เพื่อ:

ค้นหากฎหมาย คำพิพากษา และบรรทัดฐานที่เกี่ยวข้องจากฐานข้อมูลเอกสารระหว่างการวิจัย
สร้างสรุปคดีโดยดึงข้อเท็จจริงสำคัญจากแฟ้มคดีและคำพิพากษาเดิม
แจ้งข่าวสารด้านกฎระเบียบที่เกี่ยวข้องให้พนักงานโดยอัตโนมัติ

ตัวอย่างที่ 2: บริษัทอสังหาริมทรัพย์

บริษัทอสังหาริมทรัพย์อาจใช้ RAG ในระบบ AI เพื่อ:

สรุปข้อมูลจากประวัติการซื้อขายอสังหาริมทรัพย์และสถิติอาชญากรรมในพื้นที่
ตอบคำถามด้านกฎหมายเกี่ยวกับการซื้อขายอสังหาริมทรัพย์โดยอ้างอิงกฎหมายและข้อบังคับท้องถิ่น
ปรับปรุงกระบวนการประเมินราคาโดยดึงข้อมูลจากรายงานสภาพทรัพย์ แนวโน้มตลาด และประวัติการขาย

ตัวอย่างที่ 3: ร้านค้าอีคอมเมิร์ซ

ร้านค้าอีคอมเมิร์ซอาจใช้ RAG ในระบบ AI เพื่อ:

รวบรวมข้อมูลสินค้า สเปก และรีวิวจากฐานข้อมูลบริษัท เพื่อแนะนำสินค้าแบบเฉพาะบุคคล
ดึงประวัติการสั่งซื้อเพื่อสร้างประสบการณ์ช็อปปิ้งที่ปรับให้เหมาะกับแต่ละผู้ใช้
สร้างแคมเปญอีเมลแบบเจาะจงกลุ่มเป้าหมายโดยดึงข้อมูลการแบ่งกลุ่มลูกค้าและผสมกับรูปแบบการซื้อล่าสุด

ข้อดีของ RAG

3 benefits of RAG: prevent hallucinations, retrieve up-to-date information, communicate in complex contexts

ใครที่เคยใช้ ChatGPT หรือ Claude จะทราบดีว่า LLMs มีระบบป้องกันข้อผิดพลาดน้อยมาก

หากไม่มีการควบคุมที่เหมาะสม อาจสร้างข้อมูลผิดหรือเป็นอันตรายได้ ทำให้ไม่เหมาะกับการใช้งานจริง

RAG แก้ปัญหานี้ด้วยการอ้างอิงคำตอบกับแหล่งข้อมูลที่เชื่อถือได้และอัปเดตล่าสุด ลดความเสี่ยงเหล่านี้ได้อย่างมาก

ป้องกันข้อมูลหลอนและข้อผิดพลาด

โมเดลภาษาแบบเดิมมักสร้างข้อมูลหลอน — คำตอบที่ฟังดูน่าเชื่อแต่ผิดหรือไม่เกี่ยวข้อง

RAG ลดปัญหานี้ด้วยการอ้างอิงคำตอบกับแหล่งข้อมูลที่เชื่อถือได้และตรงประเด็น

ขั้นตอนการค้นหาช่วยให้โมเดลอ้างอิงข้อมูลที่ถูกต้องและอัปเดต ลดโอกาสเกิดข้อมูลหลอนและเพิ่มความน่าเชื่อถือ

ดึงข้อมูลล่าสุด

แม้ LLMs จะเก่งหลายด้าน แต่ไม่สามารถให้ข้อมูลที่ถูกต้องเกี่ยวกับเรื่องเฉพาะหรือเหตุการณ์ล่าสุด รวมถึงความรู้เฉพาะของธุรกิจได้

แต่ RAG ช่วยให้โมเดลดึงข้อมูลแบบเรียลไทม์จากแหล่งใดก็ได้ เช่น เว็บไซต์ ตาราง หรือฐานข้อมูล

ตราบใดที่แหล่งข้อมูลได้รับการอัปเดต โมเดลก็จะตอบด้วยข้อมูลล่าสุดเสมอ

สื่อสารในบริบทซับซ้อน

อีกจุดอ่อนของ LLM แบบเดิมคือการสูญเสียข้อมูลบริบท

LLMs มักรักษาบริบทในบทสนทนายาวหรือซับซ้อนได้ไม่ดี ส่งผลให้คำตอบไม่สมบูรณ์หรือขาดตอน

แต่ RAG ช่วยให้โมเดลเข้าใจบริบทได้ดีขึ้นด้วยการดึงข้อมูลจากแหล่งที่เชื่อมโยงกันตามความหมาย

ด้วยข้อมูลเพิ่มเติมที่ตอบโจทย์ผู้ใช้โดยตรง เช่น แชทบอทขายสินค้าที่มีแคตตาล็อกสินค้า RAG ช่วยให้ AI สนทนาแบบเข้าใจบริบทได้

RAG ทำงานอย่างไร?

1. อัปโหลดเอกสาร

เริ่มต้น ผู้สร้างจะอัปโหลดเอกสารหรือไฟล์เข้าสู่คลังความรู้ของ AI ไฟล์อาจเป็นหน้าเว็บ PDF หรือรูปแบบอื่นที่รองรับ ซึ่งจะกลายเป็นส่วนหนึ่งของฐานความรู้ของ AI

2. แปลงเอกสาร

เนื่องจากมีไฟล์หลายประเภท เช่น PDF หน้าเว็บ ฯลฯ ระบบจะทำการแปลงไฟล์เหล่านี้ให้อยู่ในรูปแบบข้อความมาตรฐาน เพื่อให้ AI ประมวลผลและค้นหาข้อมูลที่เกี่ยวข้องได้ง่ายขึ้น

คุณกำลังปรับใช้เอเจนต์ AI อยู่หรือเปล่า?

อ่านคู่มือวางแผนใช้งาน AI Agent ของเรา

อ่านเลย

3. แบ่งส่วนและจัดเก็บ

เอกสารที่แปลงแล้วจะถูกแบ่งเป็นส่วนย่อย ๆ หรือชิ้นข้อมูล (chunk) ที่จัดการได้ง่าย จากนั้นจัดเก็บในฐานข้อมูล เพื่อให้ AI ค้นหาและดึงส่วนที่เกี่ยวข้องได้อย่างมีประสิทธิภาพเมื่อมีการถาม

4. การถามของผู้ใช้

เมื่อเตรียมฐานความรู้แล้ว ผู้ใช้สามารถถามคำถามกับ AI ได้ ระบบจะประมวลผลคำถามด้วย การประมวลผลภาษาธรรมชาติ (NLP) เพื่อเข้าใจสิ่งที่ผู้ใช้ต้องการ

5. ค้นหาความรู้

AI จะค้นหาชิ้นข้อมูลที่จัดเก็บไว้ โดยใช้ขั้นตอนการค้นหาเพื่อหาข้อมูลที่เกี่ยวข้องที่สุดจากเอกสารที่อัปโหลดมาตอบคำถามผู้ใช้

6. สร้างคำตอบ

สุดท้าย AI จะสร้างคำตอบโดยผสมข้อมูลที่ค้นพบกับความสามารถด้านภาษา เพื่อให้ได้คำตอบที่สมบูรณ์และตรงกับบริบทของคำถามและข้อมูลที่ค้นพบ

ฟีเจอร์ RAG ขั้นสูง

หากคุณไม่ใช่นักพัฒนา คุณอาจจะแปลกใจเมื่อรู้ว่า RAG แต่ละระบบไม่ได้เหมือนกันทั้งหมด

แต่ละระบบจะสร้างโมเดล RAG แตกต่างกัน ขึ้นอยู่กับความต้องการ กรณีใช้งาน หรือทักษะของผู้สร้าง

บางแพลตฟอร์ม AI มีฟีเจอร์ RAG ขั้นสูงที่ช่วยเพิ่มความแม่นยำและความน่าเชื่อถือของซอฟต์แวร์ AI ได้อีก

การแบ่งส่วนแบบ semantic กับ naive

Naive chunking คือการแบ่งเอกสารเป็นส่วนขนาดเท่ากัน เช่น ตัดข้อความเป็นช่วงละ 500 คำ โดยไม่สนใจความหมายหรือบริบท

ส่วน semantic chunking จะตัดเอกสารเป็นส่วนที่มีความหมายตามเนื้อหา

โดยจะคำนึงถึงจุดแบ่งธรรมชาติ เช่น ย่อหน้าหรือหัวข้อ เพื่อให้แต่ละส่วนมีข้อมูลที่สมบูรณ์ในตัวเอง

การอ้างอิงแหล่งข้อมูลเป็นข้อบังคับ

สำหรับอุตสาหกรรมที่ใช้ AI ในการสนทนาเสี่ยงสูง เช่น การเงินหรือสุขภาพ การอ้างอิงแหล่งข้อมูลช่วยสร้างความเชื่อมั่นให้ผู้ใช้

นักพัฒนาสามารถตั้งค่าให้ RAG อ้างอิงแหล่งข้อมูลทุกครั้งที่ให้ข้อมูล

เช่น หากพนักงานถามแชทบอท AI เกี่ยวกับสิทธิประโยชน์ด้านสุขภาพ แชทบอทสามารถตอบพร้อมแนบลิงก์ไปยังเอกสารสิทธิประโยชน์ที่เกี่ยวข้อง

สร้าง RAG AI Agent แบบกำหนดเอง

ผสานศักยภาพของ LLMs รุ่นล่าสุดกับความรู้เฉพาะขององค์กรคุณ

Botpress คือแพลตฟอร์มแชทบอท AI ที่ยืดหยุ่นและขยายความสามารถได้ไม่จำกัด

ผู้ใช้สามารถสร้าง AI agent หรือแชทบอทได้ทุกรูปแบบสำหรับทุกกรณีใช้งาน – และยังมีระบบ RAG ที่ล้ำหน้าที่สุดในตลาด

เชื่อมต่อแชทบอทของคุณกับแพลตฟอร์มหรือช่องทางใดก็ได้ หรือเลือกใช้ไลบรารีการเชื่อมต่อสำเร็จรูปของเรา เริ่มต้นได้ง่าย ๆ ด้วยวิดีโอสอนจากช่อง YouTube ของ Botpress หรือคอร์สฟรีจาก Botpress Academy

เริ่มสร้างได้เลยวันนี้ ฟรี

สร้างแชทบอท AI

สร้างแชทบอทอัจฉริยะที่ปรับแต่งได้เอง

เริ่มเลย

คำถามที่พบบ่อย

1. RAG แตกต่างจากการ fine-tune LLM อย่างไร?

RAG (Retrieval-Augmented Generation) แตกต่างจากการปรับแต่งโมเดล (fine-tuning) ตรงที่ RAG จะคงโมเดล LLM ดั้งเดิมไว้โดยไม่เปลี่ยนแปลง และนำความรู้จากภายนอกมาใช้ขณะทำงานด้วยการค้นหาเอกสารที่เกี่ยวข้อง ในขณะที่การปรับแต่งโมเดลจะเปลี่ยนน้ำหนักของโมเดลโดยใช้ข้อมูลฝึก ซึ่งต้องใช้ทรัพยากรมากกว่าและต้องทำซ้ำทุกครั้งที่มีการอัปเดตข้อมูล

2. แหล่งข้อมูลประเภทใดที่ไม่เหมาะสำหรับ RAG?

แหล่งข้อมูลที่ไม่เหมาะกับ RAG ได้แก่ ไฟล์ที่ไม่ใช่ข้อความ เช่น เอกสารสแกน, PDF ที่เป็นภาพ, ไฟล์เสียงที่ไม่มีการถอดคำพูด และเนื้อหาที่ล้าสมัยหรือขัดแย้งกัน ข้อมูลเหล่านี้จะทำให้ความแม่นยำของบริบทที่ค้นหาได้น้อยลง

3. RAG แตกต่างจากเทคนิคการเรียนรู้แบบ in-context เช่น prompt engineering อย่างไร?

RAG แตกต่างจาก prompt engineering ตรงที่ RAG จะค้นหาข้อมูลที่เกี่ยวข้องจากฐานความรู้ขนาดใหญ่ที่จัดทำดัชนีไว้ในขณะรับคำถาม แทนที่จะใช้ตัวอย่างที่ฝังไว้ใน prompt แบบคงที่ด้วยตนเอง วิธีนี้ช่วยให้ RAG ขยายขนาดได้ง่ายกว่าและอัปเดตความรู้ได้ตลอดโดยไม่ต้องฝึกโมเดลใหม่

4. ฉันสามารถใช้ RAG กับ LLM ของบุคคลที่สาม เช่น OpenAI, Anthropic หรือ Mistral ได้หรือไม่?

ได้ คุณสามารถใช้ RAG กับ LLM จาก OpenAI, Anthropic, Mistral หรือรายอื่น ๆ ได้ โดยจัดการกระบวนการค้นหาข้อมูลแยกต่างหาก แล้วส่งบริบทที่ค้นหาได้ไปยัง LLM ผ่าน API RAG สามารถใช้กับโมเดลใดก็ได้ ตราบใดที่ LLM รองรับการรับข้อมูลบริบทผ่าน prompt

5. การดูแลรักษา AI agent ที่ใช้ RAG ต้องทำอะไรบ้าง?

การดูแลรักษา AI agent ที่ใช้ RAG ประกอบด้วย การอัปเดตฐานความรู้ด้วยเอกสารใหม่หรือแก้ไขข้อมูล, การจัดทำดัชนีเนื้อหาใหม่เป็นระยะ, ประเมินคุณภาพการค้นหา, ปรับขนาดชิ้นข้อมูลและวิธีฝังข้อมูล และตรวจสอบคำตอบของ agent เพื่อป้องกันข้อผิดพลาดหรือการสร้างข้อมูลเท็จ