ในคอร์สนี้ เราจะเรียนรู้วิธีปรับแต่งไฟล์และข้อมูลสำหรับ Retrieval-Augmented Generation หรือ RAG
เมื่อจบคอร์สนี้ คุณจะมีขั้นตอนที่นำไปใช้ได้จริง เพื่อช่วยปรับปรุงคุณภาพของคำตอบที่ LLM สร้างขึ้นเมื่อใช้แหล่งความรู้แบบกำหนดเอง
RAG ผสานสองแนวคิดหลัก: การค้นคืนข้อมูล และ การสร้างข้อความ ช่วยให้เอเจนต์ AI ของคุณดึงข้อมูลที่ตรงจุดจากแหล่งข้อมูลขนาดใหญ่ เช่น แค็ตตาล็อกสินค้า หรือรายการนโยบาย แล้วใช้โมเดลภาษาในการสร้างคำตอบที่เป็นธรรมชาติและให้ข้อมูลครบถ้วน หมายความว่าเอเจนต์จะไม่เพียงแค่ตอบ แต่ยังให้ คำตอบที่ถูกต้อง จากแหล่งที่เชื่อถือได้อย่างรวดเร็วและแม่นยำ
แต่สิ่งสำคัญคือ คุณภาพของคำตอบจากเอเจนต์ขึ้นอยู่กับคุณภาพและโครงสร้างของข้อมูลที่คุณป้อน หากข้อมูลที่ใส่เข้าไปยุ่งเหยิง ซ้ำซ้อน หรือไม่มีโครงสร้าง คำตอบของเอเจนต์ก็จะสะท้อนสิ่งนั้น นี่คือเหตุผลที่ การเตรียมข้อมูลล่วงหน้า มีความสำคัญมาก การเตรียมข้อมูลอย่างรอบคอบจะเป็นรากฐานให้ได้คำตอบที่มีคุณภาพ มีความหมาย และแม่นยำ
ในซีรีส์นี้ เราจะพาคุณไปรู้ทุกอย่างที่จำเป็นสำหรับการเตรียมไฟล์และข้อมูลให้พร้อมสำหรับ RAG โดยเนื้อหาจะครอบคลุมเรื่องต่อไปนี้:
- วิธีจัดโครงสร้างเอกสารให้เข้าใจง่าย
- แนวทางปฏิบัติที่ดีที่สุดในการทำความสะอาดและย่อข้อความ
- การเพิ่มข้อมูลเมตาและสรุปเพื่อให้บริบทสมบูรณ์ยิ่งขึ้น
- การปรับแต่งข้อมูลที่ไม่ใช่ข้อความ เช่น รูปภาพและตาราง
- การตรวจสอบและดูแลข้อมูล
แต่ละวิดีโอจะอธิบายขั้นตอนเหล่านี้พร้อมตัวอย่าง เพื่อให้คุณนำไปใช้กับโปรเจกต์ AI ของคุณได้ทันที เมื่อจบซีรีส์นี้ คุณจะมีเครื่องมือในการนำชุดข้อมูลใด ๆ มาปรับให้เหมาะกับ RAG และเพิ่มประสิทธิภาพของเอเจนต์ AI ของคุณ
