Academy
วิธีปรับแต่งไฟล์สำหรับ RAG
การเตรียมข้อความล่วงหน้า
3
rag
8
7
6
5
4
2
3
1
5
15
11
9
20
18
19
17
16
15
14
13
12
11
10
8
7
6
5
4
3
2
1
10
18
17
16
14
13
12
10
9
8
7
6
4
3
2
1
9
8
7
6
5
4
3
2
1
7
6
5
4
3
2
1
6
5
4
3
2
1
บทเรียนถัดไป
บทเรียนถัดไป
ในบทเรียนนี้

หลังจากที่เราได้พูดถึงประเภทไฟล์และรูปแบบไฟล์แล้ว ต่อไปเราจะมาดูเรื่อง การเตรียมข้อความล่วงหน้า นี่คือขั้นตอนที่เราจะทำความสะอาดและปรับเนื้อหาในแต่ละเอกสารให้ง่ายต่อการเข้าใจและค้นหาข้อมูลที่ถูกต้องโดยเอเจนต์ของคุณ

ขั้นแรก สิ่งสำคัญคือต้องลบข้อมูลที่ไม่จำเป็นออกไป ลองพิจารณาว่าแต่ละส่วนของเนื้อหาในเอกสารของคุณมีประโยชน์ต่อการตอบคำถามของผู้ใช้หรือไม่ ตัวอย่างเช่น หากคุณต้องการตอบคำถามเกี่ยวกับแคตตาล็อกสินค้า ข้อความแจ้งทางกฎหมายที่ไม่เกี่ยวข้องโดยตรงอาจสร้างปัญหาได้ การลบข้อมูลเหล่านี้จะช่วยลดสิ่งรบกวน ทำให้ชุดข้อมูลของคุณสะอาดและค้นหาได้ง่ายขึ้น นอกจากนี้ควรลบข้อมูลเมตาที่ไม่จำเป็น รวมถึงส่วนหัวหรือท้ายเอกสารที่อาจรบกวนการจัดทำดัชนีด้วย

อีกส่วนสำคัญของกระบวนการนี้คือการทำให้ข้อความอ่านง่ายขึ้น ศัพท์เฉพาะทาง เทคนิค หรือประโยคที่ซับซ้อนเกินไป อาจทำให้เกิดความคลุมเครือ หากเอกสารซับซ้อนเกินไป อาจทำให้ประมวลผลช้าลงและให้คำตอบที่ไม่ชัดเจน ลองปรับเนื้อหาที่แน่นหรือซับซ้อน หรือพิจารณาตัดศัพท์เฉพาะอุตสาหกรรมออกหากไม่จำเป็นจริง ๆ

หากเอกสารของคุณมีข้อความยาวหรือประโยคซับซ้อน อาจใช้เครื่องมือช่วยปรับข้อความให้ง่ายขึ้นโดยอัตโนมัติ เครื่องมือเหล่านี้จะช่วยแบ่งข้อความที่ซับซ้อนให้เป็นประโยคสั้น ๆ และชัดเจนขึ้น ทำให้ Botpress สามารถแบ่งและตีความเนื้อหาได้แม่นยำขึ้น

โดยสรุป เป้าหมายของขั้นตอนนี้คือทำให้ข้อความตรงประเด็นและเข้าใจง่ายที่สุด ด้วยการลบข้อมูลที่ไม่จำเป็นและปรับภาษาง่ายขึ้น คุณจะได้ชุดข้อมูลที่กระชับและเน้นเฉพาะจุด ซึ่งช่วยให้ค้นหาข้อมูลได้ดีและแม่นยำขึ้น

อย่าลืมว่า หลักการง่าย ๆ คือให้มองเอเจนต์ AI ของคุณเหมือนเพื่อนร่วมงานใหม่ที่ไม่รู้อะไรเกี่ยวกับสินค้า อุตสาหกรรม หรือธุรกิจของคุณเลย

สรุป
ลบข้อมูลที่ไม่เกี่ยวข้องและปรับภาษาง่ายขึ้น เพื่อสร้างชุดข้อมูลที่สะอาดและเน้นเฉพาะจุด ช่วยให้เอเจนต์ AI ทำงานได้ดีขึ้นและค้นหาข้อมูลได้แม่นยำขึ้น
บทเรียนทั้งหมดในคอร์สนี้
Fresh green broccoli floret with thick stalks.