เราได้พูดคุยกันมากมายเกี่ยวกับการปรับแต่งข้อความ แต่หากเอกสารของคุณมีรูปภาพหรือตาราง สิ่งสำคัญคือต้องดำเนินการเพิ่มเติมอีกสองสามขั้นตอนเพื่อให้แน่ใจว่าเอเจนต์ของคุณยังใช้องค์ประกอบเหล่านี้ได้เช่นกัน เนื้อหาที่ไม่ใช่ข้อความ เช่น รูปภาพ แผนภูมิ และตารางสามารถเก็บข้อมูลที่มีค่าได้ แต่หากไม่ได้เตรียมการอย่างรอบคอบ LLM อาจละเลยหรือตีความข้อมูลที่มีอยู่ผิดไปได้
เริ่มต้นด้วยรูปภาพก่อน หากเอกสารของคุณมีรูปภาพ ซึ่งอาจเป็นรูปถ่ายผลิตภัณฑ์หรือข้อความที่มีสไตล์ ควรแปลงเป็นข้อความธรรมดา เสียก่อนจึงจะ อัปโหลดไฟล์ได้ Botpress จะประมวลผลไฟล์ของคุณล่วงหน้าอยู่แล้วเมื่อคุณอัปโหลด ดังนั้นวิธีที่ดีที่สุดในการได้รับคำตอบที่สม่ำเสมอจากไฟล์ของคุณคือการแปลงไฟล์ด้วยตัวคุณเอง
มาดูตัวอย่างเมนูร้านอาหารแบบมีสไตล์นี้กัน ก่อนที่จะแปลงเป็นไฟล์ข้อความธรรมดา ข้อมูลที่ LLM ต้องทำงานด้วยลักษณะเช่นนี้ หลังจากวิเคราะห์แล้ว หากเราแปลงเป็นมาร์กดาวน์ก่อนอัปโหลด (หรือใช้ฟังก์ชันในตัว) Botpress โปรแกรมแก้ไขข้อความที่หลากหลาย) แล้วเราจะได้ผลลัพธ์ที่น่าเชื่อถือมากยิ่งขึ้น
ต่อไปเรามาพูดถึงตารางและข้อมูลที่มีโครงสร้างกัน หากคุณกำลังรวมตารางไว้ในเอกสารของคุณ โปรดจำไว้ว่าก่อนที่จะดำเนินการ RAG ไฟล์ของคุณจะถูกแปลงเป็นมาร์กดาวน์ ที่นี่ คุณมีสองตัวเลือก คุณสามารถกำหนดตารางในตัวได้ Botpress ตารางเป็นฐานความรู้ เพื่อให้ข้อมูลของคุณมีโครงสร้าง หรือคุณสามารถใช้ตารางที่มีรูปแบบมาร์กดาวน์ดังนี้ได้
การเพิ่มประสิทธิภาพเนื้อหาที่ไม่ใช่ข้อความหมายถึงการประมวลผลภาพด้วย OCR การเพิ่มคำอธิบายสำหรับภาพที่ซับซ้อน และการทำให้แน่ใจว่าตารางถูกนำเสนอในลักษณะที่ตัวแทน AI ของคุณสามารถใช้ได้ ที่นี่ เป้าหมายของเราคือการทำให้ชุดข้อมูลทั้งหมด—ซึ่งรวมถึงเนื้อหาทั้งข้อความและไม่ใช่ข้อความ—เป็นเรื่องง่ายสำหรับ LLM ที่จะอ่าน