Dalam pelajaran ini

Kita telah banyak membahas tentang mengoptimalkan teks, namun jika dokumen Anda berisi gambar atau tabel, penting untuk mengambil beberapa langkah tambahan untuk memastikan elemen-elemen ini juga dapat digunakan oleh agen Anda. Konten non-teks seperti gambar, bagan, dan tabel dapat menyimpan informasi yang berharga, namun tanpa persiapan yang matang, LLM dapat mengabaikan atau salah menafsirkan informasi yang dikandungnya.

Mari kita mulai dengan gambar. Jika dokumen Anda berisi gambar, yang mungkin berupa foto produk atau bahkan teks yang sangat bergaya, sebaiknya Anda mengonversinya menjadi teks biasa sebelum mengunggah file Anda. Botpress akan memproses terlebih dahulu file Anda setelah Anda mengunggahnya, jadi cara terbaik untuk mendapatkan jawaban yang konsisten dari file Anda adalah dengan mengonversinya sendiri.

Mari kita ambil contoh menu restoran bergaya ini. Sebelum mengonversinya menjadi file plaintext, informasi yang harus dikerjakan oleh LLM akan terlihat seperti ini, setelah diuraikan. Sebaliknya, jika kita mengonversinya menjadi markdown sebelum mengunggahnya (atau menggunakan editor teks kaya Botpress bawaan), maka kita akan mendapatkan hasil yang jauh lebih andal.

Selanjutnya, mari kita bahas tentang tabel dan data terstruktur. Jika Anda menyertakan tabel dalam dokumen Anda, ingatlah bahwa sebelum melakukan RAG, file Anda akan dikonversi ke markdown. Di sini, Anda memiliki dua opsi. Anda dapat menetapkan tabel Botpress bawaan sebagai basis pengetahuan, sehingga informasi Anda terstruktur, atau Anda dapat menggunakan tabel berformat markdown seperti itu.

Mengoptimalkan konten non-tekstual berarti memproses gambar dengan OCR, menambahkan deskripsi untuk visual yang kompleks, dan memastikan tabel disajikan dengan cara yang dapat digunakan oleh agen AI Anda. Di sini, tujuan kami adalah membuat seluruh dataset-termasuk konten teks dan non-teks-mudah dibaca oleh LLM .

Ringkasan
Mengonversi gambar dan dokumen yang diberi gaya menjadi teks biasa, mengoptimalkan tabel dengan pemformatan terstruktur atau penurunan harga, dan memproses konten non-tekstual untuk memastikan agen AI Anda dapat menafsirkan dan menggunakan semua informasi dalam kumpulan data Anda secara akurat.
semua pelajaran dalam kursus ini