Bu derste

Metni optimize etmekten çok bahsettik, ancak belgeleriniz resim veya tablo içeriyorsa, bu öğelerin de temsilciniz tarafından kullanılabilir olmasını sağlamak için birkaç ekstra adım atmanız önemlidir. Resimler, grafikler ve tablolar gibi metin dışı içerikler değerli bilgiler içerebilir, ancak dikkatli bir hazırlık yapılmazsa LLM bu bilgileri görmezden gelebilir veya yanlış yorumlayabilir.

Resimlerle başlayalım. Belgeleriniz herhangi bir resim içeriyorsa (bu bir ürünün fotoğrafı veya çok stilize edilmiş bir metin bile olabilir), dosyanızı yüklemeden önce bunu düz metne dönüştürmek harika bir fikirdir. Botpress dosyalarınızı yüklediğinizde zaten ön işleme tabi tutacaktır, bu nedenle dosyalarınızdan tutarlı yanıtlar almanın en iyi yolu onları kendiniz dönüştürmektir.

Örneğin bu stilize restoran menüsünü ele alalım. Bir düz metin dosyasına dönüştürmeden önce, LLM 'un üzerinde çalışması gereken bilgiler ayrıştırıldıktan sonra bu şekilde görünür. Bunun yerine, yüklemeden önce markdown'a dönüştürürsek (veya yerleşik Botpress zengin metin düzenleyicisini kullanırsak), çok daha güvenilir sonuçlar elde ederiz.

Şimdi de tablolar ve yapılandırılmış veriler hakkında konuşalım. Belgelerinize tablolar ekliyorsanız, RAG gerçekleştirmeden önce dosyalarınızın markdown'a dönüştürüldüğünü unutmayın. Burada iki seçeneğiniz vardır. Yerleşik bir Botpress tablosunu bilgi tabanı olarak belirleyebilirsiniz, böylece bilgileriniz yapılandırılmış olur veya aşağıdaki gibi markdown biçiminde bir tablo kullanabilirsiniz.

Metin dışı içeriği optimize etmek, görüntüleri OCR ile işlemek, karmaşık görseller için açıklamalar eklemek ve tabloların yapay zeka aracınızın kullanabileceği şekilde sunulmasını sağlamak anlamına gelir. Burada amacımız, hem metin hem de metin dışı içerik dahil olmak üzere tüm veri kümesini bir LLM 'un okuması için kolay hale getirmektir.

Özet
Yapay zeka aracınızın veri kümenizdeki tüm bilgileri doğru bir şekilde yorumlayıp kullanabilmesini sağlamak için görüntüleri ve stilize edilmiş belgeleri düz metne dönüştürün, tabloları yapılandırılmış biçimlendirme veya işaretleme ile optimize edin ve metin dışı içeriği işleyin.
bu kurstaki̇ tüm dersler