Nous avons beaucoup parlé de l'optimisation du texte, mais si vos documents contiennent des images ou des tableaux, il est important de prendre quelques mesures supplémentaires pour s'assurer que ces éléments sont également utilisables par votre agent. Le contenu non textuel comme les images, les graphiques et les tableaux peut contenir des informations précieuses, mais sans une préparation minutieuse, un LLM peut ignorer ou mal interpréter les informations qu'ils contiennent.
Commençons par les images. Si vos documents contiennent des images, qu'il s'agisse d'une photo d'un produit ou d'un texte très stylisé, il est conseillé de les convertir en texte brut avant de télécharger votre fichier. Botpress prétraitera de toute façon vos fichiers une fois que vous les aurez téléchargés, de sorte que la meilleure façon d'obtenir des réponses cohérentes à partir de vos fichiers est de les convertir vous-même.
Prenons par exemple ce menu de restaurant stylisé. Avant de le convertir en fichier texte, les informations que LLM doit traiter ressemblent à ceci, après avoir été analysées. En revanche, si nous les convertissons en markdown avant de les télécharger (ou en utilisant l'éditeur de texte enrichi intégré à Botpress ), nous obtenons des résultats beaucoup plus fiables.
Parlons maintenant des tableaux et des données structurées. Si vous incluez des tableaux dans vos documents, rappelez-vous qu'avant d'effectuer le RAG, vos fichiers sont convertis en markdown. Deux options s'offrent alors à vous. Vous pouvez désigner un tableau intégré à Botpress comme base de connaissances, afin que vos informations soient structurées, ou vous pouvez utiliser un tableau formaté en markdown comme celui-ci.
L'optimisation du contenu non textuel consiste à traiter les images à l'aide de l'OCR, à ajouter des descriptions pour les éléments visuels complexes et à veiller à ce que les tableaux soient présentés d'une manière exploitable par votre agent d'intelligence artificielle. Ici, notre objectif est de faire en sorte que l'ensemble du jeu de données - y compris le contenu textuel et non textuel - soit facile à lire pour LLM .