Já falamos bastante sobre otimização de texto, mas se seus documentos contêm imagens ou tabelas, é importante tomar alguns cuidados extras para garantir que esses elementos também possam ser usados pelo seu agente. Conteúdos não textuais, como imagens, gráficos e tabelas, podem conter informações valiosas, mas sem uma preparação adequada, um LLM pode ignorar ou interpretar de forma errada o que está ali.
Vamos começar pelas imagens. Se seus documentos tiverem imagens, seja uma foto de um produto ou até mesmo textos muito estilizados, é uma ótima prática converter isso para texto simples antes de fazer o upload do arquivo. O Botpress já faz um pré-processamento dos arquivos ao enviá-los, então a melhor forma de garantir respostas consistentes dos seus arquivos é você mesmo converter esses conteúdos.
Vamos pegar como exemplo esse cardápio de restaurante estilizado. Antes de converter para um arquivo em texto simples, as informações com as quais o LLM pode trabalhar ficam assim, depois de serem processadas. Em vez disso, se convertermos para markdown antes do upload (ou usarmos o editor de texto avançado do Botpress), os resultados são muito mais confiáveis.
Agora, vamos falar sobre tabelas e dados estruturados. Se você incluir tabelas nos seus documentos, lembre-se que, antes de executar o RAG, seus arquivos são convertidos para markdown. Aqui, você tem duas opções: pode definir uma tabela nativa do Botpress como base de conhecimento, deixando as informações estruturadas, ou pode usar uma tabela formatada em markdown, como neste exemplo.
Otimizar conteúdos não textuais significa processar imagens com OCR, adicionar descrições para visuais complexos e garantir que as tabelas estejam apresentadas de forma que seu agente de IA consiga utilizar. O objetivo aqui é tornar todo o conjunto de dados — incluindo texto e conteúdo não textual — fácil de ser lido por um LLM.
