Como otimizar arquivos para RAG | Imagens e Tabelas

Cursos

Iniciante

Seu primeiro Agente de IA

Interface do Studio

Interface do Painel

Intermediário

Preços

Nós Autônomos

Avançado

Otimizando Arquivos para RAG

Nesta lição

Já falamos bastante sobre otimização de texto, mas se seus documentos contêm imagens ou tabelas, é importante tomar alguns cuidados extras para garantir que esses elementos também possam ser usados pelo seu agente. Conteúdos não textuais, como imagens, gráficos e tabelas, podem conter informações valiosas, mas sem uma preparação adequada, um LLM pode ignorar ou interpretar de forma errada o que está ali.

Vamos começar pelas imagens. Se seus documentos tiverem imagens, seja uma foto de um produto ou até mesmo textos muito estilizados, é uma ótima prática converter isso para texto simples antes de fazer o upload do arquivo. O Botpress já faz um pré-processamento dos arquivos ao enviá-los, então a melhor forma de garantir respostas consistentes dos seus arquivos é você mesmo converter esses conteúdos.

Vamos pegar como exemplo esse cardápio de restaurante estilizado. Antes de converter para um arquivo em texto simples, as informações com as quais o LLM pode trabalhar ficam assim, depois de serem processadas. Em vez disso, se convertermos para markdown antes do upload (ou usarmos o editor de texto avançado do Botpress), os resultados são muito mais confiáveis.

Agora, vamos falar sobre tabelas e dados estruturados. Se você incluir tabelas nos seus documentos, lembre-se que, antes de executar o RAG, seus arquivos são convertidos para markdown. Aqui, você tem duas opções: pode definir uma tabela nativa do Botpress como base de conhecimento, deixando as informações estruturadas, ou pode usar uma tabela formatada em markdown, como neste exemplo.

Otimizar conteúdos não textuais significa processar imagens com OCR, adicionar descrições para visuais complexos e garantir que as tabelas estejam apresentadas de forma que seu agente de IA consiga utilizar. O objetivo aqui é tornar todo o conjunto de dados — incluindo texto e conteúdo não textual — fácil de ser lido por um LLM.

‍

Resumo

Converta imagens e documentos estilizados em texto simples, otimize tabelas com formatação estruturada ou markdown e processe conteúdos não textuais para garantir que seu agente de IA consiga interpretar e utilizar corretamente todas as informações do seu conjunto de dados.

todas as lições deste curso

Introdução ao Curso

2 min

Estruturando Dados para RAG

1 min

Pré-processamento de Texto

2 min

Aprimorando o Conteúdo dos Documentos

2 min

Imagens e Tabelas

3 min

Manutenção e Validação

2 min

Fresh green broccoli floret with thick stalks.