Já falámos muito sobre a otimização do texto, mas se os seus documentos contiverem imagens ou tabelas, é importante tomar algumas medidas adicionais para garantir que estes elementos também podem ser utilizados pelo seu agente. O conteúdo não textual, como imagens, gráficos e tabelas, pode conter informações valiosas, mas sem uma preparação cuidadosa, um LLM pode ignorar ou interpretar mal as informações que contêm.
Comecemos pelas imagens. Se seus documentos contiverem imagens, que podem ser uma foto de um produto ou até mesmo um texto muito estilizado, é uma ótima ideia convertê-las em texto simples antes de carregar o arquivo. Botpress pré-processará seus arquivos de qualquer forma quando você carregá-los, portanto, a melhor maneira de obter respostas consistentes de seus arquivos é convertê-los você mesmo.
Vejamos, por exemplo, este menu estilizado de um restaurante. Antes de o converter para um ficheiro de texto simples, a informação com que o LLM tem de trabalhar tem o seguinte aspeto, depois de ter sido analisada. Em vez disso, se o convertermos para markdown antes de o carregarmos (ou se utilizarmos o editor de rich text incorporado em Botpress ), obteremos resultados muito mais fiáveis.
Em seguida, vamos falar sobre tabelas e dados estruturados. Se estiver a incluir tabelas nos seus documentos, lembre-se de que, antes de executar o RAG, os seus ficheiros são convertidos para markdown. Aqui, tem duas opções. Pode designar uma tabela incorporada em Botpress como uma base de conhecimentos, para que as suas informações sejam estruturadas, ou pode utilizar uma tabela formatada em markdown, como esta.
Otimizar o conteúdo não textual significa processar imagens com OCR, adicionar descrições para imagens complexas e garantir que as tabelas são apresentadas de uma forma que o seu agente de IA possa utilizar. Aqui, o nosso objetivo é tornar todo o conjunto de dados - incluindo o conteúdo textual e não textual - fácil de ler para um LLM .