如何为RAG优化文件 | 图片与表格

课程

初级

中级

高级

本课内容

我们已经多次讨论了文本优化，但如果您的文档包含图片或表格，还需要额外采取一些措施，确保这些元素也能被您的代理使用。非文本内容，如图片、图表和表格，可能包含有价值的信息，但如果没有仔细处理，大型语言模型可能会忽略或误解其中的信息。

我们先来说说图片。如果您的文档中包含图片，比如产品照片或非常有设计感的文本，建议在上传文件之前将其转换为纯文本。无论如何，Botpress在您上传文件后都会进行预处理，因此，想要从文件中获得一致的答案，最好的方法就是自己先进行转换。

以这个有设计感的餐厅菜单为例。在转换为纯文本文件之前，LLM能处理的信息在解析后大致如下。如果我们在上传前将其转换为Markdown格式（或使用内置的Botpress富文本编辑器），就能获得更加可靠的结果。

接下来，我们来谈谈表格和结构化数据。如果您的文档中包含表格，请记住，在执行RAG之前，您的文件会被转换为Markdown格式。在这里，您有两个选择：可以将内置的Botpress表格指定为知识库，使信息结构化；或者像这样使用Markdown格式的表格。

优化非文本内容意味着使用OCR处理图片，为复杂的视觉内容添加描述，并确保表格以AI代理能够使用的方式呈现。我们的目标是让整个数据集——包括文本和非文本内容——都便于LLM读取。

‍

摘要

将图片和带有样式的文档转换为纯文本，使用结构化格式或Markdown优化表格，并处理非文本内容，确保您的AI代理能够准确理解并利用数据集中的所有信息。

本课程全部课程