在本课中
我们已经谈了很多关于优化文本的内容,但如果您的文档中包含图片或表格,就必须采取一些额外的步骤来确保您的代理人也能使用这些元素。图片、图表和表格等非文字内容可能包含有价值的信息,但如果没有精心准备,LLM ,代理可能会忽略或误解其中包含的信息。
让我们从图片开始。如果您的文件包含任何图片,可能是产品的照片,甚至是非常风格化的文本,那么最好在上传文件前将其转换为纯文本。Botpress 会在您上传文件后对文件进行预处理,因此从文件中获得一致答案的最佳方法就是自己转换文件。
以这个风格化的餐厅菜单为例。在将其转换为纯文本文件之前,LLM 要处理的信息在经过解析后是这样的。相反,如果我们在上传前将其转换为 markdown 文件(或使用Botpress 内置的富文本编辑器),就能得到更可靠的结果。
接下来,我们来谈谈表格和结构化数据。如果您在文档中包含表格,请记住在执行 RAG 之前,您的文件会被转换为标记符。在这里,你有两个选择。你可以指定一个内置的Botpress 表格作为知识库,这样你的信息就结构化了,或者你也可以使用类似这样的标记符格式的表格。
优化非文本内容意味着使用 OCR 处理图片,为复杂的视觉效果添加说明,以及确保表格以人工智能代理可以使用的方式呈现。在这里,我们的目标是使整个数据集(包括文本和非文本内容)易于LLM 阅读。
摘要
将图片和样式化文档转换为纯文本,使用结构化格式或标记符优化表格,并处理非文本内容,以确保人工智能代理能够准确解释和利用数据集中的所有信息。
本课程的所有课程