如果您使用过GPT 聊天机器人(如ChatGPT ),您可能会注意到它的输出质量参差不齐。
有时,它能准确地提供你所需要的信息。有时,你会怀疑人工智能的 "智能 "有点像一场闹剧。
您可以通过改进 ChatGPT通过改进提示方式,让你的游戏更上一层楼。思维链提示鼓励LLM 在做出反应之前,一步一步地推理任务。
较新的人工智能模型和功能开始直接建立思维链推理,这样它们的模型就能自动推理出问题,而无需任何额外提示。
什么是思维链提示?
思维链提示是人工智能中的一种提示工程技术,它指示模型分解复杂的任务,在做出反应之前对每个步骤进行推理。
您可能还会听到 "思维链推理 "一词。这指的是模型在完成手头任务时的逐步推理过程。
OpenAI o1模型不需要思维链提示,因为它们已经内置了思维链推理功能。但您可以在任何LLM 支持的聊天机器人上使用思维链提示。
思维链推理是如何进行的?
思维链推理需要将问题分解成更小的逻辑步骤,让人工智能聊天机器人依次解决。
首先,人工智能会确定问题的关键部分。然后,它依次处理每个部分,考虑一个步骤如何导致下一个步骤。每一步都建立在前一步的基础上,让人工智能有条不紊地得出合乎逻辑的结论。
思维链提示实例
著名的 "草莓 "提示
ChatGPT 和其他LLMs 的弱点是有据可查的。其一是它们无法正确识别 "草莓 "一词中有多少个 "R"(这可能是 o1 模型代号 "草莓 "背后的著名限制)。
ChatGPT-4o 不使用思维链推理。相反,它参考训练数据,根据每个单词在前一个单词之后的可能性生成反应。虽然它在大多数时候听起来都很正确,但它只是在模仿人类语言,而不是在进行推理或研究。
当您向ChatGPT-4o 提出著名的草莓问题时,它无法给出正确答案:
不过,您可以使用思维链提示技术帮助LLM 聊天机器人得出正确答案:
ChatGPT 的最新迭代由OpenAI o1-preview 支持,是首个使用思维链推理而无需任何额外提示的主要LLM 。
它第一次尝试就能破解答案,因为它已收到指示,自动遵循与上述第二个ChatGPT-4o 提示相同的过程。唯一不同的是,它不需要额外的提示就能完成这一过程。
数学
如果你向旧版本的ChatGPT 提出一道小学课本上的数学题,它不一定能答对。
多步骤数学问题需要推理,这在早期的LLMs 中并不存在。你可以分解问题的每一步,但如果你不知道正确的步骤,LLM 也帮不上忙。
ChatGPT-4o 能够通过分解问题中的一系列步骤,推理出问题的答案:
与 Hubspot 连接的人工智能代理
在现实应用中,让我们以已集成到 Hubspot 的LLM人工智能代理 为例。销售团队使用该人工智能代理处理通过各种渠道收集到的新线索。
场景
销售人员向人工智能代理发送一个新的销售线索,要求它在 Hubspot 中注册并发送第一封接触点电子邮件,但如果该销售线索所在的公司已经是潜在客户,则不要填写。
LLM 缺乏思维推理
由LLM 驱动的人工智能代理注册了潜在客户并发送了电子邮件,但却没有检查该公司是否已经是潜在客户,从而错失了关键条件。
LLM 用思维链推理
由LLM 驱动的人工智能代理在采取行动前会检查该公司是否已经是潜在客户。如果是潜在客户,它就会跳过注册和电子邮件发送;如果不是,它就会准确地按照销售人员的指示注册该客户并发送电子邮件。
何时使用思维链提示?
思维链提示最好用于需要逐步推理的情景。
涉及逻辑推导的任务、数学问题、程序任务或任何需要多步骤回答的情况都是首选。
但等等:推理听起来很不错,我为什么不一直用呢?
问得好。并非所有问题都需要推理。例如
- 简单的事实性问题,如 "加拿大的首都是哪里?
- 单步问题,如 "145 + 37 是多少?
- 内容生成任务,比如 "写一封礼貌的三句话电子邮件,询问我的同事他们的项目是否已经完成。
思维链提示Botpress
Botpress 用户已经熟悉了采用思维链推理的功能。
自主节点于 2024 年 7 月在Botpress 上首次亮相,这是一个用于构建人工智能代理的平台。自主节点能够自动执行多步骤工作流程并自主做出决策。
可以创建一个自主节点,并用一行简单的文字进行提示,如 "您的目的是生成合格的销售线索。当用户表明购买意向时,在 Salesforce 中创建线索。
您使用该自主节点构建的人工智能代理将采取各种行动来实现其目标,而不受人类设计的工作流程的影响。它还可以根据需要在不同的LLMs 之间切换,决定优先考虑速度还是功率。
建立自己的自主代理
Botpress 是唯一能让您构建真正自主代理的人工智能代理平台。
开放而灵活的Botpress Studio 允许从人力资源到潜在客户生成等各行各业无穷无尽的使用案例。我们预建的集成库和丰富的教程可让用户轻松地从零开始构建人工智能代理。
今天就开始建设。它是免费的。