How do I know if my AI system needs human-in-the-loop involvement?

Your AI system likely needs human-in-the-loop involvement if it handles high-stakes decisions, frequently encounters ambiguous or rare situations, risks producing biased or harmful outputs, or operates in areas where absolute accuracy and human judgment are essential for compliance or customer trust.

Can human-in-the-loop be used in non-technical business processes, or only in AI models?

Human-in-the-loop can be used in non-technical business processes like reviewing customer complaints or moderating content, because it means inserting human judgment into any automated workflow where machine decisions alone might be insufficient.

Does using human-in-the-loop mean my AI system is less advanced?

Using human-in-the-loop doesn’t mean your AI system is less advanced. It shows you’re prioritizing safety and fairness by combining AI’s speed and pattern recognition with human judgment for nuanced decisions, which is often essential.

Is human-in-the-loop AI cost-effective for small businesses, or only for large enterprises?

Human-in-the-loop AI is increasingly cost-effective for small businesses because modern tools allow you to selectively involve humans only for tricky cases, minimizing labor costs while still improving accuracy and trust without needing a large workforce.

How much does it cost to add human-in-the-loop processes to an AI system?

Adding human-in-the-loop processes can cost anywhere from minimal — if you use in-house staff occasionally — to significant, running into hundreds or thousands of dollars monthly if you require dedicated reviewers or specialized contractors, with costs driven largely by the volume and complexity of the tasks humans must handle.

AI中的人类参与：更高准确性，更低风险

作者

Ben Luks

计算语言学家、人工智能研究员、人工智能语音技术硕士

摘要

人类参与（HITL）将人工监督与AI系统结合，以提升准确性。
人类通过标注数据、审核AI输出、处理升级问题以及指导模型改进等方式介入。
HITL提升了可靠性，减少了偏见，实现了持续学习，并让AI系统更加透明。
应用场景涵盖自动驾驶汽车、零售机器人、金融风险审核和医疗决策等领域。

如果你正在考虑用AI提升业务，你并不孤单。随着AI聊天机器人成为增长最快的沟通渠道，它们已不再是奢侈品，而是用户的基本期待。

但放弃控制权可能让人感到不安。将关键操作交给所谓的“黑箱算法”，确实需要很大的信任。

确实如此，这也是为什么企业依赖人工干预来引导AI。几乎所有AI代理框架都包含人类参与——即对AI操作进行人工监督。

Illustration of a human in a loop of rope

本文将解释什么是人类参与、其工作原理，并举例说明日常中人类如何介入，为AI聊天机器人和代理赋予用户更多控制权。

构建AI聊天机器人

打造定制化智能代理聊天机器人

立即开始

什么是人类参与？

人类参与（HITL）是一种AI协作方式，通过引入人工输入来提升或扩展AI能力。这可以表现为人工标注数据、修正模型输出，或在AI不确定或效果不佳时由人类完成整个任务。

这个术语有些模糊。从技术上讲，它指的是AI应用生命周期中任何阶段的人为介入——从数据标注、模型评估到主动学习和问题升级。

在实际应用中，当AI服务商提供HITL功能时，通常指的是对AI输出的监督：有机会审核回复并将聊天机器人对话升级给人工客服。

人类如何“参与”AI？

一个高效的AI流程会为人类设置多个介入点。

AI通过训练数据发现模式，并将这些模式泛化到新数据。我们可以决定模型看到哪些数据，但无法决定它从数据中提取哪些模式。

在数据收集、训练和部署的每一步，都需要人来确保模型按预期工作。

根据人工介入的时间和方式，可以分为以下几类：

为持续学习提供反馈

你是否遇到过ChatGPT让你选择两个回复中哪个更好？这些反馈可以作为新数据供模型训练。

Illustrated ChatGPT interface giving 2 options for responses

不过，反馈不一定是显性的。

比如社交媒体推荐。预测模型会根据你的历史不断推荐内容。你在平台上的选择会作为数据，持续训练推荐模型。

在这种情况下，你就是人类参与者。你在使用应用时，其实是在为未来的推荐提供指引。

这就是一个完整的循环：模型基于数据训练，用户与模型互动，这些互动又成为模型再次训练的数据。

处理升级情况

HITL并不总是为了改进系统。有时是为了将复杂问题交由人工处理。

以客户支持聊天机器人为例。它能清晰、简洁、准确地回答95%的问题，大大减轻了团队负担。

但还有那5%。

有些问题非常特殊或罕见，超出了AI的能力范围。虽然这种情况下人工介入并不会直接提升模型，但这很好地体现了人类与机器学习的协同作用。

为训练进行数据标注

从技术角度看，几乎所有机器学习都包含HITL机制。因此，当我们谈论HITL时，主要指的是上述几类。

不过，不提及机器学习流程中人类的劳动和专业知识就不完整了。

数据是AI的基础，而这依赖于人类。AI模型通过输入数据预测标签。标签是AI期望输出的内容，而这需要我们人类来生成。

人工标注的例子包括：

手动编写回复以提示训练大型语言模型（LLM）
为语音识别模型转录音频文件。
为目标检测模型在图片中标注对象
为邮件客户端的垃圾邮件检测器将样本邮件标记为垃圾邮件或非垃圾邮件

评估模型表现

构建AI模型的大部分时间都花在如何改进模型上。虽然可以计算无数指标，如精确率和召回率，但要真正了解模型表现及改进方向，还需要专家的洞察力。

例如，研究人员可能发现模型在识别狗的图片时表现很好，但对热狗识别不佳。通常可以通过增加或多样化热狗图片来解决。

有时聊天模型在记忆前文信息时会有困难。研究人员通常会通过调整模型结构或生成方式来解决。

部署AI代理？

阅读我们的AI智能体实施蓝图

立即阅读

人类参与AI的优势

AI在识别微妙模式方面或许非常高效，但人类更聪明。

HITL就是将人类的细致判断与AI流程自动化的高效结合，让回复更贴合用户和服务方的需求。

1. 准确性与可靠性

这一点显而易见。比单纯AI更好的是？被人工修正过的AI。

它不仅能处理边缘案例，还可靠，因为用户知道输出会持续被审核和改进。

HITL illustrated as a curler nuging a rock towards a bullseye

2. 减少偏见

数据并不完美，模型输出也会反映这一点。偏见——即对某些输出的倾向——是机器学习和AI领域的普遍问题。

比如带有种族色彩的图像生成，或根据性别判断工作资格，都是AI反映训练数据中偏见的例子。

HITL让人们能够标记这些问题，引导模型朝更公平的结果发展。

3. 持续改进与适应性

模型上线后，训练并未结束。HITL让模型能持续利用新数据训练，更好地泛化到未见过的情况。

例如，编辑生成文本或跟踪用户内容选择，都为模型提供了更多可用的数据。

但模型光是改进还不够，还要能适应变化。

我们很容易忽视自己如何适应不断变化的世界。对于AI来说，这并不是理所当然。HITL结合专业知识和细致判断，让模型输出与时代同步。

4. 透明度与信任

引入人工让AI决策更加透明。有人纠正输出或处理不确定的情况，用户就能放心，他们面对的是一个理性的算法。

这让我们掌控AI，而不是被AI掌控。

人类参与的应用场景

1. 自动驾驶

A stick figure in the passenger seat of a car

预计未来十年市场价值将达到3.9万亿美元，自动驾驶或许会成为AI的下一个重要领域。它依赖目标检测模型和实时决策，模拟人的驾驶行为。

但对于这样一个几乎无需人工干预的系统，它却非常依赖人类。模型会不断观察人类的驾驶行为，并将其决策与自身的预测进行对比。

2. 零售

零售聊天机器人是自动化客户互动并保持个性化体验的绝佳方式。HITL（人类参与）可以让这种体验更加顺畅，并与您的业务保持一致。例如，您可以：

审核并纠正机器人推荐的产品
让客户先表达他们的基本需求，再转接给人工客服

3. 金融

金融聊天机器人非常适合将AI自动化与人工专业知识相结合。

欺诈检测系统非常擅长发现交易中的可疑行为。但并非所有可疑行为都是恶意的，您也不希望每次更换咖啡订单时就被停卡。

HITL可以将低确定性、低风险的案例交由人工处理。

贷款风险评估是AI擅长的另一个领域——它能够在各种看似无关的数据中计算概率。不过，这些数据几乎肯定会包含一定的偏见。

保持公平和减少偏见通常需要人工的帮助。

4. 医疗健康

Robot arm pointing out a tumor i an X-ray to a doctor

那位被Claude救了命的Reddit用户会第一个支持AI在医疗领域的潜力。

医疗AI聊天机器人已经展示了一些潜力，但AI的作用远不止于此：它可以根据MRI影像辅助诊断，或根据检测结果建议后续检查。但我还没准备好放弃医生。

HITL兼顾两者优势：既能发现医生可能遗漏的病例，又能让医生做最终决策。

立即体验人类增强AI

Botpress 已经有数千个机器人在无缝人工监管下部署，是市场上最灵活的 AI 智能体平台。

Botpress自带HITL集成、可视化拖拽式构建器，并支持在所有主流沟通渠道（包括Slack、Telegram、WhatsApp、网页）部署，因此使用AI并不意味着失去个性化服务。

立即开始构建。永久免费。

构建AI聊天机器人

打造定制化智能代理聊天机器人

立即开始

常见问题

我怎么判断我的AI系统是否需要人类参与？

如果您的AI系统涉及高风险决策、经常遇到模糊或罕见情况、有产生偏见或有害输出的风险，或在需要绝对准确性和人工判断以确保合规或客户信任的领域运行，那么很可能需要人类参与。

人类参与只能用于AI模型，还是也适用于非技术性业务流程？

人类参与同样适用于非技术性业务流程，比如审核客户投诉或内容管理，因为它意味着在任何自动化流程中加入人工判断，以弥补机器决策的不足。

使用人类参与是否意味着我的AI系统不够先进？

采用人类参与并不代表您的AI系统不先进。这说明您重视安全与公平，将AI的速度和模式识别与人工判断相结合，以应对复杂决策，这往往是必需的。

人类参与的AI对小企业来说划算吗，还是只适合大型企业？

人类参与的AI对小企业来说也越来越划算，因为现代工具可以让您只在棘手案例中引入人工，最大限度降低人工成本，同时提升准确性和信任度，无需庞大团队。

为AI系统增加人类参与流程需要多少成本？

增加人类参与流程的成本可能很低——如果只是偶尔用内部员工，也可能很高——如果需要专职审核员或专业外包，月成本可能达到数百甚至数千美元，主要取决于人工处理任务的数量和复杂度。