- Chain-of-thought prompting 可以引導人工智能模型逐步推理,幫助它們更準確地解決複雜的任務,而不是簡單地預測下一個單詞。
- 它最適用於多步驟的問題,例如數學、邏輯謎題或程序性任務,但沒必要用於簡單的事實或單步驟查詢。
- 提示連鎖與思考連鎖提示的不同之處在於,它將任務分割成多個獨立的提示,而思考連鎖則保持在一個提示-回應流程中。
如果您使用過GPT聊天機器人,例如ChatGPT ,您可能已經注意到輸出品質的不同。
有時它會準確地輸出您所需的內容。有時你會懷疑人工智慧中的「智能」有點鬧劇。
你可以透過改進提示方式,提升你的ChatGPT遊戲水準。思路鍊式提示鼓勵LLM代理在產生回應之前,先逐步推理任務。
較新的人工智慧模型和功能開始直接建立思想鏈推理,以便他們的模型自動推理問題,無需任何額外的提示。
什麼是思維鏈提示?
思維鏈提示是人工智慧中的一種提示工程技術,它指示模型分解複雜的任務,在做出回應之前對每個步驟進行推理。
您可能還會聽到“思維鏈推理”這個術語。這是指模型透過手邊的任務進行推理的逐步過程。
OpenAI o1 模型不需要思維鏈提示,因為它們已經內建了思維鏈推理。 LLM - 驅動的聊天機器人。
思考鏈推理是如何運作的?
思維鏈推理需要將問題分解為更小的邏輯步驟,以便人工智慧聊天機器人可以按順序解決。
首先,人工智慧識別問題的關鍵部分。然後它按順序處理每個部分,考慮一個步驟如何導致下一個步驟。每一步都建立在前一步的基礎上,使人工智慧能夠有條不紊地得出合乎邏輯的結論。
思維鏈提示的例子
著名的“草莓”提示
ChatGPT 和其他LLMs 有明確的弱點。一是他們無法正確辨識「草莓」一詞中有多少個「R」。 (可能是 o1 型號代號「草莓」背後的著名限制。)
ChatGPT -4o 不使用思考鏈推理。相反,它引用其訓練數據,並根據每個單字跟隨前一個單字的可能性產生回應。儘管它在大多數情況下聽起來可能是正確的,但它只是為了模仿人類語言而生成,而不是推理或進行研究。
當你問ChatGPT -4o著名的草莓問題,它無法給出正確答案:

但是,您可以使用思維鏈提示技術來幫助LLM - 驅動的聊天機器人得出正確答案:

最新的迭代ChatGPT , 供電OpenAI o1-preview,是第一個主要的LLM 在沒有任何額外提示的情況下使用思維鏈推理。
它在第一次嘗試時就破解了答案,因為它被指示自動遵循與第二次相同的過程ChatGPT -4o 提示如上。唯一的區別是它執行此過程時無需額外提示。

數學
如果您詢問舊版本ChatGPT 小學課本上的數學題,不一定能答對。
多步驟數學問題需要推理,這在早期是不存在的LLMs 。你可以分解問題的每一步,但如果你不知道正確的步驟, LLM 沒辦法。
ChatGPT -4o 能夠透過分解問題中的一系列步驟來推理出問題的答案:

連接到 Hubspot 的 AI 代理
在現實世界的應用中,讓我們以已整合至 HubspotLLM AI 代理 為例。銷售團隊使用此 AI 代理來處理跨渠道收集到的新潛在客戶。
設想
銷售人員向 AI 代理發送一條新的潛在客戶,並要求其在 Hubspot 中註冊並發送第一封接觸點電子郵件,但如果該潛在客戶所在的公司已經是潛在客戶,則不要填寫該電子郵件。

LLM 沒有思路的推理
由LLM AI 代理在沒有檢查該公司是否已是潛在客戶的情況下,就註冊了潛在客戶並發送了電子郵件,錯過了關鍵條件。
LLM 用鍊式思考推理
這LLM - 支援的人工智慧代理商會在採取行動之前檢查該公司是否已經是潛在客戶。如果是潛在客戶,它會跳過註冊和發送電子郵件;如果沒有,它會準確地按照銷售人員的指示註冊潛在客戶並發送電子郵件。
我什麼時候應該使用思維鏈提示?
思路鏈提示最適合需要一步步推理的場景。
主要候選人是涉及邏輯演繹、數學問題、程序性任務或任何需要多步驟答案的情況的任務。
但是等等:推理聽起來很棒——為什麼我不一直使用它?
好問題。並非所有問題都需要推理。例如:
- 簡單的事實問題,例如“加拿大的首都是哪裡?”
- 單步問題,例如“145 + 37 是多少?”
- 內容生成任務,例如“寫一封禮貌的三句話電子郵件,詢問我的同事是否完成了專案。”
提示改變與思路鏈提示
雖然名稱相似,但提示鍊和思維鏈提示是提高產生人工智慧輸出的不同提示策略。
思路鏈提示
透過思維鏈提示,使用者引導人工智慧在單一回應中解釋其答案背後的推理。這會促使人工智慧逐步完成問題解決過程的每一步,但它是在一次提示和回應中完成的。
例如,可以在一則訊息中完成一條思路提示:
「人力資源團隊需要審查 5 項員工績效評估。每項評估需要 30 分鐘,並且需要提前 15 分鐘準備。高級評估將需要額外 10 分鐘。完成 5 項高級評估和 25 項初級評估需要多長時間?一步步分解你的推理。
提示連結
透過提示鏈接,任務被分成具有多個提示的單獨步驟,每個步驟都建立在先前的結果之上。這有助於建立和指導人工智慧完成可能涉及推理的複雜任務。
第一個提示可能如下圖所示:
提示1 :確定公司在過渡到遠距工作時可能面臨的主要挑戰。
輸出:
- 溝通差距
- 保持生產力
- 技術基礎設施
- 員工敬業度
下一個提示可能會進一步深入探討這些概念。例如:
提示 2 :請告訴我公司在過渡到遠距工作時如何找到溝通差距的解決方案。
下一輪輸出後,鏈條的下一個環節可能是:
提示3 :企業在採用這些解決方案時面臨哪些常見挑戰?
因此,雖然兩者相似,但它們採用不同的方法從生成人工智慧工具中提取最深入和相關的內容。
思路鏈提示Botpress
Botpress 使用者已經熟悉了採用思維鏈推理的功能。
自治節點於 2024 年 7 月首次亮相Botpress ,一個建構人工智慧代理的平台。自治節點能夠自動化多步驟工作流程並自主做出決策。
可以建立一個自治節點,並用一行簡單的文字進行提示,例如「您的目的是產生合格的潛在客戶」。當使用者表明購買意願時,在 Salesforce 中建立潛在客戶。
您使用此自治節點建構的人工智慧代理將採取各種操作來實現其目標,獨立於人類設計的工作流程。還可以切換不同的LLMs 根據需要,決定優先考慮速度或功率。
建立自訂的自主代理
Botpress 是唯一允許您建立真正自主代理的人工智慧代理平台。
開放、靈活Botpress Studio 允許跨行業使用無窮無盡的用例,從人力資源到潛在客戶開發。我們預先建立的整合庫和豐富的教學讓使用者可以輕鬆地從頭開始建立人工智慧代理。
今天就開始建立。這是免費的。
常見問題
思考鏈提示是否只對人工智能模型有用,還是也能反映人類解決問題的能力?
它實際上反映了人類解決複雜問題的方式,就是將問題分成幾個步驟,因此它既是人工智能的有用技術,也反映了人類的自然推理能力。
連鎖思考推理與「按部就班思考」有何不同?
兩者關係密切,但連鎖思考推理更有條理、更有意義。它會鼓勵 AI 大聲解釋其邏輯,而不是直接跳出答案。
為什麼有些LLMs 預設不使用思維鏈推理?
早期或較小的模型沒有經過明確推理的訓練,因此它們傾向於根據模式而非邏輯步驟來預測答案,除非另有提示。
在推理過程中,連鎖思考提示是否是「訓練」模型的一種形式?
不完全是。您並沒有改變模型的知識,只是透過更好的指示來引導它的行為,從而影響它當下思考問題的方式。
思考鏈提示是否總能提高準確性?
不一定。它在需要推理的任務上最有效,但對於簡單的問題,它實際上可能會讓事情過於複雜,導致不必要的步驟或甚至錯誤。