經過幾個月的猜測, OpenAI最新的LLM 版本已經下降 – 並且它不被稱為GPT -5 。
先前,最新的模型系列曾使用 Q* 和 Strawberry 等神秘有趣的代號,但最終定名為OpenAI o1 。
最大的更新是OpenAI的新模式是其增強的推理能力。 OpenAI 解釋說,o1 經過訓練,比以前的模型花費更多的時間思考,使其更接近人類智慧。
什麼是OpenAI 奧1?
OpenAI o1是最新發布的大型語言模型系列OpenAI 於 2024 年 9 月 12 日發布,目前包括兩個型號:o1-preview 和 o1-mini。
o1與該公司以往機型最大的差別在於其先進的推理能力。雖然還沒有完整發布,但預覽版和迷你版已經爆了GPT -4o 在數學、科學和編碼測試中脫穎而出。
OpenAI o1 型號
9 月發布的版本包括兩個型號:o1-preview 和 o1-mini。它們是一系列型號中的第一個,並將繼續作為OpenAI 完善他們的新LLM 。
區別? o1-mini 型號比預覽型號更小,而且便宜 80%。它是為需要高級推理而不是更廣泛的知識的任務而建構的。它非常適合涉及編碼或數學的任務。
有多聰明OpenAI 奧1?
OpenAI 推出了一系列展示 o1 推理能力的 STEM 基準測試,包括:
- 在物理、化學和生物基準測試中與博士生的表現類似。
- 在美國數學奧林匹克美國預選賽中名列前 500 名的學生。
- 在競爭性編碼測試 Codeforces 中排名第 89%。
您可以閱讀有關 o1 推理能力的更多信息OpenAI的研究發布。
What is chain of thought reasoning?
The o1 models use chain of thought reasoning, a longer and more thorough way of by breaking down requests.
If the o1 model is given a prompt, it won’t answer immediately - hence the long wait time. Instead, it will reason through each of the steps, carefully considering each piece of information and its implications before deciding on the next course of action. It won't provide an answer until it has thought through the entire series of steps required in the ask.
o1 與 o1 有何不同GPT -4o?
1)推理能力
o1 的一般智力的核心是新的推理能力。 「也許最重要的進步領域將圍繞著推理能力,」奧特曼與蓋茲分享。 「現在, GPT -4只能以極其有限的方式進行推理。
推理是出了名的困難。即使對於人類來說也是如此。和OpenAI o1 是第一款獲得此殊榮的機型。
o1 模型能夠即時推理,而不是依賴預訓練資料。這就是為什麼新模型比以前的模型更擅長科學、數學和編碼任務OpenAI 模型。
2)越獄難度更高
隨著安全擔憂的增加LLMs 隨著知名度和力量的增長,安全性已成為人們關注的重點OpenAI的最新進展。該公司在開發 o1 系列時與美國和英國的人工智慧安全研究所合作,並與美國政府合作進行盡職調查。
作為向前邁出的一大步,o1 系列比以前的型號更難越獄(繞過安全措施)。
在他們最難的越獄測試之一中,o1-preview 模型得分為 84 分(滿分 100 分),相比之下,o1-preview 模型的得分僅為 22 分。 GPT -4o。
3)新的命名約定
雖然它的名字並不是這款新產品最令人興奮的地方OpenAI LLM ,這是一個有意有意義的改變。
OpenAI o1 是第一個擺脫“ GPT 」 的綽號,這是因為該公司聲稱這是全新「推理範式」的第一階段,而舊模型是「預訓練範式」的一部分。
新模型花時間進行即時推理,而不是依賴其預訓練資料。
4) 較擅長解決 STEM 問題
更好的推理會帶來更好的數學技能。
o1 和GPT -4o 被要求完成國際數學奧林匹克資格考試。 GPT -4o 解決了 13% 的問題,而 o1 解決了 83%。
5)等待時間較長
即時推理比引用訓練資料和產生反應需要更長的時間。如果你問一個問題OpenAI o1-preview 與其他型號相比,您的等待時間會明顯更長。
然而,由於能夠外包推理,因此付出的代價很小。隨著該系列下一個型號的發布,o1 型號的速度可能會提高。
誰可以使用o1?
截至9月12日, ChatGPT Plus 和團隊使用者可以存取 o1 模型ChatGPT 。
OpenAI 宣布他們將向免費用戶提供 o1-mini,但具體日期尚未確定。
目前,01-preview 的每週速率限制為 30 條訊息,o1-mini 的每週速率限制為 50 條,但很快就會增加。
我應該使用 o1 做什麼?
o1 增強的推理能力對於解決數學、科學和編碼中的複雜問題特別有用。作為OpenAI 解釋:
的局限性OpenAI 奧1
作為預覽,該模型尚不具備以下所有功能GPT -4o。如果您想使用LLM 要瀏覽網頁獲取信息,或者想要上傳文件或圖像,您需要堅持GPT -4o 直到 o1 的後續型號發布。
如何提示OpenAI 奧1
OpenAI與先前的模型相比,o1 的提示建議發生了變化,因為它增強了推理能力。
保持提示簡單。這是一個智慧模型,不需要像GPT -4系列。這意味著避免任何思想輸入鏈——模型已經在內部推理。
建造GPT - 驅動的人工智慧代理
如果你的人工智慧代理自動與每個人同步會怎麼樣? OpenAI 更新?
Botpress 是一個完全開放、可擴展的AI代理平台。我們的stack 允許開發人員跨任何工作流程建立具有任何功能的聊天機器人和人工智慧代理。
唯一涵蓋低程式碼設定和無限可自訂性和可擴展性的平台, Botpress 讓您自動獲得最新的力量GPT 您的聊天機器人上的版本 – 無需任何努力。
立即開始構建。它是免費的。