兩倍的速度和一半的價格——有什麼作用 GPT-4o 對 AI 聊天機器人意味著什麼?
在他們神秘的宣布之後, OpenAI 推出了其旗艦機型的最新版本: GPT-4o。
最新型號不僅在多式聯運功能方面獲得了華麗的光芒。它比 GPT-4渦輪增壓。雖然主流媒體的報導迷戀於新旗艦機型的視頻和語音功能,但新的成本和速度對那些使用 GPT 為他們的應用程式提供支援。
“4o的可用性能夠顯著改善構建者和用戶體驗,”他說 Patrick Hamelin,軟體工程師主管 Botpress.“影響比我們想像的要深遠。”
因此,讓我們深入瞭解新模型將如何撼動人工智慧 chatbots.
模型功能
新的旗艦機型帶來了一系列令人興奮的更新和新功能:增強的語音和視頻功能、實時翻譯、更自然的語言能力。它可以分析圖像、理解更廣泛的音訊輸入、提供摘要幫助、促進即時翻譯和創建圖表。用戶可以上傳檔並進行語音到語音對話。它甚至帶有一個桌面應用程式。
在他們的系列發佈視頻中, OpenAI 員工(以及可汗學院的 Sal Khan 等同事)演示了最新版本的 GPT 為用戶準備工作面試、唱歌、通過面部表情識別人類情感、解決書面數學方程式,甚至與他人互動 ChatGPT-4o。
此次發佈說明了一種新的現實,即人工智慧模型能夠分析孩子筆記本上的文字並能夠做出反應。它可以解釋第一次添加分數的概念,根據您孩子的理解改變語氣和策略 - 它可以跨越從聊天機器人到個人導師的界限。
有什麼作用 GPT-4o 的平均值 LLM 聊天機器人?
運行的 AI 聊天機器人 LLMs 每次公司喜歡時都會收到更新 OpenAI 更新他們的模型。如果聊天機器人連接到機器人構建平臺,例如 Botpress,他們獲得了最新的所有好處 GPT 在他們自己的聊天機器人中建模。
隨著 GPT-4o,AI 聊天機器人現在可以選擇在高級模型上運行,從而改變其功能、價格和速度。新型號的速率限制提高了5倍,從 GPT-4 Turbo,每分鐘能夠處理多達 1000 萬個代幣。
對於使用音頻集成的機器人,例如 Twilio 上 Botpress,一個語音交互的新世界已經出現。而不是局限於過去的音訊處理, chatbots 離模仿人類互動更近了一步。
也許最重要的是付費使用者的成本較低。以一半的成本運行一個功能類似的聊天機器人可以大大提高全球的可訪問性和可負擔性。和 Botpress 使用者無需為他們的機器人支付額外的 AI 支出——因此這些節省的費用直接用於構建者。
在等式的使用者方面, GPT-4o 意味著更好的用戶體驗。沒有人喜歡等待。更短的回應時間意味著 AI 聊天機器人使用者的用戶滿意度更高。
用戶喜歡速度
採用聊天機器人的一個關鍵租戶是改善用戶體驗。還有什麼比減少等待時間更能改善用戶體驗的呢?
“這肯定會是一次更好的體驗,”哈梅林說。“你最不想做的就是等待某人。”
人類討厭等待。早在 2003 年, 一項研究發現 ,人們只願意等待大約 2 秒鐘才能載入網頁。從那時起,我們的耐心當然沒有增加。
每個人都討厭等待
有大量的用戶體驗技巧可以減少感知到的等待時間。通常我們無法提高事件的速度,因此我們專注於如何讓用戶感覺時間過得更快。視覺反饋,如載入欄圖像,旨在縮短感知到的等待時間。
在一個關於電梯等待時間的著名故事中,紐約的一棟舊建築正在處理一連串的投訴。居民必須等待1-2分鐘才能到達電梯。該建築無法將電梯升級到更新的型號,居民威脅要解除租約。
一位受過心理學訓練的新員工發現,真正的問題不是浪費的兩分鐘時間,而是無聊。他建議安裝鏡子,以便居民在等待時可以看著自己或他人。關於電梯的投訴停止了,現在,在電梯大廳看到鏡子是司空見慣的。
而不是採取捷徑來增強用戶體驗——比如視覺反饋—— OpenAI 從源頭上改進了體驗。速度是用戶體驗的核心,沒有任何技巧可以與高效交互的滿意度相媲美。
為每個人節省開支
使用這種新的 AI 模型來運行應用程式突然變得更便宜了。便宜很多。
大規模運行 AI 聊天機器人可能會變得昂貴。這 LLM 你的機器人由以下因素提供支持 確定你將為更大規模的每次使用者交互支付多少費用(至少在 Botpress,我們將 AI 花費 1:1 與 LLM 成本)。
這些節省不僅適用於使用 API 的開發人員。 ChatGPT-4o 是最新的免費版本 LLM旁邊 GPT-3.5.免費使用者可以使用 ChatGPT 應用程式免費。
更好的標記化
如果您使用不使用羅馬字母的語言與模型進行交互, GPT-4o 甚至進一步降低了 API 成本。
新模型改進了使用限制。它提供了標記化效率的重大飛躍,主要集中在某些非英語語言上。
新的標記化模型需要更少的標記來處理輸入文本。對於標識語言(即使用符號和字元而不是單個字母的語言)來說,它的效率要高得多。
這些好處主要集中在不使用羅馬字母的語言上。節餘減少情況 估計 如下:
- 印度語言,如印地語、泰米爾語或古吉拉特語,代幣減少了 2.9 – 4.4 倍
- 阿拉伯語的代幣減少了 ~2 倍
- 東亞語言,如中文、日語和越南語,代幣減少了 1.4 – 1.7 倍
彌合人工智慧數位鴻溝
數字時代帶來了由來已久、有據可查的貧富差距的延伸——數位鴻溝。正如獲得財富和強大基礎設施是某些人群獨有的一樣,獲得人工智慧以及隨之而來的機會和好處也是如此。
聯合國開發計劃署(UNDP)首席數位官羅伯特·奧普(Robert Opp) 解釋說 ,人工智慧平臺的存在能夠決定整個國家的發展指標:
通過將成本減半 GPT-4o 並引入免費套餐, OpenAI 朝著消除人工智慧領域最大的問題之一邁出了關鍵的一步,並直接解決了政策制定者和經濟學家心目中的不平等問題。
大型人工智慧的積極公關舉措比愛好者想像的更有必要。隨著人工智慧在我們的日常生活中越來越重要,宣導者和懷疑論者都在問我們如何能夠“永遠”使用人工智慧。
根據人工智慧博士和教育家路易士·布沙爾(Louis Bouchard)的說法,我們正是通過更廣泛地獲得人工智慧來實現這一目標的:“讓人工智慧變得可訪問是'永遠'使用人工智慧的一種方式,即使不是最好的方法。他的理由是什麼?如果我們無法完全控制人工智慧技術的積極和消極影響——至少在早期——我們可以確保平等地獲得其潛在好處。
擴大多式聯運潛力
與企業聊天機器人交互的流行方式是通過文本,但增強的多模式功能 OpenAI新的人工智慧模型表明,這種情況可能會在未來發生變化。
在接下來的一年裡,我們可能會看到一大批開發人員推出新的應用程式,以充分利用新訪問的音訊、視覺和視頻功能。
例如 GPT-支援的聊天機器人可以:
- 要求客戶提供他們要退回的商品的圖片,以識別產品並確保其沒有損壞
- 在即時對話中提供音訊翻譯,考慮特定地區的方言
- 根據鍋中牛排的圖像判斷您的牛排是否煮熟
- 作為免費的個人導遊,根據舊大教堂的圖像提供歷史背景,即時提供翻譯,並提供定製的語音導覽,允許來回交流和提問
- 為語言學習應用程式提供支援,該應用程式可以收聽音訊輸入,可以根據嘴部動作的視頻提供發音反饋,或通過圖像和視頻教授手語
- 通過結合其解釋音訊和視頻的能力,提供非緊急的心理健康支援,從而實現低成本的談話治療
借助可以解釋圖像和音訊的 AI 模型,我們對如何理解 LLMs 可以為我們服務正在迅速擴大。
多模態意味著可及性
我們已經看到增強的多式聯運功能用於社會公益。一個完美的例子是 OpenAI與Be My Eyes的合作。
Be My Eyes是一家丹麥初創公司,致力於將視障用戶與視力志願者聯繫起來。當使用者需要説明時,例如在超市挑選合適的罐頭食品或識別 T 恤的顏色,該應用程式會通過智慧手機通過視頻將他們與世界各地的看病志願者聯繫起來。
OpenAI全新的視覺能力,可以為Be My Eyes使用者提供更加有益的體驗。盲人使用者可以將圖像或視頻中繼到他們的設備,模型可以用音訊資訊做出回應,而不是依靠人類志願者來即時視覺破譯圖像或視頻。
OpenAI 和 Be My Eyes,現在是值得信賴的合作夥伴,正在為世界各地的法律盲人鋪平道路,讓他們更加獨立。Be My Eyes 首席執行官 Michael Buckley 解釋了它的影響:
這項新服務將於 2024 年夏季首次推出。搶先體驗使用者一直在對新的視覺、視頻和音訊功能進行Beta測試,好評如潮。雖然人工智慧的影響可能會引起懷疑論者的擔憂,但這種夥伴關係清楚地表明瞭它可以帶來的積極影響。瞭解高級人工智慧帶來的社會公益是其公關的關鍵一步。
我們將如何判斷未來 LLM 模型?
隨著競爭對手繼續競相逐底——創造最便宜、最快的 LLM ——這就引出了一個問題:我們將如何判斷未來的人工智慧模型?
在未來的某個時候,專業 LLM 創作者(可能 OpenAI 和谷歌)將在其模型的運行速度以及提供訪問的廉價程度方面保持穩定。一旦我們在成本和速度上達到穩定,我們將如何為市場領先的車型加冕?
什麼會成為時代的新標誌?無論是人工智慧模型的可用個性、視頻增強功能、免費使用者可用的功能,還是超出我們當前理解的全新指標,下一代 LLMs 就在我們家門口。
人工智慧 Chatbots 讓一切變得簡單
如果您的 AI 聊天機器人自動與每個 GPT 更新?
Botpress 自 2017 年以來,一直提供可定製的 AI 聊天機器人解決方案,為開發人員提供他們所需的工具,以利用最新的功能輕鬆構建聊天機器人 LLMs. Botpress 聊天機器人可以在自定義知識源(如您的網站或產品目錄)上進行訓練,並與業務系統無縫集成。
唯一一個從無代碼設置到無窮無盡的可定製性和可擴展性的平臺, Botpress 讓您自動獲得最新的 GPT 聊天機器人上的版本 - 無需任何努力。
立即開始構建。它是免費的。