!['GPT-5' 蓝色图案背景。](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66854e271fa93cdd5adbdeb4_GPT-5.webp)
GPT-5即将到来--有传言称它的发布日期将是早而不是晚。
在与比尔-盖茨的播客访谈中,OpenAI 首席执行官山姆-奥特曼于 2024 年 1 月证实,GPT-5 正在开发中。有报道称,我们看到它的时间可能比我们想象的要早:两位接近OpenAI 的匿名人士透露, GPT-5将于 2024 年年中发布,很可能是在今年夏天。
GPT-5 是什么?
虽然GPT-4 现在对我们来说似乎是革命性的,但阿尔特曼认为,世界才刚刚触及人工智能的表面。在 2024 年 1 月举行的世界政府峰会上,奥特曼将目前的OpenAI 模型与早期的手机进行了比较:
如果有一件事是肯定的,那就是下一代GPT 机型现在对我们来说还难以想象。虽然从翻盖手机版的GPT 到 iPhone 版还需要时间,但到今年年底,我们将更近一步。
GPT-5 将是迄今为止最受期待的LLM 版本。该人工智能模型将拥有更快的速度和更强的自然语言处理能力。那么,它将带来什么呢?
"一位拥有高级GPT-5 访问权限的首席执行官说:"这真的很好,就像实质性的改善。
从OpenAI
随着GPT-5 发布会的临近,OpenAI 高管和内部人士增加了对下一代车型的评论。以下是公司最近的声明:
- 首席执行官 Sam Altman声称,GPT-5 将能够处理电子邮件和日历详情,而且可定制性更强
- 首席技术官米拉-穆拉蒂(Mira Murati)在接受达特茅斯工程学院采访时解释说,GPT-3具有幼儿的智力,GPT-4更类似于聪明的高中生,而下一代将具有博士级的智力(在某些任务中)。
- 微软人工智能首席执行官穆斯塔法-苏莱曼(Mustafa Suleyman)表示,要到两年后的GPT-6,人工智能模型才能在新环境中"采取行动"。
![米拉-穆拉提(Mira Murati)戴着耳机,坐在一把白色椅子上,一边说话一边做手势。](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/667ec97b954379fb0f078179_mira%20murati.jpeg)
GPT-4 和GPT-5 之间有什么区别?
正如GPT-4 与前一个版本相比有了大幅提升一样,毫无疑问,下一个版本也将如此。虽然OpenAI 没有确认任何更新,而且在其惊喜发布之前也很可能不会确认更新,但以下对GPT-5 的预期预测均来自内部访谈、以前的GPT 更新以及竞争对手LLMs 的人工智能趋势。
它比GPT-4 更聪明
最大的区别是什么?Altman 认为:"它将变得更加智能"。
在世界政府峰会上,奥特曼强调,从GPT-4 到GPT-5 的最大飞跃其实很简单:它更智能了。"他解释说:"这些模型之所以如此神奇,是因为它们具有普遍性。"它将更加智能,因此在所有方面都将更加出色"。
Altman 在采访中表示,虽然预计会有很多改进--新功能、更快的速度和多模式化--但更智能的模型将增强当前LLMs 的所有现有功能。
提高可靠性
Altman 证实,可靠性将是GPT(生成式预训练变换器)未来两年发展的核心重点。"如果你问GPT-4 大部分问题 10000 次,这 10000 次中可能有一次是相当不错的,但它并不总是知道是哪一次,你希望每次都能得到 10000 次中最好的回答,因此提高可靠性将非常重要。"
长期以来,可靠性一直是GPT-4 用户的一个棘手问题,开发GPT-4 Turbo 的部分目的是对模型输出的一致性和准确性进行必要的更新。Turbo 提高了模型的稳定性,减少了人工智能幻觉。
![OpenAI 首席执行官 Sam Altman 在GPT-4 Turbo 发布会的黑暗舞台上发表演讲。](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450c0f7955370a4fb1f45a_turbo%20launch.webp)
GPT事实上,一位匿名的OpenAI 内部人士证实,该团队希望在下一次迭代中提高可靠性。我们也希望如此。
增强推理能力
其通用智能的核心是GPT-5 更高级的推理能力。"也许最重要的进步领域将围绕推理能力展开,"奥特曼与盖茨分享道。"现在,GPT-4 只能以极其有限的方式进行推理。"
在 Reddit 和 Medium 上,不乏用户发布他们在GPT-4 上的失败案例,从对其解决问题能力的群嘲,到对其有限推理能力的正式解释,不一而足。这很容易理解:推理是出了名的困难。任何实质性的重大改进都将极大地提升人工智能模型的性能。
推理能力的提高意味着GPT-5 比GPT-4 更善于理解上下文、进行推理和解决问题。加上更大的知识库,这意味着GPT-5 能够更好地理解用户意图,并提供更多相关信息。
如果我们幸运的话,GPT-5 将成为最终找到谜语答案的模型,使其远远超越GPT-4。
更多的多式联运
多模态一直是GPT 过去几次迭代的核心。OpenAI 没有放慢脚步的迹象。
OpenAI 2024 年 5 月推出的GPT-4o,带来了更强的文字、语音和视觉能力。它与GPT-4 Turbo 相差甚远,能够进行自然对话、分析图像输入、描述视觉效果并处理复杂的音频。
多模态的变化使我们与GPT 的接触方式发生了巨大变化。自然对话流--当模型能够准确解释音调变化并遵循类似人类的语音模式(如GPT-4o )--是人工智能自然语言处理领域的巨大飞跃。
![由 Sora 生成的一位女士在夜色中穿过繁忙的东京街道的剧照。](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450207cf90120602b51d1a_Sora%20demo%20woman%20street.png)
OpenAI 也毫不吝啬地预告了他们即将推出的文字视频模型 Sora。该人工智能模型的开发目的是模仿复杂的摄像机动作,并在长达 60 秒的短片中创造出细节丰富的人物和场景。
如果他们的多模态历史还不够,那就听听OpenAI 首席执行官的意见吧。Altman 向盖茨证实,视频处理和推理是未来GPT 型号的重中之重。
多模态是未来人工智能模型中最热门的词汇之一,这是有道理的。尽管GPT-4o 强调要拓宽其多模态功能,但如果在新模型发布时看到更多的语音、图像或视频功能,也不足为奇。
增加参数大小
GPT 的每次更新都会增加参数的大小,下一代GPT-5 可能也不例外。在GPT 这样的转换器中,参数包括神经网络各层的权重和偏置,如注意机制、前馈层和嵌入矩阵。这些参数的大小直接影响其从输入数据中学习的能力。
虽然OpenAI 对其确切的参数大小保密,但据估计大约有 1.5 万亿个参数--与GPT-3 的 1 750 亿个参数相比有了显著增加(与GPT-2 的 15 亿个参数相比则是难以想象的飞跃)。
人工智能专家艾伦-汤普森(Alan Thompson)是谷歌和微软的人工智能综合顾问,他预计人工智能的参数数量将达到 2-5 万亿个,这将大大提高开发人员完成任务的深度。他的分析基于计算能力和训练时间的翻倍--测试时间从GPT-4 大幅增加。
更大的上下文窗口
上下文窗口表示模型可以同时处理多少个词块(单词或子单词)。语境窗口越大,模型就能从输入文本中吸收更多信息,从而提高答案的准确性。
GPT-4 的缺陷之一是处理大量文本的能力相对有限。例如,GPT-4 Turbo 和GPT-4o 的上下文窗口为 128,000 个词组。但Google 的 Gemini 模型的上下文窗口可达 100 万个标记。
目前,如果您只关心能吸收大量信息的大型语言模型,GPT-4 可能不是您的首选。预计OpenAI 将在新模型中解决这些差异。
![两个蓝色圆圈,一个比另一个大 7.6 倍。它们代表GPT-4 Turbo 和 Gemini 的上下文窗口大小。](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66464656f9787865888acf9e_final%20context%20window%20comparison.png)
艾伦-汤普森预测了什么?代币将大幅增加到 40 万亿。与双子座模型相比,这种性质的变化将是一个显著的进步,它增加了对用户输入的海量数据集做出反应的能力。这将改变人工智能模型的性能,尤其是对OpenAI 企业客户和有大量数据输入需求的用户而言。
增强定制功能
GPT-4 经常被用作一种放之四海而皆准的工具。但未来的迭代将更加个性化。在盖茨的播客中,奥特曼重申,可定制性和个性化将是未来OpenAI 模型的关键。"人们希望从GPT-4 得到的东西截然不同:不同的风格、不同的假设"。
OpenAI 已经推出了自定义GPTs ,用户可以根据特定任务个性化设置GPT ,从教授棋盘游戏到帮助孩子完成家庭作业。虽然定制可能不是下一次更新的重点,但它有望成为未来的主要趋势。
在此期间,您可以免费使用GPT-4o 的强大功能个性化人工智能聊天机器人。这是我们最擅长的。从这里开始。
GPT-5 的发布日期是什么时候?
用户和记者对发布日期进行了认真的预测,从 2024 年夏天到 2026 年初不等。
不过,最近(也是最可靠的)更新来自 openAI 首席技术官米拉-穆拉提(Mira Murati):她在 6 月 20 日发布的达特茅斯工程学院访谈中声称,"下一代 "模型大约还需要一年半的时间,因此发布时间更接近 2025 年底。不过,目前还不清楚她与采访者讨论的下一代模型是GPT-5 还是未来几代。
培训时间预计需要4-6 个月,比OpenAI的 3 个月培训时间(GPT-4)多出一倍。新模型在发布前可能还要经过强化学习、红队测试和进一步测试,但这只是一个模糊的时间表--如果在测试中遇到无法预料的情况,OpenAI 可能不得不进一步推迟发布日期。
![首席技术官米拉-穆拉提(Mira Murati)和研究负责人马克-陈(Mark Chen)和巴雷特-佐夫(Barret Zoph)坐在GPT-4o 发布会的舞台上的沙发上,演示该模型查看书面数学问题的能力。](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/66450ea7e691054133415d6d_gpt%204o%20launch.webp)
GPT-5 将使用哪些训练数据?
GPT-5几乎肯定会继续使用互联网上的现有信息作为培训数据。
如果说OpenAI 在攀登行业顶峰的过程中受到了什么清算的话,那就是有关模特完整培训的一系列诉讼。
GPT 这些模型是在从互联网上获取的大量数据集上进行训练的,其中大部分数据都是受版权保护的。这种未经授权使用数据的行为引发了广泛的投诉和法律诉讼:《纽约时报》提起诉讼,一系列美国新闻机构提起诉讼,还有人声称该模型的训练过程违反了欧盟的《通用数据保护条例》。
加利福尼亚州的一名法官已经驳回了包括莎拉-西尔弗曼(Sarah Silverman)和塔-尼希斯-科茨(Ta-Nehisi Coates)在内的一批作家对OpenAI 版权提出的诉讼。目前还没有迹象表明OpenAI 和公司在继续测试时会受到这些投诉的实质性阻碍。
GPT-5 的价格是多少?
如果OpenAI 继续采用标准定价模式,GPT-5 的使用将需要付费。目前,ChatGPT 与GPT-4 只向付费用户提供,每月 20 美元,而ChatGPT 与GPT 3.5 则免费提供。
至于应用程序接口的定价,GPT-4 目前的价格为每 100 万个输入代币 30 美元,每 100 万个输出代币 60 美元(32K 版本的价格翻了一番)。如果新模型真如预测的那样强大,价格可能会比以前的OpenAI GPT 模型还要高。
![GPT ChatGPT 每月费用为 20 美元。API -4 的费用为每 100 万个输入代币 30 美元,每 100 万个输出代币 60 美元。GPT](https://cdn.prod.website-files.com/637e5037f3ef83b76dcfc8f9/6646470eebbb0db1f7837503_final%20gpt-4%20pricing.png)
不过,最新的OpenAI 模型成本更低。GPT-4o 每 100 万个输入代币只需 5 美元,每 100 万个输出代币只需 15 美元。虽然对于企业客户来说,价格差异并不是决定性的因素,但OpenAI 正在向个人和小型企业的可及性迈出令人钦佩的一步。
好消息是什么?GPT-5 的推出将使GPT-4 成为OpenAI的新免费模式。
未来的ChatGPT
下一代大型语言模型将彻底改变我们在日常生活中与人工智能的交互方式。在彭博技术会议上,OpenAI 首席运营官布拉德-莱特凯普(Brad Lightcap)暗示了公司计划如何彻底改变人机交互方式,将GPT 从LLM 变成一个具有代理能力的模型。
"2026年还会有及时工程师这种东西吗?光帽说"你不会让你的朋友成为工程师"
能力更强、个性化更强、多模态功能更强的模型,正是 Altman 和OpenAI 所期待的:超乎想象。期待中的GPT-5 将更近一步。
GPT, 定制
如果您的人工智能聊天机器人能自动同步GPT 的每次更新呢?
Botpress LLMs Botpress 聊天机器人可以根据自定义知识源(如您的网站或产品目录)进行训练,并与业务系统无缝集成。
Botpress 是唯一一个从无需代码设置到无尽的可定制性和可扩展性的平台,它允许您在聊天机器人上自动获得最新GPT 版本的强大功能--无需任何努力。
今天就开始建设。它是免费的。