- GPT 于 2025 年 7 月 8 日发布,它将高级推理、多模态输入和任务执行统一到一个系统中,无需在专用模型之间切换。
- GPT 专为复杂的多步骤工作流程而设计。
- 与早期版本相比,GPT 能明显减少幻觉。
- GPT 的变体包括
gpt-5
,gpt-5-mini
,gpt-5-nano
和gpt-5 聊天
.
在过去的一年里,OpenAI 推出了GPT、o1 和 o3,分别改进了人工智能的思考、推理和交互方式。
这些模型使人工智能的反应更快、更准确、更直观。但每一步都只是朝着更大的目标迈出的一步。
8 月 6 日,OpenAI 不太含蓄地宣布即将推出GPT。
现在,自2025 年 8 月 7 日起,GPT 已正式到来,它将OpenAI最先进的推理和多模态功能整合到一个统一的模型中。GPT 现在是ChatGPT 中所有免费和付费用户的默认模型,完全取代了GPT。
在本指南中,我将详细介绍有关GPT所有确认信息:其功能、性能升级、培训过程、发布时间表和成本。
GPT-5 是什么?
GPT 是OpenAI最新一代的大型语言模型,于 2025 年 8 月 7 日正式发布。它以GPT 架构为基础,同时整合了 o1和 o3 等推理优先模型的先进技术。
在GPT 之前,OpenAI 在内部推出了GPT.5(猎户座)。 ChatGPT- 这是一个过渡模型,它提高了推理的准确性,减少了幻觉,并为现在GPT 原生的更深入的思维链执行奠定了基础。
过去曾暗示过的许多功能,如逐步逻辑、更好的上下文保留和更流畅的多模式切换,现在都在GPT 中得到了充分实现和统一。

GPT 作为统一自适应系统的一部分运行。一个新的实时路由器可自动在用于常规查询的快速、高吞吐量模型和用于复杂推理的 "思考 "模型之间进行选择,从而消除了在专门模型之间手动切换的需要。
GPT 有哪些不同型号?
GPT 是一系列模型--针对不同使用情况优化的专用变体系列,从 ChatGPT应用到通过 API 进行大规模部署。
每个GPT 变体都在相同的统一架构上运行,但在知识截断、推理深度、速度和运行规模之间进行了特定的平衡。
这些变体将OpenAI的推理优先方向与有针对性的性能调整统一起来,使开发人员能够灵活地根据工作负载的复杂性和部署规模来选择模型。
GPT 的性能如何?
随着GPT 于 2025 年 8 月 7 日正式发布,我们现在看到的是其架构如何处理推理、多模态和代理式任务执行等方面的实际应用。
萨姆-奥特曼曾暗示,GPT 将不仅仅是 "一个更好的聊天机器人",而根据早期的使用情况来看,这正是它所能提供的。
实时调整的推理能力
内置的路由系统可决定何时即时回答,何时分步思考。对于复杂的查询,GPT 会进入一个内嵌提示 链的思维过程,在给出最终答案前绘制出中间步骤。
这使得基于GPT GPT 聊天机器人能更好地持续解决问题(从多阶段代码调试到分层业务分析),而不需要单独的模型或模式切换。
大规模情境处理
在ChatGPT 中,模型内存可容纳约 256,000 个令牌;通过应用程序接口,可容纳的令牌数量扩展到 400,000。这样就可以在整本书、多小时的会议记录或大型资料库中工作,而不会丢失之前的细节。
在长时间的课程中, ChatGPT 回答的准确性有了明显提高,矛盾减少了,对先前语境的保留也更牢固了。
为全球市场提供更好的语言支持
GPT 的统一架构带来了多语言和语音功能的重大飞跃。ChatGPT 现在可以处理更多语言的 ChatGPT 支持,在扩展对话中具有更高的翻译准确性和更少的上下文丢失。
这些优势还延伸到了语音交互方面。不同口音和语音模式下的回复听起来更自然,这使得多语言GPT 聊天机器人在西班牙语、印地语、日语或阿拉伯语口语中与在文本中一样流畅。
从聊天机器人到人工智能代理
随着GPT 的推出,OpenAI 将其方法扩展到应用程序连接器上,即让模型直接与外部工具、客户关系管理、数据库和生产力套件进行交互的本地集成。

通过将任务路由到轻量级连接器,而不是通过高成本的推理调用来推动每个步骤,团队可以减少应用程序接口的花费,同时在需要时仍能保持复杂的逻辑。
GPT成本是多少?
GPT 可通过ChatGPT 订阅和OpenAI API 获取,定价因变体而异。对于 API 用户,GPT 有几种变体:gpt-5、gpt-5-mini 和 gpt-5-nano,按每百万输入和输出代币计价。
除 API 定价外,OpenAI 还确认GPT 可用于多个ChatGPT 层级,使免费用户可以使用,同时为付费计划解锁高级功能:
- 免费层-GPT,具有标准推理功能和每日使用限制。
- Plus Tier- 提高使用限制并改进推理性能。
- 专业级- 可访问GPT 专业版,这是一款高推理能力的 "思考 "变体,具有扩展的上下文窗口、更快的路由速度以及高级工具的优先访问权限。
OpenAI的定价模式允许开发人员根据自己的需求,在最大推理深度、更快的延迟或成本效益之间做出选择。
如何访问GPT? 提示:这取决于您要做什么
如果您只想与GPT 聊天,从 8 月 7 日起您可以直接在ChatGPT 中进行。应用程序会根据您的计划(如专业级中的GPT Thinking)自动使用正确的变体。无需设置,只需打开应用程序并开始输入即可。

但是,如果您想在自己的产品或工作流程中使用GPT,则需要 API 访问权限。访问OpenAI 的 API 有两种主要方式:
- OpenAI Platform- 请访问 platform.openai.com,您可以在其中选择适用于不同用例的 gpt-5、gpt-5-mini、gpt-5-nano 和 gpt-5-chat。这是开始从代码向GPT 发送请求的最快方法。
- GitHub上的OpenAIPython SDK- 如果您要在本地构建或编写脚本,请安装 OpenAI 官方 Python 客户端。它可以使用 API 密钥,通过简单的 Python 函数与任何GPT 变体进行交互。
如果您只是想探索模型的行为方式, GitHub 模型游乐场也已上线--您可以运行提示测试,而无需设置完整的应用程序。
如何使用GPT 构建人工智能代理
要知道GPT 是否适合您的使用情况,最好的办法就是实际使用它进行构建。看看它是如何处理真实输入、多步骤推理和实时部署流程的。
在本例中,我们将使用Botpress ,它是人工智能代理的可视化生成器,可让您连接到GPT,而无需进行任何设置。
第 1 步:确定您的代理应该做什么
明确代理人的角色。GPT 能够对复杂的任务进行推理,但当它有明确的工作时,才能取得最佳效果。
从一个确定的功能开始--比如回答产品问题、帮助用户预约或总结法律文件--然后再进行扩展。从一开始就不必过度设计。
第 2 步:创建代理并向其下达指令
在Botpress Studio 中,创建一个新的机器人项目。
在 "说明 "部分,告诉GPT 它的具体工作内容。
.webp)
例如"你是一个贷款顾问机器人。帮助用户了解不同的贷款类型,根据他们的输入计算贷款资格,并引导他们进入申请链接"。
GPT 能理解详细的任务框架--你的指令越具体,它的性能就越好。
步骤 3:向代理提供工作内容
上传文件、粘贴关键内容或链接到知识库中的实时页面。GPT 在回答问题和做出决策时会参考这些内容。
包括一些好的内容:
- 定价细目
- 产品或服务概述
- 关键页面(演示、试用、联系表单)
- 内部流程文件(如果是内部代理)
GPT 可以从冗长的文件中取材,因此不必担心篇幅过短,只需保持相关性和条理性即可。
步骤 4:选择GPT 作为LLM
.webp)
要确保您的代理使用的是GPT,请前往Botpress Studio 左侧边栏的 "机器人设置"。
- 点击进入机器人设置
- 滚动到 "LLM 提供商"部分
- 根据 模型请从GPT 变体中选择一个:
gpt-5
进行全面推理和多步逻辑
gpt-5-mini
实现更快、更轻的交互
pt-5 纳米
用于超低延迟任务
选择模型后,所有指令、知识库答案和推理行为都将由GPT 支持。您可以根据成本、延迟或输出质量随时切换变体。
第 5 步:部署到WhatsApp、Slack 或网站等渠道
一旦您的GPT 代理按照您想要的方式运行,您就可以立即将其部署到类似的平台上:
Botpress 等人工智能代理平台负责集成工作,因此用户可以利用GPT强大功能,快速部署到任何渠道。
GPT 比GPT 强在哪里?
虽然GPT 带来了自GPT 以来最大的架构转变,但如果直接将其与前代产品GPT 相比较,情况就会变得更加明朗。
在深入了解开发人员和用户的实际体验之前,下表以可衡量的方式列出了这些变化。
从纸面上看,GPT 大幅扩展了上下文窗口,在相同的输出长度下使用的标记更少。它的多模态响应也更接近文本、图像和语音。
即便如此,开发人员和用户社区中的情况也远比规格表所显示的要复杂得多。
用户对GPT 发布的反应
GPT 的发布是OpenAI最两极分化的更新之一。除了基准图之外,社区几乎在一瞬间就分裂成了两派,一派对模型更深入的推理感到兴奋,而另一派则对GPT 所带来的成果表示惋惜。
"在我需要的时候,我的 4.o 就像我最好的朋友。现在它就这么没了,感觉就像有人死了一样"。
- Reddit 用户在GPT被突然删除后表达了情感依恋和悲伤。参考资料Verge
技术方面
"GPT的先进性能毋庸置疑,但由于缺乏模型选择,许多开发人员失去了赖以生存的简单控制"。
-
参考资料:汤姆指南
OpenAI 团队正在现场处理这种混合反应,山姆-奥特曼(Sam Altman)在 X 上发布了有关模型选择、传统模型回滚、更高限制等方面的最新消息。
GPT 是如何训练的?
OpenAI 提供了有关GPT.5 训练的见解,为GPT 的开发提供了线索。GPT.5 在GPT 的基础上进行了扩展,在保持通用模型的同时扩大了预训练规模。
培训方法
与前几代系统一样,GPT 预计也将通过以下方式进行训练:
- 监督微调(SFT)--从人类标记的数据集中学习。
- 从人类反馈中强化学习(RLHF)--通过迭代反馈回路优化反应。
- 新的监督技术--可能是基于 o3 以推理为重点的改进。
这些技术是GPT.5 改进调整和决策的关键,GPT 可能会进一步推动这些技术的发展。
虽然GPT本身是由OpenAI 通过大规模监督和强化学习训练出来的,但团队现在可以通过外部服务提供商在自己的数据上训练GPT 模型,为特定领域创建定制行为。
硬件和计算能力
GPT 的培训由微软的人工智能基础架构和英伟达™(NVIDIA®)公司的最新 GPU 提供支持。
- 2024 年 4 月,OpenAI 接收了第一批英伟达 H200 GPU,这是 H100 的重要升级版。
- 英伟达™(NVIDIA®)的 B100 和 B200 GPU 到 2025 年才会量产,这意味着OpenAI 可能仍在现有硬件上优化训练。
微软的人工智能超级计算集群也在GPT 的训练中发挥了作用。虽然细节有限,但OpenAI的下一个模型已被证实将在微软最新的人工智能基础设施上运行。
GPT 发布日期
经过几个月的猜测,OpenAI 正式宣布GPT 将于 2025 年 8 月 6 日推出,并在 X(推特前身)上发布了一段隐晦的预告:
直播标题中的 "5 "是唯一需要确认的地方--它标志着GPT 的到来。仅仅 24 小时后,即太平洋时间 8 月 7 日上午 10 点,OpenAI 就开始在ChatGPT、API 和GitHub Models Playground 上推出GPT。
这个时间点也与萨姆-奥特曼早前在 2025 年 2 月发表的GPT 将 "在几个月内"到来的言论,以及米拉-穆拉提在GPT 活动期间预测 "博士级智能 "将在 18 个月内出现的说法相吻合。
GPT 现已上线并可公开访问,它代表了OpenAI最新的 "前沿模型",是GPT.5 Orion 的重大飞跃,而GPT.5 Orion 被认为只是一个过渡版本。
使用OpenAI LLMs构建人工智能代理
抛开复杂性--开始构建由OpenAI 模型驱动的人工智能代理,无任何摩擦。无论您需要的是Slack 的聊天机器人、Notion 的智能助手,还是WhatsApp 的客户支持机器人,只需点击几下即可无缝部署。
凭借灵活的集成、自主推理和简便的部署,Botpress 可帮助您创建人工智能代理,从而真正提高工作效率和参与度。
今天就开始吧 --免费。
常见问题
1.GPT 是否会存储或使用我的数据来改进训练?
不会,GPT 默认不会存储或使用您的数据进行训练。OpenAI 已经确认,除非您明确选择,否则来自ChatGPT (包括GPT)的数据不会用于训练模型,而且所有 API 和企业使用都会自动排除在训练之外。
2.OpenAI 正在采取哪些措施来确保GPT 对用户的安全性?
为确保GPT 对用户安全可靠,OpenAI 采用了从人类反馈中强化学习(RLHF)、对抗测试和微调等技术,以减少有害输出。他们还发布了 "系统卡",以披露模型的局限性,并部署实时监控以检测滥用情况。
3.GPT 能否用于在没有编码经验的情况下构建自主代理?
是的,通过使用Botpress 或 Langflow 等无代码平台,GPT 可用于构建自主代理,而无需编码经验。这些工具允许用户设计工作流程、连接应用程序接口,并通过由GPT 在引擎盖下提供的拖放界面添加逻辑。
4.GPT 将如何影响客户支持、教育和法律等传统工作?
GPT 将自动执行重复性任务,如回答常见问题、评分或总结法律文件,这可能会减少对客户支持、教育和法律领域初级职位的需求。不过,它也有望在人工智能监督、工作流程设计和战略咨询领域创造新的机会。
5.GPT 是多语种的吗?不同语言之间的比较如何?
是的,GPT 是多语种的,预计在非英语语言方面的性能将比GPT 有所提高。虽然 GPT-5 在英语方面表现最佳,但它可以流畅地处理数十种主要语言,不过资源较少的语言或小众语言在质量上可能仍会有轻微差距。