顶[0] 分享评论[0] 编辑

GPT·5

GPT-5是AI初创公司OpenAI开发的一款大型语言模型，作为GPT-4的迭代产品，它在多个领域展现出了卓越的性能，标志着AI进化进入了一个新的战略阶段。

基本信息编辑本段

类别	详情
开发公司	OpenAI
代号	Orion
产品类型	大型语言模型、“用于使用语言模型的可下载计算机软件”
模型系列	GPT-5系列，包含GPT-5、GPT-5mini、GPT-5nano以及GPT-5 - Codex四款模型
上下文长度	均为400K
最大输出	128K tokens
发布时间	当地时间2025年8月7日（北京时间8月8日凌晨1时）

模型介绍编辑本段

GPT-5是OpenAI首次将o系列模型的推理能力与GPT系列模型的快速响应能力相结合的产物。它是一个集成模型（integrated model），融合了大语言模型GPT系列和推理模型o系列，并非单一的语言或者推理模型，而是具备调度子模型的能力。首次使用了内嵌式三位一体集成架构，系统由三部分组成：

GPT-5 - main模型：处理常规问题。

GPT-5 - thinking深度思考模型：解决复杂任务。

实时决策的路由机制：根据对话类型、复杂程度、工具需求以及用户的明确意图，快速决定使用哪个模型，自主决定是否进入深度思考模式，自动匹配最适合的模型。此外，还有额度使用完后启动的mini版本。

其用途广泛，涵盖了可下载与语言模型相关的计算机程序和软件，能生成人类语音和文本，处理、生成、理解和分析自然语言。其他功能还包括基于机器学习的语言和语音处理、文本/语音的翻译、共享用于机器学习和预测分析的数据集、将音频数据文件转换为文本等。OpenAI还打算提供软件即服务（SaaS）功能，并开发和实现人工神经网络。

发展历程编辑本段

早期阶段

2023月18日，OpenAI向商标局（USPTO）提交了“GPT - 5”商标申请，在申请中将其描述为“用于使用语言模型的可下载计算机软件”，并概述了其用途，与上述模型介绍中的功能相符。

2024年1月，OpenAI首席执行官山姆·奥特曼（Sam Altman）接受媒体采访时表示，推出可能被称为GPT - 5的新模型是他的首要任务，并称GPT - 5“将能够比现有模型做更多的事情”。

测试阶段

2023年9月，OpenAI官宣招募一批红队测试人员（Red Teaming Network），邀请不同领域专家评估模型。红队测试是一种安全测试方法，目的是通过模拟真实世界中的攻击，来评估和提升系统或网络的安全性。

2024年4月，有网友透露GPT - 5正在进行红队测试，随后HACKIT AI社区创始人、网络安全架构师Yuval晒出OpenAI发给自己的红队邀请邮件。

截至2024年12月，OpenAI已经完成了至少两次大型训练运行，目的是通过对大量数据的训练来改进模型。最初训练运行比预期慢，了解该项目的人士指出，Orion目前充其量只比OpenAI的公开模型要好一些，距离“重大飞跃”还很遥远，且该模型为期六个月的训练仅在计算成本方面就花费了约5亿美元。同时，相关媒体报道称GPT - 5的研发进程落后于预期，因其研发测试成本巨大，产品效果不理想，预计不会在2024年发布。

2025年2月13日，OpenAI首席执行官萨姆·奥尔特曼宣布，OpenAI将在未来几个月内推出名为GPT - 5的模型，并公布了GPT - 5模型的发展路线图。该模型将整合OpenAI的大量技术，包括o3，并应用于聊天机器人ChatGPT以及API平台，不再计划将o3作为独立模型发布。免费版ChatGPT能在标准智能设置下无限制地使用GPT - 5进行对话。

2025年3月，萨姆·奥尔特曼称，DeepSeek的迅速崛起给OpenAI带来了深刻的教训。当OpenAI隐藏“思维链”（Chain of Thought）功能时，给了竞争对手可乘之机，DeepSeek凭借这一功能实现了病毒式传播，这让OpenAI意识到免费层策略的重要性，并促使其重新审视自身的产品布局。

GPT·5" href="uploads/202511/1763002295nCtFKpv3.jpg" target="_blank"> GPT·5

GPT·5

2025年4月，萨姆·奥尔特曼对外透露了公司发布计划的重大转变，宣布在备受期待的GPT - 5发布之前将推出两个中级大模型。

2025年5月，GPT - 4.1核心研究员Michelle Pokrass透露，构建GPT - 5的挑战在于在推理和聊天之间找到适当的平衡。

2025年6月，在墨西哥举办的AI Summit峰会上，两名OpenAI公司代表透露，公司正在开发下一代基础模型GPT - 5，并计划通过该模型与竞争对手展开更激烈角逐，明确表示GPT - 5即将面世，且性能将远超GPT - 4等现有模型。

2025年7月，IT之家消息称，GPT - 5有望在未来几天或几周内正式亮相。有迹象表明，OpenAI正在测试一个代号为gpt - 5 - reasoning - alpha - 2025 - 07 - 13的新模型，该模型已于7月13日定稿，当前正处于最终测试阶段。同月，萨姆·奥尔特曼在社交平台上确认，OpenAI准备在8月初正式推出GPT - 并透露新版本将包括mini和nano等多个规模不同的型号，并通过API向外部开发者和企业开放使用。GPT - 5被设计为一个高度集成的技术系统，旨在融合o系列与GPT系列模型的功能，打造一个能够调用全部工具并胜任多样化任务的统一平台，这一版本被视为推动语言模型与高级推理能力深度融合的关键进展。

正式发布

当地时间2025年8月7日（北京时间8月8日凌晨1时），OpenAI举行时长超1小时的线上发布会，正式推出GPT - 5人工智能模型。GPT - 5面向所有免费用户及众多付费ChatGPT订阅用户开放，付费用户拥有更高的使用限额，付费用户（Plus、Pro、Team）可获得更高使用额度或无限使用。微软同步宣布将该模型整合至Copilot、Microsoft 365 Copilot、Azure AI Foundry和GitHub Copilot等平台，标志着GPT - 5全面登陆微软生态系统。当地时间9月15日，OpenAI发布了GPT - 5 - Codex模型，这是一个专门为Agent编程优化的模型，同步在Codex CLI、IDE扩展、网页端、移动端以及GitHub代码审查中可用。

功能特点编辑本段

性能卓越

截至2025年8月8日，在大模型竞技场LMArena上，刚刚上线的GPT - 5凭借着极强的性能在所有细分类目中都位列第一。

编码能力突出

GPT - 5是OpenAI迄今为止最强大的编码模型，在复杂的前端生成和大型代码库调试方面表现突出，能够仅凭一个提示就创建美观响应式的网站、应用程序App和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面的改进。在从GitHub获取现实世界编码任务的基准测试SWE - bench Verified中，GPT - 5思考后首次尝试的准确率达74.9%，高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。例如，OpenAI的研究者演示要求GPT - 5创建一款网页App，帮助说英语的用户学习法语，且该App必须有一个引人入胜的主题，包含抽认卡、测验、经典的贪吃蛇游戏，以及追踪每日学习进度的方法。研究者将相同的提示词提交到两个GPT - 5窗口中，几分钟后生成了两个不同的App，虽然OpenAI的负责人称这些App“存在一些缺陷”，但用户可以根据个人喜好再调整AI生成的软件，如更改背景或添加更多标签页。

幻觉大幅降低

GPT - 5的“幻觉”问题大幅改善，在HealthBench Hard Hallucinations测试中错误信息率仅为1.6%，远低于GPT - 4o的15.8%。OpenAI为GPT - 5引入了新的安全训练模式“安全补全”，旨在让模型在安全范围内提供最有帮助的答案。与GPT - 4o相比，GPT - 5的事实错误率降低了45%；在深度思考模式下，事实错误率更是比o3大幅下降80%，变得更加准确可靠。在开放性事实准确性基准LongFact和FActScore测试中，GPT - 5的幻觉率比o3减少大约六倍，长篇内容生成的准确性显著提升。

创意写作出色

GPT - 5能够处理结构复杂的写作任务，如无韵律的抑扬格五音步诗或自然流动的自由诗，犹如诗人。OpenAI的ChatGPT业务副总Nick Turley表示，GPT - 5在创意任务上表现出“更好的品味”，响应更自然。

健康咨询实用

GPT - 5能更积极地标记潜在健康问题，帮助用户解析医疗结果，但OpenAI强调，ChatGPT不能替代医疗专业人员。在名为HealthBench Hard Hallucinations的测试中，具备思考能力的GPT - 5出现幻觉的错误信息率仅为1.6%，远低于GPT - 4o和o3模型，后两者的错误信息率分别为15.8%和12.9%。

记忆功能增强

ChatGPT的记忆（Memory）功能现在支持Pro、Plus以及Teams订阅用户连接ChatGPT至谷歌账号，访问日历内容。这意味着ChatGPT可以联动Gmail和Google Calendar，从而让GPT - 5根据用户日常行程，获取更多情境能力。ChatGPT甚至可以提醒用户回复其收到的电子邮件，阅读但尚未回复的电子邮件。这一功能将首先向Pro用户推出，后续扩展到Plus和Teams订阅用户。

安全补全机制

GPT - 5引入了一种新的安全训练形式，名为安全补全（safe completions），它教模型在安全范围内尽可能给出最有帮助的答案。有时，这可能意味着部分回答用户的问题，或者只提供高水平的回答。如果需要拒绝，经过训练的GPT - 5会以透明的方式告知用户拒绝的原因，并提供安全的替代方案。在受控的实验和OpenAI的生产模型中，OpenAI都发现这种安全补全的方法更加细致入微，能够更好地引导双重用途问题，增强对模糊意图的鲁棒性，并减少不必要的过度拒绝。

预设性格功能

OpenAI为所有ChatGPT用户推出四种预设性格的全新研究预览版。初始的四种性格选项——愤世嫉俗者（Cynic）、机器人（Robot）、倾听者（Listener）和书呆子（Nerd）都是可选的，用户可在设置中随时调整，用以匹配ChatGPT和用户的沟通风格。上述四种性格最初适用于文本聊天，之后将扩展到语音聊天，让用户无需编写自定义提示词即可设置ChatGPT的交互方式，无论是简洁专业的、周到支持的，还是略带讽刺的。

社会评价编辑本段

萨姆·奥尔特曼在发布会上称，如果说GPT - 4是一个大学生，那么GPT - 5就是“真正的专家”。

GPT·5

基本信息编辑本段

模型介绍编辑本段

发展历程编辑本段

早期阶段

测试阶段

正式发布

功能特点编辑本段

性能卓越

编码能力突出

幻觉大幅降低

创意写作出色

健康咨询实用

记忆功能增强

安全补全机制

预设性格功能

社会评价编辑本段

相关事件编辑本段

撤销权限风波

发布会现场BUG事件

连破“百年悬案”

附件列表

标签

同义词

GPT·5

基本信息 编辑本段

模型介绍 编辑本段

发展历程 编辑本段

早期阶段

测试阶段

正式发布

功能特点 编辑本段

性能卓越

编码能力突出

幻觉大幅降低

创意写作出色

健康咨询实用

记忆功能增强

安全补全机制

预设性格功能

社会评价 编辑本段

相关事件 编辑本段

撤销权限风波

发布会现场BUG事件

连破“百年悬案”

附件列表

标签

同义词

基本信息编辑本段

模型介绍编辑本段

发展历程编辑本段

功能特点编辑本段

社会评价编辑本段

相关事件编辑本段