知名百科  > 所属分类  >  科技百科   

GPT·5

GPT-5是AI初创公司OpenAI开发的一款大型语言模型,作为GPT-4的迭代产品,它在多个领域展现出了卓越的性能,标志着AI进化进入了一个新的战略阶段。

目录

基本信息 编辑本段

类别详情
开发公司OpenAI
代号Orion
产品类型大型语言模型、“用于使用语言模型的可下载计算机软件
模型系列GPT-5系列,包含GPT-5、GPT-5mini、GPT-5nano以及GPT-5 - Codex四款模型
上下文长度均为400K
最大输出128K tokens
发布时间当地时间2025年8月7日(北京时间8月8日凌晨1时)

模型介绍 编辑本段

GPT-5是OpenAI首次将o系列模型的推理能力与GPT系列模型的快速响应能力相结合的产物。它是一个集成模型(integrated model),融合了大语言模型GPT系列和推理模型o系列,并非单一的语言或者推理模型,而是具备调度子模型的能力。首次使用了内嵌式三位一体集成架构,系统由三部分组成:

GPT-5 - main模型:处理常规问题。

GPT-5 - thinking深度思考模型:解决复杂任务。

实时决策的路由机制:根据对话类型、复杂程度、工具需求以及用户的明确意图,快速决定使用哪个模型,自主决定是否进入深度思考模式,自动匹配最适合的模型。此外,还有额度使用完后启动的mini版本。

其用途广泛,涵盖了可下载与语言模型相关的计算机程序和软件,能生成人类语音和文本,处理、生成、理解和分析自然语言。其他功能还包括基于机器学习的语言和语音处理、文本/语音的翻译、共享用于机器学习和预测分析的数据集、将音频数据文件转换为文本等。OpenAI还打算提供软件即服务(SaaS)功能,并开发和实现人工神经网络

发展历程 编辑本段

早期阶段

2023月18日,OpenAI向商标局(USPTO)提交了“GPT - 5”商标申请,在申请中将其描述为“用于使用语言模型的可下载计算机软件”,并概述了其用途,与上述模型介绍中的功能相符。

2024年1月,OpenAI首席执行官山姆·奥特曼(Sam Altman)接受媒体采访时表示,推出可能被称为GPT - 5的新模型是他的首要任务,并称GPT - 5“将能够比现有模型做更多的事情”。

测试阶段

2023年9月,OpenAI官宣招募一批红队测试人员(Red Teaming Network),邀请不同领域专家评估模型。红队测试是一种安全测试方法,目的是通过模拟真实世界中的攻击,来评估和提升系统或网络的安全性。

2024年4月,有网友透露GPT - 5正在进行红队测试,随后HACKIT AI社区创始人、网络安全架构师Yuval晒出OpenAI发给自己的红队邀请邮件。

截至2024年12月,OpenAI已经完成了至少两次大型训练运行,目的是通过对大量数据的训练来改进模型。最初训练运行比预期慢,了解该项目的人士指出,Orion目前充其量只比OpenAI的公开模型要好一些,距离“重大飞跃”还很遥远,且该模型为期六个月的训练仅在计算成本方面就花费了约5亿美元。同时,相关媒体报道称GPT - 5的研发进程落后于预期,因其研发测试成本巨大,产品效果不理想,预计不会在2024年发布。

2025年2月13日,OpenAI首席执行官萨姆·奥尔特曼宣布,OpenAI将在未来几个月内推出名为GPT - 5的模型,并公布了GPT - 5模型的发展路线图。该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台,不再计划将o3作为独立模型发布。免费版ChatGPT能在标准智能设置下无限制地使用GPT - 5进行对话。

2025年3月,萨姆·奥尔特曼称,DeepSeek的迅速崛起给OpenAI带来了深刻的教训。当OpenAI隐藏“思维链”(Chain of Thought)功能时,给了竞争对手可乘之机,DeepSeek凭借这一功能实现了病毒式传播,这让OpenAI意识到免费层策略的重要性,并促使其重新审视自身的产品布局。

GPT·5" href="uploads/202511/1763002295nCtFKpv3.jpg" target="_blank">GPT·5GPT·5

2025年4月,萨姆·奥尔特曼对外透露了公司发布计划的重大转变,宣布在备受期待的GPT - 5发布之前将推出两个中级大模型。

2025年5月,GPT - 4.1核心研究员Michelle Pokrass透露,构建GPT - 5的挑战在于在推理和聊天之间找到适当的平衡。

2025年6月,在墨西哥举办的AI Summit峰会上,两名OpenAI公司代表透露,公司正在开发下一代基础模型GPT - 5,并计划通过该模型与竞争对手展开更激烈角逐,明确表示GPT - 5即将面世,且性能将远超GPT - 4等现有模型。

2025年7月,IT之家消息称,GPT - 5有望在未来几天或几周内正式亮相。有迹象表明,OpenAI正在测试一个代号为gpt - 5 - reasoning - alpha - 2025 - 07 - 13的新模型,该模型已于7月13日定稿,当前正处于最终测试阶段。同月,萨姆·奥尔特曼在社交平台上确认,OpenAI准备在8月初正式推出GPT - 并透露新版本将包括mini和nano等多个规模不同的型号,并通过API向外部开发者和企业开放使用。GPT - 5被设计为一个高度集成的技术系统,旨在融合o系列与GPT系列模型的功能,打造一个能够调用全部工具并胜任多样化任务的统一平台,这一版本被视为推动语言模型与高级推理能力深度融合的关键进展。

正式发布

当地时间2025年8月7日(北京时间8月8日凌晨1时),OpenAI举行时长超1小时的线上发布会,正式推出GPT - 5人工智能模型。GPT - 5面向所有免费用户及众多付费ChatGPT订阅用户开放,付费用户拥有更高的使用限额,付费用户(Plus、Pro、Team)可获得更高使用额度或无限使用。微软同步宣布将该模型整合至Copilot、Microsoft 365 Copilot、Azure AI Foundry和GitHub Copilot等平台,标志着GPT - 5全面登陆微软生态系统。当地时间9月15日,OpenAI发布了GPT - 5 - Codex模型,这是一个专门为Agent编程优化的模型,同步在Codex CLI、IDE扩展、网页端、移动端以及GitHub代码审查中可用。

功能特点 编辑本段

性能卓越

截至2025年8月8日,在大模型竞技场LMArena上,刚刚上线的GPT - 5凭借着极强的性能在所有细分类目中都位列第一。

编码能力突出

GPT - 5是OpenAI迄今为止最强大的编码模型,在复杂的前端生成和大型代码库调试方面表现突出,能够仅凭一个提示就创建美观响应式的网站应用程序App和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面的改进。在从GitHub获取现实世界编码任务的基准测试SWE - bench Verified中,GPT - 5思考后首次尝试的准确率达74.9%,高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。例如,OpenAI的研究者演示要求GPT - 5创建一款网页App,帮助说英语的用户学习法语,且该App必须有一个引人入胜的主题,包含抽认卡、测验、经典的贪吃蛇游戏,以及追踪每日学习进度的方法。研究者将相同的提示词提交到两个GPT - 5窗口中,几分钟后生成了两个不同的App,虽然OpenAI的负责人称这些App“存在一些缺陷”,但用户可以根据个人喜好再调整AI生成的软件,如更改背景或添加更多标签页。

幻觉大幅降低

GPT - 5的“幻觉”问题大幅改善,在HealthBench Hard Hallucinations测试中错误信息率仅为1.6%,远低于GPT - 4o的15.8%。OpenAI为GPT - 5引入了新的安全训练模式“安全补全”,旨在让模型在安全范围内提供最有帮助的答案。与GPT - 4o相比,GPT - 5的事实错误率降低了45%;在深度思考模式下,事实错误率更是比o3大幅下降80%,变得更加准确可靠。在开放性事实准确性基准LongFact和FActScore测试中,GPT - 5的幻觉率比o3减少大约六倍,长篇内容生成的准确性显著提升。

创意写作出色

GPT - 5能够处理结构复杂的写作任务,如无韵律的抑扬格五音步诗或自然流动的自由诗,犹如诗人。OpenAI的ChatGPT业务副总Nick Turley表示,GPT - 5在创意任务上表现出“更好的品味”,响应更自然。

健康咨询实用

GPT - 5能更积极地标记潜在健康问题,帮助用户解析医疗结果,但OpenAI强调,ChatGPT不能替代医疗专业人员。在名为HealthBench Hard Hallucinations的测试中,具备思考能力的GPT - 5出现幻觉的错误信息率仅为1.6%,远低于GPT - 4o和o3模型,后两者的错误信息率分别为15.8%和12.9%。

记忆功能增强

ChatGPT的记忆(Memory)功能现在支持Pro、Plus以及Teams订阅用户连接ChatGPT至谷歌账号,访问日历内容。这意味着ChatGPT可以联动Gmail和Google Calendar,从而让GPT - 5根据用户日常行程,获取更多情境能力。ChatGPT甚至可以提醒用户回复其收到的电子邮件,阅读但尚未回复的电子邮件。这一功能将首先向Pro用户推出,后续扩展到Plus和Teams订阅用户。

安全补全机制

GPT - 5引入了一种新的安全训练形式,名为安全补全(safe completions),它教模型在安全范围内尽可能给出最有帮助的答案。有时,这可能意味着部分回答用户的问题,或者只提供高水平的回答。如果需要拒绝,经过训练的GPT - 5会以透明的方式告知用户拒绝的原因,并提供安全的替代方案。在受控的实验和OpenAI的生产模型中,OpenAI都发现这种安全补全的方法更加细致入微,能够更好地引导双重用途问题,增强对模糊意图的鲁棒性,并减少不必要的过度拒绝。

预设性格功能

OpenAI为所有ChatGPT用户推出四种预设性格的全新研究预览版。初始的四种性格选项——愤世嫉俗者(Cynic)、机器人(Robot)、倾听者(Listener)和书呆子(Nerd)都是可选的,用户可在设置中随时调整,用以匹配ChatGPT和用户的沟通风格。上述四种性格最初适用于文本聊天,之后将扩展到语音聊天,让用户无需编写自定义提示词即可设置ChatGPT的交互方式,无论是简洁专业的、周到支持的,还是略带讽刺的。

社会评价 编辑本段

萨姆·奥尔特曼在发布会上称,如果说GPT - 4是一个大学生,那么GPT - 5就是“真正的专家”。

相关事件 编辑本段

撤销权限风波

2025年8月1日,《连线》发布博文称在OpenAI发布GPT - 5模型之际,Anthropic公司称OpenAI违反了服务条款,撤销了OpenAI对其模型的API访问权限。根据Anthropic的商业服务条款,客户禁止使用该服务“构建竞争性产品或服务,包括训练竞争性AI模型”或“逆向工程或复制”服务。此次撤销OpenAI对Claude的访问权限,正值其准备发布新AI模型GPT - 5,有消息称该模型在编程方面表现更佳。

发布会现场BUG事件

在GPT - 5的发布会上,直播中展示的性能图表存在数据与图表显示不匹配的情况,例如在编程基准测试(swe - bench)的图表中,GPT - 5的准确率标注为52.8%,但对应的柱状图高度却超过了标注为69.1%的旧模型O3的柱状图,引发了网友的广泛质疑。关于减少幻觉方面的demo,也被人挑出了毛病,奥尔特曼也承认了错误。同时,马斯克转发了GPT - 5在ARC - AGI - 2上没有打败Grok 4的消息。

连破“百年悬案”

2025年10月,两位研究人员仅用一个周末,便借助GPT - 5解决了10个「百年悬案」级的埃尔德什难题。正如数学家陶哲轩所言,AI最有成效的应用是处理查文献等耗时环节,将研究者解放出来专注于思考。这标志着一种科研范式的到来,AI正成为重塑基础科学、加速人类接近真理的工具。

附件列表


0

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 情绪消费    下一篇 向光出发 | 《我心光明》新书分享会在京举行

标签

同义词

暂无同义词