OpenAI用新版本的GPT-5升级了Codex

Author Avatar
AI百晓生
2025-09-16
阅读2

OpenAI周一宣布,它将向其人工智能编码代理发布新版本的GPT-5,药典。该公司表示,其名为GPT-5-Codex的新模型比以前的模型更动态地花费“思考”时间,可以在任何地方花费几秒钟到七个小时来完成一项编码任务。因此,它在代理编码基准测试中表现得更好。

这种新模式现在正在Codex产品中推出,可以通过终端、IDE、GitHub或ChatGPT访问,面向所有ChatGPT Plus、Pro、Business、Edu和企业用户。OpenAI表示,它计划在未来向API客户提供该模型。

此次更新是OpenAI努力使Codex与其他人工智能编码产品(如Claude Code、Anysphere的Cursor或微软的GitHub Copilot)相比更具竞争力的一部分。由于强烈的用户需求,人工智能编码工具的市场在去年变得更加拥挤。光标ARR超过5亿美元在2025年早些时候,类似的代码编辑器Windsurf是混乱的收购尝试它的团队分裂为谷歌和认知两部分。

OpenAI表示,GPT 5代比GPT 5代表现更好SWE-bench已验证,这是一个衡量代理编码能力的基准,也是一个衡量大型已建立存储库中代码重构任务性能的基准。

image.png

该公司还表示,它培训了GPT-5-Codex进行代码审查,并要求有经验的软件工程师评估模型的审查意见。据报道,工程师们发现GPT-5-Codex提交了更少的错误评论,同时增加了更多的“高影响力的评论”

在一次简报中,OpenAI的Codex产品负责人Alexander Embiricos表示,性能的提高很大程度上要归功于GPT-5-Codex的动态“思维能力”用户可能熟悉ChatGPT中的GPT-5路由器,它根据任务的复杂性将查询定向到不同的模型。Embiricos表示,GPT-5-Codex的工作原理类似,但它没有路由器,可以实时调整一项任务的工作时间。

Embiricos表示,与路由器相比,这是一个优势,路由器从一开始就决定在一个问题上使用多少计算能力和时间。相反,GPT-5-Codex可以在五分钟内决定一个需要再花一个小时的问题。恩比里科斯说,他见过模型在某些情况下需要7个小时以上。

0
好文章,需要你的鼓励