OpenAI用新版本的GPT-5升级了Codex

2025-09-16 14:14

OpenAI周一宣布，它将向其人工智能编码代理发布新版本的GPT-5，药典。该公司表示，其名为GPT-5-Codex的新模型比以前的模型更动态地花费“思考”时间，可以在任何地方花费几秒钟到七个小时来完成一项编码任务。因此，它在代理编码基准测试中表现得更好。

这种新模式现在正在Codex产品中推出，可以通过终端、IDE、GitHub或ChatGPT访问，面向所有ChatGPT Plus、Pro、Business、Edu和企业用户。OpenAI表示，它计划在未来向API客户提供该模型。

此次更新是OpenAI努力使Codex与其他人工智能编码产品(如Claude Code、Anysphere的Cursor或微软的GitHub Copilot)相比更具竞争力的一部分。由于强烈的用户需求，人工智能编码工具的市场在去年变得更加拥挤。光标ARR超过5亿美元在2025年早些时候，类似的代码编辑器Windsurf是混乱的收购尝试它的团队分裂为谷歌和认知两部分。

OpenAI表示，GPT 5代比GPT 5代表现更好SWE-bench已验证，这是一个衡量代理编码能力的基准，也是一个衡量大型已建立存储库中代码重构任务性能的基准。

该公司还表示，它培训了GPT-5-Codex进行代码审查，并要求有经验的软件工程师评估模型的审查意见。据报道，工程师们发现GPT-5-Codex提交了更少的错误评论，同时增加了更多的“高影响力的评论”

在一次简报中，OpenAI的Codex产品负责人Alexander Embiricos表示，性能的提高很大程度上要归功于GPT-5-Codex的动态“思维能力”用户可能熟悉ChatGPT中的GPT-5路由器，它根据任务的复杂性将查询定向到不同的模型。Embiricos表示，GPT-5-Codex的工作原理类似，但它没有路由器，可以实时调整一项任务的工作时间。

Embiricos表示，与路由器相比，这是一个优势，路由器从一开始就决定在一个问题上使用多少计算能力和时间。相反，GPT-5-Codex可以在五分钟内决定一个需要再花一个小时的问题。恩比里科斯说，他见过模型在某些情况下需要7个小时以上。

好文章，需要你的鼓励