openai科技升级:介绍Codex都升级了些什么

Codex变得更快、更可靠、更擅长实时协作,并在您开发的任何地方独立处理任务——无论是通过终端、IDE、Web还是您的手机。
2025年9月15日,openai发布了GPT-5-Codex,这是针对Codex中的代理编码进一步优化的GPT-5版本。GPT-5-Codex的训练重点是现实世界的软件工程工作;它同样擅长快速、互动的会话,并独立处理冗长而复杂的任务。它的代码审查功能可以在发布之前发现关键错误。GPT-5-Codex在使用Codex的任何地方都可用——它是云任务和代码审查的默认设置,开发人员可以通过Codex CLI和IDE扩展选择将其用于本地任务。
自从4月首次推出Codex CLI和5月首次推出Codex web以来,Codex已稳步发展成为更有效的编码协作者。两周前,我们将Codex统一为一个由您的ChatGPT帐户连接的产品体验,使您能够在本地环境和云之间无缝移动工作,而不会丢失上下文。Codex现在可以在您开发的地方运行——在终端或IDE、Web、GitHub,甚至ChatGPT iOS应用程序中。Codex包含在ChatGPT Plus、Pro、Business、Edu和Enterprise计划中。
通过这些更新,Codex更接近我们一直以来的目标——一个了解您的环境、与您一起工作并可靠地为您的团队承担工作的队友。
GPT-5-Codex
GPT-5-Codex是GPT-5的一个版本,针对Codex中的代理软件工程进行了进一步优化。它接受了复杂的、现实世界的工程任务的训练,例如从头开始构建完整项目、添加功能和测试、调试、执行大规模重构以及进行代码审查。它更易于纵,更好地遵守AGENTS.md指令,并生成更高质量的代码——只需告诉它你需要什么,而无需编写有关样式或代码清洁度的冗长说明。
SWE-bench验证:从历史上看,包括在GPT-5发布时,我们报告了477个SWE-bench验证任务的结果,因为某些任务无法在我们的基础设施中运行。此后,我们解决了这个问题,现在报告了所有500个任务。
代码重构任务:我们的代码重构评估包含来自大型已建立存储库的重构样式任务,包括Python、Go甚至OCaml中的任务。一个示例任务是来自Gitea的以下拉取请求,它更改了232个文件和3,541行,以通过应用程序逻辑线程一个ctx变量。
GPT-5-Codex会根据任务的复杂性更动态地调整它花在思考上的时间。该模型结合了编码代理的两项基本技能:在交互式会话中与开发人员配对,以及在较长的任务上持久、独立地执行。这意味着Codex在处理定义明确的小请求或与它聊天时会感觉更敏捷,并且可以在大型重构等复杂任务上工作更长时间。在测试过程中,我们看到GPT-5-Codex在大型复杂任务上一次独立工作超过7小时,迭代其实现,修复测试失败,并最终交付成功的实施。
在OpenAI员工流量上,我们看到,对于按模型生成的令牌(包括隐藏推理和最终输出)排序的后10%的用户轮次,GPT-5-Codex使用的令牌比GPT-5少93.7%。相反,对于前10%的人,GPT-5-Codex思考得更多,花费两倍的时间推理、编辑和测试代码以及迭代。
GPT-5-Codex经过专门训练,用于进行代码审查和发现严重缺陷。在审查时,它会导航您的代码库,通过依赖项进行推理,并运行您的代码和测试以验证正确性。我们评估了来自流行开源存储库的最新提交的代码审查性能。对于每次提交,经验丰富的软件工程师都会评估审查意见的正确性和重要性。我们发现GPT-5-Codex的评论不太可能不正确或不重要,从而将更多用户注意力保留在关键问题上。
GPT-5-Codex是前端任务的可靠合作伙伴。除了创建美观的桌面应用程序外,GPT-5-Codex在创建移动网站时还显示出人类偏好评估的显着改进。在云端工作时,它可以查看您作为输入提供的图像或屏幕截图,目视检查其进度,并向您显示其工作的屏幕截图。
Codex更新
我们最近还进行了一些更新,使Codex成为更好的结对程序员,改进了Codex CLI和新的Codex IDE扩展。
Codex CLI
Codex CLI是开源的,过去几个月的社区反馈对于塑造其发展非常宝贵。根据这些反馈,我们围绕代理编码工作流程重建了Codex CLI,以利用我们的模型成为更有能力和更可靠的合作伙伴。现在,您可以直接在CLI中附加和共享图像(屏幕截图、线框图和图表),以构建有关设计决策的共享上下文,并准确获得您想要的内容。在执行更复杂的工作时,Codex现在使用待办事项列表跟踪进度,并包括用于连接到外部系统的Web搜索和MCP等工具,总体上工具使用更加准确。
终端UI也进行了升级:工具调用和差异的格式更好,更易于理解。审批模式简化为三个级别:具有显式批准的只读、具有完全工作区访问权限但需要在工作区外部获得批准的自动,以及能够在任何地方读取文件并使用网络访问权限运行命令的完全访问。它还支持压缩对话状态,使较长的会话更易于管理。
Codex IDE扩展
Codex在您已经工作的地方(包括在您的IDE中)满足您的需求。IDE扩展将Codex代理引入VS Code、Cursor和其他VS Code分支,以便您可以无缝预览本地更改并使用Codex编辑代码。在IDE中使用Codex时,可以编写更短的提示并更快地获得结果,因为Codex可以使用上下文,例如您打开的文件或您选择的代码。
Codex云
除了Codex CLI之外,新的IDE扩展和GitHub集成使Codex云代理更接近开发人员工作流程,因此您现在无需离开编辑器或GitHub即可委派任务。
在幕后,我们还一直在不断提高云基础设施性能。通过缓存容器,我们将新任务和跟进的完成时间中位数缩短了90%。Codex现在还通过扫描常见的安装脚本并执行它们来自动设置自己的环境,并且通过可配置的互联网访问可以运行pip install等命令,以在运行时根据需要获取依赖项。
与CLI和IDE扩展一样,您现在可以使用图像来共享前端设计规范或解释UI错误。在为你构建时,Codex可以启动自己的浏览器,查看它构建的内容,迭代,并将结果的屏幕截图附加到任务和GitHub PR中。有关更多详细信息,请查看文档。
代码审查
Codex现在还包括经过训练的代码审查功能,可以捕获关键缺陷。与静态分析工具不同,它将PR的声明意图与实际差异相匹配,对整个代码库和依赖项进行推理,并执行代码和测试来验证行为。只有最彻底的人工审阅者才能在他们审阅的每项公关中投入这种程度的精力,因此Codex填补了这一空白——帮助团队更早地发现问题,减少审阅者负担,并更有信心地交付。
为GitHub存储库启用后,Codex会在PR从草稿变为就绪时自动审查PR,并将其分析发布到PR上。如果它建议编辑,您可以保持在同一线程中并要求Codex实施它们。您还可以通过在PR中提及“ codex审查”来明确请求审查,并为其提供额外的指导,例如“ codex审查安全漏洞”或“ codex审查过时的依赖项”。查看快速入门,了解如何为存储库设置代码评审。
在OpenAI,Codex现在审查我们的绝大多数PR,每天捕获数百个问题——通常是在人工审查开始之前。这是让团队更有信心地快速行动的关键。
开发人员如何使用Codex
构建安全可信的AI代理
我们构建Codex的重点是保护代码和数据免遭泄露,并防止滥用。默认情况下,Codex在禁用网络访问的沙盒环境中运行,无论是在本地还是在云中。这有助于确保Codex无法在您的计算机上执行有害作,并降低从不受信任的来源进行提示注入的风险。
Codex可以在进行潜在危险作之前请求许可,并经过训练可以运行命令来验证其输出。开发人员可以自定义安全设置以匹配他们的风险承受能力。在云中,您可以限制对受信任域的网络访问。在CLI和IDE扩展中,开发人员可以批准命令以完全访问权限运行,或允许代理使用Web搜索并连接到MCP服务器。这可以扩展代理的功能,同时增加风险-在此处了解有关如何安全作和管理Codex的更多信息。
我们始终鼓励开发人员在进行更改或部署到生产环境之前查看代理的工作。Codex为每项任务提供引文、终端日志和测试结果,以帮助解决这个问题。虽然Codex代码审查有助于降低危险问题部署到生产环境的风险,无论是由人工还是代理创建,但我们始终建议使用Codex作为额外的审查者,而不是人工审查的替代品。
价格和供货情况
Codex包含在ChatGPT Plus、Pro、Business、Edu和Enterprise计划中。使用量可根据您的计划进行扩展:此外,Edu和Business席位每周可以涵盖一些重点编码课程,而Pro可以支持跨多个项目的完整工作周。
商业计划可以购买积分,使开发人员能够超出其包含的限制,而企业计划则提供共享积分池,因此您只需为开发人员使用的内容付费。在此处了解有关ChatGPT使用限制的更多信息。
对于通过API密钥使用Codex CLI的开发人员,我们计划很快在API中提供GPT-5-Codex。
Codex正在成为我们一直设想的编码合作伙伴——一个更快、更可靠并深度集成到您已经使用的工具中的合作伙伴。我们很高兴看到你用它构建的东西,并将不断改进Codex,使它成为你最雄心勃勃的项目的更好队友。