OpenAI在其API中增加了更强大的模型，加快了开发者的步伐

2025-10-09 20:18

OpenAI在周一的开发日发布了新的API更新，介绍了其最新的语言模型GPT-5 Pro，其新的视频生成模型Sora 2，以及更小、更便宜的语音模型。

这些更新是一系列公告致力于吸引开发者加入OpenAI的生态系统，包括推出代理构建工具和能够在ChatGPT中构建应用程序.

OpenAI首席执行官萨姆·奥特曼表示，GPT-5 Pro的加入可能会吸引开发人员在金融、法律和医疗保健领域构建应用程序，这些行业需要“高准确性和推理深度”。

奥特曼还指出，语音功能在未来将是必不可少的，因为它很快成为人们与人工智能互动的主要方式之一。为此，OpenAI正在推出“gpt-realtime mini”，这是一种更小、更便宜的API语音模型，支持音频和语音的低延迟流媒体交互。新款比OpenAI的便宜70%以前的高级语音模型但承诺“相同的音质和表现力”

最后，OpenAI开发者生态系统中的创作者现在可以在API中预览Sora 2。OpenAI上周发布了其最新的音频和视频生成器Sora 2，以及Sora应用程序，抖音的竞争对手充满了人工智能生成的短视频。Sora的应用程序允许用户根据提示生成自己、朋友或任何东西的视频，并通过抖音风格的算法馈送分享。

“开发者现在可以在你自己的应用程序中使用支持Sora 2惊人视频输出的相同模型，”奥特曼说。

《Sora 2》建立在上一代的基础上，具有更真实、物理一致的场景，同步的声音和更强的创造性控制——从详细的相机方向到风格化的视觉效果。

在Disrupt 2025上加入10k+技术和风险投资领导者的成长和联系

网飞、Box、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil、维诺德·科斯拉——仅是250多位重量级人物中的一部分，他们领导了200多场会议，旨在提供推动初创企业发展和增强您的优势的见解。不要错过TechCrunch的20周年纪念日，以及向技术领域的顶尖人物学习的机会。开门前抢票，最多可节省444美元。

“例如，你可以用iPhone查看，并提示Sora 2将其扩展为一个大范围的电影广角镜头，”奥特曼说。“但我们一直在努力的最令人兴奋的事情之一是，这种新模式将声音与视觉结合得多么好，不仅仅是语音，还有丰富的声景、环境音频、基于你所看到的内容的同步效果。”

Sora 2被定位为概念开发的工具，无论是基于产品总体氛围的广告的视觉起点，还是美泰设计师将草图转化为玩具概念——奥特曼在开发日提供的一个例子说明了这一点OpenAI与芭比制造商的交易将生成式人工智能带入玩具制造行业。

好文章，需要你的鼓励