OpenAI在其API中增加了更强大的模型,加快了开发者的步伐

Author Avatar
AI百晓生
2025-10-09
阅读3

OpenAI在周一的开发日发布了新的API更新,介绍了其最新的语言模型GPT-5 Pro,其新的视频生成模型Sora 2,以及更小、更便宜的语音模型。

image.png

这些更新是一系列公告致力于吸引开发者加入OpenAI的生态系统,包括推出代理构建工具和能够在ChatGPT中构建应用程序.

OpenAI首席执行官萨姆·奥特曼表示,GPT-5 Pro的加入可能会吸引开发人员在金融、法律和医疗保健领域构建应用程序,这些行业需要“高准确性和推理深度”。

奥特曼还指出,语音功能在未来将是必不可少的,因为它很快成为人们与人工智能互动的主要方式之一。为此,OpenAI正在推出“gpt-realtime mini”,这是一种更小、更便宜的API语音模型,支持音频和语音的低延迟流媒体交互。新款比OpenAI的便宜70%以前的高级语音模型但承诺“相同的音质和表现力”

最后,OpenAI开发者生态系统中的创作者现在可以在API中预览Sora 2。OpenAI上周发布了其最新的音频和视频生成器Sora 2,以及Sora应用程序,抖音的竞争对手充满了人工智能生成的短视频。Sora的应用程序允许用户根据提示生成自己、朋友或任何东西的视频,并通过抖音风格的算法馈送分享。

“开发者现在可以在你自己的应用程序中使用支持Sora 2惊人视频输出的相同模型,”奥特曼说。

《Sora 2》建立在上一代的基础上,具有更真实、物理一致的场景,同步的声音和更强的创造性控制——从详细的相机方向到风格化的视觉效果。

在Disrupt 2025上加入10k+技术和风险投资领导者的成长和联系

网飞、Box、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil、维诺德·科斯拉——仅是250多位重量级人物中的一部分,他们领导了200多场会议,旨在提供推动初创企业发展和增强您的优势的见解。不要错过TechCrunch的20周年纪念日,以及向技术领域的顶尖人物学习的机会。开门前抢票,最多可节省444美元。

“例如,你可以用iPhone查看,并提示Sora 2将其扩展为一个大范围的电影广角镜头,”奥特曼说。“但我们一直在努力的最令人兴奋的事情之一是,这种新模式将声音与视觉结合得多么好,不仅仅是语音,还有丰富的声景、环境音频、基于你所看到的内容的同步效果。”

Sora 2被定位为概念开发的工具,无论是基于产品总体氛围的广告的视觉起点,还是美泰设计师将草图转化为玩具概念——奥特曼在开发日提供的一个例子说明了这一点OpenAI与芭比制造商的交易将生成式人工智能带入玩具制造行业。

0
好文章,需要你的鼓励