4月17日消息,OpenAI 下一代原生图像生成模型 GPT Image 2 据称正在通过 ChatGPT 向部分用户进行小规模 A/B 测试。据网络流传的测试截图显示,该版本在文字渲染、真实感还原和界面生成能力上较前代有显著提升,但目前尚无法通过官方渠道核实其具体发布时间或技术规格。
核心改进:文字、真实感与 UI 还原
根据测试用户反馈,GPT Image 2 的升级集中在三个维度:
文字渲染能力被多次提及。测试图显示,该模型能够生成复杂的中英文排版、UI 文字、对话框和手写笔记,字体、间距和标点符号的表现较前代更为自然。此前 GPT Image 1.x 系列常被诟病"文字糊成一团"的问题据称得到明显改善。
真实感与细节方面,测试图呈现出更自然的光影、皮肤纹理和材质反射,"黄色暖色滤镜"效应有所减弱。部分用户生成的手机截图、直播界面等场景在视觉上接近真实照片。
世界知识与界面还原是另一亮点。测试案例包括还原 YouTube、抖音直播间、Windows 系统界面等真实 UI 布局,以及 IKEA 门店、Minecraft 游戏界面等特定场景。这表明模型在构图逻辑和物理规律的理解上有所进步。
竞品对标:追赶 Google Nano Banana Pro
在 AI 图像生成赛道,Google 的 Nano Banana Pro(2025 年 11 月发布)目前被业界视为重要标杆。该模型支持 2K/4K 分辨率生成,定价为 1080p/2K 每张 0.139 美元、4K 每张 0.24 美元,在 LMArena 排名中被描述为"state-of-the-art"。
OpenAI 当前最新的 GPT Image 1.5 于 2025 年 12 月发布,官方强调其生成速度提升 4 倍、编辑精度改善,API 定价为输入 5 美元/百万 tokens、输出 40 美元/百万 tokens。若 GPT Image 2 确实存在,其目标显然是缩小与 Google 在真实感和文字渲染上的差距,同时在界面生成这一生产力场景上建立差异化优势。
局限与不确定性
需要明确的是,目前关于 GPT Image 2 的所有信息均来自非官方渠道,存在以下局限:
功能描述可能存在夸大。社区反馈往往集中于成功案例,失败案例或边界问题(如复杂多人物场景、特定中文字体)的系统性评估尚缺。
定价与 API 策略待定。若 GPT Image 2 最终发布,其定价是否会延续 1.5 版本的 token 计费模式,或转向与 Google 类似的按张计费,目前均无消息。