GPT Image 2 灰度测试，中文能力高于Nano Banana Pro

2026-04-17 18:19

291

4月17日消息，OpenAI 下一代原生图像生成模型 GPT Image 2 据称正在通过 ChatGPT 向部分用户进行小规模 A/B 测试。据网络流传的测试截图显示，该版本在文字渲染、真实感还原和界面生成能力上较前代有显著提升，但目前尚无法通过官方渠道核实其具体发布时间或技术规格。

核心改进：文字、真实感与 UI 还原

根据测试用户反馈，GPT Image 2 的升级集中在三个维度：

文字渲染能力被多次提及。测试图显示，该模型能够生成复杂的中英文排版、UI 文字、对话框和手写笔记，字体、间距和标点符号的表现较前代更为自然。此前 GPT Image 1.x 系列常被诟病"文字糊成一团"的问题据称得到明显改善。

真实感与细节方面，测试图呈现出更自然的光影、皮肤纹理和材质反射，"黄色暖色滤镜"效应有所减弱。部分用户生成的手机截图、直播界面等场景在视觉上接近真实照片。

世界知识与界面还原是另一亮点。测试案例包括还原 YouTube、抖音直播间、Windows 系统界面等真实 UI 布局，以及 IKEA 门店、Minecraft 游戏界面等特定场景。这表明模型在构图逻辑和物理规律的理解上有所进步。

竞品对标：追赶 Google Nano Banana Pro

在 AI 图像生成赛道，Google 的 Nano Banana Pro（2025 年 11 月发布）目前被业界视为重要标杆。该模型支持 2K/4K 分辨率生成，定价为 1080p/2K 每张 0.139 美元、4K 每张 0.24 美元，在 LMArena 排名中被描述为"state-of-the-art"。

OpenAI 当前最新的 GPT Image 1.5 于 2025 年 12 月发布，官方强调其生成速度提升 4 倍、编辑精度改善，API 定价为输入 5 美元/百万 tokens、输出 40 美元/百万 tokens。若 GPT Image 2 确实存在，其目标显然是缩小与 Google 在真实感和文字渲染上的差距，同时在界面生成这一生产力场景上建立差异化优势。

局限与不确定性

需要明确的是，目前关于 GPT Image 2 的所有信息均来自非官方渠道，存在以下局限：

功能描述可能存在夸大。社区反馈往往集中于成功案例，失败案例或边界问题（如复杂多人物场景、特定中文字体）的系统性评估尚缺。

定价与 API 策略待定。若 GPT Image 2 最终发布，其定价是否会延续 1.5 版本的 token 计费模式，或转向与 Google 类似的按张计费，目前均无消息。

好文章，需要你的鼓励