通义千问或将发布Qwen-Image-2.0:生成与编辑合二为一

2026-02-10 15:52
118
阿里通义千问团队或将发布新一代图像模型Qwen-Image-2.0,首次将此前分离的Qwen-Image(图像生成)和Qwen-Image-Edit(图像编辑)两条产品线合并为统一的基础模型,标志着Qwen图像系列的重大架构升级。


生图能力跻身前列

根据Alibaba AI Arena平台2月10日更新的Text-to-Image Elo排行榜,Qwen-Image-2.0以1029分的Elo评分位列第三,仅次于Google的Gemini-3-Pro-Image-Preview(1052分)和OpenAI的GPT Image 1.5(1044分)。
相比同为阿里出品的前代模型,Qwen-Image-2.0的提升幅度显著:较2025年12月发布的Qwen-Image-251跃升4个名次;较2025年8月发布的初代Qwen-Image跃升10个名次。
在编辑能力评测中,Qwen-Image-2.0同样表现强劲,排名第二。

统一架构:告别"双轨制"

此次升级的最大亮点在于架构层面的统一。
自2025年8月Qwen-Image首次发布以来,通义千问的图像能力一直采用"双轨制":生成走Qwen-Image路线(Qwen-Image → Qwen-Image-2512),编辑走Qwen-Image-Edit路线(Qwen-Image-Edit → Edit-2509 → Edit-2511)。两条产品线虽然共享底层的20B MMDiT架构,但在训练和部署上相互独立。
Qwen-Image-2.0将两者合并为单一基础模型,用户无需在生成和编辑之间切换不同的模型端点,一个统一的模型即可同时处理文生图和图像编辑任务。这不仅简化了开发者的调用流程,也意味着模型在训练阶段能够更好地共享生成与编辑之间的知识表征。

暂未开源,API和网页端可用

与此前Qwen-Image系列坚持的Apache 2.0全面开源策略不同,Qwen-Image-2.0目前尚未开源模型权重,仅通过阿里云百炼API和Qwen Chat网页端提供使用。官方暂未公布开源时间表。
这一策略调整值得关注。此前Qwen-Image-2512正是凭借Apache 2.0许可证下的完全开源,在与Google Gemini 3 Pro Image的竞争中打出了差异化优势——企业可以自由部署、微调和商用。Qwen-Image-2.0是否会延续开源路线,将成为社区关注的焦点。。
0
好文章,需要你的鼓励