阿里Qwen-Image-Edit-2511发布,多人一致性和工业设计生成能力大幅提升

2025-12-25 10:46
91
阿里巴巴旗下的Qwen团队近期在AI视觉领域再次发力,正式发布了全新升级的图像编辑模型Qwen-Image-Edit-2511。针对以往AI修图时容易导致“人脸变形”或“身份丢失”的痛点,该模型实现了质的飞跃,能够确保在进行创意修改的同时,精准保留原图人物的面部特征。

根据Qwen官方在Hugging Face上公布的信息,这款模型是此前版本的重大迭代。它不仅能处理单人肖像的精细编辑,在应对多人合照等复杂场景时也表现出色,可以同时维护多位角色的身份一致性。无论是为照片中的人物更换服饰、调整背景,还是改变光影效果,模型都能在不改变人物“长相”的前提下完成自然过渡。
以下是本次更新的三大核心亮点深度解读:

01.告别“一眼假”:人物与多人一致性的史诗级提升


在AI图像编辑中,最令人头疼的问题莫过于“修完图,人变了”。保持人物ID(身份特征)和风格的一致性,一直是业界难题。Qwen-Image-Edit-2511在这方面取得了突破性进展。
单人编辑:身份完美保留
现在的模型在对人像进行富有想象力的编辑时(比如换装、改变环境),能够高度保留主体的身份特征和原有的视觉风格。
这意味着,你还是你,只是换了个场景而已,再也不会出现“修图修成陌生人”的尴尬局面。
多人合影:无缝融合
更令人惊喜的是对多人场景的掌控力。虽然之前的2509版本已经提升了单人一致性,但2511版本进一步增强了复杂场景的表现。
它现在能够将两张独立的人物图像,高保真地融合为一张光影协调、风格统一的群像照片。这对于需要合成家庭照、团队照的场景来说,简直是神器。

02.创意无限:内置热门LoRA与全新视角生成


为了让创作更自由,Qwen-Image-Edit-2511开始主动拥抱社区生态,并提供了更强的基础生成能力。
精选LoRA,开箱即用
自Qwen-Image-Edit发布以来,社区涌现了大量高质量的LoRA模型。官方看到了社区的热情,决定直接将部分精选的热门LoRA集成到基础模型中。
这意味着什么?你无需额外下载、无需复杂的微调,即可启用这些强大的效果。
解锁全新视角
模型现在可以直接基于基础模型生成新的视角。这对于电商展示、建筑预览等需要多角度呈现的场景来说,极大地提升了工作效率。

03.硬核生产力:工业设计与几何推理的专业级应用


如果说以上功能是摄影师和设计师的福音,那么接下来的更新则显示了Qwen-Image-Edit进军专业工业领域的野心。
工业设计与材质替换
我们特别关注到,新版本针对实际工程应用场景进行了优化:
•批量工业产品设计:能够辅助设计师快速生成和迭代产品方案。
增强的几何推理能力
这是一个非常“硬核”的更新。Qwen-Image-Edit-2511引入了更强的几何推理能力。
它现在可以直接为设计或标注目的生成辅助构造线。这表明模型不仅是在“画图”,更是在“理解”物体的几何结构,这对于需要精确表达的工程设计领域至关重要。
该模型在Apache 2.0许可证下发货。Hugging Face上提供演示,用户可以通过Qwen Chat免费测试该模型。
0
好文章,需要你的鼓励