哪个AI工具生图最没AI味儿?Qwen-Image-2512生图,宛如实拍

2026-01-05 21:52
91
最近阿里发布了最新的开源生图模型:Qwen-Image-2512。
实测发现,它解决了咱们吐槽已久的AI塑料味。官方号称人物皮肤质感、发丝细节都能做到物理级还原,直接对标专业摄影师的实拍图。
而且,它不光能画画,什么漫画风PPT、复杂的数据图表,一条指令就能生成。
它在AI Arena的上万轮盲测里,直接杀到了开源榜第一。

简单说,在真实感和听话程度上,它不仅吊打了其他开源同行,甚至把不少收费的闭源商用模型都给干趴下了。
榜单归榜单,我还是更相信自己跑出来的效果。
所以我进行了几组对比测试,覆盖多个领域。
目前这个模型只能在千问国际版官网体验,国内千问官网用的还是旧模型,我就正好也用同样的提示词,在国内官网生成一样的图,看看新模型到底优秀在哪里?
使用地址:https://chat.qwen.ai/
在官网点击图像生成:
1.提示词:
全身景,一位正在练舞室休息的年轻芭蕾舞者。她没有站着,而是精疲力竭地瘫坐在木地板上,上半身极度前倾,额头几乎贴在膝盖上,双手抱住脚踝,这是一个折叠度很高的姿势。她穿着紧身连体练功服和粉色丝袜,背部的肩胛骨因为姿势而突兀地隆起。背景是整墙的镜子,镜子里准确地反射出她蜷缩的背影。地板上散落着几个空的矿泉水瓶和一条毛巾。
新模型:

旧模型:

升级后的效果,地板上的陈旧划痕和镜面上的灰尘,这才是真实的生活环境。人物皮肤不再是死白,而是有血色的,甚至能感觉到肌肉的松弛感。
必须要夸的是,人物长相不再是千篇一律的美女,而是一个活生生的普通人,就仿佛是身边的某个人,这样才有真实感。
旧模型只知道美白,美颜打高光,格局小了。
2.提示词:
这是一个侧逆光构图。一位二十二三岁的中国美女坐在老式绿皮火车的窗边,妆容精致,窗外是飞驰而过的模糊田野。她穿着一件粗棒针织的米白色毛衣,质感蓬松,领口处有细微的起球细节。她头靠在车窗玻璃上,闭着眼小憩,夕阳从侧后方打过来,将她凌乱的长发照得金黄透亮。重点在于发丝的独立感,不应该是一坨模糊的色块,而是根根分明的被光穿透的状态。玻璃上倒映着她半个侧脸的虚影。
新模型:

旧模型:

点评:旧版的人物长相还是偏油腻,没有识别度,新版的生图每一根头发都被阳光穿透,呈现出不同的金黄色泽。相貌同样没有那么强的油画感,非常真实。如果不说,你会以为这是哪部文艺片的电影剧照。
3.提示词:
一个年轻中国美女在周末的家中享受闲暇时光。她正盘坐在客厅的地毯上整理矮桌上的杂志,身体微微前倾,呈现出一种毫无防备的放松状态。人物细节:头发随意地用鲨鱼夹盘在脑后,几缕发丝垂在颈侧。脸上是素颜状态,皮肤白皙。她穿着一套舒适的居家服:上身是一件紧身的灰色针织短袖吊带,深v领口,下身是白色的家居裤,舒适轻薄。环境与构图:室内自然光拍摄,采用略微俯拍的视角(类似男友视角或室友视角)。背景是布置温馨、采光良好的客厅,有布艺沙发、绿植和透过纱帘的阳光。摄影风格:纪实抓拍,光线柔和明亮,色调清新自然,氛围宁静、舒适,充满了生活气息。
新模型:

旧模型生成:

点评:旧模型生成的往往是妆容半永久的网红脸,还要硬凹造型,背景假得像样板间。
但你看新模型生成的这张,重点看鲨鱼夹夹不住的那几缕碎发,还有灰色针织衫上微微泛起的绒毛感,以及肌肤的真实质感。这种不修边幅的素颜状态,配合自然的室内漫反射光,完全没有了以前那种讨好镜头的刻意。
4.提示词:
正午时分,烈日当头,地平线处的景物因高温而产生液化般的扭曲抖动。眼前是一座被风沙严重侵蚀的砂岩断崖,岩石表面呈现出如同干裂老树皮般的层状剥离纹理,缝隙中卡着细碎的红色沙砾。几株枯死多年的红柳根系像干瘪的骨爪一样裸露在外,枝条灰白、尖锐且脆弱。阳光直射,光影极其生硬强烈,岩石的阴影深重,每一粒沙石的粗糙质感都清晰可辨。整体氛围焦灼、干旱且严酷。
新模型:

旧模型:

点评:旧模型给出的就是一张标准的3D游戏贴图,石头光滑得不像话。
但新模型呢,你看看岩石表面那种干裂、剥离的层理,还有缝隙里卡着的细碎沙砾,隔着屏幕我都能感觉到那种粗糙的磨砂感,这就是国家地理摄影师的作品吧?
5.提示词:
一只成年雪豹头部的超写实肖像特写,置于寒冷、清澈的高山晨光中。皮毛展现出极端的密度和厚度,不仅是外层针毛根根分明,更能感受到其下方为了御寒而形成的致密、厚重的底层绒毛层,仿佛能用手按出凹陷。毛色从烟灰色自然过渡到奶油白,黑色玫瑰纹斑点处的毛发色素深沉,边缘杂毛的黑白交替极其细腻。几根极长的白色胡须在冷空气中清晰锐利。冰蓝色的眼睛深邃专注,鼻镜湿润且带有寒意,背景是虚化的冰川与岩石,整体突出一种高冷、野性的真实触感。
新模型:

旧模型生成:

点评:猫科动物的毛发最难画。旧模型的毛发边缘总是虚的,或者糊成一片。但你看新模型的这张雪豹,那不仅仅是毛,那是绒!
你能明显感觉到外层针毛下面还有一层厚厚的保暖绒毛,厚度感极强。
6.提示词:
这是一幅医疗健康科普信息图表,整体采用清新的薄荷绿与白色搭配,光线明亮,营造出洁净、专业的医疗氛围。画面分为左右两大板块,布局清晰。左侧板块标题为“【需要警惕】的早期症状”,以浅红色圆角矩形框突出显示,内部排列三个白色背景卡片,第一个条目展示一个人捂着胸口的图标,文字为“持续性胸痛/压迫感”,后面配有红色感叹号;第二个条目为一个时钟和睡觉符号,文字为“极度疲劳/睡眠障碍”,后面配有红色感叹号;第三个条目为模糊的眼睛图标,文字为“视力模糊/眩晕”,后面配有红色感叹号。右侧板块标题为“【健康指标】参考范围”,使用深绿色圆角矩形框呈现,内部四个条目均置于浅灰色背景方框中。图标分别为:一个血压计,文字为“收缩压【90-120mmHg】”,后面配有绿色对钩;一个心跳波形图,文字为“心率【60-100次/分】”,后面配有绿色对钩;一滴血和糖块,文字为“血糖【3.9-6.1mmol/L】”,后面配有绿色对钩;一个体重秤,文字为“BMI指数【18.5-23.9】”,后面配有绿色对钩。底部中央有一行灰色小字注释:“注:以上数据仅供参考,具体诊断请咨询专业医生,个体差异可能导致指标波动”,字体清晰可读。
新模型:

旧模型:

点评:旧模型画图表,字是有好多乱码的。
但你看新模型这张图,文字只有最后一行小字中错了一处,其他完全正确。每个细节都是符合指令要求,这个遵循能力是远超我预期的。
7.提示词:
这是一幅由六个分格组成的2×3网格布局的摄影技术分析海报,背景为深灰色,顶部中央有白色大字标题“焦段与透视:同一人像的视觉变化”。画面始终展示同一位年轻女性,她留着栗色微卷长发,围着一条红色的羊绒围巾,身穿米色风衣,站在一条两侧种满金黄梧桐树的街道中央。光线为下午温暖的逆光,在她的发丝边缘勾勒出金色的轮廓光。第一行从左到右依次为:左侧分格“16mm广角张力”:广角镜头拍摄,画面边缘略有畸变,人物显得修长,背景的街道透视感极强,显得非常深远,天空和两侧建筑占据大面积,视觉冲击力强。底部有半透明黑色横条,白色文字标注“16mm广角张力”。中间分格“35mm人文叙事”:经典的街拍视角,交代了人物与环境的关系,构图均衡,既有风景也有人像,背景元素清晰可辨。底部白色文字标注“35mm人文叙事”。右侧分格“50mm标准人眼”:最接近人眼看到的真实比例,没有变形,人物与背景的关系自然平和,画面平实舒适。底部白色文字标注“50mm标准人眼”。第二行从左到右依次为:左侧分格“85mm人像皇者”:半身人像构图,人物面部立体,背景的梧桐树叶开始化为柔和的圆形光斑(波缺乏),主体非常突出。底部白色文字标注“85mm人像皇者”。中间分格“135mm空间压缩”:特写镜头,背景仿佛被拉近了,远处的树木几乎贴在人物身后,虚化效果显著,如奶油般化开,压缩感强烈。底部白色文字标注“135mm空间压缩”。右侧分格“200mm空气切割”:面部大特写,背景完全被压缩成模糊抽象的金色和深色色块,人物仿佛与背景完全分离,画面极其纯净聚焦。底部白色文字标注“200mm空气切割”。
新模型:

旧模型:

点评:旧模型生成的六张图,人物大小几乎没变,根本没有焦段感,尤其是16mm没人了,200mm直接模糊了。
再看新模型:16mm广角时的拉伸张力,85mm的柔和虚化,200mm的空间压缩感,特征完全吻合,这就在模拟真实的物理镜头啊。
测到这里,这个变态案例是真的超乎我的想象,新模型完全实现了我的要求,无可挑剔,真的是太精准可控了。
测完这7组图,说实话上代模型和Qwen-Image-2512对比,可以说完全不在一个水平线上。
但它是无敌的吗?并不是,它跟行业天花板Nano Banana比确实还有差距,我整体的使用体验是,跟字节的模型基本处于同一个梯队,难分伯仲,这倒确实印证了榜单上的分数。
重点是:它们是闭源黑盒,Qwen是直接发布即开源,这含金量就不在一个维度了,开源意味着无限可能。
闭源决定了我们能用什么,而开源决定了我们能创造什么。
0
好文章,需要你的鼓励