当会玩梗的即梦4.0撞上色彩大师banana,会发生什么?

教程评测图像设计图像处理图像生成
Author Avatar
ChooseAI
2025-09-16
阅读4

Image



目录

  1. 前言

  2. 创意设计

  3. 图像编辑

  4. 绘本漫画

  5. 写在最后

最近AI图像生成界真是热闹!
国际上,Nano Banana、EbSynth等模型接连上线;国内即梦4.0和混元图像 2.1同在本周二正式发布
主打一个让你使用和评测都应接不暇。
我都还来不及评测Nano Banana(以下简称为“Banana”)的图像编辑功能,即梦4.0更新的元素组合和组图功能就频繁吸引我的注意。
忍不住了!就干脆Banana剩下还未评测的功能和即梦4.0过招了。也算是赶上了好时候,字节宣布,从昨天下午 3 点开始,即梦所有生图模型7天免费畅玩,不限积分随便用。

先说这俩对比的小结:能玩梗、懂国学是即梦4.0(以下和Banana对比时简称为“即梦”最为特殊的存在。Banana与之相反,是美学大师、细节控。当然两者都有不足之处。

现在我们先抛开它俩结果上的不足,去感受实际案例中的精彩过招吧

(ps:以下除大闹天宫影图和元素乱炖的原图外,其余所有图片均由AI生成)

1

创意设计

悟空表情包

直接上图:

Image

提示词:根据孙悟空的形象,生成可爱的8张一组的卡通搞笑表情包,越搞笑越好。

Image
Image

你可以看到,我都没有指定图中展示文字或梗,即梦就自动在图中补上了,还加上了具体的场景。其中热梗结合了社会现象和当下政策,让人感同身受。

悟空的形象是20世纪下半叶几版动画电影《大闹天宫》(同一种形象)和1999版央视出品的《西游记》动画的结合体。

Image

再看看Banana,就是去掉一个“包”字,全都是表情。角色形象按照西方审美刻画的,是猴王但不是悟空。

Image

当我让即梦融入《西游记》故事中人情世故的梗之后,我对它的国学底蕴又敬佩一分!

Image

(上为即梦生成,下为Banana生成

“师傅别念了!”是原著台词,猪八戒想躺平还原了原著性格,猪八戒吃西瓜、悟空化圈保护唐僧是致敬经典。甚至连“师父”“师傅”的含义都能分清并且知道分别指代哪个角色(前者指代菩提老祖,后者指代唐僧)。

而对于Banana,可能换成漫威角色生成,就会好很多,大家可以一试。

艺术海报


Image

(上为即梦生成,下为Banana生成

Image

提示词:一张艺术海报,背景是一位天鹅舞表演者,用大字体的细宋体排列铺满画面,主标题“艺术之舞”,然后随机生成和“舞”字相关的四字短语,字号不同,占据大部分海报屏幕。

Image
Image

这里考验的是两个模型的文字控制和布局审美能力。

即梦不仅能完全理解指令语义,还对成语、字体有准确理解和精准把控,后三张文字排列像古代文人的书稿。

Banana海报迎面而来的就是工业与科技的感觉,追求干净、整齐,重线条与形状。

知识卡片

随着图像难度越大、精度越高,Banana的提示词就越来越长。。。

第一组两个模型用简单指令生成的图如下:

Image

(左为即梦生成,右为Banana生成

提示词:制作一个马尔代夫旅游必备物品清单,包含插图、防晒用品列表、水上活动装备、轻便衣物推荐、电子设备保护、药品准备和当地注意事项。

Image
Image

Banana是真没法看,不是生图了,是直接提供带有插图的问答结果了。而即梦是一如既往的优秀,自己组合文字、排版,兼顾实用与美观。

当我专门针对Banana优化了指令(变得更详细)后,Banana也给出了满意的答卷:

Image

结果与即梦不相上下

2

图像编辑

花式改图

近景切特写,直接上传参考图输入指令即可,结果如下:

Image

(上为即梦生成,下为Banana生成

提示词:将上述图改成电影画质,镜头只展现牛顿的表情特写(铺满整个镜头),绝对不要出现实验室环境。给出放大了的牛顿开心到挤眉弄眼、吐舌头的面部表情,黄光和白光照射在脸上,浅景深

Image
Image

论语义理解与生动性,即梦领先Banana。论画质,两者不相上下。

改图功能比较有意思的是,两者都能识别线条标记、按要求进行人物处理。

比如提取图中红框模糊的人物放大变清晰、给主镜头:

Image

(左为原图,中为即梦生成,右为Banana生成

提示词:给这个红框里面的人一个正面近照。

Image
Image
 这里Banana和即梦都有个bug,就是鞋子细节没还原。

不过Banana比即梦胜在Banana有时候能还原,而即梦生成了很多次,鞋子一直都无法还原,并且这主角的上衣颜色深浅需要生成多次才能和原图相差无几。

再比如笔刷处添加元素或改动作:

Image

(左为加了标识的原图,中为即梦生成,右为Banana生成

提示词:用一个香奈儿包替换参考图中的红色笔刷处,同时改变蓝色笔刷处的动作

Image
Image

姿势不同,但都没啥问题。

元素乱炖

这是几个图中部分元素组合在一起的最终结果:

Image

(上为原图,下为即梦生成

Image

(上为原图,下为banana生成

我试了不下6组12次,最后只保留1个人物+3纯物品,才得到这样一个能看的结果。虽然即梦的眼镜不对,banana的头发偏向反了。

还有更离谱的,比如这组:

Image

(上为即梦生成,下为banana生成

Image

提示词:让图一的角色,换上图二的衣服裤子,换上图三的眼镜,做着图四的动作。其余都不要变,尤其是图一中人物的表情、发型和面部特征不要变。

Image
Image
不是所有图都能抽出元素成功组成新图。这是我总结出来的它俩关于元素乱炖的特点:
Image

所以大家搜集参考图时一定要注意!

同场景异角度

比如这个治愈系的室内系列图,同样还是首张作为参考图生成其他图:

Image

(上为即梦生成,下为banana生成

Image

提示词:基于照片设计8张同一场景完全不同拍摄角度的照片。

Image
Image

我看了很久,发现相互之间确实没有不同的地方。也许看花眼了,大家感兴趣的可以来找不同Image

不过即梦的角度是真多啊,banana视角变化不大。

3

绘本漫画

用的还是周一banana的虹猫蓝兔案例。

不像当时用banana一格一格生成,这里我是先即梦生成首格,再批量生成。生成后三格时指定了至少要出现一次水坑

Image

可能就是即梦对色彩把控不精,头两格芦苇颜色和后两格颜色不同,虹猫腰带颜色不一致,后三格衣服颜色更深。虹猫腰带款式也有不同。

但除此之外,就真的制作精良、细节满满!

出现多句台词,逻辑连贯,与角色对应。角色表情和台词对应。踩水坑溅起水花比较真实。

最绝的是,竟然还有倒影!而且蓝兔的倒影确实符合她说“倒影不对”的情境!

所以用即梦生成绘本或漫画时,大家还是一格一个生成吧,或许以上除了色彩的问题之外,就都能解决了!

4

写在最后

这里根据评测案例再总结下即梦4.0和banana的优缺点。

即梦4.0的显著优点是,能适应中国文化社会环境,中文语义和逻辑理解强,中文设计能力突出,国学底蕴足,会玩国内热梗,智能创意多,表情生动,提示词更为简单。

对除“玩热梗”之外的其他所有点(我没测试过banana这点,不好评价),banana刚好就和即梦相反,优点恰好是色彩和细节把控优秀。

我还发现了即梦4.0的一个bug,就是它比较逆反。比如当你想让它不要出现X物时,你提示词不能输入“不要出现X物”,因为它会和你作对,你越不想要的,它就越要生成。所以你需要写“请消除X物”或“请用Y代替X物”。

好了,今天的分享就到这里了。若你在使用即梦4.0过程中有其他体验,欢迎在评论区分享和讨论~

我们AI产品活动开始啦!有奖品和现金福利,活动详情如下,有疑问可加入社群询问~

投稿活动:https://www.chooseai.net/activity/camp

测评活动:https://www.chooseai.net/activity/recruit


Image
图片

关注ChooseAI,和我们一起探索AI时代!

0
好文章,需要你的鼓励