当会玩梗的即梦4.0撞上色彩大师banana，会发生什么？

教程评测图像设计图像处理图像生成

2025-09-16

104

前言
创意设计
图像编辑
绘本漫画
写在最后

最近AI图像生成界真是热闹！

国际上，Nano Banana、EbSynth等模型接连上线；国内即梦4.0和混元图像 2.1同在本周二正式发布。

主打一个让你使用和评测都应接不暇。

我都还来不及评测Nano Banana（以下简称为“Banana”）的图像编辑功能，即梦4.0更新的元素组合和组图功能就频繁吸引我的注意。

忍不住了！就干脆让Banana剩下还未评测的功能和即梦4.0过招了。也算是赶上了好时候，字节宣布，从昨天下午 3 点开始，即梦所有生图模型7天免费畅玩，不限积分随便用。

先说这俩对比的小结：能玩梗、懂国学是即梦4.0（以下和Banana对比时简称为“即梦”）最为特殊的存在。Banana与之相反，是美学大师、细节控。当然两者都有不足之处。

现在我们先抛开它俩结果上的不足，去感受实际案例中的精彩过招吧！

（ps：以下除大闹天宫影图和元素乱炖的原图外，其余所有图片均由AI生成）

创意设计

悟空表情包

直接上图：

提示词：根据孙悟空的形象，生成可爱的8张一组的卡通搞笑表情包，越搞笑越好。

你可以看到，我都没有指定图中展示文字或梗，即梦就自动在图中补上了，还加上了具体的场景。其中热梗结合了社会现象和当下政策，让人感同身受。

悟空的形象是20世纪下半叶几版动画电影《大闹天宫》（同一种形象）和1999版央视出品的《西游记》动画的结合体。

再看看Banana，就是去掉一个“包”字，全都是表情。角色形象按照西方审美刻画的，是猴王但不是悟空。

当我让即梦融入《西游记》故事中人情世故的梗之后，我对它的国学底蕴又敬佩一分！

（上为即梦生成，下为Banana生成）

“师傅别念了！”是原著台词，猪八戒想躺平还原了原著性格，猪八戒吃西瓜、悟空化圈保护唐僧是致敬经典。甚至连“师父”“师傅”的含义都能分清并且知道分别指代哪个角色（前者指代菩提老祖，后者指代唐僧）。

而对于Banana，可能换成漫威角色生成，就会好很多，大家可以一试。

艺术海报

（上为即梦生成，下为Banana生成）

提示词：一张艺术海报，背景是一位天鹅舞表演者，用大字体的细宋体排列铺满画面，主标题“艺术之舞”，然后随机生成和“舞”字相关的四字短语，字号不同，占据大部分海报屏幕。

这里考验的是两个模型的文字控制和布局审美能力。

即梦不仅能完全理解指令语义，还对成语、字体有准确理解和精准把控，后三张文字排列像古代文人的书稿。

Banana海报迎面而来的就是工业与科技的感觉，追求干净、整齐，重视线条与形状。

知识卡片

随着图像难度越大、精度越高，Banana的提示词就越来越长。。。

第一组两个模型用简单指令生成的图如下：

（左为即梦生成，右为Banana生成）

提示词：制作一个马尔代夫旅游必备物品清单，包含插图、防晒用品列表、水上活动装备、轻便衣物推荐、电子设备保护、药品准备和当地注意事项。

Banana是真没法看，不是生图了，是直接提供带有插图的问答结果了。而即梦是一如既往的优秀，自己组合文字、排版，兼顾实用与美观。

当我专门针对Banana优化了指令（变得更详细）后，Banana也给出了满意的答卷：

结果与即梦不相上下。

图像编辑

花式改图

近景切特写，直接上传参考图输入指令即可，结果如下：

（上为即梦生成，下为Banana生成）

提示词：将上述图改成电影画质，镜头只展现牛顿的表情特写（铺满整个镜头），绝对不要出现实验室环境。给出放大了的牛顿开心到挤眉弄眼、吐舌头的面部表情，黄光和白光照射在脸上，浅景深。

论语义理解与生动性，即梦领先Banana。论画质，两者不相上下。

改图功能比较有意思的是，两者都能识别线条标记、按要求进行人物处理。

比如提取图中红框模糊的人物放大变清晰、给主镜头：

（左为原图，中为即梦生成，右为Banana生成）

提示词：给这个红框里面的人一个正面近照。

这里Banana和即梦都有个bug，就是鞋子细节没还原。

不过Banana比即梦胜在Banana有时候能还原，而即梦生成了很多次，鞋子一直都无法还原，并且这主角的上衣颜色深浅需要生成多次才能和原图相差无几。

再比如笔刷处添加元素或改动作：

（左为加了标识的原图，中为即梦生成，右为Banana生成）

提示词：用一个香奈儿包替换参考图中的红色笔刷处，同时改变蓝色笔刷处的动作。

姿势不同，但都没啥问题。

元素乱炖

这是几个图中部分元素组合在一起的最终结果：

（上为原图，下为即梦生成）

（上为原图，下为banana生成）

我试了不下6组12次，最后只保留1个人物+3纯物品，才得到这样一个能看的结果。虽然即梦的眼镜不对，banana的头发偏向反了。

还有更离谱的，比如这组：

（上为即梦生成，下为banana生成）

提示词：让图一的角色，换上图二的衣服裤子，换上图三的眼镜，做着图四的动作。其余都不要变，尤其是图一中人物的表情、发型和面部特征不要变。

不是所有图都能抽出元素成功组成新图。这是我总结出来的它俩关于元素乱炖的特点：

所以大家搜集参考图时一定要注意！

同场景异角度

比如这个治愈系的室内系列图，同样还是首张作为参考图生成其他图：

（上为即梦生成，下为banana生成）

提示词：基于照片设计8张同一场景完全不同拍摄角度的照片。

我看了很久，发现相互之间确实没有不同的地方。也许看花眼了，大家感兴趣的可以来找不同。

不过即梦的角度是真多啊，banana视角变化不大。

绘本漫画

用的还是周一banana的虹猫蓝兔案例。

不像当时用banana一格一格生成，这里我是先让即梦生成首格，再批量生成。生成后三格时指定了至少要出现一次水坑。

可能就是即梦对色彩把控不精，头两格芦苇颜色和后两格颜色不同，虹猫腰带颜色不一致，后三格衣服颜色更深。虹猫腰带款式也有不同。

但除此之外，就真的制作精良、细节满满！

出现多句台词，逻辑连贯，与角色对应。角色表情和台词对应。踩水坑溅起水花比较真实。

最绝的是，竟然还有倒影！而且蓝兔的倒影确实符合她说“倒影不对”的情境！

所以用即梦生成绘本或漫画时，大家还是一格一个生成吧，或许以上除了色彩的问题之外，就都能解决了！

写在最后

这里根据评测案例再总结下即梦4.0和banana的优缺点。

即梦4.0的显著优点是，能适应中国文化社会环境，中文语义和逻辑理解强，中文设计能力突出，国学底蕴足，会玩国内热梗，智能创意多，表情生动，提示词更为简单。

对除“玩热梗”之外的其他所有点（我没测试过banana这点，不好评价），banana刚好就和即梦相反，优点恰好是色彩和细节把控优秀。

我还发现了即梦4.0的一个bug，就是它比较逆反。比如当你想让它不要出现X物时，你提示词不能输入“不要出现X物”，因为它会和你作对，你越不想要的，它就越要生成。所以你需要写“请消除X物”或“请用Y代替X物”。

好了，今天的分享就到这里了。若你在使用即梦4.0过程中有其他体验，欢迎在评论区分享和讨论~

我们AI产品活动开始啦！有奖品和现金福利，活动详情如下，有疑问可加入社群询问~

投稿活动：https://www.chooseai.net/activity/camp

测评活动：https://www.chooseai.net/activity/recruit

关注ChooseAI，和我们一起探索AI时代！

好文章，需要你的鼓励