当会玩梗的即梦4.0撞上色彩大师banana,会发生什么?

前言
创意设计
图像编辑
绘本漫画
写在最后
先说这俩对比的小结:能玩梗、懂国学是即梦4.0(以下和Banana对比时简称为“即梦”)最为特殊的存在。Banana与之相反,是美学大师、细节控。当然两者都有不足之处。
现在我们先抛开它俩结果上的不足,去感受实际案例中的精彩过招吧!
(ps:以下除大闹天宫影图和元素乱炖的原图外,其余所有图片均由AI生成)
创意设计
悟空表情包
直接上图:

提示词:根据孙悟空的形象,生成可爱的8张一组的卡通搞笑表情包,越搞笑越好。


你可以看到,我都没有指定图中展示文字或梗,即梦就自动在图中补上了,还加上了具体的场景。其中热梗结合了社会现象和当下政策,让人感同身受。
悟空的形象是20世纪下半叶几版动画电影《大闹天宫》(同一种形象)和1999版央视出品的《西游记》动画的结合体。

再看看Banana,就是去掉一个“包”字,全都是表情。角色形象按照西方审美刻画的,是猴王但不是悟空。

当我让即梦融入《西游记》故事中人情世故的梗之后,我对它的国学底蕴又敬佩一分!

(上为即梦生成,下为Banana生成)
“师傅别念了!”是原著台词,猪八戒想躺平还原了原著性格,猪八戒吃西瓜、悟空化圈保护唐僧是致敬经典。甚至连“师父”“师傅”的含义都能分清并且知道分别指代哪个角色(前者指代菩提老祖,后者指代唐僧)。
而对于Banana,可能换成漫威角色生成,就会好很多,大家可以一试。
艺术海报

(上为即梦生成,下为Banana生成)

提示词:一张艺术海报,背景是一位天鹅舞表演者,用大字体的细宋体排列铺满画面,主标题“艺术之舞”,然后随机生成和“舞”字相关的四字短语,字号不同,占据大部分海报屏幕。


这里考验的是两个模型的文字控制和布局审美能力。
即梦不仅能完全理解指令语义,还对成语、字体有准确理解和精准把控,后三张文字排列像古代文人的书稿。
Banana海报迎面而来的就是工业与科技的感觉,追求干净、整齐,重视线条与形状。
知识卡片
随着图像难度越大、精度越高,Banana的提示词就越来越长。。。
第一组两个模型用简单指令生成的图如下:

(左为即梦生成,右为Banana生成)
提示词:制作一个马尔代夫旅游必备物品清单,包含插图、防晒用品列表、水上活动装备、轻便衣物推荐、电子设备保护、药品准备和当地注意事项。


Banana是真没法看,不是生图了,是直接提供带有插图的问答结果了。而即梦是一如既往的优秀,自己组合文字、排版,兼顾实用与美观。
当我专门针对Banana优化了指令(变得更详细)后,Banana也给出了满意的答卷:

结果与即梦不相上下。
图像编辑
花式改图
近景切特写,直接上传参考图输入指令即可,结果如下:

(上为即梦生成,下为Banana生成)
提示词:将上述图改成电影画质,镜头只展现牛顿的表情特写(铺满整个镜头),绝对不要出现实验室环境。给出放大了的牛顿开心到挤眉弄眼、吐舌头的面部表情,黄光和白光照射在脸上,浅景深。


论语义理解与生动性,即梦领先Banana。论画质,两者不相上下。
改图功能比较有意思的是,两者都能识别线条标记、按要求进行人物处理。
比如提取图中红框模糊的人物放大变清晰、给主镜头:

(左为原图,中为即梦生成,右为Banana生成)
提示词:给这个红框里面的人一个正面近照。


不过Banana比即梦胜在Banana有时候能还原,而即梦生成了很多次,鞋子一直都无法还原,并且这主角的上衣颜色深浅需要生成多次才能和原图相差无几。
再比如笔刷处添加元素或改动作:

(左为加了标识的原图,中为即梦生成,右为Banana生成)
提示词:用一个香奈儿包替换参考图中的红色笔刷处,同时改变蓝色笔刷处的动作。


姿势不同,但都没啥问题。
元素乱炖
这是几个图中部分元素组合在一起的最终结果:

(上为原图,下为即梦生成)

(上为原图,下为banana生成)
我试了不下6组12次,最后只保留1个人物+3纯物品,才得到这样一个能看的结果。虽然即梦的眼镜不对,banana的头发偏向反了。
还有更离谱的,比如这组:

(上为即梦生成,下为banana生成)

提示词:让图一的角色,换上图二的衣服裤子,换上图三的眼镜,做着图四的动作。其余都不要变,尤其是图一中人物的表情、发型和面部特征不要变。



所以大家搜集参考图时一定要注意!
同场景异角度
比如这个治愈系的室内系列图,同样还是首张作为参考图生成其他图:

(上为即梦生成,下为banana生成)

提示词:基于照片设计8张同一场景完全不同拍摄角度的照片。


我看了很久,发现相互之间确实没有不同的地方。也许看花眼了,大家感兴趣的可以来找不同。
不过即梦的角度是真多啊,banana视角变化不大。
绘本漫画
用的还是周一banana的虹猫蓝兔案例。
不像当时用banana一格一格生成,这里我是先让即梦生成首格,再批量生成。生成后三格时指定了至少要出现一次水坑。

可能就是即梦对色彩把控不精,头两格芦苇颜色和后两格颜色不同,虹猫腰带颜色不一致,后三格衣服颜色更深。虹猫腰带款式也有不同。
但除此之外,就真的制作精良、细节满满!
出现多句台词,逻辑连贯,与角色对应。角色表情和台词对应。踩水坑溅起水花比较真实。
最绝的是,竟然还有倒影!而且蓝兔的倒影确实符合她说“倒影不对”的情境!
所以用即梦生成绘本或漫画时,大家还是一格一个生成吧,或许以上除了色彩的问题之外,就都能解决了!
写在最后
这里根据评测案例再总结下即梦4.0和banana的优缺点。
即梦4.0的显著优点是,能适应中国文化社会环境,中文语义和逻辑理解强,中文设计能力突出,国学底蕴足,会玩国内热梗,智能创意多,表情生动,提示词更为简单。
对除“玩热梗”之外的其他所有点(我没测试过banana这点,不好评价),banana刚好就和即梦相反,优点恰好是色彩和细节把控优秀。
我还发现了即梦4.0的一个bug,就是它比较逆反。比如当你想让它不要出现X物时,你提示词不能输入“不要出现X物”,因为它会和你作对,你越不想要的,它就越要生成。所以你需要写“请消除X物”或“请用Y代替X物”。
好了,今天的分享就到这里了。若你在使用即梦4.0过程中有其他体验,欢迎在评论区分享和讨论~
我们AI产品活动开始啦!有奖品和现金福利,活动详情如下,有疑问可加入社群询问~
投稿活动:https://www.chooseai.net/activity/camp
测评活动:https://www.chooseai.net/activity/recruit

