AI生图频翻车?3个秘诀为你打造高可用的文字绘画魔法


目录
- 前言
- 提示词整体基本原则
- 结构维度运用技巧
- 控制力维度运用技巧
- 写在最后
是不是从漫画中看到了你自己?
绞尽脑汁、费尽心思心中构建了一幅画,结果无法用语言表达自己的想法。
用AI为自己生成提示词,结果生成的结果与预期大相径庭,动手修改都不知道如何下笔。
借鉴了别人的灵感,想添加自己的想法,结果效果越改越废......
别人的结果长这样⬇

你的结果就这样⬇

当真是自己审美和表达不行吗?
NO NO NO!别这样怀疑自己,你的审美和表达都在线,只是差了一点技巧而已。你只是不了解提示词的结构,不清楚各类图的提示词特点而已。
今天我就带大家盘一盘提示词中藏着的“宝藏”!因提示词超多、不方便直接展示,大家阅读下文时请打开这个提示词文档,以便理解正文所提技巧。(文档中附送常见平面设计风格)
(ps:以下所有图片均由AI生成)
一、提示词整体基本原则
在讲运用原则前需要熟知提示词的结构。
提示词由主体、动作、场景、画面美学四大核心要素构成。前三个要素就不多说了,大家都懂。这里重点讲的就是画面美学。
我们常见的画面美学要素一般有,风格、色彩、光影、构图、视角、材质、氛围、景别、画质等。
( 美学要素类别的细分可参考这个文档:通义万相AI生视频—使用指南 )
一听你就能感觉到,画面美学本身就是一门艺术体系,上面任一一项要素单独拎出来,你都能学个几天几夜。不过先别急,我们先看它对于生图的作用。
画面美学的这些要素,直接决定生成的图是否精致、是否有视觉冲击力、是否有感染力、是否美感十足。
要素讲完了,接下来就是写好提示词的整体基本原则:
1.“主体+动作+场景”构成【图片内容】,一般用连贯句表达;画面美学用短词语表达,若美学要素多可将要素名写出。
比如,“【图片内容】一个约十岁的黑色短发男孩,身穿靛蓝色运动服与白色短裤,正轻盈奔跑在晨光斑驳的林荫道上。他微微前倾的身躯带着风的轨迹,扬起的衣角泛起柔光涟漪,左手腕戴着黑色手表,运动鞋带在跃动中散开。【风格】人像摄影风格。【光影】柔焦逆光与林间琥珀色光斑交织。”
2.提示词要素还可加入“用途”作为补充。不过用途(小红书封面、海报等)主要和尺寸挂钩。若AI能直接选尺寸,这个要素可省略。
3.文字精准,使用专业表达(专业/专有名词)。这样AI一组生成的几张图可用性会更高。
4.美学要素最好写全,要素越全越接近预期。因为AI会对未指定的自由发挥。
虽然目前常用的AI生图产品理解能力强,即便提示词简略也能产出满意的图,或者解放双手,直接用AI生成提示词。
但是按照上面的原则来写提示词依然很重要,因为这能让我们建立提示词的逻辑框架,能审查出AI生成的提示词漏洞,在别人提示词基础上灵活加入个人创意。
二、结构维度运用技巧
主体驱动型图片
这个类型重在构建“以谁/什么为中心”,强调主体的形象与细节。它适合生成人物肖像、动物拟人、建筑外观等以静态为主的图片。
它的提示词技巧如下:
1.重点细化描述主体形象。比如年龄、脸型、五官、着装、发型、表情、外观、内部构造等。
2.可以不需要场景。
3.可能需要生成三视图(正面图、侧面图、背面图)。不过文生图一次性生成三视图的难度较高,还是需要借助图生图。
4.全貌图和尺寸有关。其中人像需要选竖版的尺寸,比如9:16。

(上由即梦4.0生成,下由造点AI的midjourney V7生成)

动作驱动型图片
这个类型以动作为核心,强调姿态、情绪、节奏感,可以理解是动作视频的某一帧。
它通常结合主体、环境来展现图片信息。
“动作+主体”强化主体形象塑造(生物)或者预示事物的变化方向(生物+物品)。“动作+环境”主要突出环境的变化,经常用于反映或暗示抽象意识。比如未出镜或占很少镜头的人物的精神状态、构建戏剧张力、预示命运、象征主题思想或某概念等,另外它还能塑造节奏与韵律。
比如下面两幅图:

(左为“动作+主体”,右为“动作+环境”)
第一幅图通过动作展现了与歹徒搏斗女子的飒爽、英勇,第二幅图通过“崩塌”渲染了危险、高度紧张之感,预示灾难下有人伤亡的结果。
我们正好可以利用动作驱动型图片释放的信息特点,来设计生图提示词:
1.重点细化描述动作。动词、副词使用较多,有一种正在进行之感。
2.“动作+主体”可以不需要场景。
3.若环境反映的动作多,则环境构成部分状态需要细化描述。
4.景别使用根据目的而定。若目的在于塑造主体动态特点,则可用特写、近景;若目的在于营造氛围、反映抽象意识或情绪,则可用远景、全景。
环境驱动型图片
这个类型以空间与氛围主导画面构成,主体反而次要。适用于现实场地、风景景点和虚拟空间生图。
比如:

(上和下都由即梦4.0生成)

这类型图片的提示词技巧如下:
1.重点把控画面美学,各要素齐全。风格、色彩、光影、构图、视角、材质、氛围、景别、画质等基本都要写入。
2.画面美学描述详细、用词专业。比如用“祖母绿主调,流光金点缀”而不用“绿色为主,少部分金色”;用“卷轴自发光,内部柔和散射光”而不用“卷轴发光”。
3.微缩景观类、虚拟空间类的图片内容注重类比或比喻。前者的建筑设计更为复杂,一般还会融入国别、地域性文化特点,用类比、比喻能增强AI的理解;后者因为全靠创意,AI无法根据现实逻辑推理,所以需要打比方。
美学驱动型图片
这个类型美学风格体系起主导作用,主体刻画最弱,可以模糊处理。可套用常见的设计风格和画家风格,或者通过各要素搭配自定义组合。更适用于创意设计、游戏设定、视觉摄影和时尚领域设计。
比如套用平面设计风格:

(套用“极简主义、斯堪的纳维亚风格”生成)

(套用“新巴洛克数字风格”生成)
套用画家风格:

(套用Penko Gelev画作风格生成)

(套用Becca Doodlefly画作风格生成)
再比如各要素自定义组合:


这类型图片的提示词技巧如下:
1.套用画家风格需要补写特点。生图平台可能不知道这个画家或者不知道这个画家的画风,所以还是需要自己补全。可以使用智能搜索AI归纳。比如提示词用“Penko Gelev风格·漫画海报·铅笔钢笔肌理·数码渲染”而不用“Penko Gelev风格”。
2.套用平面设计风格需要提示词写入定义,需要结合具象实物。你和AI可能对同一平面设计风格理解不一,所以为了符合预期需要写入定义。抽象定义需要具象画面体现,就需要加入实物,否则,大厂生图工具也hold不住。
3.各要素自定义组合很考验审美和专业性。因为指令密度影响风格融合度,所以想快速生成美感十足的图片,熟知工艺、材质、光影、色调等专业话术,是基本功,也是将风格套系融合的必要条件。
4.不管是套用美学还是自定义组合,提示词的美学要素都尽量齐全。
三、控制力维度运用技巧
意境、氛围控制
这个类型侧重画面语言的细节控制,如风格、光影、构图等对氛围的塑造。它属于上述美学驱动型的一个表现方面,更强调对氛围与意境的控制。它多用于文字符号设计、景观场景塑造。
比如:


这类型图片的提示词技巧如下:
1.在“美学驱动型图片”提示词技巧的基础上掌握下面要点。
2.景观场景塑造把握氛围、色彩、光影的描述。因为这是最重要的3个美学要素,其中氛围多与情绪直接相连,色彩和光影为氛围和情绪服务。
3.文字符号设计重点描述氛围、色彩、装饰、光影。因为这是其最重要的4个美学要素,其中前三个元素都能与各类文化融合。所以要想体现独特韵味,结合民族、地域、文学等文化必不可少。
抽象控制
这个类型最大的特色在于强调形式语言,重主观性与内在表达,至于有无具象,需要看AI生图工具的发挥。
比如:

(镜中世界)

(与自己和解)
这类型图片的提示词技巧如下:
1.图片内容描述需要更精简,整体结构一般不写全。主体、景别、视角、构图等要素可以省略,氛围、色彩、光影可根据需要保留。
2.可以使用理念概念等抽象词语,让AI自由发挥。抽象度影响可解释性与想象空间。提示词越抽象,AI 的解释空间越大,结果更具偶然美。比如“【图片内容】与自己和解”。
这类型图片很百搭,室内装饰、品牌设计、影视概念、书籍插画、壁纸等场景都适用。
逻辑控制
这个类型的特点在于提示词结构各部分比重趋近,要求主体、动作、环境、画面美学结构全面,提示词逻辑清晰。更适用商业领域图片。
比如:

(电商产品图)

(美食店宣传海报)
这类型图片的提示词技巧如下:
1.顺应它的特点,写全结构,逻辑排列。这样输出才会越稳定。建议日常收集保存多种模板。
2.注重细节描述,用词精准。
四、写在最后
“路漫漫其修远兮”,是我对提示词的真心感悟。
它不是直接让AI生成就完事了,也不是“拿来主义”应用就完成了。因为你一旦想加入自己的想法,就会遇到各种各样的问题,而这些问题往往都是由“不知其所以然”产生的。
别看它的结构简单,但真想生成一幅美轮美奂的画作,逃不开对美学各要素的理解、研究,建立自己需要的一整套美学体系。
我们经常在网上赞叹的国潮美学图、画家风格仿作和超现实主义佳作,背后都是对艺术深厚的敬仰之情与坚定的追随之心。
好了,今天的提示词分享就到这里了,若你对提示词设计有其他心得,欢迎在评论区分享和讨论~
若还想深入了解、讨论画面美学,可入群讨论哦~

