小红书开源InstanceAssemble!轻量级AI图像生成新突破

2025-12-28 13:31
122
就在最近,一项名为InstanceAssemble的技术被顶会NeurIPS 2025收录,并直接在GitHub上开源。简单来说,它给AI装上了一个精准的“空间导航仪”,让文生图从“盲盒模式”进化到了“精准施工”阶段。


InstanceAssemble的解题思路:分而治之

InstanceAssemble的核心逻辑非常像是一个严谨的施工队。它抛弃了以往那种“大锅乱炖”的生成方式,引入了一种被称为“实例组装注意力(Instance Assembly Attention)”的新机制。
你可以把它理解为“分区分组管理”:
全局控场:模型先通过基础架构生成画面的大背景和整体光影氛围。
定点组装:对于你指定的每一个物体(比如沙发、台灯、挂画),技术会锁定它们各自的坐标区域(Bounding Box)。
独立计算:最绝的一点在于,每个物体的注意力计算被严格限制在自己的“地盘”里。画沙发时,AI绝不看旁边的台灯一眼。
这种机制完美解决了物体之间的干扰问题。哪怕是面对那种包含二三十个物体的超复杂室内设计图,它也能保证每个物体都在它该在的地方,长成它该有的样子。

惊人的“轻量化”数据

通常提到这种精细控制,大家的第一反应是:这得消耗多大的算力?模型得重训多久?
InstanceAssemble给出的答案让人相当意外。它采用了LoRA(低秩适配)方案,并不需要重新训练那个庞大的底模。
看看这组数据:
适配Stable Diffusion 3-Medium:只需增加约3.46%的参数量。
适配最新的Flux.1:额外参数量甚至低至0.84%。
这意味着,你不需要为了这就换一张4090显卡,也不需要下载几百个G的新模型,仅仅通过外挂一个极轻量的模块,就能让当红炸子鸡Flux拥有顶级的布局控制能力。
InstanceAssemble的出现,对于设计行业来说是个极大的利好。
以前设计师用AI做海报,最头疼的就是没法控制产品图的位置,往往需要生成几百张图再后期PS合成。现在,你只需要画好几个框,告诉AI这里放香水、那里放花瓣,一张符合排版规范的高质量商业图就出来了。
0
好文章,需要你的鼓励