Black Forest Labs发布FLUX.2 [klein]图像生成模型

2026-01-16 14:20

Black Forest Labs再次开源了全新图像模型FLUX.2[klein]，提供4B和9B两个版本。

FLUX.2[klein]系列模型面向对实时图像生成有强需求、同时又不愿牺牲生成质量的应用场景而设计，仅需13GB显存，即可在消费级硬件上高效运行。

在架构层面，FLUX.2[klein]采用紧凑的一体化设计，将图像生成与编辑能力统一在同一个模型中，端到端推理时间低至1秒以内，同时依然保持了业界领先的生成质量。

值得关注的是，此次开源的一大亮点在于不仅开源了蒸馏模型，还同步开源了未蒸馏的“满血版”基础模型。该版本完整保留了全部训练信号，具备更高的灵活性与可塑性，特别适合用于模型微调、LoRA训练、科研探索以及对可控性要求高于推理速度的定制化生成与推理流水线。同时，相比蒸馏模型，满血版在输出多样性方面也更具优势。

为什么选择[klein]？

视觉智能正迈入一个全新的时代。随着AI Agent能力不断增强，它们对视觉生成的要求也在同步提升：需要能够实时响应、快速迭代，并且能在易获得的硬件条件下高效运行的模型。

“klein”一词源自德语，意为“小”，既体现了模型本身的紧凑体量，也强调了极低的推理延迟。但FLUX.2[klein]绝非“能力受限”。该系列模型在文生图、图像编辑以及多参考图像生成等任务上都展现出卓越表现，而这些能力通常只存在于更大规模的模型之中。

FLUX.2[klein]具有以下特性：

亚秒级推理：在现代硬件上，图像生成或编辑可在0.5秒以内完成。

高真实感与高多样性输出：尤其是在基础（Base）版本中，具备出色的照片级真实感和更高的生成多样性。

生成与编辑统一：单一模型同时支持文生图、图像编辑以及多参考生成，并保持前沿级性能表现。

可运行于消费级GPU：4B模型显存占用约13GB，可在RTX 3090/4070及以上显卡上运行。

对开发者友好且易于获取：4B模型采用Apache 2.0许可证；9B模型提供开放权重；提供完整开放权重，支持深度定制与微调

API+开放权重双形态：既可通过生产级API使用，也可在本地加载完整权重运行。

FLUX.2[klein]模型家族

FLUX.2[klein]系列模型包含4B和9B两个版本，每个版本都有基础模型和步数蒸馏模型（只需要4步推理）。

FLUX.2[klein]9B是旗舰级的小模型。在文生图、单参考图像编辑以及多参考生成等任务中，FLUX.2[klein]9B在质量与延迟的权衡（Pareto前沿）上树立了新的标杆：在不到0.5秒的推理时间内，其效果即可匹配甚至超越体量大5倍的模型。

该模型基于9B的Flow模型构建，并配备8B的Qwen3文本编码器，通过step蒸馏将推理步骤压缩至4步，在速度与质量之间实现了极致平衡。你可以在亚秒级速度下，融合多张输入图像、混合不同概念，并对复杂构图进行反复迭代，同时保持前沿级的生成质量。

但是9B模型的开源协议是FLUX Non-Commercial License，不支持商用。

FLUX.2[klein]4B则是完全开源（Apache 2.0）。这也是最易获取、最亲民的模型，专为本地开发与边缘端部署而打造，可在RTX 3090/4070等消费级GPU上运行。体量小但能力不俗：同时支持文生图（T2I）、图生图（I2I）以及多参考生成，生成质量远超同规模模型。

除了步数蒸馏版本，这次还开源了满血版的基础模型：FLUX.2[klein]Base 9B/4B。基础模型未经过蒸馏，输出多样性更高，而且完整保留了全部训练信号，适合进一步微调。

而且，这次还同步发布了所有FLUX.2[klein]变体的FP8和NVFP4量化版本。这些版本与NVIDIA合作开发，针对RTX GPU进行了推理优化，在保持相同能力的前提下，占用更小、运行更快，从而兼容更多硬件环境。

好文章，需要你的鼓励