6月15日消息,Suno 近日对音源分离功能进行了底层架构级升级,核心变化是放弃传统的频谱掩码分离方式,转为利用生成模型的内部表征直接重新合成各音轨。
技术路径从"切"到"造"
传统音源分离工具(包括 Meta 开源的 Demucs、商业服务 LALAL.AI 等)依赖频率分析将混音"切"成独立音轨。这种方式的固有缺陷是串音、频谱伪影和相位失真——尤其在乐器频段高度重叠的密集编曲中,分离质量会明显下降。
Suno 这次升级走了另一条路。由于平台掌握自身生成模型的内部信息(即每种乐器在生成阶段的表征数据),系统不再试图从成品混音中"拆"出音轨,而是基于这些内部表征重新合成目标乐器的独立音轨。官方的表述是"从头重新生成音轨,而不仅仅是隔离频率"。这意味着输出的音轨理论上可以做到零伪影、无串音,质量接近多轨录音的独立导出。
需要注意的是,这一优势主要针对 Suno 原生生成的曲目。平台也支持导入外部音频进行分离,但由于模型缺少外部音频的内部生成信息,"重新生成"的加成会明显减弱,效果更接近传统分离工具的水平。
三种分离模式与定价
升级后的音源分离提供三种模式,覆盖从快速分轨到精细提取的不同需求。
Auto Split(自动分离)是延续原有功能的基础模式,自动将曲目拆分为最多 12 个音轨类别(人声、鼓组、贝斯、吉他、键盘等),一次操作消耗 50 credits,适合需要完整多轨的快速场景。
Split from Mix(混音提取)是旧版"人声+伴奏"分离的升级版。用户可以选择任意单一乐器或人声进行提取,系统同时输出目标音轨和其余部分的补集,形成一对输出,每轨约 10 credits。
Advanced Split(高级分离)是此次升级的最大亮点,仅限 Premier 订阅用户使用。该模式提供近 100 种乐器和音色的精确选择列表,从常规的完整鼓组、电吉他到 didgeridoo 等冷门乐器均可指定提取,每轨同样约 10 credits。
订阅方面,Pro 方案月付 10 美元(年付约 8 美元/月),可使用 Auto Split 和 Split from Mix 两种模式;Premier 方案月付 30 美元(年付约 24 美元/月),解锁全部三种模式及 Suno Studio。
竞品对比:路径差异比质量差异更关键
当前主流音源分离工具的技术路线仍以频谱分析为主。Meta 的开源模型 Demucs(HTDemucs FT 版本)是学术基准线,在 MUSDB18 测试集上表现最优,支持本地免费运行但需要 GPU 和 Python 环境,输出上限为 6 个音轨。LALAL.AI 的 Orion 引擎在人声分离上接近 Demucs 水平,支持最多 10 个音轨,按时长计费但未用完的时长不滚存。Moises 面向练习场景,移动端体验最好,附带变调变速和和弦检测功能。RipX DAW 的独特价值在于分离后的音符级编辑能力,适合深度混音和母带处理。
Suno 的差异化不在于同一技术路线上的精度提升,而在于路径本身的切换——从"分析成品"变为"重新生成"。这个优势在处理自家生成内容时极为明显,但面对外部音频时并不成立。换言之,Suno 的音源分离更像是其生成生态的延伸能力,而非通用音源分离工具的替代品。
实际使用限制
当前版本存在几个明确的边界。功能仅支持桌面端,移动端暂不可用。credits 消耗速度在频繁使用分离功能时会比较快——Auto Split 一次 50 credits,对于 Pro 用户每月 2500 credits 的额度来说,满打满算只能做 50 次完整分轨。Advanced Split 锁定在 Premier 层级,对轻度用户构成门槛。
部分用户反馈中也提到,分离操作无论结果是否可用都会扣除 credits,失败的尝试同样计费。此外,Auto Split 虽然支持 12 轨类别识别,但标签准确性有时会出错,需要人工确认。
从工作流角度看,Suno 的定位越来越明确:不是一个独立的音源分离工具,而是"生成→编辑→分轨→导出"完整链路中的一环。对于以 Suno 作为主要创作工具、需要将作品导入 DAW 做后期的用户,这次升级解决了长期以来分轨质量不够专业的痛点。但对于需要处理外部音频的通用分离需求,Demucs 或 LALAL.AI 仍然是更直接的选择。