4月10日消息,MiniMax(稀宇科技)发布音乐生成模型Music 2.6,核心新增Cover(翻唱/重制)创作功能,同步开源3个面向AI Agent的Music Skill,面向全球创作者开启14天免费内测。
Cover功能:上传原曲提取旋律,风格编曲歌词全部可改
Music 2.6最大的新增能力是Cover模式。用户上传一首参考音乐,模型提取旋律骨架后,创作者可自由修改骨架之外的所有元素——风格可以从民谣跳到重金属,编曲可以从古典交响转成赛博朋克电子,也可以保留旋律完全替换歌词。
这解决了一个此前AI音乐生成做不了的任务类型:不是"生成一首新歌",而是"把一首已有的歌变成另一种样子"。官方示例中,《友谊地久天长》被转换为完全不同风格的版本,旋律可辨认但整体听感焕然不同。MiniMax在官网用了一个场景来说明Cover的定位——一个不会编曲的普通人,想把妈妈年轻时最喜欢的歌用自己的风格重做一版当生日礼物,这件事过去需要编曲团队,现在半小时可以完成。
Suno和Udio目前均不支持上传参考音乐进行旋律提取和风格改编,Cover功能在主流AI音乐生成工具中属于首创。但需要注意,基于已有音乐旋律的再创作涉及版权边界问题,MiniMax目前未公开说明版权处理机制,创作者在商业场景下使用需自行确认原曲授权情况。
器乐和中低频:国风细节和重低音场景的针对性优化
Music 2.6在器乐表现上的提升集中在两个方向。
一是民族乐器的演奏细节。官方案例中提到,二胡揉弦、笛子气口、古筝扫弦、戏腔收放等此前AI音乐做不好的国风元素,在2.6中有了明显改善。更关键的是乐器之间的时序演进——开场留白、弦乐和弹拨逐层进入、旋律与人声最后推到顶点——这种层次感是此前"国风音色包机械拼接"的生成方式无法实现的。
二是中低频声学的系统性优化。贝斯和鼓点在下潜深度和咬合紧密度上有提升,直接受益的是House、Trap、Drum & Bass等重低音风格,以及游戏Boss战配乐等需要低频推动情绪的场景。官方给出的案例是一个独立游戏开发者,用2.6一个下午完成了整套Boss战配乐,成本从外包几千块降到零。
其他技术改进
首包延迟降至20秒以内。指令控制粒度增强,BPM、调性(Key)、段落结构、情感弧线均可在prompt中精确指定并被模型执行。输入支持歌词最多3500字符、风格描述最多2000字符,以及纯音乐模式和参考音乐上传。
人声处理方面有一个值得注意的变化:模型开始允许"不精准"——在lo-fi、indie folk、独立爵士等风格中,这种刻意的不精准转化为律动的呼吸感,适合咖啡馆、氛围空间等需要"好听但不抢戏"的场景。
Music Skill:音乐生成接入AI Agent生态
Music 2.6同步开源3个Music Skill:
minimax-music-gen是核心生成技能,Agent通过自然语言描述需求后,自动识别意图、选择模式(原创/纯音乐/Cover)并调用API完成生成。minimax-music-playlist让Agent扫描用户本地音乐应用,构建品味画像,自动生成定制歌单。buddy-sings联动OpenClaw,读取用户定义的角色人格,让虚拟伙伴以第一人称即兴创作和演唱。
这是MiniMax首次将音乐生成能力打包为标准化Skill。在微信支付、支付宝等平台近期纷纷将核心能力封装为Skill的趋势下,音乐生成也开始从独立工具变为Agent可调用的模块化能力。
竞品对比
AI音乐生成赛道当前格局:Suno用户量和社区活跃度领先,Udio在音质和风格多样性上有口碑,MiniMax Music通过2.5版本的段落级控制(14种结构变体)、100余种乐器音色库和华语流行专项优化建立差异化。
Music 2.6的核心增量是Cover功能和Agent Skill集成,这两项在Suno和Udio中均无对应能力。但Cover功能的实际旋律提取精度、风格转换质量需要大量用户验证,目前无第三方评测数据。
免费内测与局限性
14天免费内测面向全球创作者开放:普通用户每日500次免费生成额度,Token Plan开发者每日额外100次API调用,每次最多生成2个作品。创作入口为minimaxi.com/audio/music,API文档见platform.minimaxi.com。
Cover的版权风险仍是最大不确定性。即使模型只提取"旋律骨架",生成结果与原曲的相似度边界、是否构成改编权的行使、商用场景下的授权要求等均无明确说明。内测期服务器稳定性也需观察——每日500次额度看似充裕,但Cover模式需要反复调试风格参数,实际消耗可能很快。