谷歌 Gemini 上线 AI 音乐创作功能:Lyria 3 模型引爆平台级竞争
2026-02-22 21:22
50
2月18日,谷歌正式在Gemini App中上线AI音乐生成功能,由DeepMind最新音乐模型Lyria 3驱动。借助Gemini 7.5亿月活的超级入口优势,用户仅需输入文本描述或上传照片/视频,几秒内即可生成含人声、歌词与专属封面的30秒完整歌曲,标志着AI音乐生成从创业公司赛道升级为平台级角力,对Suno等竞品形成降维打击。

一、核心能力:技术跃迁+多模态创作
1.Lyria 3模型的三大突破
作为谷歌第三代音乐生成模型,Lyria 3在技术上实现显著升级:
训练数据扩容4倍:从Lyria 2的50万首曲目增至200万首,音频位深升级至24-bit,输出48kHz立体声音频,音质超越YouTube Music等主流流媒体标准;
创作体验革新:支持自动生成歌词,无需用户额外输入,同时可精细控制曲风、人声类型、节拍速度等参数,人声表现更自然、咬字清晰度大幅提升;
多模态协同:不仅能通过文本生成音乐,还可根据上传的照片、视频情绪适配作曲配词,封面由谷歌Nano Banana图像模型自动生成,形成“输入-音频-视觉”闭环。
2.功能开放与生态整合
开放范围:以Beta版面向全球18岁以上用户,支持英语、德语、西班牙语等8种语言,桌面端率先上线,移动端后续逐步推送;
订阅权益:谷歌AI Plus、Pro、Ultra订阅用户享有更高使用额度;
跨平台联动:Lyria 3同步整合进YouTube Dream Track功能,为Shorts短视频生成背景音乐,该功能从美国地区扩展至全球。
二、版权合规:谨慎布局规避行业风险
面对AI音乐领域频发的版权纠纷(2024年华纳等三大唱片公司曾起诉Suno、Udio侵权),谷歌采取多重合规措施:
明确创作定位:强调Lyria 3专注“原创表达”,不模仿现有艺术家,若提示词提及具体艺人,仅作为风格灵感参考,不复制其声线或标志性段落;
全流程版权防护:训练过程严格遵循版权协议与合作伙伴约定,设置内容过滤器比对现有作品;所有生成音乐嵌入SynthID水印,支持音频鉴别功能,用户可上传文件验证是否为谷歌AI生成,完善“图片-视频-音频”全类型溯源体系;
维权通道:开通侵权举报入口,音乐人可申诉疑似侵权内容,降低法律风险。
三、行业影响:平台入口重塑竞争格局
1.对竞品的降维打击
与Suno、Udio等创业公司相比,谷歌的核心优势集中在生态与入口:
流量碾压:Gemini 7.5亿月活远超Suno等竞品量级,无需用户单独注册,降低使用门槛,推动AI音乐创作走向大众化;
场景适配:30秒时长精准匹配短视频配乐、日常分享等轻量化场景,例如用户可将待办清单转化为朋克歌曲分享,契合碎片化创作需求;
短板仍存:目前缺乏精细编辑功能,无法修改特定声部或混音比例,30秒时长也难以满足完整歌曲创作,专业度不及Suno的虚拟音频工作站功能。
2.行业趋势转变
谷歌的入局标志着AI音乐竞争从“模型性能比拼”转向“生态整合与合规能力较量”:
创业公司优势弱化:Suno等依赖专业功能的竞品,在谷歌的入口与流量优势面前,用户获取成本大幅提升;
创作民主化加速:普通人无需音乐基础即可实现创意表达,音乐生成的核心场景从录音棚转向日常生活分享;
商业化探索:谷歌将该功能纳入订阅体系,测试用户为AI创作工作流付费的意愿,为Gemini生态商业化铺路。
尽管Lyria 3仍处于Beta阶段,存在时长限制与功能粗糙等问题,但谷歌凭借超级入口与合规布局,已重新定义AI音乐的竞争规则。未来随着时长限制放开与专业功能迭代,AI音乐或将成为Gemini生态的核心竞争力之一,同时推动行业在版权规范、创作边界等方面形成新共识。
0
好文章,需要你的鼓励
