谷歌在其Gemini生态系统中正式发布了由DeepMind研发的最新音乐生成模型Lyria 3。该模型标志着谷歌在AI音乐领域的重要进展,为用户提供了新的创作工具。
Lyria 3支持文本、图片和视频等多种模态输入,能够生成高保真的音乐曲目,并适用于包括英语在内的多种语言。目前该模型已在桌面端逐步开放体验,移动端访问也将随后推出。
模型的核心技术升级主要体现在三个方面:一是具备自动生成歌词并与旋律匹配的能力;二是提供了对节拍、人声风格等音乐元素的精细控制;三是拥有多模态协同合成功能,例如可根据上传的图片生成情绪相符的音乐。
在合规性方面,Lyria 3采取了针对性措施。所有生成的音频都嵌入了SynthID水印技术,以实现音乐来源的可追溯性。同时,模型在处理知名音乐人信息时也采取了审慎策略,以避免直接复制特定风格可能引发的版权问题。
不过,该模型在某些小众音乐风格上的表现仍有提升空间,且生成的音乐长度存在一定限制。这表明其当前更侧重于短内容创作场景的应用。
总体而言,Lyria 3的发布是谷歌在AI音乐生态布局中的重要一步。通过与Gemini生态的联动,谷歌旨在为用户提供更集成的创意体验。如何在技术创新与版权合规之间取得平衡,将是AI音乐生成领域持续面临的课题。


