AI音乐创作正变得触手可及。专注于自研音乐大模型的AI公司自由量级,近日发布了其新模型——音潮V3.0。该模型允许用户仅用一句话表达想法,即可在一分钟内生成一首结构稳定、音调准确、人声自然的完整音乐作品,时长可达2至6分钟。
相较于前代,音潮V3.0在演唱质量、整体悦耳度、编曲丰富度及音乐完整性等方面均有显著提升。目前,该模型已通过网页端和官方App向所有用户免费开放试用。
产品提供了四种核心创作模式:“一句话写歌”、“照片写歌”、“歌词写歌”和“热歌改编”。在“一句话写歌”模式下,用户只需输入描述歌曲风格或内容的提示词,系统即可生成歌曲。该模式还提供“一键AI润色”与“灵感提示”功能以降低使用门槛。用户可根据需求选择“片段模式”生成短视频适用的精华段落,或选择“完整模式”生成包含主歌、副歌等结构的成熟作品。系统会为歌曲自动匹配推荐音色,用户也可使用提前创建的专属音色。
对于已有歌词的用户,“歌词写歌”模式支持直接粘贴歌词并自动优化,用户可自由设定风格、流派、情绪等参数。“照片写歌”模式则允许用户上传图片,由模型自动理解内容并生成适配词曲,无需额外输入提示。所有生成的歌曲均可直接下载音频或带AI封面的视频,便于分享。
技术层面,音潮V3.0通过自研的双轨建模机制,将人声与伴奏拆分建模后再融合,提升了演唱质量与协同性。其旋律生成增强了动机设计能力,使副歌更具记忆点。编曲方面,模型能根据音乐类型匹配合理的配器策略,并通过核心技术提升声音的空间质感与层次感。团队建立了细粒度的专业评价体系与强化学习数据库,致力于实现AI创作与人类审美的对齐。
自由量级核心团队兼具音乐与技术背景,这种跨界融合有助于将音乐直觉转化为算法语言。目前,音潮的技术已应用于多个商业场景,并与线下KTV等展开合作。团队强调其目标是降低创作门槛,让每个人都能用音乐表达自我,并明确用户拥有AI生成音乐的版权。


