01
音乐成AIGC新热门赛道
自今年3月“音乐界的ChatGPT”SunoV3火爆全球后,“文生音乐”就成为AIGC圈里的热门赛道。国内的互联网巨头自然不会放过这样的热门风口,网易天音、腾讯启明星、字节海绵音乐、天工SkyMusic等一众“含着金钥匙”的AI音乐平台纷纷下场,再加上不少初创企业的进入,整个AI音乐赛道变得格外热闹。
AI音乐之所以能快速崛起,同其深厚的积淀有莫大关系。单纯用计算机合成音乐这件事,早在20世纪50年代就已经出现了。这些模型通过将音乐理论的原则转换成算法指令和概率表,来确定音符和和弦的进行。虽然这些作品在音乐上是合理的,但在创造性上却受限。
2015—2017年的创业浪潮当中,先后涌现出了多家AI生成音乐相关的项目。2023年以来,针对C端消费市场的AI生成音频产品之间的竞争也日益激烈,Meta和Google等巨头先后推出了能够创作歌曲和声音的AI工具,而2024年3月,Suno发布支持更多样化的风格、更准确的prompt理解能力和更少的幻觉的V3版本后,整个文生音频赛道开始崛起。
此前陆续推出的AI音乐生成器并不少,比如Adobe的 Project Music GenAl, YouTube 的 Dream Track和 Voicify AI,但只有 Suno 被称为“音乐界的ChatGPT”,主要系Suno将优秀的模型算法转化为具有实用价值的产品。
Suno团队使用多种模型和多种素材训练模型,确保Suno能够生成各种类型的音频,能够区分语音、背景音乐和人声等元素,其主要使用自研的transformer的Bark语音模型和Chirp音乐模型,前者主要用来生成人声,后者提供音乐旋律和音效,两者让Suno生成的音乐旋律更智能化、复杂化。Suno的原理跟文本生成相似,通过训练模型来预测接下来将要出现的token的概率。
与此同时,Suno通过“傻瓜式操作”“建立活跃社区”“兼具低门槛和高质量”等特色快速赢得大量普通用户青睐,进而让后来的众多AI音乐模型看到了发展方向。
02
开辟细分赛道的大模型
从文字、图片、视频到音乐,UCG平台用户创作需求不断推升Suno和Udio等生成式人工智能音乐创作平台热度,继天工SkyMusic开创了中国AI音乐大模型的先河,成为中国音乐AIGC sota后,海螺AI这样的后起之秀同样盯上了“音乐”赛道。相较早期主打文本、对话应用的文心一言、豆包等通用AI平台,天工和海螺AI多少有些深挖细分赛道,进而俘获消费者流量的意味。
在PC浏览器中访问海螺AI大模型官网,即可在首页对话框下方看到“海螺视频”和“海螺音乐”两个醒目选项,点击进去后就是“海螺音乐”的主界面了。天工AI则将“天工SkyMusic”放到了左侧工具栏底部,当前名为“AI音乐”。
两款软件对AI音乐创作功能的划分并没有太大差异,只不过海螺音乐创作界面占据了3/4的界面,而天工AI音乐则将主界面中间位置留给了“发现音乐”板块,并将“创作歌曲”放到界面右侧。
不同于前面两款AI大模型将AI音乐内置的做法,网易天音则拥有独立的界面,其本身就单纯为歌曲创作设计,不过为测试的公平性,这里选择让文心一言以“少年、晨曦、奋斗、坚持、美好等关键词为主”,为我们创作一首写给10岁至15岁少年的歌曲,要求“古典”风,从而完成测试前的准备工作。
03
开辟细分赛道的大模型
输入“歌名”和“歌词”后即可点击“开始创作”,但实际上天工AI音乐还会让用户提前选择参考音频(曲风和情绪),而海螺音乐则只会让用户选择“曲风”。
相较而言,出身有着音乐平台背景的网易天音在选项设置上就准也许多,除本身分为“关键字灵感”和“写随笔灵感”两种创作模式外,用户更可以自主设置“作曲/段落结构/音乐类型”等选项,且“全曲模式”也细分为前奏、主歌、副歌、间奏等多个部分,最多的选项多少需要点专业知识,但如此详细的交互,往往能让AI更好地理解用户想法。
相较AI视频创作,AI音频创作效率高很多,基本上1—3分钟就能拿到AI创作好的歌曲,且天工AI音乐还直接生成了两首不同节奏、音调的歌曲。
这里需要注意的是目前海螺音乐属于“限免”阶段,喜欢音乐的小伙伴倒是可以多多尝试和体验,而天工AI音乐的话每次创作需要耗费10创作券,非VIP用户的话每天凌晨0点重置创作券数量10,意味着非VIP用户每天只能用天工AI音乐创作一首歌曲。
04
谁创作的歌更好听
由于网易天音创作的内容歌词为平台自主创作,因此这里主要比较的是海螺音乐和天工AI音乐两个平台对同样歌词内容的生成效果。这里笔者和众多编辑的试听反馈均表示海螺AI在歌曲连贯性和背景音效融合度上表现更好,而天工AI音乐多少有些“僵硬”。
事实上,情感表达一直都是AI音乐的软肋,海螺音乐和天工AI两个平台生成的AI音乐作品在情感表达上依旧显得机械和缺乏深度,很容易就听出“AI味儿”,
相较而言,拥有较高“自主”权限的网易天音在完成歌曲的生成后,用户还可以设置“AI人声”和“AI伴奏”,并通过不断试听来调整作品效果。
而经过这样调整出来的作品,很难再听出“AI僵硬”的违和感了,整个歌曲从过渡到主旋律都相当不错。
总体而言,“一键成曲”虽然极大降低了AI生成音乐的门槛,但作品在结构和编排上可能显得呆板和模块化,缺乏创新性和多样性,而网易天音这种需要一定专业知识且设置步骤相对较多的平台,明显优秀不少。
此外,尽管AI可以生成歌词和旋律,但在创作过程中仍需要人类创作者的参与和调整,以确保作品的艺术性和个性化。从这个角度看,用户或许在整个创作过程中扮演“辅助”的角色,但这个角色却是不可或缺的存在。