自今年3月以来,国内外涌现出大量AI生成式音乐工具,行业格局在一夜之间发生了翻天覆地的变化。
此前,OpenAI的MuseNet、谷歌的MusicLM以及Meta的MusicGen等AI音乐项目已经引起了业界广泛关注。而如今,一款名为Suno的“音乐版chatgpt”音乐大模型点燃了全球音乐界的热情。因为这款模型能够一次性完成歌词、演唱、编曲、配乐等音乐创作的全过程,因此被誉为“消灭”了音乐创作门槛。
音乐制作人闫东炜在第一时间试用了Suno,他兴奋地表示:“输入几个关键词,不到一分钟就能生成了。”然而,他也指出了Suno的局限性:虽然借助AI可以找音乐灵感,但听多了感觉出来的基本都是流行歌。未来抖音上的歌可能会越来越相似,像流水线一样生产。如果要不断地坐在电脑前输入关键词来生成歌曲,这个过程可能会显得有些无聊。
尽管如此,Suno仍然获得了不少业内人士的高度评价。范志昊评价:Suno生成的音乐是有下限的,它的创作至少听着顺耳。
范志昊表示,可以借助AI预测音乐内容,并帮助公司找到合适的歌手。此外,AI还降低了音乐创作的门槛,让更多人能够享受到创作的乐趣。“本来听到好的作品会有共鸣,但如果变成自己去写,快乐是不一样的。这个市场的潜在需求非常大。”范志昊坦言。
AI音乐引发热潮的另一个重要原因在于使用门槛和价格的降低。以闫东炜使用过的一款AI音乐工具为例,基础版免费,PRO版价格大约是10美元一个月,能生成500首歌;更高级的版本只需30美元一个月,就能生成约2000首歌。这意味着,一首AI歌曲的成本仅需0.1元左右。
范志昊表示:“原先找专业作曲人创作歌曲的成本很高,即使是友情价也得是千元以上。但现在有了AI,几十块钱就能生成上百条音乐作品,价格差距非常大。”他还提到,如果机器不排队的话,几乎可以即刻生成一个词曲的demo(样片)。
AI音乐并非完美无缺。闫东炜认为,AI可以创作,但不善于修改。每次修改完都完全不一样,因此较为复杂的歌曲客户还是会找人工来做。尽管如此,他认为AI音乐在技术上已经高过很多网络上的口水歌。
范志昊也坦言,国内的AI工具和Suno相比仍有一定差距。虽然音乐AI能够生成各种风格的歌曲,但水平却参差不齐。其中,pop和爵士风格相对较为出色。pop风格之所以让人惊喜,是因为其训练数据丰富,结构相对可复制;而爵士风格则因为能写出好风格的人本身就比较少,所以显得尤为亮眼。
AI会取代音乐人?
当地时间4月2日,200多名国际乐坛知名音乐人联署公开信,呼吁AI开发者、科技公司、平台和数字音乐服务商停止使用AI侵犯及贬低人类艺术家的权利,要求他们承诺不开发与之相关的AI音乐生成技术等,也不能拒绝向艺术家提供合理报酬。参与联署的艺人共有246名,大多来自欧美乐坛,其中包括比莉·艾利什(Billie Eilish)、凯蒂·佩里(Katy Perry)、妮琪·米娜(Nick Minaj)等。
近年来,AI音乐生成技术迅速发展,一系列以“AI歌手”为名的翻唱作品在网络上走红。例如,“AI孙燕姿”翻唱的《发如雪》、“AI王心凌”翻唱的《套马杆》等视频,播放量均超过百万。随后,“AI周杰伦”“AI林俊杰”“AI许嵩”等“歌手”也如雨后春笋般涌现。
相关技术的普及也引发了社会各界的担忧。许多行业人士担心,AI的广泛应用可能会危及他们的生计和职业发展。对此,闫东炜表示,虽然AI对音乐创作者的影响有限,但确实降低了普通人进入音乐创作的门槛,这可能会对整个音乐行业产生一定的冲击。“流行歌手不会失业,粉丝喜欢的是这个人,他唱得好,有作品更好。”
闫东炜进一步解释说,现在客户只需将需求发送给AI,便能快速生成音乐作品,这在一定程度上减少了对传统音乐制作公司的需求。然而,他也强调,AI生成的音乐往往结构单一,对于专业领域的需求帮助有限。音乐制作人仍需要根据客户需求进行后期的修改和调整,以确保作品的质量和独特性。
“AI最先替代的就是艺术家,人工智能可以体验无数次恋爱、失恋、死亡,因此他会比人更有情感,AI在其他领域最大的问题是‘幻觉’,可能会造成误判,但这种‘幻觉’在艺术上就可能是突破和创新。”刘岩说。
范志昊表示,AI对音乐行业的影响是双面的。它既可以降低创作门槛,让更多人能够尝试音乐创作;也可能导致一部分人的工作被AI替代,尤其依赖简单创作和翻唱的艺人可能失去工作机会,例如有些唱demo的歌手已经被替代了。
“AI对音乐人的冲击并不是直接的竞争,而是潜移默化的竞争。AI音乐的普及可能会改变音乐人的职业发展方向。”在范志昊看来,未来,音乐人可能更需要注重个人IP的经营和发展,而非仅仅依赖于网络歌曲的翻唱和创作。
此外,范志昊还提到了未来音乐产业的发展趋势。他表示,随着音乐产量的不断增加,每年人们能够听到的歌曲数量已经远远超过了他们的消化能力。AI的出现进一步加剧了音乐市场的竞争,抢占了原有的音乐空间。这导致一些认真做曲库、做内容的音乐人可能会受到影响,他们的作品可能会因为AI的普及而被淹没在海量的音乐中。
对于AI音乐对传统市场的冲击问题,刘岩也表达了自己的看法。他认为,AI音乐生成技术能够在短时间内产生大量歌曲,以目前能力和需求看,一年后,市场上90%的歌曲可能都是AI生成的了,传统意义上的“新歌”可能连1%的比例都占不到了,仅从数据上看,行业的格局一定会被打破。
“黑盒”是小公司跟大厂竞争的壁垒
音乐大模型的发展正处于一个关键时期。继Suno之后,国内的科技公司也不甘落后,昆仑万维推出了“天工SkyMusic”,发布的9首由“天工SkyMusic”生成的音乐作品,展示了从说唱到古风等多种风格的音乐创作能力,这些作品的时长从10秒到51秒不等。
一年前,刘岩和他的团队就敲下音乐大模型开发的第一行代码,决心布局该行业。在他看来,音乐大模型相较于文字和视频大模型,面临着更高的技术门槛。“音乐和视频一样是一种长时序的技术形式,如果说视频可以分成每一秒钟24帧图像的话,音乐则每一秒钟包含上万个采样点,且每个采样点之间的相关性强,这使得音乐成为最复杂的模态之一。”
刘岩进一步阐述道,当前市面上部分被冠以“音乐大模型”之名的产品,其实并未达到严格意义上大模型的标准。一些作品的生成依赖于音乐结构和规则的技术,或是通过将音乐转化为MIDI等符号语言再进入模型来实现,这种方式虽然能够产生近人类水平的音乐,但不能触及音乐的本质——对音乐情感、内涵及整体结构的理解与创造性表达,永远不会超越现有音乐的水平。
“真正意义上的音乐大模型应当具备端到端的学习能力,训练数据直接来源于日常聆听的完整音乐作品而非翻译后的MIDI,并能够从构思歌词、设计旋律、编排伴奏直至模拟人声演绎等全过程进行一体化的创作。遗憾的是,当前大多数模型仅在音乐创作的旋律和伴奏等某一个环节上取得进展,尚未实现全方位的音乐生成。”刘岩说。
目前用户无法透视模型的内部逻辑,只能看到其外在表现。刘岩认为,AI这一天然的“黑盒”效应,让音乐大模型出现了不少鱼目混珠的情况。然而,“黑盒”效应也为中小企业和创业团队带来了独特的发展机遇。
范志昊早在半年前就开始集结团队,专注于研究音乐AIGC辅助生态。他认为,“黑盒”是小公司跟大厂竞争的唯一的壁垒,因为互联网产品的运作逻辑可以轻易被剖析和模仿,而AI则不然,这就要求开发者投入更多的心血与专注。在他看来,这不是大厂有钱就可以做好的。“除非他一下子砸很多钱进去,但这又不是一个潜力特别大的市场。”
与语言大模型广泛应用于多元场景不同,音乐大模型从诞生之初便瞄准了特定的应用场景——降低音乐创作门槛,使以往专业音乐人才方能完成的工作,如今普通人借助大模型只需通过自然语言描述就能得到高质量的歌曲作品。
这一点使音乐大模型在特定领域具有一定的市场潜力。刘岩认为:“语言大模型我们很难超越,但音乐大模型我们可以把它做成全世界最好的模型。”
(稿件来源:每经网)