本周一,钛媒体AGI发布了“比Suno好10倍的 AI 音乐应用”消息,引发关注,甚至当时名字都还没得到正式确认。
如今,这款 AI 音乐产品终于被官宣了。
北京时间4月11日凌晨,全新的音乐生成应用Udio正式亮相,输出效果超越热门的Suno,尤其是中文歌曲甚至直逼人类唱歌水平,堪称“录音室”级别,成为Suno劲敌,引发广泛关注。
据了解,Udio采用先进的AI技术,通过简单的文字输入,就能生成各类风格的原创音乐作品。从抒情的福音音乐,到沧桑的蓝调,再到梦幻的流行电音,应有尽有。同时,Udio还支持多种语言,用户可以创作出日语流行、俄罗斯流行、拉丁节奏等多元化的音乐作品。
就目前体验来看,Udio的优势和特点包括两部分:体验比Suno好,更好的可扩展性。
其中,Udio生成的音乐效果比前段时间大火的Suno有了质的提升;同时,可扩展性方面,用户不仅可以指定音乐的引子和尾声,还能以此为基础向前向后延伸,生成更长的音乐作品。完成创作后,只需点击"发布",作品就能与Udio社区的其他创作者们分享交流。
注册 Udio 帐户后,任何人都可以通过输入文本提示来创建曲目,其中可以包括歌词、故事方向和音乐流派标签。然后,Udio 分两个阶段处理该任务。首先,它利用类似于 ChatGPT 的大型语言模型 (LLM) 根据提供的提示生成歌词(如果需要)。接下来,它使用 Udio 没有公开的方法合成音乐,但这很可能是一种扩散模型,类似于 Stability AI 的Stable Audio。
根据给定的提示,Udio 的 AI 模型会生成两个不同的歌曲片段供您选择。然后,您可以将歌曲发布到 Udio 社区,下载音频或视频文件以在其他平台上共享,或直接在社交媒体上共享。其他 Udio 用户也可以重新混音或在现有歌曲的基础上进行创作。Udio 的服务条款规定,该公司对音乐世代不享有任何权利,并且它们可以用于商业目的。
企业层面,公开消息显示,Udio的创始团队来自谷歌DeepMind等顶尖AI机构,团队在音乐和技术领域均有深厚积淀。他们的目标是让Udio成为一款真正改变游戏规则的音乐创作工具,不仅面向专业音乐人,也希望让广大非音乐人也能轻松参与到音乐创作当中。
尽管 Udio 团队尚未透露其模型或训练数据的具体细节(其中可能充满了受版权保护的材料),但它告诉《tom指南》,该系统具有内置措施来识别和阻止与特定的艺术家,确保生成的音乐保持原创。
当前,Suno、Udio 也让一些人类音乐家感到害怕。上周,超过 200 名音乐艺术家签署了一封公开抗议信,批评Udio这种由 AI 驱动的音乐生成服务,影响音乐者创作。一位 Reddit 评论者在有关 Udio 的帖子中写道:“说实话,这太令人沮丧了。” “我仍然普遍乐观地认为,从长远来看,音乐在某种程度上会很好。但是,为什么要这样做?为什么要自动化艺术?”
也有分析称,就像Sora一样,Udio生成的音乐和 Spotify 上听到的歌曲几乎没有任何区别。而且根据他的感受,“要比Suno好10倍。”
早前钛媒体注意到相关报道,Udio称为xgboost技术,后来被证实后者是一种数据集技术,它采用开源数据集Medley-solos-DB,最初发布时间为2019年9月29日。该研究参与方包括纽约大学、加州大学伯克利分校、Spotify等机构人员。另据论文显示,山东理工大学工程与信息技术系Yijie Liu,Yanfang Yin,Qigang Zhu,Wenzhuo Cui等人采用利用XGBoost结合特征融合进行乐器识别。
据报道,Udio团队正在快速迭代优化,计划未来陆续推出更长音频、更高音质,以及更强大的可控性等众多新功能。
针对 AI 音乐生成生态,Suno首席执行官Mikey Shulman在红杉资本活动上表示,这是一个非常酷的工具,它正在扩大用户,从而让我们对倾听创造性音乐的品味能够引起更多人的共鸣。未来suno会有大量的玩家,占比或超过80%。
(本文首发钛媒体App,作者|林志佳)