一曲封神！“音乐界Sora”Udio发布，效果直逼人类唱歌｜钛媒体AGI

本周一，钛媒体AGI发布了“比Suno好10倍的 AI 音乐应用”消息，引发关注，甚至当时名字都还没得到正式确认。

如今，这款 AI 音乐产品终于被官宣了。

北京时间4月11日凌晨，全新的音乐生成应用Udio正式亮相，输出效果超越热门的Suno，尤其是中文歌曲甚至直逼人类唱歌水平，堪称“录音室”级别，成为Suno劲敌，引发广泛关注。

据了解，Udio采用先进的AI技术，通过简单的文字输入，就能生成各类风格的原创音乐作品。从抒情的福音音乐，到沧桑的蓝调，再到梦幻的流行电音，应有尽有。同时，Udio还支持多种语言，用户可以创作出日语流行、俄罗斯流行、拉丁节奏等多元化的音乐作品。

就目前体验来看，Udio的优势和特点包括两部分：体验比Suno好，更好的可扩展性。

其中，Udio生成的音乐效果比前段时间大火的Suno有了质的提升；同时，可扩展性方面，用户不仅可以指定音乐的引子和尾声，还能以此为基础向前向后延伸，生成更长的音乐作品。完成创作后，只需点击"发布"，作品就能与Udio社区的其他创作者们分享交流。

注册 Udio 帐户后，任何人都可以通过输入文本提示来创建曲目，其中可以包括歌词、故事方向和音乐流派标签。然后，Udio 分两个阶段处理该任务。首先，它利用类似于 ChatGPT 的大型语言模型 (LLM) 根据提供的提示生成歌词（如果需要）。接下来，它使用 Udio 没有公开的方法合成音乐，但这很可能是一种扩散模型，类似于 Stability AI 的Stable Audio。

根据给定的提示，Udio 的 AI 模型会生成两个不同的歌曲片段供您选择。然后，您可以将歌曲发布到 Udio 社区，下载音频或视频文件以在其他平台上共享，或直接在社交媒体上共享。其他 Udio 用户也可以重新混音或在现有歌曲的基础上进行创作。Udio 的服务条款规定，该公司对音乐世代不享有任何权利，并且它们可以用于商业目的。

企业层面，公开消息显示，Udio的创始团队来自谷歌DeepMind等顶尖AI机构，团队在音乐和技术领域均有深厚积淀。他们的目标是让Udio成为一款真正改变游戏规则的音乐创作工具，不仅面向专业音乐人，也希望让广大非音乐人也能轻松参与到音乐创作当中。

尽管 Udio 团队尚未透露其模型或训练数据的具体细节（其中可能充满了受版权保护的材料），但它告诉《tom指南》，该系统具有内置措施来识别和阻止与特定的艺术家，确保生成的音乐保持原创。

当前，Suno、Udio 也让一些人类音乐家感到害怕。上周，超过 200 名音乐艺术家签署了一封公开抗议信，批评Udio这种由 AI 驱动的音乐生成服务，影响音乐者创作。一位 Reddit 评论者在有关 Udio 的帖子中写道：“说实话，这太令人沮丧了。” “我仍然普遍乐观地认为，从长远来看，音乐在某种程度上会很好。但是，为什么要这样做？为什么要自动化艺术？”

也有分析称，就像Sora一样，Udio生成的音乐和 Spotify 上听到的歌曲几乎没有任何区别。而且根据他的感受，“要比Suno好10倍。”

早前钛媒体注意到相关报道，Udio称为xgboost技术，后来被证实后者是一种数据集技术，它采用开源数据集Medley-solos-DB，最初发布时间为2019年9月29日。该研究参与方包括纽约大学、加州大学伯克利分校、Spotify等机构人员。另据论文显示，山东理工大学工程与信息技术系Yijie Liu,Yanfang Yin，Qigang Zhu，Wenzhuo Cui等人采用利用XGBoost结合特征融合进行乐器识别。

据报道，Udio团队正在快速迭代优化，计划未来陆续推出更长音频、更高音质，以及更强大的可控性等众多新功能。

针对 AI 音乐生成生态，Suno首席执行官Mikey Shulman在红杉资本活动上表示，这是一个非常酷的工具，它正在扩大用户，从而让我们对倾听创造性音乐的品味能够引起更多人的共鸣。未来suno会有大量的玩家，占比或超过80%。

（本文首发钛媒体App，作者｜林志佳）

正文

一曲封神！“音乐界Sora”Udio发布，效果直逼人类唱歌｜钛媒体AGI

相关阅读

医疗AI新星每因智能获千万融资，致力于精准疾病风险预测

哥伦比亚大学两位退学生打造“AI 面试作弊神器”，拿下 500 万美元融资

Reachy2机器人发布：互动自然，售价 7万美元

Adobe 为 Photoshop 和 Premiere Pro 开发 AI 代理，提供编辑建议并自动执行操作

目录[+]