丰色 发自 凹非寺
量子位 | 公众号 QbitAI
前两天刚刚疯传的Suno挑战者、“音乐版Sora”正式现真身:
正式名称Udio,已完全免费开放,每人每月有足足1200首额度,网友们都玩疯了。
有人居然写了首催更奥特曼快点发布GPT-5的金属作品:
咳咳,更高能的甚至还创作出了脱口秀……!
创始人看完都直拍大腿:这绝对是我们意料之外的功能。
场面之热闹,有了Sora诞生之时的感觉了。
不仅各种风格要啥有啥(古典、流行、说唱、钢琴爵士、重金属等等),还支持多种语言,中文韩文歌也可以。
浅浅欣赏一下目前社区中最受欢迎(播放量近5万)的这首抒情歌,全长3分17秒,相当娓娓动听:
First Revelation,量子位,3分钟
由于玩的人太多,服务器一度被挤爆(现在ok了):
而质量之高,也让大名鼎鼎的播放器Spotify都直接被cue了:
趁你现在还买得起,赶紧把它买了吧。(手动狗头)
具体怎么个事儿?
如开头所见,网友们口中盛传的“音乐版Sora”就是Udio。
它刚刚发布的是Beta版,背后模型为v1版本,后续还会快速迭代。
我们进入官网,完成注册即可免费使用:
每人每个月最高可以创造1200首曲子。
具体玩法就是先输入文字,例如“a song about the experience of moving to a big city, heavy metal”。
然后系统会给你推荐一些建议标签,都是关于风格和流派的,随便选。
至于歌词的话,可以自己写,也可以纯乐器,或者让AI帮你生成。
都设置好后即可点击“Create”,稍等个大约1-2分钟左右的时间,就会得到结果了。
(ps.由于现在试玩的人还是很多,所以官方解释了一下这生成速度确实比正常要慢一些)
结果默认两首曲子——歌名都帮你取好了。
点击即可检验结果、查看歌词。
不满意的话还可以进行进一步编辑、扩展或者remix。
其中扩展可以帮咱们把默认的33秒时长提高到1分钟甚至3分钟。
一切满意的话就可以点击“publish”发布到社区了。
——这么好用的音乐生成器,大伙都很好奇它是怎么训练、拿什么训练的。
对此,官方没有任何透露,不过倒是表示产品有版权保护措施,模型配有自动过滤器,确保在平台上创作的音乐都是原创的。
据介绍,Udio主要由一批谷歌DeepMind前工程师打造。
具体来看,5位联创中有4位都来自谷歌DeepMind,分别是:
在DeepMind工作了5年多,走之前是一个30人团队(搞生成式AI的)的技术主管,现在是Udio的CEO。
来自俄罗斯,在DeepMind实习+全职工作了6年多,现在是Udio的研究科学家。
来自英国,在DeepMind实习+全职工作了5年多。
同样来自英国,在DeepMind担任了2两多研究科学家。
唯一一个非DeepMind前员工的是Andrew Sanchez,他是Udio的COO,毕业于牛津大学。
值得一提的是,谷歌DeepMind去年11月刚刚出过一个音乐生成模型Lyria。
而我们对比Lyria的贡献者名单,可以发现Udio4位联创的名字都赫然在列:
再加上Udio恰好也是去年11月成立,于是有网友“斗胆猜测”:
Udio就是从谷歌“出逃的Lyria”,是他们只花了3个月时间在自己的机器上重新训练出来的。
对此,有网友表示,如果真的是这样,谷歌是不是应该提起诉讼呢?
不过,我们很快看到有人在评论表示Udio和Lyria底层并不一样。
具体如何我们暂未可知。
可以确定的是,有着谷歌DeepMind“血缘”的Udio确实掀起了一场AI音乐生成的狂欢。
推特上,甚至由Grok发起了一场“AI音乐究竟是创意革命还是行业威胁?”的话题讨论。
感觉和当初AI绘画火起来如出一辙。
这样的Udio也自是被不少大佬寄予了厚望。
据了解,Udio目前完成的种子轮融资中,投资人包括ins的联创兼CTO Mike Krieger、谷歌Gemini负责人Oriol Vinyals,以及真的艺术家——美国说唱歌手will.i.am(推特粉丝1154万)等等。
你觉得Udio效果怎么样,与Suno相比更喜欢哪个?
友情链接:
https://www.udio.com/
参考链接:
https://twitter.com/udiomusic/status/1778045340978933989
https://twitter.com/DavidDingAI/status/1778559157127254027
https://twitter.com/futuristflower/status/1778379253513351193
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态