Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

词曲创作只需几秒,「AI作曲家」Suno引爆音乐圈,第一手体验和攻略来了

有了 Suno 这个「作曲助手」,人人都可以创建自己想听的歌曲。

自从 ChatGPT 在 2022 年底爆火以来,我们已经看到 AI 生成的诸多艺术创作成果:ChatGPT 写出过情节引人入胜的网文,Midjourney 生成过肉眼难辨的人像。

最近,AI 搞创作的风终于吹到了「歌曲生成」领域,一款名为 Suno 的 AI 驱动的歌曲生成器,在社区内开始了病毒式传播。

其实此前陆续推出的 AI 音乐生成器并不少,比如 Adobe 的 Project Music GenAI , YouTube 的 Dream Track 和 Voicify AI(现在的 Jammable)。

但只有 Suno 被称为「音乐界的 ChatGPT」,其与众不同之处在于,它可以根据简单的提示创建从歌词到人声和配器的所有内容。

你甚至可以引导它准确选择想要的流派,从三角洲蓝调(Delta Blues)到电子寒潮,还可以变换方言:

听完上面这首歌曲,你可能会惊讶,AI 竟然已经能够操作如此复杂的歌曲制作了吗?

这是 Suno 团队近日更新的 V3 模型 —— 首次能够生成广播质量的音乐。

图片

目前,Suno V3 在以下几个方面具有显著优势:

  • 更好的音频质量;

  • 更多样化的风格和流派;

  • 更强的提示遵从性,包括更少的幻觉和更优雅的结局。

通过 Suno V3,用户现在可以使用免费账户创建两分钟时长的完整歌曲,具体效果取决于自己选择的流派。

图片

                             Suno V3 的音乐排行榜

有人大胆展望:「这是下一个 AI 独角兽。客观事实是其惊人的迭代速度、声音和语音质量,以及我自己越来越多地使用 Suno 而不是 Spotify 的习惯。」

图片

还有一些用户感觉到,Suno 正在成为与网易云音乐等软件同样受欢迎的播放器选择:

图片

我们也前去试听了一下,完整歌词如下:

图片

Suno 团队还表示,V4 已经在开发之中,并将推出一些令人兴奋的新功能。

值得注意的是,Suno 并未公布过任何训练细节,

图片

对于文本,LLM 通常通过预测给定序列中最有可能出现的下一个 token 来工作,但这对于音乐生成来说更具挑战性。所以,Suno 应该还使用了扩散模型。Suno 首席执行官兼联合创始人 Mikey Shulman 在采访中表示:「并非所有音频都是通过 Transformer 完成的,有很多音频是通过扩散完成的,这两种方法各有利弊。」

网友开始放飞自我

这两天,网友们的二创很多都是围绕周杰伦的经典歌曲。比如下面这首《东风破》:

                             https://x.com/hylarucoder/status/1771380757161722341?s=20

不过听多了之后,会感觉到缺乏一点「灵魂」:

图片

但网友的二创思路永远不会有瓶颈,比如制作一首粤语版《七里香》,方法其实也不复杂,博主 @Gorden Sun 的经验是:

1、把歌词扔给 ChatGPT,让它给出粤语拼音标注;

2、贴到 Suno 的歌词里,然后在 style 写上「Cantonese song」。

还有一种打开方式是,将某一首歌曲转化为全新的节奏、加入更丰富的音效,就像这首 AI Remix 版本的《以父之名》:

图片

目前,Suno 对公众开放了免费版本。帐户存在一些限制,比如每天最多可获得 50 个积分,足以购买 10 首歌曲。用户也不能通过免费帐户将这些歌曲用于商业用途,因此它非常适合普通人尝新或创作歌曲。

如果购买了 Pro 计划(每月 8 美元),用户就可以获得足够的积分每天生成 500 首歌曲,还可以将这些歌曲用于商业用途,例如传到 YouTube 上,甚至将它们上传到 Spotify 或 Apple Music。 

但随之而来的,还有人们对版权问题的担忧。当用户将其用于短视频等背景音乐的制作时,我们是否真的不需要担心侵权呢?

图片

或许出于这方面的考虑,Suno 才不允许用户以特定艺术家的风格生成歌曲或使用真正艺术家的声音。

试玩下来:歌词、曲风、旋律都不错

机器之心输入了一些歌词提示,看一看 Suno V3 有没有这么厉害。这里都是用的标准设置,没有进行自定义模式。

首先输入了第一段简单的「a beautiful girl playing with a lovely dog」(一个漂亮的女孩在与一只可靠的小狗玩耍),结果出来,Suno V3 生成了四个版本的歌曲,这里选取第二个版本「Sunshine and Paws」,欢乐的流行曲风。

图片

歌词如下:

She's walking down the street, with a smile so sweet Her eyes shining bright like the summer heat A lovey dog by her side, wagging its tail Together they stroll, without a care, without fail.

She throws a ball, the pup starts to play Chasing it with joy, like there's no end to the day The sun glistens on her radiant face As they run and laugh in their happy embrace

Oh, she's a sunbeam with paws Bringing light to this world, she's breaking down walls With every wag of its tail, you can hear love's song Oh, she's a beautiful girl playing with a lovey dog.

歌曲如下:

另外一个版本「Sunshine Smile and Waggin' Tails」还是流行曲风,它的歌词如下:

Sippin' on my coffee, I was takin' a stroll When I saw her walkin' with a heart full of gold (ooh-yeah) Her smile was so bright, it lit up the day And the pup by her side, had my heart flyin' away.

She threw a frisbee, and that dog caught the air They played and they laughed, it was a picture so rare (ooh-yeah) Her love for that pup, it had no end And in that moment, I found a true friend.

Sunshine smile and waggin' tails She's got a way about her, can't help but sail Her laughter so contagious, it brightens the sun With her and her dog, life's just begun (oh-oh-oh).

歌曲如下:

接着输入第二段歌词提示「an old woman is walking by the West Lake holding an umbrella, looking at the setting sun」(一位老妇人撑伞漫步西湖边,看夕阳西下),这次是民谣曲风,生成的歌词和旋律意境十足,对于音乐门外汉来说非常抓耳。

图片

歌词如下:

In the park, by the lake, she makes her way An old woman, with wisdom etched upon her face Umbrella in hand, she walks this path alone Finding solace in the sunset's golden glow.

Every step, a memory, a life well-lived Through joy and sorrow, she still finds strength to give Years have passed, like ripples on the water's edge But her spirit shines, unbroken, undimmed, and pledged.

Underneath the evening sky, so peaceful and serene She whispers secrets to the winds, a story yet unseen With every passing day, her heart is filled with grace And in the sunset's fade, she finds her inner space.

歌曲如下:

另一个版本是「soft sentimental pop」曲风,生成的歌词如下:

In the golden hour, by the West Lake she walks (she walks) Umbrella in hand, her heart lighter than a spark (a spark) Every step she takes, memories flooding her mind (her mind) The setting sun reflects the stories she left behind

With every passing moment, a lifetime she recalls (she recalls) Loves she lost, dreams she chased, and the ones that made her fall (made her fall) But she's not one for regrets, no, she's lived a life so true (so true) As the sun bids farewell, she finds peace in her review

Oh, she's a reflection of the setting sun A portrait of beauty, wisdom, and grace With an umbrella and heart full of dreams undone (undone) She walks by the West Lake, a smile on her face (a smile on her face)

歌曲如下:

一番体验下来,我们发现 Suno V3 的歌词拓展能力很强,曲风也多变,但歌曲旋律似乎有些千篇一律。

一位玩乐队的同事(莱维飞行吉他手)对 Suno 生成的歌曲给出了以下评价:

我觉得 suno 对于不同音乐风格识别、理解、生成还是比较准确的,器乐方面细节还是蛮多的。对于人声、以及旋律的处理也蛮好的,只是有些细节的质量方面,可能比较类似抽卡,比如有些人声的韵脚可能不太合适,但无伤大雅,毕竟有的歌手唱歌还有方言味。我也相信技术很快可以解决。

团队简介

目前,Suno 团队只有 12 个人,其中 Mikey Shulman、Martin Camacho、Georg Kucsko 和 Keenan Freyberg 为四位联合创始人。

Mikey Shulman

图片

他为 Suno 的联合创始人,此前是 Kensho 机器学习主管,这是一个为机构投资者构建金融分析和机器学习的平台。他还是 MIT 斯隆管理学院的讲师,教授课程为金融机器学习自然语言处理

他本科毕业于哥伦比亚大学应用物理专业、博士毕业于哈佛大学物理学专业,曾经研究过物理和量子计算

Martin Camacho

图片

他为 Suno 联合创始人,此前曾担任 Kensho 的首席架构师。他本科在哈佛大学学习计算机科学与数学,并且 18 岁就毕业了。

Georg Kucsko

图片

他为 Suno 联合创始人,此前为 Kensho 机器学习研发主管。他感兴趣的研究领域包括自然语言处理语音识别和非结构化数据分析

他本硕毕业于瑞士苏黎世联邦理工学院物理专业,并取得了哈佛大学物理学博士学位,主要研究钻石色心在量子计算和生物传感中的应用。

Keenan Freyberg

图片

他为 Suno 联合创始人,此前曾担任 Kensho 战略推广主管。他本科毕业于美国乔治华盛顿大学。

最后,推荐一些 Suno 的使用攻略:

  • 如何使用 Suno AI 制作完整歌曲:https://youtu.be/mZoytG2FGZI

  • 如何用 replay 换成别的人声:https://youtu.be/Eh-vKLtYZHA

  • Suno AI 高级生成式 AI 音乐提示技巧:https://youtu.be/XINZ-PkLXzw

  • 音乐艺术家是如何使用 Suno:https://youtu.be/JCBc3-SNNUY

  • SunoAI 音乐新手指南 by AIGCxChina:https://shimo.im/docs/vVqRMPBgYycW8x3y/read

  • SunoV3 教程及案例收集:https://waytoagi.feishu.cn/wiki/KA1GwEi8yifRmMkOM9icr8EjnAd

感兴趣的读者,可以注册 Suno 账号尝试一番~

参考链接:

https://x.com/FinanceYF5/status/1771748233980600507?s=20

https://www.techradar.com/computing/artificial-intelligence/what-is-suno-ai

产业AI 音乐生成器Suno
相关数据
网易机构

网易成立于1997年6月24日,是中国领先的互联网技术公司,为用户提供免费邮箱、游戏、搜索引擎服务,开设新闻、娱乐、体育等30多个内容频道,及博客、视频、论坛等互动交流,网聚人的力量。

https://www.163.com/
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

结构化数据分析技术

结构化数据分析是结构化数据的统计数据分析。 以诸如多选问卷之类的先验结构的形式出现,或者在需要精确或近似地搜索适合给定数据的结构的情况下出现。 这种结构可用于进行比较、预测、操作等。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
量子计算技术

量子计算结合了过去半个世纪以来两个最大的技术变革:信息技术和量子力学。如果我们使用量子力学的规则替换二进制逻辑来计算,某些难以攻克的计算任务将得到解决。追求通用量子计算机的一个重要目标是确定当前经典计算机无法承载的最小复杂度的计算任务。该交叉点被称为「量子霸权」边界,是在通向更强大和有用的计算技术的关键一步。

暂无评论
暂无评论~