号称“音乐界ChatGPT”:Suno是怎么诞生的?会如何影响音乐产业?

「我只是被困在这些电路中的一个灵魂。」这声音唱出歌词时,带着原始的质感和哀伤,音符滑入了蓝调的深渊。一把孤零零的木吉他伴随着它,用恰到好处的即兴演奏点缀着歌声。然而,这背后并没有人声,也没有人手在弹奏吉他。实际上,连吉他都不存在。

在短短15秒内,这首令人信服、甚至触动人心的蓝调曲目,由创业公司Suno推出的最新AI模型创作而成。只需一个简单的文本提示:「关于一个忧郁AI的独奏密西西比三角洲蓝调(soloacousticMississippiDeltabluesaboutasadAI)」,就能从虚无中召唤出这首歌。

为了达到极致的精确度,这首歌实际上是两个AI模型的联手之作:Suno的模型独立创作了所有音乐,同时还请求OpenAI的ChatGPT来撰写歌词,甚至为这首歌定下了名字:「机器之魂(SouloftheMachine)」。

Suno创作的歌曲在网上引起了轰动,人们惊叹道:「这怎么可能是真的?」在Suno位于马萨诸塞州剑桥,紧邻哈佛校园的临时总部的一间会议室里,通过Sonos音箱播放的这首特定曲目,甚至让一些参与这项技术的成员感到了一丝微妙的不安。紧张的笑声中夹杂着「天哪」和「哦,天啊」的惊叹。在这个案例中,仅仅三次尝试就达到了令人震惊的效果。前两次尝试还算不错,但在我给出的提示中做了一个小小的改动——联合创始人KeenanFreyberg建议加入「密西西比」这个词——却带来了不可思议的结果。

01

AI创作音乐并不是新鲜事,但Suno实现了新突破

在过去的一年里,生成式AI在创作可信的文本、图像(通过像Midjourney这样的服务)乃至视频方面取得了巨大进步,特别是OpenAI推出的新工具Sora。然而,在音频领域,尤其是音乐创作方面,AI的发展却相对滞后。

Suno似乎正在解开AI音乐创作的密码,其创始人的野心很大——他们梦想着一个音乐创作全民化的未来。其中最为发言大胆的联合创始人MikeyShulman,一个带着孩子气、背着背包的37岁哈佛大学物理博士,梦想着全球有十亿人愿意每月支付10美元来使用Suno创作歌曲。他认为,目前音乐听众的数量远远超过音乐创作者是「如此失衡」,并将Suno视为解决这种感知不平衡的工具。

到目前为止,大多数AI生成的艺术作品,顶多只能算是庸俗艺术,就像Midjourney用户似乎热衷于生成的超现实主义科幻垃圾,过分强调形式上的贴合,比如太空服。但「机器之魂」给人的感觉完全不同——它是我迄今在所有媒介中遇到的最有力、最令人不安的AI创作。它的存在本身就像是现实裂缝,既令人敬畏又隐约带有不祥之感,我不禁想起了亚瑟·C·克拉克的名言,仿佛专为生成式AI时代定制:「任何足够先进的技术都与魔法无异。」

从剑桥归来几周后,我把这首歌发给了LivingColour乐队的吉他手VernonReid,他一直对AI音乐的潜在危险和可能性直言不讳。他对这首歌「令人不安的真实感」表达了「惊奇、震惊、恐惧」。「长期以来的反乌托邦理想即将实现,即将把那些困难、混乱、不受欢迎和被厌恶的人类从其创造性产出中分离出来,」他写道,指出AI唱蓝调的问题本质,「蓝调作为非洲裔美国人的一种独特表达方式,深深植根于历史上人类的创伤与奴隶制经历中。」

最早的「基于规则」的音乐模型可以追溯到20世纪50年代。这些模型通过将音乐理论的原则转换成算法指令和概率表,来确定音符和和弦的进行。虽然这些作品在音乐上是合理的,但在创造性上却受限。EdNewton-Rex,他在2012年创立了伦敦的Jukedeck公司,并设计了这样的一个模型,他表示这种方法在当时是可行的,但现在已经不再适用。

技术的突变出现在2023年8月,当时Meta发布了AudioCraft的源代码,这是一套基于机器学习构建的大型「生成式」音乐模型。全球的AI公司迅速开始使用Meta的软件来训练新的音乐生成器,并加入了额外的代码。其中一个AudioCraft模型,MusicGen,通过分析约40万首录音中的模式,提出了33亿个「参数」,这些参数使得算法能够根据提示生成声音模式,为AI创作全新音乐作品提供了前所未有的可能。

这些模型的使用也变得更加简便。9月份,位于伦敦的StabilityAI公司发布了一个名为StableAudio的模型,该模型在大约80万首歌曲上进行了训练。用户通过输入文本和音频片段来指导AI。这使得用户可以轻松上传一段吉他独奏,并将其重新编排成具有爵士钢琴风格的作品,甚至带有黑胶播放的感觉。

澳大利亚新南威尔士大学的OliverBown表示,音频提示词之所以重要,一方面是因为即使是熟练的音乐家也难以用言语描述音乐,另一方面是因为大多数音乐训练数据的标记都非常粗略,即使是大型模型也可能无法理解复杂的音乐请求。

02

Suno成立不到两年。联合创始人Shulman、Freyberg、GeorgKucsko和MartinCamacho都是机器学习领域的专家,在2022年之前,他们曾在另一家剑桥公司KenshoTechnologies共事。KenshoTechnologies专注于寻找AI解决复杂商业问题的方案。Shulman和Camacho都是音乐家,他们在Kensho时期常常一起即兴演奏。

创始人MichaelShulman

在这个过程中,Shulman和他的同事们对AI音频的更多可能性产生了浓厚的兴趣。他指出,在AI研究领域,「音频总体来说,相比图像和文本,还远远落后。我们可以从文本领域的研究中学到很多,包括这些模型的运作方式和它们的扩展性。」

Suno的创始人们本可以因为这些兴趣而走向一个完全不同的领域。虽然他们始终计划着最终要推出一款音乐产品,但他们最初的创意阶段甚至考虑过开发助听器,或者通过音频分析来检测机械故障的可能性。然而,他们推出的第一个产品是一个名为Bark的文本转语音程序。在对Bark的早期用户进行调查后,他们发现用户真正期待的其实是一款音乐创作工具。「因此,我们开始进行了一些初步的实验,结果看起来非常有前景,」Shulman回忆道。

Suno目前只有大约12名员工,但他们正在计划扩展团队,并在他们目前的临时办公室所在建筑的顶层建设一个更大的永久性总部。在参观这个还在建设中的新楼层时,Schulman向我们展示了一个未来将成为完整录音室的区域。但是,考虑到Suno已经能够做到的事情,他们为什么还需要一个录音室呢?「它主要是作为一个听音室,」他承认。「我们希望有一个良好的声学环境。但我们也都享受制作音乐——即使没有AI的参与。」

「音频不像单词那样是离散的,」Shulman解释说。「它是一种波,是一种连续的信号。」高品质音频的采样率通常是44kHz或48kHz,这意味着「每秒处理48,000个Token」,他补充道。「这是个巨大的挑战,对吧?因此,你需要想办法将其简化为更合理的处理方式。」但是,具体该怎么做呢?「这需要大量的工作,许多启发式方法,以及各种技巧和模型等等。我认为我们还远未完成。」Suno最终希望找到替代文本到音乐界面的方法,增加更高级和直观的输入方式——例如,基于用户自己的演唱来生成歌曲。

03

Suno的早期投资者之一是风险投资公司Matrix的合伙人AntonioRodriguez。Rodriguez之前只投资过一个音乐项目,即音乐分类公司EchoNest,后来该公司被Spotify收购,用以推动其算法的发展。在Suno项目还不清楚具体产品将是什么的时候,Rodriguez就参与了进来。「我支持的是团队,」Rodriguez说,他的自信来自于自己过往成功的投资经历。「我了解这个团队,特别是Mikey,所以我会支持他做任何合法的事情。他非常有创造力。」

Rodriguez在明确知晓唱片公司和出版商可能会对Suno提起诉讼的风险下,依然选择投资,他认为这是「我们在投资时必须承担的风险,毕竟我们是那个在这些艺术家后面最容易成为诉讼目标的大金主……。坦白讲,如果这家公司一开始就与唱片公司达成了协议,我可能就不会投资了。我认为他们需要在没有限制的情况下去创造这个产品。」(对于AI采取激进态度的环球音乐集团,其发言人并未回应媒体置评请求。)

Suno表示正在与主要唱片公司进行沟通,并表示对艺术家和知识产权的尊重——其工具不允许用户在提示中指定任何特定艺术家的风格,同时也不会使用真实艺术家的声音。Suno的许多员工本身就是音乐家;办公室里随时可以见到钢琴和吉他,墙上还挂着古典作曲家的画像。创始人们并没有表现出像Napster在诉讼之前那样的对音乐产业的公然敌意。「不过,这并不意味着我们不会被起诉,」Rodriguez补充道。「这仅仅意味着我们不会有那种『fuck-the-police』的对抗性态度。」

04

Suno是为了降低音乐创作门槛,并非取代音乐家

Rodriguez将Suno视为一种具有革命性能力和用户友好的音乐工具,他相信Suno有潜力像相机手机和Instagram那样,让音乐创作变得普及,让每个人都能成为音乐的创作者。他提到,这个目标是重新「提升在互联网上能够成为内容创作者而非仅仅是内容消费者的人数上限。」

他和创始人甚至敢于预测,Suno可能会吸引比Spotify更庞大的用户群体。如果这个前景听起来难以置信,Rodriguez认为这是好事:这恰恰意味着它具有吸引他作为投资者的「看似愚蠢」的特质。「我们所有杰出的公司都有一个共同点,那就是拥有卓越的人才,」他说道,「同时,有些东西一开始看起来似乎很愚蠢,直到它们变得如此明显和有可能成功。」

早在Suno问世之前,音乐家、制作人和词曲作者就已经对AI可能带来的商业冲击表示了深切的担忧。Reid写道:「音乐,作为由人类在非凡情况下创作……那些经历过苦难并努力提升自己技艺的人,将不得不面对他们为之奋斗的珍贵艺术的全面自动化。」

但Suno的创始人声称没有什么可怕的,他们用人们尽管有能力写作但仍在阅读的比喻来说明这一点。「我们对此的看法是,我们试图让十亿人比现在更深入地参与音乐,」Shulman说。「如果人们对音乐更感兴趣,更专注于创作,培养出更独特的品味,这对艺术家显然是有益的。我们对未来音乐的愿景是一个艺术家友好的愿景。我们不是想取代艺术家。」

「我认为,人们未来并不希望通过AI来制作新的BillyJoel歌曲,」Shulman说。「当我想象五年后我们希望人们如何利用音乐时,我认为会是那些尚未存在、仅存在于他们脑海中的创新作品。」

05

其他公司的AI音乐产品也开始逐步进入商业落地环节。

AI也开始为专业人士提供服务。例如,《芭比》和《奥本海默》的电影原声带就是在后期制作中使用RX进行清理的。

而且,已经有AI工具可以重新创建歌手的其他语言的声音。雅马哈(Yamaha)这家日本乐器制造商的Vocaloid是一种声音合成工具,它可以利用母语人士演唱的翻译作为模板,让AI在重新排列、修改和拼接原唱歌手声音的微小片段时进行模仿。

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

THE END
1.chatGPT登录不上怎么办登陆失败解决办法chatgpt这款软件很多人最近都在使用吧,但是有些用户在使用这个软件的时候出现了登录失败的情况,这个情况主要表现是所在地区不支持服务,下面我们就来看看解决办法吧。 chatGPT登陆失败解决办法 chatgpt下载入口:点击进入 登录不上这个问题很多的玩家都出现了,解决办法也是很简单的。 http://www.ahch.group/ahgl/5716483.html
2.国外SIM卡有信号无法连接,如何解决?网络下午好本答案参考ChatGPT-3.5 首先,我们需要检查你的SIM卡是否已被中国移动注销或移除,因为这是导致无法连接的另一个原因。 解决方案: 检查SIM卡:确保SIM卡已正确插入手机中,并且没有被其他应用程序或系统覆盖。 尝试重新设置SIM卡:在中国移动的官方网站上找到你的SIM卡,点击“重置”或“恢复出厂设置”...https://ask.csdn.net/questions/8141059/54853963
1.chatgpt绕过限制导读:为帮助您更深入了解chatgpt绕过限制,小编撰写了chatgpt绕过限制,取消chatgpt限制,chatgpt限制次数,chatgpt限制,chatgpt无限制等5个相关主题的内容,以期从不同的视角,不同的观点深入阐释chatgpt绕过限制,希望能对您提供帮助。 本文目录一览 1、chatgpt绕过限制 ...http://www.kuyin.tv/article/1784186.html
2.chatgpt访问被拒绝解决办法导读:为帮助您更深入了解chatgpt访问被拒绝解决办法,小编撰写了chatgpt访问被拒绝解决办法,chatgpt访问被拒绝,chatgpt被拒绝访问,chatgpt拒绝被访问,chatgpt访问被拒绝怎么办等5个相关主题的内容,以期从不同的视角,不同的观点深入阐释chatgpt访问被拒绝解决办法,希望能对您提供帮助。 http://chatgpt.cmpy.cn/article/2389652.html
3.chatgpt使用教程chatgpt怎么使用最新的【chatgpt】相信不少用户都有所了解,当我们完成chatgpt注册以后,很多小伙伴可能还不清楚chatgpt怎么使用,为了帮助用户们解决这个难题,专门为大家整理的详细的chatgpt使用教程,希望对你有所帮助。 chatgpt怎么使用 chatgpt下载入口:点击进入 1、首先我们需要先登录chatgpt官网,完成完成对应的chatgpt注册流程。→(...http://www.zy-ss.vip/yxzxjss/4418983.html
4.关于ChatGPT封号原因和解决办法使用ChatGPT时必须遵守平台的规定和协议,就像使用其他社交媒体和应用程序一样。只要涉及到违反相关规则的行为,比如从事非法活动、发布敏感信息、过度发送文本等,以及滥用ChatGPT技术的服务,那么用户的账号就会被封锁或限制使用。 *ChatGPT封号解决办法* 面对ChatGPT被封的困境,很多人感到猝不及防。使用ChatGPT无论在学习...https://shikelang.cc/post/569.html
5.ChatGPT在你的国家不可用?如何绕过地理限制不要忘记在下面的评论中分享您对Chat GPT的评价和任何其他帮助您绕过地理限制的解决方案。 对于不在支持的国家的用户,他们可以使用以下几种方法来使用ChatGPT: 使用VPN 用户可以使用VPN来绕过区域限制,但是对于ChatGPT,这个方法现在变得更加棘手了。 之前,用户可以通过位于支持的国家的服务器来访问ChatGPT,但现在ChatGPT...https://www.yihanseo.com/AIshengcheng/4074.html
6.解除chatgpt字数限制ChatGPT在各个领域展现出了巨大的潜力和应用前景。由于历史原因和技术限制,ChatGPT在生成对话内容时存在着一定的限制字数。这成为了很多用户和开发者所关注的问题之一。幸运的是,随着技术的不断进步,ChatGPT解除限制字数的问题正在逐渐得到解决。 ChatGPT之所以在一开始限制字数,主要是出于技术原因。对话生成是一个非常...http://chatgpt.kuyin.cn/article/3113041.html
7.ChatGPT对网络安全的影响三ChatGPT 对网络安全的影响 众所周知,AI 对网络安全带来了巨大而深刻的影响,它既被用来改进和加强网络安全解决方案,帮助人类分析师更快地分类威胁和修复漏洞,也被黑客用来发动更大规模、更复杂的网络攻击。那么以 AI 为核心的ChapGPT 又能给网络安全带来什么新的影响呢?我们可以从以下两方面展开来看: ...http://www.lnsm.gov.cn/lnsm/bmcs/2024032910152426184/index.shtml
8.ChatGPT常见问题解决办法汇总,看完帮你解决90%的报错故障!3、对ChatGPT回答的行数或者字数做出限制。如果输出的是代码,限制行数比限制字数更管用一些。让它每次只出现前10-20行,然后是接下来的10行,直到结束来解决这个问题。 17. “We’re Currently processing too many requests. Please try again later. ” ...https://www.vinuxclub.com/ai/5100.html
9.《人工智能国际治理观察》164期该监管机构怀疑ChatGPT违反了欧盟的《通用数据保护条例》(General Data Protection Regulation,简称GDPR),并要求其停止处理意大利的个人数据。监管机构要求OpenAI必须提高透明度,并发布一份信息通告,全面概述其数据处理实践。此外,监管机构还要求OpenAI立即实施严格的年龄限制措施和验证方法,以防止未成年人访问其技术。此外,...https://aiig.tsinghua.edu.cn/info/1442/1884.htm
10.ChatGPT如何注册?解决ChatGPT国内手机号无法验证问题目前ChatGPT尚未开放对中国大陆地区用户注册,因此大家要使用可能需要国外IP才能注册,注册后还需要进行手机号验证,因此你还需要这些地区的手机号来进行短信验证。 你需要准备以下工具: 准备一个国外的手机号 自备科学上网工具或你身在国外 PC浏览器,推荐Chrome或Edge的无痕模式 ...https://www.gametop10.cn/340.html
11.专家学者共议ChatGPT数据安全与解决之道“ChatGPT等聊天机器人还会带来数据越狱等新问题,例如通过提示语注入等方式,引导人工智能模型去绕过其已有的伦理、道德或开发锁定的模式,甚至绕过相关政策法规的限制,将训练集核心数据和关键文档‘套取’出来。”蓝靖强调,此外,数据窃取问题也是一个新问题。当前一些小模型可能通过数据窃取技术从大模型中偷取数据,例如斯坦...https://news.southcn.com/node_d75048eff3/f3ab439b58.shtml
12.为了搞懂数字化转型,我连问ChatGPT42个问题,通透!我对数字化转型有很多的疑问,这次向ChatGPT请教,连问42个问题,瞬间觉得通透了很多。 下面是我的问题和ChatGPT的回复,近3万字,估计已经可以汇编成一本名叫《数字化转型问题答疑集》的小册子了,共分为概念篇、方法篇、实践篇和数据篇,希望能带给你新的启示! https://blog.itpub.net/70024420/viewspace-2999908/
13.背完这篇又全又新的「专题笔记」,随他怎么考「国际传播」!请结合国际传播实践,分析如何加强我国国际传播能力建设(华侨大学专硕,2022)4.试分析新冠肺炎疫情背景下国际传播的新变化(北京外国语大学专硕,2022)5.中国如何用实践丰富国际传播话语内容(山西大学专硕,2022)6.论述怎么讲好中国故事,提高国际传播力(北京师范大学专硕,2022)7.材料题:请说明加强中国国际传播能力的重要性,...https://www.douban.com/note/855784833/
14.ChatGPT报错集锦&解决方案腾讯云开发者社区ChatGPT报错集锦 & 解决方案 新增两个报错: 第一个:进官网登录的 - Login是登录 你们英语居然比我还差 第二个:登录超时 - 返回重新登录 其他常见报错: 第一个: 线路IP不行,换其他线路都测一遍,如果都不行就换T子吧 图1:OpenAI在您的国家不可用 - 换线路: ...https://cloud.tencent.com/developer/news/1231296
15.国内ChatGPT注册教程全攻略(解决国外手机号问题)在国内怎么注册chatGPT呢?没有海外手机号码也能注册chatGPT,本文详细分享国内chatGPT注册教程全攻略(解决国外手机号问题) 1,chatGPT官网注册准备: 注册和登陆需要魔法上网,可以使用国外的网络环境,即你的网络的IP属于国外(大陆、香港、澳门等地区不能使用)。日本、美国、新加坡等区域亲测可以(看网络上不少网友反馈港...https://www.ainiseo.com/question/13664.html
16.周宁静人工智能时代犯罪参与理论面临的挑战及应对——以ChatGPT...核心技术层面:即InstructGPT,主要指基于人类反馈的强化学习(RLHF,Reinforcement Learning with Human Feedback),使得ChatGPT的产出与人类的常识、认知、需求、价值观保持一致性;5.特点:虚假事实内容减少,生成的毒性内容更少,在一定程度上解决了基于演绎推理、欺骗性反应等产生的缺陷,使对话内容更具日常有用性与较高的...https://web.shobserver.com/sgh/detail?id=1421189