你有多久没试过在用 AI 写歌的时候又唱又跳了?——没有人在用 AI 写歌的时候又唱又跳!
不,有的老师,有的。

这是 YouTube 上的一位音乐博主,本想用音乐生成软件做一些糟糕的 AI 音乐,取笑一下人工智能,却意外得到了「味挺正」的日本金属摇滚,一下子就在 TikTok 上迅速爆红。
「意外」是因为,他给的不是 prompt,也不是参考乐曲,而是一串他的……咆哮😅

Suno 你被绑架了就眨眨眼
事情还要从这个音乐博主想挑战一下,看看现在的 AI 音乐生成工具,都到了什么程度——当然,有点不怀好意。
他测试的工具包括 Suno,Mureka,ElevenLabs,Udio 等等比较流行的生成式音乐工具,测试方式主打一个狂野。
比如像上面的,对着电脑咆哮。还有,学小野洋子一样大吼大叫、

这是小野洋子是为了自己的 90 岁生日而创作的「行为艺术」,毫无意义,只是在吼出声音而已。不过 AI 不会标题,统统照单全收,认认真真优化歌词,配上旋律。
你别说,都还不错。
 
这个《My Name is Jeff》的前奏着实是不错,考虑到在这首歌的 prompting 环节,他强行塞了一大堆风格描述词,堪称大乱炖。还有直接跟随系统自动词,跑出来的歌来了很有瑞典乐队 Meshuggah 风格的摇滚乐——AI 的数据库深不可测,这也太偏门了,把只知道流行乐的人听得一愣一愣的。
最惊人的要数后面,博主完全胡言乱语,AI 呢,交出来了一首叫做《Isugaku:Never Say Goodbye 》日式重金属:他的乱吼乱叫,被 AI 识别成了日语,所以匹配了这样一个风格。你别说,融合得还挺像回事。
 
这就是 AI 生成音乐的要义所在:人想要学习音乐,理解乐理,需要长时间的学习和积累,听大量的音乐。AI 也需要学习,不过学习的是音乐作品里的内在数据特征,包括但不限于:和弦旋律,节奏,结构形式。
恰好,流行乐非常依赖一些常见和弦,高度的重复性和可预测性,使得 AI 在学习这些核心套路时,能很快地找到规律,并生成听起来有模有样、符合大众口味的音乐。
抽象,但不够人类抽象
但是,这就叫有创造力吗?
有一点,但不多。在真正的创造力面前,AI,不值一提。
比如今年网络第一爆梗「技能五子棋」,这首歌,开始于跟上面博主差不多的尝试:看看 AI 能写个啥歌。

谁能想到,成就了这个秋天最洗脑的神曲——你有多久没有在下五子棋的时候又唱又跳了?
「技能五」张兴朝直接翻明牌说这是 AI 写的,观众也感觉到了这是 AI 写的:七拐八绕的调,放在一起还怪洗脑的。
有一说一,这首歌可能是有 AI 的功劳,但一定不会完全靠 AI 的功能。我试图用 Suno(技能五老师同款)复现这支神曲,发现完全不像下五子棋那样简单啊!
首先,我没有什么头绪,只能是用最普通的 prompt,在 Simple create 模式里,让它写一首歌——一定会很无聊,我准备好了。

AI 不语,只是一昧地生成,跑出了两套歌词、共四版编曲,下面是其中一首👇🏻

怎么说呢,好无趣,好无聊。一首歌里,歌词的重要性不言而喻。而对于《技能五子棋》这首歌,歌词更是占了半壁江山。AI 生成的两套歌词,没什么大问题,圆也圆起来的,但也毫无趣味。

没办法,只能用原作了,一个字都不能少。
风格方面我没有规定具体的曲风,只是说要一个轻松有趣的节奏。我也不觉得模型理解了这个歌词,太抽象了。不过还是能抓住中间的亮点,比如「要爆了」这个切分点,或者是把这三个字的存在感加强加重。

后来我又随机跑了几个版本,都不太得劲,很奇怪。难道不理解这个歌词就不能复现了吗?这么抽象的歌词我也很难跟模型解释啊!

想要解决问题,还是得回归核心:AI 最擅长的是特征识别,而那几个流行乐和弦实在是太简单了,有些甚至过于芭乐,尤其是在不给它具体风格指示的情况下,所以不管怎么跑,都不得劲,不能和「技能五子棋」的歌词,共同制造出反差感!
于是,在把原版视频快要盘包浆了之后,我意识到当中的音乐性:这首歌的音乐用了一种类似于广播体操的乐感,规整,节奏明确,带有动感。
好的,Suno 支持本地音乐上传采样,于是我专门去翻了第三套广播体操的音乐,让 AI 这次一定要好好学习一下。

在 custom 模式里,还可以选择 weirdness 和 style influence,可惜是付费功能。这次就只能是让广播体操作为一般性的灵感来源了。

这回好一点吗?好一点。模型识别第三套广播体操是流行+爵士的风格,于是这次生成的都是非常欢快、节奏型自由到散漫的音乐,意外地和「技能五子棋」有些合拍。

但还是差点意思,于是我把整个风格描述完全删空,又试了一遍。AI 不语,只是一昧生成,四支成品,干脆给了四种不同的风格。不只有抒情、快歌,甚至还有民乐风格版本……

Suno:我真的没空陪你闹了。
十几个版本下来,没有一个可以和技能五老师的才华相匹敌。就这,还是在沿用了原版歌词的情况下。AI 你不中啊!
「技能五子棋」成功的喜剧效果,归根到底就是 AI 的反面。AI 统计音乐的特征,学习特征,它给出的这些音乐,在乐理上都是妥帖的,听感上都是契合当下流行的——然而没有一个能做到像有原版的记忆点。
奇了怪了,原版不也是 AI 写的吗?
我们至今不知道在原版的创作过程中,AI 到底有多大功劳。但是这一次复现让我相信,即便有功劳,也不会大于创作者本身的才华。
文章来自于微信公众号 “APPSO”,作者 “APPSO”
 
                            
                                 
                            
                                 
                     
                     
                     
                     
                     
                     
                    