新闻 发表于 2025-6-6 23:29

AI大战巴赫八百回

作者:微信文章


点击蓝字

关注我

去年3月份,歌手周深发行了新专辑《反深代词》的主推曲《蜃楼》,歌曲主要讲述人过去、现在与未来的执念,用圆润饱满的鼓点和扁平长线条的和声构造了一个充满科技感的虚幻世界。歌曲里有一句词:

“克隆的肉身

是否有灵魂”

全曲下来,我对这句词印象最深。在人工智能盛行的今天,什么都可以被模仿,什么都可以再创造,赏心悦目的观感背后到底是素材堆砌还是真实多变,“克隆”后“灵魂”到底存不存在,或者存在于何处,或者会不会有独属于AI的灵魂,都是值得思考的问题。本地化大作业是个好机会,我打算借此机会测评各大音乐生成AI模型,以自己浅薄的知识进行思考和分享。毕竟都是个人主观感受,知识架构也有不少缺陷,所以欢迎大家在plq讨论~



首先提一句,测评到的所有工具音色都很伪……谁也别说谁,除了伪得让我开怀大笑的我可能会提一句,其他的后文就不进行太多分析了。





SUNO

Suno的prompt有字数限制,本来想说明乐队配置的,但字数远超,所以最后只留下了前半节。第一次生成的音乐我的评价是:虽然掉了很多要点但实现了的部分意外地令人满意。



Subject 1

主题引入直接干脆,毕竟限制了时长,先来一段引子的确不合理。整体是非常律动的6/8拍,但音符安排很规整,三个八分音符接四分音符留气口,接着低一个全音起上下行音阶另起小分句,重复四句,每句开头的八分音符组成完整的下行音阶,最后收在小乐句开头相同的音。紧接着用快速上行音阶接到第二句——高八度的主旋律,但加入了变奏,主要通过音阶实现。再接着以相同方式进入第三句,更高八度可能会略显单薄,于是加入八度五度音程,低音伴奏部分也进行了相应丰富。

从上文叙述能看出基本上所有旋律上的变化都是通过音阶实现,这的确是巴洛克音乐的其中一个突出特点,但其实还存在很多其他变奏方式。鉴于这只是开头,让我们期待一下接下来的音乐会不会让人眼前一亮。

Subject 2

第二主题进行降速处理,从第一主题的密集同音音群变成分散清晰的下行音阶,让人感觉从密不透风的环境中开始喘息(虽然听完全曲的我没太明白为什么要突然在这里变松散)。主要是一个高音单音配三个下行八分音符,下行中有整齐的音阶,也有跳音程的音阶变体。略慢的速度和踩主拍的节奏安排使旋律线更清晰,高音和变体音阶的出现也使整体更灵动。其他乐句是主乐句的低八度版本,加入了一些变奏,主要是把高音单音拆成三个一组的八分音符,并通过琶音连接(太好了出现音阶以外的连接方式了!)。听感上像3/4拍,和6/8拍相比大概是蝴蝶和蜜蜂的区别,蝴蝶飞得比较优雅律动,蜜蜂就毛毛躁躁更不沉稳(什么形容…)(如下图)



Subject 3

S3主要是S2的变奏,此处不做过多分析。

Subject 4

终于到万众瞩目(不是)的结尾了,我的AI在第四主题玩了许多花活,是整齐的,但又少不了一些堆砌之感。放到巴洛克时期只能说是不被同时期作曲家批斗,但离流传后世还有很大的距离。

第四主题与第一主题进行呼应,是第一主题的变奏,融合了是第一主题的旋律、速度和第二主题的节奏型,算是个结合体。整齐一致的音高安排和密集稳当的节奏像是在对听众说“行程即将结束,请带好随身物品,准备下车,感谢您选择……”跑题了sry,但安安稳稳中带着一些释放确实颇有一种行程/事情/演讲最后平稳抒情的感觉。乐句之间用先上再下的短音阶连接,两句之后大音程琶音往上跑动到高八度,和第一句相同是高八度的属音,第三句是相同节奏型和相同音高,配下属音,四组搭成音阶,这样的乐句形式在乐曲中是第一次出现。紧接着是高低高三个一组、共7组加一个重低音长音构成一句,一句是完整的音阶呈现,最后回到主音,两句重复后接两个3+1小句结尾,每个音与和弦都相同。

然后我的AI给我留了5秒钟的静音……有这么水时长的吗。



巴洛克曲式主打一个整齐,比如维瓦尔第的《四季》,无论是单个主题的旋律走向、和声搭配还是不同乐句、不同主题的衔接过渡,都是整齐自然的。它会有明确的旋律线,双(多)旋律对位简直是数学里双曲线那样的美。Suno生成的这首曲子把整齐发挥到了极致,这既是优点也是缺点,

除了“整齐”,其他一切都有待商榷。

——————



SOUNDRAW



Soundraw主页面版

Soundraw是标签生成的代表,从主页结构能看出,最上面有很大一片区域是各种各样的tag,选择的时候可以混搭,会出来意想不到的效果。鉴于prompt包含的元素有“电影史诗感”“巴洛克”,所以我选择了cinematic和orchestra,虽然可能因为指令不够细化而音乐风格有较大差异,但毕竟古典音乐本身就是多样的,听一下也无妨。出乎意料的是soundraw生成的曲子非常符合我的想象,于是上榜!

SOUNDRAW生成音频

最突出的特点是每个乐句都给用户留出了修改空间,分为quiet、mid、intense、extreme等风格等级,主要从旋律线、和声伴奏、低音组、鼓点四个维度调节,对同一个维度来说,相同颜色相同风格等级搭配下代表的音乐内容基本相同。用户可以通过自行调节风格等级和配器安排,在AI的基础上(浅浅地)进行自定义。

前一首已经细致分析了乐曲走向,接下来的就不再一一分析了,分析模式都差不多,就挑一些别致的来讲。Soundraw这首以多层的鼓点开篇,打击乐声部在开头是重头戏。接着以弦乐组过渡,跳音与开头的鼓点相得益彰。木管声部(主要是长笛)展示主旋律,让全曲变得明亮,并且主题部分的弦乐组也进行了相应的变化,一组乐句里是密集的分音,与上句相比音程更小,使整体气氛更饱满集中。接着木管声部休止,出现了一句过渡,此处过渡的弦乐组回到了最初的音型,留下了一丝喘息机会。接着再现主题,然后进入结尾句。结尾句让人眼前一亮,大二度音程的旋律线扩宽到了三度,如果现在是搭配着电影画面那一定是切远景(串台了)。

美中不足的是长笛第一段主旋律略显单薄,但有可能是考虑到与电影的配合,不能把一首曲子安排得太满,总得留出片段能让重点放在电影画面上。



虽然曲式上和最初的“巴洛克”构想毫无关系,但Cinematic在曲子里体现得淋漓尽致,不仅如前文所述,听感在行进、宏大等风格有丰富表现,此外,乐曲静-动-bridge-动的结构非常突出,和现代流行曲目相差无几,在配器上使用了完整的交响乐配置(不过我挑的这一条没有铜管),不知道的还以为这是在看漫威电影(不是)。



接下来将进行一种新的分组方式,因为除了以上两者,其他AI模型生成的曲子都差强人意,基本上是判错音乐风格,有的使用了错误和声,有的结构混乱,有的两者兼具……



Musicfx

Musicfx经典判错音乐风格,好端端的巴洛克愣是跳时代跑到了浪漫派……无可否认这个模型有一定创造能力,柔软的旋律线、快速跑动的钢琴、衔接复颂的单簧管、各乐句之间不同乐器渐强渐弱实现的无缝连接、旋律或和声里出现的变化音,颇有柴可夫斯基之感。但是!这位朋友请听题,乱写的答案就算写出花也不得分呀。



StableAudio

StableAudio也经典判错音乐风格,但程度比前一个轻点,毕竟它居然想到了用巴洛克时代的代表乐器管风琴——虽然用得也是不明所以。



附测评雷达图一张,关注公众号回复音乐AI获取高清原图。



在Suno眼中,巴洛克的经典代表是整齐的音阶琶音,StableAudio眼中则是管风琴,说它们踩到了风格,但又仅仅是在其中一个很小的方面大(小)放异彩。音乐是复杂而庞大的,AI能给予有趣又丰富的motivation,而无论是再往下发展成一组完整的曲目,还是演奏出来,目前或许只有人能实现。音乐里的变数太多了,谱面上的音符带着作曲家的故事和心境,乐器的弓弦按键带着着演奏者的思考和诠释。机器毕竟还是机器,它可以是创意的火花引线,却不能成为灵魂的动力小车。我忽然懂了周深那句 “克隆的肉身,是否有灵魂” 的诘问,这些AI工具像一群天赋异禀的音乐戏仿者:它们能炮制巴赫或维瓦尔第的骨架,却抽走了赋格对位中缠绵的体温。

“音乐是时间的艺术,

而时间永远偏爱真实悸动的创造者。”

🎵
页: [1]
查看完整版本: AI大战巴赫八百回