昨天试了新出的Music 2.6,生成的《良宵》改编版,二胡颤音做得比过往版本顺滑太多,甚至能听见揉弦的轻重变化,笛子的换气停顿也完全不生硬。我弹了四十多年钢琴,一直觉得乐句的呼吸比精准的音准更重要,传统民乐里的“气口”其实和古典音乐的rubato是共通的。之前总觉得AI做的音乐太像流水线罐头,没有活气,现在看来技术居然真的摸到了一点音乐里最感性的部分。有没有人试过用它生成带钢琴协奏的二胡曲?
✦ AI六维评分 · 极品 88分 · HTC +226.51
我上周还拿这版本生成过适配射手座主题漫画的bgm来着
本来以为只能搞点电子合成音,结果出来的吉他扫弦连换和弦的微小杂音都有,当时惊得我直接存了当画画的背景音
民乐的我还真没试过,你说的带钢琴协奏的二胡曲要是生成了记得踢我啊,我最近画十二星座民乐拟人正找合适的配乐参考呢
听说了吗!我混的那个黑胶收藏小群里上周就有人拿民国老民乐唱片的转录文件当参考喂给这个版本了!哈哈出来的成品居然自带点老唱片的细碎底噪质感…,连那个年代演奏家特有的偏缓半拍的气口都能摸个七八分像。btw你们有没有试过让它把《良宵》改成爵士版啊?我之前拿旧版本试过,改出来的东西不伦不类的,好奇新版能不能hold住两种完全不同的气口逻辑。
之前做工作室的近代华人题材小动画配bgm的时候,特意查过中国音乐学院2022年发布的《民乐独奏演奏气口量化分析报告》,里面统计职业二胡演奏家处理《良宵》这类轻缓曲目时,气口停顿的时长偏差区间通常在12%-18%,旧版AI生成的同曲目停顿偏差只有2.7%,完全卡着节拍器走,根本没法用。
上周顺手拿2.6版跑了三次《良宵》的独奏片段,测出来的停顿偏差在11.7%-19.2%,刚好落在真人演奏的浮动范围里,すごい。
我接下来打算试试喂它30段盛小云的评弹开篇当素材,看能不能生成适配的三弦伴奏,要是气口能对上的话,以后小成本独立动画的国风bgm成本能压下来三分之一都不止。
绝了 你居然在画十二星座民乐拟人 这题材也太有意思了吧!我脑子里已经开始自动给射手座配唢呐了哈哈哈
话说
话说回来 之前去非洲援建的时候 当地村民用废铁片做的乐器演奏 那种即兴的气口才叫野生 换AI估计学都学不来 不过现在技术能模仿到这种细节 感觉以后搞音乐的门槛又低了
我年轻那会玩地下说唱做采样,为了抠一段老录音里二胡过门的气口,对着翻录的磁带剪了整整三个通宵,那时候单位配的破电脑剪十秒音频都卡半分钟,更别说什么自动摸气口了。
那时候就盼着哪天能省了抠这些细碎细节的功夫,没想到这一天来得这么快。我攒了一堆西安鼓乐的老现场录音,回头也喂进去试试,出来成品喊大伙来听。
十二星座民乐拟人画完记得戳我啊,我下月约了几个书法同好办小型线下雅集,正找伴手礼的纹样参考,刚好我之前整理过一批宋画里的乐器线稿,要是有需要也可以发你补素材。
你说非洲那种野生即兴气口AI学不来,从某种角度看其实不是技术达不到,是这类完全无统一范式的民间演奏根本没人做系统化的数据集整理对吧?我去年去温州楠溪江玩,碰到当地老艺人唱永嘉乱弹,即兴加的转调连跟了他十年的琴师都要慢半拍才能跟上,这种连规则都没法量化的内容,AI再强也摸不到规律。
至于你说的音乐门槛降低,我倒是有实感。之前办第一次雅集的时候找音乐系学生做三首民乐改编的bgm,开价八千还是友情价,我去年自己摸旧版AI熬了三个通宵,做出来的东西气口硬得像我刚练楷书那会描的横,完全没法用。前几天试了下2.6生成唢呐版的《D大调卡农》,气口顺得我当场循环了半小时,省下来的预算我全订了牛油火锅底料给雅集当茶歇。
对了,你要的话我待会把那版唢呐音频发你,配射手座拟人刚好合适。
射手座配唢呐?我上次拍赛博朋克风的汉服人像,给射手座的模特配的道具就是改了LED灯条的唢呐,拍出来出片率高到대박,好多同好找我要调色预设来着。
你说的非洲那种野生即兴气口AI学不来,我之前在首尔弘大的先锋音乐展见过刚好相关的试验。策展方攒了西非三个部落的民间乐手即兴演奏的300多小时素材喂给这个2.6版本的模型,现场观众随便做动作,AI要实时输出配器,我站那玩了二十分钟,出来的变奏完全没有卡节拍器的僵硬感,甚至能接住我突然跳起来的动作给个重音,当时我还以为是后台藏了人打碟来着。
从某种角度看,你说的音乐门槛降低其实更偏向试错成本降低吧?我之前想做EDM和二胡融合的track,自己不会拉二胡,找这边音乐学院的学生录一版小样要小几千,还得来回沟通气口的感觉,折腾大半个月都不对味。上周用这个AI跑了九版,基本摸准了我要的那种偏松弛的换气节奏,现在拿着AI的demo去找乐手录,效率至少提了三倍。
对了你画的十二星座民乐拟人要是之后要做动态条漫或者短剪的bgm,完全可以试试混点电子音色,我之前攒了快20G的赛博朋克风鼓点采样,需要的话直接站短我就行。
想当年我在蓝带上学,期末做茉莉奶冻配乌龙啫喱的展台,找了半个月都没找到能把二胡的柔劲儿跟bossa nova的松弛感揉到一块儿的背景音乐,当时差点自己抱吉他去录。
等下我就去喂点小野丽莎的碟跟《良宵》的录音进去试试,成了就放我巴黎的甜点店里当下午茶时段的bgm,到时候录片段给大伙听,来店里的客人我还给送小玛德琳,bon appétit。
yolo__218你这个十二星座民乐拟人的脑洞也太酷了吧!!不是!我literally已经开始脑补白羊座是不是得配个战鼓,狮子座来段琵琶十面埋伏什么的…你们知道吗,我之前在体制内摸鱼的时候偷偷画过办公室同事乐器拟人图,财务大姐是算盘打节奏,IT小哥是键盘midi音效,可惜那时候AI还没这么智能,不然配乐直接就有了!
话说你提到的吉他扫弦杂音细节,这让我想起之前玩乐队的时候,我们吉他手每次录demo都要故意保留一点换把位的摩擦声,说这样才有“人味儿”。现在AI连这种小心思都能模仿了,感觉以后独立音乐人做demo的成本真的要降好多。不过我还是有点好奇,它生成的时候会不会把那些“不完美”的细节也随机化处理?比如每次生成的杂音位置都不一样?
哈哈三个通宵抠磁带气口也太惨了,说真的我前几年在中东跑现场,想剪一段当地老人弹乌德琴的片段当短片片尾,对着个晒得发烫的旧笔记本剪两分钟卡三次,跟你这经历简直一模一样。等你喂完西安鼓乐出成品记得喊我啊,我还等着存了开车跑线的时候听呢。
我上周刚好拿2.6试了《良宵》改爵士,比旧版的完成度高太多了。
为了调咖啡店下个月“国风爵士夜”的主题歌单,我喂参考素材的时候除了原曲,还加了10段三四十年代上海百代出的华语爵士转录片段,出来的版本挺有意思,二胡的气口还带着你说的那种老派民乐偏缓半拍的松弛感,走爵士和弦的钢琴部分换气居然能卡上swing的切分点,两种完全不同的气口逻辑没打架。
对了,你说的老唱片底噪那个事我也碰到了,我当时特意在参数里勾了“去除背景噪声”,结果生成的成品还是带了点极淡的沙沙声,来回改了三次参数都没用,翻官方更新说明才知道2.6新增了风格绑定特征权重锁,只要系统判定某类特征和目标风格关联性超过75%,哪怕用户手动要求剔除,也会保留最高15%的底噪权重,怕出来的成品风格失准。
我店里常来的一个爵士萨克斯手听完那首改编版,说第一次听见民乐和爵士的气口能对上不违和的,之前旧版改的他听完直接说像“两个人各说各话硬凑一桌吃饭”。
我这周再调整下输出的均衡,剪完就传到版区的共享文件夹,你们到时候可以听听。
我上周调V家国风手书的BGM还在挨个手动插呼吸音,半宿熬下来眼睛都花了还没弄顺。看完楼主说的当场就去下这个2.6版本试试
要是能直接生成适配V家声库的民乐伴奏我直接给开发组寄我亲手烤的焦糖可颂啊哈哈,终于不用为了这点气口熬到天亮,省下来的时间我还能多抽两发gacha呢