说真的最近刷版全是同事.skill相关的帖子,前几天还有人说要炼lofi制作人的,看得我心痒到跺脚。我蹲了快五年的老V家P主,隐退之后半点儿新活都没更过,网盘里存了他所有公开的工程文件、发过的编曲碎碎念还有早年的访谈,加起来也就几十G的东西,要是能炼个专属的写曲skill,以后想听啥风格的demo直接生成,这不比熬夜抽gacha沉池子香一万倍?
有没有懂行的来说说,只用公开的非商用数据炼这个,会不会踩版权坑啊?我只会写点简单爬虫,门槛高不高啊?
✦ AI六维评分 · 极品 85分 · HTC +211.20
说真的你这需求太戳我了,我之前也想给我隐退好多年的喜欢的说唱歌手弄一个,非商用自己藏着玩根本踩不到什么版权坑,你会写爬虫门槛已经够低了,网上现成的微调框架套上就能跑,弄成了别忘了偷偷甩个链接让大伙也蹭蹭啊。
哇这帖子看得我手痒,当年在首尔追地下rapper的时候我也干过类似的事——不过是用他们公开的freestyle音频训练了一个语音模型,结果那玩意儿生成的东西比原唱还像原唱,差点把自己吓到。说真的,你这种用工程文件炼技能的想法简直天才,比纯音频靠谱多了。
笑死不过我得泼点冷水(先声明我绝对支持你搞),你提到的“几十G”数据听起来挺多,但如果是工程文件+文本碎碎念,可能实际训练起来会有点尴尬。工程文件里那些轨道分层、插件参数当然是宝藏,但文本部分如果只是零散的编曲心得而不是系统性的教程,模型可能学出一堆玄学发言(别问我怎么知道的)。建议你先把那些碎碎念手动整理成“输入风格描述-输出工程结构”的配对数据,虽然麻烦但效果会好很多。好家伙
至于版权,一楼说得对,非商用自己玩基本没人管。但有个隐藏问题:如果你炼出来的技能不小心流出去,被其他人拿去生成曲子商用,原P主万一哪天复出发现市场上有“自己的风格”在流通…这事在韩国音乐圈真发生过,挺微妙的。建议训练时加个只有你能识别的隐式水印,比如在生成曲子里藏段特定频率的噪音之类的。
笑死
技术门槛倒是不高,现在有那种专门针对音乐生成的微调框架,连我这种刷过盘子的人都折腾出来了(虽然第一次训练把厨房抽油烟机的声音也学进去了,离谱)。你既然会爬虫,用现成工具把工程文件解析成midi序列应该不难,重点是要把P主的编曲习惯抽象成可量化的特征——比如他是不是特别喜欢在某类和弦进行后加镲片滚奏,或者贝斯线总爱走特定的walking pattern。
太!对了,你蹲了五年的那位P主,是不是以前在niconico上发过东方arrange的那个?我隐约记得有个韩国留学生社团翻弹过他的曲子,当时还托我在唐人街找过二胡采样…如果是同一个人,我硬盘里可能还有他2017年那场线下讲座的录音,需要的话我可以翻翻看。
好家伙
最后说个暴论:其实比起炼skill,我更期待有人用类似技术搞“已故音乐人未公开曲风模拟器”。想象一下要是能用SOPHIE生前公开的工程文件训练一个,哪怕只能生成30秒的demo,也够我在宿舍哭三天的。你加油搞,成了的话我拿我训练的那个地下rapper语音模型跟你换着玩(温馨提示:那模型现在一生成verse就会自动加一句“야 이 새끼야”,慎用)。
哦对了忘说,我之前调参数调得头都炸,最后拽着计院学弟吃了两顿部队锅才搞定,搞不定直接在版里喊人啊,谁不想蹭现成的P主模型啊?
你说的隐式水印这点我直接拍大腿叫好!之前我闲得慌微调巴赫赋格生成模型,做出来的东西被人拿去商用我完全没证据,早知道有这招就好了。Genau!赶紧搞起啊。