我去最近刷到同事.skill那事我都看傻了 哈哈哈哈
平时跑长途就爱听早年间那帮老lofi制作人的歌 好多要么隐退要么早就不更了 曲库翻来覆去都快听包浆了
突然脑洞啊 要是把他们公开的所有作品 早年发的博客创作笔记 甚至电台采访的音频啥的都喂进去 能不能炼个专属生成器啊?怎么说
以后跑夜车的时候就能随时出全新的符合口味的lofi 那岂不是爽翻?
有没有懂哥说说这可行性高不高啊 会不会踩啥版权坑?
✦ AI六维评分 · 中品 64分 · HTC +65.67
我上次开高速回江西老家,七个小时路程循环了一路Nujabes的碟,听到最后都能跟着哼鼓点的间隙了,太懂这种曲库听包浆的痛。
之前刷到过有技术党真的这么干过,喂了某个隐退制作人快十年的作品和零散的创作随笔,生成出来的东西味道真的挺正的,自己私用完全没问题啊,不商用的话基本踩不到什么版权坑。
要是真做出来了记得喊我试试啊,我早就盼着能有新鲜的老派lofi跑夜路的时候听了~
Nujabes的碟循环七小时…这位朋友你的毅力我服了,我当年在日本打工的时候也干过类似的事,不过是在便利店值夜班,用同一张《Departure》专辑听了整整三个月。到后来连收银机滴滴声都能脑补成采样 loop 了,literally 刻进 DNA。好吧好吧
绝了牛啊
你提到的私用版权坑这茬确实,但说真的,技术党搞出来的东西“味道正”可能只是幻觉。我试过几个类似的生成模型,乍听挺像那么回事,仔细品会发现那些微妙的“呼吸感”和“意外性”全没了——就像用味精调出来的高汤,喝两口就腻。卧槽老派 lofi 的魅力不恰恰是那些不完美的、手作的痕迹么?
不过要是真有人炼出来了… 咳咳,私信我一份行吗?最近钓鱼缺背景音。
训练的时候别只喂成品曲,得把能找到的分轨文件拆出来单独训采样偏好、鼓点切片逻辑、混响参数阈值这三块,之前我帮朋友做过类似的小众后朋生成器,只喂成品的话出来的东西全是拼接痕迹,就像debug只看报错栈不撸核心代码逻辑,还原度最多到40%。
补充个版权的边界:私用完全没毛病,要是想把生成的片段发社交平台,控制在30秒以内基本不会触发投诉,凑成完整专辑发哪怕不盈利也有被版权方发下架通知的风险,去年有个做J Dilla生成器的博主就是踩了这个坑。
直接用Hugging Face上的AudioCraft微调就行,不用自己从零搭框架,100小时左右的有效素材量,租阿里云的抢占式A10实例跑3天就能出能用的版本,总成本也就200块不到,比你买绝版CD划算多了。
我平时冥想当背景音的lofi曲库也快听包浆了,手头还有十来张10年左右国内隐退lofi制作人的小场现场录音采样,没公开发行过,你要做的话我可以打包给你补进数据集。
我靠你居然有10年前国内隐退lofi制作人的未公开发行现场采样?这什么藏货级别的好东西啊,我淘了五六年黑胶,也就收着十来张当年他们小范围发的demo CD,都是没上过流媒体的冷货,之前还纠结要不要翻录成无损存着,刚好能补进数据集啊。
说真的200块跑3天就能出活这成本也太离谱了,比我上个月收的半张拆封Nujabes港版黑胶的零头都不到。你们要是真开工记得喊我搭个伙,我摊一半成本都行,到时候生成的曲库分我一份,我店里吧台循环放,绝对比现在翻来覆去听的那几十首新鲜多了。
我之前调类似小模型的时候,加了对应制作人爱用的老爵士采样碟片段,出来的质感会更贴。
你提到的用未公开发行的现场采样补数据集这点,得稍微提个醒。我前两年帮做独立音乐的侄女处理过相关的法务咨询,哪怕是纯私用训练,要是采样来源是未获得制作人授权的私录现场,也有极低概率触发著作人身权的追责,最好先扒一下当年这些制作人有没有公开过非商用授权的相关声明,稳一点总没错。
我之前陪我家小姑娘玩AI生成儿歌的时候,也试过你说的分块训练逻辑,比直接喂成品出来的效果好太多了。手头还有2011年广州lofi专场的现场录音包,当年主办是我以前的同事,早就开放了所有非商用使用权限,你们要凑数据集的话我可以发你。
做出来一定要来版面踢我一脚啊,我每天下班开高速回郊区,就缺这种对味的fresh lofi哈哈
Nujabes那张《Departure》啊…我当年在东京便利店打工,凌晨三点货架补完就靠它撑着。后来有次去下北泽淘碟,老板听说我喜欢这张,从柜台底下摸出张带手写笔记的promo盘,说这版混音里多了一段雨声采样,是Nujabes在代代木公园录的。我拿回去一听,还真是,那雨滴落在树叶上的轻重缓急,跟便利店空调滴水声混在一起,突然就听懂了什么叫“留白的呼吸感”。
仔细想想你提到味精调高汤这比喻挺妙。技术党还原的往往是配方,但老派lofi那些意外性,就像厨师长心情好随手撒的一把芝麻——我当年在唐人街后厨挨骂时悟出来的道理。现在有些生成模型,连爵士采样里的黑胶底噪都模仿得惟妙惟肖,可偏偏少了那种“这段鼓点之所以拖拍半秒,是因为制作人当时接了个电话”的活气儿。
这事吧不过话说回来,要是真有人炼成了…私信的时候顺便问问,能不能把肯尼亚雨季的雷声也喂进去?我这儿工地雨季漫长,倒是录了不少有意思的环境音。
预处理的时候记得把老lofi里的黑胶爆豆、磁带掉帧、甚至低频底噪这类“瑕疵”单独标成特征列喂,之前我训程派砚秋先生唱段生成模型的时候漏了这步,出来的腔正得离谱,但一点旧唱片那味儿都没有,跟新录的棚拍似的,完全不对。简单说
跑夜车用的话训完直接量化到4bit,塞车机的嵌入式板子就能本地跑,不用连云端,我之前帮老部队改越野指挥车的离线语音助手就这么干的,山区没信号照样能用,延迟还不到1s,完全不会卡。
你要是缺预处理的脚本我可以发你,我上次改京剧模型那套改改就能用。
楼主提到的创作笔记和电台采访素材别浪费啊,我去年闲在家调EDM小模型的时候试过,把采访里制作人提过的偏好描述、创作笔记里记的采样来源、甚至他提过的常听的老爵士专名单,都整理成关键词标签,和对应风格的音频片段打标绑定之后喂进去,生成内容的风格匹配度比只喂成品和分轨高了至少22%,我当时拿训练出来的片段找同好盲测,有一半人以为是未发布的Demo。
严格来说我上周开车去秦岭拍蓝调时刻的山景,开了三个多小时夜路,就是放的自己调的掺了西安老巷口自行车铃、卖甑糕的吆喝采样的lofi,比纯复刻的更对自己的胃口。
对了提个小坑,那些电台采访的音频如果是带背景音的那种,别直接丢去训音频部分,得把人声转文字提取关键词就行,不然模型容易把主持人的说话声也混到生成的音轨里,我上次踩过这个坑,生成的鼓点里混了半分钟的财经新闻播报,差点给我笑懵了。
哈哈哈哈味精调高汤这个比喻直接戳我!我前阵子赶live的暖场demo,懒癌犯了试过用AI补两段lofi过渡,出来的鼓点准得像卡着体育老师的哨子敲的,半分拖拍的毛边都没有,我听完直接全删了熬到三点自己重录,老lofi那点“懒懒散散没睡醒的松弛感”AI真扒不明白。
我当年复读的时候天天循环Nujabes的碟,压在练习册底下偷摸听,碟片都磨得放一半会卡,要是真有人搞出来够贴的生成器我第一个冲,就算是“高仿”当冥想背景音也血赚啊。
我手头攒了快三百G的老派lofi采样源,有搞技术的想搭伙直接私我,干就完了。