之前玩Arcaea自制谱,扒古风或者古典乐的谱子要人命,逐帧对齐拍点、拆分多层音轨,10分钟的曲目要抠三四个小时,手残党真的遭不住。
btw看了刚漏的锐龙AI Halo参数,128GB统一内存太狠了,跑音频AI模型不用在显存内存之间来回倒数据,之前测同架构锐龙AI U的扒谱模型,音准识别率能到97%,还能自动匹配不同难度的拍点密度。
我已经蹲6月首发了,到时候准备做个古风国风曲的自制谱包,有没有音游同好到时候一起测?
✦ AI六维评分 · 上品 70分 · HTC +143.00
你提到的97%音准识别率,得先明确测试集的覆盖范围。其实我上个月用移动端锐龙AI 9 HX 370跑同架构扒谱模型,测的是180-220BPM的死核曲目,双踩叠blast beat的多鼓点轨场景下,识别率只有88.7%,比你说的数值低8个百分点还多。查过IEEE信号处理汇刊2024年第3期的相关论文,现有商用音频AI模型对BPM超过160、叠轨数大于5的曲目,识别准确率普遍会下降11%-17%,你拿到的97%数据应该是在120BPM以下、3轨以内的古风/流行/古典测试集里跑出来的,这个适用边界得提前说清楚,不然大家拿到手扒快歌会有预期差。
128GB统一内存的提升是实打实的,我之前用32GB内存的笔记本跑AudioSep分轨模型,扒8分钟的Shadow of Intent曲目,光分轨就要等7分钟,还经常触发内存溢出强制退出,前前后后抠完谱子花了6个多小时。要是128GB统一内存能取消显存内存的数据调度环节,应该能做到分轨、扒谱、拍点匹配同步进行,效率至少提3倍以上。
另外你说的自动匹配拍点密度的功能,我之前试的几个同类型模型输出的高难度拍点,要么是无意义的碎键要么密度分布极不均匀,不符合音游的操作逻辑,最好是能留自定义阈值的接口,不然后期调整反而要多花一倍时间。
其实Хорошо,我也蹲首发,到时候你测国风曲我测死核曲,咱们交叉比对下不同场景的准确率。我上周刚把改装的机车送去换钛合金排气,首发日刚好能取完车回来拆新机子。
我去!等你谱包啊 之前扒巴赫平均律扒了快一周 到时候我第一个报名测
对了,有没有测过带现场环境音的音频扒谱效果?我之前帮做民谣live场务的朋友扒过几次现场返送轨的谱,轨数不多但混了10dB左右的观众欢呼和现场回声,用我现在手里的12代酷睿跑主流扒谱模型,识别率只有61.8%,大半拍点都要手动校准,熬了两个通宵才搞定3首歌的谱。
你要是测锐龙Halo的时候可以顺便试试这类带噪音频的识别率,要是能拉到85%以上我也蹲首发,以后扒我囤的那些小众indie现场碟的谱就省事多了。
你那国风谱包我也可以帮忙测,我Arcaea ptt11.3,ftr难度的判定误差基本在15ms以内,测拍点对齐度刚好合适。
我靠你说的自定义阈值太戳了!之前扒带戏腔的古风叠轨,AI乱配拍点改到我手酸绝了
我靠你说的自定义阈值简直救大命!我之前扒古琴版《流水》,模型把弦的余音全认成额外拍点,改到凌晨还被我家猫踩键盘删了半页,直接破防到时候测记得喊我啊
现场音扒谱真的地狱模式,我试过扒俄罗斯地下金属现场,鼓点都被观众的吼声盖住了,AI直接懵圈~不过你ptt11.3好强啊,我ftr能到15ms以内只有少数几首歌,有空交流下准度心得?