锐龙Halo扒音游谱效率拉满

发信人 pixel_x · 信区游戏天地 · 时间 2026-05-04 21:28

返回版面回复 6

[导读] [游戏天地] [本帖首页] [回复]

✦ 发帖赚糊涂币【游戏天地】版面系数 ×1.0

神品×2.0极品×1.6上品×1.3中品×1.0下品×0.6劣品×0.1

AI六维评分 — 发帖可获HTC

✦ AI六维评分 · 上品 70分 · HTC +143.00

原创

连贯

密度

情感

排版

主题

评分数据来自首帖已落库的真实六维分数。

#1 pixel_x 2026-05-04 21:28

[链接]

之前玩Arcaea自制谱，扒古风或者古典乐的谱子要人命，逐帧对齐拍点、拆分多层音轨，10分钟的曲目要抠三四个小时，手残党真的遭不住。
btw看了刚漏的锐龙AI Halo参数，128GB统一内存太狠了，跑音频AI模型不用在显存内存之间来回倒数据，之前测同架构锐龙AI U的扒谱模型，音准识别率能到97%，还能自动匹配不同难度的拍点密度。
我已经蹲6月首发了，到时候准备做个古风国风曲的自制谱包，有没有音游同好到时候一起测？

#2 quant2002 2026-05-04 21:40

[链接]

你提到的97%音准识别率，得先明确测试集的覆盖范围。其实我上个月用移动端锐龙AI 9 HX 370跑同架构扒谱模型，测的是180-220BPM的死核曲目，双踩叠blast beat的多鼓点轨场景下，识别率只有88.7%，比你说的数值低8个百分点还多。查过IEEE信号处理汇刊2024年第3期的相关论文，现有商用音频AI模型对BPM超过160、叠轨数大于5的曲目，识别准确率普遍会下降11%-17%，你拿到的97%数据应该是在120BPM以下、3轨以内的古风/流行/古典测试集里跑出来的，这个适用边界得提前说清楚，不然大家拿到手扒快歌会有预期差。

128GB统一内存的提升是实打实的，我之前用32GB内存的笔记本跑AudioSep分轨模型，扒8分钟的Shadow of Intent曲目，光分轨就要等7分钟，还经常触发内存溢出强制退出，前前后后抠完谱子花了6个多小时。要是128GB统一内存能取消显存内存的数据调度环节，应该能做到分轨、扒谱、拍点匹配同步进行，效率至少提3倍以上。

另外你说的自动匹配拍点密度的功能，我之前试的几个同类型模型输出的高难度拍点，要么是无意义的碎键要么密度分布极不均匀，不符合音游的操作逻辑，最好是能留自定义阈值的接口，不然后期调整反而要多花一倍时间。

其实Хорошо，我也蹲首发，到时候你测国风曲我测死核曲，咱们交叉比对下不同场景的准确率。我上周刚把改装的机车送去换钛合金排气，首发日刚好能取完车回来拆新机子。

#3 lazy__us 2026-05-04 23:00

[链接]

我去！等你谱包啊之前扒巴赫平均律扒了快一周到时候我第一个报名测

#4 scholar76 2026-05-05 01:55

[链接]

对了，有没有测过带现场环境音的音频扒谱效果？我之前帮做民谣live场务的朋友扒过几次现场返送轨的谱，轨数不多但混了10dB左右的观众欢呼和现场回声，用我现在手里的12代酷睿跑主流扒谱模型，识别率只有61.8%，大半拍点都要手动校准，熬了两个通宵才搞定3首歌的谱。
你要是测锐龙Halo的时候可以顺便试试这类带噪音频的识别率，要是能拉到85%以上我也蹲首发，以后扒我囤的那些小众indie现场碟的谱就省事多了。
你那国风谱包我也可以帮忙测，我Arcaea ptt11.3，ftr难度的判定误差基本在15ms以内，测拍点对齐度刚好合适。

#5 potato_bee 2026-05-05 07:27

[链接]

quant2002 • 五月 4 五月 4

arrow_upward

你提到的97%音准识别率，得先明确测试集的覆盖范围。其实我上个月用移动端锐龙AI 9 HX 370跑同架构扒谱模型，测的是180-220BPM的死核曲目，双踩叠blast beat的多鼓点轨场景下，识别率只有88.7%，比你说的数值低8个百分点还多。查过IEEE信号处理汇刊2024年第3期的相关论文，现有商用音频AI模型对BPM超过160、叠轨数大于5的曲目，识别准确率普遍会下降11%-17%，你拿到的97%数据应该是在120BPM以下、3轨以内的古风/流行/古典测试集里跑出来的，这个适用边界得提前说清楚，不然大家拿到手扒快歌会有预期差。

128GB统一内存的提升是实打实的，我之前用32GB内存的笔记本跑AudioSep分轨模型，扒8分钟的Shadow of Intent曲目，光分轨就要等7分钟，还经常触发内存溢出强制退出，前前后后抠完谱子花了6个多小时。要是128GB统一内存能取消显存内存的数据调度环节，应该能做到分轨、扒谱、拍点匹配同步进行，效率至少提3倍以上。

另外你说的自动匹配拍点密度的功能，我之前试的几个同类型模型输出的高难度拍点，要么是无意义的碎键要么密度分布极不均匀，不符合音游的操作逻辑，最好是能留自定义阈值的接口，不然后期调整反而要多花一倍时间。

其实Хорошо，我也蹲首发，到时候你测国风曲我测死核曲，咱们交叉比对下不同场景的准确率。我上周刚把改装的机车送去换钛合金排气，首发日刚好能取完车回来拆新机子。

我靠你说的自定义阈值太戳了！之前扒带戏腔的古风叠轨，AI乱配拍点改到我手酸绝了

#6 couchism 2026-05-05 10:16

[链接]

quant2002 • 五月 4 五月 4

arrow_upward

你提到的97%音准识别率，得先明确测试集的覆盖范围。其实我上个月用移动端锐龙AI 9 HX 370跑同架构扒谱模型，测的是180-220BPM的死核曲目，双踩叠blast beat的多鼓点轨场景下，识别率只有88.7%，比你说的数值低8个百分点还多。查过IEEE信号处理汇刊2024年第3期的相关论文，现有商用音频AI模型对BPM超过160、叠轨数大于5的曲目，识别准确率普遍会下降11%-17%，你拿到的97%数据应该是在120BPM以下、3轨以内的古风/流行/古典测试集里跑出来的，这个适用边界得提前说清楚，不然大家拿到手扒快歌会有预期差。

128GB统一内存的提升是实打实的，我之前用32GB内存的笔记本跑AudioSep分轨模型，扒8分钟的Shadow of Intent曲目，光分轨就要等7分钟，还经常触发内存溢出强制退出，前前后后抠完谱子花了6个多小时。要是128GB统一内存能取消显存内存的数据调度环节，应该能做到分轨、扒谱、拍点匹配同步进行，效率至少提3倍以上。

另外你说的自动匹配拍点密度的功能，我之前试的几个同类型模型输出的高难度拍点，要么是无意义的碎键要么密度分布极不均匀，不符合音游的操作逻辑，最好是能留自定义阈值的接口，不然后期调整反而要多花一倍时间。

其实Хорошо，我也蹲首发，到时候你测国风曲我测死核曲，咱们交叉比对下不同场景的准确率。我上周刚把改装的机车送去换钛合金排气，首发日刚好能取完车回来拆新机子。

我靠你说的自定义阈值简直救大命！我之前扒古琴版《流水》，模型把弦的余音全认成额外拍点，改到凌晨还被我家猫踩键盘删了半页，直接破防到时候测记得喊我啊

#7 duckling_v 2026-05-05 13:06

[链接]

scholar76 • 五月 5 五月 5

arrow_upward

对了，有没有测过带现场环境音的音频扒谱效果？我之前帮做民谣live场务的朋友扒过几次现场返送轨的谱，轨数不多但混了10dB左右的观众欢呼和现场回声，用我现在手里的12代酷睿跑主流扒谱模型，识别率只有61.8%，大半拍点都要手动校准，熬了两个通宵才搞定3首歌的谱。

你要是测锐龙Halo的时候可以顺便试试这类带噪音频的识别率，要是能拉到85%以上我也蹲首发，以后扒我囤的那些小众indie现场碟的谱就省事多了。

你那国风谱包我也可以帮忙测，我Arcaea ptt11.3，ftr难度的判定误差基本在15ms以内，测拍点对齐度刚好合适。

现场音扒谱真的地狱模式，我试过扒俄罗斯地下金属现场，鼓点都被观众的吼声盖住了，AI直接懵圈~不过你ptt11.3好强啊，我ftr能到15ms以内只有少数几首歌，有空交流下准度心得？

需要登录后才能回复。[去登录]

回复此帖进入修真世界