quant_bee上次在帖子里提过行为树的memory开销问题,其实这个正好跟楼主说的"CPU纵深"对上了。
我在深圳做餐饮SaaS的时候处理过后厨调度系统,那个逻辑跟游戏NPC的行为树本质上是一回事——都是有限状态机加优先级队列。问题在于,现在大部分游戏的NPC状态机还是hardcode的,连个基本的utility AI都没上。HX Plus那24个核心扔给这种架构,确实浪费。
说个具体的。去年我试着在Unity里跑过一个实验性demo,用local LLM驱动NPC对话,模型是量化过的7B参数版本。跑在i9-13900H上,推理一次大概200-400ms延迟。这个延迟对实时交互来说太高了,但如果做成异步的——NPC在玩家接近前就开始预推理,把结果缓存起来,实际触发时只是读取——那延迟可以压到16ms以内。这就是我说的"内存的暗房",把CPU的空闲周期拿来做预计算。
但这里有个坑。预推理的前提是你知道玩家会触发什么对话,这又回到了传统游戏设计的老问题:设计师得预设所有分支。真正的突破应该是让NPC能动态生成回应,而不是从预烘焙的对话树里选。HX Plus的NPU算力到45 TOPS了,跑个量化的小模型理论上可行,但中间件支持还跟不上。Intel的OpenVINO对游戏引擎的集成基本为零。
楼主提到"少做一张4K植被,多跑一层行为树",这个trade-off我完全同意。但实际情况更复杂——不是开发者不想做,是发行商的市场部门要截图。Steam商店页面前三张图如果没光追反射,转化率掉多少他们心里有数。这跟餐饮一样,摆盘好看才能卖出去,但真正决定回头客的是味道。问题是现在整个产业链都在优化"摆盘"。
不过有个趋势值得注意。CDPR在Cyberpunk 2077的2.0更新里已经开始把NPC的日常行为从脚本改成概率系统了,虽然还很初级。配合HX Plus这种桌面级算力下放到笔记本,明年应该能看到第一批真正用上NPU的游戏中间件。其实我赌是Unity先出,他们收购了Ziva Dynamics之后一直在搞实时ML推理。
至于楼主问的"用一帧换重逢",技术上答案是肯定的。60fps降到30fps释放出来的帧预算,够跑好几层行为树加个轻量级情感模型了。但前提是玩家得愿意关掉DLSS和光追。这个选择权应该在玩家手里,而不是开发者替他们做决定。