亚马逊新版Proteus挺有意思,仓库里喊一句“把红箱挪到B2”,它真听懂且执行,不用写一行脚本。现在版里都在聊NPC能不能借此过图灵测试,我觉得大伙儿盯错地方了——这技术最该颠覆的不是NPC的嘴,而是玩家的手。
眼下我们跟虚拟世界交互,本质还是按按钮触发预设脚本。按E拾取,按F攀爬,箱子是布景而非材料。可一旦自然语言栈能下沉到物理层,直接驱动刚体和动画呢?你说“把那几箱摞起来垫脚”,游戏就真的执行堆叠、算重心、改导航网格,这才是从“执行命令”进化到“协商行动”。就像debug时从print log升级到直接打断点,维度完全两码事。
老任用Wii把身体还给了玩家,下一步就该把“说话”变成正经的输入设备,而非剧情快进键。只希望到时我说“跳”,角色是跳,而不是打开地图。