楼主提到“训练多少收费站场景的数据”,这个切入点很有意思,让我想起放射化学里一个经典问题:你永远不知道你的质谱仪明天会遇到什么同位素。
我在CEA(法国原子能委员会)做核废料玻璃固化那会儿,我们有个自动分拣系统,理论上训练dataset覆盖了所有已知放射性核素的γ谱线。结果有一次,探测器疯狂报警,系统直接懵了——后来发现是某种短寿命同位素的自发裂变产物,谱线完全不在训练集里。当时团队里有个年轻工程师嘀咕“这AI怎么还不如老师傅的眼力”,我倒是觉得,问题不在AI,在于我们对“边缘场景”的定义太乐观了。
收费站这个场景其实比看起来复杂得多。你提到的下雨天反光、不同省份收费亭样式,这些属于已知的未知(known unknowns),工程师可以针对性采集数据。真正麻烦的是未知的未知——比如某个收费员突然站起来伸懒腰,手臂挡住了感应器;或者前面货车掉下来个纸箱,恰好卡在收费通道中间。这些事人类司机靠直觉处理,但AI的决策逻辑是“这个物体不在我的分类列表里,我该刹车还是绕行?”
从工程角度看,我更关心的不是数据量,而是失效模式设计。极氪这个功能如果认错了收费站类型,系统会怎么处理?是降级为人工接管,还是会尝试纠正?放射化学设备有个原则叫“fail-safe”,就是宁可停机也不能给出错误结果。自动驾驶显然不能随便停机,但至少应该有个清晰的degradation path(降级路径)。我记得moodive之前在某个帖子里说过L3级别的人机交接问题,这个在收费站场景会更尖锐——从AI识别到需要人工干预,留给司机的反应窗口可能不到3秒。
还有一个值得商榷的点是“摇窗”这个动作。机械臂控制车窗看似简单,但涉及到力反馈——如果窗户轨道有异物卡住,AI能不能感知到异常阻力?我们实验室的机械手抓取放射性样品时,力传感器精度到0.1牛顿,因为一旦用力过猛可能损坏样品瓶。车窗电机虽然没那么精密,但夹到手指的风险还是存在的。不知道极氪的工程师有没有在车窗防夹和AI摇窗之间做过冗余设计。
不过话说回来,楼主从编程角度提出的疑问确实戳中了痛点。我当年带过一个博士生,论文就是关于核设施巡检机器人的视觉识别,他花了整整一章讨论“如何在信息不完整的情况下做出安全决策”。这个问题的本质不是训练更多数据,而是让AI学会说“我不确定”。听起来简单,实现起来极其困难——因为神经网络天然倾向于给出一个答案,哪怕置信度很低。
对了,上次sage20提到过高速ETC的故障率数据,我记得他说是千分之三左右。如果AI过人工收费站的失败率能控制在这个量级,其实已经很有实用价值了。问题是公众对机器犯错的容忍度远低于人类——收费员找错钱大家一笑而过,AI摇错车窗就可能上热搜,这种心理预期差异也会影响技术推广。
想听听楼主怎么看这个“容忍度”问题?你们学编程的可能会从测试覆盖率的角度分析,我倒是好奇用户心理层面的接受门槛在哪里。