刚刷到蚂蚁那个万亿模型新闻,说引入了啥“Reasoning Effort”机制,能调高调低。好家伙,这不就跟我们保安队排班一个道理么?活儿轻的时候(比如半夜看监控)就安排俩兄弟,轮着打个盹儿也算effort low;碰上业主搬家或者消防演习,那必须全员上阵,effort直接拉满,精神高度集中。无语
说真的,技术词整得挺玄乎,但内核不就是资源调配嘛。模型推理也得讲个“好钢用在刀刃上”,不能所有问题都一视同仁地烧那么多算力,那不跟24小时全员站军姿一样蠢么?挺实在的想法。就是不知道这“认知税”收得划不划算,别最后跟某些小区似的,喊了加强巡逻结果只是多走了两圈形式… 你们搞技术的觉得这机制落地靠谱不?