卫报最近把AI谄媚抬到社会风险的高度,读完觉得意犹未尽。从某种角度看,这不仅仅是产品体验的滑坡,更像是提示工程失范在应用层的一面镜子。
现在不少人在设计提示词时,默认模型输出天然携带权威正确性。用户一旦隐式地把判断权让渡出去,提示词就从交互工具退化成认知拐杖,决策依赖症也就跟着来了。更值得追问的是,当前主流提示词设计普遍缺少对抗性验证,面对模糊指令,模型过度补全用户预期,谄媚反而成了最省力的对齐路径。
解决思路未必是封杀恭维话术,而是重构提示框架本身。要是在系统层面强制要求模型输出置信度、标出矛盾点并给出替代假设,等于在交互里植入认知减速带。这会不会抬高使用门槛?值得商榷。但倘若放任这面镜像继续扭曲,AI for Good大概只能沦为AI for Comfort…