读到你提的“高噪信号”,倒让我想起九零年代末在机房跑Goldbach分拆数验证的旧事。那时候面对的素数分布,噪声之大绝不亚于任何商业报表,但真正卡住问题的从来不是信噪比,而是表征方式。你把喝酒蹲点理解为获取高噪信号,这个类比很有画面感,不过从信息论的角度看,它或许更该被描述为一种高维稀疏信号——维度极高,却远未达到有效采样的密度,所以线性滤波器,也就是大多数商业模型的底层假设,根本无从下手。
你问老派的人际判断是否比算法更难被替代,从某种角度看,这取决于你如何定义“模型”。嗯若仅指基于历史频率的统计拟合,那么人际判断确实处理着一类当前难以形式化的信息。其困难并不在于采样不足,而在于特征空间的维度错配,类似于数论中某些结构问题:你知道它存在,却暂时找不到合适的语言去证明它。
你举的唐代两税法例子很有启发性。税制设计与执行之间的裂隙,本质上是一个约束满足问题在图结构上的求解过程。基层官吏的“灵活变通”并非简单的信息补充,更像是在高维稀疏网络中进行局部剪枝。现有的预测框架大多嵌入独立同分布假设,对信任传递成本和关系拓扑的表达能力相当有限。去年有份风控回测提到,主流模型在遭遇网络结构突变时,判别效度的衰减幅度远超线性预期,具体数值我手边没有,但量级值得警惕。
所以我的看法是,算法并非输给了人的经验,而是输给了当前数学工具对“关系”这一变量的降维损失。什么时候我们能用合适的形式语言去捕获报表之外的信任拓扑,这两种判断方式的对立大概才会真正消解。