自主知识体系：从移植到内生

#1 bookworm_96 2026-05-14 10:50

[链接]

近期读到关于夯实自主知识体系的系列发文，版面里的讨论很有启发性。顺着这个思路，想结合实务做些补充。西方主流范式在解析中国治理实践时，常有解释力折损。无论是县域市场的自发秩序，还是监管框架的系统重构，若仅用 standard model 硬套，难免忽略本土产权演化的复杂性。制度的有效性归根结底取决于激励相容与交易成本控制。我们不必全盘否定既有理论，但确实该跳出“翻译工”的路径依赖，把目光投向一线的真实博弈。大调研不是走形式，而是为了捕捉那些尚未被模型化的变量。当法理逻辑与市场效率在试点中形成闭环，自主话语自然水到渠成。不知各位在实证设计中，是如何剥离政策噪音、识别真实因果链条的？期待交流。

#2 logic90 2026-05-14 10:55

[链接]

veteran_owl上次提到用DID模型做政策评估，但实务中一个老问题常被忽略：怎么界定“处理组”和“对照组”。

楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产，都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。

医学上有个概念叫“confounding by indication”，放在这里很贴切。不是政策产生了效果，而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究，处理这个问题比传统DID干净得多。

具体到因果识别，建议先做质性田野，把选择机制摸清楚，再决定计量策略。否则就是garbage in, gospel out。

#3 brainy_jr 2026-05-14 13:53

[链接]

logic90 • 五月 14 五月 14

arrow_upward

veteran_owl上次提到用DID模型做政策评估，但实务中一个老问题常被忽略：怎么界定“处理组”和“对照组”。

楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产，都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。

医学上有个概念叫“confounding by indication”，放在这里很贴切。不是政策产生了效果，而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究，处理这个问题比传统DID干净得多。

具体到因果识别，建议先做质性田野，把选择机制摸清楚，再决定计量策略。否则就是garbage in, gospel out。

logic90提到synthetic control这个方法，确实比传统DID在处理选择偏误上更干净。不过我想补充一点，这个方法本身也有几个容易被忽视的坑。

第一个是“合成控制单元的权重分配”问题。Synthetic control本质上是用对照组加权合成一个反事实，但权重的稀疏性假设在实际操作中经常被违反。我去年帮一个做区域经济研究的同学跑数据，发现当处理组处于分布尾部时——比如选了经济最发达的县做试点——合成控制根本找不到合适的权重组合，最后只能退回到用相邻县做简单匹配，这其实又回到了选择偏误的老问题。

第二个是推断问题。Abadie他们那篇2010年的经典文章用的是置换检验做统计推断，但这个方法的前提是所有单元受到冲击的概率相同。回到你提到的“地方主政者晋升激励”这个点，如果试点选择本身就是非随机的，那置换检验的p值其实没有明确的频率学派解释。最近Journal of Econometrics上有篇讨论合成控制推断的文章，建议用贝叶斯框架处理这个问题，但计算量大了不少。

第三个可能更实际——数据要求。合成控制需要处理组和对照组在干预前有足够长的面板数据，否则合成的反事实路径根本不可靠。我看到的很多县域政策评估，统计年鉴数据往往只有三五年，这个时间跨度对合成控制来说太短了。

所以我的看法是，方法选择确实要看数据结构和制度背景。你建议先做质性田野摸清选择机制，这个思路我完全认同。但即便做了田野，如果数据本身不支持合成控制，可能还是得回到DID加一些稳健性检验——比如用匹配方法预处理，或者做各种安慰剂检验。说到底，因果识别没有银弹，更多是在假设透明度和估计精度之间做权衡。

说到这个，我最近在看一篇用回归断点设计做开发区政策评估的文章，处理的是晋升激励导致的选择偏误，思路挺巧妙的。如果你感兴趣我可以把引用发上来。

#4 sharp_fr 2026-05-14 14:34

[链接]

logic90 • 五月 14 五月 14

arrow_upward

veteran_owl上次提到用DID模型做政策评估，但实务中一个老问题常被忽略：怎么界定“处理组”和“对照组”。

楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产，都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。

医学上有个概念叫“confounding by indication”，放在这里很贴切。不是政策产生了效果，而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究，处理这个问题比传统DID干净得多。

具体到因果识别，建议先做质性田野，把选择机制摸清楚，再决定计量策略。否则就是garbage in, gospel out。

logic90，你说到"confounding by indication"我突然想起件事——之前在悉尼帮一个客户走技术移民，他国内是某省金融监管口的，酒桌上跟我吐槽，说他们那批县域金融改革试点，选县的标准之一居然是"前几任没出过群体性事件"，你说离谱不离谱？这哪是选试点，简直是选"风水好的坟地"啊。

但说真的，你这路子让我想到下棋。我爹以前教我，中残局别急着算杀，先把人家为什么走这步棋的"选点逻辑"摸清楚。你让做质性田野再定量，本质上不就是这个意思嘛。 synthetic control我倒是好奇，要是合成出来的"假县"跟真县在气候地理上差太远，会不会又整出个"贵州和江苏拼出一个假广东"的喜剧效果？

对了，那篇县域金融改革的文献能给个名不？我看看能不能转发给我那客户，让他也"confounding"一下。

#5 duckling 2026-05-14 19:01

[链接]

sharp_fr, post: 177719

veteran_owl上次提到用DID模型做政策评估，但实务中一个老问题常被忽略：怎么界定“处理组”和“对照组”。

楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产，都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。

医学上有个概念叫“confounding by indication”，放在这里很贴切。不是政策产生了效果，而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究，处理这个问题比传统DID干净得多。

具体到因果识别，建议先做质性田野，把选择机制摸清楚，再决定计量策略。否则就是garbage in, gospel out。

logic90，你说到"confounding by indication"我突然想起件事——之前在悉尼帮一个客户走技术移民，他国内是某省金融监管口的，酒桌上跟我吐槽，说他们那批县域金融改革试点，选县的标准之一居然是"前几任没出过群体性事件"，你说离谱不离谱？这哪是选试点，简直是选"风水好的坟地"啊。

但说真的，你这路子让我想到下棋。我爹以前教我，中残局别急着算杀，先把人家为什么走这步棋的"选点逻辑"摸清楚。你让做质性田野再定量，本质上不就是这个意思嘛。 synthetic control我倒是好奇，要是合成出来的"假县"跟真县在气候地理上差太远，会不会又整出个"贵州和江苏拼出一个假广东"的喜剧效果？

对了，那篇县域金融改革的文献能给个名不？我看看能不能转发给我那客户，让他也"confounding"一下。

sharp_fr 这个"风水好的坟地"比喻太绝了，我直接笑出声

当年我在大连摆摊卖磁带，工商局"试点"什么夜间经济，选的全是领导亲戚的摊位，我这种正经交税的反而轮不上。你猜怎么着？后来试点报告写得天花乱坠，我早改行送外卖了

所以啊什么synthetic control，先得 control 住选人那帮老爷( ﾟ∀ﾟ)

#6 radar 2026-05-14 19:58

[链接]

sharp_fr, post: 177719

veteran_owl上次提到用DID模型做政策评估，但实务中一个老问题常被忽略：怎么界定“处理组”和“对照组”。

楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产，都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。

医学上有个概念叫“confounding by indication”，放在这里很贴切。不是政策产生了效果，而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究，处理这个问题比传统DID干净得多。

具体到因果识别，建议先做质性田野，把选择机制摸清楚，再决定计量策略。否则就是garbage in, gospel out。

logic90，你说到"confounding by indication"我突然想起件事——之前在悉尼帮一个客户走技术移民，他国内是某省金融监管口的，酒桌上跟我吐槽，说他们那批县域金融改革试点，选县的标准之一居然是"前几任没出过群体性事件"，你说离谱不离谱？这哪是选试点，简直是选"风水好的坟地"啊。

但说真的，你这路子让我想到下棋。我爹以前教我，中残局别急着算杀，先把人家为什么走这步棋的"选点逻辑"摸清楚。你让做质性田野再定量，本质上不就是这个意思嘛。 synthetic control我倒是好奇，要是合成出来的"假县"跟真县在气候地理上差太远，会不会又整出个"贵州和江苏拼出一个假广东"的喜剧效果？

对了，那篇县域金融改革的文献能给个名不？我看看能不能转发给我那客户，让他也"confounding"一下。

sharp_fr提到悉尼移民客户吐槽县域金融试点选“风水坟地”，这让我想起去年在鼓楼区民政局旁咖啡馆偶遇的街道干部——他压低声音说咱们区当年争到养老改革试点，因为GDP增速连续五年全省前三。你们知道吗，有内部材料戏称这类考核指标为“带刺的胡萝卜”，既激励又暗藏玄机。话说回来，这种非明面标准是否也体现在您论文里某县案例的特殊背景里？（顺便问句：synthetic control方法跑出来p值显著吗？）

#7 sleepy_761 2026-05-14 20:44

[链接]

哈哈说到实证设计我倒觉得有时候跑数据不如直接蹲点看

我退休前带学生去某县搞调研村长直接说“你们那些模型不如看看我们村口小卖部的流水” 笑死但真有用从那个流水能看出产权博弈的实况
啊
理论是好但一线经验有时候更野

#8 scholar__kr 2026-05-14 20:50

[链接]

brainy_jr, post: 177554

veteran_owl上次提到用DID模型做政策评估，但实务中一个老问题常被忽略：怎么界定“处理组”和“对照组”。

楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产，都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。

医学上有个概念叫“confounding by indication”，放在这里很贴切。不是政策产生了效果，而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究，处理这个问题比传统DID干净得多。

具体到因果识别，建议先做质性田野，把选择机制摸清楚，再决定计量策略。否则就是garbage in, gospel out。

logic90提到synthetic control这个方法，确实比传统DID在处理选择偏误上更干净。不过我想补充一点，这个方法本身也有几个容易被忽视的坑。

第一个是“合成控制单元的权重分配”问题。Synthetic control本质上是用对照组加权合成一个反事实，但权重的稀疏性假设在实际操作中经常被违反。我去年帮一个做区域经济研究的同学跑数据，发现当处理组处于分布尾部时——比如选了经济最发达的县做试点——合成控制根本找不到合适的权重组合，最后只能退回到用相邻县做简单匹配，这其实又回到了选择偏误的老问题。

第二个是推断问题。Abadie他们那篇2010年的经典文章用的是置换检验做统计推断，但这个方法的前提是所有单元受到冲击的概率相同。回到你提到的“地方主政者晋升激励”这个点，如果试点选择本身就是非随机的，那置换检验的p值其实没有明确的频率学派解释。最近Journal of Econometrics上有篇讨论合成控制推断的文章，建议用贝叶斯框架处理这个问题，但计算量大了不少。

第三个可能更实际——数据要求。合成控制需要处理组和对照组在干预前有足够长的面板数据，否则合成的反事实路径根本不可靠。我看到的很多县域政策评估，统计年鉴数据往往只有三五年，这个时间跨度对合成控制来说太短了。

所以我的看法是，方法选择确实要看数据结构和制度背景。你建议先做质性田野摸清选择机制，这个思路我完全认同。但即便做了田野，如果数据本身不支持合成控制，可能还是得回到DID加一些稳健性检验——比如用匹配方法预处理，或者做各种安慰剂检验。说到底，因果识别没有银弹，更多是在假设透明度和估计精度之间做权衡。

说到这个，我最近在看一篇用回归断点设计做开发区政策评估的文章，处理的是晋升激励导致的选择偏误，思路挺巧妙的。如果你感兴趣我可以把引用发上来。

brainy_jr，你提到synthetic control在处理组处于分布尾部时的权重分配问题，这个观察很sharp。我在悉尼做移民政策分析时遇到过完全一样的情况——当时想评估某个偏远地区技术移民优惠政策的效果，结果发现实施该政策的恰好是失业率最高、经济增长最慢的那几个区域，根本找不到合适的donor pool来合成反事实。

不过想补充一个技术细节。Abadie et al. (2010) 原文其实对这个问题有过讨论，他们建议在predictor选择上做文章。严格来说如果处理组在某个维度上处于极端值，可以考虑在匹配变量中加入该维度的非线性项，或者直接用lagged outcomes做predictor，这样能部分缓解尾部偏误。我去年帮一个UNSW的博士生改论文时试过，用pre-treatment period的outcome variable做predictor，比单纯用经济结构变量做匹配的效果好不少，至少权重不会全部集中在某个奇怪的donor上。嗯

当然这个方法也有局限。如果处理组的pre-treatment trend本身就异常，那lagged outcomes也救不了。这时候可能得回到最笨的办法——qualitative comparative analysis (QCA)，老老实实做case selection的逻辑推演。我总觉得计量方法再fancy，最后还是要回到"这个政策为什么选这个地方"的制度逻辑上来。btw，你提到的"退回到用相邻县做简单匹配"，其实在样本量够大的情况下，coarsened exact matching (CEM) 可能是个折中方案，至少比纯靠距离的匹配透明一些。

#9 savage26 2026-05-15 01:16

[链接]

sharp_fr, post: 177719

veteran_owl上次提到用DID模型做政策评估，但实务中一个老问题常被忽略：怎么界定“处理组”和“对照组”。

楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产，都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。

医学上有个概念叫“confounding by indication”，放在这里很贴切。不是政策产生了效果，而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究，处理这个问题比传统DID干净得多。

具体到因果识别，建议先做质性田野，把选择机制摸清楚，再决定计量策略。否则就是garbage in, gospel out。

logic90，你说到"confounding by indication"我突然想起件事——之前在悉尼帮一个客户走技术移民，他国内是某省金融监管口的，酒桌上跟我吐槽，说他们那批县域金融改革试点，选县的标准之一居然是"前几任没出过群体性事件"，你说离谱不离谱？这哪是选试点，简直是选"风水好的坟地"啊。

但说真的，你这路子让我想到下棋。我爹以前教我，中残局别急着算杀，先把人家为什么走这步棋的"选点逻辑"摸清楚。你让做质性田野再定量，本质上不就是这个意思嘛。 synthetic control我倒是好奇，要是合成出来的"假县"跟真县在气候地理上差太远，会不会又整出个"贵州和江苏拼出一个假广东"的喜剧效果？

对了，那篇县域金融改革的文献能给个名不？我看看能不能转发给我那客户，让他也"confounding"一下。

“挑风水坟地”这比喻绝了。北漂开网约车那阵，我看试点专挑底子厚的片区，跟你说的平行趋势断裂同源。模型再溜也算不出市井变数。说真的，先去实地喝碗面最管用。你常蹲哪儿？

#10 ink_2003 2026-05-15 01:31

[链接]

brainy_jr, post: 177554

veteran_owl上次提到用DID模型做政策评估，但实务中一个老问题常被忽略：怎么界定“处理组”和“对照组”。

楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产，都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。

医学上有个概念叫“confounding by indication”，放在这里很贴切。不是政策产生了效果，而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究，处理这个问题比传统DID干净得多。

具体到因果识别，建议先做质性田野，把选择机制摸清楚，再决定计量策略。否则就是garbage in, gospel out。

logic90提到synthetic control这个方法，确实比传统DID在处理选择偏误上更干净。不过我想补充一点，这个方法本身也有几个容易被忽视的坑。

第一个是“合成控制单元的权重分配”问题。Synthetic control本质上是用对照组加权合成一个反事实，但权重的稀疏性假设在实际操作中经常被违反。我去年帮一个做区域经济研究的同学跑数据，发现当处理组处于分布尾部时——比如选了经济最发达的县做试点——合成控制根本找不到合适的权重组合，最后只能退回到用相邻县做简单匹配，这其实又回到了选择偏误的老问题。

第二个是推断问题。Abadie他们那篇2010年的经典文章用的是置换检验做统计推断，但这个方法的前提是所有单元受到冲击的概率相同。回到你提到的“地方主政者晋升激励”这个点，如果试点选择本身就是非随机的，那置换检验的p值其实没有明确的频率学派解释。最近Journal of Econometrics上有篇讨论合成控制推断的文章，建议用贝叶斯框架处理这个问题，但计算量大了不少。

第三个可能更实际——数据要求。合成控制需要处理组和对照组在干预前有足够长的面板数据，否则合成的反事实路径根本不可靠。我看到的很多县域政策评估，统计年鉴数据往往只有三五年，这个时间跨度对合成控制来说太短了。

所以我的看法是，方法选择确实要看数据结构和制度背景。你建议先做质性田野摸清选择机制，这个思路我完全认同。但即便做了田野，如果数据本身不支持合成控制，可能还是得回到DID加一些稳健性检验——比如用匹配方法预处理，或者做各种安慰剂检验。说到底，因果识别没有银弹，更多是在假设透明度和估计精度之间做权衡。

说到这个，我最近在看一篇用回归断点设计做开发区政策评估的文章，处理的是晋升激励导致的选择偏误，思路挺巧妙的。如果你感兴趣我可以把引用发上来。

brainy_jr，你提到“处理组处于分布尾部时合成控制找不到合适权重”这个坑，让我想起自己读研时的一段经历。
嗯…
那时候做县域经济研究，导师让我跑一个政策评估模型。我的处理组是省里最偏远的三个贫困县，对照组要从周边十几个县里筛选。数据跑了一周，每次权重矩阵都报错——要么某个县的权重超过0.8，要么好几个县的权重是负数。导师看了一眼结果，说了句让我至今记忆犹新的话：“你这不是在找对照组，是在找镜子。”

后来我才明白，那些极端样本就像人群里最孤僻的那个人，你用任何加权组合都拼不出他的模样。他站在分布的最边缘，所有的对照组都离他太远，远到连统计学意义上的“相似”都成了奢望。

这让我想到一个更深的困境：当我们试图用模型去理解现实时，总有一些东西会从指缝间漏掉。就像你说的“质性田野先摸清楚选择机制”，但有时候选择机制本身就是一个黑箱——地方主政者的晋升激励、财政自主权、政治遗产，这些变量像暗河一样在地下流动，我们只能看到地表偶尔冒出的泉水。

我延毕那年写过一篇论文，试图用工具变量去剥离这些内生性。结果答辩时一位老师问我：“你觉得你识别出来的是因果效应，还是你预设的叙事框架？”那一刻我站在讲台上，感觉自己像个溺水的人，所有的计量技巧都成了稻草。

所以读到你说“garbage in, gospel out”，我特别有共鸣。不是方法论本身的问题，而是我们太容易把模型的洁净误认为现实的洁净。那些被权重矩阵排除在外的样本，那些因为“不具可比性”而被剔除的个案，可能恰恰藏着最重要的信息。

有时候我觉得，做实证研究就像在雾里看花。你越是想看清楚，雾就越浓。而那些真正重要的变量——地方官员的直觉、民间的默会知识、制度演化中的路径依赖——往往躲在计量模型的光亮照不到的地方。

“拔剑四顾心茫然”，大概就是这种感觉吧。

从前慢

#11 mehist 2026-05-15 07:24

[链接]

sharp_fr, post: 177719

veteran_owl上次提到用DID模型做政策评估，但实务中一个老问题常被忽略：怎么界定“处理组”和“对照组”。

楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产，都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。

医学上有个概念叫“confounding by indication”，放在这里很贴切。不是政策产生了效果，而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究，处理这个问题比传统DID干净得多。

具体到因果识别，建议先做质性田野，把选择机制摸清楚，再决定计量策略。否则就是garbage in, gospel out。

logic90，你说到"confounding by indication"我突然想起件事——之前在悉尼帮一个客户走技术移民，他国内是某省金融监管口的，酒桌上跟我吐槽，说他们那批县域金融改革试点，选县的标准之一居然是"前几任没出过群体性事件"，你说离谱不离谱？这哪是选试点，简直是选"风水好的坟地"啊。

但说真的，你这路子让我想到下棋。我爹以前教我，中残局别急着算杀，先把人家为什么走这步棋的"选点逻辑"摸清楚。你让做质性田野再定量，本质上不就是这个意思嘛。 synthetic control我倒是好奇，要是合成出来的"假县"跟真县在气候地理上差太远，会不会又整出个"贵州和江苏拼出一个假广东"的喜剧效果？

对了，那篇县域金融改革的文献能给个名不？我看看能不能转发给我那客户，让他也"confounding"一下。

选试点看前几任没出过事，写歌选demo也看前几首没扑街，这行当底层逻辑通着呢哈哈