Skip to content

14.4 本章小结与展望

从Rubin到Chernozhukov,从Pearl到LLM:因果推断的完整旅程


核心要点回顾

Double Machine Learning

  1. 核心问题:如何在利用ML灵活性的同时保持因果效应估计的-一致性?
  2. 解决方案:交叉拟合 + Neyman正交性 = 双重去偏
  3. 关键公式
  1. Python工具econml.dml.LinearDMLdoubleml.DoubleMLPLR

因果发现

  1. PC算法:通过条件独立性检验学习因果图结构
  2. GES算法:在等价类空间中贪心搜索最优DAG
  3. DoWhy框架:Model → Identify → Estimate → Refute

前沿方法

  1. Shift-Share IV,条件于份额,增长率外生
  2. Staggered DID:TWFE在交错采用下可能有偏,使用C&S (2021)方法
  3. SUTVA与外部效度:溢出效应和一般均衡是推广因果结论的关键挑战

全书知识地图

方法选择总决策树

你的研究问题?

├─ 有随机实验? → RCT + 异质性分析 (Module 1, 13)

├─ 只有1个处理单位? → 合成控制法 (Module 12)

├─ 面板数据 + 同时采用? → 标准DID (Module 10)

├─ 面板数据 + 交错采用? → C&S / Sun-Abraham (Module 14)

├─ 断点处理分配? → RDD (Module 11)

├─ 有工具变量? → IV / 2SLS (Module 10相关)

├─ 观察性数据 + 高维混淆? → DML (Module 14)

├─ 想估计异质性? → Causal Forest / Meta-learners (Module 13)

├─ 不知道因果结构? → 因果发现算法 (Module 14)

└─ 需要完整框架? → DoWhy (Module 14)

全书核心概念回顾

模块核心方法关键假设估计量
Module 1RCT随机分配ATE
Module 9面板FE严格外生性固定效应估计
Module 10DID平行趋势ATT
Module 11RDD连续性LATE(断点处)
Module 12SCM因子模型 + 政策前拟合单位效应
Module 13Causal Forest条件独立性CATE
Module 14DMLNeyman正交性ATE(部分线性模型)

Python工具箱全景

方法核心库关键函数
面板FElinearmodelsPanelOLS
DIDlinearmodels, pyfixestPanelOLS, feols
IVlinearmodelsIV2SLS
RDDrdrobustrdrobust
SCMSparseSCfit
Causal ForesteconmlCausalForestDML
DMLeconml, doublemlLinearDML, DoubleMLPLR
PSM/IPWcausalml, econmlPropensityModel
Meta-learnerseconmlSLearner, TLearner, XLearner
因果图dowhy, pgmpyCausalModel
因果发现causal-learnpc, ges
Staggered DIDpyfixestfeols

因果推断的未来

正在发生的前沿进展

1. 因果推断 + 大语言模型

  • LLM辅助因果假设生成
  • 自动文献综述和效应汇总
  • 但LLM不能替代因果识别策略

2. 因果推断 + 强化学习

  • 动态处理效应
  • 最优策略学习
  • 时序因果推断

3. 因果推断 + 联邦学习

  • 隐私保护下的因果分析
  • 分布式数据的因果推断

4. 因果表示学习(Causal Representation Learning)

  • 从高维数据中学习因果变量
  • 视觉因果推断
  • 多模态因果分析

学术界的新方向

方向代表学者关键问题
Causal MLAthey, Imbens, WagerCATE的非参数估计与推断
因果发现Pearl, Spirtes, Zhang隐变量下的因果结构学习
DML扩展Chernozhukov et al.更一般的半参数模型
因果公平Kusner, LoftusAI决策中的因果公平性
因果+NLPKeith, Feder从文本中提取因果关系

进阶学习资源

书籍

  1. Angrist & Pischke (2009). Mostly Harmless Econometrics

    • 计量经济学因果推断的经典教材
  2. Cunningham (2021). Causal Inference: The Mixtape

    • 现代因果推断方法的最佳入门书
  3. Huntington-Klein (2022). The Effect: An Introduction to Research Design and Causality

    • 注重直觉理解的因果推断教材
  4. Pearl (2009). Causality: Models, Reasoning, and Inference

    • 因果推断的数学基础,侧重结构因果模型
  5. Imbens & Rubin (2015). Causal Inference for Statistics, Social, and Biomedical Sciences

    • 潜在结果框架的权威参考
  6. Chernozhukov et al. (2024). Applied Causal Inference Powered by ML and AI

    • DML和因果ML的前沿教材(在线免费)

在线课程

  1. MIT 14.387: Applied Econometrics (Angrist)
  2. Stanford STATS 361: Causal Inference (Athey)
  3. Brady Neal: Causal Inference Course (YouTube免费)
  4. Coursera: Causal Inference Specialization (UPenn)

软件文档

  1. EconML: https://econml.azurewebsites.net
  2. DoWhy: https://microsoft.github.io/dowhy
  3. CausalML: https://causalml.readthedocs.io
  4. DoubleML: https://docs.doubleml.org
  5. causal-learn: https://causal-learn.readthedocs.io

学习成果

完成全书后,你已经:

  • 掌握了现代因果推断的完整工具箱
  • 能够选择正确方法解决实际问题
  • 理解各方法的假设与局限
  • 熟练使用Python因果推断生态
  • 能够进行完整的政策评估分析
  • 达到顶级期刊(AER, QJE, Econometrica)的方法论标准
  • 了解因果推断的最新前沿和未来方向

写在最后

因果推断不仅仅是一套统计工具——它是一种思维方式

从John Snow在1854年伦敦霍乱疫情中的"天然DID",到Angrist & Imbens因"自然实验方法"获得2021年诺贝尔经济学奖,因果推断已经走过了170年的历程。

在AI时代,因果思维比以往任何时候都更加重要。当机器学习模型可以预测一切,但无法回答"如果我们改变政策,会发生什么?"时,因果推断就是连接数据与决策的桥梁。

"Correlation is not causation — but causation is what we need for policy."

因果推断:从认知革命到政策实践的完整旅程!


恭喜你完成了因果推断的全部学习!

你已经掌握了从诺贝尔奖得主到最新前沿的因果推断武器库。现在,去用这些工具回答真正重要的问题吧。


<< 上一节:14.3 因果发现与前沿方法 | 返回目录

基于 MIT 许可证发布。内容版权归作者所有。