14.4 本章小结与展望

从Rubin到Chernozhukov，从Pearl到LLM：因果推断的完整旅程

核心要点回顾

Double Machine Learning

核心问题：如何在利用ML灵活性的同时保持因果效应估计的-一致性？
解决方案：交叉拟合 + Neyman正交性 = 双重去偏
关键公式：

Python工具：econml.dml.LinearDML、doubleml.DoubleMLPLR

因果发现

PC算法：通过条件独立性检验学习因果图结构
GES算法：在等价类空间中贪心搜索最优DAG
DoWhy框架：Model → Identify → Estimate → Refute

前沿方法

Shift-Share IV：，条件于份额，增长率外生
Staggered DID：TWFE在交错采用下可能有偏，使用C&S (2021)方法
SUTVA与外部效度：溢出效应和一般均衡是推广因果结论的关键挑战

全书知识地图

方法选择总决策树

你的研究问题？
│
├─ 有随机实验？ → RCT + 异质性分析 (Module 1, 13)
│
├─ 只有1个处理单位？ → 合成控制法 (Module 12)
│
├─ 面板数据 + 同时采用？ → 标准DID (Module 10)
│
├─ 面板数据 + 交错采用？ → C&S / Sun-Abraham (Module 14)
│
├─ 断点处理分配？ → RDD (Module 11)
│
├─ 有工具变量？ → IV / 2SLS (Module 10相关)
│
├─ 观察性数据 + 高维混淆？ → DML (Module 14)
│
├─ 想估计异质性？ → Causal Forest / Meta-learners (Module 13)
│
├─ 不知道因果结构？ → 因果发现算法 (Module 14)
│
└─ 需要完整框架？ → DoWhy (Module 14)

全书核心概念回顾

模块	核心方法	关键假设	估计量
Module 1	RCT	随机分配	ATE
Module 9	面板FE	严格外生性	固定效应估计
Module 10	DID	平行趋势	ATT
Module 11	RDD	连续性	LATE（断点处）
Module 12	SCM	因子模型 + 政策前拟合	单位效应
Module 13	Causal Forest	条件独立性	CATE
Module 14	DML	Neyman正交性	ATE（部分线性模型）

Python工具箱全景

方法	核心库	关键函数
面板FE	`linearmodels`	`PanelOLS`
DID	`linearmodels`, `pyfixest`	`PanelOLS`, `feols`
IV	`linearmodels`	`IV2SLS`
RDD	`rdrobust`	`rdrobust`
SCM	`SparseSC`	`fit`
Causal Forest	`econml`	`CausalForestDML`
DML	`econml`, `doubleml`	`LinearDML`, `DoubleMLPLR`
PSM/IPW	`causalml`, `econml`	`PropensityModel`
Meta-learners	`econml`	`SLearner`, `TLearner`, `XLearner`
因果图	`dowhy`, `pgmpy`	`CausalModel`
因果发现	`causal-learn`	`pc`, `ges`
Staggered DID	`pyfixest`	`feols`

因果推断的未来

正在发生的前沿进展

1. 因果推断 + 大语言模型

LLM辅助因果假设生成
自动文献综述和效应汇总
但LLM不能替代因果识别策略

2. 因果推断 + 强化学习

动态处理效应
最优策略学习
时序因果推断

3. 因果推断 + 联邦学习

隐私保护下的因果分析
分布式数据的因果推断

4. 因果表示学习（Causal Representation Learning）

从高维数据中学习因果变量
视觉因果推断
多模态因果分析

学术界的新方向

方向	代表学者	关键问题
Causal ML	Athey, Imbens, Wager	CATE的非参数估计与推断
因果发现	Pearl, Spirtes, Zhang	隐变量下的因果结构学习
DML扩展	Chernozhukov et al.	更一般的半参数模型
因果公平	Kusner, Loftus	AI决策中的因果公平性
因果+NLP	Keith, Feder	从文本中提取因果关系

进阶学习资源

书籍

Angrist & Pischke (2009). Mostly Harmless Econometrics
- 计量经济学因果推断的经典教材
Cunningham (2021). Causal Inference: The Mixtape
- 现代因果推断方法的最佳入门书
Huntington-Klein (2022). The Effect: An Introduction to Research Design and Causality
- 注重直觉理解的因果推断教材
Pearl (2009). Causality: Models, Reasoning, and Inference
- 因果推断的数学基础，侧重结构因果模型
Imbens & Rubin (2015). Causal Inference for Statistics, Social, and Biomedical Sciences
- 潜在结果框架的权威参考
Chernozhukov et al. (2024). Applied Causal Inference Powered by ML and AI
- DML和因果ML的前沿教材（在线免费）

在线课程

MIT 14.387: Applied Econometrics (Angrist)
Stanford STATS 361: Causal Inference (Athey)
Brady Neal: Causal Inference Course (YouTube免费)
Coursera: Causal Inference Specialization (UPenn)

软件文档

EconML: https://econml.azurewebsites.net
DoWhy: https://microsoft.github.io/dowhy
CausalML: https://causalml.readthedocs.io
DoubleML: https://docs.doubleml.org
causal-learn: https://causal-learn.readthedocs.io

学习成果

完成全书后，你已经：

掌握了现代因果推断的完整工具箱
能够选择正确方法解决实际问题
理解各方法的假设与局限
熟练使用Python因果推断生态
能够进行完整的政策评估分析
达到顶级期刊（AER, QJE, Econometrica）的方法论标准
了解因果推断的最新前沿和未来方向

写在最后

因果推断不仅仅是一套统计工具——它是一种思维方式。

从John Snow在1854年伦敦霍乱疫情中的"天然DID"，到Angrist & Imbens因"自然实验方法"获得2021年诺贝尔经济学奖，因果推断已经走过了170年的历程。

在AI时代，因果思维比以往任何时候都更加重要。当机器学习模型可以预测一切，但无法回答"如果我们改变政策，会发生什么？"时，因果推断就是连接数据与决策的桥梁。

"Correlation is not causation — but causation is what we need for policy."

因果推断：从认知革命到政策实践的完整旅程！

恭喜你完成了因果推断的全部学习！

你已经掌握了从诺贝尔奖得主到最新前沿的因果推断武器库。现在，去用这些工具回答真正重要的问题吧。

<< 上一节：14.3 因果发现与前沿方法 | 返回目录

14.4 本章小结与展望 ​

核心要点回顾 ​

Double Machine Learning ​

因果发现 ​

前沿方法 ​

全书知识地图 ​

方法选择总决策树 ​

全书核心概念回顾 ​

Python工具箱全景 ​

因果推断的未来 ​

正在发生的前沿进展 ​

学术界的新方向 ​

进阶学习资源 ​

书籍 ​

在线课程 ​

软件文档 ​

学习成果 ​

写在最后 ​