13.1 本章介绍（前沿因果推断方法）

从反事实思维到现代因果革命：诺贝尔奖方法论的集大成

本章目标

完成本章后,你将能够:

掌握合成控制法(Synthetic Control Method)的核心思想与实现
理解倾向得分匹配(PSM)、IPW和Doubly Robust方法
估计异质性处理效应(CATE)与Meta-learners(S/T/X/R-learner)
运用因果图(DAG)和do-calculus进行因果推断
掌握Staggered DID等前沿方法
使用EconML、DoWhy、CausalML进行综合因果分析
理解诺贝尔奖获得者的核心贡献(Angrist, Imbens, Card 2021)

引言：因果推断的认知革命

反事实思维：人类认知的核心

"What would have happened if...?"
"如果当初……会怎样?"

这是人类最基本的思维模式,也是因果推断的哲学基石。

Judea Pearl (2018) 在《The Book of Why》中指出:

"反事实推理是人类智能的本质特征,它将我们与动物区分开来。"

Donald Rubin (1974) 创立的潜在结果框架(Potential Outcomes Framework):

: 个体接受处理时的潜在结果
: 个体不接受处理时的潜在结果
: 个体因果效应

根本问题(The Fundamental Problem of Causal Inference):

我们永远无法同时观测到和!

整个因果推断领域,就是在寻找估计反事实的方法。

2021年诺贝尔经济学奖：因果推断的胜利

获奖者与核心贡献

2021年10月11日,瑞典皇家科学院宣布:

"for their methodological contributions to the analysis of causal relationships"
"表彰他们对因果关系分析的方法论贡献"

获奖者:

Joshua Angrist (MIT)
Guido Imbens (Stanford)
David Card (UC Berkeley)

David Card的实证革命

核心贡献: 自然实验在劳动经济学中的应用

经典研究:

1. Card & Krueger (1994): 最低工资与就业

传统理论: 最低工资↑ → 就业↓

实证发现:

新泽西州提高最低工资后,快餐业就业增加
颠覆传统理论

方法: 双重差分法(DID)

2. Card (1990): Mariel船运难民与迈阿密劳动市场

自然实验: 1980年,125,000古巴难民突然涌入迈阿密

发现: 对当地工资和就业几乎无影响

意义: 证明劳动力供给冲击的影响可能被高估

Angrist & Imbens的方法论突破

核心贡献: 工具变量(IV)的现代理论框架

关键论文:

Imbens & Angrist (1994): "Identification and Estimation of Local Average Treatment Effects"
Angrist, Imbens & Rubin (1996): "Identification of Causal Effects Using Instrumental Variables"

核心概念: 局部平均处理效应(LATE)

问题: 当工具变量不完美(部分遵从)时,IV估计什么?

答案: LATE - 对顺从者(Compliers)的因果效应

数学表达:

顺从者: 那些当时选择,当时选择的人

经典应用: Angrist & Krueger (1991) - 教育回报率

工具变量: 出生季度(影响入学年龄)

发现: 每多一年教育 → 收入提高约9%

Modules 8-12回顾：因果推断武器库

在学习前沿方法前,让我们回顾已掌握的因果推断工具:

Module 8: 面板数据与固定效应

核心思想: 消除不可观测的个体异质性

固定效应模型:

关键: 捕获个体固定特征

应用: 工资方程、企业生产率分析

Python: linearmodels.PanelOLS

Module 9: 双重差分法(DID)

核心思想: 两次差分消除偏差

DID估计量:

核心假设: 平行趋势假设

检验: 事件研究图、安慰剂检验

经典案例: Card & Krueger (1994)最低工资研究

Python: statsmodels, linearmodels

Module 10: 工具变量法(IV)

核心思想: 利用外生变异识别因果效应

2SLS估计:

核心假设:

相关性:
排除性约束:
单调性:

经典应用: Angrist & Krueger (1991)教育回报

Python: linearmodels.IV2SLS

Module 11: 断点回归设计(RDD)

核心思想: 断点处的局部随机化

Sharp RDD:

Fuzzy RDD:

关键检验:

McCrary密度检验
协变量连续性检验
带宽敏感性分析

Python: rdrobust, rdd

Module 12: 机器学习与因果推断(Causal Forest)

核心思想: 估计异质性处理效应

Causal Forest (Wager & Athey 2018):

创新:

诚实分割(Honest Splitting)
局部随机化
渐近正态性

CATE估计:

Python: econml.CausalForestDML, causalml

Module 13：前沿方法全景图

本章将介绍5大前沿因果推断方法,它们代表了当前因果推断的最高水平:

1️⃣ 合成控制法(Synthetic Control Method)

领军人物: Alberto Abadie (MIT)

核心问题: 当只有一个处理单位时,如何构造反事实?

核心思想: 用多个对照单位的加权组合作为反事实

数学表达:

其中是最优权重向量,满足:

经典案例: California Proposition 99 (Abadie et al. 2010)

1988年加州提高烟草税
用其他州合成"反事实加州"
发现: 吸烟率显著下降

适用场景:

宏观政策评估(一个国家/地区)
公司并购效应
自然灾害影响

Python工具: SparseSC, 手动实现

2️⃣ 倾向得分匹配(Propensity Score Matching, PSM)

领军人物: Guido Imbens & Donald Rubin

核心问题: 在观察性数据中,如何找到"可比"的对照组?

核心定理 (Rosenbaum & Rubin 1983):

条件独立性假设(CIA):

倾向得分定理:

其中倾向得分:

估计方法:

1. PSM (Propensity Score Matching):

估计
基于匹配
计算ATT

2. IPW (Inverse Probability Weighting):

3. Doubly Robust (DR):

优势: 只要结果模型或倾向得分模型之一正确,估计就一致

经典案例: LaLonde (1986) 就业培训评估

Python工具: sklearn, causalml, econml

3️⃣ 异质性处理效应与Meta-learners

领军人物: Susan Athey & Stefan Wager (Stanford)

核心问题: 处理效应如何随个体特征变化?

CATE (Conditional Average Treatment Effect):

Meta-learners:

S-learner (Single Model):

T-learner (Two Models):

X-learner (Künzel et al. 2019):

R-learner (Nie & Wager 2021):

Python工具: econml (完整实现所有Meta-learners)

4️⃣ 因果图与结构因果模型

领军人物: Judea Pearl (UCLA, 2011年图灵奖)

核心问题: 如何用图形表示因果关系?

有向无环图(DAG, Directed Acyclic Graph):

核心工具:

1. do-算子 (Pearl 2000):

: 观测分布(相关性)
: 干预分布(因果性)

2. 后门准则(Backdoor Criterion):

如果调整集满足:

阻断所有从到的后门路径
不包含的后代

则:

3. 前门准则(Frontdoor Criterion):

当存在中介变量:

4. 中介分析(Mediation Analysis):

总效应 = 直接效应 + 间接效应

Python工具: DoWhy (微软开发)

5️⃣ 前沿专题

A. Staggered DID (交错双重差分)

问题: 不同单位在不同时间接受处理

传统2WFE的偏误 (Goodman-Bacon 2021):

其中是"禁止的比较"(已处理vs新处理)

解决方案:

Callaway & Sant'Anna (2021):

Sun & Abraham (2021): 交互加权估计量

Python工具: difference_in_differences, pyfixest

B. Shift-Share IV

Bartik工具变量 (Bartik 1991):

: 地区在行业的份额(share)
: 行业的全国增长率(shift)

识别条件 (Borusyak et al. 2022):

应用: 移民冲击、贸易冲击、技术变革

因果推断的统一框架

Pearl vs Rubin: 两大流派

Pearl的图模型:

优势: 直观、识别假设清晰
工具: DAG、do-算子、d-分离

Rubin的潜在结果:

优势: 统计推断严谨、容易估计
工具: 倾向得分、匹配、加权

统一:

因果推断的层级(Pearl的因果阶梯)

Level 1: 关联 (Association)

问题: "如果我看到,我对的信念如何改变?"
数学:
方法: 相关分析、回归

Level 2: 干预 (Intervention)

问题: "如果我做,会发生什么?"
数学:
方法: RCT、IV、DID、RDD

Level 3: 反事实 (Counterfactual)

问题: "如果我当初做了,会怎样?"
数学:
方法: 结构因果模型

️ Python生态系统

核心库对比

库	开发者	核心功能	优势
EconML	Microsoft	Meta-learners, DML, DR	最全面,学术严谨
DoWhy	Microsoft	因果图,识别,估计	统一框架,Pearl+Rubin
CausalML	Uber	Uplift modeling, Meta-learners	工业应用,文档好
CausalImpact	Google	Bayesian time series	时间序列因果
PyFixest	Python	Staggered DID, HDFE	R-fixest移植

完整工作流示例

python

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 因果推断库
from econml.dml import CausalForestDML, LinearDML
from econml.metalearners import TLearner, SLearner, XLearner
from causalml.inference.meta import BaseSRegressor, BaseTRegressor
from causalml.propensity import ElasticNetPropensityModel
from dowhy import CausalModel

# 传统计量
import statsmodels.formula.api as smf
from linearmodels.panel import PanelOLS
from linearmodels.iv import IV2SLS

# 机器学习
from sklearn.ensemble import RandomForestRegressor, GradientBoostingRegressor
from sklearn.linear_model import LassoCV

# 设置
plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']
plt.rcParams['axes.unicode_minus'] = False
sns.set_style("whitegrid")

# 示例:综合因果分析流程
def causal_analysis_pipeline(data, treatment, outcome, covariates):
    """
    综合因果推断分析管道
    """
    # 1. 因果图识别
    model = CausalModel(
        data=data,
        treatment=treatment,
        outcome=outcome,
        common_causes=covariates
    )

    # 2. 识别因果效应
    identified_estimand = model.identify_effect()

    # 3. 估计 (多种方法)
    estimates = {}

    # 3a. PSM
    estimates['PSM'] = model.estimate_effect(
        identified_estimand,
        method_name="backdoor.propensity_score_matching"
    )

    # 3b. IPW
    estimates['IPW'] = model.estimate_effect(
        identified_estimand,
        method_name="backdoor.propensity_score_weighting"
    )

    # 3c. DML
    dml = LinearDML(model_y=GradientBoostingRegressor(),
                    model_t=GradientBoostingRegressor())
    dml.fit(data[outcome], data[treatment], X=data[covariates])
    estimates['DML'] = dml.effect()

    # 3d. Causal Forest (CATE)
    cf = CausalForestDML(model_y=RandomForestRegressor(),
                         model_t=RandomForestRegressor())
    cf.fit(data[outcome], data[treatment], X=data[covariates])
    estimates['CATE'] = cf.effect(data[covariates])

    # 4. 稳健性检验
    refutation = model.refute_estimate(
        identified_estimand,
        estimates['PSM'],
        method_name="random_common_cause"
    )

    return estimates, refutation

# 使用示例
# estimates, refutation = causal_analysis_pipeline(df, 'treatment', 'outcome', ['X1', 'X2', 'X3'])

方法选择指南

决策树

你的研究问题是什么?
│
├─ 只有一个处理单位? → 合成控制法(Section 13.2)
│
├─ 需要构造可比对照组? → PSM/IPW(Section 13.3)
│
├─ 想估计异质性效应? → Meta-learners/CATE(Section 13.4)
│
├─ 需要理解因果机制? → 因果图/中介分析(Section 13.5)
│
└─ 多期/多组处理? → Staggered DID(Section 13.6)

方法对比矩阵

方法	数据要求	核心假设	难度
Synthetic Control	面板,多期	平行趋势(加权)	中
PSM	横截面	条件独立性	低
IPW	横截面	条件独立性	中
Doubly Robust	横截面	条件独立性(弱)	中
Meta-learners	大样本	条件独立性	高
Causal Forest	大样本	条件独立性	高
因果图/DAG	任意	图结构正确	高
Staggered DID	面板,多期	平行趋势	高

学习路径

前置知识检查

必需 (来自Modules 8-12):

潜在结果框架
面板数据和固定效应
DID、IV、RDD的核心逻辑
基础机器学习(回归、决策树)
Python编程(pandas, numpy, sklearn)

4周学习计划

第1周: 合成控制法(13.2) + PSM(13.3前半)

目标: 理解权重优化、倾向得分定理
练习: 复现Abadie et al. (2010), LaLonde (1986)

第2周: PSM/IPW/DR(13.3后半) + Meta-learners(13.4前半)

目标: 掌握加权估计、S/T-learner
练习: 比较不同方法的性能

第3周: CATE与因果图(13.4后半 + 13.5)

目标: X/R-learner、DAG、do-calculus
练习: 用DoWhy构建因果模型

第4周: 前沿专题(13.6) + 综合案例

目标: Staggered DID、政策评估
项目: 完整的因果推断分析报告

必读文献

诺贝尔奖获得者核心论文

David Card:

Card, D., & Krueger, A. B. (1994). "Minimum Wages and Employment." AER, 84(4), 772-793.
Card, D. (1990). "The Impact of the Mariel Boatlift on the Miami Labor Market." ILR Review, 43(2), 245-257.

Joshua Angrist & Guido Imbens: 3. Imbens, G. W., & Angrist, J. D. (1994). "Identification and Estimation of Local Average Treatment Effects." Econometrica, 62(2), 467-475. 4. Angrist, J. D., Imbens, G. W., & Rubin, D. B. (1996). "Identification of Causal Effects Using Instrumental Variables." JASA, 91(434), 444-455.

方法论奠基论文

合成控制: 5. Abadie, A., Diamond, A., & Hainmueller, J. (2010). "Synthetic Control Methods for Comparative Case Studies." JASA, 105(490), 493-505. 6. Abadie, A., & Gardeazabal, J. (2003). "The Economic Costs of Conflict: A Case Study of the Basque Country." AER, 93(1), 113-132.

倾向得分: 7. Rosenbaum, P. R., & Rubin, D. B. (1983). "The Central Role of the Propensity Score in Observational Studies." Biometrika, 70(1), 41-55. 8. Imbens, G. W. (2004). "Nonparametric Estimation of Average Treatment Effects Under Exogeneity." Review of Economics and Statistics, 86(1), 4-29.

异质性处理效应: 9. Künzel, S. R., et al. (2019). "Metalearners for Estimating Heterogeneous Treatment Effects using Machine Learning." PNAS, 116(10), 4156-4165. 10. Nie, X., & Wager, S. (2021). "Quasi-Oracle Estimation of Heterogeneous Treatment Effects." Biometrika, 108(2), 299-319.

因果图: 11. Pearl, J. (2009). Causality: Models, Reasoning and Inference (2nd ed.). Cambridge University Press. 12. Pearl, J., & Mackenzie, D. (2018). The Book of Why. Basic Books.

Staggered DID: 13. Callaway, B., & Sant'Anna, P. H. (2021). "Difference-in-Differences with Multiple Time Periods." JoE, 225(2), 200-230. 14. Goodman-Bacon, A. (2021). "Difference-in-Differences with Variation in Treatment Timing." JoE, 225(2), 254-277.

本章结构

第 1 节: 本章介绍 (当前)

反事实思维与因果革命
2021年诺贝尔奖回顾
Modules 8-12知识整合
前沿方法全景图
学习路径与文献指南

第 2 节: 合成控制法

Abadie方法的核心思想
权重优化与V-矩阵
vs DID的对比
California Prop 99案例完整复现
Python实现(SparseSC)

第 3 节: 倾向得分匹配

从条件独立性到倾向得分定理
PSM、IPW、Doubly Robust
平衡性检验与敏感性分析
LaLonde就业培训数据
Python: sklearn + causalml

第 4 节: 异质性处理效应与Meta-learners

CATE的重要性
S/T/X/R-learner详解
Causal Forest深入
最优政策学习
Python: EconML完整实现

第 5 节: 因果图与结构因果模型

DAG与因果推断
do-calculus、后门准则、前门准则
中介分析
IV的图形化理解
Python: DoWhy库教程

第 6 节: 前沿专题与综合应用

Staggered DID (Callaway & Sant'Anna)
Bacon Decomposition
Shift-Share IV
外部效度挑战
SUTVA违反
ML预测 vs 因果推断
综合政策评估案例

为什么这是最重要的一章?

学术价值

诺贝尔奖认可:

因果推断已成为经济学的核心
方法论创新推动实证革命

前沿研究必备:

顶级期刊(AER, QJE, ECMA)的标准工具
跨学科应用(经济、社会、医学、计算机)

实践意义

政策评估:

最低工资、教育改革、医疗政策
科学证据支持决策

商业应用:

A/B测试异质性分析
个性化营销
因果推荐系统

技能提升:

掌握Python因果推断生态
从描述到因果的认知飞跃

准备好了吗?

引用Judea Pearl的话:

"You cannot answer a question that you cannot ask, and you cannot ask a question that you have no words for."
"你无法回答你无法提出的问题,而你无法提出你没有语言表达的问题。"

因果推断的语言: DAG、do-算子、潜在结果、CATE...

本章目标: 让你掌握因果推断的完整词汇表,能够:

识别因果关系
选择正确方法
严谨估计与推断
解释因果机制

记住核心哲学:

"Correlation is not causation, but with the right methods and assumptions, we can climb the ladder from correlation to causation."
"相关不是因果,但有了正确的方法和假设,我们可以从相关攀登到因果。"

让我们开始这场因果推断的终极之旅!

下一节: 13.2 合成控制法 - Abadie的反事实构造艺术

因果推断:从认知革命到政策实践!

13.1 本章介绍（前沿因果推断方法） ​

本章目标 ​

引言：因果推断的认知革命 ​

反事实思维：人类认知的核心 ​

2021年诺贝尔经济学奖：因果推断的胜利 ​

获奖者与核心贡献 ​

David Card的实证革命 ​

Angrist & Imbens的方法论突破 ​

Modules 8-12回顾：因果推断武器库 ​

Module 8: 面板数据与固定效应 ​

Module 9: 双重差分法(DID) ​

Module 10: 工具变量法(IV) ​

Module 11: 断点回归设计(RDD) ​

Module 12: 机器学习与因果推断(Causal Forest) ​

Module 13：前沿方法全景图 ​

1️⃣ 合成控制法(Synthetic Control Method) ​

2️⃣ 倾向得分匹配(Propensity Score Matching, PSM) ​

3️⃣ 异质性处理效应与Meta-learners ​

4️⃣ 因果图与结构因果模型 ​

5️⃣ 前沿专题 ​

因果推断的统一框架 ​

Pearl vs Rubin: 两大流派 ​

因果推断的层级(Pearl的因果阶梯) ​

️ Python生态系统 ​

核心库对比 ​

完整工作流示例 ​

方法选择指南 ​

决策树 ​

方法对比矩阵 ​

学习路径 ​

前置知识检查 ​

4周学习计划 ​

必读文献 ​

诺贝尔奖获得者核心论文 ​

方法论奠基论文 ​

推荐教材 ​

本章结构 ​

第 1 节: 本章介绍 (当前) ​

第 2 节: 合成控制法 ​

第 3 节: 倾向得分匹配 ​

第 4 节: 异质性处理效应与Meta-learners ​

第 5 节: 因果图与结构因果模型 ​

第 6 节: 前沿专题与综合应用 ​

为什么这是最重要的一章? ​

学术价值 ​

实践意义 ​

准备好了吗? ​