Skip to content

8.6 本章小结

"Instrumental variables are the most powerful—and most dangerous—weapon in the econometrician's arsenal.""工具变量是计量经济学家武器库中最强大的——也是最危险的——武器。"— 综合自 Angrist & Pischke 的观点

掌握工具变量,打开因果推断的新维度


📋 核心概念回顾

IV 的本质

工具变量(Instrumental Variable)是解决内生性问题的核心方法。当处理变量 与误差项 相关时(),OLS 有偏且不一致。IV 通过引入一个外生变异来源 ,提取 中"干净"的变异,从而一致地估计因果效应。

核心公式


🔑 关键概念速查表

概念定义关键公式/条件
内生性 相关
工具变量外生变异来源满足相关性 + 排他性 + 独立性
相关性IV 与处理相关,F > 10
排他性IV 只通过 D 影响 Y,无直接路径
独立性IV 与误差无关
Wald 估计量二值 IV 的简单估计$\frac{E[Y
2SLS两阶段最小二乘法第一阶段:;第二阶段:
LATE局部平均处理效应
Compliers被 IV 影响处理状态的人
弱 IVIV 与 D 的相关性太弱F < 10
过度识别IV 数 > 内生变量数可做 J 检验
J 检验检验 IV 的有效性:所有 IV 有效
Hausman 检验检验 D 是否内生比较 OLS 和 IV

⚖️ IV vs OLS vs 匹配

方法对比

维度OLS匹配/PSMIV/2SLS
处理不可观测混淆?
核心假设CIA(可忽略性)三大条件
假设可检验?部分部分部分(仅相关性)
估计量ATE(若无偏)ATTLATE
效率低(方差大)
适用场景无混淆可观测混淆不可观测混淆
数据要求需要有效 IV
实施难度

何时使用 IV?

你的处理变量 D 有内生性吗?

├─ 不确定 → 先做 Hausman 检验
│   ├─ 不拒绝 H₀ → OLS 可能就够
│   └─ 拒绝 H₀ → 需要处理内生性 ↓

├─ 有内生性,但混淆变量可观测
│   → 尝试匹配/PSM + OLS 控制
│   → 如果 CIA 不可信 → 用 IV

└─ 有内生性,混淆变量不可观测

    ├─ 有清晰的断点规则? → RDD(Module 11)
    ├─ 有面板数据 + 政策冲击? → DID(Module 10)
    ├─ 有有效的工具变量? → IV/2SLS(本章)
    └─ 以上都没有? → 😔 诚实地报告局限性

⚠️ 常见陷阱

陷阱 1:排他性约束的论证不充分

问题:排他性约束是 IV 方法中最关键也最脆弱的假设。很多研究者只报告了第一阶段 F 统计量,而对排他性轻描淡写。

正确做法

  • 用 DAG 明确画出所有可能的路径
  • 详细论证为什么 不直接影响
  • 讨论可能的违反情形及其影响
  • 做敏感性分析(sensitivity analysis)

陷阱 2:忽视弱工具变量问题

问题:F 统计量接近 10 甚至低于 10 时,仍然报告 2SLS 结果。

正确做法

  • 始终报告第一阶段 F 统计量
  • F < 10 时使用 Anderson-Rubin 置信区间或 LIML
  • 考虑寻找更强的 IV

陷阱 3:混淆 LATE 和 ATE

问题:将 IV 估计值解释为"全体人群"的平均效应。

正确做法

  • 明确说明 IV 估计的是 LATE(Compliers 的效应)
  • 讨论 Compliers 是谁、他们是否具有代表性
  • 不同 IV 可能对应不同的 Compliers → 不同的 LATE

陷阱 4:过度识别时不做 J 检验

问题:使用了多个 IV 但不检验它们是否都有效。

正确做法

  • 有多个 IV 时,始终报告 Sargan/Hansen J 检验
  • J 检验拒绝时,逐一排查哪个 IV 可能有问题

陷阱 5:手动 2SLS 的标准误

问题:手动做两步回归,第二阶段的标准误是错误的。

正确做法

  • 使用 linearmodels.iv.IV2SLSstatsmodels 的 IV 功能
  • 它们会自动修正标准误

🛠️ Python 速查

基本 IV/2SLS

python
from linearmodels.iv import IV2SLS

# 公式:Y ~ exogenous [endogenous ~ instruments]
result = IV2SLS.from_formula('Y ~ 1 + X1 + X2 [D ~ Z1 + Z2]', data=df)
fitted = result.fit(cov_type='robust')
print(fitted.summary)

完整诊断

python
# 第一阶段 F
print(fitted.first_stage.diagnostics)

# 内生性检验
print(fitted.wu_hausman())

# 过度识别检验(多 IV 时)
print(fitted.wooldridge_overid)

# 系数和置信区间
print(fitted.params)
print(fitted.conf_int())

LIML(弱 IV 替代)

python
from linearmodels.iv import IVLIML
result_liml = IVLIML.from_formula('Y ~ 1 [D ~ Z]', data=df).fit()

📚 推荐文献

必读教材

教材章节推荐理由
Angrist & Pischke (2009) Mostly Harmless EconometricsChapter 4IV 方法的最佳入门,深入浅出
Cunningham (2021) Causal Inference: The MixtapeChapter 7现代视角,免费在线阅读,含 Python/R 代码
Huntington-Klein (2022) The EffectChapter 19非常好的直觉解释,适合初学者
Wooldridge (2020) Introductory EconometricsChapter 15标准教材,严谨的数学推导

经典论文

论文贡献
Wright (1928)IV 方法的起源(供需分析)
Angrist & Krueger (1991) QJE出生季度 IV,教育回报
Imbens & Angrist (1994) EconometricaLATE 定理的提出
Card (1995)学院距离 IV,教育回报
Staiger & Stock (1997) Econometrica弱工具变量问题
Stock & Yogo (2005)弱 IV 的临界值表
Bound, Jaeger & Baker (1995) JASA对 AK1991 弱 IV 的批评
Angrist (1990) AER征兵抽签 IV,兵役对收入的效应

进阶阅读

主题推荐文献
LATE 的进一步讨论Angrist & Imbens (1995); Heckman & Vytlacil (2005)
弱 IV 稳健推断Andrews, Stock & Sun (2019)
多 IV 的偏差Bekker (1994); Hansen, Hausman & Newey (2008)
IV 的敏感性分析Conley, Hansen & Rossi (2012)

🎯 本章核心要点总结

1. 为什么需要 IV?

当存在不可观测的混淆变量时,OLS 和匹配方法都无法给出一致的因果效应估计。IV 通过引入一个外生变异来源来解决这个问题。

2. 有效 IV 的三大条件

  • 相关性(可检验,F > 10)
  • 排他性 只通过 影响 (不可直接检验,需要理论论证)
  • 独立性(不可直接检验)

3. 2SLS 的逻辑

  • 第一阶段:用 预测 ,得到"干净"的
  • 第二阶段:用 解释 ,得到一致的因果效应估计

4. LATE 的含义

IV 估计的是**顺从者(Compliers)**的因果效应,不是整个人群的 ATE。不同的 IV 可能对应不同的 Compliers。

5. 弱 IV 是致命的

F < 10 时,2SLS 偏向 OLS、标准误膨胀、置信区间失效。始终报告第一阶段 F 统计量。

6. 找到好 IV 是最大的挑战

排他性约束不可直接检验,需要经济学直觉、制度知识和详尽的论证。这是 IV 方法"最优雅也最危险"的地方。


🔗 章节导航

方向链接
⬅️ 上一章Module 7:匹配方法与 PSM
➡️ 下一章Module 9:面板数据与固定效应

本章各节

标题核心内容
8.1本章介绍动机、历史、章节路线图
8.2工具变量的直觉与原理内生性、三大条件、Wald 估计量
8.3两阶段最小二乘法2SLS 机制、LATE、Python 实现
8.4弱工具变量与诊断检验弱 IV、F 检验、J 检验、Hausman
8.5经典案例与 Python 实现AK1991、Card1995 复现
8.6本章小结概念回顾、方法比较(当前)

🏆 从 IV 到更广阔的因果推断

因果推断工具箱的全景

                    因果推断方法谱系
                    ================

随机实验 ←————————————————————————→ 观测数据
(最高内部有效性)                    (更高外部有效性)

  RCT          IV/2SLS        DID        匹配/PSM      OLS
   |              |            |            |            |
  完全随机     外生变异      时间变异    可观测混淆    无混淆假设
   |              |            |            |            |
  ATE           LATE          ATT         ATT          ATE(?)

你已经掌握的方法

  • ✅ M1:反事实框架与 RCT
  • ✅ M7:匹配与 PSM
  • M8:工具变量与 2SLS(本章)

即将学习的方法

  • ➡️ M9:面板数据与固定效应
  • ➡️ M10:双重差分法(DID)
  • ➡️ M11:断点回归(RDD)

🎓 结语

恭喜你完成 Module 8!你已经掌握了因果推断中最具挑战性也最优雅的方法之一。

记住 Angrist 的忠告

"The key to good empirical work is not fancy econometrics; it's finding a good source of exogenous variation." "好的实证研究关键不在于花哨的计量方法,而在于找到好的外生变异来源。"

工具变量的本质是一种思维方式:在无法做实验的情况下,如何巧妙地利用自然世界中的外生变异来回答因果问题。这种思维方式,比任何具体的估计技术都更有价值。


找到那个"外部推手",打破内生性的枷锁! 🔧


📝 本章结束

感谢学习 Module 8!

如有问题或建议,欢迎交流讨论。

Happy Coding & Happy Researching! 🎉

基于 MIT 许可证发布。内容版权归作者所有。