8.6 本章小结

"Instrumental variables are the most powerful—and most dangerous—weapon in the econometrician's arsenal.""工具变量是计量经济学家武器库中最强大的——也是最危险的——武器。"— 综合自 Angrist & Pischke 的观点

掌握工具变量，打开因果推断的新维度

📋 核心概念回顾

IV 的本质

工具变量（Instrumental Variable）是解决内生性问题的核心方法。当处理变量与误差项相关时（），OLS 有偏且不一致。IV 通过引入一个外生变异来源 ，提取中"干净"的变异，从而一致地估计因果效应。

核心公式：

🔑 关键概念速查表

概念	定义	关键公式/条件
内生性	与相关
工具变量	外生变异来源	满足相关性 + 排他性 + 独立性
相关性	IV 与处理相关	，F > 10
排他性	IV 只通过 D 影响 Y	，无直接路径
独立性	IV 与误差无关
Wald 估计量	二值 IV 的简单估计	$\frac{E[Y
2SLS	两阶段最小二乘法	第一阶段：；第二阶段：
LATE	局部平均处理效应
Compliers	被 IV 影响处理状态的人
弱 IV	IV 与 D 的相关性太弱	F < 10
过度识别	IV 数 > 内生变量数	可做 J 检验
J 检验	检验 IV 的有效性	：所有 IV 有效
Hausman 检验	检验 D 是否内生	比较 OLS 和 IV

⚖️ IV vs OLS vs 匹配

方法对比

维度	OLS	匹配/PSM	IV/2SLS
处理不可观测混淆？	❌	❌	✅
核心假设		CIA（可忽略性）	三大条件
假设可检验？	部分	部分	部分（仅相关性）
估计量	ATE（若无偏）	ATT	LATE
效率	高	中	低（方差大）
适用场景	无混淆	可观测混淆	不可观测混淆
数据要求	低	中	需要有效 IV
实施难度	低	中	高

何时使用 IV？

你的处理变量 D 有内生性吗？
│
├─ 不确定 → 先做 Hausman 检验
│   ├─ 不拒绝 H₀ → OLS 可能就够
│   └─ 拒绝 H₀ → 需要处理内生性 ↓
│
├─ 有内生性，但混淆变量可观测
│   → 尝试匹配/PSM + OLS 控制
│   → 如果 CIA 不可信 → 用 IV
│
└─ 有内生性，混淆变量不可观测
    │
    ├─ 有清晰的断点规则？ → RDD（Module 11）
    ├─ 有面板数据 + 政策冲击？ → DID（Module 10）
    ├─ 有有效的工具变量？ → IV/2SLS（本章）
    └─ 以上都没有？ → 😔 诚实地报告局限性

⚠️ 常见陷阱

陷阱 1：排他性约束的论证不充分

问题：排他性约束是 IV 方法中最关键也最脆弱的假设。很多研究者只报告了第一阶段 F 统计量，而对排他性轻描淡写。

正确做法：

用 DAG 明确画出所有可能的路径
详细论证为什么不直接影响
讨论可能的违反情形及其影响
做敏感性分析（sensitivity analysis）

陷阱 2：忽视弱工具变量问题

问题：F 统计量接近 10 甚至低于 10 时，仍然报告 2SLS 结果。

正确做法：

始终报告第一阶段 F 统计量
F < 10 时使用 Anderson-Rubin 置信区间或 LIML
考虑寻找更强的 IV

陷阱 3：混淆 LATE 和 ATE

问题：将 IV 估计值解释为"全体人群"的平均效应。

正确做法：

明确说明 IV 估计的是 LATE（Compliers 的效应）
讨论 Compliers 是谁、他们是否具有代表性
不同 IV 可能对应不同的 Compliers → 不同的 LATE

陷阱 4：过度识别时不做 J 检验

问题：使用了多个 IV 但不检验它们是否都有效。

正确做法：

有多个 IV 时，始终报告 Sargan/Hansen J 检验
J 检验拒绝时，逐一排查哪个 IV 可能有问题

陷阱 5：手动 2SLS 的标准误

问题：手动做两步回归，第二阶段的标准误是错误的。

正确做法：

使用 linearmodels.iv.IV2SLS 或 statsmodels 的 IV 功能
它们会自动修正标准误

🛠️ Python 速查

基本 IV/2SLS

python

from linearmodels.iv import IV2SLS

# 公式：Y ~ exogenous [endogenous ~ instruments]
result = IV2SLS.from_formula('Y ~ 1 + X1 + X2 [D ~ Z1 + Z2]', data=df)
fitted = result.fit(cov_type='robust')
print(fitted.summary)

完整诊断

python

# 第一阶段 F
print(fitted.first_stage.diagnostics)

# 内生性检验
print(fitted.wu_hausman())

# 过度识别检验（多 IV 时）
print(fitted.wooldridge_overid)

# 系数和置信区间
print(fitted.params)
print(fitted.conf_int())

LIML（弱 IV 替代）

python

from linearmodels.iv import IVLIML
result_liml = IVLIML.from_formula('Y ~ 1 [D ~ Z]', data=df).fit()

📚 推荐文献

必读教材

教材	章节	推荐理由
Angrist & Pischke (2009) Mostly Harmless Econometrics	Chapter 4	IV 方法的最佳入门，深入浅出
Cunningham (2021) Causal Inference: The Mixtape	Chapter 7	现代视角，免费在线阅读，含 Python/R 代码
Huntington-Klein (2022) The Effect	Chapter 19	非常好的直觉解释，适合初学者
Wooldridge (2020) Introductory Econometrics	Chapter 15	标准教材，严谨的数学推导

经典论文

论文	贡献
Wright (1928)	IV 方法的起源（供需分析）
Angrist & Krueger (1991) QJE	出生季度 IV，教育回报
Imbens & Angrist (1994) Econometrica	LATE 定理的提出
Card (1995)	学院距离 IV，教育回报
Staiger & Stock (1997) Econometrica	弱工具变量问题
Stock & Yogo (2005)	弱 IV 的临界值表
Bound, Jaeger & Baker (1995) JASA	对 AK1991 弱 IV 的批评
Angrist (1990) AER	征兵抽签 IV，兵役对收入的效应

进阶阅读

主题	推荐文献
LATE 的进一步讨论	Angrist & Imbens (1995); Heckman & Vytlacil (2005)
弱 IV 稳健推断	Andrews, Stock & Sun (2019)
多 IV 的偏差	Bekker (1994); Hansen, Hausman & Newey (2008)
IV 的敏感性分析	Conley, Hansen & Rossi (2012)

🎯 本章核心要点总结

1. 为什么需要 IV？

当存在不可观测的混淆变量时，OLS 和匹配方法都无法给出一致的因果效应估计。IV 通过引入一个外生变异来源来解决这个问题。

2. 有效 IV 的三大条件

相关性：（可检验，F > 10）
排他性：只通过影响（不可直接检验，需要理论论证）
独立性：（不可直接检验）

3. 2SLS 的逻辑

第一阶段：用预测，得到"干净"的
第二阶段：用解释，得到一致的因果效应估计

4. LATE 的含义

IV 估计的是**顺从者（Compliers）**的因果效应，不是整个人群的 ATE。不同的 IV 可能对应不同的 Compliers。

5. 弱 IV 是致命的

F < 10 时，2SLS 偏向 OLS、标准误膨胀、置信区间失效。始终报告第一阶段 F 统计量。

6. 找到好 IV 是最大的挑战

排他性约束不可直接检验，需要经济学直觉、制度知识和详尽的论证。这是 IV 方法"最优雅也最危险"的地方。

🔗 章节导航

方向	链接
⬅️ 上一章	Module 7：匹配方法与 PSM
➡️ 下一章	Module 9：面板数据与固定效应

本章各节

节	标题	核心内容
8.1	本章介绍	动机、历史、章节路线图
8.2	工具变量的直觉与原理	内生性、三大条件、Wald 估计量
8.3	两阶段最小二乘法	2SLS 机制、LATE、Python 实现
8.4	弱工具变量与诊断检验	弱 IV、F 检验、J 检验、Hausman
8.5	经典案例与 Python 实现	AK1991、Card1995 复现
8.6	本章小结	概念回顾、方法比较（当前）

🏆 从 IV 到更广阔的因果推断

因果推断工具箱的全景

                    因果推断方法谱系
                    ================

随机实验 ←————————————————————————→ 观测数据
(最高内部有效性)                    (更高外部有效性)

  RCT          IV/2SLS        DID        匹配/PSM      OLS
   |              |            |            |            |
  完全随机     外生变异      时间变异    可观测混淆    无混淆假设
   |              |            |            |            |
  ATE           LATE          ATT         ATT          ATE(?)

你已经掌握的方法：

✅ M1：反事实框架与 RCT
✅ M7：匹配与 PSM
✅ M8：工具变量与 2SLS（本章）

即将学习的方法：

➡️ M9：面板数据与固定效应
➡️ M10：双重差分法（DID）
➡️ M11：断点回归（RDD）

🎓 结语

恭喜你完成 Module 8！你已经掌握了因果推断中最具挑战性也最优雅的方法之一。

记住 Angrist 的忠告：

"The key to good empirical work is not fancy econometrics; it's finding a good source of exogenous variation." "好的实证研究关键不在于花哨的计量方法，而在于找到好的外生变异来源。"

工具变量的本质是一种思维方式：在无法做实验的情况下，如何巧妙地利用自然世界中的外生变异来回答因果问题。这种思维方式，比任何具体的估计技术都更有价值。

找到那个"外部推手"，打破内生性的枷锁！ 🔧

📝 本章结束

感谢学习 Module 8！

如有问题或建议，欢迎交流讨论。

Happy Coding & Happy Researching! 🎉

8.6 本章小结 ​

📋 核心概念回顾 ​

IV 的本质 ​

🔑 关键概念速查表 ​

⚖️ IV vs OLS vs 匹配 ​

方法对比 ​

何时使用 IV？ ​

⚠️ 常见陷阱 ​

陷阱 1：排他性约束的论证不充分 ​

陷阱 2：忽视弱工具变量问题 ​

陷阱 3：混淆 LATE 和 ATE ​

陷阱 4：过度识别时不做 J 检验 ​

陷阱 5：手动 2SLS 的标准误 ​

🛠️ Python 速查 ​

基本 IV/2SLS ​

完整诊断 ​

LIML（弱 IV 替代） ​

📚 推荐文献 ​

必读教材 ​

经典论文 ​

进阶阅读 ​

🎯 本章核心要点总结 ​

1. 为什么需要 IV？ ​

2. 有效 IV 的三大条件 ​

3. 2SLS 的逻辑 ​

4. LATE 的含义 ​

5. 弱 IV 是致命的 ​

6. 找到好 IV 是最大的挑战 ​

🔗 章节导航 ​

本章各节 ​

🏆 从 IV 到更广阔的因果推断 ​

因果推断工具箱的全景 ​

🎓 结语 ​

📝 本章结束 ​

8.6 本章小结

📋 核心概念回顾

IV 的本质

🔑 关键概念速查表

⚖️ IV vs OLS vs 匹配

方法对比

何时使用 IV？

⚠️ 常见陷阱

陷阱 1：排他性约束的论证不充分

陷阱 2：忽视弱工具变量问题

陷阱 3：混淆 LATE 和 ATE

陷阱 4：过度识别时不做 J 检验

陷阱 5：手动 2SLS 的标准误

🛠️ Python 速查

基本 IV/2SLS

完整诊断

LIML（弱 IV 替代）

📚 推荐文献

必读教材

经典论文

进阶阅读

🎯 本章核心要点总结

1. 为什么需要 IV？

2. 有效 IV 的三大条件

3. 2SLS 的逻辑

4. LATE 的含义

5. 弱 IV 是致命的

6. 找到好 IV 是最大的挑战

🔗 章节导航

本章各节

🏆 从 IV 到更广阔的因果推断

因果推断工具箱的全景

🎓 结语

📝 本章结束