2.3 d-分离与后门准则
从图结构中"读出"因果效应的可识别性
d-分离(d-Separation)
d-分离定义
d-separation (d-分离):
给定条件集,如果和之间的所有路径都被"阻断",则称和 d-分离。
阻断规则
路径被阻断,当且仅当路径上存在节点满足:
链或分叉: 在条件集中
X → M → Y (控制M → 阻断) X ← M → Y (控制M → 阻断)对撞: 及其所有后代都不在中
X → M ← Y (不控制M → 阻断) X → M ← Y (控制M → 打开!)
d-分离的含义
直觉: 图结构蕴含统计独立性!
如果 DAG 告诉我们和在给定时 d-分离,那么在数据中,和在控制后应该是统计独立的。
d-分离判断步骤
系统方法
给定 DAG 和条件集,判断和是否 d-分离:
步骤 1: 列出和之间的所有路径(忽略箭头方向)
步骤 2: 对每条路径,检查是否被阻断:
- 找路径上的每个中间节点
- 如果是链或分叉结构:该节点在中 → 路径被阻断
- 如果是对撞结构:该节点及其后代都不在中 → 路径被阻断
步骤 3: 如果所有路径都被阻断 → 和在给定时 d-分离
例子 1: 简单混淆
Z
/ \
↓ ↓
X → Y路径: (后门路径)和 (有向路径)
不控制任何变量:
- 路径 : 是分叉结构的中间节点,未被控制 → 路径打开
- 结论: 和不 d-分离
控制:
- 路径 : 在条件集中 → 路径被阻断
- 路径 : 有向路径,无中间节点被控制 → 路径打开
- 结论: 后门路径被阻断,但因果路径保持打开——这正是我们想要的!
例子 2: 对撞偏误
场景: 招聘
才能 → 录用 ← 关系数据: 只观察被录用的人
问题: 在被录用者中,"才能"和"关系"负相关!
分析:
- 路径: 才能 → 录用 ← 关系
- "录用"是对撞变量
- 不控制"录用": 路径阻断,才能与关系独立
- 控制"录用"(只看被录用的人): 路径打开,才能与关系出现虚假关联
原因: 控制"对撞变量"(录用)打开了路径
教训: 永远不要无意中控制对撞变量!
后门准则(Backdoor Criterion)
定义
后门准则 (Pearl 1993):
给定DAG ,变量集满足后门准则相对于,如果:
条件1: 不包含的任何后代
条件2: 阻断和之间的所有后门路径
后门路径: 从到的路径,箭头指向(即路径从的"后面"出发)
后门调整公式
如果满足后门准则:
含义: 通过条件调整,可以识别因果效应!
这就是传统回归的理论基础!
当你在回归中"控制"某些变量时,你本质上是在做后门调整。后门准则告诉你:你选择控制的变量集是否正确。
例子
Z
/ \
↓ ↓
X → Y后门路径:
满足后门准则:
- 条件1: 不是的后代 ✓
- 条件2: 阻断后门路径 ✓
因果效应:
Python:
# 通过分层估计因果效应
ate = 0
for z in z_values:
ate += P_Y_given_X_Z(Y, X, z) * P_Z(z)如何找到有效调整集
规则总结
给定 DAG 和处理-结果对:
1. 列出所有后门路径:
- 从出发,找到所有箭头指向的路径,再沿(忽略方向的)路径到达
2. 找到能阻断所有后门路径的变量集:
- 中不能包含的后代
- 要阻断每条后门路径(在每条路径上至少控制一个非对撞的中间节点)
- 不能打开任何对撞路径
3. 验证:
- 控制后,所有后门路径被阻断
- 前门路径(因果路径)保持打开
多个有效调整集
注意: 满足后门准则的变量集可能不唯一!
Z1 Z2
\ / \
↓ ↓ ↓
X → Y- 满足后门准则
- 满足后门准则
- 也满足后门准则
实践建议: 选择最小的有效调整集(包含最少变量的集合),或者选择最容易准确测量的变量组合。
后门准则与遗漏变量偏差(OVB)
联系
遗漏变量偏差(Omitted Variable Bias, OVB)是计量经济学中最重要的概念之一。后门准则为 OVB 提供了精确的图形化理解。
OVB 的图形含义: 存在未被阻断的后门路径
U (不可观测)
/ \
↓ ↓
X → Y如果不可观测(无法控制),后门路径 无法被阻断,则:
回归估计包含了因果效应通过的虚假关联——这就是 OVB。
什么情况下不存在 OVB?
充分条件: 存在一组可观测变量满足后门准则
DAG vs 潜在结果框架
两大流派对比
| 维度 | Pearl的DAG | Rubin的潜在结果 |
|---|---|---|
| 核心工具 | 图、do-算子 | |
| 识别 | 图准则(后门/前门) | 假设(CIA, SUTVA) |
| 优势 | 直观、非参数 | 统计推断严谨 |
| 劣势 | 图可能错误 | 假设难验证 |
| 适用 | 复杂因果结构 | 简单处理效应 |
统一
Imbens (2020): "The Two Approaches to Causal Inference: Structural and Reduced Form"
核心: 两者等价!
例子:
DAG: 满足后门准则相对于
Rubin:
都导出:
工具变量(IV)的图形理解
IV的DAG表示
传统IV设定:
Z → D → Y
↑ ↑
└─U─┘- : 工具变量
- : 内生处理
- : 结果
- : 不可观测混淆
IV假设的图形表述:
1. 相关性: (有边)
2. 排除性约束: 到的唯一路径是
3. 外生性: 和之间没有路径
用后门准则理解IV
问题: 估计
直接:后门路径无法阻断(不可观测)
间接: 利用!
步骤:
- 可识别(无后门路径)
- 可识别(无后门路径)
- IV估计:
本节小结
核心要点
1. d-分离: 从图结构判断条件独立性的规则
- 链/分叉中的节点: 控制后阻断路径
- 对撞节点: 不控制时阻断路径,控制后打开路径
2. 后门准则: 识别因果效应的充分条件
- 条件1: 调整集不含处理变量的后代
- 条件2: 调整集阻断所有后门路径
- 满足后门准则 → 回归调整有效
3. 后门调整公式:
4. 与 OVB 的联系: OVB = 存在未被阻断的后门路径
5. 两大框架等价: DAG 的 d-分离 ⟺ 潜在结果的条件独立性
上一节: 2.2 有向无环图基础 | 下一节: 2.4 碰撞偏差与控制变量选择