2.3 d-分离与后门准则

从图结构中"读出"因果效应的可识别性

d-分离(d-Separation)

d-分离定义

d-separation (d-分离):

给定条件集,如果和之间的所有路径都被"阻断",则称和 d-分离。

阻断规则

路径被阻断,当且仅当路径上存在节点满足:

链或分叉: 在条件集中

X → M → Y   (控制M → 阻断)
X ← M → Y   (控制M → 阻断)

对撞: 及其所有后代都不在中

X → M ← Y   (不控制M → 阻断)
X → M ← Y   (控制M → 打开!)

d-分离的含义

直觉: 图结构蕴含统计独立性!

如果 DAG 告诉我们和在给定时 d-分离,那么在数据中,和在控制后应该是统计独立的。

d-分离判断步骤

系统方法

给定 DAG 和条件集,判断和是否 d-分离:

步骤 1: 列出和之间的所有路径（忽略箭头方向）

步骤 2: 对每条路径,检查是否被阻断:

找路径上的每个中间节点
如果是链或分叉结构:该节点在中 → 路径被阻断
如果是对撞结构:该节点及其后代都不在中 → 路径被阻断

步骤 3: 如果所有路径都被阻断 → 和在给定时 d-分离

例子 1: 简单混淆

DAG:

      Z
     / \
    ↓   ↓
    X → Y

路径: （后门路径）和（有向路径）

不控制任何变量:

路径 : 是分叉结构的中间节点,未被控制 → 路径打开
结论: 和不 d-分离

控制:

路径 : 在条件集中 → 路径被阻断
路径 : 有向路径,无中间节点被控制 → 路径打开
结论: 后门路径被阻断,但因果路径保持打开——这正是我们想要的!

例子 2: 对撞偏误

场景: 招聘

DAG:

    才能 → 录用 ← 关系

数据: 只观察被录用的人

问题: 在被录用者中,"才能"和"关系"负相关!

分析:

路径: 才能 → 录用 ← 关系
"录用"是对撞变量
不控制"录用": 路径阻断,才能与关系独立
控制"录用"（只看被录用的人）: 路径打开,才能与关系出现虚假关联

原因: 控制"对撞变量"(录用)打开了路径

教训: 永远不要无意中控制对撞变量!

后门准则(Backdoor Criterion)

定义

后门准则 (Pearl 1993):

给定DAG ,变量集满足后门准则相对于,如果:

条件1: 不包含的任何后代

条件2: 阻断和之间的所有后门路径

后门路径: 从到的路径,箭头指向（即路径从的"后面"出发）

后门调整公式

如果满足后门准则:

含义: 通过条件调整,可以识别因果效应!

这就是传统回归的理论基础!

当你在回归中"控制"某些变量时,你本质上是在做后门调整。后门准则告诉你:你选择控制的变量集是否正确。

例子

DAG:

      Z
     / \
    ↓   ↓
    X → Y

后门路径:

满足后门准则:

条件1: 不是的后代 ✓
条件2: 阻断后门路径 ✓

因果效应:

Python:

python

# 通过分层估计因果效应
ate = 0
for z in z_values:
    ate += P_Y_given_X_Z(Y, X, z) * P_Z(z)

如何找到有效调整集

规则总结

给定 DAG 和处理-结果对:

1. 列出所有后门路径:

从出发,找到所有箭头指向的路径,再沿（忽略方向的）路径到达

2. 找到能阻断所有后门路径的变量集:

中不能包含的后代
要阻断每条后门路径（在每条路径上至少控制一个非对撞的中间节点）
不能打开任何对撞路径

3. 验证:

控制后,所有后门路径被阻断
前门路径（因果路径）保持打开

多个有效调整集

注意: 满足后门准则的变量集可能不唯一!

DAG:

满足后门准则
满足后门准则
也满足后门准则

实践建议: 选择最小的有效调整集（包含最少变量的集合），或者选择最容易准确测量的变量组合。

后门准则与遗漏变量偏差(OVB)

联系

遗漏变量偏差(Omitted Variable Bias, OVB)是计量经济学中最重要的概念之一。后门准则为 OVB 提供了精确的图形化理解。

OVB 的图形含义: 存在未被阻断的后门路径

DAG:

      U (不可观测)
     / \
    ↓   ↓
    X → Y

如果不可观测（无法控制），后门路径无法被阻断，则：

回归估计包含了因果效应通过的虚假关联——这就是 OVB。

什么情况下不存在 OVB?

充分条件: 存在一组可观测变量满足后门准则

DAG vs 潜在结果框架

两大流派对比

维度	Pearl的DAG	Rubin的潜在结果
核心工具	图、do-算子
识别	图准则(后门/前门)	假设(CIA, SUTVA)
优势	直观、非参数	统计推断严谨
劣势	图可能错误	假设难验证
适用	复杂因果结构	简单处理效应

统一

Imbens (2020): "The Two Approaches to Causal Inference: Structural and Reduced Form"

核心: 两者等价!

例子:

DAG: 满足后门准则相对于

Rubin:

都导出:

工具变量(IV)的图形理解

IV的DAG表示

传统IV设定:

    Z → D → Y
         ↑   ↑
         └─U─┘

: 工具变量
: 内生处理
: 结果
: 不可观测混淆

IV假设的图形表述:

1. 相关性: (有边)

2. 排除性约束: 到的唯一路径是

3. 外生性: 和之间没有路径

用后门准则理解IV

问题: 估计

直接:后门路径无法阻断(不可观测)

间接: 利用!

步骤:

可识别(无后门路径)
可识别(无后门路径)
IV估计:

本节小结

核心要点

1. d-分离: 从图结构判断条件独立性的规则

链/分叉中的节点: 控制后阻断路径
对撞节点: 不控制时阻断路径,控制后打开路径

2. 后门准则: 识别因果效应的充分条件

条件1: 调整集不含处理变量的后代
条件2: 调整集阻断所有后门路径
满足后门准则 → 回归调整有效

3. 后门调整公式:

4. 与 OVB 的联系: OVB = 存在未被阻断的后门路径

5. 两大框架等价: DAG 的 d-分离 ⟺ 潜在结果的条件独立性

上一节: 2.2 有向无环图基础 | 下一节: 2.4 碰撞偏差与控制变量选择

2.3 d-分离与后门准则 ​

d-分离(d-Separation) ​

d-分离定义 ​

阻断规则 ​

d-分离的含义 ​

d-分离判断步骤 ​

系统方法 ​

例子 1: 简单混淆 ​

例子 2: 对撞偏误 ​

后门准则(Backdoor Criterion) ​

定义 ​

后门调整公式 ​

例子 ​

如何找到有效调整集 ​

规则总结 ​

多个有效调整集 ​

后门准则与遗漏变量偏差(OVB) ​

联系 ​

什么情况下不存在 OVB? ​

DAG vs 潜在结果框架 ​

两大流派对比 ​

统一 ​

工具变量(IV)的图形理解 ​

IV的DAG表示 ​

用后门准则理解IV ​

本节小结 ​

核心要点 ​

2.3 d-分离与后门准则

d-分离(d-Separation)

d-分离定义

阻断规则

d-分离的含义

d-分离判断步骤

系统方法

例子 1: 简单混淆

例子 2: 对撞偏误

后门准则(Backdoor Criterion)

定义

后门调整公式

例子

如何找到有效调整集

规则总结

多个有效调整集

后门准则与遗漏变量偏差(OVB)

联系

什么情况下不存在 OVB?

DAG vs 潜在结果框架

两大流派对比

统一

工具变量(IV)的图形理解

IV的DAG表示

用后门准则理解IV

本节小结

核心要点