Skip to content

2.3 d-分离与后门准则

从图结构中"读出"因果效应的可识别性

难度方法应用


d-分离(d-Separation)

d-分离定义

d-separation (d-分离):

给定条件集,如果之间的所有路径都被"阻断",则称 d-分离

阻断规则

路径被阻断,当且仅当路径上存在节点满足:

  1. 链或分叉: 在条件集

    X → M → Y   (控制M → 阻断)
    X ← M → Y   (控制M → 阻断)
  2. 对撞: 及其所有后代都不在

    X → M ← Y   (不控制M → 阻断)
    X → M ← Y   (控制M → 打开!)

d-分离的含义

直觉: 图结构蕴含统计独立性!

如果 DAG 告诉我们在给定时 d-分离,那么在数据中,在控制后应该是统计独立的。


d-分离判断步骤

系统方法

给定 DAG 和条件集,判断是否 d-分离:

步骤 1: 列出之间的所有路径(忽略箭头方向)

步骤 2: 对每条路径,检查是否被阻断:

  • 找路径上的每个中间节点
  • 如果是链或分叉结构:该节点在中 → 路径被阻断
  • 如果是对撞结构:该节点及其后代都不在中 → 路径被阻断

步骤 3: 如果所有路径都被阻断 → 在给定时 d-分离

例子 1: 简单混淆

DAG:
      Z
     / \
    ↓   ↓
    X → Y

路径: (后门路径)和 (有向路径)

不控制任何变量:

  • 路径 : 是分叉结构的中间节点,未被控制 → 路径打开
  • 结论: d-分离

控制:

  • 路径 : 在条件集中 → 路径被阻断
  • 路径 : 有向路径,无中间节点被控制 → 路径打开
  • 结论: 后门路径被阻断,但因果路径保持打开——这正是我们想要的!

例子 2: 对撞偏误

场景: 招聘

DAG:
    才能 → 录用 ← 关系

数据: 只观察被录用的人

问题: 在被录用者中,"才能"和"关系"负相关!

分析:

  • 路径: 才能 → 录用 ← 关系
  • "录用"是对撞变量
  • 不控制"录用": 路径阻断,才能与关系独立
  • 控制"录用"(只看被录用的人): 路径打开,才能与关系出现虚假关联

原因: 控制"对撞变量"(录用)打开了路径

教训: 永远不要无意中控制对撞变量!


后门准则(Backdoor Criterion)

定义

后门准则 (Pearl 1993):

给定DAG ,变量集满足后门准则相对于,如果:

条件1: 不包含的任何后代

条件2: 阻断之间的所有后门路径

后门路径: 从的路径,箭头指向(即路径从的"后面"出发)

后门调整公式

如果满足后门准则:

含义: 通过条件调整,可以识别因果效应!

这就是传统回归的理论基础!

当你在回归中"控制"某些变量时,你本质上是在做后门调整。后门准则告诉你:你选择控制的变量集是否正确。


例子

DAG:
      Z
     / \
    ↓   ↓
    X → Y

后门路径:

满足后门准则:

  • 条件1: 不是的后代 ✓
  • 条件2: 阻断后门路径

因果效应:

Python:

python
# 通过分层估计因果效应
ate = 0
for z in z_values:
    ate += P_Y_given_X_Z(Y, X, z) * P_Z(z)

如何找到有效调整集

规则总结

给定 DAG 和处理-结果对:

1. 列出所有后门路径:

  • 出发,找到所有箭头指向的路径,再沿(忽略方向的)路径到达

2. 找到能阻断所有后门路径的变量集:

  • 中不能包含的后代
  • 要阻断每条后门路径(在每条路径上至少控制一个非对撞的中间节点)
  • 不能打开任何对撞路径

3. 验证:

  • 控制后,所有后门路径被阻断
  • 前门路径(因果路径)保持打开

多个有效调整集

注意: 满足后门准则的变量集可能不唯一!

DAG:
      Z1    Z2
       \   /  \
        ↓ ↓    ↓
        X  →   Y
  • 满足后门准则
  • 满足后门准则
  • 也满足后门准则

实践建议: 选择最小的有效调整集(包含最少变量的集合),或者选择最容易准确测量的变量组合。


后门准则与遗漏变量偏差(OVB)

联系

遗漏变量偏差(Omitted Variable Bias, OVB)是计量经济学中最重要的概念之一。后门准则为 OVB 提供了精确的图形化理解。

OVB 的图形含义: 存在未被阻断的后门路径

DAG:
      U (不可观测)
     / \
    ↓   ↓
    X → Y

如果不可观测(无法控制),后门路径 无法被阻断,则:

回归估计包含了因果效应通过的虚假关联——这就是 OVB。

什么情况下不存在 OVB?

充分条件: 存在一组可观测变量满足后门准则


DAG vs 潜在结果框架

两大流派对比

维度Pearl的DAGRubin的潜在结果
核心工具图、do-算子
识别图准则(后门/前门)假设(CIA, SUTVA)
优势直观、非参数统计推断严谨
劣势图可能错误假设难验证
适用复杂因果结构简单处理效应

统一

Imbens (2020): "The Two Approaches to Causal Inference: Structural and Reduced Form"

核心: 两者等价!

例子:

DAG: 满足后门准则相对于

Rubin:

都导出:


工具变量(IV)的图形理解

IV的DAG表示

传统IV设定:

    Z → D → Y
         ↑   ↑
         └─U─┘
  • : 工具变量
  • : 内生处理
  • : 结果
  • : 不可观测混淆

IV假设的图形表述:

1. 相关性: (有边)

2. 排除性约束: 的唯一路径是

3. 外生性: 之间没有路径

用后门准则理解IV

问题: 估计

直接:后门路径无法阻断(不可观测)

间接: 利用!

步骤:

  1. 可识别(无后门路径)
  2. 可识别(无后门路径)
  3. IV估计:

本节小结

核心要点

1. d-分离: 从图结构判断条件独立性的规则

  • 链/分叉中的节点: 控制后阻断路径
  • 对撞节点: 不控制时阻断路径,控制后打开路径

2. 后门准则: 识别因果效应的充分条件

  • 条件1: 调整集不含处理变量的后代
  • 条件2: 调整集阻断所有后门路径
  • 满足后门准则 → 回归调整有效

3. 后门调整公式:

4. 与 OVB 的联系: OVB = 存在未被阻断的后门路径

5. 两大框架等价: DAG 的 d-分离 ⟺ 潜在结果的条件独立性


上一节: 2.2 有向无环图基础 | 下一节: 2.4 碰撞偏差与控制变量选择

基于 MIT 许可证发布。内容版权归作者所有。