当前位置：首页 > news >正文

双重差分模型学习笔记（理论）

news 2025/10/30 13:37:08

【DID最全总结】90分钟带你速通双重差分！_哔哩哔哩_bilibili

一、DID的基本原理

（一）单重差分

1. Cross-Section Comparison 截面数据

只有某个时间点事件发生后的数据

D=1 事件发生后

D=0 事件发生前

2. Befor-After Vomparison 时间序列数据

有政策发生前后的数据

（二）双重差分（DID）

AI：帮我解释这两个公式的具体含义，并给出每个公式的字母该如何拼读

1. 回归模型公式

2. 平均处理效应（ATE）公式

AI：公式代码提示语　　帮我把上面的ATE公式转换为ｌａｔｅｘ格式

$\delta_3 = \left[ \mathbb{E}(Y_t + \Delta \mid X_1, \ldots, X_k, D = 1) - \mathbb{E}(Y_{t'} + \Delta \mid X_1, \ldots, X_k, D = 1) \right] - \left[ \mathbb{E}(Y_t + \Delta \mid X_1, \ldots, X_k, D = 0) - \mathbb{E}(Y_{t'} + \Delta \mid X_1, \ldots, X_k, D = 0) \right]$

含义：
这是双重差分法（DID）中平均处理效应（ATE）的定义公式：

δ3：政策干预的净效应，即处理组与对照组在政策前后的差异之差。
：处理组在时间 t（政策后）的期望结果（控制变量为X1,…,Xk）。
：处理组在时间 t′（政策前）的期望结果。
对照组（D=0）的期望差异：反映时间趋势或其他混杂因素。
核心逻辑：通过比较处理组与对照组在政策前后的变化差异，剥离政策以外的干扰因素，得到因果效应。

关键总结

回归模型：通过控制变量、时间与处理组交互项，量化政策效应（δ3 是核心参数）。
平均处理效应：利用双重差分逻辑，分离政策干预的因果影响，公式体现“差异中的差异”。
应用场景：适用于自然实验或准实验设计（如Card和Kruger的最低工资研究）。

AI提示语：Δ∥X这个是什么意思，帮我用简单易懂的案例帮我进行具体解释，我不懂什么是期望，请帮我一起详细解释

1. 符号拆解

Δ（Delta）：通常表示差异或变化量，例如工资变化、就业率变化等。
∥（竖线）：在统计学中表示条件，即“在给定某个条件下的结果”。
X：代表一个或多个控制变量（如教育水平、年龄、地区等）。

组合含义：
“Δ∥X” 表示 “在控制变量X的条件下，变化量Δ的期望值”。例如：

Δ = 工资变化，X = 教育水平
Δ∥X 可理解为：“在不同教育水平下，工资变化的平均差异”。

2. 什么是期望（Expectation）？

定义：期望是概率论中的概念，表示随机变量在长期重复实验中的平均值。简单来说，就是“平均结果”。

案例：
假设你掷一个公平的六面骰子，可能的结果是1到6。

期望值计算：　
解释：如果无限次掷骰子，平均结果会趋近于3.5。

3. 结合案例理解“Δ∥X”

场景：研究“职业培训对工资的影响”，控制变量X为“教育水平”。

Δ：参加培训后的工资变化（如月薪增加量）。
X：教育水平分为“高中以下”和“大学以上”。

问题：在不同教育水平下，职业培训带来的工资增长是否不同？

分组：
- 组1（X=高中以下）：计算该组参与培训后的平均工资变化（Δ）。
- 组2（X=大学以上）：计算该组参与培训后的平均工资变化（Δ）。
结果示例：

结论：

在控制教育水平后，职业培训对“大学以上”人群的工资提升更大。
这体现了 “Δ∥X” 的实际意义：不同条件下（如教育水平）的平均处理效应。

4. 为什么需要条件期望（Δ∥X）？

避免混淆因素：例如，如果不控制教育水平，可能会错误归因工资变化（高教育人群本身工资更高）。
精准分析：分离出政策或干预（如培训）的真实影响，排除其他变量干扰。

总结

Δ∥X = “在考虑变量X的条件下，变化量Δ的平均值”。
期望 = 长期平均结果，用于量化不确定性中的规律性。
应用场景：经济学、医学试验、政策评估中，分析不同群体对同一干预的差异化反应。

平行趋势检验

假设实验组和对照组在政策实行前的关系是平行的。

AI提示词：帮我解释这个平行趋势检验的公式，采用具体的案例帮助我理解这个公式。并解释什么是平行趋势检验，为什么要进行平行趋势检验

帮我把平行趋势检验的公式转为ｌａｔｅｘ格式，并解释每个字母的含义，并给出每个字母的拼读

1. 平行趋势检验的公式解析

用户提供的公式可拆解为以下两步：
第一行：

含义：计算实验组（D=1）在政策后时间点 t 和政策前时间点t′ 的结果差异（如就业率变化）。

第二行：

含义：将处理组在政策前后的差异与对照组（D=0）在政策前后的差异进行比较。
核心逻辑：若两组在政策前的趋势平行，则政策后的差异可归因于政策本身。

2. 什么是平行趋势检验？

定义：
平行趋势检验是双重差分法（DID）的核心假设，要求处理组和对照组在政策干预前的结果变量变化趋势一致。

目的：确保政策效应估计不受两组固有趋势差异的影响。

检验方法：

使用政策前的多期数据，比较两组的趋势是否平行。
若政策前趋势显著不同，则DID估计可能不可靠。

3. 案例：最低工资政策对就业的影响（Card & Krueger, 1994）

背景：

新泽西州（处理组）于1992年提高最低工资，宾夕法尼亚州东部（对照组）未调整。
研究问题：最低工资上涨是否导致就业下降？

平行趋势检验步骤：

选择政策前的时间段：例如1990年和1991年（政策实施前）。
比较两组的就业趋势：
- 计算新泽西州和宾夕法尼亚州在1990-1991年的就业率年均变化。
- 若两组趋势一致（如均增长2%），则平行趋势假设成立。
若趋势不一致：
- 例如新泽西州年均增长3%，宾州增长1%，则需调整模型或选择其他对照组。

4. 为什么要进行平行趋势检验？

排除混杂因素：
- 如果处理组和对照组在政策前趋势不同（如经济增速差异），政策后的结果差异可能源于原有趋势，而非政策本身。
确保因果推断的可靠性：
- 只有满足平行趋势假设，DID估计的 δ3 才能被解释为政策的净效应。

5. 公式在案例中的具体应用

假设：

Yt 表示1992年（政策后）的就业率，Yt′ 表示1991年（政策前）的就业率。
Δ=1 年（时间跨度）。

计算处理组的就业变化：

计算对照组的就业变化：

平行趋势检验公式：

6. 总结

平行趋势检验是DID方法的核心前提，确保政策效应估计的准确性。
案例应用：通过比较政策前两组的趋势，验证研究设计的合理性。
重要性：避免将固有趋势差异错误归因于政策干预。

最终结论：
在Card和Kruger的研究中，若新泽西州与宾夕法尼亚州在最低工资调整前的就业趋势平行，则后续DID分析结果（最低工资对就业无显著负面影响）具有可信度。

AI提示词：平行趋势检验是不是应该找政策前的时间点进行分析，你上面举得例子“5. 公式在案例中的具体应用假设： Yt 表示1992年（政策后）的就业率，Yt′ 表示1991年（政策前）的就业率。”我感觉不太对

1. 用户指正的正确性

您完全正确！平行趋势检验需要基于政策前的多个时间点进行分析，仅比较政策前的一个时间点（如1991年）和政策后的时间点（如1992年）不足以验证趋势是否平行。之前的举例存在简化不当，感谢您的指正！

2. 平行趋势检验的核心要求

政策前的多期数据：需要至少两个政策前的时间点（如1990年、1991年），观察处理组和对照组在这些时间点的趋势是否一致。
逻辑验证：若两组在政策前的趋势平行，则政策后的差异更有可能是政策效应，而非固有趋势差异。

3. 修正后的案例：最低工资政策对就业的影响

背景：

新泽西州（处理组）于1992年提高最低工资，宾夕法尼亚州（对照组）未调整。
数据时间点：1989年、1990年、1991年（政策前），1992年（政策后）。

平行趋势检验步骤：

计算政策前的年均就业增长率：
- 新泽西州：
  - 1989-1990年增长率：2%
  - 1990-1991年增长率：2.5%
- 宾夕法尼亚州：
  - 1989-1990年增长率：1.8%
  - 1990-1991年增长率：2.3%
检验趋势是否平行：
- 两组在政策前的增长率和变化方向（均稳步增长）接近，说明趋势平行。
- 若新泽西州政策前增长率为5%，宾州为1%，则趋势不平行，DID结果不可信。
公式修正：
平行趋势检验的公式应包含政策前的多期数据，例如：
检验统计量=(处理组政策前趋势)−(对照组政策前趋势)检验统计量=(处理组政策前趋势)−(对照组政策前趋势)
- 若统计量接近0，则通过检验。

4. 原回答的问题与修正说明

原错误：仅用1991年（政策前）和1992年（政策后）比较，无法捕捉趋势变化。
正确做法：需使用政策前的多期数据（如1989-1991年），验证趋势是否一致。

5. 为什么必须用政策前的多期数据？

单一时点无法反映趋势：例如，若1991年处理组和对照组就业率恰好相同，但1990年差异巨大，则单一时点的比较会掩盖真实趋势。
避免偶然性：多期数据减少随机波动的影响，提高检验的可靠性。

6. 总结与正确案例示范

平行趋势检验的正确逻辑：
1. 使用政策前的多期数据，分别计算处理组和对照组的趋势（如年均增长率）。
2. 比较两组趋势是否一致（如统计检验或图形展示）。
3. 若趋势平行，则DID结果可信；否则需调整模型或更换对照组。
修正后的案例结论：
- 新泽西州和宾夕法尼亚州在1989-1991年就业增长率接近（2% vs 1.8%），满足平行趋势假设。
- 因此，1992年最低工资政策后的就业差异可归因于政策效应。

最低工资对就业的影响

DID 开山之作：Card and Kruger (1994, AER)

研究问题：最低工资对就业的影响
自然实验：1992年4月1日，新泽西州的最低工资从每小时4.25美元上涨至5.05美元，而其他州未作调整。
研究设计：比较新泽西州（处理组）和宾夕法尼亚州东部（对照组）的快餐行业在最低工资上涨前后的就业情况。
数据收集：在新泽西州最低工资调整前后，研究者分别调查了该州和宾夕法尼亚州各约400家快餐店。
研究结论：分析最低工资上涨对就业的具体影响。

关键术语解释与背景补充：
DID（双重差分法）：
- 一种准实验方法，通过比较处理组与对照组在政策实施前后的差异，剥离政策净效应。
- Card和Kruger的研究是该方法在实证经济学中的里程碑应用。
自然实验（Natural Experiment）：
- 利用现实中的政策变化（如新泽西州最低工资调整）作为“实验条件”，而非人为干预。
研究意义：
- 挑战传统经济学观点（即“最低工资上涨会导致失业”），发现新泽西州快餐业就业未显著下降，甚至部分岗位增加。
- 引发对劳动力市场弹性和企业应对策略（如价格调整、效率提升）的深入讨论。
局限性：
- 样本局限于快餐行业，结论是否适用于其他低薪行业仍需验证。
- 短期效应显著，但长期影响需进一步跟踪。