自Thistlethwaite和Campbell提出以来,断点回归设计(Regression Discontinuity Design,RDD)已成为实证研究领域不可或缺的因果推断工具。RDD的核心思想是利用得分变量在断点处的非连续性,将得分高于断点的对象分配至处理组,低于断点的分配至对照组,通过比较两组之间的差异来识别因果效应。与双重差分法(Difference-in-Differences,DID)依赖平行趋势假设及工具变量法(Instrumental Variable,IV)要求外生性与排他性假设相比,RDD的分析框架更接近自然实验,其识别假设更易于检验,并能够在较弱假设下提供可靠的因果推断结果。
近年来,RDD的应用范围不断扩大,涵盖劳动经济学(如班级规模、移民流入、教育回报)、公共财政(如税收政策效果评估)和环境经济学(如环保政策的效果评估)。
断点回归设计是一种基于得分、断点和不连续的处理分配规则来推断处理效应的因果推断方法。个体根据驱动变量的得分是否超过断点被划分至处理组或对照组,利用接受处理概率在断点处发生突变,对比处理组和对照组在结果变量上的差异来估计处理效应。
一、断点回归设计的实现过程
(一)断点回归图
断点回归图(RD Plot)是断点回归分析中的关键可视化工具,在正式估计之前能够直观展示驱动变量与结果变量的关系,为判断断点处的处理效应提供了重要的初步证据。RD图的核心功能在于通过可视化手段帮助研究者观察驱动变量跨越断点时结果变量是否存在明显的不连续性或“跳跃”,从而为验证RDD的核心假设提供支持。
(二)局部多项式回归
局部多项式回归(Local Polynomial Regression)是一种非参数估计方法,基于连续性框架捕捉断点附近的局部效应。其核心假设是结果变量与驱动变量在断点处平滑连续,通过拟合低阶多项式估计处理效应,兼具灵活性和准确性。相比全局估计方法,局部多项式回归专注于断点附近数据,避免了远端数据的干扰,尤其适合处理非线性关系。
1. 多项式阶数和核函数。在局部多项式回归中,多项式阶数的选择对估计存在较大的影响,研究者需要在估计的精确性与避免过度拟合之间找到平衡点。一般选择一阶(局部线性)、二阶(局部平方)或三阶(局部立方)回归。
2. 最优带宽。带宽选择是决定断点回归估计值精确性与稳健性的核心因素,其设定直接关系到因果效应的估计范围和推断有效性。
3. 统计推断。基于MSE最优带宽进行点估计能够提供均方误差最优的点估计值,如何对估计值的显著性进行统计检验是另一个关键问题。值得注意的是,直接使用hMSE和最小二乘的推断方法构造的置信区间是无效。
4. 控制变量。与其他因果推断方法一致,在RDD估计过程中,加入与驱动变量不相关但能够解释结果变量变异的控制变量,可以有效捕捉数据中的系统性变异,从而降低噪音对估计结果的干扰,提高因果效应估计的精度。
(三)检验RDD的有效性
作为一种准实验方法,RDD的核心优势在于处理分配依据可观测规则,使断点前后个体具有较强的可比性,有助于识别分配机制与验证模型假设。
1. 驱动变量的分布密度。断点回归的核心假设之一是个体无法系统性地操控得分以改变其是否接受处理。如果个体能够通过人为手段调整得分(如提升考试成绩或伪造收入水平),使其刻意落在断点的某一侧,则处理分配不再具有随机性,断点回归估计的因果效应可信性将显著降低。
2. 安慰剂检验。断点回归的另一关键假设是连续性假设,即在断点附近处理组与对照组必须是可比的。安慰剂检验通过检验不受处理效应影响的变量在断点附近或相关变量在非断点处的平滑性,可以帮助判断是否存在因非处理效应导致的非平滑变化,验证连续性假设是否成立。通常有检验前定变量连续性、估计不受处理影响的事后变量连续性和估计虚拟断点处的因变量变化三种方式。
3. 甜甜圈RDD。甜甜圈断点回归(Donut Regression Discontinuity,Donut RD)是一种常用的稳健性检验方法。该方法通过创建一个或多个“甜甜圈孔”(Donut Hole),逐步排除断点附近的观测值,检验潜在的测量误差、策略性行为或样本选择问题。如果剔除断点附近观测值后估计结果发生显著变化,则表明数据堆积可能对估计结果有重要影响。
二、断点回归设计的拓展
(一)机制分析
机制分析通过揭示处理变量与结果变量之间的传导路径,能够验证观测到的因果效应并非统计偶然,并有助于制定针对性的干预措施。此外,明确作用机制还有助于评估研究结论的外部有效性,帮助判断该因果效应是否能够推广至其他群体或类似政策环境。
(二)时间作为驱动变量
时间断点回归是断点回归方法的重要扩展,它以时间作为驱动变量,处理发生时间作为断点,以识别在特定时间点实施的政策或事件的因果效应。这种方法尤其适用于所有观测对象在同一时间点接受处理的情形。由于缺乏处理状态在时间维度上的变化,传统的RDD和DID往往难以适用。RDiT的核心假设是,影响结果变量的不可观测因素和其他可能干扰政策效应的因素在时间上是平滑变化的。由于时间作为驱动变量无法进行密度检验,RDiT区别于传统RDD的另一大特点是无法直接验证处理状态分配的随机性。
(三)断点回归—双重差分法
断点回归—双重差分法是断点回归设计与双重差分的核心思想的结合,为传统RDD或DID无法适用的研究场景提供了新的解决方案。具体而言,RD-DD的RD部分关注断点附近的观测值,而DID部分则引入时间维度,将断点前某一时间区间内相同驱动变量范围内的观测值作为控制组,通过比较处理组与对照组在断点前后变化的差异来估计因果效应。
RD-DD的优势在于其能够有效应对传统RD和DID方法面临的特定挑战。一方面,当断点附近存在随时间变化的混杂因素时,传统的RD可能存在识别假设不满足的问题,从而影响因果效应的估计。例如,不同日期的出生人数和婴儿特征可能存在非随机差异,不同季度企业的出口情况也可能有所不同。RD-DD通过引入时间维度,将不同时间下断点附近因变量跳跃的差异作为处理效应的估计值,能够有效消除协变量在不同时间下断点前后相同跳跃的影响,从而提高估计的准确性。另一方面,传统DID方法的核心假设是“平行趋势假设”,即处理组和对照组在未受处理时的变化趋势是一致的。然而,当处理组和对照组的时间趋势存在异质性时,DID的估计结果可能不可靠。RD-DD通过引入RDD框架,弱化了对全局平行趋势假设的依赖,仅使用断点附近的观测值进行分析,提高了处理组和对照组之间的可比性,增强了因果推断的可靠性。
(四)模糊断点回归与两阶段最小二乘估计
利用模糊断点回归估计实际处理效应时非常依赖于排他性假设。在实际研究中,排他性假设常常面临挑战,尤其是在存在溢出效应时。溢出效应指的是,处理的影响不仅局限于接受处理的个体,还波及未接受处理的个体。一方面,处理的效果可能会通过人际交往、信息传播或集体行为的变化,传递到那些未受直接干预的个体上。另一方面,处理的实施除了改变接受处理组的局部均衡外,还可能导致一般均衡的改变,从而影响未接受处理的个体。
(原文标题:《断点回归设计的实证指南:操作规范、应用误区与实践拓展》)
(作者单位:北京大学国家发展研究院;北京大学经济学院)