自20世纪80年代“可信度革命”兴起以来,经济学的经验研究发生了深刻的变化,不仅更加强调研究设计的重要性,即基于实验和准实验数据,运用计量经济学中的方法,识别和论证经济现象之间的因果关系,而且更加重视研究方法运用的可信度与有效性。社会经济活动中的各种关系错综复杂,验证特定的因果关系常常需要处理内生性问题,其中,工具变量法是一个经常使用的方法。
(一)操作清单
1.确定观测对象的份额权重和具体的政策冲击。此时需要将两个数据集合并,一个是包含观测对象信息的数据集(数据集1),另一个是量化出的政策冲击数据集(数据集2)。例如,研究进口扩张对就业的影响时,通过地区的份额权重将进口扩张进行加权分解,则数据集1的结构为地区行业的相关信息,数据集2的结构为国家—行业层面的进口贸易总额,并通过两个数据集中的行业信息进行数据匹配与合并。当计算观测对象的份额权重时,有两种处理方式,若政策冲击不可能对某些领域产生影响,则在计算权重时剔除这一部分;若政策冲击对所有领域都有可能产生影响,则在计算权重时应包含所有领域。
当计算政策冲击时,需要确定合理的分类标准,平衡好可操作性和样本有效性。
2.确定模型设定是基于份额权重的研究设计,还是基于政策冲击的研究设计。若是一种基于份额权重的研究设计时,则将基于Bartik工具变量得到的回归系数与使用份额权重作为工具变量得到的回归系数视为等价,需要满足份额权重的相关性和外生性条件。若是一种基于政策冲击的研究设计时,则将基于Bartik工具变量得到的回归系数与使用政策冲击作为工具变量得到的回归系数视为等价,需要满足政策冲击的准随机性和大样本要求。
3.检验回归估计是否满足相应的应用条件。当回归估计是由份额权重满足应用条件时,份额权重的相关关系检验应表明份额权重不会通过其他渠道对被解释变量产生影响,平行趋势检验应表明份额权重不会在政策冲击发生前对被解释变量产生显著影响,替代估计方法应表明不同估计量之间没有显著差异。当回归估计是由政策冲击满足应用条件时,政策冲击的统计特征分析应表现出分布差异较大的特征,组内相关系数检验应表明不同组别的政策冲击之间存在着显著差异,安慰剂检验应表明政策冲击对行业、地区等特征变量没有显著影响。
4.通过数值模拟来评估工具变量回归的有效性和可信度。当模拟生成的工具变量和随机抽取的观测样本所得的估计系数在数值上接近于0、拒绝原假设(系数为0)的概率大于5%,并且在不同模拟情况下所得结果未受到显著影响,则可以认为Bartik工具变量的回归结果是可信的。
近年来,全球贸易体系经历着巨大变革,贸易政策的制定和调整对国家发展具有深远影响,准确识别贸易政策的因果效应,对理解经济社会变迁具有重要的理论和现实意义。贸易政策变动与经济环境变化之间的交互作用往往使简单的统计关联存在严重的内生性问题,不能直接解释为因果关系。在这样的背景下,Bartik工具变量法为解决上述研究问题提供了一个有效可行的新思路。同时,贸易冲击的量化指标丰富,影响到的行业众多,在Bartik工具变量的构建与应用中涉及的细节问题也较多,这为该方法的实际应用提供了全面展示的机会。
二、Bartik工具变量法的发展脉络
在构建Bartik工具变量用于因果识别时,存在两个核心部分,一是确定份额权重,二是量化政策冲击。可见,份额权重的选择对Bartik工具变量法的应用具有重要的影响。因此,本部分以Bartik工具变量法在变量构建中的份额权重设定为线索,梳理了该方法的应用与发展。
1.基于Bartik经典设计的份额权重设定。
Bartik工具变量法的首次正式应用是在劳动经济学的研究中。学者Timothy J.Bartik在评估美国各州和地区经济发展政策效应时,将25个大都市统计区在1970年的就业比例与国家层面1972~1973年和1985~1986年的就业增长率交乘,以此将国家层面的就业增长分解到微观地区层面,作为地区就业增长率的工具变量进行回归估计。Bartik工具变量法由此得名,而后在Blanchard和Katz的研究中被应用推广。Blanchard和Kat基于美国50个州在1970~1989年的就业数据,以各州前置期两位数行业分类代码下各行业的就业比例作为权重,对国家层面各行业(加总至两位数行业分类代码)的就业增长率进行加权分解,作为各州就业增长率的工具变量,进而识别其与工资变化、失业率变化之间的因果关系。早期研究基本是将地区—行业的就业份额作为权重,对国家—行业层面的就业变化进行加权分解。这种以就业比例为权重,加权分解就业变化的研究设计,也被后续众多学者沿用。
随后,学者们基于相同的份额权重设定方式,开始选择不同的政策影响进行因果识别。Topalova、Autor等等学者以地区就业比例为份额权重,对国家关税削减、进出口扩张等贸易政策变化带来的影响进行加权分解。Diamond、毛其淋和盛斌等学者采用类似的方式,将国家层面的工资收入水平分解到地区层面,进而展开实证检验。伴随科技革命的深入推进,人工智能技术迅速发展,并成为学者和研究人员日益重视的热点问题,Acemoglu和Restrepo、陈媛媛等、王晓娟等、许健等、董直庆等、何小钢和刘叩明等学者基于Bartik工具变量法的思路,以地区的就业比例为权重,将行业层面的机器人渗透率分解到地区层面,识别了人工智能与工资、就业、劳动力流动和企业规模分布之间的因果关系。王永钦和董雯、沈坤荣等则以企业生产部门员工占比和制造业生产部门员工占比的比值为权重,进一步将数据分解到企业层面,从企业层面检验了机器人应用的因果效应。
2.拓展Bartik经典设计的份额权重设定。
伴随着学术研究的深入,学者们参考和借鉴Bartik工具变量的核心构建思路,对份额权重加以变形和转化,并展开了研究分析,推广和拓展了Bartik工具变量法的使用范围。这类拓展应用源于Card的研究,Card为了检验政策变化引致的外来劳动力流入对本地劳动力和区域劳动力市场产生的影响,采用Bartik工具变量法,将国家层面的移民流入按各地区早期的移民流入结构进行加权分解,以解决因果识别中由劳动需求冲击导致的内生性问题。此后,大量有关劳动力流动和移民问题的影响研究都借鉴了该方法,基于相同的份额权重构建了Bartik工具变量,进而实证检验了政策的因果效应。
由于微观数据可获得性的提高和研究方法的推广,越来越多的学者从理论模型和现实经济环境出发,选取了各类不同政策冲击和相应的份额权重,运用Bartik工具变量法检验政策和影响间的因果关系。Hummels等、毛日昇和陈瑶雯等学者以进出口贸易结构为份额权重,构建了地区或企业层面的Bartik工具变量。在数字化浪潮下,沈国兵和袁征宇、方明月等、董松柯等、何雅兴等、刘诚、卢福财等、周亚虹等和申志轩等均采用Bartik工具变量法的构建思路,分别以企业数字化转型程度占比、城市特牌酒店占比、县域普惠金融指数和企业数字采购订单数占比等为份额权重,构建了不同层面的Bartik工具变量,用于识别数字化发展进程中的各种因果效应。此外,陈诗一和陈登科、杜鹏程等、毛捷和曹婧、郝颖等、毛其淋等、江鑫等众多学者在识别环境污染、社会保险、税费改革、经济集聚、贸易网络深化和政府绿色采购等影响时,也选取了合适的评估对象和权重,通过Bartik工具变量法展开研究分析。
系统梳理Bartik工具变量法在研究中的应用,可以发现最初使用该方法的研究均延续了Bartik的经典设定。随着学术研究的深入,学者们逐渐开始对经典设定进行变形转化,进一步拓展了Bartik工具变量法的应用场景。然而,在众多国内经济学经验研究中,鲜少有学者关注到Bartik工具变量在构建过程中需要注意的细节问题,也很少判断和检验其研究设计中是否满足Bartik工具变量法在因果识别中的应用条件。这既不利于实证研究的可信度,也不利于因果识别的规范发展。
原文标题《Bartik工具变量法在因果识别中的应用与检验》
【作者单位:武汉大学经济与管理学院;湖北经济学院新财经交叉学科研究院(数字经济学院)】