内容摘要:体制转型带来了经济的高速发展,同时也导致利益分配机制的变革,从而导致我国收入差距的拉大。
关键词:收入差距;分解;教育;影响;中国农村
作者简介:
引言:体制转型带来了经济的高速发展,同时也导致利益分配机制的变革,从而导致我国收入差距的拉大。而作为整个经济体的重要组成部分,我国农村的收入分配体系经历着同样的变化趋势。在人均纯收入的决定因素中,以受教育程度为代表的人力资本因素一直是影响收入不平等的重要解释变量。理论上,教育不仅在微观层面上能够使得个人的收入得到提高,并且在宏观层面上通过提高一国的人力资本水平促进经济增长;从收入分配的角度看,教育的普及与受教育程度的提高还能够缓解贫困,改善收入分配状况。因此,将教育与收入不平等联系起来进行研究是非常必要的。而在我国农业人口居多,农村内部收入差距不断扩大的大环境下,专门研究农民受教育程度与农村内部收入差距的关系则显得更有意义。本文试图运用近几年被收入分配研究领域广为认可的分析方法——基于回归方程的夏普里值分解方法,得出教育对中国农村收入不平等贡献的比较精确的结论。
一、教育与收入不平等关系的研究评述
改革开放以来,随着农户收入水平的增长,中国农村内部收入差距总体上升趋势不断扩大,这一判断得到了国内外学者的基本认同(李实、赵人伟, 1999 )。而在解释收入差距的原因方面,已有的研究大多是通过对收入结构进行分解来进行,李实( 2003 )对这方面的研究做了一个全面的文献综述。还有一些研究尝试分析了人力资本对我国地区差距的影响,但相关的方法却又总存在令人不满意之处。首先是将人均纯收入的函数形式设定为线性形式,这样做的起点理应建立在收入服从正态分布的基础上,而且以这样的模型进行分解的后果却造成了常数项无法解释的问题。因此,收入函数至少应该用对数形式来描述(万广华, 2006 )。其次是采用了非面板数据,这样无法精确得到解释变量对因变量长期影响的趋势,造成结果的不可信。再次,这些研究对地区差异多采用的是简单的 0-1 虚拟变量,无法对不同地区对收入的差异贡献进行较细致的估算。万广华等( 2005 )还有一些研究测算教育对地区间收入差距的影响,不过由于并非专门针对教育对农村内部收入不平等的贡献,在数据的使用上大多非农户级别的数据,而是省、市级别的平均数据,因此忽略了更加微观层面上教育的异质性,也就造成了在解释教育对不平等贡献上的局限性。但其对 BOX-COX 和 BOX-Tidwel 相结合的模型的使用以及对常数项贡献作用的规避上的思路都给相关研究提供了一个很好的参照。
研究的需要催生了更好的研究方法。 Shorrocks ( 1999 )提出根据要素对不平等指数的边际效用来计算该要素对不平等的贡献的夏普里值( Shapley value )分解方法,这种处理方法建立在合作博弈理论中的夏普里值之上。 Wan(2004) 对该方法进行了改进与完善,提出了截距和残差项的处理。该研究方法能够在回归方程的基础上,根据夏普里值的思想分解出各个因素对总体收入差距的贡献程度,目前已成为近年来研究收入差距问题非常有效的方法之一。
在前人研究的基础上,本文使用 CHNS 农户级别的面板数据,运用基于回归方程的夏普里值分解方法,并采用半对数形式的农民人均纯收入函数,试图解释教育对中国农村收入不平等的贡献率,并概括出近 10 年来教育对农村收入不平等贡献率的变化趋势。本文对不同地区经济状况差异的赋值依据的是樊纲和王小鲁主编的《中国市场化指数——各地区市场化相对进程报告》中给出的各省 2000 、 2004 、 2009 的市场化指数,这也是对前人研究的一个补充。
二、模型设计和数据的统计描述
1 . 模型和方法
为了进行收入差距的分解,必须先得到一个农户级别的人均纯收入方程,为了体现在一个时间段内不平等指标的连续变化情况,我们采用了面板数据( panel )模型,农户人均纯收入函数为:
LnYit= α + ∑β iXit+uit ( 1 )
其中, Y 表示经过消费价格指数消胀的家庭人均年收入; X1 表示家庭总人口,用来代表家庭的规模经济,由于被解释变量是家庭人均收入,是否将家庭的总人口作为解释变量存在争议,这里我们采用了 Wan ( 2004 )中的做法,希望把家庭常住人口放进模型,以控制家庭类型; X2 表示家庭的人均劳动力人口,等于家庭劳动力数与家庭总人口数的比值,这个变量是以往文献中“人口负担率”的倒数。而“人口负担率”这个变量在以往的文献中的收入方程中大多显著为负,因此我们预测 X2 的系数为正; X3 表示家庭中非农就业劳动力占总劳动力的比例,一般的经验是农村中从事非农产业的劳动力比例更多会引起家庭收入的增加,因此我们预测这个变量的系数为正; X4 表示家庭人均耕地面积,系数理应为正; X5 表示调查年份下家庭的人均资本投入; X6 表示劳动力平均受教育年限;按照人力资本理论,人力资本的边际报酬递减,因此有必要往模型中加入 X7 ,以表示劳动力平均受教育年限的平方(以下 X9 同理); X8 表示劳动力的平均年龄; X9 表示劳动力平均年龄的平方,按照人力资本的边际报酬递减规律,我们预测 X6 和 X8 的系数为正, X7 和 X9 的系数为负; X10 表示各个省份经济状况的变量,本文采用樊纲和王小鲁主编的《中国市场化指数——各地区市场化相对进程报告》中给出的各省相应年份的市场化指数分别表示。
当然,按照各项收入不平等的相对指标( Gini 系数、 Thei-L 、 Theil-T )进行收入差距的夏普里值分解时需要的并非收入的对数形式,而是采用的收入的原始形式,因此我们真正进行分解的方程应该还原为:
Yit=exp( α + ∑β iXit) ( 2 )
对模型进行了拟合之后能够得到 yit= ∑β iXit 。
我们将基尼系数按集中率( Concentration Index ) 的分解公式应用于 ( 2 ) 式的两边, 则有 G (Y) = [∑ E(Xi)/E(Y) ] C(Xi) ,其中 C 表示集中率, E 表示各变量的期望。但是很容易发现这样的简单处理忽略掉了残差项的作用,这会导致分解的结果的解释力存在很大的问题。
Shorrocks(1999) 提出的方法可以确定残差项的作用,令( 2 )中的残差项等于 0 ,则有 Y(e=0)=y , G [ Y(e=0) ] =G(y) ,则我们可以定义ε对 G ( Y )的贡献率为:
CO ε =G(Y) - G(y) ( 3 )
这样的定义合理的地方在于,虽然 Y 和 y 的期望是一样的,但是由于残差项的存在,使得 G(Y) ≠ G(y) ,一方面是因为我们的模型中残差项的期望虽然等于零,但是由于残差项的波动性,导致在更多的时候 Y ≠ y ,另一方面是因为我们在计算基尼系数的过程中有一个按照变量由小到大的排序过程,由于残差项的存在,使得 Y 和 y 的排序可能出现差异, 这两方面的作用导致 G(Y) 与 G(y) 区别可能相当大。
这样,按照( 3 )去除了残差项的影响,而 G(y) 与 G(Y) 的比值就是我们将模型进行不平等分解之后对总体不平等程度的解释力度。
然后,我们只需要对模型中的β iXi 进行集中率的处理就能得到 Xi 对 y 的不平等的贡献程度。当然,每种不平等指标的计算方式是不同的,常见的进行夏普里值分解的不平等指标有 Gini 、 Theil-L 、 Theil-T 和 Atkinson 。
当然在更多的情况下,上面对模型的假设是难以实现的,首先是常数项问题,在较早的研究中, Shorrocks(1999) 也曾提出了对常数项处理的方法,但是后来学术界对这种常数项的处理方式引起了争议,究竟常数项是否影响总体不平等指数仍旧存在争议,其次是模型的线性问题,在更多的情况下经济模型是非线性模型,但是我们可以对非线性模型进行对数化或其他线性化处理,这点假设不影响我们的分析。
为了规避常数项的问题,我们借鉴了 Wan(2004) 基于对数收入方程进行了收入不平等指数的分解的方法。这样处理的好处在于将对数形式的预测收入还原为原始收入之后,常数项就成为影响收入大小的一个倍数,不再影响收入差距。因此本文中的农户人均纯收入模型采用的是半对数模型。
2 . 数据的统计描述
本文的数据来自于中国健康营养调查( CHNS )此调查由北卡罗来纳大学和中国疾病预防控制中心合作完成。该调查范围涉及全国不同地理位置、经济发展程度、公共资源水平以及健康水平的 9 个省份,分别是辽宁、黑龙江、江苏、山东、河南、湖北、湖南、广西和贵州。这 9 个省份比较有代表性地表现了中国东中西三大地区的农民生活和收入状况,也为我们的研究提供了较有力的数据支持。,我们选取了 2000 年、 2004 年和 2009 年的农村收入家庭调查数据,并将其整理为了一套面板数据。
需要说明的是,部分变量并不能从 CHNS 数据中直接获得,需要利用近似指标代替或通过相关计算获得。本文模型中的家庭劳动力人口数用家庭中年龄大于等于 16 岁并且非残疾的人口数表示,因此模型( 1 )中的 X2 为家庭中年龄大于 16 岁并且非残疾的人口数与家庭总人口数的比值;家庭资本投入为多个变量之和,包括房租、购房支出、购买机械、家用电器等固定资产支出等,以这些变量之和与家庭总人口的比值作为人均资本投入变量。
通过对 CHNS 原始数据的整理,我们得到了一套样本量为 1754 的农民家庭情况的面板数据,其中相关收入和资本数据我们已用 2009 年的价格指数进行了去胀。数据包含 153 户辽宁农户, 216 户黑龙江农户, 180 户江苏农户, 170 户山东农户, 210 户河南农户, 222 户湖北农户, 100 户湖南农户, 242 户广西农户, 261 户贵州农户。样本在这九个省份中的分布比较均匀。
表 1 为各变量的相关统计描述。
表 1 农户数据的描述性统计变量
三、教育对中国农村内部收入
差距影响的实证分析按照式( 1 ),用已得到的农户家庭的面板数据进行了回归处理,我们以农户的人均纯收入的对数为被解释变量,对模型进行了广义最小二乘估计 (GLS) ,回归结果如下:
表 2 GLS 的模型估计结果
总的来说,模型的拟合效果较好,系数都在 90% 的水平上显著,系数的符号与预期一致。家庭总人口系数为负,表示家庭规模越大,人均收入水平越低;人均劳动力人口系数为正,表示劳动力负担越低,人均收入水平越高;非农就业比例的系数为正,表示劳动力中从事非农产业的比重越高,人均收入水平越高;人均耕地面积的系数为正,表示耕地面积越多,人均收入水平越高;人均资本投入的系数显著为正,证明资本对农民纯收入的正作用;劳动力平均受教育年限的系数和劳动力平均年龄的系数为正,而劳动力平均受教育年限和劳动力平均年龄的平方的系数为负,很好的证明了我们在模型中加入这两个平方项的意义,也验证了人力资本报酬递减的规律;市场化程度系数为正,证明了农民所在省份经济环境越好,农民收入水平越高,这符合我们的预期,也符合我国的实情。
在得到了农民人均纯收入的决定方程,只需要将收入的对数形式还原成收入的原始形式,然后再利用每一期的各个解释变量的数据就能够进行不平等的分解了。
在进行分解之前,还需要计算出原始的收入数据中的收入差距情况,以判断我们的模型是否对真实的情况具有很好的解释力。这里选取基尼系数和泰尓指数作为最主要的解释收入差距的指标,其中泰尓指数分为泰尔零阶指数和泰尔一阶指数,即 Theil-L 和 Theil-T 指数。具体计算结果见
表 3 表 3 原始收入数据所反应的收入差距状况
从表 3 中可以得到这样的结论:在本世纪前十年,中国农民的收入差距是呈现不断拉大的趋势的。
根据表 2 中的模型估计结果进行收入差距的夏普里值分解,得到了在 2000 年, 2004 年和 2009 年的分解结果。由于计算量较大,人工计算非常麻烦,因此我们使用联合国大学经济发展国际研究院 (UNU-WIDER) 开发的 JAVA 程序进行了收入差距的夏普里值分解,具体结果见表 4 。
表 4 农村收入差距的夏普里值分解结果
对比表 3 和表 4 ,我们得到了不同年份的分解结果对各原始的收入差距指标的解释程度,在 2000 年中,分解结果对原始的数据的解释程度按照 Gini 系数、 Theil-L 指数和 Theil-T 指数排序分别为 57 . 85% 、 31 . 54% 和 28 . 49% ; 2004 年分别为 71 . 27% 、 47 . 73% 和 41 . 68% ; 2009 年分别为 71 . 67% 、 49 . 99% 和 45 . 23% 。三个收入差距相对指标对原始计算的解释力都无法达到 100% ,这是因为总是存在难以量化到模型中的影响收入的变量,这些变量包括社会关系、政治关系因素等。按照不同的收入差距指标的分解结果不同,是因为不同的指标对应不同的社会福利函数,并且对洛伦茨曲线的不同部分敏感程度也不同( Wan , 2004 )。我们最终选取了 Gini 系数的分解结果作为我们的正式结果,因为 Gini 系数的分解结果对原始收入差距的解释力要远高于 Theil 指数,另外 Gini 系数也是更为常用的衡量不平等的指标。
四、结果分析
结果显示家庭的规模是对农村收入差距影响最大的因素,如果我们将家庭规模和家庭的人均劳动力结合在一起考虑,这两个变量对农民收入差距的影响就更大了,三年的影响基本都达到了 35% 左右,人均劳动力越高则人口负担率越低,这样我们的结论就可以理解为家庭的劳动力越多,人口规模越小,家庭倾向于有更高的收入水平。
在这三年的分解结果中,家庭劳动力中从事非农产业的比重一直是对农村收入差距影响很大的因素,显然,农业劳动力从事非农产业对家庭收入的提高至关重要。农村劳动力大批地向城市转移,原因在于城市的非农工作的收益要远高于在农村从事农业劳动,也直接关系到这个劳动力所代表的整个家庭的收入情况,从而影响了农村的收入分配格局。相应的,农村劳动力向城市的转移使农村劳动力匮乏,也就很自然地影响了农户家庭的农业收入。结果也显示人均耕地为代表的农业直接收益对农村收入差距的贡献率正在逐渐缩小。以城市化指数所代表的各个省份的变量对农户收入差距的影响也很重要,在三年中的贡献率分别为 11 . 45% 、 14 . 28% 和 14 . 77% ,而且呈现了逐渐上升的趋势,证明村庄所在的经济环境对农民收入影响的重要性。年龄结构对农民收入差距的影响在三个时期分别达到了 13 . 85% , 17 . 13% 和 19 . 35% ,在三个时期中呈现出了逐渐上升的趋势,证明了家庭的年龄结构对家庭收入的影响很大。 这意味着平均年龄太大或者太小都形成了对家庭收入的束缚。因为老人和小孩都不能算作是劳动力,老人和小孩过多还会增加家庭的医疗开支,增加了家庭的负担,而这些负担的存在也会影响家庭中青壮劳动力进城打工的意愿,他们会考虑到进城打工将减少照顾家庭的时间,进而降低了他们进城打工的概率,从而形成对农民收入的影响。另外,资本变量对农民收入差距的影响并不明显,但有降低的趋势。
教育是本文分析的重点,首先我们发现教育对农村不平等的贡献率并不高,远小于家庭规模、劳动力以及非农就业等变量,其次我们意识到在三年中教育对收入差距的贡献率是逐渐上升的,分别为 3 . 94% 、 6 . 51% 和 7 . 51% 。这个变量的贡献率的变化反应了农村经济结构中的一些变化,人力资本在农村收入差距中的作用逐渐增加。有理由预测这个变量的作用还会继续增加,理由是随着更多的农民体验到了教育所带来的收益,农民势必会加大对后代的教育投入,而是否有机会获得更高的受教育程度将直接影响农民的收入。但教育本身是存在不平等的,富人比穷人将会获得更好的受教育机会,这点也决定了教育可能会更加地扩大农村中穷人和富人的收入差距。
在以往的研究中,万广华( 2004 )中曾利用微观数据分析过我国农村收入差距。与之相比,由于变量的采用不尽相同,我们仅比较教育农村收入不平等的贡献率,万广华( 2004 )的研究中, 2000 年中教育对农村收入差距的贡献率仅为 1 . 69% ,小于我们研究中的 3 . 94% 。而造成这点差距的原因在于前者将更多的对农村收入差距的贡献归根于了“村虚拟变量”,使得其他解释变量的贡献度偏低,也就影响到了教育对农村收入差距的贡献度。而由于我们获得了更精细的面板数据样本,因此可以将更多的地区差距因素归根到教育、资本以及其他的解释变量之中去。这一点不难理解,因为地区差距对农村总差距的贡献总是通过改变地区中的这些影响收入的变量以实现的。将地区差距的贡献弱化,实质上可以得到各个解释变量对总体收入差距的更为精确的贡献。
五、进一步的讨论
本文利用基于回归方程的夏普里值分解方法对我们估计的农民年人均纯收入模型进行了不平等的分解,测算了教育、资本等因素对农村收入差距的贡献程度。本文所采用的数据是家计的面板数据,较有连续性。
我们之所以重视教育的作用,也是因为在诸多变量中,教育能够在政策层面有所体现。政府可以通过影响教育的相关政策来实现一定的政策目标。一般地,教育影响居民收入差距的原因在于居民受教育程度的差异,以及在长期内教育收益率的变化。不过我们使用的面板数据的计量模型并没有考虑教育收益率的变动。况且,教育收益率的变动时市场调节的结果,未必是政策应该干预的范畴。那么,为缓解收入差距,缩小教育水平的差距就变得非常重要。而且,我们的研究结果显示进入新世纪以来教育对中国农村收入差距的影响呈现了不断加大的趋势,更增加了这一问题的紧迫性。因此政府制定相应的措施以保证农民获得更为公平的受教育机会,包括提高落后地区教育的投入以缩小教育发展水平的地区差、完善义务教育和降低辍学率等。另外,也需要提高农村地区高中教育和中等职业技术教育的水平,以及让更多的农村劳动力获得培训的机会。
当然,还有教育质量的差异也会产生巨大的影响,但是当前的数据只是用受教育年限来表示个体的教育水平,显然也会忽略掉一些重要的信息。这是后续工作需要进一步完善的地方。
[参考文献]
[ 1 ] Shorrocks, Anthony F. , 1999. Decomposition Procedures for Distributional Analysis: A Unified Framework Based on the Shaply value. Unpublished Manuscript . Department of Economics, University of Essex.
[ 2 ] Wan Guanghua,2004, “ Acounting for Income Inequality in Rural China: a Regression-based Approach ” ,Journal of Comparative Economics,32,348-363
[ 3 ]樊纲、王小鲁 . 中国市场化指数———各地区市场化相对进程报告[ M ] . 北京 : 经济科学出版社 .
[ 4 ]李实、赵人伟 . 中国居民收入分配再研究[ J ] . 经济研究 ,1994,(4).
[ 5 ]李实 . 中国个人收入分配研究回顾与展望[ J ] . 经济学(季刊) ,2003,2(2).
[ 6 ]万广华 . 解释中国农村区域间的收入不平等 : 一种基于回归方程的分解方法[ J ] . 经济研究 ,2004,(8).
[ 7 ]万广华 , 陆铭 , 陈钊 . 全球化与地区间的收入差距:来自中国的证据[ J ] . 中国社会科学 ,2005,(3).
[ 8 ]万广华,张藕香 . 人力资本与我国农村地区收入差距:研究方法和实证分析[ J ] . 农业技术经济 ,2006,(5).







