数据资本估算及对中国经济增长的贡献——基于数据价值链的视角

2023-11-20 作者:刘涛雄 戎珂 张亚迪 来源:《中国社会科学》2023年第10期

微信公众号

分享
链接已复制

摘  要:随着数字经济的蓬勃发展,数据资本对中国经济增长的重要性日益显现。数据经过采集、清洗、存储、加工等各环节,不断积累价值形成数据资本。基于数据价值链的视角,使用成本法和增值法估算价值层面的数据资本形成额与数据资本存量,用存储规模法估算物理层面的数据规模,基于数据资本估算结果利用省级面板模型估计其对经济增长的贡献,可以发现:2003—2020年间,我国数据资本形成额、数据资本存量在总量和人均上均实现大幅度增长,增速明显快于GDP增速;2011年后,数据资本对经济增长的产出弹性和对经济增长率的贡献均明显超过之前阶段,已成为中国经济增长重要动能之一。

关键词:数据资本;数据价值链;增值法;经济增长

作者刘涛雄,清华大学社会科学学院教授(北京100084);戎珂,清华大学社会科学学院教授(北京100084);张亚迪,北京交通大学经济管理学院助理教授(北京100044)。

  引言

  随着数字经济的蓬勃发展,数据更加深入地参与到各类生产活动之中。数据可以在研发部门参与知识的生产,也可以用于生产部门提升生产效率,被称为“数字经济时代的石油”。数据是指利用一定的信息技术手段所形成的对信息的数字化记载。物理意义的数据经过采集、清洗与存储、加工等步骤,逐步形成具有生产价值的数据。从经济学视角来讲,具有生产价值的数据为“数据资本”,其积累的存量为“数据资本存量”,每年新形成的数据资本则为“数据资本形成额”。要进一步证实和度量数据在经济活动中的作用,一个基础性工作就是理清一个经济体中到底有多少数据资本。因此,理解数据资本形成的过程,科学度量我国数据资本的存量、分布及走势,进而客观评价其对经济增长的贡献,引导其更好地发挥经济价值,在理论或实践层面都已成为一个十分重要和迫切的课题。

  当前,国内数据资本的估算尚处于探索阶段,鲜有公开发表的估算成果。现有研究借鉴关于物质资本、人力资本、基础设施资本等的已有方法,认为数据资本估算可采用市场法、收益法和成本法等三类方法。市场法基于与数据相关的同类物品的近期市场交易价格或者市场价格等价物来估算数据资本形成额。但当前数据要素市场并不成熟,可供参考的市场交易价格甚至市场价格等价物难以获取。收益法基于数据在未来能够获取到的预期收益,通过折现来估算数据资本。而当前数据缺乏成熟数据要素市场的支撑,实际操作过程中对数据预期收入的估算存在诸多不确定性,无法进行准确预测。成本法基于数据价值获取过程中的各类成本来估算数据资本形成额。从数据的可获取性以及既有实践来看,成本法是现阶段对数据资本形成额进行估算最为可行的方法。目前加拿大统计局(Canada Statistics)以及美国商务部经济分析局(BEA)的相关估算都是基于成本法,中国资产评估协会以及中国信息通信研究院也同样建议采纳成本法作为数据资本估算的主要方法。

  国际上关于数据资本的估算也处于探索阶段,少量可参考的工作都是基于成本法。加拿大统计局在2019年和美国BEA在2022年的估算逻辑类似,都是通过对数据价值链的分析,分别估算从事数据价值链中相关工作的就业人员的劳动力成本以及生产数据资本的非劳动力成本,进而用每一年总和的成本去度量新增的数据资本形成额。但目前各国都没有关于数据生产所消耗的劳动力成本和资本成本的调查统计,因而必须借助其他方法。其中,美国BEA在劳动力成本估算方面相对精细一些,采用机器学习对不同职业与数据的相关程度进行了估算,从而确定这些职业的劳动力成本中有多大比例可以算入数据相关的劳动力成本之中。

  现有成本法也存在明显不足。首先,从数据价值形成的规律看,在数据生产的不同阶段,同样成本所积累形成的价值量可能并不相同,比如从事数据采集和从事数据分析各自耗费的一个单位劳动对数据价值量的影响可能十分不同,现在对中国数据资本估算的讨论都忽略了这一点。其次,更重要的是,数据资本估算的基本逻辑是价值量估算,采用成本法进行估算的前提是数据生产的成本大体和数据的价值量相当,但这一点难以实现。一个突出问题是,数据的价值和数据分析的技术水平密切相关,在数字经济发展早期,算力和算法水平相对较低,用成本法估算的数据资本,其价值明显会被低估。再次,实际估算工作中也面临数据来源不足的问题。比如,相比发达国家,我国关于数据生产的劳动力成本的统计数据基本没有直接的统计资料,现有文献没有针对我国的情况提出可行的解决方案。最后,除了在价值层面估算数据资本,在物理层面对数据存储规模进行估算同样有必要,现有研究忽视了这一点。对物理层面的数据资本进行估算,可以最终获取单位存储的数据资本价值,从而为数据要素市场的构建提供更好支撑。由以上可见,基于现有框架对中国数据资本进行估算,难以得到关于数据资本存量的科学度量,进而难以得到关于数据资本对经济增长贡献的客观评价。特别是,很可能低估数据资本存量,进而低估其对经济增长的贡献。

  本文将数据价值链划分为数据采集、数据清洗与存储、数据加工三个环节,基于三个环节构建数据生产的经济学模型,论证成本法的经济学原理及其存在的问题。进而基于价值链的视角,考虑数据分析技术发展带来的数据价值增值,在成本法基础上提出了增值法。增值法可以更直接地反映数据要素的本质特征,即数据分析技术的进步会提升数据的价值,解决成本法会低估数据资本存量这一问题。本文利用成本法、增值法及存储规模法等三种方法,从价值层面和物理层面对我国数据资本存量做出系统估算,刻画其随时间的动态演进特征。其中,本文采用机器学习的方法,基于我国职业大典中各类职业的详细描述,估算了数据生产三个环节中各个职业分配给数据相关工作的时间比例,对三个环节中的劳动力成本进行了详细估算。使用分省数据资本存量的估算结果,本文对中国经济增长过程中数据资本的产出弹性及其对中国经济增长率的贡献率进行实证检验,发现在数字经济快速发展的2011—2019年,数据要素无论在经济增长的产出弹性还是对经济增长率的平均贡献率上,均已成为中国经济增长重要的动能。本文研究发现,过往估算所采用的简单成本法存在低估数据资本贡献的可能。

  一、基于价值链的数据资本估算方法

 

  二、中国数据资本估算过程与结果

  三、数据资本对中国经济增长的贡献

 

 

  结论

  本文从数据价值链视角出发,基于数据采集、数据清洗与存储、数据加工三个环节重构了成本法,并通过考虑数据分析技术带来的数据价值增值提出增值法。利用成本法、增值法及存储规模法三种方法,从价值层面和物理层面对我国全国及省际数据资本存量做出系统估算。尤其采用机器学习的方法,基于我国《职业大典》中各类职业的详细描述,估算了数据价值链三个环节中各个职业从事数据相关工作的时间占比,对中国数据生产三个环节中的劳动力成本进行了详细的估算。估算结果表明,2003—2020年,我国数据资本存量在总量和人均上均实现大幅度增长,人均数据资本存量和人均GDP的比例从2003年的0.11增长到2020年的0.32,增长至近3倍。

  基于数据资本存量估算结果,本文利用面板模型估计数据资本存量对中国经济增长的贡献。可以发现,近年来数据资本对增长的贡献相对于以前明显加大,已成为中国经济增长的重要动能。2003—2019年,数据资本每增加1%,可以带动GDP增长约0.11%,对经济增长率的平均贡献率为16.30%;2011—2019年期间数据资本的产出弹性达到0.19,数据资本对经济增长率的平均贡献率达到34.46%。

  当然,本文的估算结果依赖于对数据资本折旧率、数据相关企业增长率等参数的前置假定。若参数设置不合理,例如设定了过低的数据资本折旧率或者过高的数据相关企业增长率,可能会导致对数据资本存量的高估。今后随着相关统计资料的不断完善,可以不断改进参数设置,进而提高估算的准确性。

  基于上述研究结果,本文提出如下建议。

  第一,立足数据资本形成的价值链规律,积极发展人工智能(AI)等相关数据分析技术,提升数据资本存量。本文利用增值法估算发现,数据分析技术的提升会对已有数据带来价值增值。例如,ChatGPT的横空出世不仅在很大程度上依赖于海量的数据,也反过来提升了这些数据的价值。因此,在不断积累新数据的同时,也应积极发展以AI为代表的数据分析技术,提升数据价值,助力数据资本积累。

  第二,基于数据价值链的三大环节,优化数据产业空间布局,发挥各自比较优势,实现区域间更好的协同互补。本文估算结果表明,数据资本存量地区分布不均衡。经济发展水平高、互联网经济发达的东部地区省份数据资源丰富,数据资本存量相对较高。而东部地区的比较优势在于高素质的数据分析人才,中西部地区则相对在发展算力所需的能源成本等方面有比较优势。应优化数据产业空间布局,大力推进“东数西算”工程,将东部地区产生的丰富数据更多布局在中西部地区进行存储和运算,而东部地区更多发挥人才优势做大做强数据分析产业。

  第三,充分发挥数据价值链不同环节尤其是第一环节在实现高质量就业中的作用。本文估算了不同阶段劳动力成本的情况,发现总体看来第一阶段劳动力成本是最主要的,占到总劳动成本的一半左右。可见第一阶段是整个数据资本积累的基础,是数据产业吸收劳动力就业的主阵地,且第一阶段的劳动力相对后续的环节来讲,所需要的专业技能相对容易掌握,就业形式灵活,对于在中国经济不断数字化的进程中创造高质量就业有很大空间和潜力。

  (本文注释内容略)

原文责任编辑:梁华

  原文责任编辑:梁华

转载请注明来源:中国社会科学网【编辑:常畅】