首页 >> 图书情报学
数据出版视角下的科学数据同行评议
2018年03月23日 10:20 来源:《图书馆杂志》 作者:屈宝强 王凯 字号
关键词:科学数据;数据共享;数据出版;同行评议

内容摘要:科学数据同行评议是保证数据质量的重要手段之一,对于产生正确的科学结果有重要意义。

关键词:科学数据;数据共享;数据出版;同行评议

作者简介:

  作者简介:屈宝强,管理学博士,中国科学技术信息研究所副研究员,研究方向:数据共享,E-mail:qubq@istic.ac.cn;王凯,中国科学技术信息研究所研究生,研究方向:信息资源共享。北京 100038

  内容提要:科学数据同行评议是保证数据质量的重要手段之一,对于产生正确的科学结果有重要意义。文章总结了数据同行评议的内涵,分析了不同数据出版模式中数据同行评议的内容及特点以及数据同行评议的影响因素、时机选择、工具、流程等问题。

  关 键 词:科学数据 数据共享 数据出版 同行评议

  标题注释:本文系国家社会科学基金项目(项目编号:15BTQ053)和中信所预研基金(项目编号:YY2015-09)的研究成果之一。

  0 引言

  在科学论文发表的过程中,如果不能提供支撑研究结果的原始数据,则会出现科学的“可重现性危机”[1],例如Nature指出一种用来把体细胞改造成多能干细胞的方法不可重复就是例证之一[2]。为尽可能消除这种现象,美国国家卫生研究院(NIH)要求“提供发表论文的基础数据和材料”作为提高科学可重现性的方法之一[3],许多期刊和出版商也已经开始关注开放获取出版模式,要求作者共享他们的数据,从而帮助发现潜在的错误,验证原始研究结果。但是数据共享又存在着技术、经济、政治、动机、法律和道德方面的障碍[4],因此,学术界提出了数据出版[5]的理念,数据出版可以提高数据的可获得性,有助于数据的再次分析,使研究被重现和数据被复用,与研究论文相关数据的出版还可以帮助发现错误和造假[6]。

  科学数据出版的一个非常重要的问题是数据同行评议,数据出版意味着某种程度的认可[7],即认为“发表”的数据集一般经过同行评议。目前,虽然有一些对数据同行评议的讨论[8-9],但是对于数据出版中同行评议的流程、标准、内容等没有统一的标准,本文尝试对不同数据出版模式下同行评议的内容和方法进行总结,为我国科学数据出版中的同行评议和质量控制提供参考。

  1 数据同行评议

  1.1 数据出版

  数据同行评议是与数据出版和引用新范式的发展相连接的。目前国际上已经出现许多数据出版和引用的计划,例如2009年在生物信息学领域Global Biodiversity Information Facility(GBIF)就启动了数据出版项目“Data Publishing Framework Task Group”,2013年美国气象学会(American Meteorological Society,AMS)发布了“Fulland Open Access to Data”政策声明,内容包括在AMS期刊和出版物实施出版和引用数据的建议。Lawrence等[8]指出数据出版是指数据达到可引用和追溯的状态,讨论了Data Publication(大写P)和Data publication(小写p)的区别,他们认为Data Publication是使数据“在互联网上尽可能可用”,以及将数据通过处理(如创建元数据和同行评议)增值并提供给用户,Data publication致力于网站上的信息发布,没有明确的长期数字归档行为。Data Publication促进了数据集资源的稳定、完整、永久、高质量,同时可以促进数据集被学术资源引用。然而,数据集的“出版”概念面临许多现实挑战,例如许多数据集是动态的,在使用过程中会发生重复、分裂、合并、纠正、返工、或者改变,导致数据出版的粒度变化等问题[10]。随着数据出版的兴起,数据同行评议问题自然出现。

  1.2 同行评议内涵

  同行评议在科学交流体系中占有重要地位,几乎所有形式的科学工作都受到同行评议,包括期刊文章、研究资助申请以及会议论文和摘要等,在各个学科通过同行评议确认科学研究结果的质量已经形成共识。成立于1665年的科学期刊Philosophical Transactions发表的文章在出版前受到英国皇家学会理事会成员的评议,标志着同行评议过程创建。同行评议可以分为单盲(Single blind)、双盲(Double blind)、开放(Open)同行评议三种。

  科学数据的同行评议被认为是数据出版中的非常有挑战性的部分,Borgman指出:“很少有数据进行与出版物类似的同行评议,这是数据如何在学术奖励体系价值链中被合法化的问题。”[11]美国地球物理联合会(American Geophysical Union,AGU)鼓励数据出版物的同行评议,但是未指定程序的具体形式[12]。LeMone和Jorgensen[13]讨论美国气象学会(AMS)期刊同行评议时,指出数据集往往太大,难以理解,记录不完整,或者审稿人难以获取。另外,数据同行评议的概念是模糊的,且有不同的解释。

  对于数据的同行评议,数据出版中每个相关者关注点不同。从科学家视角看:①数据可得性是开展同行评议的前提条件。②同行评议的可行性存在许多障碍,包括数据获取、数据校验、数据验证等。③同行评议过程需要花费大量时间和精力。④科学家需要以积极态度对待研究数据的出版和同行评议。从数据仓储视角看:数据仓储对于存储数据的质量保证有贡献,数据管理评估、数据选择过程和验证是数据质量的重要保证。由数据仓储进行的质量保证措施可根据数据形式、范围和学科而不同。从期刊视角看:数据的同行评议往往不包括在标准的期刊同行评议过程。已有的数据同行评议实践,也因学科不同而不同。例如一些期刊的编辑政策要求数据可用、可访问,特别是在生命科学。总体上看,大多数学科的期刊缺乏对数据评议的技术标准和实践,使得对数据的全面评议成为审稿中的负担。从专家视角看,出版商和期刊积极应对数据出版,特别是他们对未来数据期刊中的数据同行评议充满期望。

  从同行评议方式上看,科学研究中的出版物可以通过论文发表后的评议(post publication review)来试图复制或验证研究结果,同样对于数据来讲,也可以开展由用户驱动的数据出版后评议过程[14],不管在出版前的质量控制水平如何,数据质量等问题往往会随着数据版本变化、数据更新等发生变化,更需要在出版后经过长时间的传播和大范围分发,供外部使用后才能真正发现其价值[15]。一般来说,随着时间的推移,数据集越来越好用、适用。

作者简介

姓名:屈宝强 王凯 工作单位:

转载请注明来源:中国社会科学网 (责编:毕雁)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们