首页 >> 社科评价
我国知识图谱研究演进特征可视化分析
2020年03月26日 10:41 来源:《情报科学》(长春)2019年第3期 作者:夏立新 王凯利 程秀峰 字号
关键词:知识图谱/演进特征/可视化分析

内容摘要:从动态视角出发,通过对我国知识图谱研究的时空及主题演进的可视化分析,梳理其演进特征,提出发展建议,以促进该领域的可持续发展。

关键词:知识图谱/演进特征/可视化分析

作者简介:

  内容提要:[目的/意义]从动态视角出发,通过对我国知识图谱研究的时空及主题演进的可视化分析,梳理其演进特征,提出发展建议,以促进该领域的可持续发展。[方法/过程]以CNKI期刊全文数据库为信息源,以“知识图谱”为主题检索相关文献。通过函数拟合识别我国知识图谱发展阶段,以k-core方法分析相关机构研究的持续性,以阶段新关键词梳理我国知识图谱在分析方法、分析工具、应用领域及数据来源四方面的演进情况。[结果/结论]我国知识图谱研究的发展进程可分为起步阶段、低速发展阶段和高速发展阶段,且现如今正处于加速发展期。相关研究机构分布较离散,且研究持续性差。分析方法、分析工具和数据来源较固定,应用领域广,且其发展呈现出多元化、交叉化、社会化、时代化和国际化的特点。

  关 键 词:知识图谱/演进特征/可视化分析

  标题注释:国家社科基金重大项目“基于多维度聚合的网络资源知识发现研究”(13&ZD183),国家自科青年项目“基于QSIM的图书馆移动用户群体行为模拟与学习兴趣引导研究”(71503097)。

  作者简介:夏立新(1968- ),男,教授,博士,华中师范大学信息管理学院,主要从事信息组织与信息检索研究;王凯利,程秀峰,华中师范大学信息管理学院。武汉 430079

  1 引言

  知识经济时代,人们关注的焦点逐渐从获取知识转向关注知识之间的联系,知识图谱也得到越来越多研究者的青睐。知识图谱是将应用数学、图形学、信息可视化技术、信息科学等学科理论与方法与计量学引文分析、共现分析等方法结合,用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构的多学科融合的一种研究方法[1]。知识图谱不仅是一项重要的科研工具,更是一个系统的研究领域,因此对其自身发展态势的研究也至关重要。

  迄今为止,已有部分学者将知识图谱作为研究主题进行相关分析。如2010年魏瑞斌对国内知识图谱研究进行可视化分析,发现当前时间节点的研究人员和机构相对集中,研究论文的合著率较高且研究主题鲜明[2];2012年杨思洛等以中国知网为数据源,分析我国知识图谱的研究集中在理论、方法、工具与应用,并探讨其发展趋势[3];2015年曹树金等基于SSCI与SSCI期刊论文分析了知识图谱研究的脉络、流派与趋势[4];2017年张妮等基于WOS和CSSCI中知识图谱相关论文,借助Citespace进行分析发现,国内外知识图谱的研究热点为知识图谱理论及方法研究、数据处理和数据挖掘、知识图谱的学科应用和经济社会应用,并展望其发展趋势[5]。

  通过梳理各时间段的研究文献发现,学者们对知识图谱的研究多从静态视角出发进行整体分析,缺乏对知识图谱随时间变化的演进分析。另一方面,同进行一般学科分析相似,学者们对知识图谱的研究普遍集中在研究热点和发展趋势两方面,缺少对热点及趋势的特征识别。为弥补相关研究的不足,本文拟从动态视角,分阶段分析我国知识图谱研究的时空及主题演进情况,并总结其演进特征,以促进该领域的可持续发展。

  2 数据来源

  中国知网作为世界上最大的、连续动态更新的中国学术期刊全文数据库,由于涵盖自然科学、工程技术、农业、医学、哲学、人文社会科学等众多领域,常被用作计量分析对象。本研究以CNKI期刊全文数据库为数据源,以“知识图谱”为检索词进行主题检索,将截止日期限定为2017年12月31日(检索日期为2018年5月3日)。结果共得到2740篇相关文献,去除通知、贺词、重复等无效文献后,共得到有效文献2681篇。

  数据库中包含上述2681条学术论文题名、作者、机构、关键词等知识单元。根据研究目的,将提取年份、机构、关键词等知识单元用于文献时序、空间格局及研究主题的演进特征分析。

  3 时空演进特征分析

  3.1 文献时序演进

  文献数量的时序变化是衡量学科领域发展的重要指标,通过对某一学科领域学术论文的统计,绘制相应的分布曲线图,能够明晰学科领域所处的发展阶段,预测学科领域的发展趋势和动态[6]。

  统计发现,我国有关知识图谱及相关议题的研究文献最早可追溯到2005年大连理工的陈悦、刘则渊教授于《科学学研究》上发表的《悄然兴起的科学知识图谱》一文[7]。本文在介绍有关科学知识图谱基本概念的基础上,从数据库、数据格式及存取、数据分析算法、可视化和互动设计等方面阐述了有关科学知识图谱绘制的最新进展,并展望了其应用前景,堪称国内知识图谱研究的开山之作。该文被引频次524次(其中《中国期刊全文数据库》共351篇引证文献,《中国博士学位论文全文数据库》共40篇引证文献,《中国优秀硕士学位论文全文数据库》共118篇引证文献,《国际会议论文全文数据库》共3篇引证文献,《中国重要会议论文全文数据库》共12条引证文献),可见此文在我国知识图谱研究领域的影响力之巨大。

  图1显示了我国知识图谱研究论文的产出及累积量的变化曲线。由图可知,我国知识图谱研究一直保持良好的发展势头,文献产出量持续增长。对我国知识图谱研究文献累积量的增长趋势进行模拟,得到拟合曲线符合指数型函数(Y=2.1008e0.6007x),且曲线的拟合程度较高(=0.9503)。这表明我国知识图谱研究的文献累积增长趋势符合普赖斯指数增长规律。

  

  图1 我国知识图谱研究文献增长趋势

  为进一步反映我国知识图谱研究的发展进程,拟进行发展阶段的识别。文献计量学的奠基人之一D.S.Price在对各种科学指标进行大量统计的基础上,提出了科技文献增长的“四个阶段理论”[8]。第一阶段学科刚刚诞生,绝对论文数量少,呈不稳定增长。第二阶段学科进入大发展时期,理论迅速发展,论文数量急剧增加,较严格地服从指数增长。第三阶段理论日趋成熟,论文数量增长减缓,演变为线性增长。第四阶段随着理论的完备,文献日趋减少,曲线逐渐平行于横坐标,或出现不规则的各类震荡。

  由我国知识图谱研究年发文量可知,2005—2007年间,虽然年发文量一直在增加,但数值较低(低于10篇),符合“四个阶段理论”中第一个阶段的描述特征。2008年以后,年发文量急剧增长,2012年的年发文量突破了100篇,可视为发展分界点。为了正确识别我国知识图谱研究的发展阶段,笔者对2008—2011年的年累积发文量进行指数回归,得到2009—2011年我国知识图谱研究文献累积量符合指数型增长,值达到0.9971(如图2),可知此阶段符合普赖斯文献增长第二阶段的特征。对2012—2017年的年累积发文量分别进行指数和线性回归,得到指数回归的拟合效果较线性回归更佳(值0.9982>0.9468)(如图3),故此阶段也符合普赖斯文献增长第二阶段的特征,且增速相较于2009—2011年有所提升。

  经文献计量分析可知,自2005年起,我国知识图谱研究进程可划分为三个阶段:①起步阶段(2005—2007年),该阶段知识图谱研究文献相对较少(<10)。②低速发展阶段(2008—2011年),该阶段知识图谱研究发文量较起步阶段相比有很大提高。③高速发展阶段(2012年以后),该阶段知识图谱研究文献量保持高速增长,且年发文量突破百余篇。总体来讲,我国知识图谱研究文献正值普赖斯“四个阶段理论”所描述的第二个阶段——指数增长期,本学科也正处于大发展时期,有着良好的研究前景,值得众多学者及研究人员的持续关注和重视。

  

  图2 2008—2011年间年发文累积量拟合图

  

  图3 2012—2017年间年发文累积总量拟合图

作者简介

姓名:夏立新 王凯利 程秀峰 工作单位:华中师范大学

转载请注明来源:中国社会科学网 (责编:赛音)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
1.jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们