Digital Humanities Study of Humanities from the Perspective of Big Data
作者简介:欧阳剑,广西民族大学图书馆 欧阳剑,文学博士,广西民族大学图书馆,研究馆员,图书馆学、情报学硕士生导师。研究方向:信息资源管理、语言学及语料库大数据分析与处理、知识挖掘与抽取、数字人文等。E-mail:oyjjj@163.com 广西南宁 530006
原发信息:《图书馆杂志》(沪)2018年第201810期
内容提要:本文以大数据为背景,从新数字化环境下数字人文发展及其内涵的变迁出发,分析了数字人文中的人文学科研究的变革。大数据的思维模式给人文学科领域的研究提供新的思维和方法,使人文学科的数字人文研究呈现出大视野、定量化、跨学科、集成化及多维度分析等新特点,给人文学科的数字人文带来了大视野、长时间、大空间等多样化的思维模式与研究视角,形成了大数据时代数字人文研究新的范式,而数字化资料集成与融合及计算机分析成为其数字人文研究的重要组成。
Based on the background of big data,this paper starts with the changes of digital humanities development and its connotation under the new digital environment,and analyzes the transformation of humanities research in digital humanities.The thinking mode of big data provides new ideas and methods for humanities research.The digital humanities studies in the humanities have presented new features,such as wide horizon,quantification,interdisciplinarization,integration and multi-dimensional analysis,which have brought a variety of thinking modes and research perspectives,such as wide horizon,long time,and large space.It has formed a new paradigm for digital humanities research in the era of big data.Integration and fusion of digital data and computer analysis have become two important components of digital humanities studies.
关 键 词:大数据/人文学科研究/数字人文/Big data/Humanities research/Digital humanities
标题注释:本文系国家社科基金项目“图书馆古籍文献的数字人文开发与应用模式研究”(项目编号:17XTQ003)、广西社科基金“面向数字人文研究的大规模古籍语料可视化分析与挖掘”(项目编号:15DTQOO1)、广西民族大学引进人才项目(项目编号:2017MDSKRC24)的研究成果之一。
引言
人文学科传统研究主要靠研究者所具有的经验性、直觉性和思辨性来进行,强调对大量已有研究成果搜索、整理、分析后通过提炼、演绎、归纳等方法进行知识升华和创新,是一种思辨式研究方法。近年来,随着数字化环境的发展,数字人文及大数据的出现使人文学科的研究发生了深刻的变化,大数据正在掀起一场思维模式和数据技术的革命,大数据不仅仅只是数据规模巨大,更重要的是数据数量的变化引起了质变,数据不仅仅是自然或社会现象的数量表征,而是引发了一系列的本质变化,大数据给人文学科领域的数字人文研究带来新的思维模式、研究视角与实现方式。
1 新数字化环境下人文学科的数字人文发展与变革
数字技术在人文学科研究中的应用已有很长历史。人文学科研究经历了20世纪70年代人文语料数据库建设、文本编码标准创建,20世纪80年代末到21世纪初获得了迅猛发展,数据库工具为第一批人文计算项目提供了基础。20世纪90年代初,网络的出现加速了数字学术从加工处理到网络协作的转变。90年代末,一些项目开始利用数字技术实现可视化、地理空间展示、模拟空间以及复杂系统的网络分析。进入21世纪,大数据、VR/AR、云存储、移动终端相继出现,数字化的证据和研究方法广泛运用于学术性的研究、出版与储存,形成了全新的数字学术环境,使我们进入了一个数字化的学术时代。随着信息技术的发展,大量的普通图书、报纸、期刊、照片、绘本、乐曲、古籍、图像、视频等人文资料被数字化,形成规模庞大、种类繁多、专业混杂、具有高价值的庞大数据集合,数字化的文档资料、数据库和检索系统等数字学术资源逐渐成为人文研究的基础平台。
数字技术已成为人文学科研究的必要手段,随着数字技术在传统人文学科研究中的广泛应用,使人文学科研究进一步促使了方法论的革新、研究领域的拓展和新研究问题的出现。人文计算(Humanities Computing)从意大利神父罗伯特?布萨(Roberto Busa)的阿奎那项目开始,一直延续至今,计算思维(Computational Thinking)在人文学科研究中已无处不在,已有大量的研究方法和实践,人文学者的研究环境逐渐发生了改变。
随着数字技术对人文研究、教学与传播全流程各环节的渗透,数字人文(Digital Humanities)的概念逐渐取代人文计算(Humanities Computing),成为一个新兴的跨学科研究领域的代名词。数字人文是一个将人文领域知识、学科研究发展需要、数据收集及分析技术、网络与计算基础设施、算法模型等方面发展共同促成的产物,将计算机和网络技术深入应用于传统的人文研究、教学和出版等活动的新型跨学科的合作性研究领域。数字人文融合了人文学术与计算机科技,具有截然不同的特点,极大地包容了主观性与客观性、定性与定量、模糊性与准确性等,是一个真正融合的多学科领域。
数字人文是一个处于不断发展的新兴领域,由浅表到深处,从基于文本的人文计算到网络时代的多媒介表达,在迭代中不断改写数字人文的边界和功能,数字人文的内涵也在发生变化,数字人文早期被认为是使用计算机进行量化分析的一种人文研究方法,随着网络技术的发展和数字化技术的广泛应用,数字人文的研究和应用领域变得更加宽泛,强调数字技术文化和环境中的人文研究,并对印刷文化和基于印刷文化的传统出版模式进行反思,形成了高度数字化的数字学术环境,开放性与协作性成为共性。数字人文给传统的人文学科研究提供了新的研究方法和研究范式,传统人文学科研究往往先预设问题,然后收集及整理相关材料,通过对材料的思辨和诠释而形成成果(如图1),传统人文学科研究的过程中学者的大部分时间耗费在相关材料收集及整理方面。而数字人文中的人文学科研究是基于已有的数字化资料集合,借助于计算机技术的辅助分析,通过可视化的结果呈现并进行诠释,将人文研究学者从低档繁杂的资料收集和整理工作中解脱出来,从而专注于高层次的学术发现(如图2),数字化资料及计算机计算的介入加快了人文学科研究速度,也提高了效率,更重要的是给传统人文研究提供新颖的研究方法。
图1 传统人文学科研究
图2 数字人文中的人文学科研究
数字人文的产生在本质上属于一种方法论和研究范式上的创新,其核心目标是将现代信息技术融入人文领域,从而改变知识的获取、标注、比较、取样、阐释与表现方式,通过设计、计算、分析、可视化等手段重塑和改造人文知识,为学者提供更多差异化、规律性、宏观性、趋势性研究的可能和线索,从而扩展学术疆域和潜力,使学术领域实现“轮廓重绘”[1]。
扫码在手机上查看