何谓数字人文?哈佛大学的包弼德教授有一个经典的回答,在他看来,数字人文研究不同于传统人文研究的重要特征主要体现在以下几个方面:“一是数字资源,二是数据,三是用计算性方法查找和提取数据,四是用计算性方法分析数据,把数据可视化,来创造新的信息。”(《何谓数字人文?何为数字人文?》)这包括数字人文环境下围绕数据展开的查找、收集、整理和分析等步骤在内的完整研究周期,而这里涉及的诸多环节都可以运用数字人文方法。在如今学科融合叠加媒介融合的大背景下,审美主义者捍卫的文学性早已岌岌可危,当代文学批评如何回应数字人文时代的挑战,有效吸纳数字人文研究的重要方法,走出一条积极交融的创新之路,显然构成了新时代文学批评的重要理论命题。
数字人文方法对传统文学批评的融入
概而言之,数字人文方法主要是基于“大数据”的文本挖掘和数据分析,或是用相对新颖的分析和统计手段对数据进行综合处理,以跨时间、跨空间和跨文化的重要方式对文献进行宏观分析与研究,因此这也意味着一种跨界研究与学科融合。在这样的媒介环境下,传统人文领域的批评和研究范式已经有了很大的改变。数据库建设、可视化分析等研究模式,无疑为学者们更广泛地获取研究材料提供了极大便利。近些年来,随着相关研究档案和数据库建设的飞速发展,那些 “上穷碧落下黄泉”的“材料癖”者已经开始日渐绝望。在数字信息化如此迅捷的今天,那些传统史料占有者们的批评范式急需转变,旧有的批评观念随着大量材料的电子化和可视化而寿终正寝。
数字人文方法不仅有力地打破了旧有的批评观念,以及相对僵化的批评范式,它还被主张广泛地运用于建立一种可视化的知识图谱,由此提供一种相对新颖的批评和研究图景。比如王兆鹏教授主持研究的国家社科基金招标项目“唐宋文学编年系地信息平台建设”,便是传统古代文学研究与现代数字技术的有机融合。这一平台其实包含两个方面的内容:一是基础数据,也就是作家活动和创作的编年系地数据,这是从作家年谱、作家诗文集编年笺注、作家生平考证论文等三类文献里提取的基础数据;二是“矢量化地图”,即将谭其骧先生主编的《中国历史地图集》进行“矢量化”,将其与文学研究数据有机融合,从而建立起可视化呈现的地图平台。这有效地解决了古代文学研究中的两大难题:一是资料分散,二是时空分离。它既能把不同学科、不同门类的知识关联起来,又能够更直观地将作家的活动时间与写作地点等信息融合在一起,不仅提供了一种相对新颖的批评和研究图景,也为教学研究提供了更多便利。
作为数字人文方法的重要代表,美国学者弗兰克·莫莱蒂(Franco Moretti)提出的“远读”理论(又称“距离阅读”),被认为是一种与传统的文本细读相对的重要方法(《对世界文学的猜想》)。所谓“距离阅读”,其实并不神秘,它主要以大规模的文本分析、计算批评和协作阅读为主要特征,注重从宏观层面完成对文本的整体感知,这是传统的文本细读式批评所无法完成的。此外,马修·乔克斯(Matthew Jockers)提出的“常量分析”也可视为莫莱蒂意义上“距离阅读”的一种变体,其目的在于从海量的文学作品中阅读和捕捉其共同特征。而与常量分析相辅相成的定量辅助定性分析,则主张通过数据化的手段更深入地揭示文学现象的变化趋势和内在规律。比如早在20世纪80年代,为了深入揭示一直困扰读者的《红楼梦》作者问题,陈大康教授就曾在没有人工智能软件介入的条件下,通过人工检索和机械比对的方式细致分析了《红楼梦》的部分虚词和惯用语句,令人信服地得出了小说后四十回作者并非曹雪芹的重要结论。这便在某种程度上体现了常量分析与定量辅助定性分析的有机结合。
事实上这种“距离阅读”的方式,在今天流行的网络文学批评中已经比较普遍了。作为超大文本的网络文学,与习惯于以精英阅读方式展开的传统文学殊为不同,它并不具备传统文本细读的客观条件,这当然也为数字人文意义上的“距离阅读”提供了某种契机。从近年来的批评研究来看,研究者依托“一叶·故事荟”平台、人物关系分析智能软件等,通过对相关作品进行关联词分布、可视化呈现,以及人物关系图示等手段,已然实现了对网络文学海量文本的宏观统计分析,这便在数字人文研究方法的辅助下抓住了网络类型小说的重要面向,从而开拓了网络文学批评的新范式。
看得出来,以知识图谱、文本挖掘和数据分析为主要特征的数字人文研究方法正在加速融入传统文学批评,这极大地推动了文学批评研究从封闭走向开放,从单一走向综合。此外,以数据模拟、深度学习等为代表的人工智能技术,也正以前所未有的速度渗透到文学研究与批评的各个环节之中。比如情感分析、智能挖掘等技术的运用早已方兴未艾,而基于深度学习的文学鉴赏与对话生成等人工智能应用更是如火如荼,这也为未来时代基于人与机器的互动协同而生成的智能批评实践提供了契机与可能,这是令人欣喜的时代之变。
数字人文时代文学批评的忧思
数字人文技术的发展,有时也是一柄“双刃剑”。对于批评研究者来说,材料太容易获取,未见得是一件好事。海量而便捷获取的研究成果,也可能让青年研究者在入行时,造成随意敷衍、抄袭通用模式的弊病。比如随着“网生一代”的成长,对于今天的年轻学子来说,论文数据库几乎早已成为他们获取研究素材的唯一来源。然而充斥在论文数据库的大量成果,多为低水平重复发表,人云亦云的观点重复,真正有创见的并不多见。相信多数学者都有此经验:每逢本科毕业论文选题期间,“余华小说的悲剧主题”“张爱玲小说的女性形象”等诸如此类模式化的研究论题大行其道,这已然成为今天学术研究之大敌。正是在这个意义上,陈平原教授感慨道,今天我们检索的能力越来越强,而思考、阅读的能力却越来越弱。不得不说,这也正是数字人文时代文学批评的忧虑所在。
我们需要看到,莫莱蒂的“距离阅读”以其“二手阅读”、大规模阅读、协作阅读和计算批评的方式,表征了阅读对象、主体和方法的多重范式革命,从而促成了传统文学批评的数字人文转型。以上三个方面的范式革命,也被认为有效回应了文学批评中至关重要的对象、主体和方法问题。尽管“距离阅读”极大地改变了传统人文阅读的常规模式,开启了数字人文批评的先河,然而,正如但汉松所说,“算法批评的意义恰恰是利用人工智能,促使批评家发现之前使用别的方法未曾觉察的问题,帮助批评家阐释文本并解析出新的意义”。对于文学批评来说,数字人文研究方法主张以“距离阅读”的方式实现对文本要素的迅速提取,它利用先进的技术手段,为文学批评提供了新的视角和工具,却并非要完全替代传统意义上的文本细读,事实上也并不能完全替代已然深入人心的传统批评方法。这是因为技术固然实现了“人体器官的延长”,成为人的“代理者”,却并不能取代人本身。对于莫莱蒂来说,解读“距离阅读”的结果仍然需要依赖学者在细读文本的基础上建立起来的认知和理解。概而言之,对作品的深入剖析永远离不开人类独有的情感体认,人的阅读仍然不可替代。
也正是在这个意义上,数字人文技术越是迅猛发展,我们越是要警惕其风险所在。也就是说,数字人文时代,人文主义者的警惕与忧思从来都不会缺席。我们不仅需要警惕数字人文时代从传统“文本拜物教”向现代“技术拜物教”滑落的风险,以及客观上造成的人对机器的迷恋,也应该对数字鸿沟引发的信息获取差异可能进一步加剧的文化资本的不对等感到忧虑。与此同时,恰如学者们一再呼吁的,不要对“数字人文”过度迷信,在数字文献迅猛发展的今天,切不可放弃寻找“实物”的努力。而如何在数字人文时代最大限度地保留文学的意象与情感之美,保留人之为人最后的“阵地”,更是文学批评需要直面的难题。
(作者系中国社会科学院文学研究所研究员)