首页 > 读刊·中国学派 > 《中国文学批评》 > 2024年第1期

网络文学的数据性及数据批评

2024-08-05 作者：周冰来源：《中国文学批评》2024年第1期P84—P92

微信公众号

— 分享 —

链接已复制

摘要：网络文学处于全面数据化的网络空间，依赖0和1来表征，是数据录入、数据存储、数据计算和数据表达的综合复杂呈现，具有明确的数据属性。但近30年的网络文学批评却存在着数据缺失“综合症”现象，不仅导致批评无法面向网络文学的火热现实，而且引发了一系列的弊病。以数据为中心，在网络文学的底层安放“装置”，搭建批评的基座，建构数据批评新范式，并不是与印刷批评绝对割裂，而是在接续、更生的基础上，引入数据思维与视野，强调文学性与数据性兼顾、从定性走向定量与定性结合、从人走向人—机协同、从单一的学科批评走向跨学科的场域化、实证化批评。数据批评并不排斥传统网络文学批评的文化阐释，而是要以数据思维、模型为文化赋能。它不是功利性的数据崇拜，也不滑向计算主义或数据主义，而是为了更好地析出数据的经验、逻辑；更不是片面的数据分析、技术分析，而是对数据保持充分警惕基础上的、体现技术与人文相结合的批评。

关键词：网络文学;数据;计算;批评

作者周冰，西南科技大学教授（绵阳621010）。

　　经过近30年的蓬勃发展，网络文学已逐渐告别早期的“草根”形态，进一步迈向“主流”与“正统”，成为社会主义文艺的重要组成部分。然而，与它从“边缘”向“中心”走势不相称的是，网络文学的批评探讨似乎还比较“小众”，缺少富有影响、可以实操的批评成果。一方面，学术界大抵都认识到网络文学批评的重要性，看到了数媒赋能给文艺带来的革命性变化，进而试图在对纸媒评价限度的超越上，寻找新的评价视角、立场、方法，确立新的批评标准，建构适合网络文学自身的评价体系。另一方面，学术界的这些批评“区隔性”明显，往往局限在“圈子”内部，自说自话、自我观瞻；学院派的批评出圈、真正走进网络文学第一现场的学理性批评言说还比较有限。在这样“两难”的语境下，网络文学批评既需要“口号”式的“宣传”，广而告之，以求增强批评的广度、热度、力度，更需要提出一系列可以描述网络文学特性的概念、理念，如“网络性”“交往性”“社会性”等，以求增强批评的针对性、有效性、在地性。在媒介革命与融合的数字时代，新的文学确实有必要寻找新的观照方式，不如此，不足以揭示其有别于传统文学的评价标准，建立符合网络文学特征的评价体系。那么，网络文学的本质特征是什么？除了现有学术界常谈到的文学性、商业性、网络性等，还可以使用哪些概念来理解网络文学，是否可以由此延伸出一种新的批评范式？在我们看来，回到网络文学发生的技术与媒介语境，重申网络文学的“数据”特性，或许将是一条富有启发性的途径。

　　数据与网络文学的数据属性

　　依据《现代汉语大词典》，“数据”指的是“进行各种统计、计算、科学研究或技术设计等所依据的数值”。而所谓的“数”，则是“数目，划分或计算出来的量”“几，几个”等意思，“值”数学上主要指“依照数学式演算所得结果”。显然，数据来源于数、值、量等概念，其由数、量等演变而来，它的发展是一个历史的过程。在现有的研究中，人们一般将数据的发展分为三个阶段：早期数的产生，人们对数、量的懵懂认知和判断；中期数学的发展，科学数据的形成；现在信息互联网技术发展所带来的大数据的诞生。从数到大数据的发展历程，不仅显示了数据在内涵和形式上发生的重大变化，而且带来了人类对数据的新认知和新理解，引发了一场观念、方法上的“数据革命”。

　　如果说早期人类有关数的认识主要是在采集、狩猎中累积起来的素朴感知，近现代人类有关数据的理解主要是在科学研究、实用测量、数值计算中的范式推进判断，那么当前有关数据的观照则是在人工智能、云计算、可视化呈现中的革新性理念。可以看到的是，传统的数量、数值逐渐转换增殖为以0/1为“内核”的图文信息资源，建基于数据之上的各类型数据库、算法、可视化等大行其道，而人类行为和社会活动也正越来越多地被数据化，被挖掘、跟踪、计算、分析、预测，产生新的价值，形成新的智慧。数据成为新的资源和要素，并被赋予了一种“权力”，促成新的世界观、价值观和方法论，全方位地影响着我们对世界的认识和把握。

　　网络文学正诞生于熙熙攘攘的数据化语境与氛围中，无论当前学术界如何溯源网络文学的发展历史——是1991年北美汉语网络文学、1996年金庸客栈的论坛模式，还是1998年BBS上连载的《第一次的亲密接触》等，都无法改变一个基本的事实：网络文学因数据而生，又因数据而在，它具有天然的数据属性。它以作者、读者的信息录入为数据源，以文学数据库为应用平台，以专门性的文学网站为数据应用门户和数据服务提供商，并试图通过对各类型文学数据的归档、管理、抽取、转换、挖掘、应用，实现有别于传统文艺的数字审美意识形态功用。在某种程度上，网络文学处于全面数据化的网络空间，依赖最简单的0和1来表征，仰仗数据技术与数据库平台来实现，是各类型文学数据行为的复杂性编码、计算、处理、架构与呈现，在本质上可将其看作一种“活态性”的数据平台型文艺范型，体现的是科学技术对文学的影响与规训。

　　网络文学数据特性至少在四个层面上呈现。其一，材料层的数字0和1二进制机器语言构成。数字0和1构成的二进制位数“bit”既是计算机信息技术的根本，更是网络文学的基础、材料，是它的电子数码语言。网络文学依赖数字“比特”进行表征与叙事，数字0和1是网络文学数字信息的DNA与基本构成，网络文学的“大厦”正是依此构筑而成。其二，地基层的数据源。数据源是网络文学比特数据的扩展与实现，主要是各类型数据行为如电脑写作、用户点击、读者评论等的比特数据集成，数据源是否丰富、多样等决定着网络文学“大厦”根基的牢固程度。其三，应用层的数据库与平台。这主要指的是各类型文学网站、APP后台等通过技术搭建的不同特性数据库以及建立于其上的数据整合平台、数据存储平台、数据处理与服务支撑平台、数据应用平台等，它们承担着对数据源进行管理、存储、抽取、转换、加载、挖掘、计算、分析等功能。应用层决定着网络文学的“大厦”如何安全、有效、精准地运作等。其四，界面层的数据显示。这主要指的是应用门户上的数据界面显示、各类型数据的报表服务提供。比如，纵横中文、番茄小说的界面显示，各作品的封面、阅读页，或者各类型的月票榜、打赏榜，读者的搜索显示、交流帖子、朋友圈等。界面层是数据使用者所看到的网络文学最直接的呈现，是网络文学的“前台”与面相，其直接关系用户体验、粘连度。

　　所以，谈论网络文学，固然是在谈论作者、作品、现象等，但谁能否认不是在谈论网络文学数据？网络文学有着文学应该有的语言、叙事、审美，有着正常文学作品所具有的文学性，但它更是数据，是各类型数据的集成、化合、运算、表达，它在文学性上涂抹了数据性，并使得文学性和数据性互为表征。从根本上来说，支撑当前网络文学繁荣的是数据生产与数据产业。对网络文学而言，数据生产是其存在的“王道”，它是用户的数据生产性行为与结果，既包含平台的数据库建构、数据规则录入、数据界面搭建等，亦包括作者的写作实践、读—写互动、编—写互动等，更包含读者的点击、选择、阅读、付费、讨论、分享、二次创作等。数据产业则是网络文学走向繁荣发展的关键，它是建基于用户数据生产基础上的进一步数据分析、加工和处理，是跨媒介的数据流转，可看作网络文学数据生产的再生产。网络文学数据生产能力与数据产业转化的强弱既是检验文学平台优秀与否的试金石，也是衡量一部作品质量好坏、升降沉浮的重要标准。

　　由此，数据溢出了原本的自然数量意义，更多地迈向了资源要素配置，它贯穿了网络文学生产、流通、消费的各个环节，成了一种文学性的经验形态。从这样的角度来衡量，网络文学的生产与扩大再生产充满着数据导向，依循数据理路，多由数据决定，是典型的工业化数据产业。“如今，为网文源源不断贡献内容的，已经不再是印刷媒体时代的个人创作，而是进行数据收集、信息处理的工业化生产。”比如，一个专门性的文学网站，假如数据技术“一般”、用户数量稀少、无数据“好”的作品，该网站产业发展可能性较小，很快就会成为明日黄花。而对一部作品而言，如果其收藏、订阅、打赏数据较好，则将有机会进入网站排行榜，获得主页推送、热点推送等，从而曝光率增大，成为阅读的“风尚”，获得IP改编等。再深入一点，我们可以把当下网络文学的某些时尚类型，像凡人流、洪荒流等，看作某一类型的数据跟风，赘婿文、总裁文、飞卢风等则是数据经验的模仿。也由此，网络文学的各类型数据成了政策制定、用户画像、发展预测的“关键物”。比如，起点中文网的各类型年度分析报告，经常利用用户的数据生产行为，对用户进行数据画像，分析年度的阅读偏好、审美特点，给后来写作者以借鉴。再如番茄小说网，通过算法与大模型，进行精准的偏好小说推送、广告投放等。

　　因此，当我们从数据的角度切入网络文学，表面上看我们似乎在一步步远离文学与文学性，但在本质上我们回到的却是网络文学的“初心”，通过数据来观照网络文学的生产与再生产，透视文学网站、作家作品、产业形态，分析和寻绎一种有别于传统文学的“美的规律”，并试图在数据关联、共现间达成对网络文学高质量发展的反思与问询。但问题的关键在于，网络文学这样的数据特性是否被评论界充分认知，并进行相当地实操？

　　网络文学批评的反思与数据“敞开”

　　网络文学批评是与创作相伴生的，但它们之间的发展却并不平衡，网络文学创作走的是一条“爆发式增长、‘马鞍形’上扬之路”，而批评则是“在低调起步、艰难前行中日渐发声的”。人们对网络文学的普遍印象是创作的热闹、产业的繁荣、批评的边缘与弱势，似乎很少有批评能“走心走肾”，既获得网络作家认可，又能对创作进行引导。为何会形成这样的印象？创作与批评的鲜明反差是原因，“网络文学批评形态的内在区隔”是原因，评论的碎片化、可适性也是原因。那么，有没有更根本的原因？在笔者看来，对网络文学数据属性的忽视“难辞其咎”。

　　回顾网络文学批评的历史，其演进大抵经历了三个阶段：其一，“技术”理论的援引。网络文学初兴时，从西方引入数字文学相关概念、理论，观照网络文学的“技术”新质，黄鸣奋的《数码艺术学》、欧阳友权的《网络文学本体论纲》、陈定家的《“超文本”的兴起与网络时代的文学》等即是此类。其二，西方理论的“在地化”与作家作品分析的强化。网络文学进入商业写作和类型化发展后，早期的超文本理论、“数码”、“比特”等技术性概念明显地淡出，而与此同时，“传统”的媒介理论、叙事理论、英美新批评等与网络文学的实际相结合，落实在了类型研究、作家作品的分析等方面，代表性研究如周志雄的《网络文学的发展与评判》、邵燕君的《网络文学经典解读》、单小曦的《媒介与文学：媒介文艺学引论》《入圈：网络文学名作细评》等。其三，面向“技术”的批评回归。面对移动互联技术的突破、虚拟现实技术的成熟、AI大模型的赋能等，评论界似乎再一次省悟到网络文学终归是一种“技术生产”，于是“技术路向”又开始抬头，回归趋向明显，虽然整体上还比较“微弱”，但却有种燎原之势，代表性研究如黎杨全的《中国网络文学与虚拟生存体验》、储卉娟的《说书人与梦工厂：技术、法律与网络文学生产》、王玉玊的《编码新世界——游戏化向度的网络文学》等。

　　问题的关键在于，早期的“技术”理论多为“横向”移植，存在“水土不服”等问题，技术背后的“数据”属性还没有得到充分发掘就被搁浅。作家作品和类型的讨论却又大抵局限于个别、少量、“经典性”文本，常常存在着以偏概全、既敞开又遮蔽的特点，各文本背后的“数据”价值并未被充分重视。而“技术”批评的再次回归，虽从“数据”的角度作了不少创新性贡献，但又才崭露头角，尚没有形成一种强势的批评话语，其热点、方向性也有限。对网络文学而言，数据是本体、存在依据，是“生命线”，但对大多数批评而言，数据仅仅是材料、方法、手段等批评之“技”，不过“技”却无法走向数据评价论的价值、理念、思维之“道”。

　　因此，近30年的网络文学批评，网络文学的数据性是被遮蔽的，批评思维上的数据转换、批评方法上的数据应用等都还比较有限，更进一步的数据批评实操更是“沧海一粟”，由此导致批评不仅无法有效面向网络文学火热的数据现实，而且引发了批评的数据缺失“综合症”，促使批评的弊病愈发严重。比如，批评的标准错位，用“印刷文学”标准评价网络文学；批评只见树木不见森林，无法从数据整体性角度批评；批评迟滞、空洞，不能有效回应创作；批评各自为战，缺少共识性的批评“基座”等。这些问题弱化了网络文学批评的影响力，加剧了批评与现实创作的疏离，导致了批评的区隔性与浅表化弊病，正如有学者担忧的，“目前的网络文学批评，恰恰在理论的融通上捉襟见肘，产业、媒介、文学、观念、受众变迁……等等，都高踞网络一角，单独言说哪一个，都只能是盲人摸象、管中窥豹”。面对这样的网络文学批评现实，我们亟待以数据为中心，在底层安放“装置”，搭建批评的基座，真正地走向批评的敞开。这一做法的价值与意义至少有三方面。

　　第一，有效化解“量”的难题。网络文学批评的一大阵痛是阅读，批评者需要面对众多的作家、海量的作品、超长的小说、纷杂的用户评论。比如，2021年，“全国45家主要网络文学网站全年新增作品250多万部，存量作品超过3000万部”，2022年网络文学市场规模389.3亿元，同比增长8.8%，网络文学作家数量已超2278万，涵盖57个国民经济行业大类，网络文学用户规模达4.92亿。一些作品的字数如下：猫腻的《庆余年》398万字，忘语的《凡人修仙传》771万字，老鹰吃小鸡的《全球高武》835万字。一些作品的用户评论数如下：辰东的《完美世界》超过60万条，会说话的肘子的《大王饶命》超过150万条，爱潜水的乌贼的《诡秘之主》超过200万条。这些数字让人生畏，如果要确切地对某一类型的作品进行批评，或许皓首穷经亦难完成。但假如不阅读完毕，批评的可适性将大打折扣。作为应对策略，树立批评的数据思维，合理利用数据化技术手段，进行相关文本的数据抓取、集成、分析等，无疑将使批评更为合理。比如“一叶故事荟”软件，它能够“10分钟，多角度观察文本特征”，“一眼找到全文关键信息”，“一目了然地洞察全文的情节起伏变化”。借助于它，我们可以轻松地读完上述那些“巨量”作品，了解主要人物、故事梗概、情节变化等，批评自然会“得心应手”一些。

　　第二，开拓新的批评问题域。从数据的角度来审视，当前的网络文学批评主要涉及的是文化层面，大多停留在界面层的数据显示上，地基层的数据源、应用层的数据库却鲜有涉猎。但问题在于，网络文学正是通过数据录入、数据结构、算法分析、数据分发等来实现，表层的文化呈现只是数据的运算结果，不讨论结果背后的数据处理如何能够达成深度理解？从这样的角度来衡量，当前的批评只是揭示了网络文学数据特性之冰山一角，更广阔的以数据为中心的批评问题域还停留在海平面下。比如算法偏见问题，如果我们将算法偏见理解为“对某些个人或群体、信息内容等产生不公平结果的系统性和可重复性错误”，那么在网络文学领域就时刻存在着这种偏见，其表现在网站的排版设计上、作品的升降沉浮上，更表现在阅读的推送上。算法偏见似乎是作为数据的网络文学在呈现过程中不可避免的，因为算法说到底是人创造的，但是由于当前网络文学普遍的商业性氛围，算法偏见加剧了网络文学的数据崇拜，导致了同质化、数据歧视与遮蔽，从而使得小众写作、边缘写作等一定程度上处于弱势地位，不利于网络文学的创新。其他类似的问题，如数据的采集是如何影响生产的，算法又是如何生成、运行的，是否存在着一种算法审美，该如何看待数据正义与伦理，“数据鸿沟”又表现在哪些方面，文学产业是否就是数据产业，批评界还没有完全将之纳入观照视域，进行深入思考。

　　第三，切实回应技术的挑战。网络文学已进入智能化发展时期，技术的进步塑造出了软件辅助写作、人工智能生成，尤其是以ChatGPT和“文心一言”为代表的大语言模型展现了“AI生成”的巨大潜力，势必会带来网络文学的革命性变化。“人工智能之于网络文学的特殊优势在于，它不仅是媒介和载体，还是创作工具和内容‘生产商’，随着算法不断迭代创新，预训练模型和多模态开发促成AIGC技术能力质变，人工智能将获得更通用和更强大的文学生产和传播能力，其改变的不仅是文学创作方式和存在方式，还将改变整个网络文学生态。”比如，百度小说的AI革命。百度小说融合AI，可以实现“AI校阅、AI润色、AI查阅”，“能为创作者提供海量创意，AI大纲、AI设定、AI续写能力”。例如AI续写，“作者只需要提供创意想法，输入创作指令，AI就会延续作者思路进行创作，生成的内容不但更贴合作者构思，并且可实时修改、无限次创作”。一个典型的案例是，百度小说作者“绘梦人”通过百度作家平台AI辅助完成的反诈题材短篇小说，“在上线5日吸引超10万读者，作者分润预计达5位数”。问题在于，AI是如何实现这些功能的，它背后的运算逻辑是什么？在这一过程中，是否存在着数据丢失、数据侵权、数字剥削？AI的崛起，是否内蕴着一种危机，昭示着网络文学主体性的丧失、“终结”的临近？面对人工智能的来势汹汹，网络文学批评不能仅仅局限于传统的价值、审美、文化等上，而必须凭对技术的了解与把握，回应技术的挑战，而从数据的维度切入无疑是最便捷、最有效的进入方式，因为人工智能在本质上就是数据和数据的运算，它与网络文学有着同构性。

　　网络文学产生于互联网平台，技术打造了它发展的基本格局，其创作、传播、消费都是以数据方式进行，“数据是网络文艺的天然母体，缺乏数据视角便难以进行完整的网络文学研究，从这个角度看，数据可被视为网络文艺批评的起点”。但问题的关键是，网络文学批评30年，数据并未得到应有的重视。面对批评的数据缺失和数据的敞开，我们应进一步从数据的角度思考网络文学的本质、特性、功能、发展趋势等内容，考量数据背后复杂的资本、文化、意识形态运行逻辑，建构基于数据的批评理论，从而实现网络文学的数据“解放”。那么，这一批评范式应该如何建构？

　　在技术与人文之间：作为新范式的网络文学数据批评

　　早在2000年，美国批评家弗兰科·莫莱蒂（Franco Moretti）就发表了《对世界文学的猜想》一文，提出了著名的“世界文学”和“远读”的概念。莫莱蒂认为，“现在的文学”是“一种全球性的系统”，但是“科研工作总是有诸多局限性”，“要同时解决世界文学和未读作品问题，也许太难了”，因此，“需要有一种新的批评方法”。面对“同为一体但不平等”的世界文学，我们无法用传统的细读方法来研究它，因为“文本细读的症结在于，细读的经典范围必然狭小”，“文本细读不会顾及非经典作品”，它是一种“神学的训练”，“极为庄正、严肃地对待那些为数甚少的文本”。这时，我们就必须“远读”，以牺牲细节的丰富性为代价，“少即多”，“关注那些比文本小得多或大得多的单位：手法、主题、修辞——或是体裁和系统”，以小见大，“从整体上理解系统”。莫莱蒂的“远读”概念凸显了他面对文学全球化的焦虑与思考，但如何“远读”，莫莱蒂却并未提及。迟至2005年，莫莱蒂出版了《图表、地图和树：文学史的抽象模型》，才第一次用定量、统计等方法示范了“远读”的操作方法；2009年发表了《风格公司：对7000个标题的反思（英国小说，1740—1850）》，用计算和定量的方法分析了7000部小说的标题，呈现了“远读”的批评魅力；2010年莫莱蒂又与马修·乔克思（Matthew L.Jockers）共同成立了斯坦福文学实验室，专注于用软件来分析文学，进行“计算”的批评，“远读”的影响力再次扩大。

　　莫莱蒂的“远读”理论并非诞生于“数据”的语境，但是其“远读”的数据实践却对网络文学批评颇具方法性的启示，“展示了定量或数字人文方法在文学研究中的价值和作用”，“展示了如何利用数字人文来进行小说、戏剧等叙事文体的研究”，以及批评主体需要的“对统计数据的分析和阐释能力”“通过微观的数据推导出宏观的结论的能力”。基于莫莱蒂的“远读”理论和批评操作的示范性，新的研究设想“统计文艺学”被提出，专门性的网络小说数据分析软件“一叶故事荟”被开发出来，而基于该平台的网络文学数据批评实践也获得一定彰显。比如，2019年战玉冰发表了《网络小说的数据法与类型论——以2018年的749部中国网络小说为考察对象》，对2018年的749部网络小说进行全样本考察和分析，呈现了其整体特点、主题、类型等。2020年，吉云飞发表了《作为“计算批评”的“远读”——以网络小说“升级文”中的节奏与情绪为例》，该文以2005年至2019年间共计14部超5000万字的“升级”类型网络小说为研究文本，通过关联词分布与关系、可视化呈现的方式，探究了“升级文”与读者情绪高度共振的奥秘。李强的《作为数字人文思维的“网文算法”——以“明穿”小说为例》，则尝试以“网文算法”思维为指引，运用数字人文研究中的人物分析对比工具，处理了“明穿”小说类型发展史的部分问题。2022年，周冰发表了《网络文学的“方言”书写、言语社区与修辞幻象》，对中国作家协会评选的中国网络文学20年20部作品进行数据分析，统计这些作品中有关时间词语的使用情况，并与传统作品《四世同堂》中的时间词语比较，启发性地总结了网文与传统作品时间词语使用的差异及原因。这些批评实践都是基于“数据思维”，综合运用“数据”软件系统，抓住网络文学的某一面向，以近乎全样本的统计、分析，呈现了网络文学的多模态特点，开拓了网络文学批评研究的新领域。

　　从莫莱蒂的“远读”理论到国内网络文学批评的“数据”实操，潜藏着一种对传统文学批评的颠覆性挑战，带有较强的范式革命意义。传统的文学批评基于“印刷文明”，“有一个词叫Literature，基本意思是‘书写的东西’（拉丁语对应词是literatura,其词根是litera,即字母），用以指一套书面材料，比如英国文学、儿童文学。相反，用以指称纯粹的口语传统、与之相应而令人满意的概念或术语，却是一个缺项。比如，传统的口头故事、箴言、祷告、套语就没有相应的概念或术语来表达”。印刷文明之下的文学批评面向的是纸质文本，崇尚文本细读，批评是具体的、少量的、经典的，认识逻辑是直线性的，“印刷文字则把主体构建为理性的自律自我，构建成文化的可靠阐释者，他们在彼此隔绝的情形下能在线性象征符号之中找到合乎逻辑的联系”。这一批评是“经典性”批评，优点在于描述、定性，但主观、遮蔽，敞开性不够。而“远读”与“数据实操”则不同，它不忽视那些边缘性的文本，不讲究文本的精确性，而是讲究批评的数据量与数据计算，它意味着从文学性走向数据性，从个别经典文本走向海量文本，从人走向人—机辅助的计算批评、总体性批评，优点在于定量、效率、范围、深度等方面。

　　正是在这个意义上，我们认为，面对数字媒介带来的网络文学数据属性的强化，有必要倡导数据批评。这一批评范式不是与印刷批评绝对割裂，而是在接续、更生的基础上，在面向具体的数据文艺实践中，引入数据思维与视野，强调文学性与数据性兼顾、从定性走向定量与定性结合、从人走向人—机协同、从单一的学科批评走向跨学科的场域化、实证化批评。它并不排斥传统网络文学批评的文化阐释，而是要以数据思维、模型为文化赋能。它不是功利性的数据崇拜，也不滑向计算主义或数据主义，而是为了更好地析出数据的经验、逻辑。它更不是片面的数据分析、技术分析，而是在对数据保持充分警惕的基础上，将技术与人文相结合的批评。数据批评至少应包含以下四个方面。

　　首先，数据批评将着力于文艺批评的数据思维转换与视野建构。它基于技术的维度，对数据进行本体性探讨，阐释网络文学底层的算法运行逻辑、特点，讨论算法的效能；它将在批评中引入数据性的思维与逻辑，强调网络文学的数据性、数据生产、数据正义、数据产业等；它将以数据的思维与眼光观照、反思网络文学的文学性，着力于对传统印刷批评进行数据性的思维与视野转换，从而以更符合网络文学实际的数据方法进行批评。比如，通过对2019年以来“赘婿文”的数据挖掘，用可视化数据软件，绘制“赘婿文”的数据图谱，把握网络文学的阅读审美风尚，进而通过对小说、视频等文本、阅读量、评论等数据的分析，呈现该类型作品的审美偏好、写作技法、心理指向等。

　　其次，数据批评将充分评估数据对网络文学的价值与意义。我们必须承认数据对网络文学生产与扩大再生产所具有的要素意义，以更贴近网络文学实际的方式进行数据批评，因为“今天的艺术家比以往任何时候都更为依赖于技术”，“艺术与技术正在重新融为一体，回归到它们原初的身份”。但问题在于，网络文学的数据在多大程度上影响到它的文学性，这种影响落实到具体的创作上又是以何种形式呈现出来的，数据性与文学性之间的关系又是怎样的？而在另一个层面，由于数据自身存在着可复制性、可删改性、算法偏见、易逝性等特点，如果对相关网络文学数据不甚了解，对即时性的数据保存不善，或进入“信息茧房”中，不留存相关数据史料，那么这种批评必将成为一种空谈。因此，倡导数据批评，需要在充分考虑数据特性的同时，充分估量其所具有的生产要素价值，研判数据的可能性与限度。

　　再次，数据批评将充分关注网络文学的数据生产与扩大再生产。网络文学的30年是数据生产赋能的30年，是它的读者演变为用户，文本转化为产业，生产即消费、消费即生产的30年。在一定意义上，网络文学的数据生产蕴含着网络文学繁荣发展的密码。问题的关键在于，数据是如何介入生产的，数据生产又是如何规训和实现它的扩大再生产的，再生产环节的生产、分配、消费等又是如何相互制约、相互影响的，数据背后的管理、模型、计算等又是如何影响到网络文学的生成的？数据算法推荐是否就是一种算法偏见，工业化的数据考量与标准化生产是否为导致网络文学同质化的“罪魁祸首”？传统的文学批评面对这些问题存在着“失语”现象，因而我们亟待从数据的角度强化对网络文学进行生产批评。

　　最后，数据批评将注重学科互涉，充分吸纳数字人文的方法进行批评。面对网络文学的巨量数据生产与扩大再生产，传统的文学批评方法与手段常常力不从心，这就需要倡导学科互涉，将文学与传播学、统计学、计算机科学与技术、图书情报、智能科学与技术等结合起来，“利用定量和计算对文艺进行数据化和数字化建构，从而走向网络分析、算法批评、可视化呈现等数字人文方法”。比如，天蚕土豆《元尊》的海外传播，小说英语版于2019年上线武侠世界，小说漫画版（韩语、英语、印尼语、法语等）在2018—2021年分别登陆Kakao Page、Naver、Mangatoon、PICCOMA、YouTube、Bilibili Comics等平台，海外传播、接受数据的分散、跨平台、多样性为影响研究带来困难，而诸如各平台的设计、风格是如何影响传播的，海外读者的接受又呈何种样态等问题，依赖传统文学批评与方法更是难以解决，必须走向学科互涉、数字人文批评。

　　2021年，中央宣传部等五部门联合印发《关于加强新时代文艺评论工作的指导意见》（以下简称《意见》），明确指出要“健全完善基于大数据的评价方式，加强网络算法研究和引导，开展网络算法推荐综合治理，不给错误内容提供传播渠道”。2023年，国家数据局组建，负责协调推进数据基础制度建设，统筹数据资源整合共享和开发利用，统筹推进数字中国、数字经济、数字社会规划和建设等。《意见》和新机构的成立提醒我们，网络文学的批评必须“返本归根”，回到网络文学的数据本体，建构基于“数据”的批评方法与体系，只有这样才能发展出切合网络文学实际的批评理论，从而为建设具有中国特色的文艺理论与批评的学科体系、学术体系和话语体系提供必要的支撑。

　　〔本文注释内容略〕

　　原文责任编辑：马征

转载请注明来源：中国社会科学网【编辑：苏威豪】

社科推荐

学科体系

新媒体矩阵

网络文学的数据性及数据批评