摘 要:生成式AI向人工智能写作领域拓展,为反思媒介技术革新与文艺生产的关系带来契机。生成式AI借助模型迭代持续进化,带来文艺生产方式的新变化,传统文艺生产方式向“人机生产”发展。在人与AI生产者、自动化生产工具等因素的交互作用下,新的文艺生产方式得到快速发展,并向人机间性生产模式转型。文艺生产方式的更新产生了新型的人机关系,人机之间具有复杂的矛盾。为此,应探索一种人与AI和谐共存,在“共鸣”中充分发挥各自创造力的合作方式,充分释放人机生产活力,实现文艺健康发展。
关键词:生成式AI;人工智能写作;人机生产;人机关系
作者别君华,杭州师范大学文化创意与传媒学院讲师(杭州311121)。
媒介技术与文艺生产的关系一直是新媒介文艺研究和人工智能美学聚焦的话题,学术界也基本形成了新技术变革能引发一个时期文化变革的共识,但超出常人预期的媒介技术迭代和应用依然能引发热议。2022年文本—图像跨模态生成模型DALL-E 2、Midjourney的面世、Stable Diffusion的开源,以及ChatGPT的兴起,使生成式AI成为重要的公共议题。与此同时,AIGC也受到广泛关注。AIGC的全称是人工智能生成内容(AI-Generated Content),指利用人工智能模型让机器生成高度接近训练数据风格、具有创造力、展现出一定创意性的数据内容,包括诗歌、小说、图像、视频等。例如,基于Transformer大语言模型(LLM)的ChatGPT能理解和生成自然语言文本,并根据上下文信息进行情感分析、情感计算,使文本具有情感性。传统人工智能写作软件只能进行拼写检查、语法检查、文章质量评估、提高文本可读性等辅助性工作,ChatGPT的技术能动性和文艺创造力与之截然不同。
新的文艺生产图景展现出:不仅人类,生成式AI也能动地生产和建构着文艺经验,在深度学习模型、大语言模型等技术基础上,生成式AI展现的模仿力和创造力突破了传统艺术创作主客二元模式下的媒介工具定位,对既有文艺生产形成了革命性挑战,推动文艺生产方式发生变化。这一变革为我们深入认识基于生成式AI的文艺生产状况和AIGC文艺生产方式新变提供了重要契机,也呼唤学术界创造新的文艺理论和批评范式,以更恰切地阐释新出现的文艺现象,讨论新技术影响下人类作者和智能机器的关系。
生成式AI模型迭代提供技术基础
长期以来,在文艺生产中,媒介往往被视为工具,这一认识导致文艺批评在面对AI媒介物的冲击时不能很好地认识新媒介的作用。从2017年微软“小冰”携诗集《阳光失了玻璃窗》打破人工智能写作的主体界限,到2023年ChatGPT与AIGC广泛进入文艺生产领域,人与智能媒介间的紧张关系愈发成为文艺研究者的关注焦点。对人与AI关系讨论的主流视角仍是基于主客对立的二元论立场,人类是否会被智能机器替代?智能机器能否具有人的感知力、情感、创造力?智能机器生产的艺术品能够作为艺术品吗?面对媒介物的能动性,关于作者“主体性的消解与重构”焦虑反复出现,并充满威胁论基调。基于这样的状况,对媒介能动性的确认尤为必要。能动性观念将进一步打破长期以来文艺生产中媒介仅仅被视为生产工具的观念,为建立符合AIGC文艺生产特征的评价标准提供合理的认识前提。
GAN被广泛应用到文本生成、语音生成和图像生成领域。对于人工智能写作而言,GAN能够从随机噪声(或其他数据)中生成高度逼真的新文本。这就为文字风格的模仿奠定了基础。使用GAN模型开发的人工智能写作工具,可以使普通人的写诗风格接近海子甚至李白、杜甫,也可以让普通人的小说创作获得著名作家的风格,甚至人人都可以创作类似莎士比亚的戏剧剧本。中国传统美学讲的“风格即人”,面临被智能机器生产拆解的风险。此外,人工智能也可以生产出某个特定时期、特定流派、特定作家的“风格”。在绘画领域,GAN模型的能动性也被充分开发,以43.2万美元在佳士得拍卖会上成交的作品《埃德蒙·贝拉米的肖像》就是一幅由GAN生成的作品,有趣的是,作品右下角的签名不是某位艺术家的名字,而是一串计算机代码。
虽然CLIP+VQGAN主要应用在图像生成领域,但对人工智能写作而言,它同样是技术能动性变革不可忽视的一环。这是由于,对传统文学来说,文学文本仅仅由单一的文字符号构成。文字符号构成的文本欣赏空间是扁平化的,只允许视觉这一单一感官进入,这就构成了传统文学的“静观式”审美方式。这样的历史在新媒介文艺时代发生了很大变化,文本开始由多模态符号组装而成,文字、图片、声音甚至动态视频都能囊括其中,形成复合符号文本或超文本。数字文化学者考斯基马在梳理数字文学时提出,20世纪80年代出现的文字处理器和数字桌面系统是数字文学诞生的技术起点。这些工具的出现,给文学文本从字体、页面到整体风格的设计提供了技术支持。
在厘清生成式AI如何在技术迭代中实现能动性后,本文便能进一步探讨AIGC文艺生产方式的变化。由于“文学”与“艺术”的交融趋势在人工智能写作中愈发清晰,因此,本文的研究对象涵盖了广泛的文艺生产类别。
AIGC文艺生产方式的变化
能动性是智能机器区别于非智能机器的根本特征,也是开展生成式AI文艺生产方式研究的立足点。AI显示的能动性,从内部来看是经由不同路径模拟人类智能,从外部来看是在人机交互技术的支撑下被赋予的感知、认知和行动能力。而具体到生成式AI,其能动性则是在前文所述的模型迭代进化过程中,在GAN、CLIP+VQGAN这类跨模态模型基础上实现的。除了以上模型,人工智能写作领域ChatGPT的火爆也让基于Transformer的大语言模型及其能动性受到广泛关注,本文借此展开进一步分析。
ChatGPT的能动性集中表现为基于上下文编码和动态记忆机制这两项主要技术形成的多轮对话能力。与之前的聊天机器人相比,ChatGPT-4能够生成更加连贯、自然的语言文本,其生成结果的精准性以预训练技术、迁移学习方法为基础,根据任务目标对模型进行反馈,对规则和参数进行调整。结合上下文的动态记忆,ChatGPT-4能够从给定的文本中推导出隐含的信息,从而提高输出的精确率。ChatGPT-4在人类情感计算上也达到了很高的水平,并随着技术迭代不断进化。综合多种模型来看,生成式AI的能动性体现在“学习性”“模仿性”“推理性”“对话性”“情感性”“生成性”“创意性”等多个维度,这促使诸多研究者将这种能动性的定位升级至“主体性”。例如,近年来兴起的人机传播范式便是以“智能机器主体性”为前提建立起来的。
数据库逻辑同样影响了AIGC文本形态,在人机间性生产方式的作用下,文艺文本呈现为数据库化的聚合与组合。有学者就此提出了AI创作文本的“互文性”,但“互文性”不足以概括AIGC文艺生产过程中文本发生的数据库化的变形。AIGC文艺生产成为一种基于人类“输入”对数据进行调用、调配和组装的生成过程,在这里我们也能看到生成式AI的物质性是如何影响文本的。
具体来看,这既体现在算法艺术、数据艺术、人工智能艺术及其交叉领域中,也体现在生成式AI向大众文艺生产的不断渗透上,如抖音、快手等数字平台上由人工智能编剧、剪辑、配音、制作特效并进行叙事模版生产和个性化推送的AI影像生成,普通用户运用文心一言、New Bing、ChatGPT及绘图应用DALL-E、Midjourney、Stable Diffusion等进行的文艺生产。在智能机器生产阶段,AI既能以“生产者”身份调用人类已有的以数据化形式存储的“数据库”并将其作为生产对象,又能作为“生产工具”对数据生产资料进行自动化加工,通过人机协作提升文艺生产速度和效率。
与传统的文艺创作相比,AIGC文艺生产的一个重要变化是人机间性生产方式的出场。如上文提出的,在AIGC文艺生产中,AI不再仅仅以工具、媒介的面貌参与到艺术生产中,而且成为一种新兴的生产者,独立或与人类合作进行艺术生产,产生了新型的人机生产方式。正是在人的使用中,智能媒介显示出了“类人性”;正是在AI的参与中,人类创作者融合了AI的物质性并显示出“类机器性”。在二者合作中出现了人机间性的生产方式。
对人机关系的反思和展望
在人机生产方式中,我们需要充分认识到人—机之间的复杂关系,尤其是这一关系内在的互斥张力可能导致的风险结果,毕竟技术带来的社会问题很多时候是由技术关系造成的。
那么,我们应如何调试、调和AIGC文艺生产中的人机关系?如何在AIGC文艺生产中保持人和AI二者关系的动态平衡,避免造成其中一方排斥、侵蚀另一方能动性和主体价值的状态,充分激发人机生产活力,进而提升文艺生产价值?这首先需要对人工智能写作及AIGC文艺生产中的人机关系问题进行梳理,在此基础上才能作出较为客观的判断。
第一,生成式AI作为创作工具并不被人完全“掌控”。使用者并不了解AI的计算原理和基础,即使专业的程序员、工程师也不知道机器内部的“算法黑箱”是如何进行数据处理的。并且AI的不断迭代使人与AI之间存在一种“丢弃结构”,即人还未能理解、掌握当前的AI工具就需要换掉它们,“因为创新的高速率,让这些东西在它们的物理寿命结束之前,就已经落伍、不合时宜了”。
第二,AIGC文艺生产过程中人的主体性存在被消解的危险。我们仅仅在生成式AI平台输入指令,就能得到一个作为结果的艺术品,传统文艺创作中人与物深度纠缠的灵感、顿悟等都泯灭于机器数据运算过程中。艺术创作行为不再是人的本质力量的对象化,行动脱离自我的掌控,导致我们有意识地做着无意识的事。
第三,人和作为结果的AIGC艺术品之间“体验”的方式发生了变化。典型的例子是在AI沉浸式艺术中,我们通过人机交互“自动地”实现了自身感官对艺术品生成的影响,却不能完全理解和深度参与作品的创作。
上述变化均出现在人工智能写作中。譬如,AI写作软件“笔神”为解决文字工作者缺乏素材、没有灵感、效率低下的问题,利用自然语言处理、推荐算法等技术为用户提供用于“拼图”的素材。“笔神”的数据库覆盖了万亿条中文语料数据,并且每条数据都借助机器模拟人工打标签的方式打上标签,方便后续基于对用户创作内容的语义分析和预测进行高相关度内容的推送,提高与用户需求的匹配度。用户通过关键词搜索,就可以匹配到相应的古文经典、名人名言、网络文学等素材。此外,在使用“笔神”写作过程中,该工具也能跟随写作内容的提示在右侧拓展框中随机推送相关数据。用户可以选择性调用推荐的语料数据,进行与数据相融合的“拼图”游戏。
用户使用“笔神”进行文本创作的过程精准体现了上述三种变化:首先,用户和“笔神”之间并非一种“上手”状态,且“笔神”的持续进化要求用户不断适应它,二者之间是疏离的。其次,用户和输入、搜索、推送、筛选的行动之间是无关系的,除了对数据进行“拼图”的过程体现了有限的主体性,其余的行动更像是对机器的自动化反应。最后,由于缺少了文艺创作过程中对人本质力量的凝结,主体的创作动机、情感、情境全部被排除,艺术作品成为一个主体力量干瘪、机器数据符号充盈的拼凑物。因此,人无法在文艺接受中获得共鸣、净化和余味等审美体验。二者仅仅是短暂的、瞬间的相遇,形成技术对人的感官的“侵占”和冲击,人被迫卷入其中,形成机械化的技术快感。
在上述情况下,人和物的疏离也导致人和智能机器均无法充分发挥自己的能动性,人与物活力的萎缩使人机间性状态下具有创造性的“文艺生成”难以发生。在这种文艺生产中,AIGC无法实现对人类艺术价值的突破,人的本质也被人工智能写作深度排除。
对于这些问题,哈特穆特·罗萨提出的旨在体现主体与世界双向互动关系的“共鸣”概念有一定启发性。郑作彧将共鸣提升为一个有着明确定义的物—人关系范畴,物—人之间的共鸣关系意指一种物与人于内在作用中增添了原先不具有的性质,从而使双方提升了存有厚度的关系,并且增添的存有厚度是物与人双方在一定程度上共享的。共鸣关系之所以能产生“厚度”,是由于它承认矛盾的必然性,正是矛盾的交互作用为增加物与人交互中的厚度奠定了基础。这与人机生产中的人机间性关系具有相似性,人机之间虽存在矛盾,甚至这种矛盾有使双方失去自主性的风险,但矛盾也能使双方发生革命性变革并增加人机互构的经验厚度。因此,只有在“共鸣”的人机关系中,人机才能发挥各自的活力,生产出一种凝结了人与AI主体性、拓展了审美经验厚度的人机审美经验。
因此,AIGC文艺生产必须倡导一种更加开放的观念,在“共鸣”的立场上,揭示人与AI之间存在和谐共生的可能性,承认人机生产为文艺生产带来的巨大变化,并在这一观念指导下开展更广泛的文艺实践,接纳不属于人类独创的,在人与智能机器乃至人类与非人类之间生成的审美经验。人与技术之间并不总是矛盾关系,也并不必然处于对立状态。并且,在良好的人机关系中蕴含着超出人类主体性的创造力。这一点在AI生成文艺作品中已经凸显出来,其创造力既不同于人类,也不纯然是机器运算的结果。人与AI合作进行生产,可获得文化创新的可能。
在面对越来越多嵌入社会生活和文艺秩序中的智能物时,我们应以一种更开放的观念视之,抛开人类中心主义立场,思考一种人与AI和谐共存,在“共鸣”中充分发挥各自能动性、创造力的合作方式。这样才能在人机“共鸣”中探索出一条文艺健康发展的路径。
结语
在实践层面,人工智能与文学、艺术已然紧密结合,学术界也有研究者陆续进入这一新兴文艺场域,对新发生的文艺现象进行分析和研讨。然而,到目前为止,大多数研究往往在现有相对成熟的学术范式下展开,将人工智能文艺视作网络文学、网络艺术、新媒介文艺的延续,导致中国文学、艺术研究领域尚未形成一个可以称之为“人工智能文艺研究”的成熟范式。本文提出,在传统AI迭代为生成式AI,介入人工智能写作,推动人工智能文艺持续更新的情况下,有必要加大研究力度,探讨生成式AI的技术迭代及其文化后果,建构相应的理论范式。
本文提出人机生产这一表征文艺生产方式的概念,为回应AIGC文艺生产变革,理解人与AI在文艺理念和实践上的复杂关系提供了可能。此外,在迎接这种可能性的同时,我们亦需充分关注人机关系变化造成的技术对人本质全面排除的风险。生成式AI的文艺生产,呼唤以“共鸣”规范人机关系,充分释放人机生产活力。此外,可将对生成式AI和AIGC文艺生产的思考与中国文艺理论传统联系起来。“共鸣”与中国传统文化中的“和谐”理念有契合之处。从中国传统文艺理论视域出发,可对人机生产实践作出具有启发性的阐释。这指向了中国文艺研究的一项重要任务,即为人工智能文艺研究构建具有中国特色的理论话语。
〔本文注释内容略〕
原文责任编辑:范利伟