伴随ChatGPT、Kimi等大语言模型的诞生,生成式人工智能正在剧烈颠覆人类社会的生产模式、工作习惯以及信息法则。在此背景下,大语言模型对于国际关系研究方法的冲击成为重要议题。
技术发展是改进研究方法的动力
长期以来,社会科学认知依赖于人类对现实世界发展规律的归纳与演绎,而科学技术的发展则为人类更新研究方法提供了诸多助力。在归纳层面,技术发展推动了信息记录载体的变化,提升了归纳总结的效率及成果。数据技术的发展不仅可以帮助人们通过数目字的方式理解世界,而且能够将图像、声音、视频等纳入统一数字底层框架,实现归纳工作的数字化与智能化。在演绎逻辑层面,技术的发展丰富了人类表达社会科学规律的逻辑方式,数学等形式化符号语言成为众多社会科学理论假设的表达方式,支撑起诸如理性选择理论、分析性叙事等诸多社会科学研究方法。同样,伴随计算机科学的演进,社会科学理论的演绎逻辑也可以在计算机系统内实现有效模拟。
大语言模型等一系列人工智能技术的出现,为社会科学研究者提供了一个具有参考性的“模拟现实世界”。一方面,大语言模型进一步实现了对人类社会现实的精准记录,并呈现海量数据、模态多样等特点,完整准确地完成对现实社会的数字重构。另一方面,大语言模型实现了对人类行为模式与规律的深度还原。在特定工程方案下,研究者证明了大语言模型具有“基于推理展开行动”的特性。通过“思维链推理”和“上下文学习”等方式,大语言模型将问题拆解为一连串中间步骤或推理链,以便更加轻松地处理复杂问题。这些行为背后体现了大语言模型具有“类人推理”的重要逻辑。
大语言模型在国际关系研究中的优势
既有国际关系研究的基础来自对世界事务的信息记录,大语言模型可以在以下几个方面助力研究者实现方法进步。
首先,大语言模型有助于弥补国际关系研究中的“数据赤字”。在既有研究国际关系的方法中,有效数据与资料缺失制约方法的演进。大语言模型通过对现实动态的精准感知,可在相关议题上构建具有高拟真度的模拟数据,缓解研究者“无米之炊”的困境。例如,在心理学、政治学和经济学领域,均有一些研究使用生成数据替代人类被试者的响应数据,内容涵盖人物性格、意识形态、消费偏好等多个方面。同样,这些应用思路将有助于国际关系研究者分析决策者性格、外交决策的社会影响以及战略决策背后的偏好等问题。
其次,大语言模型可以更好地解决“反事实”问题。“反事实”是既有诸多研究方法与因果推断的核心。在既有方法中,“反事实”呈现的世界只能停留在具有诸多限制性条件的实验研究里。与关注微观样本的学科不同的是,国际关系研究常将“重大事件”作为研究对象,因此难以通过大量微观样本分析实现因果推断。在大语言模型的赋能下,“反事实”的世界可在模拟的条件下实现,进而为研究者提供假设检验。例如,通过模拟国家战略行为的“战争行为体”多智能体系统,美国密歇根大学与罗格斯大学的研究团队借助触发不同冲突强度的“反事实”事件,探索了诸如第一次世界大战等重大国际冲突中引发战争的核心机制与可能的和平维持策略。
最后,大语言模型能够提供更为准确的预测研究。大语言模型以生成式神经网络为基础结构,将复杂系统的数值求解问题转化为多模态数据拟合问题,建立起从假设空间到预测空间的高效映射,从而加速预测知识发现的进程。例如,古吉拉尔对印度州议会的选举预测研究,就展示了应用大模型相比民意调查等传统预测方法的优势。古吉拉尔等研究者采集了社交媒体中与印度州议会选举相关的推文,在只利用提示语工程的前提下,借助大语言模型对推文中涉及政党、州和候选人等关键政治对象的情感倾向进行分析。通过基于正负情感总量与提及量的计算,该研究将大语言模型分析的情感得分转化为预测得票率,在准确率上超过了传统的民意调查。该项研究显示,大语言模型可以在零样本的情况下,展现出优于传统政治预测甚至深度学习模型的预测效果。
客观看待大语言模型的应用
虽然大语言模型的发展已经为研究方法的改进创造出无限潜力,但在方法应用过程中,研究者还需关注以下几个方面。
第一,大语言模型并非是对既有研究方法的替代或扬弃,而是进一步赋能和充实。一方面,在资料整理、数据清理、协助量化分析等阶段,大语言模型能够发挥自身在人机协作上的功效,进一步提升研究者使用传统方法的效率。另一方面,在多模态数据、行为体逻辑模拟等方向上,大语言模型可以助力研究者开发出更有优势的方法。例如,大语言模型可以与既有定性研究中的过程追踪相结合,通过对过程追踪事件的虚拟重构,构造相应关键节点的“反事实”情境,实现《追踪1789法国大革命》一书中展示的“身临其境”效果。此外,借助对实际数据样本点的虚拟还原,大语言模型可以将冷冰的客观数据还原成具象的行为体或事件,帮助研究者更清晰地把握研究机制和过程,进而丰富定量研究的内容。
第二,使用大语言模型开展研究需要处理好模拟世界与真实世界的关系。对于国际关系研究而言,大语言模型应用最重要的贡献在于通过对虚拟现实的把握,检验和发展相关学科理论。因此,在使用大语言模型开展研究时,需要确保大语言模型塑造的虚拟世界与真实世界的匹配度,这就要求研究者能够深入理解现实世界,建立针对大语言模型模拟数据的拟真性检验,限制大语言模型出现“幻觉”,避免因使用不符合客观实际的假数据导致研究失效。
第三,大语言模型仍无法代替人类自身对于现实世界的观察与思考。大语言模型可以通过高超的归纳能力与类似人类的思维能力,替代研究者的部分工作。但国际关系研究创新的源泉来自学者对国际社会的观察与思考。尽管大语言模型实现了对人类行为与逻辑的复刻,但它尚不具备主动思考的高级能力。因此,大语言模型只能成为开展研究的助手,却无法有效提出重要的研究问题,形成对于科学知识的自主发现与提炼总结。
(作者系上海国际问题研究院比较政治与创新研究所副研究员;上海社会科学院新闻研究所青年学术交流中心主任、中国社会科学院大学数字文明与智慧决策实验室研究员)