人工智能不仅成为引领新一轮科技革命和产业革命的重要驱动力,而且深刻影响到包括社会科学在内的知识生产和传播。围绕人工智能时代社会科学研究的新发展、新趋势与新挑战,《中国社会科学报》约请了米加宁、高奇琦和邱林三位学者展开研讨,希望通过对话促进共识、呈现分歧,为变革时代的社会科学研究激荡思想的火花。
ChatGPT的本质是大模型
《中国社会科学报》:我们说ChatGPT的出现在人工智能的发展史上具有里程碑的意义。如果用一个词来描述ChatGPT的本质,或者说革命性突破,是什么?我们可以看到有用生成式人工智能、通用人工智能、大语言模型等不同的表述,背后的区别是什么?
邱林:我是主张用大模型来理解ChatGPT。为什么不用“生成式”呢?因为生成式这种语言模型,其实从AI一开始就有了。像最早的Eliza,它就是对话型的,但它是基于非常简单的规则来对话的。比如,你跟它说“我今天心情不好”,它就会挖出“心情不好”这个关键词,生成“你为什么心情不好?”虽然这种对话是非常刻板的、机械化的,但它在本质上也是生成式的,是根据你的输入,生成了对你的反应。人工智能刚开发出对话机器人时是一个非常令人惊讶的工具,因为它原本是要用作心理治疗的,在心理治疗中通过与对话机器人聊天,让人可以更多地抒发。所以说,生成式对于人工智能来说是有一定的历史的,并不是新的。
之所以称它为大模型,是因为ChatGPT现在的数据量是有史以来最庞大的,加上它惊人的算力,导致了这种爆发性的智能行为。它与之前的生成式人工智能最大的区别在于,它的训练集是超大的,而且它背后的算法也与之前有所不同,是基于神经网络的机器学习,这是更加智能化的自我学习。
米加宁:生成式人工智能是很早就有的,但ChatGPT的生成式是非常独特的。为什么以前不用生成式人工智能?那是因为以前生成的内容质量很差,虽然生成了内容,但不够智能。直到今天,生成式人工智能才真正达到可以使用的程度。
GPT的全称是Generative Pre- Trained Transformer,翻译过来就是生成式预训练转换器。加上Chat,我觉得Open AI是出于商业考虑。但放到中文里,就容易把它理解为聊天机器人,甚至使用效果还不如一般的聊天机器人。实际上,GPT是三个要素的集合:一是大模型,二是大算力,三是大语料,三者缺一不可。在这个整体中,大算力是核心,因为有多大算力,才能处理多大的语料;有多大的算力,才能建立多大的模型。中美科技战里,美国为什么从芯片上打压我们?因为芯片是算力的基础,控制了芯片,算力就上不来。
高奇琦:我同意从大模型来定义ChatGPT。从概念史来看,生成式人工智能这个概念是略早于大模型的。三四年前,我们讨论比较多的概念是AIGC,即AI Generated Content,人工智能自动创作生成的内容。这个概念有两个相关的概念,一个是PGC,Professional Generated Content,是专业生成内容;一个是UGC,User Generated Content,是用户生成内容,即人生成内容。AIGC概念比大模型要早,ChatGPT出现后,为了更好地进行定义,人们越来越倾向于用大模型。其实,更准确的说法是大语言模型。这个语言是从人工智能关于语言的4个基本分类——机器视觉、语音生成、自然语言和机器人中的自然语言分类成长起来的。
稍微补充一点,这个大模型不光是数据量大,参数大是一个更本质的特征。因为这个算法最重要的特点是模仿了神经网络。GPT-3的参数量是1750亿,GPT-4官方没有公布,但可以知道的是,它是一个混合专家模型(MOE,Mixture of Expert),是不同小模型组合在一起的一个模型。所以,早期人工智能是基于规则展开,也就是符号主义;而发展到神经网络其实是关联主义,现在的大模型更多体现的是关联主义。
不只是新工具,更是新范式
《中国社会科学报》:近年来,随着新技术的发展,学术界尤其是公共管理学界有关于研究范式转变的一种呼声,比如主张构建数据驱动的新研究范式。大模型的出现,对于社会科学研究开放了哪些新的可能性?
米加宁:在大模型出现之前,社会科学的研究范式主要有定性研究、定量研究、仿真研究和大数据研究。大数据的提出是在2010年,提出之后对社会科学产生了很大的影响。在此之前,以往的社会科学研究都是基于个体对于问题的研究。孔德一直主张社会科学向自然科学看齐,他非常推崇经典物理学对自然界的研究,希望社会科学也能像物理学那样能找出一些规律来。孔德以后,社会科学开始大量开展模仿自然科学的定量研究。但是,这些研究并没有什么进展。因为,社会科学的研究对象超级复杂,用定量方法进行研究,相当于用简单的数量方法来应对复杂的问题,就好像用因式分解的方法去解决球面积分的问题。实际上,定量研究在极小的领域里才有可能,比如说公司治理中,因为公司边界清晰、数据规范,可以作一些回归分析。
社会科学的复杂性更多的是涌现的问题。比如,美国的通货膨胀,美联储为什么不用计量经济学做一个模型来解决?因为它知道,通胀率的产生是整个美国社会在真实世界中各种要素互动的结果,包括消费者、银行、生产者相互之间的互动。
大数据出现以后,大家认为大数据能有一些解决方案,想通过大数据洞察人的行为,但是没有成功。大数据始终没有形成一种方法论的体系。今天,ChatGPT来了,首先是认识论的转变,然后是方法论的转变,落地的解决方案就来了。因为以往都是基于问题的研究,是基于事件的研究;而ChatGPT是建立在人类整体智慧的基础之上。认识论转变就是你对社会系统、对复杂性的理解发生了变化。比如,定性研究、定量研究都超级简化了社会的复杂性,而仿真研究似乎想模拟社会的复杂性,甚至跟大数据结合起来搞数字孪生,但它们都不能真正解决问题。ChatGPT带来了生成式的治理解决方案,及时、灵活、快速。为什么说它是生成式的呢?比如,在应急管理领域,过去我们做应急管理,首先是把应急预案找出来,按照应急预案一步一步走。但是,面对超级复杂性、不确定性,怎么可能有预案?实际上,应急管理过程中往往都是按照经验来解决的,但经验毕竟是有限的。ChatGPT来了以后,对每一个场景都能给出决策支持系统、决策支持方案,能够让决策者在经验的基础上参考给出的解决方案,并随着危机的进展阶段,不断生成新的解决方案。
大模型作为第五研究范式,肯定要走出一个全新的道路来。在大数据之前,社会科学方案是由理论驱动的,大数据作为第四研究范式,形成了数据驱动社会科学研究。有了大模型,最需要的是把思维框架解放出来。以前是基于问题的解决方案,以后是基于事件的解决方案,不是从经济学角度,也不是从政治学角度,是怎么好使就怎么解决。
高奇琦:定量仿真、大数据、大模型其实是一个东西的不同发展阶段,都是用的计算机科学的方法。说到底它们都是量化的方法,是定量。大模型的发展肯定会使这个定量方法更加容易,因为它是试图去捕捉所有的可能性。但这在理论上讲是不可能的,因为任何事情都会产生新的变量出来。如果真的要穷尽,那就会进入一个封闭系统。
邱林:原来的社会科学研究样本很多是比较小的,像一个心理学实验里可能将100个人分成两组,对照组和控制组比一比,发现差异,而要跟踪实际生活中的数据,比如购物、吃饭、交通是非常困难的。而大数据带来了一个颠覆性的改变,因为它可以让我们拿到海量的数据,比如通过社交媒体可以测量24小时内的情绪变化。这些实时的、大量的数据,弥补了原来社会科学研究中样本量太小的问题。样本量太小,意味着研究的泛化能力小,而大数据扩展了我们的视野和数据量,让我们可以研究以前研究不到的现象。这是大数据带来的优势。
现在讲大模型,跟大数据又有不同。对我来说,大模型是一个颠覆性的工具。它能使社会科学研究在广度与深度上产生质的飞跃。比如说,根据最近的报道,研究者让ChatGPT生产一个可以行走的机器人。人类设想的机器人往往是类似于人或动物的,这局限了我们的思维;而ChatGPT给出的答案是超出人类想象的——它设计了一块海绵,上面有很多洞,通过打气进去来移动。可见它具有很强的创造力。这将会大大推动理论创新。实际上,ChatGPT可以从文献综述、产生理论、研究设计、收集数据、分析数据等多个方面对社会科学研究赋能。
大模型对于人类社会的理解,不是一种单独的理解,而是一种全局观的理解,是一个系统化的理解。用大数据做研究,比如根据微博上的数据分析人们的情绪变化,或者看看交通拥堵的情况、出行的规律,这些研究还是基于部分的数据来描述人类的行为,这样产生的理论还是比较孤立的。而现实生活是一个非常复杂的系统。有了大模型以后,它可以生成一个模拟系统,来模拟出非常真实的个体与群体行为。像斯坦福大学的研究团队建立的智能小镇,里面的25个智能体能产生非常令人可信的、类似于人的行为。过去的计算机模拟里的个体都是非常简化的,是通过很机械化的方式来设置行为。而在这个小镇里,你可以告诉其中一人你想要组织一个情人节的派对,这个人就会去告诉别人要开派对的时间,小镇里其他人就会互相约请,谁跟谁一起去,还会把时间记住,并在准确的时间地点出现。他们不再局限于建模时既定的简单行为规则,而是由大模型在背后根据互动产生相应的行为。这种在虚拟环境中产生类似真实生活中的交互场景,为社会科学研究者研究个体与群体行为提供了极大的便利。
我们近期的研究还表明,大模型有模拟受访者产生大规模调查数据的能力。美国皮尤研究中心在2023年3月对美国公民就俄乌冲突和拜登政府应对方式的看法展开了问卷调查,受访者10441人,调查包含8道题目。我们在2023年6月展开了一项研究,研究设计是向ChatGPT介绍俄乌冲突和皮尤研究中心2023年3月的调查问卷题目,然后要求其预测美国受访者在每个问题上各选项的百分比。研究表明,在8个问题中,ChatGPT在7个问题上的预测与调查结果的选择方向相符。我们还对另外3个皮尤中心的民调做了相同的实验,都得到了类似的结果。这说明, 大模型已掌握了人们的心理状态与思考方式,将能替代社会科学研究中的人类被试。
《中国社会科学报》:如果ChatGPT这样的大模型具有模拟受访者产生大规模数据调查的能力,那诸如问卷调查一类的研究方式还有存在空间吗?
米加宁:我想再强调一下认识论的转变,就是知识的生成是由传统个体的生成变成了大模型的基于人类知识的千百万个脑袋的生成。这里最关键的地方在于,是相信个体的力量,还是相信大模型的力量。我们过去的社会科学研究都是基于个体力量进行的。我觉得个体的力量是微不足道的。在大模型面前,个体只是作为一个催化剂而存在。以后的研究就在于,谁更擅长于跟大模型对话,那它生成的解决方案就更好。考虑假设、数据、模型都没什么必要,ChatGPT全都可以解决。只要把语境处理好,个体的问卷可以作为一个小语料投喂给大模型。大模型生成的内容一定是更可靠的。所以就民调来说,不是让ChatGPT去跟民调比准不准,而是应该用它来看民调准不准。
邱林:大模型模拟的结果确实与民调结果非常一致,但这并不代表现在可以完全依赖大模型的模拟。首先是数据荒漠的问题,有些地方网上的数据比较少,数据训练集不够,很难依赖大模型进行模拟。其次是即便有数据,但未必能真实反映线下民众的心理。
当然,从长期来看,解决数据荒漠是一个时间问题。可以想象一下,如果大模型通过装载在无人机上投放到世界各地去收集数据,它既可以收集地形地貌,也可以观察人类社会,还可以实现人机对话。如果可以全息、实时地收集数据,那现在的民调数据或论文数据对它而言都只是微量数据。关键是谁来安装,这是一个大问题。
大模型能够提出研究问题,又能够自己采集数据去验证,这样就形成了一个闭环,可以自己产生科学的知识。从这个意义上看,未来的研究不是怎样使用大模型作为一个工具,而是以它为主导的一个科研过程。虽然近期内更多的讨论是在讲人机协作,但我的预测是它会越来越占据主导,而人将会发挥一种辅导作用,扮演的是教练或导师的角色,通过提示、指引来参与研究。随着大模型的能力越来越强,它会自我产生更多的科学知识,也会改变科学研究的方式。
新图景中的学科与理论
邱林:在大模型的赋能下,理论会从孤立的、单一的理论,变成一种系统性的理论,成为对整个系统的一种描述。因为以前的理论往往用一个或几个变量预测另外一个变量就结束了。比如,关于提高生育意愿的研究,只会考虑通过发放补贴的方式将怎样提高家庭的生育意愿,就结束了。但实际上,如果女性都生三胎,可能会降低女性的社会地位,因为她们专注于工作的时间减少了,这样会导致女性不愿意生孩子,也就会削弱发放补贴的效应。所以,单单研究两个变量或几个变量之间的关系,没有一个系统性的全局观,是无法真正解决或观测到问题的。我相信,大模型会改变我们产生的理论,不再那么孤立的,而是描述整个系统的理论。
《中国社会科学报》:以后需要的理论会越来越少,或者是只需要一个理论?就像有学者在讨论ChatGPT可能带来的知识大一统?
米加宁:这种理解还是传统的思维模式,未来不能用传统的概念去解释。比如大平台,如果用传统经济学来理解,它就是垄断,但是大平台绝对不是垄断,因为它不是物理空间里传统企业的概念,它可以重新在物理空间里组织。对于数字空间、数字经济这些现象,传统经济学概念都不能解释,现在需要创造出一套新的解释方案。
《中国社会科学报》:那未来人类的知识体系是什么样的状况呢,是要打破以学科为基础的构建模式吗?
米加宁:对于这个问题,就像维特根斯坦所说,不能说的,我们就应该保持沉默。
邱林:有了大模型以后,我们从原来的解释导向,会进一步转向解决导向,更关注怎么解决实际问题。实际问题的解决会包含心理学的变量、经济学的变量、社会学的变量……它是一个融合交汇的解,是一个无学科的解决方案。比如财富分配,它是整个系统,其中的变量分布在不同领域中,大模型产生的是一个融合的跨学科的方案。这个方案里有很多参数,是一个很复杂的方案,可能是我们无法理解的。大模型的工作之一,将是怎样把复杂的理论用最精简的语言告诉我们,变成一个让人可以认知、可以理解的一个理论。
《中国社会科学报》:消解掉学科,这对知识体系来说是一个非常大的变化。
邱林:理论之所以重要,是让我们有一个对世界的理解,提供一个框架性的东西。理论是让我们活在这个世界上不焦虑的一种工具。所以,我们往往追求简单易懂的理论。但是,这种理论往往是宽泛的、不精准的、不能解决实际问题。所以,要能真正解决社会问题的理论一定是复杂的、跨学科的。
高奇琦:学科重构是肯定的。当下的学科划分是在第二次工业革命过程中,像涂尔干讲的社会分工,是由于新的职业的诞生,产生了教育的分类,教育实际上是为了培养劳动力的。在这个逻辑之下,越分越细,人变成了工具,也就是马克思所讲的异化。大模型的一个重要潜能就是,它可以成为一个重要的赋能工具,不管你学什么东西,它似乎都可以帮助你,不需要像原来那样细分了。从这个角度讲,它很好地回应了马克思所讲的异化问题。将来,每个人都应该是全能的,既可以写诗,也可以写代码。有了大模型以后,整个学习方式可以变成问答式的。通过百科全书式的方式,让个人建立起同步全球的学习能力。
尽管大模型不能说是全样本,但它是非常大的一个人类知识的样本,也可以说是一种世界模型,world model。世界上的知识基本上以知识压缩的方式压缩进大模型,人们再根据需求来进行调用。它的好处是什么?由于它的样本量非常大,可能无限接近理性。当你遇到困难时,过去只能是问父母,问有经验的人,更早之前可能是通过占卜。各种方法总是要给你一个说服的理由。从知识样本接近全样本量的角度看,大模型给出的答案确实可能让人类个体无限接近理性。但是,要让它的解释有说服力并让人信服,可能有点麻烦。
这需要回到是否还需要理论这个问题,关于这点又涉及两个问题。一是预测的问题。大模型在本质上是没有办法穷尽所有可能性的,是没有办法预测的。而如果大模型真正可以把所有东西都搞定,实际上不是一个开放系统,而是一个封闭系统,有点像把所有条件都设定好。但这个世界会变得很无趣。我觉得仍然还是有开放性的。另一个是因果的问题。我觉得社会科学的因果研究基本上是很困难的。就像《叙事经济学》所揭示的,人类社会实际上就是一个叙事,自我实现的预言,似乎很难存在绝对的因果。
米加宁:社会科学里追求因果关系太复杂,多因多果、多因异果。涌现就不是因果能解决的。所以现代社会科学抛开因果,走向了基于主体建模、复杂系统,涌现概念更适合社会科学对问题的看法。大模型的出现是建立了一个理论产生的高原,研究者在新的高原上建立高峰。高原和高峰的关系,一定是人机合作。
人工智能时代的“人”
《中国社会科学报》:不管是大模型主导,还是人机合作,新技术显然在学术研究中扮演了非常重要的角色。那么,人在其中扮演着什么样的角色?这种新的研究模式又对研究者提出了哪些要求?
米加宁:大模型的出现,要求研究者具有更丰富的想象力、对全局的把控力和深度的洞察力。在新技术普及的情况下,研究水平的高低取决于个体跟大模型对话的能力。现在面临的最大问题是如何规范。过去美国的25校联盟反对ChatGPT,最近哈佛大学发布了ChatGPT课堂使用指南。因为它意识到用ChatGPT写作业是阻止不了的。大家都用,就是在高原上建立高峰。
高奇琦:我认为提示工程是一个短期行为。因为大模型发展很快,现在有了Auto GPT,原本讨论的那些提示技巧,机器就可以自动执行。
《中国社会科学报》:使用大模型进行学术研究是否有弊端或者需要注意的地方?
米加宁:现在用还来不及,没有发现弊端。
高奇琦:国际上顶尖的人工智能研究专家,比如图灵奖得主约书亚·本吉奥(Yoshua Bengio)和杰弗里·辛顿(Geoffery Hinton),他们都对人工智能的发展非常担心。人工智能的威胁并不是虚幻出来的。大模型的样本量如果足够大,它是会有纠偏功能的。但它会产生更大的极化效应,在其中人其实没有太多的选择,从众效应肯定会加大。从这个角度讲,大模型有可能会成为谁能够当选美国总统的决定性因素。
《中国社会科学报》:ChatGPT的回答可能会影响到提问者后面的行为或认知。
邱林:事实上,媒体对人的影响一直就是存在的。美国民众的两党极化在社交媒体上很严重,原来以为只是一部分人的声音,但调研发现现实中的民众也是极端分化。这其实很难说是因果关系,到底是社交媒体上的极化影响到了现实世界,还是说社交媒体反映了现实世界。大模型也一样。它既会反映人们的思想, 也会影响人们的思想。
高奇琦:它会成为新的战场,新的舆论引导。我们要看到大模型背后的资本和利益,它所代表的意识形态。ChatGPT这样的大模型能够面世,其中有一个非常重要的工作叫“对齐”(alignment),就是跟美国的主流价值观对齐,否则是无法上市的。
实际上,它对于我们当下的研究者而言,影响是有限的,因为我们整个研究习惯已经形成了。但对于从小就生活在大模型的强大影响之下的未来的人而言,挑战就在于他有没有信心去做自己的研究?对于学术研究而言,人和人的交流是至关重要的。如果完全让技术主导,最后不可避免会导致人的主体性的丧失。在技术主导下,人和人的交流会变得越来越弱,最后都会变成人和技术的交流,技术会成为中心。这其实还是马克思所说的异化。在这样的异化背景下,人类肯定会走向消亡,至少是衰落。尽管从庄子的齐物论来讲,人和机器也是平等的,但如果就此讨论后人类,也是不符合人类的主流价值观的。毕竟,机器是人发明的,即便结果是注定的。那为什么要去加速呢?现在最根本的问题是,各国都在加速,都希望从中获益。
(本版由本报记者刘倩采编整理)