2022年底,ChatGPT横空出世,标志着生成式人工智能(以下简称“生成式AI”)在语言理解和交互领域取得了显著进展,从而引燃了全球对生成式AI的关注和研发与应用。 2025年初,中国的DeepSeek异军突起,以极低的成本实现了与顶级模型相媲美的性能,标志着生成式AI进入平价时代。由于其卓越的内容生成(文生文、文生图、文生视频、文生代码)与信息整合能力,生成式AI也被寄予了变革科研范式的厚望。笔者在2024年初曾撰文《从数字人文到AI人文:人文研究范式的变革》(《东南学术》2024年4期)认为“随着生成式AI技术的快速发展,AI人文将进一步实现对人文信息分析的自动化和智能化”。不过,这一判断的论证还有进一步深化的必要:“生成式AI的快速发展”的方向是通用AI(Artificial General Intelligence,也称AGI),AGI尚未实现,AI人文“对人文信息分析的自动化和智能化”能力也将严重受限,短期内难以彻底推动“AI for Science、AI for Social Science、AI for Humanities”科研范式的变革。因此,非常有必要结合AI技术的发展以及新一轮科技革命的目标,对生成式AI在科学研究中的赋能作用进行冷深思与审慎评估。
毫无疑问,生成式AI的技术突破已经引发了对新一轮科技革命的狂热想象。然而,有两个方面值得特别关注:其一,经过两年多的发展,生成式AI已初步具备了一定的商业落地应用场景。从2022年底以ChatGPT为代表的生成式AI技术的成功出圈,进而引发的“百模大战”,再到当前以宇树机器人为代表的人形机器人取得跨越式发展,预示着人工智能与机器人两项技术正在获得突破性进展。其二,生成式AI的发展是否标志着当前已开启了新一轮科技革命?这个判断还值得商榷,略有保留。理由是,通用人工智能目前还没有出现的迹象,量子计算等为代表的前沿技术确实有了大幅进步,但当前技术的渗透率还远未达到临界点(如AGI还未成为现实、即便是现在互联网也都还未全球普及),相应的社会结构的失衡、适配制度的滞后、技术伦理的缺位等诸多问题都还远未得到解决;换言之,新一轮科技革命能否到来,其核心并非新技术的出现,而在于这些新技术是否已经全面重塑了生产力和生产关系,并推动社会的变革。因此,新一轮科技革命还处于可能到来的阶段。
之所以区分这两个方面,是出于对“新技术革命”这一宏大叙事的审慎态度。即,虽然我们可能看到了新一轮科技革命的曙光,但也别高兴得太早。当我们尝试着用生成式AI提高学习、工作和研究效率的时候,千万别想当然地将它等同于全部的AI技术,更不要轻易地想当然认为它已经就是“第四次革命”的核心技术。正因为如此,非常有必要强调对生成式AI技术本身的两个基本判断:其一,生成式AI技术本身并不新鲜,其理论基础可以追溯到20世纪的概率统计和生成模型。当深度学习技术出现之后,生成式AI也经历了从变分自编码器(VAE, 2013)到生成对抗网络(GAN, 2014),再到循环神经网络(RNN)和长短时记忆网络(LSTM, 1990s-2010s),最后到Transformer架构(2017)的演进历程。更为重要的是,生成式AI只是众多AI技术中的一种,除此之外,还有诸如专家系统、计算机视觉、启发式算法等诸多领域。当前生成式AI之所以火爆,是因为其内容生成能力满足了普通人对科幻文学中非人智慧生命的想象,并且其“自然语言编程”能力极大地降低了人们与AI技术进行交互的门槛;其二,从生成式AI到新一轮科技革命,人类的科技探索还有很长的一段路要走。当前的生成式AI仍然还是弱AI(Narrow AI),离能够像人类一样自动学习、自主决策,实现自动化生产的AGI还相去甚远。虽然生成式AI获得了技术突破,但其他相关科技领域的进展还相对滞后,诸如量子计算与脑机接口尚处于实验阶段,人形机器人只是初步展现出一定的进展。
正是基于以上判断,当我们讨论“新技术革命冲击背景下的科研范式变革”这一问题时,一定要明确,不能将“新技术”等同于生成式AI。而且即使是生成式AI,也不能仅仅等同于ChatGPT、DeepSeek等大语言模型(LLM)。从技术本质上说,生成式AI是大语言模型、多模态技术、深度学习等诸多领域的技术集成与优化。它们所共同推进的内容生成,其技术核心是概率建模和生成。如生成式AI的文本生成仍然主要依赖于统计学习和语料库训练,即便是现在各类大语言模型纷纷增加了“深度思考”“长思考”功能,但它们的所谓“推理”本质上仍然只是一个“伪装成思考的任务分解器”,。虽然它在策略优化上明显提升了大语言模型的性能,但究其实质仍然是对模糊、复杂任务的分解,还未真正学会人类的思考;以Midjourney为代表的图像生成工具则主要基于扩散模型实现像素级的生成,其底层仍是对现有视觉模式的组合,也尚未创造出全新的视觉语言;以Sora为代表的视觉模型的视频生成能力还受计算成本和物理一致性的限制,其“世界模拟器”的理想还依赖于“空间智能”技术的突破;最近火爆的AI编程软件,如Cursor、Trae等,确实极大提高了编程的效率,但它还无法取代人类的架构设计能力。
因此笔者认为,当前的生成式AI技术对科学研究的影响需要审慎评估。生成式AI本质上只是一个效率工具,虽然在文献综述、增强检索、虚拟筛选、技术预见等方面能够实现部分的“加速研究”,但自身还存在诸如预训练不足、“幻觉”、“偏见”等诸多问题,在现阶段还没有实现科学研究范式变革的能力。当然,对生成式AI的冷思考并不意味着否定AI技术未来的飞速发展以及即将获得的巨大突破。当通用AI诞生之日,或许才是“对人文信息分析的自动化和智能化”实现之时,到那时,对科研范式的影响也许才会真正走向深入。现在我们需要做的,是尽快提升AI素养,借助生成式AI的能力,提高人类自身的学习和工作效率、改善教学和科研方式,不断探索AI赋能科学研究的可能性。
(作者系上海大学中文系教授)