ChatGPT是OpenAI公司在2022年11月底发布的一种借助自然语言对话为主要载体和形式的人机交互应用。相比于该公司早期推出的前三代GPT模型而言,ChatGPT由于其应用形式的普适性(即以聊天的形式使用大规模语言模型并见证其解决问题的能力),在短时间内便获得了广泛的传播,引发了整个社会面的关注,同时也类似DeepMind的AlphaGo一样,为人工智能技术的进展在全社会的普及性认识,再次铺开了一条路。
ChatGPT的出现使得人工智能从业人员看到了通用人工智能达成的希望,但同时也对人工智能领域的相关研究带来了不小的冲击,众多企业纷纷进行相关布局和调整,高校和研究院所也在紧锣密鼓地开展相关调研以及举办密集的研讨会。在ChatGPT技术影响的人工智能领域的众多研究方向上,受到最直接冲击的便是自然语言处理。
众所周知,自然语言处理按照自底向上的任务进行划分,可以分为词法、句法、语义和语用四个层次。深度学习的兴起和发展,几乎使得词法、句法和浅层语义分析相关的任务退出了研究的主流,而ChatGPT的出现则进一步推动了语义和语用相关研究的进展,凭借(1)语境学习(In-context learning)的特殊模式、(2)能够容纳较大窗口范围的输入(可以将上百句话的语境信息建模成输入)并进行回复的能力、(3)接收人类的语言指令并输出与人类期望相对齐的结果、(4)多语言及代码一体化的训练方式和方法,使得ChatGPT具备了一系列的能力。包括(1)长距离语义关联性建模;(2)精准定位语言中的特殊内容和结构;(3)以特定的逻辑来组织所生成的回复;(4)给定一种语言的片段作为输入,输出相同语义但不同语言的片段;(5)甚至理解人类语言所表达的“弦外之音”并模拟这种说话方式等等。
以上这些能力对应着大部分自然语言处理的研究任务,包括篇章建模及分析、信息抽取、自然语言推理、机器翻译、指代消解与省略恢复、比喻和类比的识别及生成等,同时也带来了上层应用,如对话系统和搜索引擎,性能上的显著提升。
对于ChatGPT对自然语言处理研究带来的冲击,不同的从业人员(无论是来自于学术界还是工业界)持有不同的态度,从我个人的角度,我是持积极态度的,即我认为自然语言处理的相关研究任务会借助以ChatGPT为代表的大规模预训练语言模型技术的发展而迎来更大的进步,甚至是在可以预见的短期时间范围内,带来研究范式的变迁,至于现有某些研究任务的消失也不需要感到悲观和绝望,毕竟这就是技术发展必经之路上常见的“风景”,我们可以做的是“不念过往,不畏将来”,毕竟我们已经看到强如ChatGPT也暴露出了很多未能解决的新问题,如生成内容的事实性较弱而幻象较强、与人类常识有一致性上面的矛盾、偶尔还会生成有害性或误导性的内容等等,而以上的这些问题也为自然语言处理的研究人员提供了新的研究机遇和挑战。
综上所述,人工智能的发展过程是一个不断变化的过程,是一个新事物代替旧事物的过程,伴随着技术的迭代和应用场景的不断更新,我们看到的积极的方面是由人工智能驱动的生活便利性、幸福感和舒适度的不断的提升,对于无论是人工智能的专业从业人员还是受惠于人工智能发展的普通民众,我们都可以积极地拥抱这种变化,毕竟无论对于人工智能的研究还是应用,唯一不变的就是变化。
(作者系哈尔滨工业大学计算学部社会计算与信息检索研究中心教授)
扫码在手机上查看