人工智能如何理解语言

2024-10-16 来源:中国社会科学网-中国社会科学报

微信公众号

分享
链接已复制

  2024年7月31日,OpenAI推出GPT-4o的高级语音功能,可以提供更自然的实时对话。GPT-4o能够识别并响应用户语音中的情感变化,如感知悲伤、兴奋等情绪。人工智能语言能力的跃升引发了人们的思考:这是否意味着,人工智能理解了诗的内涵及情绪?当与人工智能对话时,它真的理解我们吗?对于此类问题的回答,或许可以从语言、符号以及意义等基本概念入手。

  语言即自我:

  图灵测试的语言哲学观

  1950年,图灵发表论文《计算机器与智能》。考虑到智能本身难以定义,他提出了作为判定标准的图灵测试:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么就可以称这台机器具有智能。该文为第一波人工智能发展奠定了理论基础,图灵本人也因此被誉为“人工智能之父”。这个测试的基本方式——“语言交流”包含着深刻意义。

  图灵思考人工智能的策略深受艾耶尔影响。首先,图灵测试通过“语言交流”而非身体形态或生物学特征来确认“人的智能”,预设了“人”及其智能的最核心表现是“语言符号能力”。艾耶尔在《语言、真理与逻辑》中认为“自我意识绝不包含任何实体自我的存在”,强调了语言在哲学中的核心位置,因此“语言”实际上就构成了可被实证的“自我”之所在。这是图灵测试的重要哲学基础。其次,图灵测试通过可操作的实验和经验观察来验证机器智能的表现,悬置了过程,排除了对机器内在意识的讨论,并不追究机器是否“真正思考”这一形而上学问题,契合了艾耶尔所强调的可验证性和实证主义。总之,图灵测试设计理念与艾耶尔行为观察方法之间存在共鸣,展示了对语言和行为的重视以及对传统形而上学问题的规避。这使得图灵测试成为评估人工智能的一种实用方法。

  图灵测试的另一个重要基础是“符号主义”。在图灵测试提出之前的1936年,图灵就提出了“图灵机理论”。该理论用一个理想化的数学模型模拟计算过程。它是一个能够读写符号的机器,通过一组简单的规则进行计算。图灵机理论为第一波人工智能浪潮奠定了理论基础,但符号主义的哲学基础则可追溯到19世纪末和20世纪初的数学逻辑和哲学发展,尤其受到逻辑学家和哲学家如弗雷格、罗素、怀特海等学者的影响。这些学者致力于将逻辑符号化,用符号系统表达数学和逻辑命题。在他们看来,似乎所有问题都可被归纳为符号逻辑,而人的智能理论上也可以被具有计算能力的机器还原。

  符号主义的许多原理及应用迄今仍影响着人工智能的发展。但“符号主义+行为主义”的局限也逐渐暴露出来。这就是图灵测试中未加深究的问题——机器与人的交流中,机器是否“理解”了人类语言或是自己所呈现的内容?这个问题在后续的“中文房间”思想实验中被正式提出。

  “中文房间”思想实验:

  生命体验作为“理解”的前提

  1980年,塞尔发表论文《心灵、大脑与程序》,该文提出了“中文房间”思想实验:设想一个不懂中文的人被关在一个房间里,房间里有一本规则手册,这个人可以根据手册将输入的中文符号转换为输出的中文符号。从外部观察来看,这个人的输出似乎是理解中文的,但实际上他并不懂中文,只是在机械地进行符号操作。此文的目的旨在批判分析人工智能特别是强人工智能的观点。其攻击的要点即在于图灵测试所依据的“行为主义”所观察到的“智能现象”并非真正的智能。塞尔指出,虽然计算机程序可以在形式上处理符号,但这并不意味着它们真正理解这些符号的意义。

  艾耶尔从语义与语法方面阐述关于“理解”的区别。语法指的是符号之间的形式规则和结构。在“中文房间”思想实验中,房间内的人只是根据语法规则进行符号形式操作,而语义指的是符号的意义和内容。塞尔认为,语法本身不足以产生语义,计算机即便能够处理复杂的语法操作,也无法从根本上获得语义上的理解。心灵状态具有内在的主观性和意识体验,这种体验是符号形式操作无法捕捉的,因此“机器不能具备心灵状态”。

  塞尔的论点实际上是一种生物主义的观点,主张意识是基于生物物理过程的。因此,心灵现象必须通过生物学机制来解释,人工智能系统不能仅通过符号操作和计算模拟来达到与人类相同的心灵状态,心智能力是生物大脑的产物,而不是任何形式程序的产物。他的观点在人工智能相关的语言哲学、认知科学和伦理学等领域产生了深远影响。不过,塞尔的论点实际上将“生物性”作为“智能”或“理解”的前置条件,成了绝对化前提,使得后续讨论失去了意义。要客观理解“交流”本身,需要从生物性作为必要前提的必然性,以及交流与语义、语法之间的关系两个方面来讨论。

  广义语言:

  符号语用论与跨语际交流的敞开

  反驳生物性作为“交流”或“理解”的前提,可将这种前提推至极致,就会出现一个逻辑上的悖论——主体无法理解任何“他者”。因为“交流”存在的逻辑前提是存在意义主体的“相异”,颇有“子非鱼安知鱼之乐”的意味。对此,关于生物作为“智能”的前提可调适为:生物演化产生了生命感知的独特方式。生物的生存本能让特定生物发展出某种更适应于该物种生存的感知方式,这就意味着,这种感知或“理解”方式是“特别的”而不是“绝对的”。因此,跨越主体的交流也是相对的、特别场域下的有限交集。比如,人们认为理解了自己的宠物狗或宠物狗懂了主人的心,无非是在跨物种的交流之中,基于某个“意义场域”达成了临时性的跨语际交集。此时去追问整个“狗生”与“人生”的体悟之差别就没有必要了。即便是在人类这个物种内部,这种“有限交集”的获得也是我们实现“交流”的全部内容。

  塞尔的“中文房间”思想实验有力批判了图灵测试过于集中在“符形操作”方面的问题,但自身又陷入了狭义语义论的自限制之中。既然所谓的“生命体验”本就千差万别,那么我们何以用个体自我之“理解”去否定“他者”体验,以及去断定自我并不能共情之非生命体的“非体验”?我们只能知道自己的不同,而不能否定他者的存在,即所谓“子非我安知我不知鱼之乐”。语言哲学转向以来,语言背后的那种“本体”就弥散了,留下的只有语言或符号现象。这意味着,语言需要从狭义向广义拓展。人类定义的语言,或许只是以特定物种和文化社群为基础形成的狭义语言,是丰富多样的自然语言和符号中的“特定方言”。

  若同意交流的本义就是将“人”从幽闭的意义囚笼之中解放出来,那么广义的语言和符号就不仅是单个符号语义问题或符号形式操作问题,而是一个包括受传双方、媒介传输形式在内的整体语用问题。比如,人类可以借助超声波与蝙蝠交流,使用二进制代码与图灵机对话。反过来,动物也在学习“理解”人类的语言。被驯化的动物长期与人类相处,就会对人类的手势或语言进行符合期待的回应。而机器也在以人类所期待并实质上作为后台力量推动的方式学习这种“理解”。如今,人工智能已在一定程度上学会了对机器而言属于“外语”的人类自然语言——这仍是一个语用问题。人工智能没有生物学意义上的进化史,其语言符号表达现象是对人类语言的模拟。当人类通过深度学习的方式训练人工智能,以及将人工智能接入互联网时,人工智能吸纳的就是人类的意识——习得语言、语法以及社会文化,并成为人类意识的镜像,只是这镜像有可能延展、扭曲甚至形成一些看似“独立”的观感,但其实背后都可以找到人类意识。因而,当人们讶异于人工智能的惊艳表现时,所讶异的其实是人类自身意识的外在延伸。正如麦克卢汉所说,“一个有意识的计算机仍然只是我们意识的延伸,就像望远镜是我们眼睛的延伸,或是腹语术师的假人是腹语术师的延伸”。“懂得”我们的,不是一个机器他者,而是另一个自我。

  (作者系四川大学文学与新闻学院教授)

关键词:人工智能;理解语言
转载请注明来源:中国社会科学网【编辑:崔晋(报纸)赛音(网络)】