知识革命还是知识堕化——ChatGPT与知识生成秩序

2023-09-18 作者:高奇琦 来源:《中国社会科学评价》2023年第2期

微信公众号

分享
链接已复制

摘  要:ChatGPT自2022年底发布以来,已成为目前最受世人关注的科技社会现象。之所以受到如此大的关注,是因为其让人们似乎看到了未来通用人工智能突破的可能性。当然,也有一些人认为,ChatGPT本身就是通用人工智能,例如搜狗创始人王小川便持有这样的观点。本文重点关注ChatGPT与未来知识生成秩序之间的关系。作为一种新型的知识创新工具,ChatGPT可能会对传统的知识生成秩序形成打破效应。因此,本文聚焦回答的问题是,ChatGPT这种新现象的出现,究竟是意味着一场新的知识革命,还是最终会导致人类的知识堕化?

关键词:知识革命;知识堕化;ChatGPT;知识生成

作者:高奇琦,华东政法大学政治学研究院教授(上海201620)。

  ChatGPT自2022年底发布以来,已成为目前最受世人关注的科技社会现象。之所以受到如此大的关注,是因为其让人们似乎看到了未来通用人工智能突破的可能性。当然,也有一些人认为,ChatGPT本身就是通用人工智能,例如搜狗创始人王小川便持有这样的观点。本文重点关注ChatGPT与未来知识生成秩序之间的关系。作为一种新型的知识创新工具,ChatGPT可能会对传统的知识生成秩序形成打破效应。因此,本文聚焦回答的问题是,ChatGPT这种新现象的出现,究竟是意味着一场新的知识革命,还是最终会导致人类的知识堕化?

  ChatGPT对传统知识生成秩序的打破

  人类社会在几千年的历史中逐渐形成了某种知识生成秩序。波普尔所讲的世界三实际上就是对这种知识秩序的概括。在波普尔看来,世界一是物理世界,世界二是人们的主观世界,世界三则是一种客观知识世界,即在人类主观世界中创造的文化、语言、科学技术等知识用某种载体记录并保存起来的世界。换言之,世界三实际上是人们共同理解的知识的客观化。相比而言,传统的知识生成是相对缓慢的,而学者在这样的知识秩序中发挥重要作用。学者所做的工作就是,在各自的研究领域,通过对前人文献的阅读并结合最新的现实发展情况进行进一步的知识总结和创造。

  应该说,这样的知识秩序是相对稳定且不断缓慢推进的。一个创新力极强的学者要挑战之前的主导传统观念需要准备大量的经验事实,并提出更具说服力的结论。在长达几千年的人类历史演进中,一个完整的知识生成秩序由教育系统和评价系统构成。教育系统的关键是要培养一流的学术工作者,并加入知识生成过程中。学术工作者要有非常强的学术兴趣,要受到良好的学术训练,并有志于为此付出自己全部的心血和精力。评价系统则由期刊社、出版社以及奖项评定系统等构成。换言之,在传统的知识生成秩序中,学者处于中心位置,特别是那些获得较高声誉的学者会成为知识秩序的中心,他们的观点会成为知识秩序中的定盘星和稳定器。这样的代表性学者也是在严格的教育系统和复杂的评价系统中,经过无数次筛选后出现的。总之,传统的知识生产形成了一套完整的规则,并对人类社会的其他秩序形成支撑效应。例如,政治秩序的稳定和延续在很大程度上就依赖于这种知识秩序。人们之所以对民族国家或政治系统有很强的认同,很大程度上就来自以知识秩序为中心的政治传播。

  然而,ChatGPT的出现对传统知识生成秩序却会形成打破效应。ChatGPT给人的初始印象是一个聊天工具,但它实际上是一个伪装成聊天工具的通用知识生成器。ChatGPT的基础是通用大模型。这类通用大模型是卷积神经网络(CNN)、循环神经网络(RNN)、生成式对抗网络(GAN)等基础上发展起来的,其核心架构是2017年谷歌提出的转换器(Transformer)模型。转换器模型在之后的发展中形成了两条代表性路径,一条是谷歌推动的以BERT为代表的编码路径,另一条则是OpenAI推动的以GPT为代表的解码路径。BERT模型在完成类似于完形填空的任务时表现得更加优异,而GPT则在根据上文预测下文的任务中表现更好。我们今天体验到的ChatGPT,便主要是这种类似于“文字接龙”的语言预测模型。

  ChatGPT中的“Chat”是聊天的含义,而GPT则是“Generative Pre-trained Transformer”的缩写,其字面翻译是“生成式预训练转换器”。如前所述,“转换器”是最基本的算法模型。“生成”代表着其核心是一种生成智能。换言之,其内容完全是生成的,而不是从已有训练的语料库中摘取出来的。“预训练”意味着要通过已有的语料封装一个具有海量参数的大模型。换言之,这样的大模型要经过预训练的阶段,而在预训练阶段时,只要达到一定的参数规模,那么这样的大模型便可能会涌现出较高水平的生成智能。

  ChatGPT在知识生成方面最为强大之处在于其“一键生成”的功能。换言之,只要对话者给出合适的提示语,ChatGPT便能在短时间生成大量内容。例如,人们可以要求ChatGPT扮演某个角色,并根据这个角色提供一段文字,那么ChatGPT就可以在几秒内输出一大段文字。尽管ChatGPT是逐字生成的,但是在强大算力的支撑下,这种逐字生成的速度还是远远超出了人们的想象。一般人完成一篇2000字的文稿可能要花上一天或几天时间,而对于GPT,这些文字通过几轮对话,可能在一分钟之内生成。从这一角度来讲,ChatGPT是一种维利里奥所讲的光速技术。更准确地讲,它是一种光速知识生成技术。如果ChatGPT仅仅是生成速度快,那也不会引起人们过多的担忧。但ChatGPT的知识生成质量同样令人惊艳。尽管ChatGPT也可能会一本正经地说瞎话,然而当其迭代到GPT-4时,知识幻觉现象已经大大减少。GPT-4的知识准确性大为提高,似乎有了类似于人类的某种常识。

  这实际上对传统的知识生成形成较大的挑战和冲击。传统的知识生成是相对缓慢的,无论是完成还是发表论文,都需要较长的周期。然而,ChatGPT却可以光速生成知识。其中会产生一系列的问题。例如,作者在撰写论文时是否可以使用ChatGPT?是否应该对作者完全独立完成和使用ChatGPT完成的情况做明显区分?ChatGPT加入写作过程,是否会对传统的发表秩序产生扰乱效果?传统的知识评价是否也需要进行调整?这一系列问题极难回答,却也非常急迫。目前关于是否可以在论文撰写中使用ChatGPT,已经出现了两极化的观点,分别是拥抱技术派和限制技术派。

  拥抱技术派认为,ChatGPT是一种先进生产力,而先进生产力就必须被使用,否则便会落后于时代,因此积极的态度应该是拥抱先进技术,与技术共生。正如搜索引擎出现时,我们要充分运用搜索引擎带来的知识检索便利,并通过这种知识检索来增加知识的广度和深度。ChatGPT就是一种新技术条件下的类搜索革命,因此最佳态度就是要充分运用ChatGPT技术。限制技术派认为,ChatGPT的使用会导致在知识创造中产生不公平竞争,最终可能导致人类知识生产水平的下降。例如,乔姆斯基激烈地表达了这类观点。他认为,ChatGPT是一种公开抄袭。这类观点认为,如果人们大量且长期地使用ChatGPT这类技术,那么人类最终可能走向对技术的过度依赖,使得自身的知识生产能力大为下降。

  智能生成知识:一种新的知识革命

  我们需要充分认识到ChatGPT给人类社会带来巨大知识革命的机会和潜能。人类历史上长期面临的重要问题之一是教育资源的匮乏。一些脑科学研究表明,人类大脑并未受到充分开发。其中的关键原因是,人类受教育的时间仅仅占到人生总时间中很小一块。具体原因是多方面的。比如,在农业社会甚至是工业社会的绝大多数时期,教育都极其昂贵,教育并不是为了满足人们的好奇心,更多是为了维持生计。或者说,教育服务于劳动力的再生产。即便是在公立教育普及并且教育成本大大降低的今天,我们同样能感受到教育开支在家庭总开支中仍然占有较高比例,持续不断地获得新鲜的好知识非常困难。再者,绝大多数个体在人生的诸多阶段并不知道应该学习什么。在农业社会和工业社会早期,人们在受教育过程中面临的主要困难是知识匮乏,要获得一些好的书籍极为困难。今天,书籍的获取已经不那么困难,但对于学习者而言,直接与拥有较高知识水平的学者进行沟通和对话仍然是不大可能的。从这个意义上讲,优质教育资源仍然是高度稀缺的。

  然而,ChatGPT的到来让人看到了高等教育平民化的希望。换言之,每个人都有可能获得一个足够耐心的、百科全书式的好老师的机会。这个老师就是ChatGPT。在ChatGPT的辅助下,我们可以更好地学习诗歌、创作乐曲和练习编程。如前所述,在工业时代,教育的目的是创造更多专业领域的劳动力,因此教育的特征是分科教育。而在ChatGPT的辅助下,我们似乎可以更好地激发个体的兴趣,在对话的语境中更加深入地探索知识的乐趣,并且得到手把手的指导。以编程为例,这是一个非常漫长的、艰难的学习过程。传统的计算机编程教育往往会强调基础理论,而编程的魅力和乐趣在于编写者通过某个程序可以解决一些实际问题。在ChatGPT的辅助之下,学习者可以获得更多边玩边学的机会,这便是教育学中强调“寓教于乐”的道理和缘由。

  当然,这样的知识革命还意味着一场新的知识秩序调整。目前,在知识产权界已经产生了相关争论。例如,人工智能生成的作品是否可以被界定为具有某种知识产权?这样的知识产权是归人工智能的开发者,还是归人工智能的使用者,抑或是归人工智能本身所有?这类问题在今天并没有一个大家都认可的结论。目前知识产权界较为通行的做法是,将人工智能生成物统一界定为没有知识产权。然而,这并没有解决问题。例如,那些花了较多时间和精力并运用了各种提示词来激发人工智能生成的使用者往往会宣称其在这一过程中确实付出了较多劳动,并且人工智能生成物也是在其核心构想基础上产生的,其往往会主张某种知识产权。

  另外,知识产权设立的目的是对某些极具创新性的设计或形式进行保护,从而激发人们的创作欲望。如果完全将人工智能生成物界定为没有知识产权,好处是这样的作品会被广泛使用,缺点是这最终会损害那些花了巨大精力来对人工智能进行诱导和提示的人们的积极性。另外,也有一些观点认为,提示词本身是否就应该具备某种知识产权。总之,智能生成知识的出现对传统知识秩序形成了某种打破效应。然而,新的知识秩序并未完全建立。我们对人工智能生成知识的范式、创新性以及价值等都仍然在探索之中,共识也远未达成。

  知识堕化:智能生成知识的新风险

  ChatGPT会带来一场新的知识革命,但这一革命中也蕴含了知识堕化的新风险。ChatGPT是一种快速进行知识生产的通用知识工具。尽管GPT-4在一定程度上可以减少知识幻觉的问题,但仍然存在一本正经说瞎话的可能性。同时,由于其强大的快速生成知识的能力,这使得我们进入了一种知识通胀时代。如前所述,人类生成知识的速度是较慢的,任何一个新知识的出现都要经过诸多同行的确认。新的、有价值的知识也是在反复核对和校准的基础之上才能产生。然而,ChatGPT却会通过远超人类知识生成速度的方式进行知识生产,目前的新媒体也不需要期刊发表那样复杂的知识确认程序,“完成即发表”更是自媒体的特点。可以想见,在ChatGPT相关技术的辅助之下,自媒体会海量且快速地大量生成各类公众号文章或视频,人类会进入一个巨大的知识泡沫时代。

  这导致的风险有两类。一类是在知识泡沫之中寻找有价值的知识变得极为困难。我们很难辨认,哪些是人类创造的真正知识,哪些是机器在“一本正经说瞎话”背景下创作的泡沫知识。伴随着这些有用知识和无用知识的搅拌、混杂与流通,多数人类个体可能会放弃知识辨别。另一类则是一些人类个体可能会在ChatGPT的辅助下最终放弃自己的知识创造能力。换言之,ChatGPT可以帮助自己写诗歌和程序,那为什么还要亲自动手写?进言之,一旦人类丧失了自己动手的能力,那么人类是否还真正掌握着创新的核心驱动力?按照德勒兹的说法,大量的差异是在重复过程中产生的。换言之,一丁点的创新是在无数次千锤百炼中获得的。如果我们不动手去做,怎么能发现那么一丁点的创新机会?

  一些人将人类未来的创新潜能寄希望于提示词,认为提示工程是人类未来的核心能力。笔者在一定程度上认同这一观点,认为提问确实是人类非常重要的能力。提问的关键是人类会对事物的变化保持好奇心。然而,问题是近期AutoGPT的发展似乎也在侵蚀人类的提问领域。换言之,机器将来在一定程度上也可以具备提问能力。如果将所有的工作都交给机器,那么人还需要做什么?人类自身的核心能力还会剩下什么?

  如何重构新的知识生成秩序

  前文讨论了争论的两极,分别是拥抱技术派和限制技术派。在笔者看来,对于ChatGPT在知识领域的运用,我们恰恰要处在拥抱和限制之间。一方面,作为一种新型生产力,我们需要了解并掌握这一技术。否则,我们会落后于时代,最终被先进的生产力所淘汰。因此,使用技术是不可阻挡的大趋势。另一方面,我们也要充分看到技术可能带来的新风险。特别是,在使用这一技术的过程中,人类可能会形成一些坏习惯,如将所有的工作都交给ChatGPT,自己则处于躺平状态。一个好的态度应该是,接受和使用技术,充分认识到技术的局限性,并且在这一过程中不断提升自己的能力,用自身在与技术对抗和学习的过程中掌握的新能力最终打败技术。

  笔者曾提出过机器人新三原则,其核心逻辑是:机器人永远是辅助。机器人作为一个全新的他者,在很大程度上会进一步激发人类自身的知识生产。换言之,在机器巨大的知识生产能力面前,人类要找到自身优势,并不断提高自己的知识生产能力。在这一过程中,我们同样需要充分思考ChatGPT的技术特征,并积极构建一种全新的知识生成秩序。在这一过程中,如下几点较为重要。

  第一,对ChatGPT的使用采用分级制度。例如,对于成年人,在工作的环境下,为提高生产力,可以使用并建议使用ChatGPT。然而,在培养自身能力的教育阶段,ChatGPT的使用要分级,并在某些领域限制使用。例如,在未成年人的基础教育阶段,要避免孩童形成对ChatGPT的过度依赖。理想的状态是,要让孩子们使用并了解这些新技术,但要充分地告知在其受教育阶段,这些技术不能用来完成作业,因为教育的目的是训练其自身能力,而这种一键生成的完成作业方式,对学习能力是有害的。

  第二,对ChatGPT技术生成的知识要加以区分。换言之,要对ChatGPT生成的知识给予明确的标识,使之与人类创造的知识明显区分。特别是当这些知识被用到一些可能影响人类重要决策的领域(如政治决策、司法决策或医疗决策等领域)时,要充分审核这类知识,避免对人类社会产生巨大的负面影响。同时,对于那些运用相关人工智能技术生成虚假信息并恶意传播,进而产生较坏社会影响的某些个体及行为,要充分地警诫。在对ChatGPT生成知识进行标识的过程中,区块链技术可能是一个较优方案。区块链技术的基础是数字账本。数字账本技术可以把这些智能生成知识有效地记录下来,并且可以追踪其流转和传播的整个过程,这样就可以避免某些虚假或泡沫知识对人类知识秩序形成较大冲击。

  第三,传统知识秩序中的发表节奏也需要适应相应的变化。传统期刊的审稿周期较长,实际上不利于某些人类知识的传播。换言之,一些严肃的学者也会愿意对一些新兴问题发表自己的看法。如果这些看法是通过传统期刊途径加以发表的话,这一周期往往较长,其知识影响力也会大大减弱。因此,传统知识秩序同样需要尽可能地缩短周期。例如,近年来在国外兴起的Open Access和国内出现的提前上网都是一些较好的尝试。

  第四,投稿人、审稿人和期刊都需要履行一些声明义务。ChatGPT技术并不是不能用,但是如果投稿人在文章某部分确实使用了ChatGPT,那么应当在文章中加以声明。未来,审稿人或期刊编辑也可能会使用ChatGPT相关技术,对此也需要加以声明。换言之,ChatGPT可以出现在期刊论文发表的某一环节中,但相关方一定要充分地声明具体的使用情况,给予其他相关方明确的信息,以助于其他相关方更加明确地判断其知识的可靠性和精准性。

  第五,人类社会需要在知识产权的相关问题上尽快地达成一定程度的共识。知识产权是整个知识秩序的中心。如果人类社会围绕知识产权仍然处在不断的争论之中,那么传统知识秩序就会与新知识秩序之间产生巨大摩擦,这并不利于人类社会的知识生产。如何在传统知识秩序与新知识秩序之间达成某种妥协或一致性,至关重要。

  结语

  整体而言,ChatGPT是一个全新的事物,给传统的知识生成秩序带来了巨大冲击,也带来一场全新的知识革命。对于普通人而言,这样的知识革命意味着多数人可以运用这一技术获得更好的教育机会。在ChatGPT强大的赋权效果之下,教育资源可能会变得不那么稀缺,同时学习者可以将自由时间转化为更多的受教育实践。从这一意义上讲,终身教育是ChatGPT出现之后人类教育实践的一次重大变化。那些未充分开发的大脑可能会获得更多的深度开发机会,人类个体的知识创造潜能也可能会在与机器他者的凝视和互动之下被大量地激发出来。然而,其中也蕴含了新的知识堕化风险。如果人们将获得的新自由时间不用来学习而用来做其他无意义的活动,那么ChatGPT将带来的更多是人类对工具的过度依赖以及自身堕化的风险。同时,对于整个知识秩序而言,ChatGPT的巨大冲击效应还未完全显现,在冲击之后产生的一系列问题还未完全暴露出来。在接下来的阶段,我们需要更加关注这些有可能出现的新风险。在新知识秩序与传统知识秩序之间达成某种弥合性的共识,可以使得人类的知识秩序更好地服务于每个个体的美好生活。

原文责任编辑:刘倩

转载请注明来源:中国社会科学网【编辑:陈静】