司晓
腾讯研究院院长
以大模型为代表的生成式人工智能,是新一轮科技革命与产业变革的关键力量。当下,人工智能从端侧用户角度来看,正在从提效工具(Efficiency tools)、助手(Copilot)进化到智能体(Agent),成为人们生产生活中不可或缺的伙伴。技术能力迎来新跨越,给人类的价值判断和路径选择带来一次全新考验。中国高度重视人工智能发展,积极推动互联网、大数据、人工智能和实体经济深度融合,培育壮大智能产业,加快发展新质生产力,为高质量发展提供新动能。走进人工智能新时代,我们要促进技术与社会的连接,以人工智能助力人类智慧与创造力,让人工智能始终朝着助人成长、与人为善的方向发展,真正实现科技向善,走向人类可持续发展的美好未来。
智能向善,需要可信的共识机制
可信,是筑牢智能向善的基础。大模型在文字、语音、图片、视频生成上展现出不错的效果,机器第一次具有了部分类人的创作能力。在表现能力升级的同时,大模型的表达能力也取得突破性进展,技术对知识生命周期的影响第一次从传播和交互环节向前延伸到生产环节。大模型知识输出的精准度、专业度,即大模型的可信度,将成为人工智能应用赛道的核心竞争指标。
为实现可信,一方面,要在模型原理等底层技术架构设计上提高答案的准确度,加强算法的鲁棒性和可解释性,全面做好系统和信息的安全防护,增强技术的安全韧性;另一方面,要在机制建设上借鉴并升级传统的知识共识机制,在全面引入人类长期积累的优质文化知识资源的同时,以新的共识机制创造更多新知识,用共识和知识的确定性,结合技术进步,消除大模型“幻觉”的不确定性,促进人类知识的传承、运用与创新。
回顾过去,人类的知识创新、知识进步,尤其是以计算机为代表的科技革命以来,是信息技术驱动下内容表现形态和传播方式的演进历史。第一阶段,是以印刷术为支撑,从中国北宋发明家毕昇发明活字印刷术到15世纪德国发明家古登堡改良活字印刷术,再到近代以蒸汽机和电力革命驱动的机器印刷技术革新,促进了知识传播与分享从小众群体到普罗大众、从一城一国到覆盖全球的演变。第二阶段,是以互联网为支撑,借助搜索引擎、社交网络、数字媒体等知识创造与传播的新形态,推动知识在全球达成共识、流动流通,从异步变为实时,极大促进了经济发展和社会进步。如今,大模型的出现,正在推动知识创新向第三阶段迈进,大模型带来的知识汇聚、融合、解构、重组和生成的新方式,有望成为未来知识生产、传播、再创造的主流模式之一。
为了提高大模型可信度,各国大模型开发者都在不断加大研发投入,试图通过更大规模参数、更多训练数据来提升基础大模型性能。但应当认识到,大模型的“幻觉”问题是伴随着人工智能底层技术路径与生俱来的,和创新能力是一体两面的,难以仅仅依靠技术彻底解决。因此,引入权威的图书、期刊、资讯、论文等优质内容数据,并打造新的、可信的知识共识机制和供应体系,是未来大模型在生产生活应用领域产生更大价值的关键所在。这就需要传统的知识创造与传播机构和大模型开发者加强合作,共同完成可信知识生产供应能力的跨时代迁移。
在近期的实践中,腾讯混元大模型正在与中国大百科全书出版社、人民卫生出版社、上海辞书出版社、化学工业出版社等传统出版机构开展合作,支持其推出图书智能体,探索基于搜索增强技术的可信大模型合作模式。比如,在元宝APP应用广场中,人卫智能体可以为用户提供心脑血管等特定医学知识领域的权威解答,同时提供相关书籍原文的引用,并引流到电子书阅读平台、跳转到实体书购买页面。智能体的应用既能实现类似脚注尾注、文献索引等传统知识溯源机制的迁移,确保输出知识的共识性、准确性,也将为出版机构和互联网平台带来可持续、共赢的收益模式。
未来,随着文化与科技的深度融合、传统业态与新兴业态的共创协同,一定会有更多模式创新,拓展更多应用场景,带来更多高可信度的应用体验,促进大模型更好地赋能生产生活。人工智能将更好地服务人类,支持每个人以其智慧进行更有创造力和普惠性的生产生活,实现可信应用,走向和谐共生。
智能向善,需要可靠的行业应用
可靠,是实现智能向善的条件。让人工智能成为助力人类可持续发展的向善力量,需要全面接入生产生活的各种应用场景,成为驱动经济发展的基础设施,让全社会可以像“接上电”“连上网”一样,达到“用上智”。实现这一普惠愿景的前提是,人工智能的供应必须像供电、上网一样安全可靠,能够满足各种生产生活场景的应用需求,保障大模型在应用层面的可靠性。
为实现可靠,所需要努力的方向之一便是在技术路径上升级,让大模型具有科学研究领域(Al for Science)的深度思考、科学推理和研究能力。为了推进人工智能应用落地,让技术从可用到好用,在继续完善大模型概率输出的“形象思维能力”基础上,加快强化推理输出的“逻辑思考能力”。大模型此前更擅长“快思考”,能做出快速反应和类似人类的直觉判断;以OpenAI的o1和DeepSeek R1为代表的大模型则将“强化学习”引入推理过程,是一种“慢思考”,会花更多时间分析背景、挖掘细节并逐步推导,模型生成内容的过程也更加符合人类的思维逻辑,输出的结果更加可靠。随着推理能力的提升,大模型的可靠性也得到提升,已经在实践运用中得到初步验证。
在教育领域,与之前的大模型相比,具备深度推理能力的大模型应用效果更好,特别是在STEM(科学、技术、工程、数学)教育中的表现尤为突出。比如,当用户提问一道物理题时,大模型不仅会输出答案,还会一步步推导过程,解释每一个具体关键点。这种“教学式回答”特别适合逻辑性强的科学教育领域,比如编程、数学解题、物理与化学等,能帮助学生真正理解背后的原理。
在科学研究领域,大模型推理能力的提升已经发挥巨大作用。人工智能不仅是“计算工具”,还可以担任科研“助手”,能够生成假设、优化实验参数、穷举复杂变量,甚至帮助研究人员分析结果。这意味着,未来的科学家不再是单枪匹马,而是会与人工智能科研助手形成搭档,不断突破科学发现的边界。2024年的诺贝尔物理学奖授予两位与人工智能研究密切相关的科学家约翰·霍普菲尔德和杰弗里·辛顿,以表彰他们在使用人工神经网络进行机器学习的基础性发现和发明;而诺贝尔化学奖则因为人工智能在蛋白质结构预测和分子设计方面的应用,颁给了大卫·贝克以及DeepMind的创始人戴密斯·哈萨比斯和科学家约翰·詹伯。
另一个方向是要加快行业大模型建设,让大模型既通用泛化又专业精深,在千行百业的应用中发挥更大作用。当前,人工智能落地普遍面临“不可能三角”问题,在专业性、泛化性和经济性上难以兼得。通用大模型可以在100个场景中解决70%~80%的问题,但未必能100%满足所有场景的需求。业界解决这一问题的方法,是在通用大模型基础上打造行业大模型,提升人工智能落地应用的可靠性,以打通“人工智能+”行动落地的“最后一公里”。
行业大模型大多是在通用大模型基础上,基于特定数据、针对特定任务进行微调后训练或蒸馏优化,使其深化为面向特定行业的、具备专用知识与能力的应用大模型。相比通用大模型,行业大模型有三个优点能更好满足行业需求:一是高性价比,行业大模型通常在比基座模型参数小一个量级的规模上实现,在显著节约微调和推理成本的同时提高效率;二是可定制,行业大模型可基于行业数据微调,能更好地满足个性化应用需求;三是专业性强,行业大模型可更好地利用行业知识、企业的自有数据,提高应用的针对性。
在“人工智能+”行动等国家战略的部署下,在国家网信办等七部门联合公布的《生成式人工智能服务管理暂行办法》等法规的规范下,行业大模型发展方向逐渐清晰,各领域人工智能应用渐次展开。截至2024年12月31日,共302款生成式人工智能服务在国家网信办完成备案,其中,行业大模型占七成,涵盖众多行业场景。SAS(赛仕软件)公司联合科尔曼·帕克斯研究公司对来自全球16个国家和地区的1600名行业决策者进行的一项调查中,中国83%的企业受访者表示已使用了生成式人工智能技术,远高于参与调查的其他国家和地区,紧随其后的是英国和美国(比例为70%和65%)。
腾讯在迈出打造大模型第一步的时候,就坚持做“离产业最近的人工智能”,努力把人工智能融入产业应用场景中,实践国家“人工智能+”行动。腾讯混元大模型已经落地800多个业务场景,腾讯人工智能也在千行百业落地生根。腾讯云正在积极探索,引入高精专的行业数据,加强模型对行业理解的深度,并结合搜索增强与实时查询能力提升模型解决产业实际问题的准确度、安全性和实时性等能力。目前已经在金融、医疗、教育、汽车、能源等20多个行业落地,联合生态伙伴打造超50个大模型解决方案,从生产、运维、管理、营销等各环节开展应用创新。基于腾讯混元大模型推出的智能陪练、智能问答、智能出题等功能,大幅提升了不同行业领域企业员工的知识学习和生产效率。畅想未来,每个组织都可以拥有一个能力强大的人工智能团队,人和机器协同工作,大幅提升行业效率和质量,拓展生产力的边界。
经济发展指标方面,以前讲用电量,后来讲用云量,以后可能要开始讲用Token(词元)量。AI大模型实际上是通过Token输出“智力”,因此,用Token量就是含AI量。这里的“智力”是否等同于人类智能还存有争议,但不可否认的是人工智能已经成为人类进行智力创作的助手与伙伴。大模型将写作、画画、谱曲、编程、翻译等智能变成一种随时随地可调用的服务,看似是Model as a Service(模型即服务),但其本质其实是Intelligence as a Service(智力即服务),通过云与端提供类人甚至超人的智力,才是这一轮科技革命与产业变革的趋势和本质。
可以预见,随着国产芯片、自主框架、万卡集群、算力互联等技术的日益成熟,加之大模型深度推理能力大幅提升、推理成本持续降低、行业大模型深入应用等,2025年,我们将迎来大模型应用增长年,大模型的安全性、可靠性将进一步提升。
智能向善,需要普惠的成果共享
普惠,是衡量智能向善的标尺。国家主席习近平向2024年世界互联网大会乌镇峰会开幕视频致贺强调,要“把创新作为第一动力、把安全作为底线要求、把普惠作为价值追求”。在继续升级技术、全面赋能经济、提升效率与效益的同时,大模型的算法逻辑中应当加入更符合人的情感与情绪因素的参数,并时刻维护“人”在人机协作中的核心主体地位,以满足人的需求、助力人的成长作为唯一标尺,让大模型更具人情味,并且更充分地展现出普惠性。
在生活场景中,“助我”“陪我”“懂我”的智能助手将日益成为重要需求。一方面,技术迭代过快,给普通大众带来一些应用障碍。平台企业需承担起降低技术门槛的责任,让人工智能技术能够真正服务于广大群众,加快技术普惠。目前,腾讯已经率先行动,微信、腾讯会议、文档、元宝等众多C端产品均接入混元和DeepSeek大模型,帮助用户及时获取人工智能服务。另一方面,我们正面临人口老龄化加剧、各类社会心理问题不断显现等社会议题。因此,大模型的开发与应用须超越单一的商业考量,深入理解全用户的情感和习惯,做好情感陪伴和生活服务。特别关注老年人、残障人士、留守儿童、心理亚健康人群等多元群体,确保他们能够同样享受人工智能发展带来的便利与福祉。为此,腾讯研究院近期发起“向善语料库”行动,联合50多家养老院、社工组织、高校等机构,面向老年人和青少年群体,搜集大家生活中遇到的问题,并邀请专家给出有用且富有人情味的回答,再把这样的问答作为语料交给大模型来训练,让人工智能贴近千万普通人的情感、心理感受和内心需求,让技术成果惠及更多群体。
在工作场景中,从长期看,人工智能可以在更高水平和更大程度上赋能各行各业劳动者,从而推动经济社会发展,并在这一过程中催生新的职业与就业机会,创造更大的就业空间;同时,人工智能还将提高就业质量,提升人们的劳动自由度和工作舒适度,进而实现技术发展与充分就业的高水平协调平衡。但短期看,人工智能带来更高工作效率的同时,也不可避免会在局部产生就业替代效应。因此,在推动人工智能技术创新的同时,要格外关注就业和社会稳定问题。应当加快促成政府、行业协会、企业多方合力的社会协同机制,提升我国在人工智能时代的全民数字素养,投入更多资源支持各类企业开展新技术、新技能培训,提高劳动者技术应用水平,让技术进步真正惠及人们的工作质量和满意度的提升。
回顾人类历史,技术的每一次变革都会带来社会认知的升级、产业经济的升维发展,科技进步带来的变革阵痛总会引发各种犹豫与怀疑,创新之路总是荆棘密布。所幸,人类从来没有因此而畏惧,也从未停止前进的脚步。
今天,人工智能的创新发展注定不会一帆风顺。我们要认识到,不发展才是最大的风险。在投入更多资源改进技术、优化机制、加强价值对齐的同时,我们更需要保持自信与乐观,凭借人类的智慧、勇气和协作,继续秉持科技向善的价值观,坚持以人为本,在可信、可靠、普惠的路标指引下,使人工智能技术在符合科技伦理、公众利益的前提下全面赋能科学研究,让人工智能的福祉惠及每一个人,共同创造更加光明与美好的未来。
来源:《中国网信》2025年第3期