近年来,以深度学习为代表的人工智能加速与科学融合,形成人工智能驱动的科学研究(AI for Sciences,AI4S)现象,即利用现代人工智能方法(如深度学习等),来解决当代科学研究所面临的“数据灾难”和“高维灾难”问题,提升整体科研效率。当前的科学已进入复杂系统时代,所涉数据规模愈发庞大,且在解决现实问题的过程中,已有科学方程求解所涉变量过多、计算复杂度过高,从而出现“维度灾难”现象。而AI4S所具有的维度拟合能力、数据模式抽取能力、深度搜索能力等,对于缓解以上难题,以及推动前沿科技创新具有重大意义。学界甚至将AI4S视为继实验范式、理论范式、仿真范式、数据密集型科学发现范式之后的“第五范式”。但是,在充分认识人工智能重大潜能的同时,也要冷静分析其所面临的问题与挑战,辩证看待AI4S的未来发展,避免非理性的吹捧与狂欢。
一、AI4S知识生产的合法性面临挑战
目前的AI4S还无法形成独立且自洽的“创新闭环”,它是作为传统科学体系的“嵌入性”子系统而存在的,需纳入到已有科学规范之中来证明自身的合法性与合理性。在长期发展过程中,科学共同体已构建起一整套评估知识合法性的规范与标准,如可验证性、可重复性、逻辑自洽性等,只有符合这些规范和准则,特定的知识才可被科学共同体所接受,并打上“合法”或“合理”标签。然而,当前AI4S系统所输出的所谓“知识”,与传统的科学评估规范之间存在一定的结构性冲突。首先,从输出信息的性质看,以深度学习或强化学习为关键特征的AI4S系统,其输出是一种(函数)关系性知识,而不是传统的因果性知识,其合理性与否,仍需再次回归、接受传统科学规范的评估与验证;其次,从知识评估过程看,AI4S解题及运行过程具有“黑箱”特征,无法在输入与输出之间搭建明晰的逻辑链条,且其输出结果往往是不可重复性的,难以进行可逆化验证,这对已有科学方法论体系提出了新挑战;此外,从知识可靠性层面看,AI4S本身可以捏造所谓的“科学事实”,形成“AI幻境”现象。整体看,AI4S还没有形成独立的、符合自身特色且被广泛认可的知识评估规范和标准,必须融入到已有科学规范体系之中来获得自身的合法性。
二、认识层面存在重工具化轻科学创新能力问题
AI for Sciences主要包含AI和Science两个关键性要素,一个典型观点是:只要AI研究水平高,便可构建高质量的AI4S系统。而实际上,在AI for Sciences系统中,AI往往是辅助性工具,而Science则是更加关键的方向性引领因素。第一,AI4S需要有明确的科学问题意识,它决定着AI4S功能发挥的方向和价值,而有前瞻性的,尤其是具有跨学科性质的科学问题的提出,则是由科学家来主导,目前AI自身不会主动提出高质量科学问题;第二,虽然AI4S的解题过程是黑箱化的,但AI4S系统中最为关键的神经网络的构建,则蕴含着科学家的解题思路,它决定着数据[输入]与[输出]以何种方式进行映射;第三,高质量AI4S系统,需要专业的科学数据库为支撑,其规模与质量对于模型训练结果的精确性与准确性至关重要,但科学数据库建设不可能一蹴而就,需要科学家通过实验方法进行长期的数据积累。整体看,AI4S是人工智能研究能力与科学研究能力的综合,不应奢望在科学创新能力不足的情况下快速构建起高质量的AI4S系统,要想成为AI4S强国,必须拥有雄厚且领先的科学研究能力。
三、实践层面存在“为AI而AI”现象
积极推进人工智能与科学研究各领域的汇聚,逐渐成为一种政策性共识。但在发展AI4S过程中,却出现了一些“为AI而AI”现象,即在研究问题不明确、算法创新能力不足的情况下,盲目建立大数据机构、算力中心,大量购买、堆积算力芯片等硬件设备,导致出现“有设备,无研究”、“有数据,无算法”现象。甚至还出现一些“伪AI4S研究”,即在无算法创新的情况下,仅利用AI复现已知研究成果,而不是解决新的问题。有意义的AI4S研究,应该是在明确的前沿科学问题或国家重大战略需求问题的引导下展开的。因此,研究机构在发展自己的AI4S系统时,首先要明确自己的研究目标,并对AI4S发展过程中所可能出现的问题(如跨场景适应性差等)有清醒的认识和准备,树立长期思维而非基于短期的功利主义。
结语
我国高度重视AI4S的发展,2022年7月,科技部、教育部、工业和信息化部等六部门印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,提出要推动人工智能技术成为解决化学、材料、生物和空间科学等领域重大科学问题的新范式。面对新的机遇和挑战,应全面、理性看待AI4S,树立长期思维、进行持续支持,既看到其所蕴含的巨大潜能,同时又对其局限性有清醒认识。对于未来AI4S的发展,首先,应坚持问题导向和需求导向,以世界科技前沿、国家重大需求等来引导其赋能方向;其次,坚持系统观念,使AI4S的科学精神、效率提升能力赋能到国家创新体系的更多环节,尤其是应用性特征突出技术领域,提升国家创新体系整体效能。
(王彦雨,中国科学院自然科学史研究所副研究员;高芳,科技部中国科学技术信息研究所研究员)