北京外国语大学人工智能与人类语言重点实验室

探索人工智能 解码语言奥秘

2025-01-16 来源:中国社会科学网-中国社会科学报

微信公众号

分享
链接已复制

  为推动智能技术在外语学科不同领域的应用,加速外语教学的数字化转型和智能化提升,探索新文科建设的创新之路,2019年北京外国语大学成立人工智能与人类语言重点实验室(以下简称“实验室”)。

  6年来,该实验室充分发挥外语教育和语言资源的优势,相继产出了“‘理解当代中国’系列教材编写与研究”“人工智能与人类语言重点实验室建设”“多语言文本语义标注语料库建设”等一系列成果,为人工智能赋能外语教学研究及应用提供了一定借鉴。1月9日,记者来到实验室,深入了解该实验室语言智能系列研究最新成果。
  语言数据库建设是语言智能的基础,尤其对于低资源语言来说,通过专门的语料库建设,可以显著提高机器的智能效果。实验室的多语种语料库研究中心在语种规模、语料容量、开放程度等方面均达到国际一流水平,尤其有些语料库是世界范围内的第一个特定语种语料库,如迪维希语语料库,而有些语料库是对象国以外唯一的大型语料库,如芬兰语语料库。实验室主任李佐文表示,机器翻译是语言智能的重要领域之一,目标是实现世界所有语言之间的智能转换。在几十年的探索过程中,机器翻译领域的大多数研究聚焦于高资源语言的处理,而忽略了数千种且拥有数十亿使用者的低资源语言的机器翻译。因此,实验室将低资源语言机器翻译作为重要研究领域。实验室研发的“LingTrans101机器翻译系统”,是以低资源语言为特色的学术性、公益性机器翻译平台。该系统目前实现了大洋洲的比斯拉马语、斐济语、毛利语、纽埃语等29种低资源语言翻译。其中,涵盖了比斯拉马语、皮金语、毛利语、斐济语、纽埃语、汤加语等15种稀缺语言的自动翻译,填补了机器翻译中低资源语言的空白,有力促进了我国语言智能领域的发展。实验室“LingTrans101机器翻译系统”负责人之一刘沛鑫表示,该系统自主构建了一批高精度的低资源语言语料库,为低资源语言的机器翻译研究提供了基础,还通过优化模型参数并融入多语言词典和语言学知识,提升了翻译的准确性和可靠性,这对于语料库的深度开发和应用具有重要意义。
  虚拟现实、增强现实技术的发展打破了传统外语教学的空间局限,为语言学习者提供虚实融合的沉浸体验。“在虚拟现实技术支持下,学习者所处的感知环境变得更加丰富。” 实验室“跨文化交际视域下走进韩国”虚拟仿真外语教学系统研发负责人之一陈秀秀表示,这不仅可以让学习者打破教室的围墙,实现跨时空的穿梭,从教室内走向世界各地,体验丰富多样的语言文化,还为学习者提供虚拟交互角色,增强外语学习过程的互动性和情境性。
  “数字人+AI技术”为外语教学带来了新的可能性和机遇。实验室新发布的“ LingTutor”系统是数字人赋能外语教学的典型代表之一。该系统现阶段可分为2D数字人教师虚拟课堂系统和3D数字虚拟教师系统。其中,3D数字人虚拟教师系统可以快速逼真地建模任何世界场景,并通过数字手段根据教师授课内容切换授课场景,极大提高教学的沉浸感。“不同于以往的数字人系统,我们的教师数字人能够实现实时打断交互,给每位学生提供专属虚拟教师,实现个性化教育。此外,我们可以提供一种‘泛在教育’的模式,即根据学生喜好,可以任选时间、任选地点进行虚拟人实时授课。”该系统研发负责人之一任佳伟说。
  实验室关于语言智能在外语教学中的研究与应用是我国人工智能背景下外语教学的一个缩影。近年来,我国外语教学领域积极推进信息技术与外语教学的深度融合,并在外语教学领域的数字化基础环境、智慧教室、智能化教学平台的搭建等方面取得了显著的成绩。但是,目前人工智能融入外语教学应用仍处探索阶段。
  外语教学从数字化到智能化,是当前人工智能时代的必然发展趋势。实验室理事会理事长王定华表示,未来,外语教学工作者不仅要做知识的传授者,还要做满足学生个性化需求的教学服务提供者、设计实施定制化学习方案的成长咨询顾问,要成为学生学习的陪伴者、动力的激发者、情感的呵护者、“灵魂的工程师”。与此同时,要积极推动、参与、共享人工智能和外语教育的深度融合,才能顺应时代的变化,培养出更多有家国情怀、有全球视野、有专业本领的外语复合型人才,进而提升国家外语能力、增强国家软实力,推动中国更好走向世界、世界更好了解中国。
  在研究方法方面,未来人工智能赋能外语教学研究需注重研究方法的多元性。实验室理事会副理事长唐锦兰提出,未来人工智能赋能外语教学研究,既要注重思辨研究,也要积极开展实证研究,充分揭示传统外语学科与新兴技术深度融合下的外语教学理念与实践。人工智能赋能外语教学研究仅从思辨层面进行理论探讨还不够,需要开展大量实证研究,涵纳量化研究、质性研究和混合研究。
  随着技术的进步和数据采集手段的多样化,多模态语料库的构建将成为人工智能赋能外语教学研究中的一个重要趋势。刘沛鑫提出,多模态语料库能够整合文本、音频、视频等多种数据形式,更全面地捕捉和表达语言使用的情境,这对于提升机器翻译的自然度和准确性至关重要。此外,多模态语料库的建设也将促进跨学科研究,如语言学、计算机科学、认知科学等领域的融合,为小语种的保护、教学和文化交流提供更丰富的资源和工具。李佐文表示,未来实验室将进一步探索人机融合背景下的外语教育规律和人才培养机制,构建训练外语教育专用大模型,致力于具身外语学习智能体探索与研发,为我国外语教育的数字化转型与智能化提升不懈努力。
转载请注明来源:中国社会科学网【编辑:杜琨(报纸) 张赛(网络)】