首页 > 文学 > 资讯

语言文学学术全文本大语言模型发布

2024-07-08 来源:中国社会科学网

微信公众号

分享
链接已复制
  中国社会科学网讯(记者吴楠 通讯员张小玉)在近日举办的第六届中国高校外语慕课联盟大会上,南京理工大学经济管理学院信息管理系副教授沈思的团队与北京外国语大学研究员孙凤兰编审的团队,基于近三年来在语言智能化合作项目上的深入而广泛的探究,融入大语言模型前言的技术、方法和理念,针对外语教学与研究过程中和应用场景上的重点、难点,以学术研究和教学为目的,发布了语言文学学术全文本大语言模型。该大语言模型由基座模型和对话模型两部分构成。
  为了确保大语言模型能够精准地理解和生成语言文学领域的内容,研究团队从全球顶尖期刊和重要图书中收集数据。据介绍,所构建数据集囊括了来自SSCI、CSSCI、北大核心收录的期刊论文,以及大量高质量的语言文学图书。经过系统的筛选和处理,这些数据不仅涵盖了语言学、文学、翻译等多个子领域,还包含了大量的案例研究和实证分析,为模型提供了丰富的学习数据。
  南京师范大学计算机与电子信息学院/人工智能学院教授曲维光介绍,在大量开源语言模型中,选择一个合适的基座模型是至关重要的。该团队通过建立良好的评价体系,专门针对语言文学领域的特殊需求,从多个开源模型中选择Qwen模型作为基座模型。此外,在模型选取过程中,还特别注意了模型的可适应性和扩展性,确保它能够在后续的领域特定训练中达到最佳效果。为了处理复杂的模型训练任务,该团队采用最新的技术来优化训练过程,通过智能分配计算资源来提高训练效率和减少资源消耗。同时,通过改进内存管理和参数优化技术,有效减少了计算资源的消耗,加快了模型训练的速度,确保了在有限的资源下,完成大语言模型对大规模数据集的训练。
  基于基座模型,研究团队进一步开发了对话模型,旨在使技术更加贴近用户需求。南京大学外国语学院教授魏向清认为,这个对话模型能够处理包括文本翻译、术语解释、知识问答在内的多种语言文学领域任务,极大地方便了非技术背景用户的日常使用,使他们能够更容易地利用人工智能技术从事语言文学的研究和教学工作。这种对话模型的开发具有更为广阔的应用前景,不仅能高效满足语言文学领域多类型具体实践活动中的语言与知识服务需求, 而且有利于外国语言文学领域专业教学过程中学生自主探索能力的培养,同时对于外国语言文学领域学术研究效率和效益的显著提升有积极帮助。该语言文学学术全文本大语言模型将引领我国外语语言文学领域的教学科研及应用实践走向智能化发展的新阶段,未来对话模型的用户友好性将成为大语言模型真正落地并高效发挥作用的关键之一。
  华中农业大学外国语学院副教授耿云冬表示,语言文学学术全文本大语言模型在挖掘学科知识、促进教学创新和赋能学术研究等方面将发挥显著的数智助力作用。在挖掘学科知识方面,该模型能够从多角度、多层次对学科知识进行深度分析和挖掘,识别并提炼出隐藏在学术文本中的前沿知识模块。同时,该模型还能辅助学科内的知识联结,推动构建全面而系统的学科知识图谱。在促进教学创新方面,该模型将成为外语教师高效备课的助手和学生自主学习的伙伴。通过整合和分析海量数据,它不仅为教师提供最新的学科前沿动态和丰富的教学素材,还可以用于开发诸如智能知识问答、作文/论文批改、知识测验等智能化教学工具,帮助教师提高教学效率。在赋能学术研究方面,该模型能够帮助研究者快速完成文献综述、识别学术热点、发现研究空白,启发创新性研究,提供有力的参考。此外,该模型还具备强大的语言润色功能,能够帮助研究者更好地撰写和发表学术论文。因此,有理由相信,语言文学学术全文本大语言模型不仅将引领人工智能与语言文学的深度融合,还将推动外语教学和学术研究向智能化的重要转变,为我国语言文学领域的教学改革与学术研究带来新的机遇。。
  面向语言文学领域的大语言模型构建是人工智能新时代语言文学领域与人工智能技术深度融合的基础工程,是推动外语教学、研究工作从数字化向智能化转型的必要条件,是新文科背景下将新质生产力融入学科发展的应有之义。安徽大学外语学院教授朱玉彬提出,作为新文科发展重要表征的数字人文研究,迫切需要专门领域的大语言模型供研究者使用。在大数据基础之上形成的语言文学学术全文本大语言模型必将助力语言学、中外文学和翻译学领域的研究者提高研究效率,探索出更多富有创见的研究成果。同时,在语言教学实践方面,语言教师也可以在专门领域大语言模型基础上生成更多适合具体情境的教学材料,提升学生的学习效果。
  在已发布版本基础上,一方面,沈思和孙凤兰的团队将持续对现有模型进行迭代更新,提升模型性能,对模型目前仍然存在的幻觉问题、资源消耗问题进行深入探讨和解决。另一方面,研究团队将深入挖掘外语教学与科研过程中的现实问题与解决措施,通过结合RAG(检索增强)、AI Agent(人工智能助理)等技术,切实解决外语教学与科研过程中的重要问题,实现人工智能技术在外语教学与科研工作中的全面落地。
转载请注明来源:中国社会科学网【编辑:张雨楠】