南京大学数智文献处理平台暨近代红色资源库发布

2026-01-07 来源:中国社会科学网-中国社会科学报

微信公众号

分享
链接已复制

  中国社会科学报南京讯 (记者王广禄)1月5日,由南京大学历史学院数智史学实验室主办的南京大学数智文献处理平台暨近代红色资源库发布会在南京举行。

  面对多形态多模态的史料,史学研究者大多面临文献识读与转录、跨语言、信息搜集与检索这三个突出的文献使用问题。实验室负责人、南京大学历史学院助理教授金伯文介绍说,南京大学数智文献处理平台是基于生成式大语言模型打造的资源库,通过ORC增强和智能优化,将非结构化内容数字化,进行语义校正与漏识补全,能够快速准确地进行多语种翻译,依靠强大的翻译能力和自然语言能力,支持跨语种检索和语义检索,实现了史学文献识别、编目、检索以及人机交互、写作的高度智能化。

  基于上述平台建设的“蒙元史多语种文献——穹庐文库”,在推动具有显著跨学科、多语言特征的蒙元史研究方面进行了实践。南京大学铸牢中华民族共同体意识研究基地首席专家华涛表示,人工智能技术运用于蒙元史研究,使学者在使用蒙古文、藏文、波斯文、阿拉伯文、突厥文等多语种史料时更为便利。

  谈及人工智能时代的史学研究,南京大学历史学院院长梁晨认为,人工智能可以高效处理规范性的基础性研究任务,从而解放人脑,使人们在学术研究中有更多精力思考更为复杂、更具有深刻价值的学术问题。在人工智能推动的历史研究中,如何与AI对话、如何使机器的工作体现正确价值导向,对学者自身专业能力与深度思考提出了更高要求。

  华中师范大学中国近代史研究所所长马敏表示,数字史学已不仅仅是一种手段、工具或者方法,而是正在成长为一门新兴的史学分支学科。要加强学术合作和资源共享,共同推动数字史学发展,让人工智能技术赋能古老的历史学科焕发学术青春。

  据悉,南京大学近代红色资源库收录的历史文献以中共党史、中华人民共和国史和20世纪中国革命史为主,另有部分民国时期相关史料。数据库收录的文献类型多元、语种多样,涵盖文件汇编、日记、年谱、文集、回忆录、报刊等种类以及中、英、日、俄等语言。

【编辑:崔园园(报纸)赛音(网络)】