首页 >> 中国史 >> 动态
古人的智慧,曾以文字的方式,被记录在甲骨、青铜器、竹简、线装书上。如今,这些智慧结晶凝结在比特(BIT)里,供世代镜鉴 让古籍不胫而走 ——中华书局古籍数字化侧记
2017年03月24日 10:32 来源:人民日报 作者:张稚丹 字号

内容摘要:从对古籍简单的数字化处理,到产品化设计,再到互联网化……回顾一路摸索的曲曲折折,中华书局数字出版中心副主任、古联(北京)数字常务副总经理洪涛既感慨万千,又对未来充满期待。众所周知,整理本古籍(将同一古籍的不同版本研究对照、整理出版)是书局最核心的资源,也是书局这个品牌安身立命之所在。沟通古籍和当代人的平台2015年,古联(北京)数字传媒科技有限公司成立,统合了中华书局的古籍数字化业务。古联公司还与其他古籍出版社洽谈业务,到2017年底,古籍库将收入古籍1000种、10亿字,古籍库会变得更为全面、权威,充分体现“古联”的内涵。洪涛介绍说,根据《中国古籍总目》,中国古籍著录约20万种,其中重要的古籍约四五千种,整理本无法满足用户的所有需求。

关键词:中华书局;数据库;数字化;局域网;出版;古籍整理;检索;互联网;发布;图书馆

作者简介:

  程毅中先生有些烦。

  这位中央文史馆馆员、中华书局前副总编,虽退休20多年,却仍然以整理古籍为业。最近他正校勘《大宋宣和遗事》(元代人根据多个笔记小说以说书形式连贯而成的话本,后成为《水浒传》的蓝本),需用笔记小说原文来对,但他用不惯手机上的数据库,打开慢不说,一不小心一碰就把页面弄丢了。

  现在好了,“中华经典古籍库”微信个人专业版上线了。用户可以在电脑端使用,古籍原书图像、页码都清晰在目。

  从对古籍简单的数字化处理,到产品化设计,再到互联网化……回顾一路摸索的曲曲折折,中华书局数字出版中心副主任、古联(北京)数字常务副总经理洪涛既感慨万千,又对未来充满期待。

  厚积终有薄发日

  洪涛是学历史的,因为喜欢计算机,2001年直接被招进中华书局信息中心。书局当时连电脑都没有,只好现买电脑,建局域网。2003年,中华书局成立了“古籍资源开发部”,建设“中华古籍语料库”。

  洪涛坦言,当时完全没有数字出版概念,只是对中华书局传统铅排古籍整理书籍进行数字化编辑加工。

  这一工作不仅为《史料笔记丛刊》《古典文学基本丛刊》、佛教道教典籍的出版提供了数字内容,也让书局借此建立了数字加工和流程管理的标准,造了3.1万个字符集以外的字,这些成果直到今天还在应用。

  2008年前后,已完成3亿字的数字化加工的中华书局并没开发产品,而是进入了对古籍知识库的研究。他们认为,以谷歌百度为代表的搜索引擎,有强大的资源索引、聚合功能,代表了从内容服务到知识服务的互联网方向。于是开始对《资治通鉴》《二十四史》进行分析系统建设,把书中相关知识信息标引、组织起来,形成以人物、时间、地点和事件为不同维度的知识网络,脱离了原书目录结构,相当于一个小世界。比如搜索张飞和关羽,系统会图形化给出两个人的关系图,包括他们共同参与的事件、接触的人物,甚至可以看到他俩在地域上的移动轨迹,文献变得可视、立体化了。

  事实证明,这个项目思维过于超前、工作量过于庞大,技术、知识和资金都严重不足。通常的用户群——普通读者、学生、教职、研究者,不知道该用这个知识库做什么;反倒是结构简单的数据库,在商业上容易成功。

  这段经历看似歧路,却为后续开发“中华经典古籍库”提供了重要思路。

 

分享到: 0 转载请注明来源:中国社会科学网 (责编:刘远舰)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们