该数据库由 “
文学、历史、文史哲、周易研究所联合购买”。
《瀚堂典藏》古籍数据库采用基于Unicode四字节编码和自然语言全文检索的典籍文献数字化构建技术,以小学工具、出土文献、传世文献以及专题文献类数据所构架的独特内容,为历史、中文、哲学等学科的研究提供一个一体化数字平台。
传统的计算机二字节编码技术只能处理2万多个汉字,对大量的生僻字、俗体字、异体字、通假字、避讳字和多语种文字无能为力,并没有从根本上解决中国历代典籍数字化、网络化的问题。采用7万汉字Unicode四字节编码技术的《瀚堂典藏》古籍数据库,从根本上彻底突破了古籍整理和研究中生冷僻汉字数字化的瓶颈,完善了汉字信息网络化的平台,开创性地实现了所有汉字及多语种文献的单一数字化平台管理,从而结束了历史文献和出土文献研究手工抄写、图片替代、生硬造字的历史,也标志着计算机汉字处理开始进入到了四字节字符的领域。
《瀚堂典藏》古籍数据库以精准校对的小学工具类、古代类书类数据、出土文献类数据为基础,陆续纳入包括经史子集,以及中医药典籍、古典戏曲、敦煌文献、儒、释、道等历代传世文献,涵盖文史哲等专业的教学和研究工作中所应用到的专业古籍文献数据。至2009年底止,《瀚堂典藏》精细加工入库的图书种类约有8000种,图片数量近1000万张,文字总量超过 13 亿字,可全文检索和连续图文对照阅读的记录条目 1000万条以上,并持续每周定期增加中,是精度最高品质最好的巨型古籍数据库。
访问地址:
http://www.hytung.cn/