扫一扫识别古文字,关注 | 如何加强古文字研究的数字化?

随着信息时代的到来,人文科学研究不再局限于传统的单一模式,而是呈现出数字化的趋势。 以古文字领域数字化研究为例,随着对相关研究的日益重视和统一指导,计算机网络和人工智能技术有望进一步大力推进人文领域的科研和推广工作,为弘扬中国传统文化做出更大贡献。

原文:《加强古文字研究的数字化》

作者|复旦大学出土文献与古文书研究中心谢明文

图片|网络

由于古文字输入困难,以甲骨文、金文、竹书文字等为代表的出土文献数字化滞后于传世中文文献的数字化。 随着计算机技术、人工智能技术的进步和古文字研究的深入,学术界越来越重视甲骨文、金文等古文字的数字化,取得了一系列成果。 甲骨文、金文和其他古文字等都是具有重要文化价值和传承意义的“绚学”、冷门学科,近年来在国家一级大力提倡。 作为古文字研究者,笔者深受鼓舞,同时也感到任务艰巨。 新形势下,古文字研究深度数字化迫在眉睫。

古文字书籍出版的数字化

随着信息时代的到来和读者阅读习惯的改变,书籍出版不再局限于传统的纸质出版单一模式,而是呈现出数字化的趋势。 目前,数字化趋势在甲骨文、金文等古文字类学术著作的出版中还没有得到足够的重视,只有小部分古文字著作的出版借鉴这种形式。 如中西书局2021年出版的《清华大学藏战国竹简(拾壹)》,卷末附有二维码,读者扫码激活后即可获得访问权,查看该书的电子版进行检索。 这种数字化形式值得在学术著作,特别是古文字大型著录书籍的出版中推广。

另外,甲骨文、金文等大型著作等也可以在相应的图版旁边加上二维码,扫描代码使数据可视化。 例如,可以从多维度清晰展现一版甲骨、一件青铜器,动态立体化文物,深入融入读者。 您也可以在典型的古文档中添加不同的二维码,以链接相关视频、相关深度解说或相关扩展知识等。 总之,加强古文字出版数字化,古文字学科的发展将迎来更加辉煌的前景。

古文字数据库的建设

数据库与数字化密切相关。 目前,有关古文献的数据库不少。 如甲骨文数据库有“甲骨文全文影像数据库”、“殷契文渊”、“殷墟甲骨文数据库”等,金文数据库有“殷周金句及青铜器数据库”、“商周金句数据库”、“ 综合数据库有《汉达文库》等。 笔者认为,建设好的古文字数据库,应着眼于“全”“清”“准”“便”“新”“变”等特点。

“全部”是指资料全部。 任何专题数据库或综合数据库收到的资料必须齐全,研究者根据相关资料开展研究时才能得出比较全面合理的结论。

“清”是指图案清晰。 同一个甲骨文或同一个金文往往有不同的拓本或照片,散见于各种著录中。 甲骨文、金文的数据库要尽量找出其中最清晰的拓片和照片,研究者往往能由此解决许多解放问题。

“准”应当准确古文字字形采集、文字属性书写等,准确释文等。 利用古文字数据库的用户除了古文字研究者外,还有先秦史、汉语史等领域的学者。 他们大多并不一定熟悉古文书,也不一定有直接阅读原材料的能力,很可能是根据数据库的说明文直接进行研究。 因此,数据库的说明文必须力求准确,不同学科的人使用时错误较少。

“便”是指检索方便。 虽然一些古文字数据库非常有用,但是一旦搜索就会出现很多无效的信息,研究者无法在短时间内获得所需的信息。 很难全面普及这样的数据库。 因此,良好的数据库必须能让研究者在最短的时间内获得最想要的信息。

“新”意味着及时更新新资料,反映最新研究成果。 土地不爱宝,近年出土资料呈井喷式增长。 例如,在金文,每年都会发表几百份新的金文资料。 在古文书研究方面,每年也出现了一系列相关成果。 相关古文字数据库必须及时更新资料,反映最新的研究成果,才能满足研究者的需要。

“变”是指重视用户体验,建立相应的反馈机制,灵活调整数据库。 许多古文字数据库没有重视用户体验,也没有建立相应的反馈机制,无法及时纠正存在的问题。 好的古文字数据库一定要建立相应的反馈机制。 数据库开发人员不仅要向用户反馈数据库程序本身存在的问题,而且要鼓励及时反映资料和释文本身存在的问题。

我们认为,关于古文字的数据库最好依靠对古文字有影响力、能够维持数据的专业学术网站。 这些专业学术网站可以进一步搭建适应新形势的数字化平台,用户不需要申请账号,也不需要购买数据库,匿名登录即可搜索,同时可以进行互动交流只有这样,才能完全发挥古文字数据库的作用,使更多的人有机会学习和利用古文字资料,促进传统文化的传承。

文章为社科报《思想工坊》媒体原创产品,原载社科报第1805期第4版,未经许可转载,文章内容仅为代表,不代表本报立场。

拓展阅读

关注|促进计算机技术、甲骨文研究的发展

视域|经典数字化,不会改变学术研究的本质

扫一扫识别古文字

推荐阅读