点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
高 峰
想象一下,3000多年前刻在龟甲兽骨上的神秘字符,与秒速处理海量数据的人工智能相遇,会擦出怎样的火花?这并非科幻小说,而是正在现实中上演的“穿越故事”。
故事的起点,要追溯到2003年4月的一堂数据库课。那时,我自信满满地为本科生讲解数据导入知识。突然,一只手高高举起:“老师,甲骨文如何输入输出?”我盯着黑板,陷入深思。甲骨文和计算机技术能有什么关联?
甲骨文AI协同平台上,人工智能助力甲骨文研究。高 峰供图
当时,我们学校的计算机系有团队已经在研究“电子甲骨文”,并成功开发出“甲骨文输入法”。我迫不及待地加入了。团队成员大多来自计算机专业,大家一边艰难地啃读艰深的甲骨文学术书籍,一边思考如何用代码这把“神奇钥匙”复活那些沉睡千年的古老符号。
2008年,团队中的刘永革教授申请的“基于甲骨文语料库的计算机辅助考释技术研究”获批国家自然科学基金项目。我们意识到,计算机可以成为甲骨文研究的“超级助手”。
团队开始了漫长的甲骨文语料库探索。我们陆续攻克甲骨文输入输出、甲骨文电子字典、甲骨文语料标注等若干问题。团队也受到更多关注,2017年获批教育部科技创新团队,2018年获批教育部重点实验室立项建设。2019年10月,在中国社科院学部委员宋镇豪带领下,我们推出专业化甲骨文数据平台“殷契文渊”。经过5期的持续建设,这个平台就像一个装满甲骨文知识的“超级大脑”,不仅能帮研究者快速查找甲骨文的字、图、文,还能利用AI数字工具箱辅助专家整理甲骨文资料,更提供了多个人工智能算法应用必不可少的甲骨文数据集。2024年,甲骨文AI协同平台上线那天,全球的甲骨文爱好者都涌了进来,留言区满是惊叹:“原来甲骨文离我们这么近!”它的出现,让甲骨文研究大步迈入人工智能时代。
在甲骨文数据平台的不断完善中,我们搭建起全球甲骨数字守护技术体系。这个方案就像一张精密的大网,将甲骨采集、整理、检索、拼接等流程都纳入其中。在甲骨数字化采集现场,多光源摄影设备如同不知疲倦的眼睛,从不同角度捕捉甲骨的每一处细节;基于表面深度增强的图像合成技术,则像一位技艺高超的修复师,将原本模糊的契刻痕迹、卜兆裂痕高保真还原。面对一块表面斑驳的甲骨,合成后的图像竟清晰显现出专家肉眼都难以辨别的微小刻痕,这些细节为研究甲骨字书写顺序和甲骨钻凿甚至占卜过程提供了重要线索。
面向甲骨文的AI摹本生成技术、AI查重技术、AI字形检测技术、微痕成像技术等令人惊叹。以甲骨文摹本生成技术为例,过去手工临摹甲骨文不仅耗费大量时间和精力,还容易产生主观误差。如今,算法模拟人工临摹的过程,能够精确勾勒出每个甲骨文字的形态特征。看着机器快速生成的高精度数字摹本,我不禁感慨,这不仅解放了人力,更为甲骨文的保护和修复工作奠定了坚实的数据基础。
2024年,“数字甲骨共创中心”成立。今年则对我们更重要,一是开启欧洲甲骨数字回归之旅,二是举办“AI+甲骨文”邀请赛,全力以赴推出甲骨文大语言模型,联合社会各界一同打造“最懂甲骨文的AI”,构建“科技+文化”的中国方案。
当然,我们也面临诸多挑战。目前,人工智能对甲骨文的理解还不够“智能”,遇到甲骨残片、模糊甲骨字尤其是未释甲骨字时,依然会“卡壳”,专业研究文献的异构化、碎片化问题依然需要更强大的技术支持。未来,我们还将带着这份热爱,继续前行,让甲骨文在数字时代绽放更耀眼的光芒!
(作者单位:安阳师范学院甲骨文信息处理教育部重点实验室)