篆体转换器(人工智能如何辅助古文字研究)
篆体转换器(人工智能如何辅助古文字研究)
2024-11-22 04:32:14  作者:乐逍遥  网址:https://m.xinb2b.cn/life/xdl131177.html

作者:李春桃(吉林大学考古学院古籍研究所教授,“人工智能识别古文字形体软件系统研发与建设”项目负责人)

人工智能已经参与到人们的生活、工作、学习等诸多方面,科研工作同样如此。古文字专业虽然属于传统学科,却与人工智能技术十分契合。相较于人文学科中的许多专业,古文字考释更为客观,其研究结论具有唯一性,研究过程也遵循一定的规律,在人文学科中最接近自然科学,这符合人工智能技术的工作原理。

那么,人工智能的哪些技术能够辅助古文字研究?之前需要人力完成什么工作?学界目前又做到了什么程度?本文便拟谈谈这些内容。


古文字形体系联图谱

就古文字考释而言,人工智能可以提供的帮助是多方面的。著名古文字学家唐兰先生曾将古文字的考释方法总结为形体对照法、推勘法、偏旁分析法与历史考证法。人工智能中的图像识别、自然语言处理、知识图谱等技术正可与这几种方法相互对应。

形体对照法是把不同材料中的古文字形体加以比较、对照,利用已识字来考证未释形体。这种方法需要研究者能够熟记大量古文字形体,如此才能把不同材料联系起来。而人工智能识别利用的是深度学习与计算机视觉技术和算法,只要提供足够多的古文字形体来训练模型,就能实现识别功能。记忆方面,数以百万计的文字形体总量,人脑只能记住其中很小的一部分,而智能模型却可以全面覆盖,能力更为强大,识别推荐结果会给专家以有效提示。

推勘法是将出土材料与文献中的记载进行对勘,寻绎文义,进而破解未释形体。随着深度学习技术的使用,尤其是2018年谷歌公司开发的BERT预训练模型在自然语言处理领域的大规模使用,近年来,自然语言信息处理技术发展迅速,在命名实体识别、语义关系等方面有重大提升。经过足够的数据训练,模型能够具有普通人甚至专家一般的能力。举一个通俗易懂的例子,假设“过节了我们煮△▽吃”一句中的“△▽”二形是未释字或残损字。如果要考证这两个形体,经过训练的深度学习模型可以给出备选答案,如“饺子”“汤圆”“粽子”等相符合的词语。因为有“过节”限定,所以“白粥”等普通熬煮食物不会被推荐;因为有“煮”字限定,“月饼”等非熬煮食品不会被推荐。深度学习模型完全能够捕捉语句里面关键字词的文意。对于例子中的这句话,普通人也能给出正确的判断方向。但是如果面对的是古文字材料,情况就不同了,因为多数人对古代汉语并不熟悉,即使专业学者也无法熟记大量的古代语料。所以,我们可以利用出土文献的释文数据和传世古书的记载来训练语言模型,从而在研究过程中利用模型圈定待释字的目标范围,有时甚至能够锁定正确答案,这能给予专家极大的帮助。

偏旁分析法是通过分析、识别偏旁来考释古文字。历史考证法是根据不同时期形体的特征及演变规律来考释古文字。人工智能知识图谱技术与这两种方法相关。知识图谱是描绘实体之间关系的智能网络,能够整合部件、字形、词义几个层次的古文字知识。可以根据文字偏旁系联图谱,从而展示出那些具有相同偏旁的文字及对应形体;知识图谱也具有挖掘文字演变规律的潜力,进而为专家提供帮助。可见,在古文字研究过程中,人工智能技术可以从多个维度为专家提供辅助。

当然,随着战国竹简的公布,古文字的考释方法也发生了变化,通过破解通假关系找到文字所代表的“词”显得尤为重要。这就需要专家做好通假现象标注,经过反复训练使模型具有通假语感。但是面对以往从未出现过的通假用例,模型是无能为力的,所以还需要音韵学家介入,从通假规律等角度进行研究,让模型同时掌握通假条件所需要的“实例”和“规律”。

笔者认为,人工智能与古文字结合可分成三个阶段:第一阶段是人工塑造模型。古文字专家需要整理基础数据,包括资料释文、图版切字、字形拆分、属性标注等等;计算机专家利用这些数据完成功能实现。这一阶段费时费力,最为艰苦。第二阶段是人工智能利用已经实现的技术为专家提供辅助。这有可能是省时省力的资料对勘,有可能是思考方向的积极引导,也有可能是研究结果的智能推荐。此阶段专家也会针对智能技术的不足进行完善。第三个阶段就是人工智能的独立判断,它可以综合以上所有方面给出问题的答案。目前在这一领域的研究,学界似乎尚处在第一阶段。

以上重点谈了人工智能与古文字考释的关系。事实上,人工智能在其他方面也能给研究者提供帮助,如甲骨缀合、甲骨文分组分类、青铜器断代、竹简编联等等。可以预见,将来人工智能技术会在更多方面为古文字研究提供帮助。人们常说,古文字学是一门古老而又年轻的学问。由于人工智能技术的介入,古文字学的“年轻”也体现在研究的方法上,可以与最新的科技相互结合。相信新的研究资料与新的研究方法能让古文字学一直年轻且充满活力。

《光明日报》( 2022年10月30日05版)

来源: 光明网-《光明日报》

  • 韭菜花能炒牛肉吗(韭菜花可以和牛肉一起炒吗)
  • 2024-11-22韭菜花可以和牛肉一起炒吗韭菜花不能和牛肉一起吃韭菜花是属于温性的食材,具有很好的温补性能,特别是对于男性有很好的壮阳效果,而牛肉同样是属于温性的食材,如果把韭菜花和牛肉一起吃的话,会容易形成上火的情况,而且会导致牙龈肿痛,所。
  • 科三靠边三十公分如何找准(科二科三靠边30cm判断方法)
  • 2024-11-22科二科三靠边30cm判断方法驾考新规中更加细化了停车时车身与路边线距离的考核标准:“大于30厘米而小于50厘米扣10分,距离大于50厘米直接不合格”,所以想要又快又安全的找准30厘米以内,还是有一定难度的,再加上考试时容易发生突。
  • 周九良叫小番惊呆郭德纲(周九良澄清与23岁女星绯闻)
  • 2024-11-22周九良澄清与23岁女星绯闻12月21日,相声演员周九良在直播间内回应了自己和23岁女星赵小棠的绯闻,周九良调侃称有绯闻太高兴了,之后他解释了事件原委并连连摆手明确表示"我们都没见过面"当晚郭德纲、于谦、孟鹤堂也。
  • 金庸武侠中的最惨主角是谁(非他莫属)
  • 2024-11-22非他莫属《连城诀》狄云狄云出生是个孤儿,由师父养大但他师父并不是真心对他,师父本身就不是一个好人,为了武功秘籍,可以杀害师父然后,被诬陷,关进了大牢被削断了五指,刺穿了琵琶骨心爱的师妹,嫁给了陷害他的人出了大。
  • 魔兽世界皮甲幻化套装任务(魔兽世界皮甲幻化套装任务讲解)
  • 2024-11-22魔兽世界皮甲幻化套装任务讲解我,鹿角,不对,凉酒今天带大家拿一个鹿角幻化,效果如下:使用此模型的有三件装备,分别是碧环头饰、青环头饰、塞纳里奥头盔,解锁幻化之后全皮甲职业都可以幻化其中碧环头饰和青环头饰都是德鲁伊50级职业任务奖。
  • 易县客运何时恢复(易县汽车站再传通车好消息)
  • 2024-11-22易县汽车站再传通车好消息来源:易县汽车站保运集团八公司将分级分批、逐步有序恢复客运站及客运班线运营3月19日起,先期恢复线路:易县至保定(981路高速)易县站发车时间:6:30、17:30保定站发车时间:6:30、17:30。
  • 10万内的奥迪可以买吗(10个w左右就能买奥迪当代步车)
  • 2024-11-2210个w左右就能买奥迪当代步车值得注意以下几点:1、家用,代步,旅行2、配置好3、品牌好4、舒适度高5、油耗低6、外观精致,时尚综合以上选购精品二手车的要求,结合品牌的定位,今天给朋友们推荐一款满足以上要求的车型:2020款奥迪A。
  • 三里屯太古里实惠美食(三里屯太古里美食地图)
  • 2024-11-22三里屯太古里美食地图刷爆朋友圈的烧饼油条、连鹿晗都要吃的薯条和汉堡、日本开来的全球首创蘸面、用意面做甜品的pasta专营店、巧克力重度患者的天堂、凌晨两点也能买到的网红面包、《好先生》里的爆款惠灵顿牛排、风靡京城会跳舞的。
  • 杜若在古诗中的寓意
  • 2024-11-22杜若在古诗中的寓意古代用杜若表达表达美好、高洁的品质在屈原的诗句中就有记载“搴汀洲兮杜若,将以遗褋兮远者;时不可兮骤得,聊逍遥兮容与!”由此可见,在古人写的诗句中就会用杜若这个意象表达一种美好品质。
  • 牛年接虎年的吉祥语八个字(牛虎年转换说说牛)
  • 2024-11-22牛虎年转换说说牛牛年快过去了,即将迎来虎年比起真正的虎,牛属于大家最为常见的传统家畜,即将过去的牛年也是十分不寻常的一年,新冠疫情尚未彻底消失,经济估计短期内也无法恢复到疫情前的活跃状况,一年来看似平静的社会实际上有。