篆体转换器(人工智能如何辅助古文字研究)
篆体转换器(人工智能如何辅助古文字研究)
2024-11-22 08:53:59  作者:乐逍遥  网址:https://m.xinb2b.cn/tech/xdl131177.html

作者:李春桃(吉林大学考古学院古籍研究所教授,“人工智能识别古文字形体软件系统研发与建设”项目负责人)

人工智能已经参与到人们的生活、工作、学习等诸多方面,科研工作同样如此。古文字专业虽然属于传统学科,却与人工智能技术十分契合。相较于人文学科中的许多专业,古文字考释更为客观,其研究结论具有唯一性,研究过程也遵循一定的规律,在人文学科中最接近自然科学,这符合人工智能技术的工作原理。

那么,人工智能的哪些技术能够辅助古文字研究?之前需要人力完成什么工作?学界目前又做到了什么程度?本文便拟谈谈这些内容。


古文字形体系联图谱

就古文字考释而言,人工智能可以提供的帮助是多方面的。著名古文字学家唐兰先生曾将古文字的考释方法总结为形体对照法、推勘法、偏旁分析法与历史考证法。人工智能中的图像识别、自然语言处理、知识图谱等技术正可与这几种方法相互对应。

形体对照法是把不同材料中的古文字形体加以比较、对照,利用已识字来考证未释形体。这种方法需要研究者能够熟记大量古文字形体,如此才能把不同材料联系起来。而人工智能识别利用的是深度学习与计算机视觉技术和算法,只要提供足够多的古文字形体来训练模型,就能实现识别功能。记忆方面,数以百万计的文字形体总量,人脑只能记住其中很小的一部分,而智能模型却可以全面覆盖,能力更为强大,识别推荐结果会给专家以有效提示。

推勘法是将出土材料与文献中的记载进行对勘,寻绎文义,进而破解未释形体。随着深度学习技术的使用,尤其是2018年谷歌公司开发的BERT预训练模型在自然语言处理领域的大规模使用,近年来,自然语言信息处理技术发展迅速,在命名实体识别、语义关系等方面有重大提升。经过足够的数据训练,模型能够具有普通人甚至专家一般的能力。举一个通俗易懂的例子,假设“过节了我们煮△▽吃”一句中的“△▽”二形是未释字或残损字。如果要考证这两个形体,经过训练的深度学习模型可以给出备选答案,如“饺子”“汤圆”“粽子”等相符合的词语。因为有“过节”限定,所以“白粥”等普通熬煮食物不会被推荐;因为有“煮”字限定,“月饼”等非熬煮食品不会被推荐。深度学习模型完全能够捕捉语句里面关键字词的文意。对于例子中的这句话,普通人也能给出正确的判断方向。但是如果面对的是古文字材料,情况就不同了,因为多数人对古代汉语并不熟悉,即使专业学者也无法熟记大量的古代语料。所以,我们可以利用出土文献的释文数据和传世古书的记载来训练语言模型,从而在研究过程中利用模型圈定待释字的目标范围,有时甚至能够锁定正确答案,这能给予专家极大的帮助。

偏旁分析法是通过分析、识别偏旁来考释古文字。历史考证法是根据不同时期形体的特征及演变规律来考释古文字。人工智能知识图谱技术与这两种方法相关。知识图谱是描绘实体之间关系的智能网络,能够整合部件、字形、词义几个层次的古文字知识。可以根据文字偏旁系联图谱,从而展示出那些具有相同偏旁的文字及对应形体;知识图谱也具有挖掘文字演变规律的潜力,进而为专家提供帮助。可见,在古文字研究过程中,人工智能技术可以从多个维度为专家提供辅助。

当然,随着战国竹简的公布,古文字的考释方法也发生了变化,通过破解通假关系找到文字所代表的“词”显得尤为重要。这就需要专家做好通假现象标注,经过反复训练使模型具有通假语感。但是面对以往从未出现过的通假用例,模型是无能为力的,所以还需要音韵学家介入,从通假规律等角度进行研究,让模型同时掌握通假条件所需要的“实例”和“规律”。

笔者认为,人工智能与古文字结合可分成三个阶段:第一阶段是人工塑造模型。古文字专家需要整理基础数据,包括资料释文、图版切字、字形拆分、属性标注等等;计算机专家利用这些数据完成功能实现。这一阶段费时费力,最为艰苦。第二阶段是人工智能利用已经实现的技术为专家提供辅助。这有可能是省时省力的资料对勘,有可能是思考方向的积极引导,也有可能是研究结果的智能推荐。此阶段专家也会针对智能技术的不足进行完善。第三个阶段就是人工智能的独立判断,它可以综合以上所有方面给出问题的答案。目前在这一领域的研究,学界似乎尚处在第一阶段。

以上重点谈了人工智能与古文字考释的关系。事实上,人工智能在其他方面也能给研究者提供帮助,如甲骨缀合、甲骨文分组分类、青铜器断代、竹简编联等等。可以预见,将来人工智能技术会在更多方面为古文字研究提供帮助。人们常说,古文字学是一门古老而又年轻的学问。由于人工智能技术的介入,古文字学的“年轻”也体现在研究的方法上,可以与最新的科技相互结合。相信新的研究资料与新的研究方法能让古文字学一直年轻且充满活力。

《光明日报》( 2022年10月30日05版)

来源: 光明网-《光明日报》

  • 耳机接触不良的小妙招(5个方法解决耳机接触不良的问题)
  • 2024-11-225个方法解决耳机接触不良的问题酒精擦拭法首先,准备好酒精后,那一条抹布稍微沾点酒精,然后轻轻的沿耳机插头擦拭一圈,稍等片刻后再插入耳机孔转一转,看看是否能解决吹风筒使用吹风筒对着耳机的插头吹,注意在吹的时候不要靠的太近,热度建议调。
  • 三餐要间隔多长才会发胖(易胖的人往往有这几种习惯)
  • 2024-11-22易胖的人往往有这几种习惯导语:女性天生爱美,而减肥是女性现在的主旋律平时没事的,就会关注各种减肥的方法,健康的减肥肯定是不能节食的但我们可以在吃饭之后,通过喝一些具有减肥效果的茶水,来达到减肥的目的如果再能配合适当运动的话,。
  • 乡村爱情几季加起来共多少集 播了11季的乡村爱情
  • 2024-11-22乡村爱情几季加起来共多少集 播了11季的乡村爱情事情呢就这么个事情,情况呢就这么个情况天下网商记者宁函夏13年,11部,549集这是最长寿的国产农村系列剧《乡村爱情》据不完全统计,这部系列剧曾创下超过12%的收视率,意味着至少每10户有电视的人家中。
  • 如何快速做出应收账款账龄分析(发现广东一28岁女会计)
  • 2024-11-22发现广东一28岁女会计这段时间,业务量蹭蹭蹭的长,搞的我们焦头烂额的,光处理业务还不行还得盯着应收款,一堆的应收款数据要整理,简直让人头大,这不,我们部门张姐,特意赶在休息的时间整理了一些应收账款账龄分析表格模板,今天可算。
  • cenai数据线好吗(CHOETECH迪奥科的这根CC数据线)
  • 2024-11-22CHOETECH迪奥科的这根CC数据线市面上的大功率USBPD充电器越来越多,不少功率超过60W的PD充电器都需要5A大电流的数据线,还有类似三星Note10、小米9Pro使用大电流PPS充电的手机也需要5ACC数据线目前常见的就是带有E。
  • 暗裔剑魔详细技能介绍(暗裔剑魔并不是无敌霸主)
  • 2024-11-22暗裔剑魔并不是无敌霸主以这个信息为切入点,不难分析出,克制剑魔主要从两方面找切入点,一个是和他一对一硬刚,只是很好的压制,另一种是对他进行远程消耗,不给他接触的机会,而且可以很好的清理兵线,牵制剑魔的同时还可以抽身去支援其。
  • 魅力四射成长的充电站(技能充电站不是人人都是)
  • 2024-11-22技能充电站不是人人都是极目新闻记者周治涛刘玉琴实习生张航梅子晗廖述一不知道如何挑选适合自己的衣服?最新一期极目新闻职教传播研究院“技能充电站”直播栏目,邀请到了形象设计师白富,在线教我们如何搭配服饰(可关注“职教传播研究院。
  • 发松糕怎么做好吃(如何做发松糕好吃)
  • 2024-11-22如何做发松糕好吃做法:把隔夜浸泡好的大米和黄小米淘洗干净、沥干,同时要把糯米提前打好,不用浸泡,当然米一定要隔夜浸泡过,放入打磨机里面去打成粉在把糯米粉倒入隔夜大米粉中搅拌均匀取出适量的白糖,同事也把糖碾压成粉,这样。
  • 梅花诗句最出名诗句(梅花诗句最出名诗句分别有什么呢)
  • 2024-11-22梅花诗句最出名诗句分别有什么呢寒雪梅中尽,春风柳上归——李白《宫中行乐词八首》衔霜当路发,映雪拟寒开——何逊《咏早梅/扬州法曹梅花盛开》玉骨那愁瘴雾,冰姿自有仙风——苏轼《西江月·梅花》长记曾携手处,千树压、西湖寒碧——姜夔《暗香。
  • 国产车自驾游开什么车最好 自驾游开什么车比较合适
  • 2024-11-22国产车自驾游开什么车最好 自驾游开什么车比较合适相信很多朋友都听说过这些词“世界那么大,我想去看看””一辈子总要去一次西藏“等等形容诗和远方的词语,而相比较乘坐公共交通工具,我相信绝大部分朋友都喜欢带上亲朋好友去自驾游,那么适合自驾游的车型有哪些呢。