篆体转换器(人工智能如何辅助古文字研究)
篆体转换器(人工智能如何辅助古文字研究)
2024-11-24 08:07:08  作者:乐逍遥  网址:https://m.xinb2b.cn/know/xdl131177.html

作者:李春桃(吉林大学考古学院古籍研究所教授,“人工智能识别古文字形体软件系统研发与建设”项目负责人)

人工智能已经参与到人们的生活、工作、学习等诸多方面,科研工作同样如此。古文字专业虽然属于传统学科,却与人工智能技术十分契合。相较于人文学科中的许多专业,古文字考释更为客观,其研究结论具有唯一性,研究过程也遵循一定的规律,在人文学科中最接近自然科学,这符合人工智能技术的工作原理。

那么,人工智能的哪些技术能够辅助古文字研究?之前需要人力完成什么工作?学界目前又做到了什么程度?本文便拟谈谈这些内容。


古文字形体系联图谱

就古文字考释而言,人工智能可以提供的帮助是多方面的。著名古文字学家唐兰先生曾将古文字的考释方法总结为形体对照法、推勘法、偏旁分析法与历史考证法。人工智能中的图像识别、自然语言处理、知识图谱等技术正可与这几种方法相互对应。

形体对照法是把不同材料中的古文字形体加以比较、对照,利用已识字来考证未释形体。这种方法需要研究者能够熟记大量古文字形体,如此才能把不同材料联系起来。而人工智能识别利用的是深度学习与计算机视觉技术和算法,只要提供足够多的古文字形体来训练模型,就能实现识别功能。记忆方面,数以百万计的文字形体总量,人脑只能记住其中很小的一部分,而智能模型却可以全面覆盖,能力更为强大,识别推荐结果会给专家以有效提示。

推勘法是将出土材料与文献中的记载进行对勘,寻绎文义,进而破解未释形体。随着深度学习技术的使用,尤其是2018年谷歌公司开发的BERT预训练模型在自然语言处理领域的大规模使用,近年来,自然语言信息处理技术发展迅速,在命名实体识别、语义关系等方面有重大提升。经过足够的数据训练,模型能够具有普通人甚至专家一般的能力。举一个通俗易懂的例子,假设“过节了我们煮△▽吃”一句中的“△▽”二形是未释字或残损字。如果要考证这两个形体,经过训练的深度学习模型可以给出备选答案,如“饺子”“汤圆”“粽子”等相符合的词语。因为有“过节”限定,所以“白粥”等普通熬煮食物不会被推荐;因为有“煮”字限定,“月饼”等非熬煮食品不会被推荐。深度学习模型完全能够捕捉语句里面关键字词的文意。对于例子中的这句话,普通人也能给出正确的判断方向。但是如果面对的是古文字材料,情况就不同了,因为多数人对古代汉语并不熟悉,即使专业学者也无法熟记大量的古代语料。所以,我们可以利用出土文献的释文数据和传世古书的记载来训练语言模型,从而在研究过程中利用模型圈定待释字的目标范围,有时甚至能够锁定正确答案,这能给予专家极大的帮助。

偏旁分析法是通过分析、识别偏旁来考释古文字。历史考证法是根据不同时期形体的特征及演变规律来考释古文字。人工智能知识图谱技术与这两种方法相关。知识图谱是描绘实体之间关系的智能网络,能够整合部件、字形、词义几个层次的古文字知识。可以根据文字偏旁系联图谱,从而展示出那些具有相同偏旁的文字及对应形体;知识图谱也具有挖掘文字演变规律的潜力,进而为专家提供帮助。可见,在古文字研究过程中,人工智能技术可以从多个维度为专家提供辅助。

当然,随着战国竹简的公布,古文字的考释方法也发生了变化,通过破解通假关系找到文字所代表的“词”显得尤为重要。这就需要专家做好通假现象标注,经过反复训练使模型具有通假语感。但是面对以往从未出现过的通假用例,模型是无能为力的,所以还需要音韵学家介入,从通假规律等角度进行研究,让模型同时掌握通假条件所需要的“实例”和“规律”。

笔者认为,人工智能与古文字结合可分成三个阶段:第一阶段是人工塑造模型。古文字专家需要整理基础数据,包括资料释文、图版切字、字形拆分、属性标注等等;计算机专家利用这些数据完成功能实现。这一阶段费时费力,最为艰苦。第二阶段是人工智能利用已经实现的技术为专家提供辅助。这有可能是省时省力的资料对勘,有可能是思考方向的积极引导,也有可能是研究结果的智能推荐。此阶段专家也会针对智能技术的不足进行完善。第三个阶段就是人工智能的独立判断,它可以综合以上所有方面给出问题的答案。目前在这一领域的研究,学界似乎尚处在第一阶段。

以上重点谈了人工智能与古文字考释的关系。事实上,人工智能在其他方面也能给研究者提供帮助,如甲骨缀合、甲骨文分组分类、青铜器断代、竹简编联等等。可以预见,将来人工智能技术会在更多方面为古文字研究提供帮助。人们常说,古文字学是一门古老而又年轻的学问。由于人工智能技术的介入,古文字学的“年轻”也体现在研究的方法上,可以与最新的科技相互结合。相信新的研究资料与新的研究方法能让古文字学一直年轻且充满活力。

《光明日报》( 2022年10月30日05版)

来源: 光明网-《光明日报》

  • 生出的孩子像爸爸还是妈妈(肚里宝宝出生后像爸爸还是妈妈)
  • 2024-11-25肚里宝宝出生后像爸爸还是妈妈文|秘籍君记得我怀孕的时候,最盼望的是去做四维彩超因为四维彩超能看到宝宝的样子拿到四维彩照照片后,我就对着瞅啊瞅,希望能从中看出来宝宝到底长什么样眼眶大大的,可别是爸爸那样的小眼睛,鼻梁有点塌,千万不。
  • 胶南以前属于哪里(曾经的胶南哪里去了)
  • 2024-11-25曾经的胶南哪里去了胶南县行政区划图胶南地形图胶南位于山东省东南部,是青岛西海岸新区的前身(与黄岛区合并为新黄岛区),东临胶州湾,北依胶州,西及西南接诸城、五莲和日照,南即东南濒临黄海秦时胶南属于琅琊郡,其后分属诸城与胶。
  • 吃完柿子能喝酸奶吃香蕉吗(香蕉柿子牛奶)
  • 2024-11-25香蕉柿子牛奶在生活中,大家总能听到很多“空腹禁忌”“空腹不宜吃水果”、“空腹不宜喝牛奶”……这些言论让很多人担忧而事实上,广泛流传的“空腹禁忌”名单中,还需要科学分辨接下来,中国保健协会食物营养与安全专业委员会会。
  • 美人如玉剑如虹作品(温和典雅沈行工作品)
  • 2024-11-25温和典雅沈行工作品沈行工1943年出生于浙江宁波1966年毕业于南京艺术学院美术系1981年南京艺术学院油画专业研究生毕业留校任教,曾任南京艺术学院副院长现为南京艺术学院教授、中国国家画院研究员、中国油画学会理事油画作。
  • 双11怎样网购便宜(双11网购大件商品流行)
  • 2024-11-25双11网购大件商品流行今年双十一,天猫迁址北京后与国美在线、京东两家电商形成北京电商三国格局,上演了最激烈的三国杀面对各路电商铺天盖地的价格传播,消费者的败家也不含糊至今双十一的购物狂欢已经举办了5年,服装百货以及3C小家。
  • 火之迷恋泰剧女主叫什么名字
  • 2024-11-25火之迷恋泰剧女主叫什么名字火之迷恋》的女主名为平采娜,看泰剧的网友应该都很熟悉,她主演的《初恋这件小事》当初可是火遍了亚洲,清纯美丽、为爱努力向上的小水,是多少人心目中的小仙女,如今小仙女长大了,开始挑战各种更复杂的角色,平采。
  • 吕颂贤经典电影大全(没想到这些居然都是唐人剧)
  • 2024-11-25没想到这些居然都是唐人剧hello,大家好!今天的你们都开心了吗?都在忙些什么呢?最近《无心法师3》播出,目前豆瓣评分7.2,宝宝我看了几集,觉得也还不错背后的制作公司唐人,又再次出现在我们视野让宝宝我不免怀念起曾经的唐人!。
  • 硅酸盐矿物有哪些(硅酸盐矿物包含什么)
  • 2024-11-25硅酸盐矿物包含什么比较重要的有长石(正长石、斜长石、副长石)、云母、橄榄石、石榴子石、红柱石、绿帘石、辉石、角闪石、硅灰石、滑石、高岭石、绿泥石、蛇纹石等其中长石即约占地壳总质量的58,为地壳中最主要的矿物硅酸盐类矿物。
  • 运动完喝水会胖吗(运动完喝水有影响吗)
  • 2024-11-25运动完喝水有影响吗刚运动完喝水是不会长胖的首先,水几乎不含热量和糖分,人体运动后喝水可以帮助人体缓解运动引起的口渴症状,不会导致人体内热量上升,不会引起发胖其次,人体新陈代谢离不开水的参与,运动后喝水能够为人体提供水分。
  • 增广贤文用心读书的句子(读增广贤文9知我者谓我心忧)
  • 2024-11-25读增广贤文9知我者谓我心忧差之毫厘,失之千里若登高必自卑,若涉远必自迩三思而行,再思可矣使口不如自走,求人不如求己小时是兄弟,长大各乡里妒财莫妒食,怨生莫怨死人见白头嗔,我见白头喜多少少年亡,不到白头死墙有缝,壁有耳好事不出门。