如何用网络标签检索(知识问答KBQA两种主流方法)
如何用网络标签检索(知识问答KBQA两种主流方法)
2024-11-08 04:26:11  作者:唄宝娶你  网址:https://m.xinb2b.cn/tech/xys489112.html


什么是知识问答

基于知识的问答是以知识库为认知源,在知识库的基础上回答自然语言问题。

知识库(KB)是一个结构化数据库,其中包含形式<主题,关系,对象>的事实集合,每个事实都可以随附所谓的属性。

例如,“Barack Obama got married to Michelle Obama on 3 October 1992 at Trinity United Church”,会被解析为以下的集合


一般常用的的知识库有DBpedia和WikiData。

简单问题vs复杂问题

KBQA的早期工作专注于简单的问题回答,其中只涉及一个事实。例如,“JK罗琳在哪里出生?”这是一个简单的问题,可以用《J.K.罗琳》这个事实来回答罗琳,出生地,英国>。

最近人们的注意力转向了回答复杂的问题。所谓的复杂的问题就是涉及到在KB上的多跳推理、约束关系、数值操作或上述的某种组合。

让我们来看一个复杂的KBQA问题:“Who is the first wife of the TV producer that was nominated for The Jeff Probst Show?

这个问题需要找到以下的组合:

约束关系:我们正在寻找The Jeff Probst Show提名的电视制片人,因此需要找到一个与The Jeff Probst Show提名链接的实体,并且是一个 TV producer。

多跳推理:一旦我们找到电视制作人,我们需要找到他的妻子(wife)。

数值运算:一旦我们找到电视制作人的妻子,我们就会寻找第一任(first )妻子,因此需要比较数字并生成一个排名。


KBQA方法

对于复杂的KBQA,有两种主流方法。这两种方法都是从识别问题中的主题开始,并将其链接到知识库中的实体(称为主题实体)。然后,他们在主题实体的知识库附近获得答案:

通过执行解析后逻辑结构,典型的基于语义解析的方法(基于SP的方法)。 会分析执行范式并通过在从KB中提取的特定于问题的图中进行推理,根据其与问题的相关性对提取图中的所有实体进行排名,这是典型的基于信息检索的方法(基于IR的方法)。

基于语义解析的方法

该方法通常将自然语言转化为中间的语义表示,然后将其转化为可以在 KG 中执行的描述性语言。具体有4种方法:1)语义解析(Semantic Parser)过程转化为query map 生成问题的各类方法;2)仅在领域数据集适用的Encoder-Decoder模型化解析方法;3)基于 Transition-Based 的状态迁移可学习的解析方法;4)利用 KV-MemoryNN 进行解释性更强的深度 KBQA 模型。

基于信息检索的方法

该方法首先会确定用户 Query 中的Entity Mention,然后链接到 KG 中的主题实体(Topic Entity),并将与 Topic Entity 相关的子图(Subgraph)提取出来作为候选答案集合,然后分别从 Query 和候选答案中抽取特征。最后利用排序模型对 Query 和候选答案进行建模并预测。

两种方法的优缺点

基于语义解析的方法由于逻辑形式而产生了更可解释的推理过程但是它们严重依赖于中间的语义表示的解析设计,这通常是性能改进的瓶颈。

基于信息检索的方法适合流行的端到端训练,但是推理模型的黑盒式使得中间推理的可解释性降低。

结论

在本文中,我们了解了什么是基于知识的问答(KBQA),以及解决复杂问题的两种主要方法。

如果你对KBQA比较感兴趣,可以从下面两个主要的数据集开始。

DBpedia , WikiData

作者:Fabio Chiusano

  • 帮帮团暂住证(帮帮团四季青苏杭市场老板娘叫苦)
  • 2024-11-08帮帮团四季青苏杭市场老板娘叫苦钱江晚报·小时新闻记者朱燕八月的尾巴,中国服装第一街上,车多人多,一番热闹的景象当我们还在关注35度以上的高温天气何时结束时,各个服装市场里的秋装叫卖声已是此起彼伏,再看看门口堆着的大包小包,在等着发。
  • 福建十大名茶是什么茶(福建之茶浅谈历代福建省产茶历史)
  • 2024-11-08福建之茶浅谈历代福建省产茶历史福建省的产茶历史悠久南朝齐时,浦城令江淹赞武夷山为“碧水丹山”,山上所产的“珍木灵芽”皆淹平生所至爱唐代茶对陆羽《茶经.八之出》叙述茶叶产区时称“……岭南生福州、建州……往往得之,其味甚佳”也说明福建。
  • 老鸭跟什么煲汤最佳(13道滋补养气老鸭汤)
  • 2024-11-0813道滋补养气老鸭汤鸭汤是一种十分常见的汤水,指以鸭为主要材料煲制的汤鸭肉含有较多的B族维生素和维生素E,当中的脂肪较易消化,还含有较多的蛋白质,是滋补养气的佳品一、虫草花萝卜炖鸭汤食材鸭腿、虫草花、白萝卜、盐、生姜、葱。
  • 游钟山王安石翻译(游钟山王安石解释)
  • 2024-11-08游钟山王安石解释翻译:整日在山间游览,山色美丽,变化万千,毫无厌倦将这片山林买下,等待终老山间山花花开花落而山一直魏然屹立,山间的溪水空空流淌而山自在清闲原文:钟山阳谷梵王家,帝释台前优钵花游戏但闻师子吼,比丘身衣锦。
  • 春秋时期姬姓后代(话说上古姞姓各国)
  • 2024-11-08话说上古姞姓各国据《国语·晋语》记载,黄帝二十五子,其中,十四子有姓,地位尊贵,他们来自十二个妇人,亦即来自十二姓这十二姓是:姬、姞、任、己、祁、荀等姬姓,由于后世周王国的建立,大名鼎鼎;而姞姓,大家知道的就不多了,。
  • 好吃的南瓜做法大全(九种家常南瓜做法)
  • 2024-11-08九种家常南瓜做法【九种家常南瓜做法】南瓜可不仅仅只能做南瓜饼,它无所不能,可炒,可蒸,可煮,可煎汤服,可外用捣敷熟食补益、利水,生用驱蛔、解毒来一起学几道~​​​​,。
  • 猫不能吃蛋白质吗(猫不能吃太多碳水化合物)
  • 2024-11-08猫不能吃太多碳水化合物猫其实并不需要碳水化合物与大部分只有“一个胃”的动物不同猫体内的血糖水平,与是否进食碳水化合物关系不大当一只猫,不吃任何碳水化合物时,猫的血糖状况并不会因此而出现问题猫的肝脏之中的“糖原异生能力”比其。
  • 四川开学要求通知(成都沈阳重要通知)
  • 2024-11-08成都沈阳重要通知微信公号“成都发布”央视新闻成都:非必要不离蓉,推迟秋季开学时间当前疫情防控形势异常复杂严峻,为快速遏制疫情扩散蔓延势头,切实保障广大市民群众身体健康,按照国家和省上有关要求,经成都市新型冠状病毒肺炎。
  • 柿子和萝卜一块吃有什么害处(骗了国人几十年)
  • 2024-11-08骗了国人几十年相信很多朋友在朋友圈和家族群中,都曾看过这些食物相克的消息和文章,而且其内容往往写得十分骇人听闻一些半信半疑的群众即使心存疑惑,也会因为事关健康和生命大事而宁可信其有不可信其无正是这些文章的广泛流传,。
  • 如何查询wifi中的mac地址(计费认证wifi设置关闭)
  • 2024-11-08计费认证wifi设置关闭如果手机上校园网经常出现掉线需要重新认证的情况,请检查手机设置里面是否关闭“随机MAC地址”,具体设置方法如下:1、华为手机关闭随机MAC地址1)点击“设置”--“WLAN”--长按已连接的无线WLA。
  • 什么季节吃海虹最好(海虹什么季节吃最肥最好吃)
  • 2024-11-08海虹什么季节吃最肥最好吃海虹是一种价格低廉营养丰富的海鲜,在生活中十分受欢迎,那么,海虹什么季节吃最肥最好吃呢?有兴趣的小伙伴们都来看看吧一、海虹是什么东西海虹是贻贝的别称贻贝(学名:Mytilusedulis)也叫青口,是。
  • 果树怎么嫁接成功率最高(如何更好的嫁接果树)
  • 2024-11-08如何更好的嫁接果树我们都知道,桃、梨、苹果,杏等果树,要想培育出优良品种,并且使它的优良性状能够保持下来,就必须实行嫁接嫁接一般分芽接和枝接两种芽接的时间,一般在7月中旬到8月上旬,枝接在春季发芽之前、树液开始流动的时。