2020-04-30_193408.jpg

维基百科为那些知道去哪里看的人提供了无数主题的丰富知识,但其中却有麻烦-导航其超过60亿篇文章的数据库需要一些网络爬行技巧。为了简化搜索,Salesforce的研究人员开发了他们所谓的基于图的可训练检索器-阅读器框架,该框架顺序 从英语维基百科文章中检索段落,以回答复杂的开放域问题。他们说,它在一系列基准测试中均达到了最先进的性能,证明了其有效性。

正如研究人员所解释的那样,开放域问答广泛使用了检索阅读方法。典型的检索阅读方法包括使用有效的基于术语的检索器系统为每个查询选择几个段落,然后读取排名最高的段落以提取答案。通常,它们对于可以由一个段落回答的简单单跳问题很有效,但是当遇到复杂的多跳问题时,它们通常会失败。

相反,Salesforce研究人员提出了一个基于图的递归检索器-阅读器框架,该框架学会了在Wikipedia图上检索推理路径。直觉是,可以将检索问题表述为大型图上的神经路径,其中每个段落代表图中的一个节点,每个内部超链接都被视为一条边。

 

2020-04-30_193418.jpg

基于图的递归检索器通过限制先前检索的段落,使用图形结构检索给定问题的段落。它估计从种子段落开始并以证据终止符号结尾的合理的推理路径(即,段落序列),并选择问题的主要推理路径,以验证哪条路径最合理地提取答案。

研究人员说,这些技术在一起使框架能够比现有系统更强大地解决单跳和多跳开放域问题。在之前的实验中,在具有11 GB内存的单个图形卡上对检索器进行了训练,他们发现该检索器在基准测试中比以前的最佳模型高出14点。

“详细的推理路径有助于解释我们框架的推理过程,”详细介绍这项工作的论文的合著者写道。“检索到的推理路径为我们提供了用于多跳推理的基础实体关系的可解释的见解。我们希望这项工作能促进未来针对开放域质量检查中检索组件的研究。”

对于Salesforce来说,自然语言处理是一个急需解决的领域,其爱因斯坦AI平台每天都会产生数十亿个预测。在2018年6月,它发表了一篇关于自然语言处理模型的论文,该模型可以一次执行多达10个任务。2019年6月,这家科技巨头的研究人员提出了一个语料库- 常识解释(CoS-E) -用于使用新型机器学习框架(共知自动生成的解释或CAGE)进行训练和推理,他们说该方法可提高问答基准的数量级。

发布评论

分享到:

创世资讯

我的微信号:57018158(左侧二维码扫一扫)欢迎添加!

苹果第二季度财报显示,由于大流行,收入同比增长持平
你是第一个吃螃蟹的人
发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。