|陈丹琦新作:关系抽取新SOTApipeline挫败joint( 三 )
下表 4 展示了这些变体的性能 , 从中可以看出不同的输入表示确实对关系抽取的准确率产生影响 。
本文插图
实体和关系如何交互
人们对 joint 模型的主要认知是 , 对两个子任务之间交互的建模对彼此有所帮助 。 但这项研究并未采取这种方式 , 而是使用了两个独立的编码器 。
研究人员首先研究了共享两个表示编码器能否提升性能 。 如下表 5 所示 , 简单地共享编码器对实体 F1 和关系 F1 分数均有所损害 。 研究人员认为 , 其原因在于两个任务具备不同的输入格式 , 需要不同的特征来预测实体类型和关系 , 因此使用单独的编码器可以学得更好的任务特定特征 。
本文插图
该研究的分析结果显示:
实体信息有助于预测关系 , 但实验未表明关系信息可以大幅提升实体性能 。
仅共享编码器对该研究提出的方法无益 。
如何缓解 pipeline 方式中的误差传播问题
pipeline 训练的一个主要缺陷是误差传播问题 。 使用 gold 实体(及其类型)进行关系模型训练 , 使用预测实体进行推断 , 可能会导致训练和测试之间存在差异 。
为此 , 研究人员首先探究在训练阶段使用预测实体(而非 gold 实体)能否缓解这一问题 。 该研究采用 10-way jackknifing 方法 , 结果发现这一策略竟然降低了最终的关系性能 。 研究人员假设其原因在于训练阶段引入了额外的噪声 。
在目前的 pipeline 方法中 , 如果在推断阶段 gold 实体没有被实体模型识别出来 , 则关系模型无法预测与该实体相关的任何关系 。 于是 , 研究人员考虑在训练和测试阶段 , 对关系模型使用更多 span 对 。 实验结果表明 , 这无法带来性能提升 。
这些常识未能显著提升性能 , 而该研究提出的简单 pipeline 方法却惊人的有效 。 研究者认为误差传播问题并非不存在或无法被解决 , 我们需要探索更好的解决方案 。
此外 , 该研究使用的跨句语境对性能提升有所帮助 , 参见表 2 。
推荐阅读
- GIS|担当新作为,融创新未来——2020第八届高校GIS论坛在广州成功举办
- 区块链世界大神|人工智能和灵动区块链居然是这么层关系?
- BENCOM信息科技|机器学习与AI这两个术语通常可以互换使用,到底有什么关系?
- 生活电商汇|华为nova 8 SE评测:5G时代给年轻人的轻量新作
- 快谈天下|如果支付宝花呗“欠债不还”会咋样?马云淡定回复3个字:没关系
- 汽车商报|对话福瑞泰克:自动驾驶浪潮下的整零关系重构 | 汽车商报
- 不忘初心传媒|数字人民币和微信支付宝不存在竞争关系,将与纸币长期共存
- 用户|CMO训练营专访|群脉CEO周萍:私域不是未来,推进用户关系深度才是
- 时政要闻|新时代 新媒体 新作为 延安网信召开新媒体发展座谈会
- |央行立法为DCEP开路,但DCEP和比特币、区块链毫无关系