文章插图
Mention-Pair 特征的集合
Cluster-Pair Encoder 对上述特征集合进行 pooling 操作,生成 Cluster-Pair 的特征向量 rc(ci, cj) 。
![基于聚类的指代消解算法](http://img.jiangsulong.com/220422/012J25a4-8.jpg)
文章插图
生成 Cluster-Pair 特征向量
2.3 Mention-Ranking Model
作者首先训练和一个 Mention-Ranking Model,用于对 Mention-Pair 打分 。主要原因有两个:
- 预训练 Mention-Ranking Model 模型可以初始化 Cluster-Ranking Model 。
- 通过 Mention-Ranking Model 预测 Mention-Pair 的得分,可以对 Cluster-Ranking Model 的搜索空间进行剪枝,直接去掉一些不可能的 Mention-Pair 。
![基于聚类的指代消解算法](http://img.jiangsulong.com/220422/012J212X-9.jpg)
文章插图
Mention-Pair 得分
用 A(m) 表示 Mention m 所有可能的先行词集合,用 T(m) 表示 m 真实的先行词集合 。通过计算一个 Mention 和所有 T(m) 的得分,可以找出一个得分最高的真实先行词,如下所示 。
![基于聚类的指代消解算法](http://img.jiangsulong.com/220422/012J231J-10.jpg)
文章插图
得分最高的真实先行词
作者用了下面的损失函数训练模型,损失函数针对不同的预测错误采用不同的学习权重,NA 表示 Mention 没有先行词 。
![基于聚类的指代消解算法](http://img.jiangsulong.com/220422/012J234Z-11.jpg)
文章插图
Mention-Ranking 损失函数
2.4 Cluster-Ranking Model
用一个状态 x=(C, m) 表示当前的状态,其中 C={c1, c2, ...} 表示当前所有的簇,m 表示当前考虑的 Mention,cm 表示包含 Mention m 的簇 。初始的时候每一个 Mention 单独成为一个簇 。对于当前状态 x(c, m),可以采用的行动 U(x) 包括:
- MERGE[cm, c],把包含 m 的簇 cm 和当前簇 c 融合成一个簇 。
- PASS,不改变簇 。
![基于聚类的指代消解算法](http://img.jiangsulong.com/220422/012J24217-12.jpg)
文章插图
计算 Cluster 得分
最终模型根据策略 π 采取下一步的行动 。
![基于聚类的指代消解算法](http://img.jiangsulong.com/220422/012J23133-13.jpg)
文章插图
Cluster 执行策略 π
Cluster-Ranking Model 的训练过程和传统的机器学习不同,因为其状态依赖于过去的行动,因此作者使用了一种 Learning to Search 的方法训练模型,如下所示 。
![基于聚类的指代消解算法](http://img.jiangsulong.com/220422/012J223c-14.jpg)
文章插图
Learning to Search
3.参考文献Improving Coreference Resolution by Learning Entity-Level Distributed Representations
【基于聚类的指代消解算法】
推荐阅读
- 实时推荐系统的3种方式
- 菊花茶的功效与禁忌,菊花茶与枸杞的功效与作用及禁忌
- 金坛雀舌的制茶工艺,雀舌绿茶
- 你的接口参数怎么接收的
- 金瓜贡茶的收藏价值,普洱茶不同的收藏价值
- 程序算法设计,华为面试题中的算法考了这些内容
- HTML跳转到页面指定位置的几种方法
- 加多宝凉茶的功效,薄荷凉茶的做法是什么
- 基于.NET Core的Orchard Core框架出来了
- C++中左值和右值的理解