盘点准时播|2020京东入选论文深度解析，京东AI写作能力超过人类表现，AAAI( 二 ) 人工智能技术在电商领域

（1）多任务学习
文本摘要任务和关键词提取任务在某种意义上非常相似，都是为了提取输入文本中的关键信息。不同点在于其输出的形式：文本摘要任务输出的是一段完整的文本，而关键词提取任务输出的是关键词的集合。我们认为这两个任务均需要编码器能够识别出输入文本中的重要信息的能力。因此，我们利用多任务学习框架，共享这两个任务编码器，提升编码器的性能。
（2）基于关键词指导的摘要生成模型
我们受Zhou等人工作[1]的启发，提出了一种基于关键词指导的选择性编码。具体来说，由于关键词含有较为重要的信息，通过关键词的指导，我们构建一个选择门网络，其对输入文本的隐层语义信息进行二次编码，构造出一个新的隐层。基于这个新的隐层进行后续的解码。
我们的解码器基于Pointer-Generator网络[2] ，即融合了复制机制的端到端模型。对于Generator模块，我们提出直连、门融合和层次化融合的方式对原始输入文本和关键词的上下文信息进行融合；对于Pointer模块，我们的模型可以选择性地将原始输入和关键词中的文本复制到输出摘要中。
3、实验与分析
（1）数据集
在本次实验中，我们选择在Gigaword数据集上进行实验，该数据集包含约380万个训练句子摘要对。我们使用了8000对作为验证集， 2000对作为测试集。
（2）实验结果
表1显示了我们提出的模型比没有关键词指导的模型表现更好。我们测试了不同的选择性编码机制，分别是输入文本的自选择，关键词选择和互选择，实验结果显示互选择的效果最佳；对于Generator模块，我们发现层次化融合的方式要优于其他两种融合方式；我们的双向Pointer模块比原始的仅能从输入文本中复制的模型表现更好。

文章图片
4、总结
本文致力于生成式句子摘要的任务，即如何将一个长句子转换成一个简短的摘要。我们提出的模型可以利用关键词作为指导，生成更加优质的摘要，获得了比对比模型更好的效果。
1）通过采用了多任务学习框架来提取关键词和生成摘要；
2）通过基于关键字的选择性编码策略，在编码过程中获取重要的信息；
3）通过双重注意力机制，动态地融合了原始输入句子和关键词的信息；
4）通过双重复制机制，将原始输入句子和关键词中的单词复制到输出摘要中。
在标准句子摘要数据集上，我们验证了关键词对句子摘要任务的有效性。
注释：
[1]Zhou,Q.;Yang,N.;Wei,F.;andZhou,M.2017.Selectiveencodingforabstractivesentencesummarization.InProceedingsofACL,1095–1104.
[2]See,A.;Liu,P.J.;andManning,C.D.2017.Gettothepoint:Summarizationwithpointer-generatornetworks.InProceedingsofACL,1073–1083.
关于京东AI研究院
【盘点准时播|2020京东入选论文深度解析，京东AI写作能力超过人类表现，AAAI】京东AI研究院专注于持续性的算法创新，多数研究将由京东实际的业务场景需求为驱动，聚焦领域涵盖：计算机视觉、自然语言理解、对话、语音、语义、机器学习，已逐步在北京、南京、成都、硅谷等全球各地设立职场。

盘点准时播|2020京东入选论文深度解析，京东AI写作能力超过人类表现，AAAI( 二 )

推荐阅读

「蓓小西」一身黑走机场，气质没差反而更优雅，俞飞鸿真是气质女人穿搭标杆

电影|莫泊桑《项链》：不被欲望所捆绑的女人，才是真正的赢家

“爸爸牺牲10年”作文传到雪域高原兵营里的回复让人泪目

篮球技巧教学媒体|锡安全场仅得到7分！一场打这么十几分钟，倒不如让他好好休息

滚滚人潮中反向流动显“潇洒” 春运中逆行的身影为团圆

美军|美军再次不宣而战！数艘军舰在公海动手，强行扣押4艘油轮

白鱼light|五十岁的姐姐都这么穿，减龄有气质，您来看看HOLD住场面吗

金桔冰糖水可以多喝吗金桔冰糖水孕妇能喝吗

「圈内八卦」3D姓氏签名头像40多个，换个头像，改变形象，您该换个微信头像了

[两弹一星]唯一在天空闪烁的牛郎织女两弹一星烈士和最美院士在天上相会

猛犸鹤壁■鹤壁：全面提升科技创新能力为建设高质量富美鹤城贡献科技力量（1）

【疯狂搞笑每一天】满身上下都是钱了，搞笑GIF趣图：这个风俗不错

倩碧黄油怎么样倩碧黄油好用吗

湖南美食达人|人称“刮油机”，想要苗条身材，女人需常吃，常见的4种美食

故事没我|《假面饭店》：卧底神探五星级布局，大破连续预告杀人事件

「青岛要闻」青岛推出有奖发票最高一等奖50万元，花钱就是挣钱

梵古■大方得体端庄大气，50——60岁中老年女士遮肉显瘦的连衣裙款式

河北|邹市明一家四口合照未见三胎儿子身影，大儿子身高直窜快追上妈妈

ITheat热点科技|E530 上市多应用场景高效解决方案，明基智能商务投影仪

「好物鉴定官」真实测评，把电影院搬回家：SONOS智能音箱