李航等提出多粒度AMBERT模型，中文提升显著

选自arXiv
作者：Xinsong Zhang、李航
机器之心编译
编辑：杜伟、小舟
自谷歌 BERT 模型问世以来，各式各样的 BERT 变体模型在自然语言理解任务上大显身手。近日，字节跳动 AI 实验室李航等研究者提出了一种新型多粒度 BERT 模型，该模型在 CLUE 和 GLUE 任务上的性能超过了谷歌 BERT、Albert、XLNet 等。
BERT 等预训练语言模型在自然语言理解（Natural Language Understanding, NLU）的许多任务中均表现出了卓越的性能。
可以看到，模型中的 token 通常是细粒度的，对于像英语这样的语言， token 是单词或子词；对于像中文这样的语言，则是单个汉字。例如在英语中有多个单词表达式构成的自然词汇单元，因此使用粗粒度标记化（tokenization）似乎也是合理的。实际上，细粒度和粗粒度标记化对于学习预训练语言模型都各有利弊。
近日，字节跳动 Xinsong Zhang、李航两位研究者在细粒度和粗粒度标记化的基础上，提出了一种新的预训练语言模型，他们称之为 AMBERT（一种多粒度 BERT）。在构成上， AMBERT 具有两个编码器。
对于英文， AMBERT 将单词序列（细粒度标记）和短语序列（粗粒度标记）作为标记化后的输入，其中使用一个编码器处理单词序列，另一个编码器处理短语序列，并利用两个编码器之间的共享参数，最终分别创建单词和短语的上下文表示序列。

本文插图
论文链接：https://arxiv.org/pdf/2008.11869.pdf
研究团队已经在一些中文和英文的基准数据集（包括 CLUE、GLUE、SQuAD 和 RACE）上进行了实验。实验结果表明， AMBERT 的性能几乎在所有情况下都优于现有的最佳性能模型。尤其是对于中文而言， AMBERT的提升效果显著。

本文插图
我们首先看一下中英文任务中细、粗粒度模型层的注意力图。
下图 1 显示了适用于中英文句子的细粒度模型的首层注意力图。可以看到，某些 token 不恰当地出现在句子的其他 token 上。
例如在英文句子中，「drawing」、「new」和「dog」分别对「portrait」、「york」和「food」这几个词有高注意力权重，但这是不合适的。而在中文句子中，汉字「拍」、「北」和「长」分别对「卖」「京」「市」有高注意力权重，这也是不合适的。

本文插图
下图 2 显示了中英文相同句子粗粒度模型的首层注意力图。
在英文句子中，单词组成的短语包括「drawing room」、「york minister」和「dog food」，前两个句子中的注意力是恰当的，但最后一个句子则因为不正确的标记化而出现了不恰当的注意力。类似地，在中文句子中，高注意力权重的「球拍（bat）」和「京城（capital）」都是合理的，但「市长（mayor）」不合理。但请注意：错误的标记化是不可避免的。

本文插图
接下来详细解读 AMBERT 模型的细节和实验结果。
AMBERT 模型
研究者在下图 3 中给出了 AMBERT 的整体框架。 AMBERT 以文本作为输入，其中，文本要么是单个文档中的长序列，要么是两个不同文档中两个短序列的级联。接着在输入文本上进行标记化，以获得细、粗粒度的 token 序列。

本文插图

李航等提出多粒度AMBERT模型，中文提升显著

推荐阅读

生活中普拉提和瑜伽哪个好？

枪声再响！美国密苏里州一校园附近发生枪击案 1死3伤

火星|火星上发现巨大湖泊，水量比渤海还多，意大利科学家称里面有生命

酷玩儿|西门子合资企业有望在澳大利亚电网中领先特斯拉电池

『评测狂想曲』这是什么黑科技？，适合游戏的真无线耳机清单：最低延时只有94ms

如果有一天微信这种社交软件也不火了咋办

补肾|肾虚“别忙补”，老中医：“3招”补肾气，简单易学！

寒风|透析冬季筏竿钓鲫，直击作钓误区，给寒风中的自己增加点鱼获

出现北京西城出现33人集中发热排除新冠肺炎

经济|港股风云 | 恒指一周仅上涨1.73% 机构：杀估值是目前市场的主旋律

战魂铭人银藏玩法心得分享银藏怎么玩|战魂铭人银藏玩法心得分享银藏怎么玩

东邪体坛泰山|山东女排崛起是中国女排新的希望！，新赛季

女朋友开始一直很爱我，但是因为我很自我对她不关心，最近提出很累要分手，说以后要远远的看着我作朋友，关注我，永远的支持我，累的时候可以找她，她会一直坚定不移的看着我，直到我成

「烽火戏猪狗」詹姆斯是否能创建新的王朝球队？，假若杜兰特没有加盟73胜勇士

中国经济网|法国汽车以旧换新补贴将调回疫前水平

虎扑足球|你在最需要你的时候留下，赖特连线奥巴梅扬：其他人离开了

春季宝宝补钙食谱推荐

为啥美本学生也在培训机构上GRE

越南|转身“求助”中国伸援手，越南制造业问题“暴露”？束手无策后

大蒜伤眼睛吗