黑科技篮子|参数量仅为1/300，谷歌最新的NLP模型，性能媲美BERT 机器之心编辑部在最新的博客文章中

机器之心编辑部
在最新的博客文章中，谷歌公布了一个新的NLP模型，在文本分类任务上可以达到BERT级别的性能，但参数量仅为BERT的1/300 。

文章图片
在过去的十年中，深度神经网络从根本上变革了自然语言处理（NLP）领域的发展，但移动端有限的内存和处理能力对模型提出了更高的要求。人们希望它们可以变得更小，但性能不打折扣。
去年，谷歌发布了一种被称为PRADO的神经架构，该架构当时在许多文本分类问题上都实现了SOTA性能，并且参数量少于200K 。大多数模型对每个token使用固定数目的参数，而PRADO模型使用的网络结构只需要很少的参数即可学习与任务最相关或最有用的token 。

文章图片
论文链接：https://www.aclweb.org/anthology/D19-1506.pdf
在最新的博客文章中，谷歌的研究者宣布它们改进了PRADO ，并将改进后的模型称为pQRNN 。新模型以最小的模型尺寸达到了NLP任务的新SOTA 。 pQRNN的新颖之处在于，它将简单的投影运算与quasi-RNN编码器相结合，以进行快速、并行的处理。该研究表明， pQRNN模型能够在文本分类任务上实现BERT级别的性能，但参数量仅为原来的1/300 。
PRADO的工作原理
在一年前开发该模型时， PRADO在文本分割上充分利用特定领域的NLP知识，以降低模型大小和提升模型性能。通常来说，首先通过将文本分割成与预定义通用词典中的值相对应的token ，将NLP模型的文本输入处理成适用于神经网络的形式。然后，神经网络使用可训练参数向量（包括嵌入表）来唯一识别每个文本片段。但是，文本分割的方式对模型性能、大小和延迟都有显著的影响。
下图展示了NLP社区使用的各种文本分割方法及其相应的优缺点：

文章图片
由于文本片段的数量是影响模型性能和压缩的重要参数，因此引出了一个问题，即NLP模型是否需要能够清楚地识别每个可能的文本片段。为了回答这个问题，研究者探索了NLP任务的固有复杂性。
只有语言建模和机器翻译等少数NLP任务需要了解文本片段之间的细微差异，因此可能需要唯一识别所有可能的文本片段。其他大多数任务仅通过了解这些文本片段的子集即可解决。此外，任务相关的文本片段子集并不一定是频率最高的部分，因为可能很大一部分是专用的冠词，如a、an和the ，而这些对很多任务来说并不重要。
所以，允许网络决定给定任务的最相关片段可以实现更好的性能。并且，网络不需要唯一识别这些文本片段，只需要识别出文本片段的聚类即可。举例而言，情感分类器只需要了解与文本中的情感强相关的片段聚类就行了。

文章图片
基于此， PRADO被设计成从词（word）中学习文本片段的聚类，而不是wordpiece或字符，从而使它能够在低复杂度NLP任务中实现良好的性能。由于wordunit更有意义，而且与大多数任务最相关的词并不多，所以学习相关词聚类的简化子集所需要的模型参数就少了很多。
改进PRADO
谷歌研究者在PRADO的基础上开发了一个更强的NLP模型——pQRNN 。该模型由三个构建块组成——一个是将文本中的token转化为三元向量序列的投影算子、一个密集bottleneck层和若干QRNN编码器。
pQRNN中投影层的实现与PRADO中所用到的一致，帮助模型学习相关性最强的token ，但没有一组固定的参数来定义这些token 。它首先对文本中的token进行识别，然后使用一个简单的映射函数将其转换为三元特征向量。这将产生一个三元向量序列，该序列具有平衡对称分布，用来表示文本。这种表示没有直接用途，因为它不包含解决感兴趣任务所需的任何信息，而且网络无法控制这种表示。

黑科技篮子|参数量仅为1/300，谷歌最新的NLP模型，性能媲美BERT

推荐阅读

【杜润旺】宏远新招数！杜润旺沦为“备胎”？其实他已经是人生赢家

北京寄东西回重庆，快递哪家划算

|英囤积者家中堆满6万件物品，大部分为未拆快递，自己被迫住旅馆

#综合#法国教育部长：我们流失了5%至8%的学生

王者荣耀|王者荣耀：已经出了5款周年限定，原始高清海报一览，这个共同点最良心

柠檬蜂蜜茶|夏天首饰别乱戴！建议这3种款式，洋气有面子，?女人过了40岁

立春节气推荐三款养生汤

脱口秀演员卡姆容留他人吸毒被判有期徒刑8个月

鲤鱼|弄明白这几句话，野钓找鱼窝，简直易如反掌

穿搭|清新可人的比基尼泳衣美女，轻松拥有优美曲线，尽显甜美洋气感！

井柏然|井柏然宋威龙露营：看成了官宣恋情

中国首枚芯片邮票面世

【钱甜圈】可以影响世界的美联储为什么那么牛

该怎样来修剪才比较好？枣树修剪

八年级数学一次函数的应用一次函数的应用

骁龙898|安卓阵营跑分王预定！骁龙8 Gen1跑分破百万稳了

几许狼烟|留下巨大弹坑，亚美尼亚动用最强导弹袭击阿塞拜疆第二大城市：民居楼被摧毁

国民乐见晚上俺翻来覆去睡不着，开心笑话：昨天男友突然被公司派去出差

华纳|华纳发布《信条》港台版海报

人社部|人社部：行业协会商会证书不能使用“中国”、“中华”等字样