黑科技篮子|参数量仅为1/300，谷歌最新的NLP模型，性能媲美BERT( 二 ) 机器之心编辑部在最新的博客文章中

研究者将其与一个密集bottleneck层结合在一起，以使网络可以学习到一个与手头任务相关的逐词表示。 bottleneck层产生的表示仍然没有考虑到词的上下文。因此，研究者利用若干双向QRNN编码器学习了一个上下文表示。这样可以得到一个仅从文本输入就能学到上下文表示的网络，并且无需任何预处理。

文章图片
pQRNN的性能
研究者在civil_comments数据集上评估了pQRNN ，并将其与BERT模型在相同的任务中进行了比较。模型的大小与其参数量成正比，因此pQRNN比BERT小得多。
此外， pQRNN还进行了量化处理（quantized），因此模型体积进一步缩小到原来的1/4 。公开训练的BERT在本文的任务中表现不好，因此拿来对比的BERT其实是在几个不同的相关多语言数据源上进行预训练得到的，以使其达到最好的表现。

文章图片
在实验中，研究者得到了两个模型的AUC信息。在没有任何预训练、只在监督数据训练的情况下， pQRNN的AUC是0.963 ，用到了130万个量化（8-bit）参数。在几个不同数据源进行预训练并在监督数据上进行微调之后， BERT模型得到的AUC是0.976 ，用到了1.1亿个浮点参数。
为了鼓励社区在谷歌研究成果的基础上做出进一步改进，谷歌还开源了PRADO模型。
项目地址：https://github.com/tensorflow/models/tree/master/research/sequence_projection
【黑科技篮子|参数量仅为1/300，谷歌最新的NLP模型，性能媲美BERT】博客链接：https://ai.googleblog.com/2020/09/advancing-nlp-with-efficient-projection.html

黑科技篮子|参数量仅为1/300，谷歌最新的NLP模型，性能媲美BERT( 二 )

推荐阅读

军机图：苏联之后俄罗斯的“大”舰艇为何越来越少？并非没钱这么简单

卿卿日常|“大清早都亡了”，浙传女生穿高开叉跳舞被批暴露，本人回怼霸气

荒野行动|快上车！这就教你如何高效跑圈

「」吃了太多苦的3大生肖，7月上旬起苦尽甘来，日子越过越滋润！

疫苗|紧急！专家警告：美国疫情或在今年秋冬季再度大暴发！全球疫情最新形势速看→

你家乡啥时解放的 | 一图看懂

经济学|支持率探底＋再度入院，安倍晋三或告别日本政坛

看大世界|快速拿驾照，科目三被教练催促约考怎么办？你得明白教练的用意

韩国|月薪过万韩国95后妹子一月吃饭只花44元：四年攒出一套房

「小李的篮球观」最糟糕的路人皆知其他你还知道哪些，本赛季最糟糕的5大管理层

周深|港影：给时光以生命，跨越岁月的“郭富城年”

栀子花长青虫了家用小妙招图片栀子花长青虫了家用小妙招

贸易|广西晟庄福贸易有限公司蓝莓冰酒上市新闻发布会圆满成功

勒布朗·詹姆斯|球商高！情商更高！颁奖典礼詹皇一举动化解女老板尴尬

满嘴谎言私生女，大骗子吴尊，“底裤”都被扒光了

微言教育微信公众号|“天问一号”升空这些“硬核”知识讲给孩子听

迪士尼和贝贝怡的关系贝贝怡童装属于什么档次

美国|更令美国担忧的事发生！美元将迎35％崩跌？，1406亿美债遭抛售后

爱国诗歌朗诵简短100字一年级爱国诗歌朗诵简短

这里是厦门|海清登封面棕色廓形夹克时髦摩登