薄情先生|会怎么样?,把Transformer加深几倍( 二 )
3实验
在英法和英德翻译任务上进行了实验 , 结果如下:
2.为深层transformer模型的研究开辟了方向 。
参考文献:
1.Vaswani,Ashish,etal."Attentionisallyouneed."Advancesinneuralinformationprocessingsystems.2017.
2.Wang,Qiang,etal."Learningdeeptransformermodelsformachinetranslation."arXivpreprintarXiv:1906.01787(2019).
3.Liu,Liyuan,etal."UnderstandingtheDifficultyofTrainingTransformers."arXivpreprintarXiv:2004.08249(2020).
推荐阅读
- 苹果|你当时脑袋一热买的东西现在怎么样了?玩了6次,就亏本卖了
- 薄情先生|真首发120W!倍思120W多口GaN氮化镓充电器体验
- 薄情先生|云手机将成主流?,界读丨云鲲鹏来了!光刻机不再是限制
- 薄情先生|华为排第五,小米排第六,手机好评率排行榜出炉
- iPhone|9年前那个卖肾买苹果手机的高中生,后来怎么样了?看完心疼不已
- 52未来社区|中国全面支持的半导体产业会怎么样?,新导航芯片领先GPS
- 饿了么|曾把饿了么卖给阿里,赚得647亿的张旭豪,现在他怎么样了?
- 薄情先生|有可能正在被“监听”,你中招了没?,手机如果出现这6种情况
- 先生科技汇|索尼WH-1000XM4无线降噪耳机实力圈粉,降噪体验再升级
- 依湖美丽新娱乐|与王伟撞机的美军肇事飞行员,现在生活怎么样了?,18年前