智能家居科技 谷歌大改Transformer注意力,自己挖坑自己填( 三 )


智能家居科技 谷歌大改Transformer注意力,自己挖坑自己填
文章图片
Performer在蛋白质序列建模时的性能 。
下面可视化一个蛋白质Performer模型 , 该模型使用基于ReLU的近似注意力机制进行训练 。 研究者发现 , Performer的密集注意力近似有可能捕捉到跨多个蛋白质序列的全局相互作用 。 作为概念的证明 , 研究者在串联蛋白长序列上训练模型 , 这使得常规的Transformer模型内存过载 。 但由于具有良好的空间利用效率 , Performer不会出现这一问题 。
智能家居科技 谷歌大改Transformer注意力,自己挖坑自己填
文章图片
左:从注意力权重估计氨基酸相似性矩阵 。 该模型可以识别高度相似的氨基酸对 , 例如(D,E)和(F,Y) 。
智能家居科技 谷歌大改Transformer注意力,自己挖坑自己填
文章图片
Performer和Transformer在长度为8192的蛋白质序列上的性能 。
随着Transformer的频繁跨界 , 越来越多的研究者开始关注其内存占用和计算效率的问题 , 比如机器之心前段时间介绍的《抛弃注意力 , 比EfficientNet快3.5倍 , 类Transformer新模型跨界视觉任务实现新SOTA》 。 在那篇文章中 , 研究者提出了一种名为「lambda」的层 , 这些层提供了一种捕获输入和一组结构化上下文元素之间长程交互的通用框架 。 类似的改进还在不断涌现 , 我们也将持续关注 。
参考链接:http://ai.googleblog.com/2020/10/rethinking-attention-with-performers.html


推荐阅读