|速度超快！字节跳动开源序列推理引擎LightSeq

机器之心发布
机器之心编辑部
这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。
2017 年 Google 提出了 Transformer [1] 模型，之后在它基础上诞生了许多优秀的预训练语言模型和机器翻译模型，如 BERT [2] 、GPT 系列[13]等，不断刷新着众多自然语言处理任务的能力水平。与此同时，这些模型的参数量也在呈现近乎指数增长（如下图所示）。例如最近引发热烈讨论的 GPT-3 [3] ，拥有 1750 亿参数，再次刷新了参数量的记录。

本文插图

如此巨大的参数量，也为模型推理部署带来了挑战。以机器翻译为例，目前 WMT[4]比赛中 SOTA 模型已经达到了 50 层以上。主流深度学习框架下，翻译一句话需要好几秒。这带来了两个问题：一是翻译时间太长，影响产品用户体验；二是单卡 QPS （每秒查询率）太低，导致服务成本过高。
因此，今天给大家安利一款速度非常快，同时支持非常多特性的高性能序列推理引擎——LightSeq 。它对以 Transformer 为基础的序列特征提取器（Encoder）和自回归的序列解码器（Decoder）做了深度优化，早在 2019 年 12 月就已经开源，应用在了包括火山翻译等众多业务和场景。据了解，这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。
LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景，大大提高线上模型推理速度，改善用户的使用体验，降低企业的运营服务成本。
相比于目前其他开源序列推理引擎， LightSeq具有如下几点优势：
1. 高性能
LightSeq推理速度非常快。例如在翻译任务上， LightSeq相比于Tensorflow实现最多可以达到14倍的加速。同时领先目前其他开源序列推理引擎，例如最多可比Faster Transformer快1.4倍。
2. 支持模型功能多
LightSeq支持BERT、GPT、Transformer、VAE 等众多模型，同时支持beam search、diverse beam search[5]、sampling等多种解码方式。下表详细列举了Faster Transformer[7]、Turbo Transformers[6]和LightSeq三种推理引擎在文本生成场景的功能差异：

本文插图

3. 简单易用，无缝衔接Tensorflow、PyTorch等深度学习框架
LightSeq通过定义模型协议，支持各种深度学习框架训练好的模型灵活导入。同时包含了开箱即用的端到端模型服务，即在不需要写一行代码的情况下部署高速模型推理，同时也灵活支持多层次复用。
使用方法
利用 LightSeq 部署线上服务比较简便。 LightSeq 支持了 Triton Inference Server[8] ，这是 Nvidia 开源的一款 GPU 推理 server，包含众多实用的服务中间件。 LightSeq 支持了该 server 的自定义推理引擎 API。因此只要将训练好的模型导出到 LightSeq 定义的模型协议[9]中，就可以在不写代码的情况下，一键启动端到端的高效模型服务。更改模型配置（例如层数和 embedding 大小）都可以方便支持。具体过程如下：
首先准备好模型仓库，下面是目录结构示例，其中 transformer.pb 是按模型协议导出的模型权重， libtransformer.so 是 LightSeq 的编译产物。
- model_zoo/- model_repo/- config.pbtxt- transformer.pb- 1/- libtransformer.so
然后就可以启动Triton Inference Server[8] ，搭建起模型服务。
1. trtserver --model-store=${model_zoo}
性能测试
在 NVIDIA Tesla P4 和 NVIDIA Tesla T4 显卡上，笔者测试了 LightSeq 的性能，选择了深度学习框架 Tensorflow v1.13 和解码场景支持较为丰富的 Faster Transformer v2.1 实现作为对比。 Turbo Transformers 解码方法比较单一（只支持 Beam Search，不支持文本生成中常用的采样解码），尚未满足实际应用需求，因此未作对比。

|速度超快！字节跳动开源序列推理引擎LightSeq

推荐阅读

心理测试|心理测试：哪只蝴蝶最美丽动人？测你什么时候能逆转富贵命

[白志峰]睡觉姿势有大学问

给行李箱贴贴纸需要注意什么？

机核网|疯狂、恶意、痛苦且不可理喻的作品：《龙背上的骑兵》

周黑鸭喊你来开店，单店特许经营模式已开放

|清代和田玉螭龙摆件一对

|新品牌M43卡口摄像头

偃师市|男子溺亡打捞上来发现内穿红色豹纹文胸警方发布认尸启事

品恒星语|能够顺风顺水的四大生肖，七月下旬最有发展空间

北青网综合|美国阿拉斯加州海域发生5.7级地震震源深度20千米

上海厨卫展法恩莎卫浴张国庆：艺术体验，让设计为爱而生

怎样让头发更柔顺？

天涯看点历史号|被美国人当成怪物，送去马戏团展览，她是第一个去美国的清朝女子

叶子股评|股价涨停；医药行业一细分领域现重大机会！，宇通客车销量猛增

有一种“反噬”叫胡杏儿和黄宗泽，分手11年后，曾经预言都应验了

不怕被“文化统战”？蔡省长竟也追起大陆古装剧

行程码在哪里查询？

新手消防员分管供水车开心到飞起|新手消防员分管供水车开心到飞起画面太喜感

按姓氏笔画如何排序(如何按姓氏笔画进行排序)

北京日报|教育部新批准32个中外合作办学项目，明年起可招生