内存第四范式推出业界首个基于持久内存、支持毫秒级恢复的万亿维线上预估系统( 二 )
02. 数据恢复速度测试:
当系统节点出现故障时 , 采用纯内存的参数服务器需要从数据存储集群(如HDFS)重新申请模型参数数据恢复 , 耗时长 , 严重影响线上服务质量 。 采用持久内存的HyperPS则完全不同 , 节点发生故障或者程序崩溃后 , 数据依然保存在持久内存中 , 服务重启后只需要调用优化过的数据一致性检查函数 , 即可实现毫秒级实时恢复 。
图片
以恢复6千万维参数模型为例 , 纯内存参数服务器恢复模型需要花费58秒 , 而持久性内存参数服务器只需要0.03秒 , 故障恢复时长缩短将近2000倍 。
图片
恢复20个模型总计12亿维参数测试中 , 纯内存参数服务器数据恢复时间随着数据总量增加而大幅增长 , 而持久内存的参数服务器几乎没有受到影响 , 只需检查哈希表元数据后即可提供服务 , 其恢复时长缩短17114倍 。
03. 预估性能测试:
HyperPS不仅大幅降低了总拥有成本并提升数据恢复速度 , 也展现出和纯内存模式下同水准的性能表现 。 在非高压(1个请求线程)和高压(56个并发请求线程)的情况下的请求延迟(TP99) 。 结果表明 , 基于持久内存的HyperPS参数服务器在延迟上 , 与采用纯内存的参数服务器性能相近 。 单线程和56线程两个测试中 , 持久内存的参数服务器均仅比采用纯内存的参数服务器延迟多1毫秒 。
在吞吐性能对比测试项目中 , 基于持久内存的参数服务器在56线程的高压负载测试中的QPS仅比纯内存参数服务器低3.5% 。
此次 , 通过 “软件定义算力”的全新方式 , 第四范式将自研HyperPS万亿维参数服务器与英特尔?傲腾持久内存进行软硬一体优化设计 , 保证线上推理服务超高性能的同时 , 大幅降低企业AI整体投入成本 , 提升线上服务质量 , 进一步扫清了企业AI规模化应用的前进障碍 。
(责任编辑:张洋 HN080)
推荐阅读
- |好物推荐:RGB杀马特灯条下的另类内存条 金士顿掠食者系列
- 手机使用技巧|宝宝照片太多怎么办?4种不占手机内存的存储方式,最后一种更安全
- 红米手机|长续航大内存百元老人机推荐红米9
- 开售|千元四摄OPPO A11开售:配备5000mAh电池+AI四摄 128GB超大内存
- 雷军|雷军再度爆发,小米10跌至新低价,还有256GB内存!
- 手机使用技巧,微信|不管手机配置多好,微信这个“默认开关”要关闭,会占用大量内存!
- 小米手机|想买手机的再等等,下半年发布的四款神机,第四款颠覆手机形态!
- 内存条|重磅消息!首款国产芯片内存条问世,有望走向世界市场
- 驱动之家|32GB内存有必要吗?实测给出你想不到的答案
- Realme手机|OPPO火力全开,8+256GB大内存跌至1699,支持屏幕指纹和NFC功能