AI也会遭遇瓶颈 解析人工智能技术的存储性能需求( 二 )


 
如果全部使用DRAM内存来存储这些数据,在性能上可能会表现突出,但也意味着用户需要花费非常高昂的成本 。因此更合理的是根据数据的类型、负载对它们合理地使用存储设备 。例如可以使用DRAM内存、英特尔傲腾持久内存来存储热数据,因为它们拥有很高的性能和超低的延迟,离CPU和GPU最近,能够获得及时的洞察 。而英特尔傲腾固态盘搭配以英特尔为代表的TLC、QLC NAND固态盘,则凭借大容量、高性能适合用于热、温热、温存储 。这种分层设计的绝妙之处在于金字塔里的每一个层级的数据、使用产品在容量和延时特性上正好有数量级的差距,这就使得用户可以根据数据的类型、工作负载进行冷热分层,并同时参考自己的预算,对性能的需求,对功耗的预期,来不断地优化自己的存储方案 。

AI也会遭遇瓶颈 解析人工智能技术的存储性能需求

文章插图
 
凭借不同于传统NAND闪存的革命性材料,傲腾具有就地写入、支持位寻址、低延迟等三大新特性 。
 
那么英特尔的存储技术能否承担起这一重任呢?从倪锦峰先生的介绍中,可以看到由于使用了不同于传统NAND闪存的傲腾介质,傲腾持久内存、傲腾固态盘具有诸多新特性 。首先是它支持就地写入,写入前不需要进行数据擦除 。不像普通NAND闪存存在读-修改-写这个过程,因此它拥有更好的性能 。同时在长时间写入后,它也不会出现数据脏块,不需要进行垃圾回收,因此傲腾产品可以很好地保持性能一致性,不会出现NAND固态盘用得越久、性能越差的问题 。
AI也会遭遇瓶颈 解析人工智能技术的存储性能需求

文章插图
 
与采用传统NAND闪存的DC P4600SSD相比,傲腾固态盘DC P4800X的延迟更低、一致性更好,寿命长得多,效率更高 。
 
其次是傲腾技术支持位寻址,可以提供超低的延迟,带来更快的传输速度,毕竟AI人工智能技术的应用对存储设备的容量和性能都有很高的要求 。相比传统NAND闪存,傲腾产品在性能上有质的提升,形象地比喻,就是将数据的载体从汽车升级为飞机 。延迟方面,它最好可以做到微秒级别,虽然和内存DRAM的不到0.1 微秒相比还是存在一定的差距,但是已远远好于NAND闪存的近百微秒的水平 。英特尔数据显示傲腾DC固态盘的访问延迟不仅较传统HDD、SATA SSD大幅降低,即便与同样采用NVMe接口的NAND SSD相比,其优势也是非常大的——与采用3D NAND 颗粒的英特尔DC P4600 SSD 相比,傲腾固态盘DC P4800X的读取延迟在不同写压力、不同队列深度下,低了8~63倍 。
 
此外新介质大幅提升了傲腾产品的寿命,英特尔傲腾固态盘可以支持多达60个DWPD(每日全盘写入次数),而大家所熟悉的英特尔P4600、P4610这样的高性能、高寿命的NAND固态盘,只能支持3个DWPD左右,英特尔傲腾固态盘的进步是非常可观的 。
AI也会遭遇瓶颈 解析人工智能技术的存储性能需求

文章插图
 
人工智能技术的数据管道可以通过使用英特尔傲腾持久内存、傲腾固态盘、QLC 3DNAND固态盘,进行合理搭配来提升任务执行的效率,并降低成本、功耗 。
 
同时从AI数据通道中的采集、整理、训练、推理四个阶段,可以看到各阶段对存储的要求是非常高的,需要有持续、一致的吞吐量,以及同样一致、持续、超低的延迟,这些需求正是傲腾产品所擅长的,再加上英特尔QLC 3D NAND SSD所拥有的大容量(已可实现单盘32TB)、高性能特性,通过这样一个完美的结合,可以帮助改善客户对数据的融合,提升软件定义存储解决方案的性能,帮助用户为即将到来的人工智能时代的数据爆发做好相应的准备 。
 
大幅提升效率,英特尔存储方案体现实际价值
AI也会遭遇瓶颈 解析人工智能技术的存储性能需求

文章插图
 
采用傲腾固态盘后,VMWare vSAN、hadoop、CEPH等各个存储系统的性能都获得了大幅提升 。
 
根据倪锦峰先生介绍,在实际使用中,不少平台改用英特尔傲腾产品后,都获得了很好的效果 。如百度在2018年发布了基于英特尔傲腾固态盘加英特尔QLC 3D NAND固态盘的存储解决方案,这一方案大幅提升了AI人工智能、大数据、云计算的存储性能 。在AI的一个训练场景中,这一方案相比原来的HDD机械硬盘方案可以获得21倍的性能提升以及96%的延迟下降,同时降低TCO多达60% 。在VMWare vSAN分布式存储系统中,将高性能缓存从NAND PCIe固态盘换成英特尔的傲腾固态盘后,其虚拟机密度提升了60%,同时系统整合率能够提升30%;在hadoop分布式架构中,当用户使用英特尔傲腾固态盘作为hadoop的临时数据缓存后,其吞吐量或性能可以提升40%左右 。


推荐阅读