AI也会遭遇瓶颈解析人工智能技术的存储性能需求( 二 ) _人工智能

如果全部使用DRAM内存来存储这些数据，在性能上可能会表现突出，但也意味着用户需要花费非常高昂的成本。因此更合理的是根据数据的类型、负载对它们合理地使用存储设备。例如可以使用DRAM内存、英特尔傲腾持久内存来存储热数据，因为它们拥有很高的性能和超低的延迟，离CPU和GPU最近，能够获得及时的洞察。而英特尔傲腾固态盘搭配以英特尔为代表的TLC、QLC NAND固态盘，则凭借大容量、高性能适合用于热、温热、温存储。这种分层设计的绝妙之处在于金字塔里的每一个层级的数据、使用产品在容量和延时特性上正好有数量级的差距，这就使得用户可以根据数据的类型、工作负载进行冷热分层，并同时参考自己的预算，对性能的需求，对功耗的预期，来不断地优化自己的存储方案。

文章插图

凭借不同于传统NAND闪存的革命性材料，傲腾具有就地写入、支持位寻址、低延迟等三大新特性。

那么英特尔的存储技术能否承担起这一重任呢？从倪锦峰先生的介绍中，可以看到由于使用了不同于传统NAND闪存的傲腾介质，傲腾持久内存、傲腾固态盘具有诸多新特性。首先是它支持就地写入，写入前不需要进行数据擦除。不像普通NAND闪存存在读-修改-写这个过程，因此它拥有更好的性能。同时在长时间写入后，它也不会出现数据脏块，不需要进行垃圾回收，因此傲腾产品可以很好地保持性能一致性，不会出现NAND固态盘用得越久、性能越差的问题。

文章插图

与采用传统NAND闪存的DC P4600SSD相比，傲腾固态盘DC P4800X的延迟更低、一致性更好，寿命长得多，效率更高。

其次是傲腾技术支持位寻址，可以提供超低的延迟，带来更快的传输速度，毕竟AI人工智能技术的应用对存储设备的容量和性能都有很高的要求。相比传统NAND闪存，傲腾产品在性能上有质的提升，形象地比喻，就是将数据的载体从汽车升级为飞机。延迟方面，它最好可以做到微秒级别，虽然和内存DRAM的不到0.1 微秒相比还是存在一定的差距，但是已远远好于NAND闪存的近百微秒的水平。英特尔数据显示傲腾DC固态盘的访问延迟不仅较传统HDD、SATA SSD大幅降低，即便与同样采用NVMe接口的NAND SSD相比，其优势也是非常大的——与采用3D NAND 颗粒的英特尔DC P4600 SSD 相比，傲腾固态盘DC P4800X的读取延迟在不同写压力、不同队列深度下，低了8～63倍。

此外新介质大幅提升了傲腾产品的寿命，英特尔傲腾固态盘可以支持多达60个DWPD（每日全盘写入次数），而大家所熟悉的英特尔P4600、P4610这样的高性能、高寿命的NAND固态盘，只能支持3个DWPD左右，英特尔傲腾固态盘的进步是非常可观的。

文章插图

人工智能技术的数据管道可以通过使用英特尔傲腾持久内存、傲腾固态盘、QLC 3DNAND固态盘，进行合理搭配来提升任务执行的效率，并降低成本、功耗。

同时从AI数据通道中的采集、整理、训练、推理四个阶段，可以看到各阶段对存储的要求是非常高的，需要有持续、一致的吞吐量，以及同样一致、持续、超低的延迟，这些需求正是傲腾产品所擅长的，再加上英特尔QLC 3D NAND SSD所拥有的大容量（已可实现单盘32TB）、高性能特性，通过这样一个完美的结合，可以帮助改善客户对数据的融合，提升软件定义存储解决方案的性能，帮助用户为即将到来的人工智能时代的数据爆发做好相应的准备。

大幅提升效率，英特尔存储方案体现实际价值

文章插图

采用傲腾固态盘后，VMWare vSAN、hadoop、CEPH等各个存储系统的性能都获得了大幅提升。

根据倪锦峰先生介绍，在实际使用中，不少平台改用英特尔傲腾产品后，都获得了很好的效果。如百度在2018年发布了基于英特尔傲腾固态盘加英特尔QLC 3D NAND固态盘的存储解决方案，这一方案大幅提升了AI人工智能、大数据、云计算的存储性能。在AI的一个训练场景中，这一方案相比原来的HDD机械硬盘方案可以获得21倍的性能提升以及96%的延迟下降，同时降低TCO多达60% 。在VMWare vSAN分布式存储系统中，将高性能缓存从NAND PCIe固态盘换成英特尔的傲腾固态盘后，其虚拟机密度提升了60%，同时系统整合率能够提升30%；在hadoop分布式架构中，当用户使用英特尔傲腾固态盘作为hadoop的临时数据缓存后，其吞吐量或性能可以提升40%左右。