存储|浪潮存储登顶SPC-1 看IOPS性能真功夫

_原题为 浪潮存储登顶SPC-1 看IOPS性能真功夫
日前 , 存储性能委员会(Storage Performance Council,简称SPC)公布了最新的SPC-1基准评测报告 , 浪潮存储AS5500G5以超330万IOPS(每秒读写操作的次数)、0.387ms时延的评测值 , 创造了8控存储产品性能的全球最高成绩 。 这是继16控存储性能领跑之后 , 浪潮存储在8控领域再次突破 , 成为唯一在两大存储主流市场夺冠的厂商 。
8控和16控存储是业界的主流产品 , 主要覆盖15K–100K美元的市场 , 占整体存储市场份额的60%左右 。 浪潮存储在这一领域的性能优势 , 将提升浪潮存储在主流市场的产品竞争力 。
本次 , 浪潮存储8控性能夺冠 , 应该说 , 这是浪潮存储这些年苦练内功的印证 。 浪潮存储坚持了近二十年的技术创新和积累 , 这方面完全没有捷径可走 , 不仅在硬件设计上下苦功和创新 , 比如多控之间的信息同步链路 , 率先采用基于Optane介质的缓存层等等 , 更关键的是在软件层面的深层优化 , 比如用户态驱动 , QoS , 智能感知等等 。
存储|浪潮存储登顶SPC-1 看IOPS性能真功夫
文章图片

存储性能委员会公布最新的SPC-1基准评测数据
【存储|浪潮存储登顶SPC-1 看IOPS性能真功夫】“综合性能指数”
大家都知道IOPS越高越好 , 但是却少有人深刻的理解IOPS底层的生成机制 。 有两个因素对IOPS有加成作用 , 或者说 , 存储系统终极目标就是这两个参数:
1.处理单个I/O耗费的时间(延迟)
2.有多少个并发线程在处理I/O(并发)
显而易见 , 并发数/延迟=IOPS 。 当然 , 现实中的模型远非如此简单 , 现实中一般采用异构处理流水线方式处理I/O , 也就是流水线中的模块处理的是不同I/O的同一个子步骤 , 与此相比还有同构流水线 ,。 一个理想的提升流水线吞吐量的原则 , 就是将每一步的处理延迟做到相等且最小 , 或者将慢速处理步骤并行化 。
存储|浪潮存储登顶SPC-1 看IOPS性能真功夫
文章图片

浪潮存储AS5500G5的IOPS和延时
根据并发数/延迟=IOPS , 并发数越高越好 , 延迟越低越好 。 前者是可以很容易的实现的 , 只需要采用高核心数CPU , 以及软件的并行化优化 , 就可以相对较为轻松的达到目的 。 但是对于延迟的优化 , 可就是难上加难了 , 这就像公路 , 同时修两个车道把路拓宽 , 简单 , 但是想把路修成高速路 , 其耗费的成本就会很高 , 对于I/O路径 , 也是一样 , 优化I/O处理速度的一些办法包括砍掉那些附加软件功能 , 重写内核 , 采用用户态驱动绕过内核 , 等等 , 这里面哪一样都不简单 。
不妨思考一下 , 既然这样 , 存储厂商为了实现高IOPS , 是否可以疯狂提升并发数 , 而对延迟不闻不问呢?这样做IOPS确实可以上来 , 但是只会在压力测试的时候 , 通过将队列深度提升以满足这些并发线程的胃口 , 但是延迟并不会有降低 。
在实际场景下 , 相当一部分应用根本不会以高并发异步I/O模式工作 , 这类应用发出的都是同步I/O , 以至于底层队列根本压不满 , 存储系统的高并发度根本无用武之地 , 导致实际性能惨不忍睹 。
那么 , 既然IOPS越高越好 , 延迟越低越好 , 是否可以用IOPS与Latency的比值来断定一款存储系统的真实能力呢?也不客观 , 因为厂商可以只优化其中一个参数来实现高比值 。
我们认为 , 应该用一种横向比较的比值作为性能指标 。 比如就拿本次登顶8控SPC1的浪潮 , 和排第二的产品相对比 。 IOPS越高越好 , 延迟越低越好 , 那就用浪潮IOPS/第二名产品IOPS=I , 浪潮延迟/第二名产品延迟=L , 然后得出I/L=1.828
1.828这个比值 , 可以体现出厂商在提升并发度同时优化I/O路径降低延迟方面做的工作的一个均衡价值 。 也可以这么理解 , 浪潮8控AS5500G5相比第二名8控产品 , 在综合I/O性能方面为后者的1.8倍 。
如果以某个标准模型性能作为参考 , 算出每个厂商与这个标准值的比值 , 就可以得出各个厂商的一个标准指数 , 我们不妨将这个指数称之为“综合性能指数” 。
新指标对业务应用的意义
延迟对性能的影响几乎深入到各个业务场景 。 例如国有六大行 , 每天需要处理超过1亿笔交易 , 这些都对承载核心业务的存储系统性能提出了巨大的挑战 , 通常情况下 , 亿级规模用户对存储性能要求就要数十万级别IOPS , 同时时延需要保持在1ms以下 , 而核心数据库和报表业务对IOPS与时延要求会更高 。
再看银行数字化营销 , 针对于银行智能客服、智能投顾、智能风控、智能营销等智能业务场景 , 涉及到AI的某些特定模型 , 对存储系统性能要求极为苛刻 , 尤其是IOPS和时延性能指标 。 例如 , 在训练阶段 , 以大量随机小IO为主 , 要求存储具备极强的IO并发处理能力;在推理阶段 , 要求存储时延低 , 能快速响应 。
未来以交易所、理财机构、保险机构为主的金融机构会面临巨大的IT架构压力 , 其中对存储系统最大的挑战就是IOPS处理能力和控制时延能力 。 以股票交易为例 , 交易途中 , 存储系统需要高并发接收和处理成百万乃至上千万亿的交易数据时 , 如果并发能力差、时延高 , 将导致买卖操作的卡顿 , 引发股民情绪波动 , 影响满意度 , 严重的会导致用户流失 。


推荐阅读