高通量|“超算”、“云计算”与“信息高铁”,各有何不同

全球最大的云计算服务商亚马逊Amazon , 为了应对峰值时期的数据处理 , 储备的数据中心等设备是平常使用的10倍 , 且真正运行率只有30% 。 这样高成本、低效率的选择源于一个现实:现有高性能计算机系统在解决单个并行计算任务时得心应手 , 但在规模数据的实时处理上 , 显得先天不足 。
8月14日-16日 , 在南京江宁举办的第四届未来网络发展大会上 , 中国工程院院士李国杰举例表示 , 目前中科院计算技术研究所正在研究建设的信息高铁 , 正是希望解决上述问题 , 兼顾高并发、强实时、确定性、内生安全等目标 。
信息高铁是信息基础设施的一种 。 中国工程院孙凝晖院士向包括澎湃新闻在内的媒体介绍 , 信息基础设施发展可分为三个阶段 , 1.0阶段以超算中心为代表 , 追求速度 , 算得快;2.0阶段以云计算中心为代表 , 追求共享 , 算的省 。 而3.0阶段 , 就是信息高铁 , 追求高通量 , 即算得多 。
孙凝晖认为 , 速度、准时、通量(即单位时间内通过的数据)是信息基础设施的三大目标 。 但前两个阶段的超算中心和云计算中心 , 无法做到三者兼顾:1.0阶段算得快 , 但是吞吐小;2.0阶段吞吐高 , 但延迟不确定 , 特别是在高载荷情况下、难准时 , 难控时 。
用交通工具做类比 , 1.0阶段超算中心对应的是飞机——速度快、完成时间短 。 2.0阶段云计算中心的核心是面对多样化的计算需求实现算得省 , 对应交通工具中的汽车——汽车在绝大部分出行场景中可以达到成本低和利用率高的目的 。 然而飞机和汽车都存在一个明显的局限性:在流量较低的情况下 , 两者都能确保较好的服务质量;但是 , 一旦交通负载快速上升时 , 就容易造成拥塞 , 导致完成时间急剧增长 , 难以保障服务质量 。
高铁 , 则是目前交通工具中 , 在高负载、高利用率前提下依然能有效保障用户服务质量的最佳方案 。
孙凝晖表示 , 类似的 , 3.0阶段的信息高铁就是要突破上述局限性 , 在高负载的情况下实现算得多 。 这也是为何这种以高通量计算机为核心的算力综合实验场被命名为信息高铁的原因 。
【高通量|“超算”、“云计算”与“信息高铁”,各有何不同】中国科学院计算技术研究所正在开展高通量计算中心的建设 , 按照规划 , 第一步将先建设1-2个高通量计算的示范中心 , 然后在全国重点城市开展高通量计算中心建设 , 逐步实现高通量计算技术与新兴产业的无缝融合 。 2019年7月 , 第一个城市高通量计算中心落地江苏省盐城市 。 盐城高通量计算中心将重点支持高通量视频处理和人工智能加速 , 作为服务盐城智能产业升级的核心公共研发平台 。


    推荐阅读