独家对话阿里云张建锋:云计算接近进入下一个时代|钛媒体深度


独家对话阿里云张建锋:云计算接近进入下一个时代|钛媒体深度

文章插图
“互联网和网络科学的快速发展使人产生了一个具有误导性的印象,即社会网络悬浮在空间内,似乎不再被重力和物理世界所累 。” 和阿里云智能总裁张建锋(花名:行癫)的沟通,很快让我脑子里想起了杰弗里·韦斯特在他的奇书《规模:复杂世界的简单法则》中的这句话 。
因为他的谈话,焦点都集中于如何用最小的计算和能源消耗,去更高效管理迅速膨胀的数据中心规模——截止到目前为止,阿里云在四大洲的27个国家和地区、84个可用区、2800个网络节点,运营着上百万台服务器,服务着全球400多万客户 。他非常清楚,这个发展迅速的巨量规模的服务器集群,会带来超乎想象的管理难度和成本 。
同时,巨量的规模也带给阿里云利好的消息 。5月26日,阿里发布了2022财年的业绩报表,云业务同比增长23%,全年收入在抵销跨分部交易前和抵销后分别为1001.8亿元和745.68亿元,并且实现11.46亿的盈利数据 。这是成立13年来首次实现年度盈利,实现了历史性突破 。
“规模 。”张建锋对于盈利的解释非常简短,因为只有足够大的规模才能摊销掉庞大的研发成本 。所以对阿里云来说,不断投入研发,用先进的技术手段对抗、消解云计算规模扩张带来的挑战和成本,就是赢得竞争的不二法门 。
“过去我们从分布式到资源池化,都是以CPU为中心的云时代,事实上也完成了非常多的一些创新,特别是像资源池化等等 。但是随着数据的增长、随着规模的变大、随着延迟的要求越来越高,需要呼唤一个全新的一个技术体系去满足下一阶段的要求 。”张建锋说,为此他给2022年的云峰会上提了一个新的主题——Back to Basic 。如果最近出差的话,会看到机场上阿里云的广告,也回归了最初的版本——为了无法计算的价值 。
在云峰会上,阿里云发布了下一代的云计算的基础设施核心CIPU 。CIPU的说法直接映射于PC时代的CPU,意为云时代的IDC内部的处理核心 。在这个全新的架构下,计算、存储和网络接入CIPU,资源即可被高效的云化管理 。通过CIPU的硬件加速,实现超高的性能 。他举了一个例子,使用阿里云的盘古存储协同CIPU、盘古高密存储服务器和洛神Solar-RDMA网络,可以让延迟降低到30微秒,这意味着访问存储在远端的数据,延迟比访问本地的硬盘还低 。
3年前张建锋刚刚接手阿里云的时候,我们第一次见面,他提出阿里云要“被集成”,这个说法的核心就是推动阿里云从提供资源向提供能力转换 。但是那时对于如何被集成、如何定义可以被封装的能力,还有很多模糊的地方 。3年之后,他提出Back to Basic,再次把技术放在了首要战略位置,也再次把向用户提供能力作为努力的方向 。但这一次,用户和阿里云对于能力的定义,都清晰了很多 。某种意义上讲,这也是阿里云以及整个中国云计算市场的螺旋式上升 。
“云计算越来越接近进入下一个时代了——全新的架构定义,全新的软件界面,硬件加速 。我们错过了PC时代,但云这个时代大家起步是一样的 。大家在重新定义云的结构的窗口期,如果我们定义好了,中国就可以在下一代的技术时代有自己的一席之地 。”张建锋认为,新一代的技术架构,会催生新一代的云原生应用,也是中国软件和企业数字化的巨大机会 。所以,阿里云一方面会向下深耕技术,另一方面,也会加大气力推动生态的建设 。
在云峰会之前,张建锋和钛媒体联合创始人刘湘明就云计算的发展以及生态建立的话题,做了一次深入交流 。

独家对话阿里云张建锋:云计算接近进入下一个时代|钛媒体深度

文章插图
下文为对话实录,有删节 。
云计算的下一个时代
张建锋:其实我们要做的东西,本来就是更底层一点,但为了客户能用起来,我们已经自己用业务翻译了一层,搞各种数字化的项目,结果这个越搞越厚了,离云越来越远 。
钛媒体:其实大家都面临同样的问题,现在提这个真的挺好,正好市场大环境大家都在减速,原来都捆在战车上,谁也不能慢下来 。
现在真是可以回头看看,很多原来来不及思考的本质 。对于过去的云计算,你觉得有哪些判断是有点失真的,偏离了它的本质?
张建锋:云本身在发展,特别是这两年发展的非常快 。最基础的层面,客户用了云,肯定要比原来的传统IT更灵活,更安全更高性价比,这是个基本的要素 。
如今的云计算我们认为面临着几大挑战:第一是计算和网络传输的时延大 。以前可能不明显,但是随着我们的体系结构越来越分布式了之后,那意味着我们的一个大型的应用会分散在多个子系统去部署,这些系统之间需要高速地去互联、需要非常低的延时;第二,因为随着大数据应用的不断的增长,使得IDC内部的东西向流量越来越大,所以我们需要来满足这个流量增大之后的网络的一些新的要求;第三,我们现在的系统规模越来越大、越来越复杂,所以我们需要解决超大规模基础设施的复杂管理问题,也需要解决在云内部的超大应用、复杂应用的管理问题 。


推荐阅读