[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘( 三 )


3)最后就是基于 AVS 能力 , 单个 ECS 能够提供百万级 PPS 能力的转发性能 。
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

飞天洛神 2.0:连接全球 , 高性能 , 弹性开放网络
洛神 1.0 支撑了阿里云网络从无到有 , 至规模应用 , 随着阿里云的业务不断增长 , 租户越来越多 , 也带来了越来越多的 VPC 。 租户购买的虚拟机越来越多 , 也代表着网络里的节点越来越多 , 转发性能要求越来越高 。 此外 , 也有越来越多的租户在云上不但仅仅满足简单的连通性要求 , 提出了丰富的业务网元处理诉求 。 例如用户原来在自己的数据中心里面构建了防火墙和 NAT , 或者自己买了一些 Load balancer 的设备 , 现在业务系统搬到阿里云上之后 , 希望原来的网络功能继续在阿里云使用 。
在此背景下 , 洛神平台升级到 2.0 。 如图所示 , 洛神 2.0 提供了更加丰富的转发网元 , 既有神龙 MOC 卡 , 还有专用可编程芯片以及通用 ECS;同时洛神 2.0 新构建了一个 NFV 平台 , 支持业务网元不再依赖传统 X86 服务器 , 直接基于 NFV 平台构建 , 例如 NAT、SLB、VPN 产品 , 同时 NFV 平台支持开放能力 , 第三方的网元也可以基于 NFV 平台部署 , 通过 VPC 内和 VPC 间的访问 。
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

图 6 洛神 2.0 架构图
洛神 2.0 的基础是阿里云遍布全球的网络基础设施和 Region 数据中心的基础设施 。 目前在全球有 20 个 Region、61 个可用区 , 100 多个 POP 节点 。 当国内用户需要出海或者国外的用户需要进中国的时候 , 不再需要自己购买很多物理形态的设备和网络连接 , 并花很长的时间搭建出网络基础设施 。 基于洛神 2.0 , 阿里云的网络产品就可以分钟内快速构建出运营网络、基础设施 。
洛神 2.0 的 AVS 和业务网关都进行了架构跨越式升级 , AVS 基于软硬件一体化方式 , 使用神龙 MOC 卡实现快速转发 , 转发性能提升数倍 , 达到千万 PPS 。
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

图 7 软硬件一体的新一代 AVS
洛神 2.0 另一个跨越式架构升级是提供新一代的 NFV 平台 , 通过网元逻辑部署在通用 ECS 上 , 提供弹性和开放能力 。 当第三方厂商将其应用移植到阿里云之后 , 就可以在阿里云市场里对阿里云的租户进行售卖和提供能力 , 形成了一个非常好的生态:
1)网元可以给大量租户使用;
2)客户的白天流量很大 , 半夜的流量很少时 , 阿里云会自动帮你缩容 。
如果说在某个时刻点突然碰到高峰 , 阿里云会自动协助扩容 , 也就意味着第三方的网元利用洛神 NFV 平台 , 不仅可以开放部署 , 还可以享受到自动的弹性 。
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

图 8 洛神 2.0 NFV 开放平台架构
[阿里巴巴集团]一群阿里人如何用 10 年自研洛神云网络平台?技术架构演进全揭秘
本文插图

飞天洛神的未来
洛神 2.0 中 , 还有一个齐天智能网络平台 , 是未来演进的重要能力 , 未来的网络将是一个智能化的网络 。 当客户业务部署在阿里云的时候 , 如果网络发生波动或故障 , 需要非常快速的排查问题 , 因为网络是属于最底层的服务 , 当业务不能对外提供服务的时候 , 首先会想到网络问题 。 这个时候网络可能是正常的 , 有可能是上层业务的问题 。 如何让上层业务团队快速定界问题所在 , 如何让网络的管理员能快速自证清白 , 提升未来生产运营服务的效率 , 就这是未来智能化网络需要解决的问题 。


推荐阅读