弹性计算Region化部署和跨可用区容灾介绍( 三 )
双可用区同时提供服务:如下图所示 , 有可用区a和可用区b同时提供两套服务 。 SLB同时挂载两个可用区的ECS服务 , 每个可用区的SLB需要将请求分发给两个可用区的ECS 。
本文插图
RDS主备架构:自动同步数据 , 保证两个可用区的数据一致性与及时性 。 正常情况下两可用区服务均访问RDS主节点 。
无状态服务:ECS部署无状态服务 , 所有业务状态存储在数据库中或可从数据库恢复 。
故障恢复方案:当一个可用区发生问题时 , RDS可自动主备切换 。 DNS定时检测SLB状态 , 屏蔽故障可用区 , SLB定时检测ECS服务状态 , 屏蔽故障服务 。 该场景下大部分检测自动实现 , 部分复杂场景下可能需要手动确认故障 , 但是该切换过程迅速 , 可实现秒级切换 。
以上两种跨可用区容灾方式较为实用、常见 , 实现条件均是可用区之间具备网络、电力的物理隔离以及低延迟特点 。
3.跨Region部署
此处仅介绍较为简单的跨Region部署模式 。
本文插图
首先进行地域划分 。 Region化部署完成后 , 每个Region中由可用区容灾的集群保证高可用性 。 但是客户端调用地域时一个Region不能支持所有用户与资源访问 。 因此首先需要根据用户或者资源所属地域进行划分 , 通过DNS服务获取Region化地址 。 该DNS可能是阿里云提供的服务或其他服务 , DNS根据用户或资源返回相应的Region化地址 。
例如某用户访问Region 1 , 则调用Region 1的服务提供相应支持 , 某用户访问Region 2 , 则调用Region 2的服务提供相应支持 。
Region内双可用区容灾 。 地域划分完成后 , 当可用区级别问题扩大到Region级别问题场景下 , 并未提供Region级别容灾能力 , 但是提供了隔离能力 。 例如当Region1发生问题 , 无法切换到Region2进行容灾 , 但是可以实现隔离 , 当Region 1出现问题时Region 2不受影响 , 即能够保存一部分工作服务的能力 。
若需要提供Region级别容灾能力 , 需要实现跨Region的数据同步或复制 , 将一个Region的数据、用户状态等复制到另一个Region , 即可实现Region切换 。 如此将更加复杂 。 Region级别容灾等复杂方案此处不做介绍 , 有兴趣者可自行查阅资料 。
故障影响和恢复 。 用户最终选择的容灾方式、故障隔离级别、故障恢复方案等需要根据自身业务需求、实现难度与故障概率等进行判断 , 选择最适合自身业务的方案 。
综上所述 , 本次分享介绍了Region、可用区的定义、故障隔离与低延迟特性、关键点以及跨可用区容灾等基本概念 。 大家可以利用阿里云的基础架构以及业务相应支持提高服务可用性 , 在一定级别实现容灾 , 提供更好的服务 。
感兴趣的同学可通过学习更加具体的场景下不同跨可用区容灾方案 , 更加深入了解跨Region容灾 。
作者:李钟(谢顿) , 阿里云智能弹性计算高级技术专家 。 2015年7月加入阿里云弹性计算团队 , 目前负责阿里云弹性计算管控架构团队 , 主导弹性计算管控系统架构的优化和演进 。
本文为阿里云原创内容 , 未经允许不得转载 。
推荐阅读
- Intel|Intel超级GPU计算卡太恐怖了!63个小芯片合体、600W功耗
- 黑洞|科学家计算出宇宙中黑洞数量:4000亿亿个
- 三星|准确率98%!三星全球首秀MRAM磁阻内存内计算
- NVIDIA|NVIDIA GTC 2022大会官宣:Hopper计算架构要来了
- 论文|2020中国卓越科技论文近50万篇:计算机等4大领域位列世界第一
- CPU处理器|曦智发布光子计算处理器PACE:1GHz频率、比GPU快数百倍
- 联想|上海交大杨元庆科学计算中心揭牌!算力中国高校第一
- IDC|仅剩十年!IDC称经典计算机将面临来自量子计算机的巨大挑战
- 大学生|5名大学生处置实验室漏水获奖12万:避免我国新一代量子计算机研发延误
- 重污染天气!今起,河北3市启动应急响应!1市中小学、幼儿园弹性教学!