使用 NetQ 排除网络故障


使用 NetQ 排除网络故障

文章插图
 
EVPN 已成为现代数据中心架构的标准解决方案 。对于终端用户来说 , 受益于基于 BGP 的控制平面所具有的稳定性 , EVPN 提供了扩展其广播域的灵活性 。但这些增加的益处是以提高配置的复杂性为代价的 。
 
当前所面对的不再是相对固定、简单 , 可以通过维护人员直观分析来发现错误的网络配置 。真正的生产性 EVPN 配置可能包括多个深度嵌套结构 , 而且随网络中的租户数量成比例增长 。
 
EVPN 配置复杂性可以且必须通过适当的自动化解决方案予以解决 , 这可以减少人为出错的可能性 , 而 NVIDIA Cumulus linux 正是解决该问题的合适解决方案 。但仅有自动化还不够 , 错误仍然可以通过数据源引入系统 , 例如配置管理数据库(CMDB)的人为错误 。
 
可观察性的重要性
 
这就是为什么对于任何具有合理复杂程度的基础设施 , 用户应该有办法来采集各类日志、指标 , 并且调试、输出、汇总、关联和处理这些信息 , 从而尝试推断系统的内部状态 。实现这一点的能力通常被称为系统的“可观察性” , 而且随着底层基础设施复杂性的增加 , 它正变得日益重要 。在 CNCF 云原生环境 中 , “可观察性和分析”部分不断增长的项目数量已证明了这一全行业趋势 。对此 , NVIDIA 也持同样的观点 。
 
使用 NetQ 排除网络故障

文章插图
 


    推荐阅读