「采集」DeepFlow为企业混合云建立统一高效的网络流量采集与分发平台( 二 )


控制器完全控制采集器状态 , 各类采集器具备相同状态机机制 , 各类型的采集器可能处于自检、运行、停止、异常、保护等几种状中 , 其中保护状态 , 是确保采集器工作时 , 平台能对其使用CPU、内存资源使用上限的限定 。 当采集器压力过大时 , 采集器状态将由“运行”切换至“保护”状态 , 以确保不对生产环境产生影响 , 直至重新调整资源配置或处理压力下降 , 切回至“运行”状态 。
此外 , 单一DeepFlow 控制器可管理2000个采集器 , 通常能够满足一个可用区;控制器最大支持50台的规模 , 方案整体可满足10万台采集器统一管理 , 足以应对大型企业私有IT、公有云、容器等网络流量采集需求 。
基于分布式的监控流量处理
不同于集中式后处理的方案 , DeepFlow 采集器具备专利算法的前置计算能力可在采集点对流量进行直接处理 。 众多采集器和控制器共同构建成一个与云网规模一致的分布式流量处理系统 , 大幅减少了分发数据对监控网络和后端分析工具的压力 。 通过各类型的采集器实现流量采集处理抽象层 , 主要对数据包处理能力进行抽象 , 包括过滤、去重、数据包截短、压缩、特征标记等功能 。
高性能网络时序数据订阅服务
对于非原始数据包的数据消费需求 , 平台提供开放的数据订阅方式 。 处理后的包头 , 网络元数据、遥测统计数据通过网络平面汇总至高性能时序数据库中 , 可通过API , 消息队列为其他数据消费平台调用 。
部署
整体方案主要涉及采集器、控制器、高性能时序数据库三部分 , 在完成规划整体方案后 , 可分区域、分资源池按阶段投入建设 , 最终为企业混合云IT基础设施环境构建统一的流量监控管理平台 。 对于已经运行的混合云环境 , 可以在不影响生产环境运行的情况下部署实施 , 网络规划上将 DeepFlow平台所涉及的管理、监控分发平面复用在已有的网络平面中 , 通常可以复用已有的网络管理平面 。 对于整体规划的方案 , 建议对整体混合云规划独立的网络监控平面 , 对混合云的监管流量统一、独立地进行管理 。 根据流量、资源情况整体规划采集器的性能 , DeepFlow 采集器最低可配置1vCPU、128M的计算资源 。
与传统方案比较
采集技术先进:全网采集方案主要围绕 DeepFlow 采集器技术实现 , 采集器以进程形态部署 , 最大程度上避免对生产交换平面的干扰 , 不存在与生产平面交换机流表冲突的风险 , 同时在操作系统上继承进程级保护优势 , 实现整体系统稳定 。
分布式系统:采集到数据包后避免集中处理 , 采用分布式架构 , 采集点分布处理控制器集中管理 。
场景全规模大:整体方案是基于分布式设计模型以及多地域管理 , 可以充分保障资源池规模弹性扩展 , 整体系统可管理 10 万台采集器 , 涵盖虚拟机、容器、公有云资源池 。
可管理性:平台主控制器具备对所有采集器的监控和管理能力 。 通过对接云平台使得操作贴近资源池特性 , 针对云资源的迁移、回收、重新部署等场景做到了实时策略跟随 , 保障采集能力在动态环境下的持续执行 。
数据服务:数据服务是将流量采集与后端平台对接的重要环节 , 完整流量数据包多目的地分发 , 高性能网络时序数据库通过API、ZeroMQ、Kafka等消息队列提供流数据服务 。 同时也将采集与后端各类分析工具解耦 , 避免流量采集器局限在仅为单一工具服务的竖井中 。
总结
DeepFlow 混合云全网监控流量采集与分发解决方案为企业在混合云、云原生等新型IT基础设施环境演进过程中 , 提供完整地、可持续的平台级监控流量管理 , 避免重复投入 , 重复安装 , 解决实际网络监管难题 , 也为企业规划整体运维、安全平台补齐现网流量、流日志这一板块 。 本方案已应用于金融、运营商等客户IT环境中 。
(责任编辑:李显杰 )


推荐阅读