无人科技|华为AIOps,让“智慧”在网络中流淌( 二 )



无人科技|华为AIOps,让“智慧”在网络中流淌
本文插图

总体来看 , 华为AIOps使能服务的核心竞争力集中四个方面:
首先 , AI原子能力解决了AI场景方案可以快速复制的难题 , 这种能力越丰富 , 可以解决的场景化问题就越多 。
华为就提供了丰富的AIOps原子能力 , 可以覆盖运维全流程 , 包括预测、检测 , 定位、执行 。 同时 , 原子能力库支持流量预测 , 故障预测 , KPI 异常检测 , 日志异常检测 , CHR 异常检测 , 异常关联分析 , 事件聚合 , 根因定位等20+原子能力 。
其次 , 组合编排与DevOps能力 , 可以将AI原子能力快速串联 , 使得AIOps能力做到不断扩展 。
华为通过组合编排功能 , 让使用者可选择业务场景所需的AIOps原子能力 , 通过可视化方式完成流程串接 , 并进行业务泛化参数配置 , 包括数据接入方式 , 模型参数 , 内置电信领域泛化参数 , 事件通知方式、可视化Dashboard 等配置 。 同时 , 这些能力还支持可视化编排或接口调用方式实现 。
第三 , AI训练和推理 , 依靠大量有效的数据 , 而电信网络的数据来源则非常的复杂 , 甚至包括异构数据 , 所以满足通用数据源的要求 , 也是一个重要的考量因素 。
华为的解决方案 , 做到了支持电信领域通用数据源 , 如KPI 、告警、日志、xDR 等电信领域主流运维数据 。 同时 , 支持Kafka , 数据库 , 文件系统 , Restful 等电信运维系统的主流数据对接方式 。 AIOps 使能服务提供通用的数据源对接和标准化数据治理组件 , 通过配置项快速建立与运维系统的数据源连接 , 通过SDK将不同的数据类型和格式治理成标准化的AIOps 原子能力输入集 , 用于模型训练和推理 。
第四 , 在场景组合服务方面 , 要实现快速的接入运维流程 , 就要将典型的场景进行预集成 。
华为AIOps使能服务作为自动驾驶网络的组成部分 , 目前已经和AUTIN/NCE/MAE等网络管控析单元、智能运维解决方案等系统的预集成 。 围绕运维全流程提供预制的典型场景组合应用 , 通过AI 特性或者服务方式快速接入运维流程 。

无人科技|华为AIOps,让“智慧”在网络中流淌
本文插图

不难发现 , AIOps使能服务 , 融合了AI的技术优势与华为在电信领域的专业优势 , 为运维系统的智能化演进提供AIOps平台能力支持 , 以四大能力集 , 解决了电信网络在AIOps智能运维上的所有难题 。 沉入场景化 , 击破行业痛点
华为之所以总能能成为电信用户的首选 , 是因为华为总是能够站在用户的视角去看待需求 , 华为甚至可以引导用户 , 主动去发现问题 , 并提前帮用户解决问题 。
例如在某地市运营商的运维实践当中 , 华为帮助其提前5小时发现故障 , 保障了地市用户业务体验不间断 , 降低了业务损失 。 华为还帮助某能源企业实现分钟级故障根因定位和分析 , 提升网络运维效率4-5倍 。
这些看得见的成绩 , 一方面是华为沉入行业 , 对用户需求的深刻理解 , 另一方面则是华为AIOps使能服务 , 在电信网络的几大关键场景中 , 已经具备了完善的能力 。
如在通信网络中 , 通过KPI来预测和检测网络问题是最普遍的场景 。 NAIE融合了电信领域的运维业务特点 , 提供单指标/多指标检测 , 异常原因关联分析 , 模型的自学习调优等关键能力 。 目前已经用在核心网 , 无线 , 数通等不同业务领域 。
告警根因定位则是另一个典型的场景 , 在异常发生后 , 准确的将多维度的异常 , 告警等事件进行汇聚和准确定位 , 过去主要依赖专家经验或者手工分析 。 而NAIE AIOps通过AI算法 , 支持多类异常/告警等事件的智能故障定位 , 自动实现时间 , 拓扑和故障传播图等维度的事件汇聚和根因定位 , 大幅提高了运维效率 。


推荐阅读