|华为云地协同,是网络AI规模化复制的关键( 二 )


那么 , 什么是云地协同?
按照官方的定义 , 云地协同是指:云端和地端一起协作完成数据样本上云 , 模型状态管理 , 模型重训练 , 模型/ 知识下发、择优更新等一系列的闭环任务 , 同时把云端汇集的全局网络知识经验、全量数据训练得到的高精度模型 , 持续注入地端 , 让电信网络能够进行智能的迭代升级 , 变得越来越聪明 。
简单的理解 , 这种模式其实就是把数据服务和模型训练这些较“重”的工作放在云上去做处理 , 然通过将一些较“轻”的本地模型推理放在边缘设备上 , 一重一轻 , 兼顾了高质量的同时做到了及时性 。
|华为云地协同,是网络AI规模化复制的关键
本文插图

也许很多人会有这样的疑问 , 云地协同将AI的训练与推理进行了拆分 , 这是不是本身对网络传输的要求就会更高 。 没错 , 云地协同最关键的一点就是要保证云端和地端要有快速的通道 。 同时 , 从地端到云端 , 信息可以从运营商上传到云端 , 而从云端到地端 , 可以下发新的模型 。
在这个过程当中 , 地端会对模型进行监控和评估 , 而云端会存储超过3个月以上周期的样本生成相比本地更高质量的模型 。 同时 , 云端通过汇集和沉淀专家经验和产品知识 , 运用知识图谱等技术 , 形成 “网络知识库” , 这些知识又可以持续注入地端 , 通过云与地之间的相互印证不断优化 , 达到提升网络智能水平的目的 。
从场景化与用户视角 , 解决网络AI规模复制难题
我们知道 , 任何技术只有在场景中发挥价值 , 才是商业化成功的基础 , 网络AI化如此 , 云地协同亦如此 。
所以 , 针对电信网络的不同应用场景 , 华为云地协同在实际应用部署时也提供了不同的模式 。
比如 , 核心网变更在线机器值守这种模型简单 , 算法结构稳定的场景 。 华为采取了云端进行初始模型的训练 , 运行态由地端根据新增的样本进行在线学习 , 持续保持模型的精度;
再比如 , 无线KPI异常检测这一类模型相对复杂的场景 , 华为则在云端进行模型的分发 , 然后在地端根据新增样本进行在线学习;而如IP RAN/PTN智能告警 , DC PUE优化等模型复杂、需要用到华为云端高质量标注数据 , 知识图谱以及仿真等知识能力进行模型优化的场景 , 华为则利用云地实时协同 , 让模型可以自动化演进 。
|华为云地协同,是网络AI规模化复制的关键
本文插图

从效率的角度 , 云地协同可以提升模型泛化能力和训练效率 , 同时通过构建网络知识库 , 会提升故障运维辅助效率 。 而从安全的角度 , 因为建立了云端仿真 , 所以模型及业务验证安全高效 , 同时也会提升模型版本管理效率 , 加速AI特性更新 。
不难总结 , 云地协同可以实现一点生效 , 全网复制 , AI的特性在一个局点成功实施后 , 快速 的形成知识和经验 , 在其他局点进行复制 , 实现在全网规模应用 。
客观地说 , 云地协同模式 , 是华为在网络AI化的趋势中 , 通过具体应用场景的需求 , 逆推出来的成果 , 其对电信网络智能化升级的意义深远 。


推荐阅读