行业互联网|《数据安全能力成熟度模型》实践指南:网络可用性管理( 三 )


⑦网络故障消除后 , 由网络可用性管理部门向领导小组宣布网络故障应急期结束 , 并予以公告 , 同时预案终止 。
技术工具简述
数据在网络传输过程中依赖网络的可用性 , 一旦发生网络故障或者瘫痪 , 数据传输也会受到影响甚至中断 。 网络可用性管理过程域的设定 , 即要求建设高可用性的网络 , 从而保证数据传输过程的稳定性 。 所谓网络可用性并不是单纯的网络设备、服务器或节点的通断 , 而是一种综合管理信息 , 以反映支持业务的网络是否具有业务所要求的可用性 。 网络系统的可用性包括:链路的可用性 , 交换节点的可用性(如交换机和路由器) , 主机系统的可用性 , 网络拓扑结构的可用性 , 电源的可用性以及配置的可用性等 。 但由于网络节点与网络链路的故障无法完全避免 , 因此构建高可用性网络的基础就是要实现快速故障发现和快速故障恢复 , 在这个过程中涉及相关的检测手段及冗余措施 。
目前网络可用性的主要考核指标公式可参考以下
网络可用性的计算公式:

行业互联网|《数据安全能力成熟度模型》实践指南:网络可用性管理
本文插图


行业互联网|《数据安全能力成熟度模型》实践指南:网络可用性管理
本文插图

从上述公式我们可以看出 , 为了提高网络可用性 , 我们需要尽量的提高平均故障间隔时间(MTBF) , 即保证网络在规定时间内不出故障或少出故障 , 主要的措施有避错和容错机制 。 同时降低平均修复时间(MTTR) , 即网络出了故障要能迅速修复 , 主要措施时快速检错和快速排错(恢复) 。 因此主要有4方面技术方法来提高网络可用性 。
1)避错措施
避错就是通过改进硬件的制造工艺和设计 , 选择技术成熟可靠的软硬件等策略来防止网络系统的错误产生 , 从而提高网络的可靠性 , 并通过可靠性来提高网络的可用性 。
避错方法包括各种硬件、软件和管理措施 。
硬件避错方法是通过改进硬件的制造工艺和设计 , 防止错误的产生 , 包括网络中电气系统的避错、网络设备的避错、服务器的避错和网络中传输媒体的避错等 。
软件避错方法包括形式说明、过程管理、软件测试和程序设计技术选择等 , 例如网络应用系统的避错和成熟可靠的网络操作系统的使用等 。
管理避错方法要求网络运行管理要严格按照规范进行 , 包括制度建设、任务分配、设备标识、规范文档记录、各种软硬件日常维护和网络安全管理标准等 , 例如管理信息存储的避错、网络中网络结构选择的避错和日常网络管理的避错等
2)容错机制
避错方法可以提高网络可靠性 , 但无论多么可靠的系统都会出现系统失效 , 光靠避错方法不能完全解决系统的可靠性 , 因此通过容错技术 , 外加冗余资源消除单点故障使系统在单点故障中仍能正常工作 。 冗余资源主要包含三块:硬件冗余、软件冗余、路由冗余 。
3)快速检错
实现快速检错包括故障检测和故障诊断两方面 , 故障检测的作用是确定故障是否存在 , 故障诊断的作用是确定故障的位置 。 一般快速检错是从故障现象出发 , 以网络诊断工具为手段获取诊断信息 , 确定网络故障点 , 查找问题的根源具体包括:
①自动检错而不是人工检错可以更快提高检错的速度;
②借助线路检测工具(如线缆测试仪、时间域反射计)可以加快线路故障的检错速度;
③利用网络管理系统专门的管理进程不断地检测路由器的关键数据并及时给出报警可以加快路由器故障的检测速度;
④通过工具自动监视主机流量、扫描主机端口和服务来检测主机的异常 , 可以加快主机故障的检测速度;
⑤利用网络测试仪可以自动定位网络故障源 , 找出故障点并显示其网络相关信息 , 从而加快逻辑故障的检测速度;


推荐阅读