cpu故障怎么办,cpu故障蓝屏怎么解决

CPU使用率高
故障处理步骤

  1. 检查CPU使用率是否偏高 。
  2. 多次执行命令display cpu查看设备CPU使用率 , 确认是否持续偏高 。
  3. 如果CPU平均使用率(“System CPU Using Percentage”字段)持续高于75%,或者单个CPU的使用率(“Current”字段)持续高于75%,那么可以确认CPU使用率偏高 。<HUAWEI> display cpu CPU utilization statistics at 2016-11-02 06:16:36 772 ms System CPU Using Percentage : 6% CPU utilization for five seconds: 5%, one minute: 5%, five minutes: 5%. Max CPU Usage : 36% Max CPU Usage Stat. Time : 2016-11-01 12:39:45 908 ms State: Non-overload Overload threshold: 90%, Overload clear threshold: 75%, Duration: 480s --------------------------- ServiceName UseRate --------------------------- SYSTEM 6% AAA 0% ...... --------------------------- CPU Usage Details ---------------------------------------------------------------- CPU Current FiveSec OneMin FiveMin Max MaxTime ---------------------------------------------------------------- cpu0 10% 9% 9% 9% 48% 2016-11-01 12:39:28 cpu1 4% 3% 3% 3% 51% 2016-11-01 12:39:28 cpu2 4% 4% 3% 3% 56% 2016-11-01 12:39:18 cpu3 6% 6% 5% 5% 48% 2016-11-01 12:39:28 ----------------------------------------------------------------
  4. 设备CPU使用率过高常常会导致业务异常,例如BGP震荡、VRRP频繁切换,甚至用户无法登录交换机 。但某些情况下,CPU使用率高并不会导致网络问题 。例如交换机在某一时刻集中读取光模块信息、瞬间流量增多等情况 , 导致CPU使用率暂时性偏高的现象是正常的、可接受的 。所以不能简单的将CPU使用率高当作故障处理,只有当设备长时间不能正常处理业务时,才需要定位是否由于CPU使用率高而引起的 。
  5. 如下一些场景可能导致CPU使用率高,属于正常现象,而非故障 。如果过一段时间,CPU使用率又恢复到正常值,则无需处理:
  6. 交换机单板刚启动 。
  7. 网管系统在频繁操作交换机 。
  8. 交换机在执行copy flash:/或输出信息量大、执行时间长的命令 , 如debugging、display diagnostic-information命令 。
  9. 批量读取光模块信息(执行命令display interface transceiver或者在网管读取光模块信息) 。
  10. 批量配置命令下发(一键式提交大量配置,或通过控制器、脚本批量下发命令) 。
  11. 交换机在进行生成树STP的计算 。
  12. 对于MSTP,CPU使用率同实例数和活跃端口数成正比 。对于VBST,由于每个VLAN独立运行一个实例,因此在相同VLAN和端口数目下,VBST比MSTP占用更多的CPU资源 。
  13. 交换机接收到大量路由更新信息,大规模更新路由表 。
  14. 当接收到路由更新消息时,设备需占用CPU资源将路由信息更新到转发面 。对于堆叠系统,路由信息还需要同步到其他成员交换机 。
  15. 在路由表更新过程中影响CPU使用率大小的因素有:
  16. 路由表项的规模 。
  17. 更新的频率 。
  18. 接收更新的路由协议进程数 。
  19. 堆叠系统成员交换机数量 。
  20. 如下一些场景 , 可能导致CPU持续偏高,需要关注处理:
  21. 以太网广播风暴(ARP、VRRP、OSPF) 。
  22. 大量协议报文上送CPU(如ARP-Miss、TTL-Expired、FIB-Hit) 。
  23. SSH或Telnet、SNMP连接攻击 。
  24. 大量端口频繁Up/Down 。
  25. 检查各服务的CPU使用率是否异常 。
  26. 通过命令display cpu和display system service [


      推荐阅读