|全年产品可用率99.9985%,微众银行智能运维首战告捷

近日,由清华大学、中国移动、中国计算机协会互联网专业委员会主办的第三届国际智能运维(AIOps)挑战赛决赛在杭州举行 。 来自全国产学研各界的141个企业与高校团队、673名选手报名参赛,经过五个多月的激烈角逐,微众银行智能运维团队首次参赛便挺进六强,最终获得全国季军 。

|全年产品可用率99.9985%,微众银行智能运维首战告捷
文章图片

据了解,国际智能运维(AIOps)挑战赛已经举行两届,旨在加强工业界与学术界的交流,促进AIOps技术的迅速发展和落地 。 此次挑战赛的课题是“微服务”应用系统的故障排查,是微众银行过去两年在智能化领域主要研究的方向 。 微众银行基于自主可控的分布式架构搭建,运维该架构最大的挑战便是微服务的稳定运行 。 当应用系统异常时,如何快速定位及恢复,一直是运维人员亟待解决的首要问题 。 在此次复赛阶段,各参赛团队需每晚22点上传运维数据,在最短时间提交检测结果,对参赛队伍的检测速度和检测准确率都提出了极大挑战 。 微众银行的代表团队最快3秒提交结果,真正做到了秒级识别和秒级定位,这也是对其两年来智能运维系统建设的成果检验 。
作为首家互联网银行,微众银行自上线之初即承担着如何降低IT运维成本、降低金融服务门槛以便让更广泛的用户享受到普惠金融服务的使命,而利用人工智能、大数据等创新科技提升智能运维水平,正是提升运维效率、降低运维成本的有效手段 。
据了解,2018年微众银行开始应用机器学习算法进行运维智能化建设 。 借助智能化运维手段,微众银行实现了由机器人管家负责资源调配,仅需不超过10名运维人员就可以管理万余台服务器,大幅度降低IT运维成本,减少人为可能造成的失误;运用神经网络技术,通过系统自动学习,无需人工介入即可实时精确的发现指标异动,减少95%的监控配置工作量;应用机器学习、神经网络与知识图谱技术,大幅提升异常检测准确率,异常识别准确率提升至96%;应用异常根因定位(RCA)方法论,在异常发生的1分钟内根因定位系统即可给出异常根因的方向和结论,根因定位准确率高于80%,并自动通知运维人员,大幅减少异常处置时间,平均通报时长仅12.6分钟 。 在疫情期间,异常根因定位更支持运维团队实现了部分事件手机远程在线处理,有效提升了运维效率 。
智能化的运维系统有力保障了银行信息系统的稳定运行、大大降低了运维成本 。 2019年,微众银行有效客户数逾2亿,单日交易笔数近6亿,消息峰值 24万/秒,达到国有大型银行同等规模水平 。 在如此高并发高交易压力下,全年产品综合可用率达99.9985% 。 得益于系统的稳定性和高可用,2019年微众银行户均IT运维成本仅3.5元,约为国内银行业界的10% 。
【|全年产品可用率99.9985%,微众银行智能运维首战告捷】在数字技术日新月异的当今,运维智能化重要性愈发成为工业界的共识,未来,微众银行将会继续着力推进AIOps落地探索和实践,为普惠金融业务的进一步发展提供可靠的基础支撑 。


    推荐阅读