云科技时代|微软的软件工程现代化转型( 三 )


2.1 投资现代软件工程
CSEO 建立了强大的基础 , 具备用于服务组合管理的通用工具和平台 , 并将这些数据与事件管理、遥测和常见指标仪表板(如事件运行状况和合规性仪表板)集成在一起 , 每月在 CSEO 全服务回顾中审核 。 此基础使CSEO能够通过着重于安全性和合规性等基本能力 , 进而从客户的角度实施更好的事件管理和服务健康 , 来推动改善CSEO服务总体体验的通用做法 。 在此基础上 , CSEO对现代软件工程实践和技术的持续投资 , 反映了微软的愿景并支持微软的文化变革 。 CSEO投资的三个主要支柱是:痴迷客户、快速交付、软件工程生产力 。
2.2 痴迷客户
CSEO致力于提高服务和LSI(live site incident)管理的效率 。 CSEO正在合并服务管理平台 , 推出标准的事件管理流程 , 并根据关键指标持续评估改进的情况 。 随着CSEO朝这个方向努力 , CSEO对业务流程健康有了更好的理解 , 并正在扩展工具和流程以改善对业务流程运行状况的监测 。 业务流程可以涵盖从现代到传统再到第三方的多种服务和技术 , 例如从供应商处购买服务后提供有关该服务付款状态的透明度 , 这需要跨多个系统的集成和代理商的手动工作来支持该过程 。 CSEO正在通过对跨多个服务和技术的关键业务流程进行更深入的了解 , 从而在服务和业务健康状况之间架起一座桥梁 。 这使CSEO能够收集和聚合数据 , 以提供服务和流程健康的整体画面 。 CSEO正在积极主动地检测流程瓶颈 , 以帮助减少响应时间 。 CSEO正使用端到端流程监测 , 以将可见性扩展到单个服务之外 , 这确保了整个业务流程的有效运行 。
2.3 使用遥测平台
CSEO使用的是基于Azure Monitor的统一遥测平台 , 该平台可帮助实现服务质量的持续改进 。 该平台与诸如Kusto、Azure Cosmos DB、Azure Application Insights和Log Analytics等异构数据源集成 , 以收集、处理和发布来自应用程序、基础结构和业务流程的数据 。 统一的遥测平台可帮助获取端到端视图 , 并生成有关CSEO服务管理的可行动的见解 , 还能通过常见的可视化来更好地检查原始数据和Application Insights数据 , 以用于确定团队、Live Site、以及服务评论的相关性 。 CSEO正致力于交付高度相关的洞察 , 用以聚合组件服务、客户体验和业务流程的健康状况 。 这将产生上下文数据 , 这些数据不仅可识别事件 , 还可识别根本原因和建议的下一步操作 。 CSEO正在使用业务流程监视(BPM)通过跟踪多个服务和业务组的成功交易和客户影响来监测真实可用性和性能 。
增强了数据支撑的工单 , 将提供根据对业务影响程序而优先排序的问题视图并补充潜在原因 , 包括通过机器学习判断原因和评估严重性、对给定事件分配更智能的变更 , 以及类似情况归因 。 这些数据增强的工单 , 让团队可以专注于最重要的工单并减少解决问题的时间 。
CSEO正在将综合监测集成到统一的遥测平台管道(pipleline)中 , 以帮助服务工程师可视化和跟踪服务的性能、减少检测问题所需的时间 , 并查明系统中的瓶颈 。 为了达到可持续的质量水平 , CSEO对所有关键服务 , 尤其是业务交易量相对较低的那些服务 , 进行综合监测 。 为了满足CSEO中那些孤立的和异构解决方案的需求 , CSEO使用综合监测来测试第三方应用程序的新功能和性能 , 并无缝处理各种身份验证协议 , 包括Microsoft Azure中的平台即服务(PaaS)组件、公司防火墙连接和多重身份验证 。 CSEO正在构建平台 , 以提供启用负载、压力和可用性测试的机制 , 并提供门户和 API , 使 CSEO 团队能够加入并管理其配置 。
2.4 服务健康报告
CSEO在监测整个组织的服务运行状况指标和关键绩效指标(KPI) , 以了解客户的情绪并确保服务可靠、合规以及表现良好 。 CSEO在使用一致的标准 , 这有助于确保在服务层次结构中的任何级别聚合数据 , 并在不同团队组之间进行比较 。 监测和报告服务健康状况需要登录和集成CSEO统一的遥测平台、自定义维度和基于Power BI构建的服务健康状况仪表板 。 CSEO在Azure Monitor的基础上构建更集成的体验 , 并通过统一遥测平台提供丰富的上下文数据 , 并创建一组被定义的服务运行状况衡量指标和分析器 , 以跟踪可能影响服务可靠性的事件 , 例如即将进行的计划性维护或与更改合规相关变动 。 这使CSEO能够主动、快速地检测和解决问题 。 CSEO定义的服务健康措施 , 可以更轻松地跨各种技术启用服务健康报告 , 包括Application Insights、自定义服务监视和第三方服务 。


推荐阅读