数据库的数字化运维能力，你了解了吗？ _数据库

随着数字化的不断深入，数据库爆炸式增长已经是一个现实了。如此数量众多，种类繁杂，还包含大量国产数据库的中小型数据库如何运维，是未来摆在每个企业IT部门面前的一道难题。传统的企业IT运维都是抓大放小，关键、核心系统花大价钱招人或者请第三方服务商驻场服务，一些不重要的，小型的的数据库就放任不管，出了问题再去解决。不过随着数字化转型的不断深入，大量的不能放任不管的中小系统又摆在运维人员面前了。再加上以前一套Oracle数据库干的事情，现在可能需要分解为多套国产数据库来干。
以前虽然Oracle运维起来难度大一些，不过关键系统数量有限，人还是干得过来的。现在的国产、开源数据库虽然比Oracle简单多了，不过原来运维Oracle的模式似乎也不大灵光了。平时不出问题的时候人工去监控也没多大价值，出了问题，人工去处理似乎也经常发挥不出啥作用。再加上面对如此庞大的数量，总是觉得力不从心。
确实如此，Oracle时代行之有效的运维模式到了现在国产、开源数据库时代似乎不大好使了。转变思路，转变工作模式迫在眉睫。实际上既然业务都在数字化转型， IT运维也应该数字化转型了。今天我们就来讨论一下数据库的数字化运维能力是如何构建出来的。

文章插图
图片
数据库的数字化能力来源是数据库产品自身的可观测性接口。通用数据库的可观测性接口一般来说还是比较丰富的，一些开源的专用数据库（比如clickhouse、mongodb等）相对少一些。一般来说，面对场景的复杂性和多样性越多的数据库产品就需要越多的可观测性能力来支撑其运维。上面的图中左侧是数据库需要对外提供的可观测性能力，右侧是IT部门需要构建的数字化运维能力。可观测性是数据库提供给运维的基础数据，数字化运维能力是IT部门建设的自动化分析与处置能力。
IT部门对于数字化运维能力的终极目标是自动化处置与故障自愈，不过这个要求很高，可以在一个组织内部，通过对自己运维对象与运维流程的深入理解不断的演进与完善。不过个性化定制的工程量很大，极难做成通用产品去销售。前阵子和蚂蚁的同学做了一次深入的交流，观看了他们支付宝的运维管理平台，他们的业务自动限流、SQL自动优化、故障自动隔离等方面的能力已经做得很强大了。我当时看得十分眼馋，问他们这部分能力能不能开放到OCP里。他们很坦诚的告诉我，这些能力都是基于对他们的系统充分了解的基础上构建起来的，甚至和他们的关键业务系统的代码都是关联的，想要开放成通用功能是有一定难度的。
虽然构建高级目标是需要长时间积累的，不过饭可以一口一口的吃，先把基础能力构建起来还是可以做的。不过要想构建基础的数字化运维能力也还是有一定的基础条件的。数据库的可观测性接口的能力强弱限制了数字化运维能力的建设。传统的数据库监控是网管理念的监控，数据库的几个关键指标合理，不宕机就行了，因为判断系统是否存在问题主要还是靠人。数字化运维是要考算法来判断系统是否存在问题，那么所需要的监控指标就复杂多了。
举个例子，哪怕是最简单的配置信息，如果是人工运维时代，那么很多配置信息记录在系统里或者保存在文档里还问题不大，大不了人工去检查。而如果要数字化运维，那么数据库的备份策略，备份作业的完成情况等配置信息都必须要数字化了。这方面Oracle数据库的完备程度是十分高的，值得国产数据库去学习。通过系统视图，我们可以知道大量的数据库运行于配置变更的细节，这对于数字化运维和最终实现数据库自治十分重要。
活跃会话历史（ASH）是数据库数字化运维高级阶段不可缺少的数据支撑。精准的故障预警和根因分析都需要ASH数据的支持才能实现。因此ASH也是很多数据库故障自愈能力构建的基础。数据库要提供ASH的能力并不简单，需要在数据库核心代码中能够将大量的会话活动数据转储出来，最终固化到系统表中。为了实现更精准的分析，ASH要求的采样频率一般是1秒钟，这对于数据库内核也是一个巨大的考验。目前应有一些国产数据库已经开始提供ASH数据了，比如openGauss、Polardb、KingbaseES等。
Top SQL的发现与分析是另外一种十分关键的可观测能力，在以人为核心的运维时代，对数据库的Top SQL可观测能力要求也不是很高。支持慢SQL输出就够用了。当系统出问题的时候，启动慢SQL日志输出，人工去看日志分析问题就行了。而如果要想实现自动化分析，那么就需要运维平台主动采集系统中的SQL语句。

数据库的数字化运维能力，你了解了吗？

推荐阅读

毛呢大衣家里如何清洗干净毛呢大衣家里如何清洗干净视频

#小白篮球TB#路威先选便士后改科比，路威与维特斯同评历史前五：维特斯没乔丹

联盟：安定门街道复工复产“联盟”暖心服务辖区商户

起亚汽车|又一韩系“顶梁柱”倒下，5月销量被腰斩，价格降到10w出头也白搭

为啥把结过婚的男女叫叔叔和阿姨，而不是叔叔和婶婶

【经济日报】2020中国企业500强公布千亿级企业首次突破200家

[王者荣耀]王者荣耀新英雄抄袭惹众怒，清北策划就这水平？

促醒者|促醒者：王恒之被司徒院长戏耍，他挪用善款，想用化瘤丹翻身

A6体育|西王官宣打脸，经纪人懵了，小丁要博同情？山东给800万还反咬

健身|原创34岁李思思晒健身照儿子意外入镜，家中装修简朴，私下形象反差大

[香港]紧急提醒！50万就这么没了，已有人中招！

阜康市人民检察院|增收补短送鸡苗助力脱贫暖人心

全身|颈部拉筋法，加8穴位按压法，打通全身经络，颈椎病肩周炎都管用

青年|王者荣耀新赛季皮肤严重弊端

哈萨克斯坦新观察■“我在居家隔离中”：哈萨克斯坦开始使用公民远程追踪技术

蚂蚁花呗|借了花呗不想还？马云：一个都逃不掉，只有一种情况不用还

新公务员法正式实施：加班有工资了，可以提前退休

人民日报客户端甘肃频道|人民日报：崇信县梁老汉，心里有一个温柔的念想

就业指导直播?高校创业就业直播大赛

win7系统怎么关闭自动睡眠 win7休眠设置