新一代HTAP数据库崛起,MySQL生态的最佳归宿?

俗话说,天下大势,合久必分、分久必合 。
数据库领域同样如此 。过去五十余年,数据库经历OLTP和OLAP两种需求漫长的融合-分离-再融合的过程 。究其原因,数据库的发展始终与用户场景需求变迁紧密相关 。如今,随着云计算和大数据的兴起,业务场景正在经历前所未有的变革,数据库领域也掀起了一股HTAP浪潮 。
Gartner在多次报告中强调,HTAP是数据库领域最重要的发展趋势之一,也是用户数字化转型中重要的数据平台 。业界甚至认为,HTAP的兴起代表着数据库大融合时代的开启 。
那么,为什么数据库大厂和云服务巨头们均纷纷押宝HTAP?开源+多云为何是HTAP普及的助推剂?面对新一代HTAP数据的崛起,多年积累形成的MySQL生态终于找到最佳归宿?
HTAP数据库是新瓶装旧酒?放在几年前,HTAP可能还会被认为是数据库领域的小众产品,是否成气候还有待观察 。
而随着数据资源、数据消费习惯和数据驱动型场景发生巨大变化,用户需求与传统数据库之间的供需矛盾日渐突出,使得HTAP这种具备“同时支持OLTP和OLAP、创新计算存储框架、去ETL”等特征的新时代数据库成为不可阻挡的趋势 。
如今,几乎所有数据库大厂和云服务巨头都在布局HTAP 。例如,OceanBase去年推出的 3.0版本中就正式宣布向HTAP数据库进军;今年5月,google Cloud发布HTAP云端数据库AlloyDB,为PG用户提供了HTAP数据库服务;再加上Oracle MySQL Heatwave,甚至连SnowFlake也发布Unistore来“蹭”HTAP的热点 。
如果细数近一年以来的HTAP新品,会发现几乎全部都建立在云端之上 。新一代HTAP+云正在成为数据库市场重要的潮流 。例如,PingCAP近日发布的TiDB 6.0,也是与云端紧密联系的新一代HTAP数据库 。
事实上,PingCAP是HTAP数据库领域非常重要的一个引领者 。早在TiDB 3.0起,PingCAP就正式转向HTAP,从OLTP主引擎+OLAP辅助能力,到OLTP引擎+外接分析引擎,再到OLTP引擎+融合分析引擎,PingCAP在HTAP领域稳打稳扎,一个版本上一个台阶 。

新一代HTAP数据库崛起,MySQL生态的最佳归宿?

文章插图
 
如今,随着TiDB 6.0的发布,针对HTAP进行了更多成熟性改进,TPC-C 性能也较 5.0 版本提升达到 76.32%,TiDB 6.0还增强了多个企业级特性,以更好适合云时代用户对于HTAP数据库的需求 。
固然,有人质疑当前HTAP是新瓶装旧酒,并无太多新意 。但业界普遍形成共识:新一代HTAP与过去完全不同,开源+云孕育而出,很多都有AI加持,而且是为数据敏捷而生,拥有过去前所未有的创新活力与迭代速度,并逐渐形成数据库技术变革的新潮流 。
PingCAP CTO 黄东旭也直言:“TiDB近年来的快速进化与迭代,得益于开源和云的助力 。”
开源+云,数据敏捷的助推剂HTAP之所受到用户青睐,某种程度是因为用户对于数据敏捷性的极度渴求 。
“在数字化时代,客户最为在乎的是如何快速走向市场 。这需要数据敏捷性,而HTAP恰恰是数据敏捷的核心能力 。”黄东旭如是说 。
最近几年,“海量、实时、在线”的需求越来越广泛,大量采用 MySQL 和 PostgreSQL 开源数据库的新一代企业需要提升对于热数据的实时在线分析能力,这类需求遍布几乎所有的互联网企业以及从事线上业务的数字化转型企业 。对于新鲜数据的实时分析能力直接决定了这些业务的生死存亡,传统的 OLTP+OLAP+ETL 的数据架构已经严重阻碍了消费者体验,这种诉求催生了 HTAP 的技术变革 。
新一代HTAP数据库崛起,MySQL生态的最佳归宿?

文章插图
 
而真正帮助HTAP与用户需求完成对接的则是开源+云 。众所周知,开源近年来在数据库领域的流行和影响力与日俱增,DB-Engines数据显示,全球383款数据库中开源数据库占据51.7%,六款开源数据库进入到前十,开源正在成为像HTAP这种新时代数据库的创新源泉 。
以PingCAP的TiDB为例,其产品研发体系建立在开源体系和开源社区的基础上,实现了一年一个大版本、一个月一个小版本的迭代速度 。黄东旭透露道:“开源是TiDB的第一个增长引擎,通过开源体系,开发者、贡献者、布道者和用户能够很好串联起来,形成飞轮效应,让产品能够走向加速迭代和创新的正向循环 。”
据悉,TiDB每年会有超过 40% 的代码更新,而这些代码有很大一部分由外部贡献者所共享 。TiDB开源项目一直在全球和中国开源项目活跃度中名列前茅 。
如果说开源改变了HTAP产品的开发模式和迭代速度,那么云则能够为HTAP产品提供用户最为直接的需求反馈 。众所周知,云数据库一改以往传统数据库部署、运维、扩展等难题,以云服务的方式让数据库使用更加简单;更加关键的是,随着云计算的普及,云上用户群体持续增加,来自云上用户群体的需求反馈无时无刻都在发生,对于数据库产品的进化与迭代至关重要 。


推荐阅读