过去一年,我看到了数据库领域的十大发展趋势

作者 | 朱洁
策划 | 李冬梅
过去一年,行业信心跌至冰点
2022 年中,红衫的一篇《适应与忍耐》的报告,对公司经营提出了预警,让各个公司保持现金流,重整团队,想办法增加盈利 。这篇报告的推出的时间点应该是各个整个行业的拐点 , 大家不再期待 V 型复苏拐点,信心开始逐步跌落,2023 年初跌倒谷底和冰点 。2023 年整个一年都是在艰难的慢慢恢复 , 各行各业普遍艰难,公司裁员加剧,就业率创新低 。数据库行业 2021 年的资本盛宴开始 , 众多创业者刚想闯进来分一杯羹 , 22 年底 23 年初就结束了,应该说让从业者深刻体会到了什么是大起大落 。站在 2024 年起点往回看,还是非常感慨和唏嘘 。作为大起大落的亲历者 , 今天这篇我们一起来总结数据库行业在 2023 年的一些情况 , 我会尽量涉及到产品技术 , 厂商发展 , 市场环境等多个方面 , 受限于时间和水平不足 , 肯定有不少错漏之处 , 也欢迎大家一起探讨 。接下来就正式进入正题:
趋势一:HTAP 成为主流数据库的一项基础能力
数据库技术起源于美国 , 中国在这个行业里面不管是市场容量 , 技术方面总体来说还是全面落后于美国的 。所以产品技术这块国内和国外还是有很大的区别 , 有些方面国内非常火热 , 但是在国外缺完全不一样,反过来也是一样的 。首先这个特别明显的就是 HTAP 和 Serverless 两项技术 , HTAP 在国内比国外热,Serverless 则更是成为海外产品的 default 选项 。
HTAP 概念能在国内火爆,TiDB 功不可没,甚至一度大家觉得这可能是一个细分赛道,不过经过几年下来,行业还是逐渐形成了一个共识,HTAP 是数据库的一项基础能力 , 而不是一个细分赛道 , 或者反过来说 HTAP 不足于支撑一个单独的数据库细分门类 。2023 年一个重要的趋势就是各个主流数据库都把 HTAP 支持作为一项基础能力 。典型的有:
23 年 10 月腾讯的 TDSQL-C 也列存索引,并把列存索引和并行查询整体包装成 HTAP 能力 。
23 年 12 月百度发布 GAIaDB 4.0,重要升级就是推出列存索引和列存引擎 , 提升不同规模数据的查询速度 , 其中列存引擎最大可支持 PB 级数据的复杂分析,并且与事务处理业务严格复杂隔离 。

过去一年,我看到了数据库领域的十大发展趋势

文章插图
海外这个概念提的比较少 , google AlloyDB 算是正式提过这个概念 , AWS 重点宣传的是 Zero-ETL , 本质上也是 HTAP 的能力,但总的来说海外对这个概念并不是特别感兴趣 。
趋势二:Serveless 成为头部厂商的共识
Serverless 在美国经过 AWS 长达十余年不遗余力的宣传 , 早就深入人心 , 国内因为不同的市场环境,企业普遍还是喜欢预付费为主,所以这种弹性动态的优势就不明显,因此导致 Serverless 在国内发展缓慢 。
数据库 Serverless 这块阿里发力最早,21 年就开始布局,23 年把 Serverless 作为主推方向,基本 TP,AP,NoSQL 各个方向都支持了 Serverless , 甚至传统的 RDS 产品线 , 以及工具的 DTS 产品也开始支持 Serverless 。
23 年 8 月份 , 腾讯的 TDSQL-C 也宣传支持 Serverless , 并把主打的差异化点是可以完全释放存储 , 数据变成归档 。业内的 Serverless 无法完全做到不使用不付费,一般实例暂停后仍然会收取高昂的存储费用,可释放存储将彻底解决这一问题 。当实例暂停后,数据会进行归档存储 。用户无需再为高额的分布式存储进行付费,可在原实例暂停后的存储费用上降低成本 80% 。
年底的时候华为 GuassDB for MySQL 也全面商用,号称相比固定规格 , Serverless 实例平均可降低使用成本超 30% , 特定情况甚至有 80%+ 的成本降低 。
所以从 2023 年开始,Serverless 可以说成为头部厂商的共识了,相信在接下来数据库 Serverless 会有一个长足的发展 。
趋势三:国内在产品形态上部分开始领先海外
相比 HTAP,分布式产品在国内发展更充分,竞争对手很多,所以更值得说一说 。分布式数据库国内 OceanBase,TiDB , PolarDB-X 都是比较有特色和竞争力的产品,其中阿里的 PolarDB-X 很早就开始布局和支持存储分离 + 分布式的技术,走一条存算分离,分布式一体化的技术路线 。下图是阿里宣传的融合架构图:


推荐阅读