2023,数据库国产替代走到哪了?( 三 )


第三个转折点则是今天,2020年后,随着传统行业高速发展,Oracle、DB2局限性越来越明显 。在BAT时代和4G时代积累的数据库,也愈加能承载诸如保险公司和能源公司等行业的数据需求和业务复杂度需求 。这也为国产数据库“弯道超车”提供了充足的可能性 。
除了市场需求的变化,信创也是所有央企国企考虑使用国产数据库的首要因素 。以央企为例,如果不进行国产数据库的替换,不仅面临Oracle数据库被禁止使用的问题,还会遇到许可证费用增加的问题 。
首先,中美国际环境在很长一段时间都会处于紧张状态,贸易战和科技战加剧,美国政府不知何时会在未来的某一天,以国家安全等为由,禁止央企或其他中国企业使用美国厂商研发的数据库产品和技术 。
而Oracle在央企占比十分大,并且都是企业经营管理的核心系统 。一旦被禁止应用,将将产生不可估量的影响与损失 。
其次,近两年随着传统行业数字化程度加深,很多央企对Oracle数据库的应用不仅限于应用水平较低的数据存储 。如果应用继续深入,也会带来Oracle数据库许可费用的大幅增加 。
最后,由于Oracle数据库诞生于三四十年前,其技术架构存在一定局限性,如采用集中式架构无法线性扩展,稳定性、性能强依赖硬件 。对于那些越来越多的并发量大、峰值高等带有互联网场景的数字化应用系统,Oracle数据库将无法支撑 。
从市场需求到业务复杂度,从信创要求到技术架构局限性,当下的种种因素都驱使着国产数据库迁移的加速到来 。
国产数据库,走向何方
从2023年国产数据库的中标情况可以看出,未来国产数据库有两大发展趋势——云原生、湖仓一体 。
首先,云原生数据库就是从根本上改变技术架构,让数据库实现真正意义上的横向扩展 。因为云本身具有弹性、可扩展性的特点,云原生数据库可以在全面云化的基础设施环境中,按照使用情况进行更细粒度的计费 。
对于云原生数据库,现在有一种说法,云原生数据库已进入2.0时代,更强调一个能集成多种引擎的全面数据库解决方案 。简言之,云原生数据库可以充分发挥云上的优势,让每个分区都可以充分享受云带来的弹性和高可用能力 。
对此,华为云给出的解释是,业务是否“生于云、长于云”,决定了企业是否能充分享受到云原生数据库带来的极致体验 。
这种弹性能力在关键时刻就会发挥作用 。比如,双十一场景下,庞大的数据量如果用传统数据库,只能靠硬件堆砌 。但云原生数据库就可以解决这一瓶颈,利用弹性可用这一优点成为问题的突破口 。
从另一种角度看,云原生数据库也是国产数据库“换道超车”的一种可能性 。
以阿里云当年自研数据库为例,当时阿里决定做双十一,创造了淘宝业务数据量的峰值,加上互联网业务所需的弹性,Oracle数据库集群已无法满足,将阿里“逼上”自研数据库的这条路 。
后来阿里云时代,在阿里云不断服务客户的过程中,积累了如云数据库的托管服务RDS、云原生数据库PolarDB和分布式版本PolarDB-X等丰富的数据库服务 。
过去几十年,数据库经历了从早期的关系型数据库,到数据仓库和关系型数据库配合,OLTP和OLAP两个领域的细分,再到开源数据库、NoSQL数据库,最后到今天云原生数据库的发展历程 。
今天,云原生之所以成为未来数据库的一大发展趋势,一方面是因为数据规模爆炸性增长;另一方面是数据的生产和处理的实时化和一体化需求越来越强,对于一站式数据管理与服务的需求也随之增强 。第三,用户处理数据对智能化的要求,也推动云原生数据库的发展 。
据Gartner预测,2022年,全世界75%的数据库会以云的方式运行 。未来,数据库领域的核心发展方向是云原生+分布式,以及由此带来的几个核心技术布局:安全稳定、自动化与智能化、数据库大数据一体化、数据仓库与数据湖、多模数据库以及软硬件结合 。
另一大趋势是湖仓一体 。
简单理解湖仓一体是,数据湖+数据仓库的结合 。其中,数据湖的特点是存储非结构化的数据,这些数据往往比较杂乱,但使用起来很方便,可以从中任意挑选数据随意组合 。数据湖更适用于前期的开发 。
数据仓库则相反,它主要存储结构化、经过处理的数据 。这些数据的“排序”非常规范、有序,但用起来却没那么灵活 。但两者各有利弊,如果能将数据湖的灵活与数据仓库的规范结合到一起,就可以实现让数据先在数据湖中进行开发,再将整理后的数据在数据仓库中存储,让数据在湖与仓之间自由流动 。


推荐阅读