阿里巴巴|阿里的分布式数据库OceanBase:帮公司省了几百个亿( 四 )


阿里的高层们也终于看到了OceanBase原生分布式数据库的优势,看到了既能做交易、也能做分析的HTAP模式颠覆行业的可能 。他们正式同意OceanBase作为一个单独的公司独立运营,这也是OceanBase发展一个重要的分水岭 。
2020年6月1日,北京奥星贝斯科技有限公司正式成立 。蚂蚁集团前金融科技产品技术总监 杨冰任CEO,阳振坤任首席科学家,与他一起进入OceanBase创业至今的杨传辉(花名:日照)任CTO 。
不久,“出走”刚刚12个月的OceanBase再一次选择了开源 。在进行了数月工作文档和代码的梳理后,2021年6月,OceanBase再次向全网开源 。
不同于遮遮掩掩式的“公关式开源”,OceanBase这次放了狠招:他们一次公开了自己全部内核 。他们把心沉下来,只想如何用开源的方式去满足客户需求 。遵循指示,一个初学者可以在30分钟内将OceanBase的数据库完成装配 。
OceanBase做的是用户价值,这是他们开源的重要理念 。
从最早先屈指可数的几个客户,到今天400多家全行业的客户;大到支付宝、网商银行,小到占总比66%的小型企业,从蚂蚁独立出来的奥星贝斯仍然在帮助全社会的各行各业 。
“让天下没有难做的生意”依然流淌在他们每个人的基因里 。
结语:
尽管已经年近花甲,阳振坤仍然没有半点停滞的意思 。在技术驱动创新的路上,OceanBase的目标是做“无限扩展、永远在线”,意在创造一个不被扩展和故障所限制的数据库系统,而这项成果则可能永远地颠覆数据库,乃至互联网行业 。
做技术的人大多是简单的 。阳振坤和OceanBase十余年走来,风风雨雨,终于至今 。有时他总能想起自己的老师,两院院士王选,当代中国的“毕昇”,颠覆了中国印刷业的科学家 。
33年前,阳振坤成为了王选的弟子 。
那年,阳振坤22岁,青春写意;王选52岁,也正是当打之年 。而今天,王选早已溘然长逝,阳振坤也把自己三十余年的青春献给了科研 。
当年,我憧憬你;今天,我仍在以你为灯塔前行 。 
阳振坤知道,和自己的恩师一样,自己的这一生都将要献给中国的科研事业,但他从没有半分悔意,也没有半分退意 。
2022年1月,在由CSDN主办、OceanBase承办的DC 2021分布式数据库开发者大会后,雷峰网采访了阳振坤,并与他进行了一番深谈 。以下是我们整理的访谈实录:
数据库技术的发展历程
雷峰网(公众号:雷峰网):我们知道技术在历史中,发展都存在着不同的阶段 。数据库也应该不例外,可以根据技术的突破划分为几个阶段,您可以为我们回顾一下吗?
阳振坤:在最开始,它其实是跟账有关系 。最早的数据库叫层次数据库,功能比较简单 。而也是因为其功能比较单一,大家有接触大概几年以后,就发明了一种网状的数据库 。最大的代表其实就是 IBM 的这一套系统 。
到了 60 年代末或者 70 年代的时候,关系模型横空出世 。曾经两个这个图灵奖的获得者专门有一次是ACM(国际计算机学会)开大会,两派的人争执不下:一派的人说这个未来一定是关系模型,因为关系模型有更强的表述能力 。另一派说关系模型不实用 。结构上的复杂性,会导致性能会很差 。
此后关于这个问题一直没有定论 。所以,关系模型从1970年发表,一直到整个70年代,其实都没有过产品 。
到70年代末80年代初,关系型数据库才开始产品化 。此后这个模式就一直被沿用,直到差不多互联网之前 。集中式,本质上是个单机的系统 。一个很关键原因还是因为它太复杂 。
雷峰网:为了解决这个难题,科学家做出了哪些努力?
阳振坤:对数据库来说,它有一个特殊之处:人们很难用一个自然的语言,来操作数据库 。所以后来,就有人开发出了一种数据库专用的语言,叫SQL(结构化查询语言) 。
这个SQL不是告诉数据库干什么的,这个太难描述了;它告诉数据库说我要什么,你怎么干是你的事 。
Oracle 算是最早的那批数据库,就是 Oracle 、DB2,SQL Server,还有像对后面是 PGSQL 跟 MySQL 。在之后的 20 多年的时间里,都没有如此体量的数据库面世 。数据库到今天都是个非常大的挑战,也导致这么多年格局大致不变,一个新的数据库的研发特别困难 。
而互联网时代,有许多很新的、完全不一样的需求也随之而来 。那我们OceanBase今天才有这机会 。
分库分表不是分布式数据库
雷峰网:OceanBase将自己定义为“原生”分布式数据库,这个“原生”要怎么理解?


推荐阅读