过去一年,我看到了数据库领域的十大发展趋势( 二 )


过去一年,我看到了数据库领域的十大发展趋势

文章插图
2023 年 AWS re:Invent 上宣布推出 Aurora Limitless Database,本质上是存算分离的 Aurora 的基础上加了一层 proxy 做分布式 。下图就是 AWS 的架构:
过去一年,我看到了数据库领域的十大发展趋势

文章插图
看到 AWS 这个新的发布,国内数据库圈子好一阵沸腾,觉得国内的数据库一些方面也可以领先美国厂商了 。其实这个趋势并不是发生在 2023 年某一天,而是一个逐步积累的过程 。早在 2020 年的时候,国内的阿里云 RDS 产品能力就比 AWS 要强 , 提供了三节点 , 双节点 , 单节点,拖管,半拖管等多种形态,除了 AWS 形态,产品性能,规格丰富等都比 AWS 要强 。
所以这个趋势并不能说是 2023 年的新趋势,这个趋势一直在发生;但是还是非常值得放到 2023 年重大趋势中拿出来说,这个还是非常明显标志着:随着国内的工程技术能力的逐步增强 , 会有越来越多的产品领先美国厂商 。
【过去一年,我看到了数据库领域的十大发展趋势】趋势四:AI4DB and DB4AI 成功翻红
AI4DB , DB4AI 喊了很多年,谈不上新概念,不过在 2023 年大模型的带动下,数据库和 AI 结合又有了新的想象力,大模型的巨大威力,让厂商纷纷研究数据库和大模型的结合 。
首先是 23 年 8 月份 , 腾讯云向量数据库(Tencent Cloud Vector DB)正式上线公测 。作为一款全托管的自研企业级分布式数据库服务,腾讯云向量数据库专用于存储、检索、分析多维向量数据 。该数据库支持多种索引类型和相似度计算方法,单索引支持 10 亿级向量规模,可支持百万级 QPS 及毫秒级查询延迟,不过半年后,直到笔者写这篇文章的时候,腾讯的向量数据库还是没有商用 。
百度也赶在年底发布了单独的自研向量数据库,百度向量数据库 VectorDB 是一款纯自研高性能、高性价比、生态丰富且即开即用的向量数据库服务 。支持多种索引类型和相似度算法 , 百亿级向量规模 , 毫秒级查询延迟 。百度向量数据库不仅能配合大模型打造专业知识库,还可以应用于图片搜索,音乐推荐,文本分类等领域 。
过去一年,我看到了数据库领域的十大发展趋势

文章插图
23 年 12 月份,百度还发布 DBSC(数据库智能驾驶舱),这个是利用 AI 的技术,为用户提供安全审计、智能诊断与数据库管理的数据库自治服务 。DBSC 利用 AI 大模型能力和专家经验实现数据库的智能化洞察、评估和优化 。有效保证数据库服务的安全、稳定及高效 。这块的探索应该说阿里最早 , 阿里的 DAS 产品在 20 年就看准了数据库安全自治工具一体化成主流趋势 。百度的 DBSC 比较有特色的是提供问答诊断、工单处理、知识查找等能力的智能手,这个能力其实是非常考验产品知识的积累的 。
NoSQL 这块阿里的 Lindorm 直接简单粗暴的将大模型内置到系统里面,支持以图搜图功能 , 应该说是一种探索,不过总体觉得还是比较难做出特色和实用价值的 。
美国的 AWS 利用 AI 增强 ETL 能力 , Google 利用大模型实现代码改写能力,也是在这个方向发力 , 国内的也有创业公司跟进,不过目前离成熟还需要一些时间 。
趋势五:云厂商开始发挥软硬件垂直整合优势
应该说云厂商本质上先革 IDC 的名,再革各种基础软件的命 , 要相比客户自建有明显的优势 , 推出自研,走垂直整合是必选道路 。前一个非常成功的 2C 厂商是苹果 , 2B AWS 也是复制这条道路 。国内总体差距比较大,云厂商里面华为,阿里跟进的比较快,都推出了 ARM 系列芯片,国内目前最强的应该是华为的鲲鹏系列 。
2023 年开始阿里的全线主力产品都进行了适配,阿里发布的 RDS 经济版本就是 适配 ARM 系列 , 基于倚天 /ARM 芯片服务器上持续优化 , 提高性能,定价则是只有 X86 实力的 60%~70% 的价格,通过性价比吸引用户尝鲜和试用 。应该说短期内 ARM 的能力还不够,所以是经济版本 , 长期看,ARM 应该要能能力迭代更快,长期发挥比 X86 更好的能力 。如果走向这一天,云厂商的相比自建客户的优势将进一步拉大 。
华为、阿里的动作标志着云厂商 2023 年也开始发挥垂直整合的优势,不过总体来说国内的发展水平相对美国还是差距比较大 。
趋势六:RDS 还是常青大盘产品,NoSQL 创新相对较少


推荐阅读