节点|曾经,我以为我很懂MySQL索引...( 三 )
B-Tree 借助计算机磁盘预读机制:每次新建节点的时候 , 都是申请一个页的空间 , 所以每查找一个节点只需要一次 I/O;因为实际应用当中 , 节点深度会很少 , 所以查找效率很高 。
那么最终版的 B+树是如何做的呢?
④B+Tree (B+树是 B 树的变体 , 也是一种多路搜索树)
本文插图
从图中也可以看到 , B+树与 B 树的不同在于:
- 所有关键字存储在叶子节点 , 非叶子节点不存储真正的 data , 从而可以快速定位到叶子结点 。
- 为所有叶子节点增加了一个链指针 , 意味着所有的值都是按顺序存储的 , 并且每一个叶子页到根的距离相同 , 很适合查找范围数据 。
B+ 树的优点 , 比较的次数均衡 , 减少了 I/O 次数 , 提高了查找速度 , 查找也更稳定:
- B+树的磁盘读写代价更低 。
- B+树的查询效率更加稳定 。
你每次增加索引 , 数据库就会为你创建一个附加索引(上述 B+树) , 索引选取的字段个数就是每个节点存储数据索引的个数 , 注意该索引并不存储全部数据 。
为什么 MySQL 索引选择了 B+树而不是 B 树?
原因有如下两点:
- B+树更适合外部存储(一般指磁盘存储) , 由于内节点(非叶子节点)不存储 data , 所以一个节点可以存储更多的内节点 , 每个节点能索引的范围更大更精确 。 也就是说使用 B+树单次磁盘 I/O 的信息量相比较 B 树更大 , I/O 效率更高 。
- MySQL 是关系型数据库 , 经常会按照区间来访问某个索引列 , B+树的叶子节点间按顺序建立了链指针 , 加强了区间访问性 , 所以 B+树对索引列上的区间范围查询很友好 。 而 B 树每个节点的 key 和 data 在一起 , 无法进行区间查找 。
①回表查询
比如你创建了 name ,age 索引 name_age_index , 查询数据时使用了:
- select * from table where name ='陈哈哈' and age = 26;
②索引覆盖
结合回表会更好理解 , 比如上述 name_age_index 索引 , 有查询:
- select name ,age from table where name ='陈哈哈' and age = 26;
③最左前缀原则
B+树的节点存储索引顺序是从左向右存储 , 在匹配的时候自然也要满足从左向右匹配 。
通常我们在建立联合索引的时候 , 也就是对多个字段建立索引 , 相信建立过索引的同学们会发现 , 无论是 Oracle 还是 MySQL 都会让我们选择索引的顺序 。
比如我们想在 a , b , c 三个字段上建立一个联合索引 , 我们可以选择自己想要的优先级 , a、b、c , 或者是 b、a、c 或者是 c、a、b 等顺序 。
为什么数据库会让我们选择字段的顺序呢?不都是三个字段的联合索引么?这里就引出了数据库索引的最左前缀原理 。
在我们开发中经常会遇到明明这个字段建了联合索引 , 但是 SQL 查询该字段时却不会使用索引的问题 。
推荐阅读
- 沙面|广州第一知名小岛,曾经领事馆林立,遍地都是洋建筑
- 情感|让男人爱你如初的妙招:“拾掇”
- |员工轮休,只发最低工资,曾经的赴美第一股,华晨汽车为何沦落至此?
- |这三座城市曾经是两广总督府驻地,一座名气很大,两座默默无闻
- 古村记|青海海西7处小众古址,在高原风光中寻找曾经记忆
- 威海|中韩文化艺术节点亮威海夜空!记者探秘“山东消费年”
- 情感解压台|爱你太累,想念太苦,我熬不住了
- Veyron|布加迪设计师最喜欢这6台威航,国内曾经有2台,每台都有故事
- 元稹|曾经沧海难为水?元稹:婚姻是场权力的游戏
- 明朝|明朝覆灭之前,左良玉手握80万大军,为何选择攻打曾经的自己人