Elasticsearch查询速度为什么这么快？( 三 ) 这段时间在维护产品的搜索功能

倒排索引那如果反过来我想查询 name 中包含了 li 的数据有哪些?这样如何高效查询呢?
仅仅通过上文提到的正排索引显然起不到什么作用，只能依次将所有数据遍历后判断名称中是否包含 li ;这样效率十分低下。
但如果我们重新构建一个索引结构：
文章插图
当要查询 name 中包含 li 的数据时，只需要通过这个索引结构查询到 Posting List 中所包含的数据，再通过映射的方式查询到最终的数据。
这个索引结构其实就是倒排索引。
Term Dictionary但如何高效的在这个索引结构中查询到 li 呢，结合我们之前的经验，只要我们将 Term 有序排列，便可以使用二叉树搜索树的数据结构在 o(logn) 下查询到数据。
将一个文本拆分成一个一个独立Term 的过程其实就是我们常说的分词。
而将所有 Term 合并在一起就是一个 Term Dictionary ，也可以叫做单词词典。
英文的分词相对简单，只需要通过空格、标点符号将文本分隔便能拆词，中文则相对复杂，但也有许多开源工具做支持(由于不是本文重点，对分词感兴趣的可以自行搜索) 。
当我们的文本量巨大时，分词后的 Term 也会很多，这样一个倒排索引的数据结构如果存放于内存那肯定是不够存的，但如果像 MySQL 那样存放于磁盘，效率也没那么高。
Term Index所以我们可以选择一个折中的方法，既然无法将整个 Term Dictionary 放入内存中，那我们可以为 Term Dictionary 创建一个索引然后放入内存中。
这样便可以高效的查询 Term Dictionary，最后再通过 Term Dictionary 查询到 Posting List 。
相对于 MySQL 中的 B+树来说也会减少了几次磁盘 IO 。
文章插图
这个 Term Index 我们可以使用这样的 Trie 树，也就是我们常说的字典树来存放。
文章插图
如果我们是以 j 开头的 Term 进行搜索，首先第一步就是通过在内存中的 Term Index 查询出以 j 打头的 Term 在 Term Dictionary 字典文件中的哪个位置(这个位置可以是一个文件指针，可能是一个区间范围) 。
紧接着在将这个位置区间中的所有 Term 取出，由于已经排好序，便可通过二分查找快速定位到具体位置;这样便可查询出 Posting List 。
最终通过 Posting List 中的位置信息便可在原始文件中将目标数据检索出来。
更多优化当然 Elasticsearch 还做了许多针对性的优化，当我们对两个字段进行检索时，就可以利用 Bitmap 进行优化。
比如现在需要查询 name=li and age=18 的数据，这时我们需要通过这两个字段将各自的结果 Posting List 取出。
文章插图
最简单的方法是分别遍历两个集合，取出重复的数据，但这个明显效率低下。
这时我们便可使用 Bitmap 的方式进行存储(还节省存储空间) ，同时利用先天的位与计算便可得出结果。
[1, 3, 5] ? 10101[1, 2, 4, 5] ? 11011 这样两个二进制数组求与便可得出结果：
10001 ? [1, 5] 最终反解出 Posting List 为 [1, 5] ，这样的效率自然是要高上许多。同样的查询需求在 MySQL 中并没有特殊优化，只是先将数据量小的数据筛选出来之后再筛选第二个字段，效率自然也就没有 ES 高。
当然在最新版的 ES 中也会对 Posting List 进行压缩，具体压缩规则可以查看官方文档，这里就不具体介绍了。

Elasticsearch查询速度为什么这么快？( 三 )

推荐阅读

?乌鸡汤补血的做法是怎样的？

『洋哥爱生活』旧爱忏悔，桃花重现，3星座彼此挽留，复合恩爱共白头，5月初

妇科苏医师|称为“穷人的阿胶”，隔三差五吃一些，专家提醒：碰到一菜买20斤

中考400分能上高中吗？

携号转网“坑多多”：申请障碍重重，转网即成“二等用户”

群众网马云再出“王炸”！19年前的项目重启，离首富又近了一步！

【楼市新观】爱恨两茫茫，坚持初心，旧情相思，接受旧爱，十四天过后

竹豆的图片什么是竹豆

娱乐一手消息|为走红往脸上扎200针，如今49岁成玻尿酸脸，为拍戏打掉孩子

窦骁何超莲合体破婚变传闻，穿情侣拖鞋街头拥抱，身高差引热议

虞山镇|中国最牛的6个镇，江苏4个，广东2个，浙江和山东零个

舌尖尝美食下锅油炸是不对的，教你新做法，肉软烂还不腻，做梅菜扣肉时

孩子|选幼儿园最应该关注什么？北大哈佛双硕士宝爸分享经验

男性健康|便秘也伤前列腺？！90%的男性都不知道危害！

娱乐知长街|王鸥年轻时有多美？早年青涩照曝光，甜美的笑容让人心动

天蝎座男生最配星座天蝎座男生最配星座配对

许佳琪|一觉醒来，张大大被多个平台封禁，言论被删，原因是声援高某

送女友什么鲜花好送女友花什么花好

「华为」7纳米芯片+90Hz刷新率+22.5W快充，华为5G千元机仅1599元

浮生梦醒|让你获得高级感，又不贵，如何简单穿搭