实现1000万用户的昵称模糊查找

楼上匿名是对的,比较合理的做法是遍历一遍整个数据库,对其包涵的每一个字建立一个目录,代码的例子就是map\u0026gt;. 花--\u0026gt;, 梨--\u0026gt;,校--\u0026gt;.这里的set推荐用hashset.这样只需要遍历数据库创建这样一个目录系统。以后每次找直接相应的词语的目录就好了,这里同样可以把关键词存在一个哈希表里。预处理真是提高效率的神器。
■网友
看题主要的“模糊”需要实现到什么程度了如果只是要实现mysql里的like级别的“模糊”,那么就按单字切割、建立倒排索引、用检索词的多条拉链取交即可如果更复杂一些,还要实现同义词的“模糊”,例如查找“中科大”,可以将“中国科技大学-小明教授”这个用户检索出来,那就要搞个词库、切词后用与或树得到结果如果还要将大量结果按相关性排好序,那还要实现一套计算相关性的算法。。。
■网友
把这个字段单独拉出来,建索引,昵称分类,就啪啦啪啦的出来了


    推荐阅读