实现1000万用户的昵称模糊查找
楼上匿名是对的,比较合理的做法是遍历一遍整个数据库,对其包涵的每一个字建立一个目录,代码的例子就是map\u0026gt;. 花--\u0026gt;, 梨--\u0026gt;,校--\u0026gt;.这里的set推荐用hashset.这样只需要遍历数据库创建这样一个目录系统。以后每次找直接相应的词语的目录就好了,这里同样可以把关键词存在一个哈希表里。预处理真是提高效率的神器。
■网友
看题主要的“模糊”需要实现到什么程度了如果只是要实现mysql里的like级别的“模糊”,那么就按单字切割、建立倒排索引、用检索词的多条拉链取交即可如果更复杂一些,还要实现同义词的“模糊”,例如查找“中科大”,可以将“中国科技大学-小明教授”这个用户检索出来,那就要搞个词库、切词后用与或树得到结果如果还要将大量结果按相关性排好序,那还要实现一套计算相关性的算法。。。
■网友
把这个字段单独拉出来,建索引,昵称分类,就啪啦啪啦的出来了
推荐阅读
- 广东警方曝光38款存在超范围收集用户信息违规行为App
- 北京22家市属医院均开展安检基本实现重点区域安检措施全覆盖
- 长江流域渔民退捕“上岸”实现扩产新致富
- 实现“甜蜜计划”,这对中哈跨国夫妻好甜
- 北京地铁11号线西段三座车站提前实现主体结构封顶
- 为啥工商银行的用户体验如此之差
- 电池|享域混动 为了满足用户需求 优惠1.5万
- 5.1声道片源对于没有5.1硬件系统的用户来说有意义吗
- 环球车讯网|11月销量盘点:蔚来销售5291辆,BaaS购车用户占比提升
- 朋友圈权限被破解,怎样反破解