LSH 局部敏感哈希( 五 )


4, Kernel LSH
前面讲了三种LSH算法 , 基本可以解决一般情况下的问题 , 不过对于某些特定情况还是不行:比如输入的key值不是均匀分布在整个空间中 , 可能只是集中在某个小区域内 , 需要在这个区域内放大距离尺度 。又比如我们采用直方图作为特征 , 往往会dense一些 , 向量只分布在大于0的区域中 , 不适合采用cosine距离 , 而stable Distribution投影方法参数太过敏感 , 实际设计起来较为困难和易错 , 不免让我们联想 , 是否有RBF kernel这样的东西能够方便的缩放距离尺度呢?或是我们想得到别的相似度表示方式 。这里就需要更加fancy的kernel LSH了 。




推荐阅读