数码实验室|又为啥会“失灵”?,推荐算法为啥这么“灵”

导读:一句话概括推荐算法的原理 。
作者:木羊同学
来源:华章计算机(ID:hzbook_jsj)
数码实验室|又为啥会“失灵”?,推荐算法为啥这么“灵”
文章图片
推荐系统是为用户推荐所需物品的软件工具和技术 。 提供的推荐旨在通过各种决策过程来支持用户 , 例如 , 买什么物品、听什么歌曲或读什么新闻 。 推荐系统的价值在于帮助用户解决信息过载和做出更好的选择 , 也是现在互联网领域最强大和最流行的信息发现工具之一 。
今天就和大家聊聊:推荐算法为啥这么“灵” , 又为啥会“失灵”?
01推荐算法为啥这么“灵”?
要回答这个问题 , 首先得讲清楚推荐算法的原理是什么 。
我们知道 , 互联网最大的特点就是有海量的信息 。 不过 , 光是数量庞大是没有任何意义的 , 需要信息真正发挥作用才能产生价值 。 所以 , 如何让信息发挥价值 , 始终是互联网发展的一条主轴 。 为此 , 我们想了很多办法 。
“算法推荐系统”出现前 , 我们的做法是发现信息 , 这就是搜索引擎 。 搜索引擎很有用 , 但限制也很明显 , 遗留了很多问题 。 回想一下:我们要用搜索引擎找信息 , 不是直接就得到想要的结果 , 而是得首先掏出一个“关键词”输入进去 , 然后才能看到命中的结果 。
这个过程叫信息检索 , 也就是你得首先知道自己对什么信息感兴趣 , 得有线索 , 然后才能通过搜索引擎检索信息 。 但这就有个问题 , 互联网实在太大了 , 而人的认知圈子实在太小了 , 这就导致了大量本该有价值的信息 , 因为没被人看到 , 而只能静静躺在角落被白白浪费了 。
这个问题初看不可能有解 , 毕竟从常识推断 , 我们得首先知道那条信息 , 才可能判断对它是否感兴趣 , 这个过程应该没法颠倒过来 , 去发现我们不知道但感兴趣的信息 。 但推荐算法做到了 , 它改变了搜索引擎的做法 , 不再是发现信息 , 而是发现兴趣 。
推荐算法是怎样发现兴趣的呢?听起来好像很玄乎 , 不过原理远没有想象中的那么复杂 , 我用一句话概括——就是依靠人和物的关联关系 , 最少只要经过三次关联 , 就能完成兴趣发现 , 进行一次推荐 。
这么说不太形象 , 我举一个例子 。
我爱喝快乐水 , 经常去家旁边的便利店买快乐水 , 店长当然很快就知道我对快乐水感兴趣 , 这是第一次关联——我关联快乐水 。 接着 , 店长收完钱 , 想起来有另一位顾客也对快乐水感兴趣 , 名字就叫小编吧 。 小编也常到店里买快乐水 , 这是第二次关联——快乐水关联小编 。 这位小编和我一样 , 对快乐水有着相同的执念 , 但又有点不同:除了到店里买快乐水 , 小编还常买另一样东西——薯片 , 这就是第三次关联——小编关联薯片 。想到这里 , 店长觉得:既然我们都爱喝快乐水 , 那没准你们也都喜欢吃薯片呢?于是 , 店长就向我推荐了薯片 。 这就是基于兴趣的推荐算法 , 大数据分析常举的例子——啤酒尿布 , 就是上面的这个原理 。
数码实验室|又为啥会“失灵”?,推荐算法为啥这么“灵”
文章图片
我最近看到很多文章 , 说推荐算法比女朋友更懂你 , 外人一看都觉得挺神奇的 , 其实明白了推荐算法的原理 , 就应该知道这是理所当然的 , 术业有专攻 , 除非你的女朋友正好是店长 。
当然了 , 推荐算法原理不复杂 , 但实际要发挥好作用 , 还需要根据应用场景作很多调整 。 推荐算法的重心在于发现人与人之间的共同点 , 但怎么划分共同点 , 是有很多不同的方法的 。
就拿我们常见的推荐来说 , 既有“看过这个视频的观众还看过”这类基于视频节目的推荐 , 也有“同城的观众都在看”这类基于地理位置的推荐 。
早期做推荐很简单 , 是基于点击量来推荐 , 但大家很快发现:基于点击量的推荐没法发现差异化的兴趣 。 所以 , 要想实现一套好用的推荐算法 , 通常要综合方方面面去考虑 , 而不只是单独的一两个点 。


推荐阅读