深入理解热度算法:如何做好内容推荐?

热门推荐是互联网产品中最常见的功能之一,比如“大家都在看”、“今日热卖榜”这些在各大网站上都随意可见,堪称标配 。而其中推荐算法的好坏,则不仅密切关系着内容对用户的吸引程度,也同时反应了产品对内容的分发能力 。

深入理解热度算法:如何做好内容推荐?

文章插图
在一个产品中,如果不能及时发掘新鲜内容,并将优秀内容传播出去,甚至引爆,那么整个内容生态也难以搭建起来 。
虽然时下,大家更有兴致讨论的都是个性化推荐,但它并不适用于所有产品,尤其是初创的、小众的产品 。因为个性化推荐它必需依赖大量的用户数据以及对内容深入的挖掘,若不然强行个性化推荐只会适得其反 。
这次,本文主要探讨实用性更强热度算法,它也并非想象中的简单粗暴,反而有不少只属于它的亮点 。
本文不带一个数字公式,可安心食用^_^
 
一、基本原理其实,在热度算法表层之下,还有不少的基础原理在支撑着它,但在本文中将不先扩展,而是以最普遍运用的牛顿冷却定律为例 。
它的特点在于,引入了时间衰减的概念 。
牛顿冷却定律若用函数来代表,则为:
热度 = 初始热度 + 互动热度 – 随时间衰减的热度
举个例子:
当一条微博产生后,随着用户的浏览、点赞、转发、它的热度逐渐攀升,进入榜单 。
但因为这条内容本身具有时效性,如果不考虑这点,那么它可能长期霸榜,所以我们必须考虑到如何令它的热度随着时间的推移而衰减,从而令新的微博有机会取而替代,达到热门榜单动态变化的效果 。
 
二、影响因素在理解热度算法的基础原理后,我们可以得知影响热度计算的三个因素:
 
1. 原始热度首先是原始热度,正如内容千差万别,再加上产品本身的定位、偏爱 。
我们不太可能去为所有的内容赋予同样的初始热度,就比如一个大V发的微博和一个好友发的微博,以及一个陌生小号发的微博,它们从一开始就难以相提并论 。
而我们又该如何给每个内容赋予不同的原始热度呢?
可以从两个维度出发:
(1)创作者,即创作这个内容的人,也可以是机构 。
还是以微博为例,微博对用户做了不少划分,个人、垂直领域的知名博主、自媒体、机构、企业、政府等等,不同类型的身份也隐含他们的创作能力和传播价值 。
所以在初始热度的考量上,我们就会考虑是否让大V用户发表的新内容更先一步的进入热榜 。
当然,其它产品就算不像微博那样对用户有明确的归类,也可以利用一些基础的用户数据,比如:
  • 注册时长:是否激励新用户,还是优待老用户?
  • 活跃程度:一个投入更多时间精力的常驻用户是不是更大概率会创作出优秀内容?
(2)内容属性,则是从内容本身出发,根据它的类别、字数长度、丰富度、流行指数等有所侧重 。
就比如在热门微博管理规范,就表示过含多张的图片,含#话题的就会加重热度,而带外链的,已有相似内容的则会降低热度 。
具体哪些内容该赋予更高的热度,哪些内容又该冷处理,关键看这个产品的内容调性和氛关键可能看这个产品中主流用户的偏爱,以及运营人员想营造什么样的内容生态 。
 
2. 互动热度初始热度这一因素虽然看上去具有极大的天然优势,但往往在实际推荐算法中也不会占据主要的地位 。
比如就算是一条超级大V发的和一条普通用户发的内容,可能在初始热度上差距也不会特别大,因为内容是否真的够好,还是要靠更广泛的用户来检验 。
这也就是影响热度的第二因素——互动热度,这也是最为重要的,也可以理解为用户的行为数据 。
我们需要先定义哪些用户行为可以提高这条内容的热度,像对一条微博的浏览、点赞、评论、转发、分享等,都可以代表了用户对它的感兴趣程度 。
同时需要注意的是,不同行为的权重应该也是不同的 。
比如,评论明显比点赞更有诚意,所以我们在计算互动热度时,可以对这些用户行为进行评级,浏览+1分,点赞+3分,评论+10分,转发+15分,分享+15分 。
且在实际产品运营过程中,我们还需要根据用户规模、周期效应不断调整用户的行为分,同时考虑如何反作弊,若规则太生硬,是不是就会被有心人利用,这点后面会再探讨 。


推荐阅读