3. 随时间衰减的热度由于大部分内容是属于一次消费型,用户看过也就过了 。若热门推荐的榜单总是固定那几条,他可能很快就觉得乏味,从而转向别的产品 。所以我们自然希望内容能不断更新,而若只看初始热度+互动热度,那么后来者必定很难超越前者 。
所以,我们还需要考虑另一个因素——随时间衰减的热度 。
以社会热点来说,往往一件事情的时效性是在24小时内 。
比如一项政策出台,大家都在关注,若不能及时推送,用户很可能已从别的渠道得知;而新鲜劲一过,这条内容再占着榜单也少有人问津了 。
所以我们可以制定一个策略,这个内容在发布后,随着时间的推移,热度也开始逐步衰减 。
同时需要注意的是,时间衰减通常不是线性的 。
毕竟结合现实情况来看,一条新内容产生后,我们可能先需要几个小时去传播它,看看它的热度反应 。
在刚开始这期间,可以不必过多的去考虑时间衰减;而到了有效传播期之后,比如一条新闻过了24小时,那么我们就可以加重时间衰减的因素,尽量不让用户看到昨天的新闻 。
三、如何进行人为干预:调整权重上述的内容已经讲完了热度算法的核心内容,通过理解原理和三大影响因素,相信大家已经可以尝试去设计一套适合自家产品的热度算法了 。
不过,在实际的内容运营中,哪怕一套算法再可靠,我们有时候还是难免想要进行一些人工干预 。
这就涉及到了我们常用的一个手段:调整权重 。
我们可以将权重这一因素,扩展到热度算法中,如:
热度 = 初始热度 + 互动热度 – 随时间衰减的热度 +/- 权重
然后在运营后台中,开放对内容进行加权、降权的功能 。
权重调整其实另一方面也可以弥补热度算法的不足,因为通过传播去获取热度总是需要一定时间,可能没办法应对突发的大热点,而也有某些内容明明在被持续关注着,但却不得不随着时间衰减退出热榜 。
四、偶然和极端其实,除了上述我们预先规定好的因素外,还会有一些偶然的元素可能会影响到热度算法 。
比如,一条内容在产品往往不止在热榜中可见,我们还会通过其它的方式去传播它,比如开屏、PUSH等,这些都会带来巨量的热度提升,而不是它自身在热榜里竞争所得,若不剔除这些偶然因素,则热榜的前几名很有可能就充满了运营导向的味道 。
而且,在设计热度算法时,需要多考虑极端情况,比如若在网站流量不大的情况下,一条初始热度最高的内容,是不是可能永久无法被初始热量最低的内容超越?
五、反作弊【深入理解热度算法:如何做好内容推荐?】在一些知名产品中,热门榜单往往伴随着数据造假,如果我们不能有效的反作弊,那么所谓热榜则相当于名存死亡,成了营销者的聚集之地 。
而至于如何反作弊呢,此文篇幅有限,不做深入,就先抛砖引玉下,比如:
1. 将不同用户对互动热度的贡献再次分级前文提到了我们需要对用户的不同行为分级,贡献不同的互动热度;现在考虑到许多刷数据者使用都是批量小号,具有一些区别于正常用户的特征,比如注册时长慢,活跃度低 。
那我们就可以对用户进行分群,比如新用户的点赞+0.3分,正常用户的点赞+1分,从而抬高了数据造假的难度和成本 。
2. 实时监控异常数据,若发现违规,将人工降权因为数据造假是很难模拟出像优秀内容那样的热度上升曲线,所以可以通过监控数据波动,来判断这条内容是否为自然增长,若察觉存在违规现象,则运营可以通过降权进行处罚 。
六、抖音视频的推荐算法讲完枯燥的理论,最后,再给大家分享下抖音是如何做内容推荐的,希望能帮助你更好的理解热度算法 。
首先,抖音有一个流量池的概念,不论新人还是网红,当用户新发一条视频后,抖音都会将它推荐给一定的人,即启动流量,可能是300-1000人 。
然后根据这条视频在流量池内的数据表现,比如完播率、点赞率、评论数、转发率等,再来决定是否要将这条视频推荐给更多人 。
而在数据达标之后,抖音会再将这条视频引向更大的流量池,让新的1W-10W人看到,即叠加推荐,以此类推,数据越好,叠加越多的流量 。
同时,上述所说的流量池是有区间的,决定具体数值,则就是上述影响因素的概念 。
抖音里的影响因素是哪些呢?
推荐阅读
- 如何更好的理解茶艺
- 10分钟理解TCP、UDP 和端口号
- 5分钟理解SSH的工作原理
- 深入理解Java中方法的参数传递机制
- 递归与动态规划算法时间复杂度的简单理解
- 仅需 5 分钟,彻底理解 cookie、session、token
- 简单理解JavaScript,TypeScript和JSX
- 要做到相互理解和包容 人是相互的 婆媳之间
- 深入理解TCP/IP协议
- 如何理解戒定慧三学 戒定慧三学