算法,凭什么判定成年男人全是色狼?( 二 )


算法,凭什么判定成年男人全是色狼?

文章插图
不禁想问,现在的互联网平台,都如此评判人的喜好,明目张胆地推送涉黄信息吗?
算法如何判定用户是不是好色之徒
一位在曾在华为工作过的资深算法软件工程师赵学洪告诉陆玖财经,算法其实是通过对自然语言进行处理,以文档的形式形成一个关系数据库,基于用户行为和相关信息给用户加上算法标签,形成一个个的数据实体,数据实体在这一过程中将会被抽象出来,进行对应关系的匹配 。平台会根据自身设定的数学模型(算法模型)把这些对应关系放入数据库中,得到一个自身想要的结果集 。
算法模型在各个平台之间是通用的,但是每个平台之间采取的模型会有差异,这就直接导致了平台获得了不一样的结果及方向 。用户画像分析是算法数据搜集的一个过程,数学公式会根据每个平台的特性对用户画像进行对应的处理 。
用户画像的生成与用户过往的浏览行为、人口统计学相关信息(如年龄、性别、地域、兴趣等)以及相似用户信息等密不可分,然后基于用户画像对用户打上个人标签,通过对标签的分析和判断帮助用户进行信息过滤,形成用户的个性化推荐,也就是各大平台的推荐页 。
也就是说,算法先对“我”的信息展开分析和处理,然后将“我”和“我”相似年龄段的用户信息放入模型中,推算“我”是一名喜欢浏览美女图片、出入不明场所的色狼 。
赵学洪还介绍说,早期的算法比较死板,需要让用户自行选择喜欢的兴趣内容,为自己勾选标签,然后进行信息过滤和推荐 。而现在,以字节系为代表的算法技术已经可以脱离这一阶段,直接可以根据用户习惯推理这些标签,从而形成个性化内容 。
算法技术发展到今天,已经越来越趋向于智能化,但像上述事件那样智能,对人们而言究竟是福还是祸?
算法背后的价值观是谁赋予的?
算法也有价值观,你相信吗?
赵学洪在采访中告诉陆玖财经,控制算法的背后的人,存在价值观 。与其说是价值观,不如说是价格观,商业化才是算法背后的核心 。
平台通过用户行为生成算法标签,然后通过一系列大数据分析和推算,将用户信息和市场信息相结合,同时考虑平台自身信息的变化从而形成内容推荐,每天推荐的内容会根据当天形势形成较大差异和变化,甚至是精确到每个时间点都会有差别 。
算法作为平台吸引流量和完成商业化的工具,自然也就受到自身归属平台的影响,形成了价值观 。
他举了这样一个例子,新浪微博的热搜和今日头条的热搜往往会有较大的差异,但按理说在一个时间点,人们关注的事件会有很大的关联性和交叉性,但是因为平台本身受众和平台关注的热点存在差异,导致热搜内容存在较大出入 。很多时候可能不是我们想要关注这些热点,而是这个平台想让你觉得它是热点,就让它出现在了热搜推荐栏 。
这些互联网平台里的内容和服务,通过竞价排名,出价高者可得优先推流权,平台在这一过程中收取内容或是服务提供者的推流费和服务费,通过一些技术性手段,将这些内容提供给用户,并且让这些内容表面看上去没有什么破绽 。
所以,那些中年男性被判定为色狼也就不难理解了 。算法通过猜测用户喜好生成推荐,平台为了吸引流量,往往会利用人们的好奇心和兴趣,在提供内容时加入刺激性的信息 。
某内容平台高管向陆玖财经爆料:之前,我们平台要是出现流量数据下滑的情况,往往会在晚上发布一些美女图片,第二天一般流量就会回到正常水平甚至出现小幅提升 。
这些平台提供给你的刺激性信息,在达成KPI方面,事实证明是有效的 。
一位前互联网公司高管告诉陆玖财经:只要平台是以KPI(绩效考核)为导向,就会有打擦边球的现象出现 。的确,互联网公司往往以PV、UV、停留时长等作为一款产品或应用的KPI考核点,而这些数字背后,都代表用户的上网行为 。用刺激性信息引导用户驻留,就成为很多算法工程师工作的重要内容 。
算法背后的规则制定者利用人性的弱点在作恶,算法本身或许并不具有价值观,但因为它依附于平台,存在一定目标导向,它就有了价值观 。
算法其实是一把双刃剑
某互联网公司对于平台提供涉黄信息向陆玖财经做出回应,目前平台上提供的内容和服务,先由机器根据文字的关键字、图片的图形分析等进行过滤和筛选,一般能甄别出90%的不良信息,那剩下的10%交给人工 。虽然这个比例看上去比较小,但实际操作起来,信息量依然很大,其中难免会存在疏漏,导致一些敏感信息未被及时处理,提供给了用户 。


推荐阅读