算法|我们需要什么样的“算法”?

您是否有过类似经历:在求职网站填写一份有关工作喜好的调查,网站会自动推送匹配的岗位;打开购物软件,发现页面上多是近期搜索或浏览过的商品;通过App阅读一条养生信息,随后便会经常收到养生知识、养生产品的广告推送……伴随着信息技术迅猛发展、大数据广泛应用,算法推荐技术正在将人们带入个性化、定制化、智能化更强的信息传播时代 。
因为算法推荐,互联网平台越来越能抓住用户的心,帮助人们更加方便、精准地获取信息,也牢牢吸引了用户的注意力 。据不完全统计,当前基于算法的个性化内容推送已占整个互联网信息内容分发的70%左右 。算法推荐逐渐成为各平台“基本操作”的同时,诸如低俗劣质信息精准推送、“大数据杀熟”等乱象也凸显出来 。
作为数字经济的重要推动力,算法如何实现更高质量发展?移动互联时代,我们究竟需要怎样的“算法”?
互联网平台越来越“懂”用户了吗?
“看完一个短视频后,平台会自动推荐很多相关视频,很方便 。”在北京一家企业工作的陈辉是某款网络对战游戏的“发烧友”,平时喜欢通过手机观看相关短视频来提高操作水平 。他发现,随着刷短视频的频率增加,平台推荐的相关视频越来越多,“游戏攻略、英雄介绍、对战视频都有,电商平台还会推荐鼠标、键盘 。”
这些平台的自动推荐功能,运用了一种叫算法推荐的技术 。这是一种通过人工智能分析和过滤机制对海量数据进行深度分析、完成信息内容与用户精准匹配的技术 。
自从1994年美国明尼苏达大学研究组推出第一个自动化推荐系统,算法推荐技术如今已深入到资讯、社交、电商、短视频、搜索引擎等平台和互联网应用中 。
互联网平台变得越来越“懂”用户,在极大方便用户获取信息的同时,也容易引发一些用户尤其是青少年不同程度的沉迷问题 。
“说好只看5分钟,结果一刷就是几小时 。”贵州省贵阳市的林忠信说,他12岁的儿子最近迷上刷一些恶搞的短视频,不仅影响学习成绩,与同伴一起进行户外活动的时间也少了 。
从去年5月底开始,全国主要网络短视频平台中推广青少年防沉迷系统 。在“青少年模式”下,大多数平台主要推送教育类、知识类等有益内容 。但是,在缺乏监护人照管监督的情况下,防沉迷系统效果容易打折扣 。
有受访者反映,一些新闻资讯、网络社交等平台的个性化推送存在“泛娱乐化信息多、低俗内容多、未经核实内容多”的“三多”现象;一些网络社交等平台防沉迷手段较少,容易导致青少年沉迷和盲目模仿 。
北京大学中国社会与发展研究中心主任邱泽奇对采访人员表示,对自我的偏好是人类认知偏好的一部分,“偏好”阅读可能加速形成“信息茧房”效应和“情绪传染”效应,前者易导致视野局限,后者易使个人情绪受他人感染 。
一些喜欢网购的人还可能因遭遇“大数据杀熟”而蒙受损失 。一些平台利用算法技术给不同类型消费者数据“画像”,判断其偏好、用户黏合度、价格敏感度等,使不同用户看到的价格或搜索的结果不同 。通常是老用户看到的价格比新用户贵,或搜索到的结果比新用户少 。
今年“双11”期间,北京消费者韩女士发现,她通过某App预订一家酒店,“同一时间,不同手机”预订,价格相差约1000元 。
9月中旬,微博上发起的一个投票显示,有1.5万人认为自己遇到价格明显差异的情况,占所有投票人员的近八成 。
“算法”是中性的,问题出在人身上
算法技术的重要意义在于,将此前基于人力的“人找信息”转变成基于电脑自动化运算的“信息找人”,既极大解放了人力,又更高效地完成了人和信息的匹配 。
从2012年起,互联网平台今日头条在业内较早将算法推荐系统应用到资讯领域的产品中,实现了系统的自动学习推荐 。据今日头条算法架构师曹欢欢介绍,推荐系统综合考量内容特征、用户特征、环境特征等因素进行决策 。例如,环境特征包括上班期间、上班路上、下班休息等不同场景下用户的兴趣偏好信息 。
为帮助用户发现更多兴趣点,今日头条不断引入多领域的优质内容生产者,并运用算法推荐给用户;推出“灵犬”反低俗助手,剔除低俗信息 。推荐系统还增加了消重和打散策略,前者旨在消除内容相似文章推荐,后者降低了同领域或主题文章的推荐频率 。
不过,在头部互联网平台切实严格自律的同时,仍有一些采编流程不规范、管理不严的网络社交媒体、新闻客户端在业务导向上走偏了 。主要表现在:
【算法|我们需要什么样的“算法”?】——向用户推荐劣质信息 。部分平台为留住用户,不断向用户推荐其关注过的相似内容,其中掺杂低俗媚俗、色情暴力、真假难辨、缺乏深度、价值观导向错乱等信息 。一些互联网平台为增加点击率和流量,还会进行人工推荐,主动推荐“博眼球”、打“擦边球”信息,很多用户直呼“辣眼睛” 。这反映出一些平台社会责任感缺失,更忽视了价值观建设 。
——增加用户权益保护难度 。一些算法推荐的内容过度强化用户偏好,影响了用户对于信息内容的自主选择权,加剧“信息茧房”效应,极易造成个体与社会的隔离,缺乏对当下国情世情的深刻认识和判断 。由于依托于用户浏览记录等数据,算法推荐若设计不当,还可能侵犯用户个人隐私 。


推荐阅读