|传媒观察丨算法新闻,拥抱人工智能谨防“技术霸权”

编者按:人工智能技术的崛起和广泛应用日益将我们置于一个大数据和算法环绕的世界,算法的权力无处不在,从股票交易量化分析到创作音乐,从购物网站智能推荐到自动驾驶,处处都有算法操盘运作的痕迹 。算法可以决定一个人的贷款申请是否获批,也可以决定当你打开手机浏览新闻的时候看到什么样的推送 。北京大学新闻与传播学院博士研究生敖鹏在《传媒观察》2019年第1期刊文,梳理算法在当下欧美数字媒体环境中的前沿应用实践,探讨其如何影响和变革新闻的生产流程,以及在这个过程中产生的不容忽视的新闻价值判断、客观性、算法责任等问题 。
算法新闻,拥抱人工智能谨防“技术霸权”
敖鹏
作为新闻生产过程中的全新中介,算法给以新闻业为代表的公共信息和知识生产带来了一场全新的范式革命,在传统新闻业的方法论和观念认知层面带来突破和挑战,激发人们在全新的数字环境下重新思考新闻是什么,承担着公共知识生产功能的新闻要如何拥抱变化、同时又应该牢牢坚守什么 。
锚定新闻:从海量信息中发现事实线索
在寻找新闻线索方面,算法作为一种数据驱动式的直觉雷达,通过一系列实时监测、聚类分析等机器深度学习功能进行数据挖掘,帮助采访人员在庞杂无章的信息环境中快速锁定到有价值的信息 。算法可以通过对数据的量化分析,穿透表面纷杂将信息深处隐藏的特质或问题呈现出来,帮助导引人类采访人员将注意力关注到有价值的信息线索上面,从而生产更为有意义的报道 。比如BBC的研发实验室就在Github里面开发了一款名为Data Stringer的应用程序,帮助采访人员监控不同数据库的实时更新变化,在某一地区某一时间失业人口激增、犯罪率激增等情况发生时给予采访人员提示,成为新闻生产链条上的关键起始环节 。路透社则开发了专门的社交平台监控器Tracer,运用各种数据挖掘能力帮助采访人员实时关注社交媒体上大规模的内容信息走向 。除了强大的监测预警功能,算法还可以通过对惯常数据的系统深度分析发现出乎人们预期的线索 。这一应用目前最具知名度的案例就是BuzzFeed News在2016年关于网球赛造假丑闻的调查性报道《网坛骗局》(The Tennis Racket),采访人员对2009-2015年间26000场专业网球比赛的赌球数据和比赛数据进行深度发掘,从数据的异常发现了球员欺骗行为的存在 。算法在这一过程中,为有价值的新闻线索的发掘提供了更为客观可靠的实证依据 。
深度学习:对素材进行精密分析与核查
算法主导的深度发掘可以帮助采访人员更深刻地理解并驾驭日益广泛的数据和资料,为采访人员提供全新的报道视角或是对事件进行深层次、全方位分析,以及用于求证信源消息的可靠程度等等 。从目前的应用来看,算法深度发掘主要有三种类型,监督式学习(supervised machine learning)、非监督式学习(unsupervisedmachine learning)和强化学习(reinforcement learning) 。监督式学习(supervised machine learning)依赖于标签化的数据建立分类和回归体系,可以揭示数据之间的联系,对数据信息进行深度分析,帮助新闻采访人员挖掘到事件背后更为深刻的现实,获取更为独到的解释视角 。比如,2016年,亚特兰大宪法报在医生性侵问题的报道方面,通过对十万多封机构文件进行挖掘分析,发现普遍存在医生在性侵不当行为发生后仍然继续正常执业的事实 。非监督式学习(unsupervised machine learning)不依赖于预设的标签,可以用于揭示很多事物之间预期之外的关联,透过互不相干的信息表象挖掘出内在联结特征 。强化学习(reinforcement learning)试图在算法进行决策的每一次都最大化奖励函数,找寻在具体情境中结果最好的方法,比如被应用于测试不同的报道标题以找到最佳标题 。这三种类型在新闻业素材分析领域发挥着重要功能,独立或交叉应用于不同的情境,有效帮助新闻生产过程中的素材分析处理、趋势预测以及事实核查等方面,提高新闻报道的精度和深度 。


推荐阅读