人工智能|人工智能正在冲击整个新闻行业


早在2014年 , 《洛杉矶时报》就在地震发生的三分钟之后发表一篇报道 。 这一壮举的实现 , 源自该报社某位员工开发的Quakebot机器人(一款软件机器人) , 其能够根据美国地质调查局发布的数据自动编写文章 。 时至今日 , 每周多达数十万篇主流媒体发表的文章都出自AI技术之手 。
人工智能|人工智能正在冲击整个新闻行业
本文插图

【人工智能|人工智能正在冲击整个新闻行业】起初 , 生成这类文章的大多数自然语言生成(NLG)工具主要由Narrative Science等软件企业提供 。 但越来越多的媒体组织开发出适合自身需求的内部版本 。 BBC拥有Juicer , 《华盛顿邮报》拥有Heliograf , 彭博社发布的近三分之一内容都来自一套名为Cyborg的系统 。 这些系统以数据为起点 , 通过图形、表单与电子表格进行内容分析 , 提取特定事实 , 并将其作为叙述的构成基础 。 他们还为文章制定结构规划 , 最后使用自然语言生成软件将一个个句子填充到框架中去 。

这些系统只能依靠高度结构化的数据作为输入 , 据此生成文章——适用的数据类型包括足球比赛视频、或者企业年报中的电子表格数据等 。 可以肯定的是 , 它们写不出需要天赋、想象力或者深入分析的文章 。 结果就是 , 这类系统的出现并没有替代成千上万采访人员相反 , 它们让采访人员的日常工作更轻松、也让以往某些因受众过少而鲜有报道的领域得到媒体关注 。
正如《经济学人》杂志高级编辑Kenn Cukier所言 , “我们必须坦言:这类系统出现之后 , 最大的受益者是公众 , 而不是新闻从业者 。 但我们在打字机刚刚出现的时代没有拘泥于羽毛笔 , 现在也不应该对AI写手过分抵触 。 这一切都是为了在小众市场上建立起规模化效应 , 否则单靠人力将永远无法实现成本效益 。 ”
当计算机拥有自己的观点

作为前BBC采访人员 , Cait O’Riordan如今担任《金融时报》的首席产品与信息官 。 她坚信 , 在可预见的未来 , 文章生成系统并不会取代人类新闻工作者:“人类读者希望看到意见控制分析 , 而不仅仅是算法处理后的结构化数据 。 ”她当然承认 , IBM的Debater项目等系统已经能够很好地模拟人类分析观点 , 但在她看来“如今媒体行业并不缺观点 , 真正缺少的是精彩的观点 。 在这方面 , IBM还有很长的路要走 。 ”Martin Wolf与Yuval Harari这样的一流采访人员不太可能被AI系统所取代而且真正的问题在于 , 随着观点的泛滥 , 新的意见领袖似乎越来越难以出现 。
另一个有趣的可能性在于 , 文章将针对特定的小众群体量身定制 , 并最终让每个人都拥有适合自己的报道可看 。 例如 , 如果某家研究组织宣布调整汽车胎压最多可将行驶油耗降低7% , 那么读者可以根据自己的具体车型、每周行驶里程数甚至是驾驶风格来获取更有针对性的参考内容 。 “我的日常新闻”这个想法已经存在多年 , 谷歌新闻等多种服务一直在以比较简陋的方式努力达成这个目标 , 包括帮助用户管理最适合其口味的新闻报道 。 未来 , 哪怕只有一位读者感兴趣 , 媒体也许都有能力为其提供定制化的报道文章 。
运用AI发现趋势与偏见

《金融时报》使用AI技术解决的另一大难题 , 在于发现经济体之内与市场当中的种种趋势 。 作为一家英国媒体 , 《金融时报》自身的内容就很适合进行这类分析 , 并结合其他数据源给出令人眼前一亮的汇总性结论 。
《金融时报》还使用机器人帮助自身解决偏见问题 。 以美联储前任主席Janet Yellen命名的Janetbot系统 , 能够分析报道中所出现面孔的性别比例 。 遗憾的是 , 这套使用新闻行业大规模照片样本训练而成的模型目前已经暂停使用 , 理由是该样本缺少种族差异性、不足以对图像中的性别做出可靠检测 。


推荐阅读