GAITC专题丨Jim Kennedy:人工智能让我们以更低成本报道更多新闻

7月26日,由中国人工智能学会主办、新浪新闻联合浙江大学承办的2020全球人工智能技术大会(2020GAITC)“AI时代下的新媒体与社交娱乐”专题论坛拉开帷幕,新浪集团首席信息官、新浪AI媒体研究院院长王巍,浙江大学特聘教授、悉尼科技大学教授、百度研究院访问教授杨易共同担任论坛主席 。
美联社战略和企业发展高级副总裁Jim Kennedy在本次专题论坛上,与来自业界、学术界的嘉宾们分享了《人工智能如何升级新闻工作流程》 。

GAITC专题丨Jim Kennedy:人工智能让我们以更低成本报道更多新闻

文章插图
美联社战略和企业发展高级副总裁Jim Kennedy
Jim Kennedy提到,人工智能是辅助人类新闻的一个强大工具,而不是取代人类的工具 。话虽如此,但也不得不承认,人工智能和自动化十分有可能对我们的商业模式和整个新闻行业产生深远的影响 。“事实上,从我的经历中可以看到,影响已经发生:人工智能可以报道更多新闻而无需增加人类工作量,并且增加我们为用户提供的真实价值 。”
他认为,在一个全球互联的世界里,新闻周期永不止息 。毫无疑问,我们需要我们所能获得的一切帮助 。而人工智能技术有望让我们以更低成本报道更多新闻 。
以下为Jim Kennedy演讲实录,内容经编辑略有删减:
大家好,我是吉姆·肯尼迪 。我是美联社的战略和企业发展副总裁 。美联社是一家全球新闻机构,在世界250多个地方设有分社,报道的新闻涵盖各种媒体格式,有图文、音频和视频等 。在此,我首先感谢中国人工智能学会的邀请,让我有机会在这里与大家交流,分享我对人工智能和自动化在新闻领域的广泛使用 。很遗憾,这一次我无法在现场与大家面对面交流 。我之前来过中国多次,给我留下许多美好回忆 。我希望不久的将来可以再次来到中国与大家见面 。不过,今天,我们只能线上交流沟通了 。我为今天的演讲准备了一份简单的PPT,和大家分享人工智能如何用短短的数年时间在新闻行业扎根和发展 。
2013年,美联社的一名同事邀请我参加一场会议,讨论自动化文本新闻创作的可能性 。当时,我对此不是很有兴趣 。我过去见识过这些技术的“创作水平”,感觉非常一般 。我之前看到的那些机器创作的新闻故事读起来非常不自然,而且内容也很无聊 。所以,我不是这方面的爱好者 。但是我的同事说服了我,他说如今技术已经有了很大的进步,应该重新去了解一下 。那天,我们去了一家创业公司,这家创业公司以报道体育新闻为主 。他们将棒球和橄榄球的结构化数据集变成叙述性文字,为体育迷带来有趣的故事 。公司的首席营销官给我递上一份他们的新闻报道打印稿,内容和美国职业棒球大联盟的一个球队有关 。并且,这篇报道完完全全是计算机撰写的 。当时我很惊讶,准确来说,是非常震惊 。专业新闻报道该有的要素它都有,报道还对比赛做了详尽的回顾,选手的介绍也恰到好处,甚至报道的语气语调也十分贴近该球队球迷的喜好 。从那一刻起,我意识到,机器一定会走进我们的新闻编辑室 。
我们完全没有理由去阻止它们或惧怕它们 。当时我们没有意识到——但后来才慢慢明白的一件事是——我们才刚刚踏上人工智能阶梯的第一个台阶 。日后,我们会使用自然语言生成,这是一种算法,通过将结构化数据集转换为模板化的叙述性文本报道,从而创作出成千上万的体育类、商业类等各种技术报道 。于是,我们马上在体育领域展开试验,为每一个全国橄榄球联盟里的运动员、为每一场比赛撰写独立报道 。
想象一下,2013年赛季,我们要为每一场比赛、每一个运动员撰写报道 。这意味着每周我们需要撰写350多篇独立报道 。我将其称之为一次“严峻的考验”,这是我们在美国用来描述绝对结论性实验的一种表达方式 。因为我们从来没有要求任何人类采访人员去完成这样一项繁重的任务 。这项任务,哪怕是一个部队,也需要花上几小时才有可能完成,涉及大量人力劳动,繁琐又费力 。但是我们发现,我们的自然语言生成程序仅花了数分钟就完成了任务 。这个试验让我们相信,这项技术必将大有作为 。所以,接下来,我们把目光投向另一个更加庞大且复杂的任务 。
自动撰写美国上市公司的季度收益报道 。在美联社,传统的季度收益报道仅关注前300家上市公司的每季度财报 。但是通过将数据输入到文本自然语言生成程序里,我们可以将输出的报道数量提高10倍,几乎覆盖股市里所有的上市公司——大概超过4000家上市公司 。正如你在幻灯片里看到的,这个过程涉及到创建每家公司季度收益的结构化数据文件,然后将这些数据文件输入到自然语言生成程序,生成计算机撰写的叙述性报道,当然报道的模板还是由美联社的采访人员设计 。


推荐阅读