连美女主播都是机器人了,新闻业会成为AI的天下吗
全文共3437字,预计学习时长7分钟
人工智能逐渐渗入新闻业,新闻报道和新闻消费的方式将发生重大变化。
由Luka Lavrenci绘制在传统新闻业,经验老道的编辑挑选重要的新信息,然后把这些信息传达给读者。那么,在加深读者原有的兴趣和观点方面,人工智能拟人化趋势能否走得更远?
如果你是新华社的观众,你可能已经注意到,三月份在电视上发生了一些奇怪的事情。
在第十三届全国人大二次会议期间,播音员新小萌报道了一则有关人大代表已搭乘火车抵达目的地的新闻。新小萌其实是一个超现实的计算机生成模型,能够机器学习模仿真实新闻播报员的面部表情和演讲模式。
新小萌是新华社AI新闻主播生力军中的一员,他可以准确地播报输入的信息,不会疲惫,不会犯错,也不会抗议。
“在播音员短缺的现状下,机器人主播似乎充满吸引力。”
现在,因为此系统仅限于将文字转化为语音,新小萌的播报内容由人类书写。要真正理解人工智能正在如何改变新闻业,你需要了解屏幕背后的运行规则。
自动播音
今年1月,《卫报》发布了一篇有关澳大利亚政治捐款的文章,署名为ReporterMate。《卫报》称,ReporterMate是一种“试验性自动新闻报道系统”,可以通过分析已有数据迅速写出对应的短讯。该系统的设计者Nick Evershed认为,“新闻机构员工不足,但需要处理的新闻很多”,而人工智能主播可以帮助处理模式化的新闻,人们从而可以得到更多时间去进行有意义的调查。
据皮尤研究中心称,在美国,新闻编辑室的雇员数量从2008年到2017年已经下降了45%。而在年初,众多电子新闻报刊,包括BuzzFeed和Vice,员工缺口超过2000。因此,机器人主播非常有吸引力,它可以整合数据,发布常规报道,而同时其他人类员工可以把技能用在编写更加复杂的故事上。
“它们不只是做职业记者通常会做的事情,还有能力比他们做更多的事情——至少稿件数量更多。”
但人工智能的吸引力不只在填补工作空缺。《华盛顿邮报》的战略方案主管Jeremy Gilber说道:“我们可以创造一些没有人工智能我们可能不会去写的故事。”过去几年,《华盛顿邮报》内部也使用了一种叫作Heliograf的自动化技术。在2016年里约奥运会上,Heliograf生成了数百条有关奥运会的短报。在2016年美国大选期间,它报道了将近500条竞选消息。
Heliograf不只是报道几条政治竞选的预测新闻,而是让其中一家新闻机构报道绝大多数有关政治竞选的新闻。在2014年,美联社也开始使用人工智能撰写金融新闻。在此期间,公司收益报告数值增长了十倍,而这个数值足以影响到金融市场上的贸易交易量。通过使用一种不同的系统,美联社能够很快导出关于1250个北美职业冰球联赛项目的预测。Heliograf不只是进行职业记者通常会做的事情,而有能力比他们做更多的事情——至少在稿件数量上。
算法内容管理
处理机器生成的数据蔓延,使其更好服务于读者会比较复杂。为了避免首页充斥数百篇有关政治竞选的文章,在2018年美国中期选举期间,《华盛顿邮报》使用互联网定位技术向用户提供相关的新闻。比如说,如果你在宾夕法尼亚州,该网站就会让人工智能生成与你当地相关的竞选报道。
Gilbert说,“重点不在于给很多人写一篇报道,而在于从很多报道中找出不同的人所适合的那篇。理想情况下,我们想要创造一种平台,在上面有你愿意分享的信息,并且我们可以提供给你一些你可能感兴趣而其他人不感兴趣的文章。”
路透社执行编辑Reg Chua也对此持有相似看法,他说,“我们始终坚持将写的内容发给尽可能多的人看。这很像是同时面向所有人的传播,这种传播方式需要更加精彩的故事才能足够吸引到尽可能多的读者。”
但是,Req Chua又问道,如果新闻机构的报道覆盖面太广,使得这个模式反而本末倒置了呢?“我写的是一篇关于英国学校和运作的文章,但是读者实际想要了解的是他们小孩在学校表现如何。那么我可以将人工智能和自动化相结合,这样你就可以获得一篇专属的文章了。”
体育比分、政治结果、放假和学校表现报告都是无足轻重的领域,人工智能可以编造数百篇微观报告并将其发送给目标人群。在传统新闻业,经验老道的编辑挑选重要的新信息,然后把这些信息传达给读者。那么,在增进读者现有的兴趣和观点方面,人工智能拟人化趋势能否走得更远?
英国数据科学和人工智能国家研究院——艾伦图灵研究所数据伦理研究员Josh Cowls警告道,“对读者个人兴趣和偏好的表现进行细微调整后的内容,即使只在一种出版物内发布,仍可能会产生回声室效应。” Cowls说在油管可以看到类似情况,油管的推荐服务由于给人们推荐极端内容而备受指责。“你可能会加深人们本身的想法。阅读新闻的偏好会带来你已经看过的,从而使得你的选择越来越少。”
折纸新闻
人工智能使文章推送对象的选择变得更加复杂,同时也在决定个人故事中显示何种信息中发挥着决定性作用。《华盛顿邮报》的Gilbert称,令他感兴趣的是机器智能是如何在对读者已有了解的基础上去改变文章的结构的。
他以目前委内瑞拉国内争端为例,说道,“对于一些人来讲,我们只需要告诉他们马杜罗做了什么,或者是救援卡车是否已经跨越边境。因为他们一直在追踪这个事情,所以新信息很重要。而另一方面,对于一些没有持续关注这个事情的人,我们需要告诉他们事情牵涉到的各方,发生的原因以及时间。”
如果你试着把网上文章看作一张折纸而不是数据点,那么这张折纸露出哪一部分取决于是谁在阅读这篇文章。在这种情况下,人工智能成为了编辑,重新编辑文章使其适合不同的人群。Gilbert说,这种情况无疑改变了记者、编辑、新闻和受众群之间的关系。
但是这四者的关系是否因此而变得更好了呢?人工智能拟人化帮助节约读者时间与失控混淆视听之间的界限在哪? Cowls认为,输入系统数据将受众群和新闻本身看得一样重要,这会带来道德问题。在法律上,它获取了个人信息;在道德伦理层面,它牵扯到了身份和偏好问题。
为不同人提供不同阅读内容——“对传统新闻编辑道德的真正挑战。”
对于算法而言,向读者展示哪个版本的故事取决于读者对这个话题了解多少。尽管算法可以通过读者浏览的历史记录来获取相关信息,但是这会牵扯到此行为是否和数据收集法相一致。欧洲的《通用数据保护法》对于公司如何使用个人信息有严格的规定。更通俗来讲,新闻在构建读者知识世界上可以做到何种程度?有一个积极应对的方法是询问读者感兴趣的阅读内容,从而向他们推荐相似的故事。许多媒体公司已经采用了此方法,包括Medium。也有一种可能就是媒体公司在读者没有察觉的情况下,使用机器学习被动地了解读者兴趣。但同样,信息使用和公众言论使他们进入困境。
路透社新闻业研究高级研究员Lucas Graves赞同根据不同人提供不同阅读内容是对传统新闻编辑道德的真正挑战。今天的编辑们以专业视角来安排新闻的布局,所以把决定权交给电脑会使得新闻编辑室与以往完全不同。
机器调查
毫无疑问,机器学习最具潜力的部分并不是面向受众的新闻业,而是挖掘出可供职业记者研究的故事。
路透社研制出了一批新闻收集人工智能系统,包括News Tracer——该系统用算法扫描大批讨论同样事件的推特来挖掘爆炸新闻。其验证信息是否可靠的手段包括推特账号是否通过验证,账号的关注者,是否有相关媒体和推文的结构。
另外一个路透社项目——Lynx Insights,可以搜寻类似于股票和体育成绩的大数据,标记数据趋势和异常,甚至会在将其转交给职业记者前写几句话。和机器人记者相比,Lynx Insights更像一个记者的个人数据研究员。这种方法类似于BuzzFeed训练算法筛选飞行数据以识别间谍飞机,以及ProPublica使用机器学习来研究成千上万条新闻稿来分析国会谈论内容。
路透社记者Chua说道,“人工智能最大的用处可能在于分析数据。在未来你可以看到这些功能是如何相互结合的。你可以自动分析人工智能系统内的数据,然后再自动将其变成一个故事。”
这些自动化的环节最终互相联结是大势所趋。类似路透社的Lynx Insights的系统可以自动找到一个潜在故事,将这些信息提供给《卫报》的ReporterMate进行编写,然后将这样的故事交给像新小萌这样的机器人新闻播报员在电视直播上播报,整个过程都不需要人类的存在。
Cowl说:“这个过程的机械化程度越高,我们的疑问也越多‘等下,附加值是什么?’如果我们要做的只是收集事实并将他们传播出去,那么编辑的附加值是什么呢?这种想法很危险……你可能最终会陷入困境,觉得在这个过程中,整个刊物乃至故事的真实性降低了。”
好在这种反乌托邦的新闻自动水平几乎不会发生。Chua和Gilbert都承认我们正处在人工智能适应新闻业的早期阶段,而这项技术尚未成熟,仅仅是内容最为丰富的数据集而已。《卫报》记者Evershed称,在一段时间内,我们仍然需要记者。
就算我们实际并不在探讨机器人播报员自动播报新闻这件事情,但我们仍需谨慎行事。考虑到人工智能系统制造的信息仍然作为故事可信度中的一部分,不管其制造的是背景信息,话语本身,或者是找到的读者,我们都应该时刻重点关注这些机器制造的新闻。毕竟,读者是人类。
留言 点赞 关注
我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”