我爱编程

深度|人工智能时代:新闻业的谢幕与重生

2017-06-23  本文已影响303人  CoverUER

[行业动态]

转载自:腾讯研究院

6月21日下午,互联网前沿沙龙PRO举行,相关领域专家就人工智能对于新闻业的影响进行了主题分享和圆桌讨论。腾讯研究院发布了《人工智能时代:新闻业的谢幕与重生》报告,并就新闻业面临的挑战和机遇及新闻业的意义进行了思考和论述。以下为报告节选。

对于新闻业来说,这是最好的时代,也是最坏的时代。

在生产端,媒体终于迈进自动化门槛。机器人替代普通劳动力不仅发生在富士康等制造业,如今也进入智力密集的新闻业。腾讯Dream Writer如今已累计生成了三万多篇稿件;全球最大通讯社美联社早在2014年7月开始使用机器人新闻记者撰写财报新闻。

在分发端,以天天快报、今日头条为代表的个性化阅读客户端,也在掀起一场巨大的变革:把新闻的编辑发布权从人让渡给算法。当然,算法终归也是人来编写,但是主导这一过程的不再是传统的编辑,而是程序员或者由程序员和编辑组成的跨界小组。门户网站在勃兴十多年后又掀起了一场自我革命:那些最初招聘来的编辑将何去何从?在这之外,社交网络则扮演着更为主流的新闻分发平台角色——你的亲人、同事、朋友正在成为决定你每天看什么新闻的那个人,从这点看,我们似乎又回到了人际分发的乡村田园时代。

在接收端,深度阅读可望不可及,纯文字的传统阅读变得更为小众化和精英化,图片和视频开始升格为21世纪主流文本表现形式。微信公众号一篇图文的平均阅读时间只有区区80余秒,全球用户都在经受注意力涣散的阅读大转折。新世纪的数字难民,不再是无法接入互联网的人群,而是沉溺在互联网海量信息之中无比焦虑的网民。这无疑极具讽刺:我们面对着信息的大海,却依然干渴难耐。海量信息在拓宽消费选择边界的同时,也加剧另一种短缺——过滤。

过去,传统媒体扮演着信息过滤器的角色,这也是法兰克福学派所批判的“景观社会”——媒体只对社会做有选择性的呈现,最终受众得到是一个扭曲的景观。今天,人工智能是否能够呈现一个更加客观还是更加扭曲的社会镜像?人工智能之于新闻的影响,是正向还是负向、是技术性的还是根本性的、是短期还是长期?回答这些疑问,首先还需仰赖于以下几个问题的解答:

“第一,相比其他行业,新闻业是否存在特殊性?”

我们从新闻客户端中点击一条新闻,与我们从自动售卖机中购买一听可乐,这两个动作是否可以等量齐观,如果是,其区别只不过一个是为了满足大脑、一个是为了满足口腹之欲,那么我们完全不必为新闻业的跌宕起伏而担忧。但如果我们承认,新闻不是一种简单消费品时,那么衡量其价值的标尺,也不应该只有产值、活跃用户数这些资本市场感兴趣的维度。毕竟,在西方社会,媒体长期扮演着立法、司法、行政之外的“第四权力”的角色,它不仅取得了商业的成功,同样也扮演着社会守夜人的角色。这一点也表现在好莱坞的价值观中,从《罗马假日》到《纸牌屋》,新闻从业者人物设定的主流都颇为积极、向上。

“第二、人工智能是否将全面替代记者编辑?”

现阶段,无论是自动写作软件、还是视频自动剪辑,都不过是对传统新闻从业者的初级拟态,从这一点看,人工智能短期内取代的主要是菜鸟写手,媒体老炮们的地位依旧岿然不动,理论上不会引发新闻业大规模的失业浪潮。但是,如果未来人工智能加速进化,发展出不同于图灵机之外的技术逻辑,那才是新闻业真正的凛冬。

“第三,新闻业的意义是否正在转变?”

我们无法想象五十年后的世界,一如五十年前无法预测今天的科技成就。回溯新闻业十多年的历史,两大蜕变趋势十分明晰:其一,新闻的生产和分发正在分离,传统新闻机构容易依赖平台公司的分发,且在内容生产上主动揣摩、跟进平台算法吸引用户注意;其二,新闻的意义之墙正在瓦解,社会教化、监督功能弱化,娱乐功能空前膨胀。电视时代开启的大众传播娱乐化浪潮,在互联网时代更为澎湃,当物质生产日益丰腴的今天,娱乐在整个内容产业中发挥引领性作用,新闻业亦不能幸免,由此不难解释,为何王宝强离婚事件引来数亿群众围观,而事关司法公正的聂树斌案仅仅在社交网络激起浅浅涟漪。这正是当下新闻业所面临的困境:拥抱人工智能可能被其吞噬,而抗拒新技术无异于自杀。从悲观的角度看,人工智能正在摧毁传统新闻业残存的基础;从乐观的角度看,人工智能正在把新闻业变成一个全新的内容产业的一部分。

在科技进步推动之下,新闻从业者所拥有的生产工具可谓前所未有的强大而又唾手可得:就在20世纪初,一篇新闻稿件的问世,从记者接获新闻线索到采访、整理、写作、编辑、校对、排版、印刷、配送,全程往往需要经历十几个环节,最快也需要在隔日才能抵达读者。那个时代,人们习惯用“飘着油墨香味”形容最新消息。今天,人们早已无需通过嗅觉去感知新闻的新鲜度。这一切几乎都可以在线完成,记者从社交网络中获取信息,在即时通讯软件做视频采访,最终通过文字、图片、视频的方式直接发布,跳过了纸张、印刷、运输环节,直接把新闻推送给用户。这个推送动作,甚至不需要记者或编辑直接完成,而是通过一套算法推荐给感兴趣的用户。

“机进人退”人工智能对新闻业的摧毁式创新

人工智能的发展,推动新闻业直接从手工业阶段跨越到流水线大工业时代,从内容生产、渠道分发、用户信息反馈,新闻业正在经历有史以来最为震撼的大变革。资深的业内人士笃信人工智能将主宰未来的新闻业:彭博社总编辑John Micklethwait认为AI技术将对新闻业的未来起到决定性作用;《纽约》杂志作者 Kevin Roose称 “自动写作将是未来新闻行业最佳发展趋势。”Narrative Science预计,到2020年前后,90%以上的新闻报道都将由机器来完成。

在这一过程中,传统报刊、电视、广播媒体的影响力将进一步衰弱,而拥有技术优势的新媒体、特别是一些超级信息分发平台开始成为新闻业的新枢纽,它们掌握先天的强大渠道分发优势,并借此进一步影响上游内容生产,以便更好满足用户胃口。人工智能技术在媒体的应用,某种程度上也是一场机器对人力的大范围替代,新闻业的灵魂正在从“写作者的情怀”让位于“工程师的严谨”,“机进人退”的幕布拉开了。

一、内容生产智能化:新闻业的机器之心和魔幻之手

早在2006年,国外媒体就已开始应用人工智能写作。相比于美国、英国等发达国家,中国人工智能在媒体领域应用的开始时间较晚,不过近几年也在迎头赶上。

1、文本生成:新闻业的机器之心

部分新闻媒体机构都已经采用人工智能撰写稿件。

由Automated Insights 公司研发的Wordsmith写作系统,其工作过程有点像填字游戏。用户可以生成一些语法路径,其中的信息可以下载和修改。比如,这样一个句子“(某公司)的收入(增长/减少)的百分比(%)。Wordsmith接下来就把相关的公司财务信息填充到这个句子中去。类似的语法路径应用广泛:“(某足球队)以(比分)击败(某另一足球队)”或“(某电影)周末票房达到(美元)”等等。这些例子最终可以汇聚成一些豆腐块文章。Wordsmith所生成文章的深度,主要取决于用户加入的词语和短语的总量。通过搭建这些句子段落,用户可以确信Wordsmith能够搞清楚语义关系。和受过新闻专业训练的记者一样,自动写作系统也会犯错误。从2014年7月起,每一篇由Wordsmith生成的报道,美联社都会安排编辑进行审查,每一次编辑对稿件的勘误反馈,都会提升机器学习的能力。现在,Wordsmith的错误率比人类同行要低许多。

美联社于2014年7月开始使用Wordsmith平台撰写财报新闻;《洛杉矶时报》通过写作软件,从抓取美国地质调查局发出的预警数据,到生成报道并发布,只需3分钟。其他机构应用人工智能进行自动化编辑情况:

应用人工智能进行自动化编辑的机构

腾讯网、搜狐网、新华社等机构在人工智能方面也有所尝试。

2015年9月10日,腾讯财经推出自动化新闻写作机器人Dream Writer,主笔发布了首篇新闻《8月CPI同比上涨2.0%创12个月新高》,该报道抓取了国家统计局发布的CPI相关数据,同时援引了行业专家和业内人士的分析。据Dream Writer的研发团队透露,它的内容生产方式主要是基于大数据分析平台,在短时间内选出新闻点、抓取相关资料,通过学习固定的新闻模板生成稿件,它的优势在于适用在信息量巨大的财经资讯类新闻,在准确率和时效性上都完胜人类记者编辑。

2016年2月18日,搜狐宣布正式推出智能股市播报系统“智能报盘”,利用人工智能的自动跟踪技术,及时捕捉股市动态,自动化生成并发布资讯。“智能报盘”基于对股市大盘和个股行情盘面变化,进行纯粹客观描述。

除了腾讯Dream Writer和搜狐的“智能报盘”,类似的还有新华社的机器新闻生产系统“快笔小新”。它通过对数据采集、加工,并进行自动写稿、编辑签发,以最快的速度地完成例如体育赛事、中英文稿件和财经新闻的自动撰写等。目前,“快笔小新”服务于新华社体育部、经济信息部和《中国证券报》。在新华社体育部,它可以快速生成中英文数据消息,包括每轮比赛的成绩公报和积分排名;在《中国证券报》,它可以写一句话的报盘、一段话的公司财报、快讯等。新华社机器人发稿系统研发团队成员、技术局高级工程师熊立波曾介绍,机器人写稿流程分数据采集、数据加工、自动写稿、编辑签发4个环节。技术上通过根据各业务板块的需求定制发稿模板、数据自动抓取和稿件生成、各业务部门建稿编审签发“三步走”来实现。

与普通的编辑人员不同的是,智能写作机器人通过文本风格模式的识别,使用算法进行数据加工处理,并运用计算机程序自动化生成文本内容。相比普通的新闻记者,“智能记者”在时效性、准确性上更加具有优势可言。目前,人工智能在新闻媒体内容生产领域的智能化应用还处于比较基础的状态,能做到效率的提高,还未能进行更加深度的分析和解释。

2、视频剪辑:后文字时代的魔幻手

相比文字,人工智能在视频领域的应用相对更为普遍。

图片视频信息获取方面,无人机航拍、无人车地面拍摄、无人船的水下摄影等,通过最大限度延伸人类的拍摄能力,可以无死角呈现世界的全貌。此外,可穿戴设备在媒体领域的应用也逐步凸显。例如一些智能眼镜产品可以实现精准的拍摄和第一视角的图片与视频摄影录制,推动了媒体领域的技术创新。

人工智能在图片处理领域,利用神经网络、深度学习等技术,可以让普通用户也能享受奇妙丰富的艺术和娱乐体验。俄罗斯科技公司研发的图片处理软件Prisma,能在短短十几秒内,将手机相册或随意拍照的任意一张照片转变成特定风格流派的图片。与传统滤镜的简单叠加不同,Prisma主要基于机器学习技术的应用,通过导入无数张图像,不断训练其学习图片的颜色、结构和纹理,进行各种风格的识别和图片转化。其他机构人工智能技术在内容转换方面的应用:

人工智能技术在内容转换方面的应用

二、内容分发智能化:编辑权利的让渡

在很长一段时间,编辑掌握了内容分发的权利,我们读什么、听什么、看什么,都是由少数媒体精英所决定。今天,随着用户数据的积累,内容推送的权利,正在由有血有肉的编辑让渡给算法。相比人工分发,机器分发的优势主要体现在效率上:

一是机器分发能够对海量内容进行深度加工。人工智能干预的内容数目受限,往往集中于最热门的头部内容,而机器分发则可以覆盖与用户生活、个人兴趣相关长尾的新闻报道之外的资讯,通过记录、分析用户的浏览行为,从信息源中提取分类、主题、标签、风格等结构化信息,利用用户的行为探索并发现有潜力的内容。

二是机器分发有助于跳出编辑的个人视野,算法排序的核心是根据用户、内容、上下文信息决定实时计算每个内容的得分,按照得分进行排序。由于考虑到了用户的信息,排序结果是个性化的。另外,模型的更新也是实时的,能够充分的利用已有数据,指导下次分发,最大化的优化分发效率。

但机器分发也存在一些不完善之处。Facebook就曾把一张曾获普利策新闻奖的越战照片误判为黄色图片,只因为机器把照片中为躲避炮火奔跑的小女孩裸露了部分身体。在中国,机器分发新闻引发的争议主要集中在“信息窄化”和内容低俗化上,即推荐引擎不断向用户推荐其兴趣范围之内、甚至是带有明显低俗倾向的内容,以尽可能地诱导用户沉浸其中、拖延停留时间。

国际一流的新闻出版服务机构已经开始提供针对推特等社交网络的新闻监测服务,来帮助华尔街的金融客户自动筛选与交易趋势有关的新闻,以助于投资决策。

2015年,《纽约时报》副总编Alexandra MacCallum基于团队工作中需要对文章进行针对性推送的繁琐经历,提出应该对用户关注度进行某种工具化的分析与预测,《纽约时报》数字部门研发的机器人Blossomblot由此应运而生。它能够对海量文章进行大数据分析,从300篇文章中搜索并挑选出具有用户偏好和社交发散效应的文章,同时推荐适合的内容与图片集,凭借后端先进的机器学习技术独立产生标题、摘要和配图等工作。Blossomblot所推荐的内容将会被发布到Facebook和Twitter等社交网络上。《纽约时报》内部统计结果显示,经过Blossom筛选后自动推荐的文章的点击量是普通文章的38倍,这极大地减轻了他们的工作压力,将工作人员从繁琐而复杂的内容搜索分类中解放出来。

腾讯开发的天天快报,通过智能计算用户的兴趣,将各个端口的内容通过算法精确推送。天天快报先对用户进行海量推荐,根据用户屏蔽不感兴趣的内容从而进行算法计算,最终推荐给用户喜欢的内容;用户获取资讯的另一种方式就是自主选择想看的频道,设置频道选项的时候可以手动调整已收藏频道的顺序,并且可以选择添加想要的频道。当用户用微信或者QQ登录后,即可立刻识别用户的阅读兴趣。这种“算法+运营”的内容推荐机制,是基于腾讯的大数据以及用户的阅读习惯,让用户能看到自己感兴趣的内容,同时通过运营又能防止信息阅读单一的情况出现,其他领域优质内容的推荐让用户不至于将生活局限在熟悉的领域。

三、内容监测智能化:更好理解消费者

美国著名报人约瑟夫·普利策曾把记者比喻为国家之船的瞭望者,而人工智能似乎有可能比记者看得更远、更深。

人工智能可以直接越过新闻本身,追踪用户的情绪变化。

Facebook在2017年3月宣称,已经在使用一套人工智能系统来监测Facebook Live和Messenger中的不良信息,以帮助用户防止自杀。这套系统基于对以往有自杀风险帖子的模式识别,对帖子中那些字眼进行分析,尤其是来自朋友的评论,比如“你好吗?”、“我很担心你”就是两种不同的情绪,相应会触发不同的信号。检测到问题后,Facebook 社区团队会对帖子进行审核,确认后会与有潜在自我伤害风险的人联系,建议他们寻求帮助。同时,人工智能会针对用户亲友突出显示“自杀或自我伤害”报告,让亲友们意识可能存在问题。

通过分析大量的用户数据,可以增进对消费者的行为认知水平。

2016年10月,腾讯推出国内首个基于移动浏览行为的数据分析工具——腾讯浏览指数。这套指数通过接入400多个APP、超过4亿对用户数据,可以提供基于行业、品牌和IP的热点分类排行,如明星、汽车、手机、电视剧、游戏等;基于关键词的浏览指数查询,涵盖浏览热度及趋势、热门资讯、人群画像、关联浏览等纬度;针对特定事件、人群、品牌指定专题报告和定制化洞察报告。

美国科技公司Narrative Science旗下的Quill Engage平台不仅可以自动化生成详尽的图表式报告,还可以检索用户浏览路径,跟踪营销广告效果。Quill Engage通过数据统计各种网站用户行为,了解和显示用户浏览或进入某一网页的方式、网站所有人改善用户体验的手段,给网站管理员提供用户的有效信息,如用户关注的关键词、广告信息有效性等,持续跟踪营销广告的效果。基于这些跟踪统计信息,叙述科学公司的自动化写作机器人就可以此为基础形成图表报告,为网站所有者和广告商更加精准投放广告等信息提供策略。

四、内容终端智能化:万物皆媒

未来的媒体行业将因其智能化连接而重新定义媒体。

媒体介质正在泛化,一如麦克卢汉所说“万物即媒介”,一切能够实现信息互联的载体或社会信息活动都可以称之为“媒体”。因此,媒体不仅仅局限于报纸、广播、期刊等新闻性媒体,同时还包括微博、微信等社交媒体,以及美团、大众点评等生活服务平台,甚至未来整个物联网。美国IT研究与顾问咨询公司高德纳(Gartner)预计到2018年,全世界将有60亿台设备用上人工智能技术,届时人们将在互联网家电、汽车等产品上与人工智能零距离接触。

虚拟现实和增强现实技术为传统媒体重建影响力提供了契机。

华尔街日报曾借用用户手机的GPS定位及运动轨迹,根据用户提供的公开数据创作了“看图猜城市”的可视化互动新闻;在对2015、2016年全国两会等重大会议的宣传报道中,中央电视台和新华社、《光明日报》等机构积极运用新媒体、新技术、新手段,实现新闻报道的立体化,提高了受众参与的互动体验性。

随着科学技术的进一步发展,未来的人工智能在包括媒体领域在内的各个领域所发挥的作用将变得越来越大。除了覆盖领域的扩张,在技术涉及的时效性、深度性和质量上都会有所突破,同时还能深入平民生活,实现人工智能的个性化发展。

潘多拉魔盒,新闻业未来挑战与应对

随着内容生产、分发、用户追踪逐步自动化,新闻的教育、业务到社会影响已经开始发生不可逆转的结构性变化,如何让传统新闻业浴火重生,目前看,最大的可能是泛化内容产业的一部分。

一、新闻专业:算法会比人更客观吗?

算法正在成为现代社会运行的基础设施,离开了算法的世界几乎无法想象:旅行预订网站无法买到票,在微博、微信朋友圈上看不到好友更新,甚至搜索引擎也无法给出答案。实际上,算法几乎决定了人们在互联网上看到的一切。

算法进入新闻业的生产、发布虽然较为晚近,但其巨大的革命性力量已经显现。在最近的美国总统选举中, Facebook 的新闻流算法引发了巨大争议,并被认为有可能影响了大选结果。

以Facebook新闻色彩浓厚的热门话题为例,推送热门话题到页面一般需要经过三个步骤:首先,Facebook使用程序监控网站内部关于一些话题的分享和评论,同时,外部的爬虫抓取RSS新闻,搜索Facebook用户还没有开始分享的新闻。其次,当这些话题出现在Facebook的网站上时,管理员就会在1000家媒体上进行认证,并匹配标题、图片和地点人物等相关数据。最后,另一个系统将已经通过认证的热门话题推送到桌面和移动端的首页等。同一时间,任何一次刷新都会有有60-100条的热门话题,而Facebook会根据每个用户的个性化选择和算法推送少于10条的话题。

《华盛顿邮报》曾经对117名随机的美国用户做了抽样调查,结果显示,Facebook会根据用户的性别、设备、使用习惯、居住地、年龄等进行个性化推送,比如关于福特皮卡的新闻,只推送给居住在农村而非城市里的用户,艺人碧昂斯的任何动态信息主要推送给了大部分的女性用户。而在测试的两天内,推送给几乎所有的用户的热门话题是一则关于世界首例“男性生殖器移植”的新闻,可见只有“猎奇+性”这样的超级组合,在Facebook的算法看来是适合所有人的。

作为科技公司, Facebook和谷歌希望以算法全面取代人工编辑。Facebook“趋势”栏目编辑守则规定,编辑们的工作主要限定在基础的修改和格式编辑,其功能并不是提炼新闻要点或者选择新闻操纵娱乐,而是训练算法。2015年8月底,Facebook 解雇数十名新闻编辑,将热门话题的编辑、推荐和排名全部交给机器算法以“保持公正性”。然而,几天之后就有一篇关于新闻主播 Megyn Kelly 因为力挺希拉里被福克斯踢出公司的假新闻,被顶到 Facebook 热门话题榜的首位,之后很快又被 Facebook 紧急撤掉。

当然,在传统媒体时代,假新闻同样无法杜绝,但是社交媒体的出现,使得假新闻传播的速度和广度得到了爆炸式增长。Facebook针对其在美国大选中没有采取有效措施打击虚假新闻的指控,已宣布将联手第三方调查机构加大打击力度,并推出了新的防范工具。面对不断增多、声音渐趋一致的批评声音,Facebook联合创始人马克·扎克伯格于2016年12月16日在自己的Facebook主页中发布声明,并表白道:“我们很早就已经在着手解决这个问题,我们把这项责任看得很重。我们已经取得了重大的进展,但还有更多工作需要做。”

谷歌则通过与媒体和社交平台合作的方式来鉴别假新闻。2015年,协助成立了打假新闻组织“第一稿联盟” (First Draft Coalition),与多家新闻媒体和科技公司一起联手打击假新闻,其中不仅包含纽约时报、法新社、CNN等老牌传统媒体,更有Buzzfeed、Twitter和Facebook这样的新媒体公司。

在中国,微信等社交平台也在致力于打击假新闻。从2014年10月起,微信联合人民网、果壳网等一批具有影响力的机构建立了官方辟谣公众号——“谣言过滤器”,用最权威的渠道不定期发布辟谣信息。此后,“谣言过滤器”公众号中上线了一项名为“辟谣小助手”的服务,只需要将谣言的文字内容复制粘贴给“谣言小助手”,后者就会自动回复相关的辟谣结果。考虑到微信中的谣言一半为复制粘贴的群发,此功能在应对微信谣言方面被认为起到了很好作用。在甄别假新闻的过程中,科技巨头们不但会面临着技术上的问题,还有意识形态的问题。如果主观地把一类言论或意识形态粗暴地定义为“恶意中伤”,又会伤及“言论自由”。

无论如何,算法的公正性直接决定了新闻的公正性。美国新闻网站Vox曾撰文指出,相比Twitter的时间线推送信息流,Facebook利用算法推送误导了用户,但这些算法给予高互动用户较高的内容呈现优先权,其采取的标准类似八卦小报,给用户推送最吸引眼球的标题,却完全不管文章是否公正、精确和重要。这种算法迫使类似《纽约时报》这样有声望的老牌媒体,也不得不亦步亦趋。简言之,算法主导下的新闻业,对人性弱点的迎合,对传统新闻业社会责任的弱化、对娱乐性的无限放大,将是人工智能时代,新闻业面临的根本性挑战。

但是,拒绝算法无疑是自外于潮流之外,对于传统新闻业来说,更明智的选择是,把新闻专业主义贯穿甚至凌驾在算法之上,算法依然服务于新闻业所追求的真实和客观,并随时根据新的形势进行算法的调整。

网络表达渠道的多元化和信息分发的去中心化,媒体昔日强大的社会监督功能的衰减不可避免,但是新的机遇也在出现:

首先,相对社交媒体的海量呈现,传统媒体应进一步强化其信息过滤器功能,建立一道基于信息减法原则的过滤网,既发挥筛选高品质新闻的功能,同时充当好打击假新闻、核验事实真相的主场。

其次,要善于利用依托于社交网络的公民监督,正视“人人即记者”时代的到来——信息的消费者也可以是生产者,组织和引导好“公民记者”,是在一些突发事件报道中,利用分散化的在场人群,及时、准确地进行报道。

最后,在任何一个社会,作为中立、第三方的新闻媒体始终有其独特的存在价值,这种价值并不仅仅表现在商业上,同样也体现在社会、政治功能上,媒体也许不再是强大的“第四权力”,但至少应该守住社会灯塔的角色。

上一篇下一篇

猜你喜欢

热点阅读