NO.28 数据新闻的“同”与“异” ——佛罗里达大学调查性数据
摘要 佛罗里达大学调查性数据新闻奖是美国网络新闻奖下设的数据新闻类奖项。通过对该奖项2017年至2019年大型编辑室获奖作品的对比分析发现,数据新闻在网络新闻中选题主要聚焦社会话题,在数据采集分析方面都体现了极大的专业性。不同的数据新闻也会根据自身报道特点,选取合适的可视化手段以及叙事方式,避免陷入滥用可视化技术的迷思。数据新闻所体现的网络新闻新媒体特点也为新闻工作者的职业素养提出了更高的要求,数据新闻在网络空间的发展还有待探索。
关键词 数据新闻 网络新闻 可视化 对比分析
一、研究背景与问题
数据新闻的概念来自于西方新闻媒体的实践领域,可以狭义地理解为“基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式”,其特点包括:“以服务公众利益为目的;以公开的数据为基础;依靠特殊的软件程序对数据进行处理,开掘隐藏在宏观、抽象数据背后的新闻故事;以形象互动的可视化的方式呈现新闻”(方洁、颜冬,2013)。可见,在数据新闻中十分强调一种可视化呈现的方式,这也恰恰迎合了网络新闻中的新媒体技术的需要。
在美国网络新闻奖中,也专设了一项数据新闻的奖项——佛罗里达大学调查性数据新闻奖。该奖由Lorraine Dingman房地产公司提供,旨在表彰那些在数字和移动平台上表现优秀的数据新闻作品,该奖项的评判重点是报道中故事数据的有效性、数据的质量、该数据新闻的影响力和相关性、数据呈现的设计感和功能性,以及获取数据的难度。该奖获奖者可前往佛罗里达大学主持全日制研讨会,该奖由此得名。本文选取了佛罗里达大学调查性数据新闻奖2017年至2019年,共三篇大型编辑室的获奖作品作为分析对象,试图通过对三篇数据新闻作品的对比分析,探讨作品中的异同点。
二、作品分析
1、《无据可依(Unfounded)》(数据新闻作品《无据可依(Unfounded)》是2017年佛罗里达大学调查性数据新闻奖的大型编辑室获奖作品,由加拿大《环球邮报(The Global and Mail)》制作。)
在数据新闻作品《无据可依(Unfounded)》中,《环球邮报》进行了为期20个月的调查,收集了加拿大全国由于“无据可依”而被视为没有发生过的性侵案件数据。通过对庞大的“无据可依”的性侵案件数据的分析和呈现,该报道揭示了加拿大警察当局在处理性侵案件中的司法漏洞,并促使加拿大统计局再次收集和发布有关“无据可依”的刑事案件的数据。
在数据的收集方面,《环球邮报》所得的案件数据均来自警方,有很高的可靠性。在数据收集阶段,《环球邮报》向加拿大178个警察局发送了近250个请求,并从其中的1,119个警察辖区中获取“无据可依”的机密数据。最后共收到了来自873个司法管辖区的答复,且这些司法管辖区占加拿大人口的92%。
在数据的处理方面,《环球邮报》对数据的比较分析维度十分丰富。《环球邮报》通过排查全加拿大及各省和地区性侵案件中“无据可依”的数量,计算出全加拿大及各省和地区性侵案件中“无据可依”的比例,并对各地区的“无据可依”性侵案件发生率进行比较。该报道的分析表明,加拿大东海岸“无据可依”性侵案件发生率比西海岸高。除了“无据可依”性侵案件发生率维度的比较外,《环球邮报》还特意关注了女警察在性侵案件中扮演的重要角色,并在数据分析中加入了地区中女警官的数量比例作为变量来进行分析。结果表明,女警官越多的地区,该类案件的发生率更小。另外,《环球邮报》还加入了各省和地区的房价和人口数量的变量来进行比较。
《无据可依》网页搜索栏
在数据的呈现方面,《环球邮报》结合数据与网络平台的特点对数据进行了可视化处理。由于该报道的数据分析大多基于加拿大各省和地区的比较,新闻网页中数据的呈现也借助了地图的元素,在地图上呈现数据能够更直观地表现各省和地区之间的差别。同时,该报道数据的呈现也借助了常规的直方图和四象限坐标图的形式,使数据内容更加简单易懂。另外,《环球邮报》对报道篇幅的安排也十分独特。该篇报道是基于大量的数据统计,而且《环球邮报》也对加拿大各省和地区进行了分析,但没有将所有数据放在一个网页上,而是通过在网页中设置搜索引擎和超链接的方式来对数据进行整理。一方面方便本地读者对相关信息的快速检索,一方面也照顾到了不了解加拿大当地信息的读者。
“无据可依”案件数量分布可视化地图
“无据可依”案件与女警官相关性坐标图
另外,《环球邮报》在报道中也加入了对受害者的采访,为数据新闻的报道增添了人文关怀。性侵话题是一项十分敏感的社会话题,对报道伦理规范的拿捏十分重要。《环球邮报》在伦理方面处理得比较恰当。一方面,该报道使用数据新闻的报道方式,用数据说话,从十分理性的角度揭示了加拿大当局在处理性侵案件中的司法漏洞问题;另一方面,该报道也以采访征集的方式,在被害者自愿的情况下用感性的方式揭露性侵案件的问题,并没有过度使用警方提供的案件数据。同时,该报道网页使用的颜色为深红和黑色,报道风格十分严肃,十分贴合主题。
2、《乘着公车出逃:美国如何安置无家可归者(Bussed out: How America moves its homeless)》(《乘着公车出逃:美国如何安置无家可归者(Bussed out: How America moves its homeless)》是2018年佛罗里达大学调查性数据新闻奖的大型编辑室获奖作品,由英国《卫报(The Guardian)》(美国版)制作。)
在《乘着公车出逃:美国如何安置无家可归者(Bussed out: How America moves its homeless)》中,《卫报》对美国30多年以来进行的公交车项目进行了为期18个月的调查,美国的公交车项目是美国大多数城市解决无家可归的流浪人员流向问题的方式。《卫报》在调查中发现,这个项目表面上看来政府用免费乘坐公交车的方式把无家可归的人送出城市,帮助他们回到以前熟悉的地方,并获得熟人的支持,但事实上很多被救助者会再次回归流浪的生活,而且由于曾接受公交车项目的资助而失去获得其他补助的机会,这让被救助者的生活雪上加霜。
在数据收集方面,《卫报》对美国多个警察局、住房部门、收容避难所和美国城市数据库等进行了探访,总共整理了34,000个无家可归者的旅行信息,并对多个曾参与该公交车项目的被救助者和开展该项目的官员与专家进行了访谈。与此同时,《卫报》的调查记者还与两名无家可归者一起乘坐公共汽车旅行,对公交车项目进行了深度的调查。
在数据处理方面,《卫报》对收集到的原始数据进行了大量的清洗和分类工作,工作强度很大,所获得的数据可靠性也更高。因为公交车项目的特殊性,其中的人员资料都是流浪的无家可归者,数据难以核实,《卫报》便通过与美国城市数据库的比较,使绝大多数数据都能够真实匹配,而无法匹配的数据便通过算法和手动筛选的方式进行确认。在数据分析中,《卫报》将重心放在了人员的地点流动上,从纵向的时间维度比较了全美该项目的人员流动情况,并挑选出典型的案例城市旧金山来进行详细的分析,分析手法有详有略。同时,数据的比较也选取了横向的地点距离作为比较维度,不仅关注政府提供的免费公交车票,也关注到更独特的政府提供的机票。
美国公交车计划救助人数的地区与年际差异(动态)
在数据呈现方面,《卫报》多采用动态统计图的方式进行数据呈现。由于数据分析多在全美各地的人员流动上,对该数据的呈现不仅借助地图进行统计,还以动态的点线移动来表示人员流动的年际变化。
纽约市重新安置无家可归者的距离比较示意图(动态)
在整篇报道中,《卫报》主要是以对无家可归者的采访为主线,在对不同的典型采访中插入相关的调查数据,使得新闻报道与调查数据相辅相成。同时在采访中也放入了被采访者的采访视频,让新闻报道更加丰满详实。
3、《警队武力报告(The Force Report)》(《警队武力报告(The Force Report)》是2019年佛罗里达大学调查性数据新闻奖的大型编辑室获奖作品,由新州先锋媒体(NJ Advance Media)制作。)
在《警队武力报告(The Force Report)》是中,新州先锋媒体(NJ Advance Media)通过对新泽西州警局为期16个月的调查,建立了美国最大的警察武力使用数据库,通过对数据多维度的分析比较,客观地呈现了新泽西州的警察武力使用情况,并推动警察当局建立更加完备的警察武力使用数据库。
在数据采集方面,该报道的数据来源可信度较高。在该警察武力使用数据库建立前,美国警察部门对警察武力使用的情况也有记录,但所采集的数据却无人问津。新州先锋媒体的十多位记者向当地各警局提交了五百余份请求,采集到七万余条纸质的警察武力使用记录,并将纸质数据进行数字化和标准化。
在数据处理方面,新州先锋媒体进行了十分专业化的数据分析处理。新州先锋媒体是一家专业从事数据处理的媒体机构,有足够专业的职业素养技能将纸质的警察武力使用数据数字化后集成为标准的数据库。除建立数据库外,该报道还将新州各地区的警察武力使用进行横向比较、对警察武力使用对象的种族与武力使用的方式分析,以及同地区不同时间警察武力使用情况的纵向分析。除了收集到的新州警察武力使用数据外,该报道还引入了警察武力使用的基本知识,起到了科普的作用。可见,新州先锋媒体对数据的处理分析角度十分全面。
《警队武力报告》网页搜索栏
在数据呈现方面,新州先锋媒体采用网站的形式将数据进行整合,该报道的网页不仅有搜索引擎,还有不同板块的超链接,数据呈现简洁又合理。在呈现新州各地区的警察武力使用进行横向比较数据时使用了大量的可视化图表以及交互地图,在其他数据比较重也结合了常规的统计直方图。报道中最特别的数据呈现方式便是将数据集中在每一位警员的武力使用信息上,将美国数据抽象化为一个彩点,再通过网页的超链接来展现每个彩点的具体信息。这种处理方式既体现了数据库的完备性,也使数据不显得过于庞大和冗杂。
武力使用数据种族对照表
卡姆登市警察武力使用情况交互图(动态)
新州先锋媒体网站式的报道使数据新闻的呈现十分简洁、集中。除了对新州警察武力使用的数据分析以外,也加入了过度武力使用中的被害者采访,让理性的数据分析也有了一分“温度”。同时,该报道力求报道的客观中立,再报道中多次提示警察使用武力是警务工作中的
4、作品异同点
以上三篇数据新闻作品都是佛罗里达大学调查性数据新闻奖的获奖作品,便都满足佛罗里达大学调查性数据新闻奖的获奖要求,的确都很多相似之处。
首先,从新闻的选题上看,三篇报道都聚焦了较为敏感的社会话题——性侵、社会保障、警察武力,而且通过新闻报道,对相应的社会现象和社会问题都产生了一定的影响。这也满足了数据新闻以服务公众利益为目的的特点(方洁、颜冬,2013)。
从数据的收集与处理分析上看,三篇作品也有共通之处。在数据来源方面,三篇报道的数据主要都来自政府官方的数据,且在记者的多次请求后得以公开,并经过大量的筛选和核查工作,有较高的可靠性;在数据容量方面,三篇报道的数据容量也是十分庞大的,让报道呈现的社会问题更具有普遍性;在数据的处理分析方面,三篇报道的分析维度都十分全面,既有横向的地区间的比较分析,也有纵向时间跨度的比较分析。
另外,三篇数据新闻报道也都呈现了网络新闻的特点与优势。三篇新闻报道的选题与报道方式符合传统的新闻价值——聚焦社会问题,体现了报道的重要性、接近性与显著性,同时利用网络平台实时更新的特点,增加了新闻的时效性,而且在报道中也力求做到客观公正,注重新闻伦理尺度的把握;同时在新闻的呈现方式上又利用互联网优势,以超链接、搜索引擎、视频等新媒体技术对数据分析结果进行可视化处理,达到了传统新闻价值与新媒体技术优势的融合。同时,在每篇作品的网页底栏都设有问题反馈的通道,一方面起到了读者监督的功能,一方面也为在线读者提供服务与讨论的渠道。
而三篇获奖的数据新闻中最大的不同在于两点——数据的可视化手段与报道的叙事手法不同。在数据的可视化手段方面,第一篇报道《无据可依》中,对数据的可视化利用了网页搜索引擎、超链接和静态可视化图表绘制的手段,该报道的网页数据整体更加偏于静态的呈现,交互性比较弱。第二篇报道《乘着公车出逃》中并未使用网页搜索引擎和超链接,整篇报道一气呵成,通过鼠标的滚动来展现动态的可视化图表,并在采访文字中加入采访视频,动态感更强,但是缺少互动性。第三篇报道《警察武力报告》的数据呈现手段像是前两篇报道的“集大成者”,搜索引擎、超链接、动静态可视化图表、交互地图……几乎囊括了数据新闻中常见的数据呈现形式。
在报道的叙事手法方面,《乘着公车出逃》之于《无据可依》和《警察武力报告》的叙事手法最不相同。《乘着公车出逃》的叙事手法更为故事化,从一个无家可归者对公交车旅行的回忆开始,慢慢深入对美国公交车项目的数据调查,根据不同的采访素材,穿插各方面的数据分析结果。整篇报道的主线都是由对无家可归者的采访组成,而数据的整合和分析则是帮助采访中的个案问题上升到一个普遍性问题的高度,是从微观到宏观、从特殊到一般的叙事路径。而《无据可依》和《警察武力报告》的叙事手法更加模块化,把对数据分析的不同维度分成一个个的模块,对采集到的数据进行科学化的处理后再进行模块化的呈现。两篇报道从全国(州)的数据信息中提炼出普遍的社会现象和社会问题,以此作为报道的主线,最后才在报道中加入被害者的采访来深化主题,是从宏观到微观、从一般到特殊的叙事路径。
三、结论与反思
在近三年美国网络新闻奖佛罗里达大学调查性数据新闻奖的大型编辑室获奖作品对比分析中可以发现,调查性数据新闻的选题主要聚焦社会民生话题,与读者有很大的相关性,接近性很强。这类社会选题对数据新闻有很大的帮助,数据新闻中的数据分析统计有极强的专业性,倘若是相关性、趣味性不大的选题,很难吸引到读者,而社会性的话题更能够降低数据新闻的阅读门槛,更能够引发读者的思考与讨论。
当然,在对比中也发现数据新闻中数据的收集与处理环节给新闻记者的职业素养提出了很高的要求。在收集数据时,既需要记者强大的公关能力,又需要数据采集、存储、编码、筛查的专业知识;在处理数据时,还需要数据统计的分析能力。在各报道中也发现,一份完整的数据新闻往往是一个专业化的团队进行制作,制作人员也各有所长。
而在数据可视化的对比中,每篇报道各有特点,这也是因为在数据新闻中,虽然对数据的处理与可视化是十分重要的环节,但却不能陷入“可视化”迷思(栾轶玫、何雅妍,2019)。在数据新闻的报道中是以新闻事实作为叙事的重点,而非将精力投入到如何把数据图表做得好看上面。在三篇报道中,报道机构也结合自身的新闻特点选择了不同的叙事方式。《乘着公车出逃》中所采集的数据更接近无家可归者,报道以无家可归者的采访故事出发会更有吸引力。而《无据可依》和《警察武力报告》的数据来源于警方,数据十分庞杂,需要对数据进行大量的分析才能挖掘出更深的社会问题。尤其是《警察武力报告》中的数据精确到个人,需要采用各种维度的可视化处理来呈现数据的意义,先从宏观上的数据入手,把庞大的数据抽象化更能够把报道内容叙述清楚。另外,从题材上讲,《无据可依》和《警察武力报告》的确不适合过多的采访,容易对事件被害者产生二次伤害;而《乘着公车出逃》中的大量采访,其实是为无家可归者的利益诉求提供了便捷的渠道。
总的来说,数据新闻相比于传统的新闻报道而言,以其数据可视化报道形式的诉求,能够使数据新闻本身更好地融入到网络新闻当中。数据新闻与网络平台的新媒体技术是相辅相成的,没有新媒体技术的支持,也不会有数据新闻的实践;而在数据新闻的实践中,不断开发新的数据可视化手段与新的叙事方式,又能帮助新媒体技术在实践中前进。当然,这样的趋势也愈发要求新闻从业人员的综合性职业素养——不仅限于传统的新闻工作素养,还需要专业的数据处理能力与网页设计、维护技术,为将来的新闻媒体从业人员提出了新的一项挑战。
参考文献:
[1] 栾轶玫,何雅妍. 从“可视化”到“数据叙事”——以英国数据新闻理念变迁看数据新闻教育的未来走向[J]. 传媒观察, 2019(08): 34-40.
[2] 方洁,颜冬. 全球视野下的“数据新闻”:理念与实践[J].国际新闻界, 2013, 35(06): 73-83.
[3] Online Journalism Awards. The University of Florida Award for Investigative Data Journalism[EB/OL]. https://awards.journalists.org/awards/investigative-data-journalism, 2019.
[4] NJ Advance Media. The Force Report[EB/OL]. http://force.nj.com/, 2019.
[5] The Global and Mail. Unfounded[EB/OL]. https://www.theglobeandmail.com/news/investigations/compare-unfounded-sex-assault-rates-across-canada/article33855643, 2019.
[6] The Guardian. Bussed out: How America moves its homeless[EB/OL]. https://www.theguardian.com/us-news/ng-interactive/2017/dec/20/bussed-out-america-moves-homeless-people-country-study, 2019.
文/杨蕻意
2019年10月30日