全球新闻数据可视化实践研究
——基于2021年西格玛数据新闻奖作品的内容分析
The Practice of Global News Data Visualization
—A Content Analysis of the 2021 Sigma Awards Finalists
◎陈积银 李月 聂汉林
Chen Jiyin Li Yue Nie Hanlin
摘要:西格玛数据新闻奖是自2019年起举办的全球数据新闻竞赛。本文对2021年入围该奖的106个独立作品,从入围作品国家与地区分布、生产机构、作品主题、数据来源、使用工具、呈现方式、交互要素7个维度进行分析,以呈现当前全球新闻数据可视化的实践特征。本研究发现,当前不少国家和地区都参与了新闻数据可视化的实践;作品主题相对聚焦;数据源公开程度高;工具使用凸显记者数据素养;可视化呈现方式多样;交互要素对受众个性化体验重视不够等。根据以上特点,本文提出未来新闻数据可视化作品可关注社会聚焦议题;保障新闻透明性与数据合法使用;重视人才培养;注重可视化图表合理性;丰富交互要素,注重用户个性化阅读体验等建议。
关键词:数据可视化;西格玛数据新闻奖;数据新闻;内容分析
Abstract:Sigma Awards is a global data journalism competition launched since 2019. This article analyzed the content of the 106 independent works shortlisted in 2021. Seven dimensions are analyzed to present the practical characteristics of current global news data visualization,which are the national and regional distribution,production organizations,themes,data sources,tools,presentation methods,interactive elements. The study found that many countries and regions are trying to produce news data visualization projects;the themes are relatively focused;the degree of openness of data sources is high;the use of tools highlights the data literacy of journalists;there are various ways of visual presentation. In addition,interactive elements do not pay enough attention to the experience of audience. This article proposes that future news data visualization projects can focus on the value of topics. Projects should guarantee the transparency and the legal use of data. Related majors must attach importance to personnel training. The projects should also pay attention to the rationality of visual charts. Finally,it is necessary to enrich the interactive elements and follow users’ reading experience closely.
Keywords:data visualization,Sigma Awards,data journalism,content analysis
大数据时代每时每刻都有大量数据产生,处理和分析这些数据,探索其背后隐藏的信息和规律,对于各行各业的发展有着重要意义。数据可视化(data visualization)是关于数据视觉表现形式的科学和技术的研究[2],利用图形、图表、图像和模型等形式将看似海量、无规律且复杂的数据进行直观和美观的视觉呈现,从而让人们直接看出数据的规律,甚至预测事件的发展趋势,因此数据可视化被逐渐应用于各个领域。
近年来,数据可视化的研究和实践也延伸至新闻传播领域,即新闻数据可视化(journalism data visualization)的发展,这种新闻的“量化转向”(quantitative turn)直接影响并重构着新闻的生产过程。新闻数据可视化是指人们通过收集相关数据,对数据进行一定处理和分析,再将其以恰当的可视化方式呈现。其主要应用于互联网时代的新闻报道,包括数据新闻(data journalism)或数据驱动新闻(data driven journalism)、新闻报道中使用的数据图表、短视频新闻中的动态交互图表,以及基于人工智能的VR、AR数据图表等。新闻数据可视化的核心特性有三点,即服务于新闻媒体报道、以各类数据为基础、以可视化为呈现方式。
从2009年开始,英国《卫报》、美国《纽约时报》等媒体相继建立数据新闻编辑部,数据新闻作为一股新闻实践风潮在全球范围内迅速扩散。[3]《数据新闻手册》(The Data Journalism Handbook)是第一本专门探讨数据新闻的小册子,它率先提出了数据新闻的概念[4]。2013年国外学术界开始出版刊物《数据新闻》(Digital Journalism),为大数据时代下的新闻传播研究提供了专门的平台。在学科发展上,“数据新闻学”作为一个应运而生的学科分支,正越来越受到学界和业界的关注和重视。[5]数据新闻虽已发展十余年,全球业界实践热潮却并未退去,国内外先后设立多项赛事以表彰优秀的数据新闻可视化作品,例如全球数据新闻奖(Data Journalism Awards)、凯度信息之美奖(The Kantar Information is Beautiful Awards)、中国数据新闻大赛(China Data Journalism Competition)等。
一、研究方法与设计
近年来,一些学者逐渐选择用量化分析的方法对数据新闻作品进行研究,较传统案例分析方法而言,这种方法增强了数据新闻作品研究的科学性与规范性。国外有研究对加拿大媒体向在线新闻协会、全球编辑网络和加拿大记者协会提交的数据项目进行内容分析,以探讨什么样的数据新闻作品是高质量的[6];有学者对2019年数据新闻奖作品类型、互动性以及功能加以分析,得出信息图表是最广泛使用的呈现方式,但作品互动性不强的结论[7];在新冠肺炎疫情期间,有研究从新闻报道类型、数据源、可视化呈现等维度对比分析美国当地报纸《达拉斯晨报》和《休斯敦纪事报》关于疫情的报道[8];有研究从透明性、交互性、多样性等维度对《华盛顿邮报》和《纽约时报》的数据新闻进行内容分析[9];国内有学者曾对2012—2017年全球数据新闻奖的提名作品与获奖作品做量化分析,探究如何确立数据新闻领域的专业规范[10]。
西格玛数据新闻奖(Sigma Awards)是自2019年开展的全球数据新闻竞赛。该赛事与世界各地数据新闻竞赛合作,包括菲利普·迈耶奖(Fhilip Meyer Award)、韩国数据新闻奖(Korea Data Journalism Awards,KDJA)等,媒体合作单位包括数据新闻网(Data Journalism.com)、镝数图表、全球调查新闻组织(Global Investigative Journalism Network)等来自15个国家或地区的组织机构。值得一提的是,第二届大赛中,澎湃新闻与财新传媒的数据新闻作品均入围决赛。参赛作品对全球数据新闻实践者具有启发作用,也有学者对获该奖项的作品进行分析。María等对2012—2020年全球数据新闻奖(DJA)、西格玛数据新闻奖以及在线新闻奖(OJA)的获奖作品进行定性的内容分析,探究数据新闻作品的透明性与隐私性[11];Alba和Manuel对2019年全球数据新闻奖和2020年西格玛数据新闻奖获奖报道进行描述性统计分析,旨在核查数据来源和数据类型是否影响数据新闻作品的透明性[12]。
本文试图对2021年西格玛数据新闻奖入围决赛的106个独立作品进行内容分析,统计入围作品的国家与地区分布、生产机构、作品主题、数据来源、可视化呈现方式、交互要素以及使用工具,以探究以下问题:作品的国家和地区分布如何?生产机构类型有哪些?主要聚焦哪些议题?数据来源有哪些?使用了何种工具?可视化呈现方式与交互要素是什么?本文对上述7个维度进行一级和二级编码后,得到内容编码表(见表1)。本文旨在通过从不同维度分析2021年西格玛数据新闻奖的入围作品,量化呈现当前新闻数据可视化的实践特征,找到学界与业界关于数据新闻可视化的未来方向,一方面丰富其相关理论的发展,另一方面有助于新闻数据可视化在未来的新闻报道实践中持续发挥更重要的作用。
表1 内容编码表

续表

二、全球新闻数据可视化实践特征
(一)众多国家和地区参与,作品主题相对聚焦
本文对入围作品的国家和地区进行分类,得到下表(见表2)。研究发现,共有32个国家和地区的作品入围,美国入围作品数量最多(32个),巴西次之(10个),中国内地(大陆)有来自澎湃新闻和财新传媒的两个作品入围。虽然涉及国家和地区较多,但获奖情况在空间上分布不均衡,以美国为首的欧美西方国家在作品数量上占较大比例,而亚洲、非洲、澳洲入围作品数量相对较少。
表2 入围作品国家和地区分布

续表

从生产机构规模看,入围作品的生产机构中有65个为大型新闻机构,如美国《纽约时报》、路透社新加坡分社、英国《金融时报》等,剩余41个机构为小型工作室,如美国The Pudding工作室、南非新闻媒体News24等。从生产机构性质看,本文将入围作品的生产机构性质划分为新闻媒体、非营利性新闻组织、商业公司/机构/工作室以及其他组织(包括社会团体、大学、政府机构),统计结果见表3。统计结果显示,新闻媒体作为作品主要生产者,创作的作品数量占总数的60.14%,其中美国纽约时报团队参与创作的7个作品入围;纽约市曼哈顿区的一家非营利公益新闻调查机构(ProPublica)入围3个作品。此外,一些作品由不同机构合作完成,例如作品《哪些城市在 COVID-19核酸检测中的种族差距最大?》(Which Cities Have the Biggest Racial Gaps in COVID-19 Testing Access?)由美国专注于数据咨询新闻的网站FiveThirtyEight.com和美国广播公司共同制作。
表3 入围作品生产组织性质统计

对于入围作品的主题,本文将其分为新冠疫情、政治、经济、战争/犯罪、社会/公共服务、环境/灾害、人口/性别、科技、城市/交通共9类,并对入围作品进行主题统计,统计结果见表4。由于2020年新冠肺炎疫情在全球范围爆发,且本届大赛着重表彰新冠疫情报道中优秀的数据新闻作品,因此新冠疫情相关议题的作品占比最高(34.91%)。对于同一类议题,不同的数据新闻可视化作品的报道角度也有差异,例如澎湃新闻关于新冠疫情的数据新闻可视化作品《11699位患者和我们的这一年》(What 11699 Cases Tell Us About COVID-19?)将患者流调详情信息制作成数据库,可视化呈现传染途径、患者关系、患者症状。来自美国马歇尔项目机构(The Marshall Project)的作品《15个月逐州观察监狱中的冠状病毒》(A State-By-State Look at 15 Months of Coronavirus in Prisons)则重点可视化呈现美国各地联邦和州监狱中因感染新冠病毒而患病和死亡的犯人,可见不同维度的数据可讲述截然不同的故事。
表4 入围作品主题统计

(二)数据源公开程度高,政府与自采集数据较多
Karlsson指出新闻透明性可分为制作透明和参与透明两种表现方式[13],在新闻数据可视化作品的生产过程中,其透明度的最直观体现就是研究所使用的数据库的公开程度,即在作品中详细阐述数据来源与使用情况,且公众可通过超链接或其他方式访问相关数据集[14]。而在数据新闻可视化作品中,发布者不完全公开数据来源或选取数据不够客观,也会降低新闻的专业性和权威性。[15]因此数据来源的公开和数据选择的客观在数据驱动的可视化报道中显得十分必要。在本文所统计的106件作品中,有96件作品标注了数据来源,大部分作品都建立了公开数据集供受众核查或再利用,数据源公开程度较高。
Paul等在分析美国本地报纸关于新冠疫情的数据新闻报道时,将数据来源分为7种:商业与工业数据、教育或学术资源、政府等官方公开数据、非营利组织数据、自采集数据、其他新闻媒体组织数据、医院数据。[16]本文将以上数据源进行进一步概括,按政府等官方公开数据、自采集数据、商业/社会组织/学术机构数据这3种数据来源分类进行统计,对标注了数据来源的96件作品进行统计分析,得到的结果如表5所示。政府等官方公开的数据由于具有权威性,因此仍然是数据新闻可视化的重要数据来源,在本文分析的作品中占比59.38%;自采集数据也逐渐成为重要的数据来源,在所统计的作品中占比53.13%。值得注意的是,通常一件作品的数据来源不是唯一的,为了使叙事更加深入和全面,数据新闻可视化作品的生产者会获取多方面、多维度的数据。路透社新加坡分社的作品《评估澳大利亚生态灾难》(Assessing Australia’s Ecological Disaster)对澳大利亚的生态环境进行了分析,使用了国际自然保护联盟(IUCN)的数据、美国宇航局资源管理系统(FIRMS)的火灾信息数据以及马里兰大学全球土地分析与研究实验室(GLAD)的相关数据等。
表5 入围作品主要数据来源

(三)编程与地图工具使用频率高,体现记者数据素养
在新闻数据可视化作品生产过程中,相关人员必然要对海量数据进行处理,主要的处理技术可分为统计分析、数据挖掘、自然语言处理、机器学习、空间分析等类别[17],不同类别的分析可借助不同工具实现,这些新技术和新工具的加入也为传统新闻报道提供了机遇与挑战。有研究通过对英国主流媒体数据记者的半结构化访谈,得出结论称,由于一些小型编辑室缺乏先进技术设施,数据记者缺乏计算机相关技能,他们便需要花更多的时间寻找现成的自动化工具来满足调查或分析需求。[18]本文统计了106件作品使用的25种工具,按照功能将其分成6类,分别为图形动画、图表设计、数据存储、数据挖掘、网页开发以及地图工具(见表6)。本文经编码和统计后发现,有37.74%的作品使用了爬虫技术(Scraping)进行数据获取,40.57%的作品用到Python语言,20.75%的作品在制作过程中使用了R语言;共有34件作品使用了地图工具,具体主要有OpenStreetMap、Google Earth Pro、PostGIS和QGIS。值得注意的是,作品的大部分图表都不是可视化工具一键生成的,而是利用脚本语言通过编程生成的,且有7件作品使用人工智能/机器学习技术,可见信息化与大数据的时代对记者的数据素养和处理数据能力的要求进一步提高。
表6 入围作品主要使用工具统计

续表

(四)可视化呈现方式多样,作品多以网页为载体
可视化图表是数据新闻可视化作品中必不可少的要素,国外有研究指出媒体在进行数据可视化报道时应结合新闻思维和视觉设计思维[19]。传统的信息图表包括条形图、饼状图、时间轴、折线图等。随着新闻数据可视化的发展,信息图表呈现出多样性,旭日图、桑基图、数据地图等图表类型的应用让作品更美观、充实。有研究根据视觉吸引力对呈现方式进行如下排序:文本分析、数字引用或表格、时间线或列表、静态地图/图表、动态地图/图表。[20]在本次统计的作品中,可视化呈现方式主要分为时间轴、单一图表、复合图表、静态地图、动态地图、视频以及动画7类,除去链接失效的作品,本研究共统计91件作品的可视化呈现方式,结果见表7。其中,复合图表有两种类型,第一种类型表示在同一张图表中,不同数据以不同的图表形式呈现,如作品《大型水坝是否会让尼罗河消失?》(Could Mega-dams Kill the Mighty River Nile?)中的一张图表结合了地图和饼状图两种可视化呈现类型(见图1);第二种是图表或者地图以“组图”的方式呈现,作品《为什么西班牙女性不再在周末或节假日分娩》(Why Women Stopped Giving Birth on Weekends or Holidays in Spain),以组图形式呈现西班牙各地一周中每天出生人数与年日均值相比的百分比变化(见图2)。复合图表在所有作品可视化呈现方式中占比57.14%。动态地图较静态地图最大的差异是具备交互性,人们可对地图进行缩放、搜索地区或展示某区域详情的操作,占比42.86%。视频是新闻报道的重要呈现方式,且短视频已经成为人们获取信息的重要途径,视频在本文所统计的作品中占比26.37%。从作品的呈现载体看,大部分作品依托网页呈现,一种为生产者自主开发的网页,作为独立作品供受众阅读;另一种依托于生产机构的平台,人们在浏览作品时可以看到该机构其他的新闻报道。
表7 入围作品可视化呈现方式


图1 《大型水坝是否会让尼罗河消失?》作品复合图表示例[21]

图2 《为什么西班牙女性不再在周末或节假日分娩》作品复合图表示例[22]
(五)具备交互要素,但不够重视受众个性化选择
交互性(Interactivity)的概念在20世纪90年代末随着在线新闻网站的出现而兴起,随着技术的发展,交互性逐渐成为评价数据新闻可视化作品足够出彩的指标之一。Yi等人于2007年提出了信息可视化(Infovis)中广泛使用的7类交互要素,即选择(Select)、探索(Explore)、重新配置(Reconfigure)、编码(Encode)、抽象/精心设计(Abstract/Elaborate)、过滤(Filter)和连接(Connect)[23];Boy等人针对数据新闻特征,将“检查”(Inspect)和“叙述”(Narrate)纳入数据新闻交互要素指标[24]。此外,如今可共享链接已成为新闻网站上的一项常见功能,有学者指出这是一种扩大影响范围和增加受众的有效方式[25]。基于以上分类标准,本文将交互要素分为标记、详情、筛选、探索、抽象/详细、重新设置以及转发7类。其中,标记是指将某元素以特殊符号记录,例如下划线突出显示某元素、点赞等;详情是指更多信息,例如用户单击鼠标或鼠标悬停在某元素可以查看更多信息或跳转到新的页面以了解新的信息;筛选指有条件地显示某些内容,例如从菜单栏中选择某一具体项;探索指用户手动输入/查询相关内容,并得到相应反馈;抽象/详细是针对于图表或地图而言的,指显示更多或更少的细节,例如放大或缩小地图视图以调整抽象级别;重新设置指显示不同的排列,例如用户可以将某一版块或要素上下移动或将折线图手动变换为堆叠的条形图;转发指将某元素或作品网页分享到其他平台,一般包括弹出想要分享的平台或生成分享链接。
本文经统计后发现,详情类交互要素占比最高(87.91%),体现出数据新闻可视化作品为了避免信息过于冗余复杂,或为了防止受众被他们不太关注的信息所影响,增加详情交互的要素,供受众自主选择想要进一步了解的信息。一些新闻可视化作品包含多个链接,用户在主作品页面可以自主筛选跳转到其他分页面或分章节,筛选类交互要素便主要存在于以上情况中。重新设置类交互要素最能体现受众对图表的个性化设计与操作,但本文分析的作品中只有23.08%的作品具备该要素,说明目前的作品对受众个性化选择体验关注较少。随着社交媒体的兴起,可共享链接已成为新闻网站的常见功能,本文统计作品的转发功能后发现,81.32%的作品具备一键分享至Twitter、Facebook等平台的链接或按钮。
表8 入围作品交互要素分析

三、讨论
(一)关注社会焦点议题,凸显作品选题叙事之意义
数据新闻可视化投入实践的十余年间,其对政治、金融、医疗、犯罪、体育等各类新闻议题几乎都有涉及,所报道的社会类议题也更聚焦社会痛点。数据新闻可视化设计者需要具备内容与用户的关联意识[26],即策划选题之前应当思考这个选题与读者会有什么联系以及联系是否紧密。新冠肺炎疫情在全球大流行的这两年时间,受众有获取最新疫情信息的需求,且可视化图表较文字报道能更清晰地呈现疫情态势,因此国内外媒体团队制作了大量疫情相关的数据新闻可视化作品。数据新闻与传统新闻报道相比,独具的特征便是预测功能,分析海量的数据可以了解事件的走势或发展规律,这项功能通常会被应用于政治选举、环境演变以及人口增长等议题。美国FiveThirtyEight.com网站在2020年美国大选期间推出作品《2020大选预测》(2020 Election Forecast),通过收集各州的民意调查数据,并借助计算机模拟4万次选举,预测出拜登赢得大选的概率为97%,且特朗普赢得超过50%选票的概率为1%。可视化作品在叙事时,除了使用数据进行可视化呈现,还可结合与选题相关的深度访谈,以个人视角加深报道深度,凸显作品选题意义。例如萨尔瓦多共和国的《今日报》媒体团队生产的作品《冲突的面孔和声音》(Rostros y voces del conflicto),以幸存者和受害者亲属的证词,揭示该国1972—1992年的武装冲突发生之前和发生期间出现的侵犯人权的行为。
(二)保障新闻透明性,降低数据非法使用之风险
统计本文所研究作品的数据来源,可以发现政府等官方公开的数据被用得最多,如美国联邦政府数据、各国统计局数据以及联合国或世界卫生组织公布的数据等。非官方数据也逐渐被应用于数据新闻可视化作品中,例如国际自然保护联盟(IUCN)等社会组织的数据,或通过爬虫抓取的数据。此外,“众包数据”(Crowdsourcing Data)和实时监测的“传感器数据”(Sensor Data)正作为新的数据来源,在作品中占有越来越大的比例。“众包”是指一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式,外包给非特定的大众网络的做法,众包数据库表示众人合作构建数据库,其核心是数据的自愿上传和分享[27],例如利用OpenStreetMap工具中的开放地理数据进行新闻叙事。因此国内外用户可通过众包的方式,共同上传、监督和使用数据库中的数据信息。由于非官方数据可能是生产者自我采集的,因此可能会出现数据的合法使用问题。相关部门应加快数据安全法律法规的制定与实施,对数据分级管理,明确哪些数据可以被共享,哪些数据需要征求数据生产方的许可后才能使用。业界媒体可视化团队要提升自身数据素养,保障用户数据安全,从数据收集、清理、分析到可视化呈现,记录整个数据新闻可视化过程,标注数据来源,这将在保证数据真实性的同时便于确定责任归属。
(三)注重人才培养,提升“数据为我所用”之能力
对生产作品使用的工具统计结果表明,当下和未来的新闻数据可视化实践除了需要相关人员具有传统新闻技能外,还需要他们具备计算和编程技能、数据挖掘与分析技能、图表设计与可视化技能等。这对大数据时代的新闻数据可视化专业人才培养提出新的要求,高校课程安排的规范性日益重要。国外著名高校为培养新闻数据可视化相关人才,在教学上的改革具有引领作用和参考价值,如英国威斯敏斯特大学为数据、文化与社会文学硕士开设数据可视化课程;英国华威大学为大数据与数字未来理学硕士开设可视化、数据挖掘、大数据研究等相关课程;美国哥伦比亚大学开设“新闻与计算机双硕士学位项目”(Dual M.S. in Journalism and Computer Science),制定新闻专业与计算机等理工专业联合培养人才的政策,鼓励学生根据自身能力水平和兴趣进行跨学科学习实践。因此,首先,国内高校新闻传播相关学院可以借鉴英美等国家的数据新闻教育经验,结合学生具体学习能力和知识吸收情况,开展由浅入深、多元平衡的新闻数据可视化相关内容的教学工作。其次,以赛促学也是培养学生的数据思维、提升技术能力的有效方式,例如作为全国新闻教育学界唯一持续举办的全国性专业比赛,中国数据新闻大赛贯彻新文科发展理念,不断推动中国新闻数据可视化的实践创新与发展。最后,高校可多与业界展开合作,让新闻传播相关专业的学生了解当前业界需要具备哪些技术的人才,并在实践中学习大数据相关技术,这样高校才能在保证发挥学科传统优势的同时,顺应时代变化,培养出更符合行业和时代要求的人才。
(四)回归新闻价值,思考可视化图表使用之合理性
数据可视化在一定程度上确实吸引了更多读者的注意力,但一味追求可视化效果却忽略新闻价值和新闻报道的社会功能,是本末倒置的现象。设计再精美的可视化图表,如果无法引发受众的思考,对社会发展没有推动作用,也不能称为好的新闻作品。在新闻作品中,可视化图表并非越丰富多样越好,图表使用的合理性与类型选择的恰当性要比其丰富性更重要。例如,时间轴是体现时序数据变化最常用的图表类型,新冠肺炎疫情相关议题的新闻数据可视化作品大多用到了时间轴,以呈现不同地区的疫情相关数据(如确诊人数、死亡人数、痊愈人数)在一定时段内的变化。在统计过程中,笔者发现大部分作品的图表并非整个新闻报道的重要内容,而是辅助报道。一张图表想要呈现的要素过多,数据类型多且图表花哨复杂,图表过长并不适配移动端设备等问题并不罕见,过度复杂的可视化内容不仅不利于用户对相关内容的理解,还会减少其阅读兴趣,从而弱化新闻传播效果。在“万事皆能可视化”的当下,学界与业界都应当思考新闻报道如何破解“泛可视化”之困。因此,下一阶段的数据新闻可视化实践应适当将图表化繁为简,将易读性作为设计过程中考虑的重要方面。让体量较为庞大的数据更具易读性,整个作品的核心依旧是叙事,体现专业记者依然将新闻价值放在最重要的地位。
此外,长久以来,人们普遍认为呈现更多量化的数据比主观文字描述更能体现信息的真实性[28],正如有学者评价“数据携带着科学主义的先天合法性,又暗合实证主义逻辑传统”[29],因此以数据为基础的可视化新闻既直观又具权威性。以地图为例,制图师对颜色、图标和地图方向的选择可以引导观众以完全不同的角度看待世界。[30]2020年波士顿公共图书馆Leventhal地图与教育中心举办的名为“弯曲线:地图和数据的扭曲到欺骗”(Bending Lines:Maps and Data from Distortion to Deception)的地图展览,便旨在揭示地图数据可视化如何有目的地呈现特定议题或观点。[31]在“相同的数据,不同的故事”(Same Data,Different Stories)展区展出的数据作品《马萨诸塞州西部的开放空间与非开放空间》(Open or Closed Space in Western Massachusetts),以同样的数据集呈现出相同地区截然不同的开放程度。在一张地图(见图3)中,绿色区域(本文呈现图片中的深灰色部分)展现了大量土地可供公众使用,而另一张地图(见图4)却讲述着众多区域限制公众进入的故事。可见新闻报道中的数据可视化在某些情况下会制造陷阱,以影响人们对事实的判断。在追求可视化美观性之前,新闻客观性和真实性永远是优秀作品的前提。

图3 马萨诸塞州西部地区的众多开放空间[32]

图4 马萨诸塞州西部地区不对公众开放[33]
(五)丰富交互要素,增强用户个性化阅读之体验
在技术不断发展的当下,用户越来越追求新闻阅读体验,传统文字报道甚至静态的数据新闻作品已无法满足所有受众的阅读需求。本文通过对作品的统计,发现大部分生产者都比较重视作品的易传播性,即分享功能。随着智能移动端的普及,作品被一键共享到其他平台后,如何适配和兼容是未来数据新闻可视化作品生产者必须考虑的问题。本文统计的交互要素占比情况表明,当前作品在探索和重新设置等方面的交互设置还不够丰富,假设用户可以一键变换个性化图表样式,实现间接参与新闻生产过程,或许将极大激发其阅读兴趣。如作品《为何新冠病毒在室内传播的风险如此之高?》(Why is the Risk of Coronavirus Transmission so High Indoors?),让用户自主选择房间面积、停留时间以及房间人数,以模拟新冠病毒在室内传播的速度和影响范围。未来,人工智能等新技术的发展也将为交互要素的丰富带来更多可能性,VR、AR技术在数据新闻可视化作品中的应用可以增加交互体验的维度,用户可以置身新闻报道构建的虚拟场景,交互要素不再局限于本文所分析的标记、详情、筛选、探索、抽象/详细、重新设置以及转发这几个维度,而是增加“在场”“肢体感应”等交互要素,进一步增强用户体验感。丰富的交互要素一方面会增强用户的沉浸式阅读体验,另一方面也会提升用户分享的欲望,从而优化作品的传播效果。
结语
通过分析2021年西格玛数据新闻奖的106件独立入围作品的内容,本文论述了当前全球数据新闻可视化实践的特征。优秀的新闻数据可视化作品能较好地体现新闻价值,数据来源多样且公开,保证了新闻透明性;作品可视化呈现方式虽然多样,但并未“喧宾夺主”,其核心依然是新闻的社会价值;作品具备丰富的交互要素,共享性强。国内新闻数据可视化经过十年的发展,已经历兴起期和探索期,并逐渐走向沉淀期,未来如何让新闻数据可视化的热度延续?怎样生产出引起社会共鸣的好作品并提升作品的传播效果?如何平衡新闻可视化作品的透明性与数据隐私问题?怎样进一步增强作品的交互性和用户参与感?如何克服专业人才培养的一系列难题?这些问题都值得我们进一步思考。
〔陈积银,西安交通大学新闻与新媒体学院教授、博士生导师;李月,西安交通大学新闻与新媒体学院硕士研究生;聂汉林,西安交通大学马克思主义学院博士研究生〕
〔特约编辑:顾洁〕
[1] 本文系2021年中组部万人计划“全国青年拔尖人才项目”阶段性成果;2021年国家社科基金后期资助项目“智能推荐型视频媒体产业价值链研究”(项目编号:21FXWB003)阶段性成果;2021年科技部高端外专项目“智能信息传播与社会治理研究”(项目编号:G2021170010L)阶段性成果。
[2] 左圆圆,王媛媛,蒋珊珊,等.数据可视化分析综述[J].科技与创新,2019(11):82-83.
[3] 陈积银,杨廉.中国数据新闻发展的现状、困境及对策[J].新闻记者,2016(11):64-70.
[4] GREY J,BOUNEGRU L,CHANBERS L. The data journalism handbook:how journalists can use data to improve the news[M]. Cambridge:O’ Reilly Media,Inc.,2012.
[5] 丁柏铨.数据新闻:价值与局限[J].编辑之友,2014(7):6-10.
[6] YOUNG M L,HERMIDA A,FULDA J. What makes for great data journalism?A content analysis of data journalism awards finalists 2012-2015[J]. Journalism practice,2017,12(4):1-21.
[7] CORDOBA-CABUS A,GARCIA-BORREGO M. Evaluating the transparency in reference data journalism. Study of the stories published between 2018 and 2019[J]. Revista Icono 14-Revista cientifica de communicacion y tecnologias,2021,19(2):364-387.
[8] PAUL N,NISBETT G. The numbers game:how local newspapers used statistics and data visualizations to cover the coronavirus pandemic[J]. The Howard journal of communications,2022,33(3):297-313.
[9] ZAMITH R. Transparency,interactivity,diversity,and information provenance in everyday data journalism[J]. Digital journalism,2019,7(4):1-20.
[10] 刘建坤,方洁.数据新闻领域专业规范的确立与变化:基于全球数据新闻奖历届作品的内容分析[J].新闻与写作,2017(12):80-84.
[11] CHAPARRO-DOMINGUEZ M,DIAZ-CAMPO J. Data journalism and ethics:best practices in the winning Projects (DJA,OJA and Sigma Awards) [J/OL]. Journalism practice,2021-09-27[2022-06-15]. https://doi.org/10.1080/17512786.2021.1981773.
[12] CORDOBA-CABUS A,GARCIA-BORREGO M. Visualisations as a critical information source for data journalism:analysis of the typology,interactivity,and functions in the 2019 Data Journalism Awards[J]. Doxa comunicación,2020(31):87-105.
[13] KARLSSON M. Rituals of Transparency:evaluating online news outlets’ uses of transparency rituals in the United States,United Kingdom and Sweden[J]. Journalism studies,2010,11(4):535-545.
[14] TANDOC E C,OH S K. Small departures,big continuities?Norms,values,and routines in The Guardian’s big data journalism[J]. Journalism studies,2015,18(8):1-19.
[15] BURROWS R,SAVAGE M. After the crisis?Big data and the methodological challenges of empirical sociology[J]. Big data & society,2014,1(1):191-211.
[16] PAUL N,NISBETT G. The numbers game:how local newspapers used statistics and data visualizations to cover the coronavirus pandemic[J]. The Howard journal of communications,2022,33(3):297-313.
[17] MANYIKA J,CHUI M,BROWN B,el al. Big data:the next frontier for innovation,competition,and productivity[R/OL].(2011-05)[2021-11-08]. http://www.mckinsey.com/Insights/MGI/Research/Technology_and_Innovation/Big_data_The_next_frontier_for_innovation.
[18] BORGES R E. Unravelling data journalism:a study of data journalism practice in British newsrooms[J]. Journalism practice,2016,10(7):833-843.
[19] YI J S,KANG Y A,STASKO J T,et al. Toward a deeper understanding of the role of interaction in information visualization[J]. IEEE transactions on visualization and computer graphics,2007,13(6):1224-1231.
[20] KNIGHT M. Data journalism in the UK:a preliminary analysis of form and content[J]. Journal of media practice,2015,16(1):55-72.
[21] 图片来源:https://interactive.aljazeera.com/aje/2020/saving-the-nile/index.html。
[22] 图片来源:https://www.eldiario.es/nidos/no-ninos-nacen-toca-dar-luz-semana-21-probable-hacerlo-lunes-viernes_1_6400307.html。
[23] YI J S,KANG Y A,STASKO J T,et al. Toward a deeper understanding of the role of interaction in information visualization[J]. IEEE transactions on visualization and computer graphics,2007,13(6):1224-1231.
[24] BOY J,DETIENNE F,FEKETE J D. Storytelling in information visualizations:does it engage users to explore data?[C]//ACM Conference on Human Factors in Computing Systems.New York:ACM,2015.
[25] SINGER J B. User-generated visibility:secondary gatekeeping in a shared media space[J]. New media & society,2013,16(1):55-73.
[26] 张超,钟新.新闻业的数据新闻转向:语境、类型与理念[J].编辑之友,2016(1):76-83.
[27] HOWE J. The rise of crowdsourcing[J]. Wired,2006,14(6):176-183.
[28] NGUYEN A. News,numbers and public opinion in a data-driven world[M]. New York:Bloomsbury Academic,2018.
[29] 刘涛.理解数据新闻的观念:可视化实践批评与数据新闻的人文观念反思[J].新闻与写作,2019(4):68.
[30] LAUREN K. Truth in mapping [EB/OL]. (2020-12-18)[2022-06-15]. https://www.technologyreview.com/2020/12/18/1012996/truth-in-mapping/.
[31] Leventhal Map & Education Center at the Boston Public Library. Bending lines:maps and data from distortion to deception[EB/OL]. (2020-05-27) [2022-06-15].https://www.leventhalmap.org/digital-exhibitions/bending-lines/.
[32] 图片来源:https://collections.leventhalmap.org/search/commonwealth:rr173g37d。
[33] 图片来源:https://collections.leventhalmap.org/search/commonwealth:rr173g35v。