专题04 精确新闻报道的高级形态:数据新闻

专题04 精确新闻报道的高级形态:数据新闻

1.“数据新闻”的定义及特点:(1)定义解释:数据新闻有广义和狭义之分,广义的数据新闻是指在新闻报道中使用了数据;而狭义的数据新闻则是指“数据驱动新闻”的一种更高级的新闻报道形态,是在大数据技术迅速发展的背景下,通过大规模的数据收集、处理、统计、分析和可视化呈现进行的新闻报道。(2)概念区分:尽管新闻中使用数据也是数据新闻的一种体现方式,但数据新闻并非仅仅指在新闻报道中使用了调查数据的新闻,在今天更多强调基于大规模数据进行分析和统计之后生产出的新闻。(3)产生背景:数据新闻并不是计算机时代独有的产物,但计算机、大数据的发展直接促进了“数据新闻”的常态化应用,大数据挖掘、分析和处理技术的发展是数据新闻在新媒体环境下迅速发展的重要推动力量。(4)理论渊源:“数据新闻”跟“精确新闻”有着一脉相承的渊源,即在新闻报道中使用数据,是当时媒体、记者为了改进新闻报道的客观性不足问题进行报道优化的结果。

2.数据新闻的发展历程:数据新闻经历了精确新闻学、计算机辅助新闻(数据库新闻)到大数据新闻的发展历程。(1)精确新闻学:数据新闻并非一种全新的新闻报道形式,其源头可追溯到20世纪六七十年代西方媒体的精确新闻报道。精确新闻报道的理念是由美国记者菲利普·迈耶(Philip Meyer)提出的,强调将社会科学和行为科学的研究方法引入新闻采访报道中。(2)计算机辅助新闻:计算机辅助报道更偏向于一种辅助工具,主要是把数据的收集与分析作为提高报道能力的一种手段,例如,新闻记者可通过对公共数据库的信息分析来发现新闻线索。(3)大数据新闻:基于人力无法胜任的大规模数据的抓取、处理、统计及可视化而生产的新闻,其特点为,数据规模体量大、数据处理难度大、对自动化信息处理技术和处理水平高度依赖。

3.数据新闻发展现状及趋势:(1)数据新闻生产社会化:数据新闻生产不再是专业媒体所独有,一些第三方机构也加入数据新闻生产行列,开放与合作成为数据新闻生产的新趋势。例如,武汉镝次元数据科技有限公司和武汉大学新闻与传播学院进行合作,在数据搜集、内容可视化以及数据素养培训等方面系统培训数据新闻生产从业人员。(2)公共服务导向:数据新闻要遵循数据伦理,例如过滤掉涉及个人隐私的数据以及使用脱敏数据;此外,在追求形式多样的同时,更加注重新闻的核心价值,以用户为导向,进行信息传递。(3)盈利模式多元化:除了采用广告这种变现模式以外,数据产品以及内容定制成为数据新闻机构新的盈利模式。例如财新网的“财新数据通”产品,以为用户提供订阅服务实现盈利;在内容定制方面,澎湃新闻与蒙牛合作,探索出与品牌冠名的经营方式。

4.数据新闻的生产流程:(1)数据获取:数据的获取是数据新闻生产的前提,数据的发现与采集可以依赖不同的渠道。数据新闻的数据可来源于媒体现有的公开报道;政府机构、社会上各类组织以及企业发布的公开信息也是重要的数据来源,例如国外许多政府、企业、媒体机构纷纷建立自己的数据库,向记者和公众免费开放;随着物联网的发展,各类传感器采集的数据将会越来越多,未来的物联网数据将会成为数据新闻的重要来源。例如央视推出的“数说命运共同体”是基于GPS传感系统中的数据进行的分析。(2)数据处理:收集的数据必须是可靠的数据,因此需要对获取的数据进行处理。数据处理主要包括数据的质量鉴别和数据清洗两个环节。对数据质量进行鉴别即对数据真实性的鉴别以及对数据产生背景的分析;数据清洗即去除所收集数据中的“脏数据”,例如重复出现的数据以及存在明显逻辑错误的数据等。(3)数据分析:数据分析是指寻找数据之间的关系,从而揭示其所蕴含的新闻意义。在对数据进行分析时,可以探究新闻发生的背景及原因,同样也可以发现事物发展的规律,用于预测未来发展趋势。(4)数据呈现:数据呈现通常是指数据的可视化,即用图形、图像等视觉符号来表达数据、知识等抽象信息。如中国雄安官网发布数据新闻《一组数据带你看雄安之变》展现雄安新区设立以来的建设成果,用数据更加直观地呈现出雄安新区建设四年来的变化,央视发布的《大数据看五一假期有多火》全方位展现“五一黄金周”期间的产业、经济、民生数据。

5.以大数据为依托的数据新闻:(1)大数据与数据新闻:数据新闻也是大数据技术的一个重要应用领域,主要为新闻机构或职业媒体人在海量数据收集、清洗、统计的基础上,以可视化为主要方式的一种新闻生产样态。(2)大数据作为数据新闻的基础:大数据技术是数据新闻勃兴的重要推动力量,这主要表现在两个方面。一方面,大规模的数据积累为数据新闻的生产提供了宝贵的素材;另一方面,数据处理技术的更新为大规模的数据处理及可视化呈现提供了可能。(3)数据新闻带来的隐忧:数据新闻将新闻生产的过程隐藏于幕后,生产者发布新闻时只提供某些数据化的结果和结论,此时,数据的来源、数据处理的标准、新闻生产者的价值取向都将以不为公众所熟知的方式对新闻报道的结论产生影响,即新闻生产的“黑箱化”。(4)数据新闻存在的问题:数据新闻需要依托真实可靠的数据以及有效的数据公开,目前数据公开的程度、范围、质量存在的不足严重制约了数据新闻的发展前景;新闻从业者存在数据素养不足的问题,对数据的挖掘与处理能力有限,从而出现数据真实性以及媒介伦理等问题,限制了数据新闻的发展;此外,数据新闻也将带来隐私侵犯等伦理和法律问题。

6.数据新闻的价值意义:(1)提升新闻报道的客观性:数据新闻最初因在新闻报道中使用调查、分析和统计数据发展而来,其初衷是解决西方新闻报道中普遍存在的客观性不足、煽情内容泛滥等问题;数据新闻依赖客观真实的数据生产新闻,对于传统方式而言,更能增强新闻报道的客观性。(2)提供讲故事的新方法:使用数据可视化软件,通过统计大量的数据,帮助记者使用数据图表讲述错综复杂的故事;同时能够帮助记者发现若干新闻事实之间的关联,解释宏大背景下若干因素之间的关系,甚至进行预测性报道。(3)激活休眠数据的价值:人类信息技术的发明和发展为大规模的数据存储提供了实现条件,“数据新闻”格外倚重对大规模数据的统计和处理,这将在很大程度上提高人类社会对已经累积的资料的利用率,使数据的价值充分释放出来。(4)对新闻事件进行阐释:将启迪新闻报道不再仅仅记录新闻事实、再现事实真相,更将进一步推动新闻记者由新闻事实的记录者、真相还原者转向新闻事件的解读者、预测者。

7.精确新闻学(Precision Journalism):(1)概念由来:20 世纪六七十年代出现于美国的一种报道理念,强调数据资料在新闻报道中的使用,从而解决解释性新闻报道客观性不足的问题;最早为美国新闻学者菲利普·迈耶在1971 年出版的《精确新闻学》中提出。(2)操作方法:该理念主张用问卷调查、实地实验、内容分析、量化统计、民意测验等现代社会科学的方法和新手段来收集资料、查证事实,以保证新闻报道的准确性与客观性。(3)应用价值:用精确的数据、概念来分析新闻事件,尽可能避免主观、人为的错误,从而使新闻报道更加客观、公正、令人信服;精确新闻学自提出后,不断向美国以外的地区扩散,成为一种被普遍接受的新闻观念和新闻报道方式。

8.计算机辅助新闻(Computer-Assisted Journalism):(1)定义:计算机辅助新闻(CAJ)又称计算机辅助报道(CAR),出现于 20 世纪 90 年代初,是使用计算机访问或链接其他计算机或依赖数据库,借以建立新的数据库或寻找现成的数据库,在此基础上对数据库进行统计分析进而生成报道。(2)特点:计算机之间的链接与依赖数据库,正因如此,计算机辅助新闻又被称为“数据库新闻”。(3)影响:提高记者的生产能力和效率,增加对信息的接近性,强化新闻的准确性,摆脱记者对新闻解释及消息来源的依赖,加强记者对数据意义的解读和阐释;同时有助于节省新闻机构的采访成本,增强竞争能力,提升报道质量。

9.数据新闻对传统新闻的影响:(1)新闻工作理念的变化:数据新闻作为一种“数据驱动新闻”,格外重视数据的价值和应用,甚至引发“数据就是生产力”的思维革命。(2)传媒人才结构的变化:数据新闻导致新闻生产人才的结构变化,将会激发对数据挖掘、数据处理和可视化三个方面人才的倾斜。(3)新闻报道实践的创新:用全面、完整、深入、有信服力的方式报道新闻;出现了依赖计算机智能进行自动化生产的新闻。(4)对海量信息的再生产:数据新闻从海量数据中发现之前研究方法无法发现的新规律、新动向、新趋势、新特点、新知识。(5)对新闻产业链的影响:将会围绕数据新闻的生产出现数据采集、数据整理、数据加工、可视化呈现的专业机构。

10.数据新闻中的数据质量:(1)数据质量问题的提出:网络舆情分析、网络精准营销、数据新闻以及基于大数据的学术研究等都需要凭借精确的数据才能得出有价值的结论,一旦数据是“脏数据”,其研究结论的可靠性及参考价值就会大打折扣,甚至会导致出现错误的决策。(2)数据质量瑕疵产生的原因:直接原因是数据的清洗过程不能有效剔除假数据、“脏数据”和无效干扰数据,更为复杂的原因包括数据造假、水军营销等极大降低了数据价值的密度也影响了数据的质量,如在舆情分析和社科研究中,很难识别出哪些信息是由水军甚至是高智能机器人发布的。(3)数据质量瑕疵的应对策略:在数据采集、数据清洗阶段进行更为严格、规范的数据质量把控,不要为求数据体量的大而放弃对数据质量的重视,政府有关部门要牢牢把控统计数据的质量关,避免“脏数据”通过权威的方式公开,同时,在研究的过程中充分整合“大数据”与“小数据”各自的优点,采用“全局数据 + 典型样本”等手段来提高分析的科学性和准确性。

11.突发事件中的数据新闻:(1)数据新闻的三大功能:数据新闻可以用来讲述故事、预测趋势、进行科普。具体表现为:讲述故事,即在突发事件中,可以采用图表、数据的方式以简明、直观的方式呈现事件的来龙去脉,让受众迅速了解事实状况;预测趋势,即根据对历史数据的回溯和动态数据的跟踪,预测事件未来发展的可能性;进行科普,即采用图表、漫画、数据等方式对事件的背景、同类型事件、事件的应对措施等具体维度进行可视化呈现,使复杂的事实素材更加轻松易读。(2)数据新闻的特殊意义:用简洁、清晰、直观的数据、图表、动画等方式再现复杂的故事过程及事件中若干要素的关联性;在信息生产及供给海量化的背景下,有助于读者迅速了解事实的全局信息,解决用户注意力稀缺和难以阅读长篇调查报告的问题;契合互联网时代新媒体用户信息获取的图片化、视觉化、可视化需求;丰富新媒体时代内容生产的形态、种类,为受众提供多样化、多元化新闻产品;增强新闻报道的直观性、客观性、准确性与可读性。(3)数据新闻的局限性:突发事件一般具有紧急性、紧迫性,对新闻生产及报道的效率有极高要求,而数据新闻受制于其复杂的生产流程,难以满足受众对新闻报道时效性的要求;突发事件一般较为复杂,涉及较多利益主体和主客观因素,数据新闻在呈现极为复杂的要素关系上具有较大困难,故在报道复杂事件时,仅能从部分维度展开叙事;如果事件尚处在动态的进展过程中,数据新闻往往难以进行动态的、可持续的报道;从现实操作状况来看,数据新闻较多停留在对事实状况的描述和介绍上,在趋势预测、多因素关联分析上开发不足。

12.延伸:大数据对传统研究范式的影响:(1)大数据的优势特点:大数据具有数据容量大、处理速度快、数据类型丰富等特点,这对于传统的以抽样为方式的小样本调查来说是一项巨大的变革,意味着在大数据时代,社会科学研究有可能通过规模更大的样本发现无尽的可能性。(2)拓展科学研究视角:舍恩伯格曾经提及大数据重视相关性而不重视因果性的思维,尽管有人提出过疑问,但相关性研究思路也为社科研究提供了新的可能性,通过相关分析可以发现不同于以往研究方式的结论,如使用于营销和广告领域。(3)推动交叉领域的研究:大数据技术的热化催生了“数据科学 + 具体领域”的跨学科研究范式,大数据正成为一个杠杆,不仅为之前的研究提供了新的思路和方法,也催生了若干新的交叉研究领域。如“数据科学+法学”就开拓了法学在案例量化研究方面的新领域。(4)大数据研究的局限性:大数据技术不可能取代传统的研究方式,它只是量化研究的一种升级和发展,传统的基于抽样研究的范式依然有其存在的价值。此外,在现今语境下,数据质量普遍偏低、数据可信度不足、数据隐私问题、数据确权问题都严重制约了大数据技术在研究中的应用。