什么是数据新闻

什么是数据新闻?

数据新闻(Data-driven journalism)并不是一个新的概念。事实上,数据新闻先锋英国卫报的第一个数据新闻报道可以追溯到1821年5月5日,卫报(彼时的卫报还叫做曼彻斯特卫报)历史上第一份报纸的头版新闻:曼彻斯特在校小学生人数及其年平均消费。这份数据现在可以从卫报的网站上下载原版的PDF数据,或经过后期数据清理的资料表

数据新闻简单来讲就是利用真实有效的数据来发现、辅证、和讲述新闻故事。举个最简单的例子,人的身体需要各种各样的营养,缺维生素B1可能导致消化不良,缺少维生素C导致抵抗力下降。事实上,我们的身体也可以理解为一个永不休息的数据新闻记者,搜集身体营养数据,向大脑报告发现的问题。当如此这般的“健康报告”不再是关乎一个人,而是一群人,所有人,这便是我们所说的数据新闻了。

DDJ(Data-driven journalism)是一个2009年出现的词汇,常与之相伴的另外一个概念是计算机辅助报道(CAR, Computer-assisted reporting)。这也是数据新闻发展到今天与传统报道最大的区别:现代数据新闻依赖开源软件(open source software)来获取、整理、分析大数据,从而找到其中的规律,发现其中的异常,最后对数据进行可视化,用最容易被理解(好的可视化也具有很高艺术性)的方式呈现给读者。

以下这幅来自Visual.ly的信息可视图,既阐述了什么是数据新闻,其本身也是数据新闻的一个例子。

其他一些优秀的数据新闻作品可以在本站《九大值得记住的可视化新闻作品》中看到。

这些数据有什么特别的吗?

没有。

事实上,许多数据新闻报道的数据来源都是公开的,任何一个读者都可以从政府网站、公共图书馆、企业资料、或者其他网络资源中获得,比如我国的国家数据网以及美国纽约州的公开数据网站。然而,没有经过处理的大数据,一方面由于其繁杂量大的特点很难被读者消化,另一方面由于原始数据常常复杂凌乱,读者很难从中发现问题。这样令人不悦的数据我们通常称之为“Dirty Data”。将这些枯燥杂乱的数据整理为简明易懂的,可为新闻故事服务的数据,也许是数据新闻整理写作过程中,耗时最长的阶段。

本站资源列表下定期更新数据处理和可视化的工具及教程。推荐浏览《数据清理/分析工具》以及《数据可视化工具》

数据新闻记者做些什么?

所有传统记者要做的:发现新闻,找到线索人物,采访,写作等传统新闻记者的任务。

以及:

– 发现有趣的数据,嗅到其中的新闻价值

– 整理分析数据

– 对数据进行可视化

– 根据数据进行进一步的采访和写作

由于处理数据往往需要一些专业技能,数据新闻通常是多人合作的项目。当然,业界也不乏兼采访、技术与写作能力于一身的记者,这样的新生代记者数量不断增加。国际各大新闻院校也在不断培养前沿记者们,比如哥伦比亚大学新闻学院创新开设了计算机和新闻双硕士学位,旨在培养数字时代下的媒体新生力量。

此外,各大媒体也都致力于组建自己的数字新闻团队。这也是一个从“黑客”转为“数据新闻记者”的好机会。数据新闻团队需要多样人才,因此,无论你是毫无代码经验的传统纸媒记者,还是尚未入行的计算机达人,只要你有“数据新闻敏感性”,都有可能成为数字新闻记者。

更多关于各国著名数据新闻记者的情况可在《数据新闻界的大牛们》看到。