对开放数据的可获取性、质量和影响的度量
2025年10月13日
1.对开放数据的可获取性、质量和影响的度量
从历史上看,各国统计组织一直负责编制、归档和传播国家统计数据。世界银行[17]统计能力指标(SCI)等指数试图对各国统计系统的能力进行量化[18]。指标使用三个子标准:统计方法(数据的收集遵循国际标准和规范);源数据(普查周期和行政数据的可靠性);周期性和及时性(统计输出的规律性、及时性和可用性)。
度量数据开放程度的各类方法很大程度上归功于世界银行SCI等传统计量。但是,开放数据评估也存在显著差异。首先,开放数据指标与SCI不同,不仅限于国家统计组织生成的数据,还包括各级政府部门生成的各类信息。政府信息处理能力的普及大大增加了各级政府收集、归档和发布的信息量。其次,SCI等措施以对所含元数据信息的分析为基础;但新的信息技术允许对数据库本身进行质量评估,令新的质量评估法成为可能,如OKI[19]为其全球开放数据指数(GODI)实施的众包以及世界正义工程所用的人口调查[20]。第三,SCI等计量并未考虑数据库是否满足新媒体环境中定义的“开放”标准。
本文将按顺序讨论数据开放的三个方面:开放性、内在质量和影响。