2.3 开放数据晴雨表(ODB)

2.3 开放数据晴雨表(ODB)

与GODI和ODM相比,ODB指数的范围更为广泛,包括三个副指数:就绪度、实施和影响。对于就绪度,《方法论》解释称,该副指数并非旨在衡量“启动政府数据开放计划的意愿,而在于衡量是否做好准备从中获得积极成果”[46]。因此,副指数衡量的不仅是数据的可用性,还包括数据生态系统中存在(或缺失)的其他要素,表明数据开放项目取得有益成果的可能性。如前所述,当国家存在“数据开放生态系统”时,取得成功的可能性便更高[47]。因此,就绪度副指数包含四个组成成分:一是对政府政策的衡量;二是政府行为,包括行政决定;三是能够利用政府数据开放进行创新的企业家和企业的存在;四是存在知情权立法、隐私保护和政治自由且公民具备相关法律意识。如表2所示。

表2 ODB副指数、组成、权重和数据来源

续表

来源:Web Foundation[48]方法论描述链接(PDF文档)

副指数的运用是为应对被视为“系统相关要素”的诸多内容和部分“数据内在质量”的计量指标[49]。此类内容包括政府开放数据的格式、可机读性、批量下载的可能性、开放式许可、数据库的时效性、查找数据库相关信息的难易度及数据库的可发现性。分析中包括了数据开放计划最常发布的数据类型:地图、土地数据、国民经济和人口数据集、预算、支出、公司注册、立法、运输、贸易、健康、教育、犯罪、环境、选举和政府合同。根据其影响分为三类集群——创新、社会政策和问责制。举例而言,政府合同数据属于创新集群,健康部门绩效属于社会政策集群,全国选举数据则属于问责制集群。各集群数据库的评估是相互独立的,计算实施副指数的得分时,各群集分数的权重相同。

最后,影响副指数所用的问题包括政治影响(对政府效率、效力、透明度和问责制的影响)、社会影响(对环境可持续发展和包容边缘化群体的影响)和经济影响(对经济的积极影响和对创业的影响)。

每个副指数在整个ODB指数中的权重相同(均为1/3)。副指数各要素的权重也相同(见表2)。各要素的估算以四种数据类型为基础:政府自我评估、数据开放专家的调查回复、对数据集开放的评估;次要数据。表2亦显示了各副指数的数据基础。

总结本节,尽管GODI、ODM和ODB皆对相同概念予以度量,但包括的子要素却截然不同,收集信息的方法也不相同。GODI采用众包方式建立数据库集合,之后利用专家问卷对主要依赖于“系统”的标准数据库进行评估。ODM通过自动化流程分别估算各国开放数据的发布质量和数量:基于软件程序采集的元数据展开评估。ODB的评估过程更为全面且基础广泛,不仅考虑了数据开放计划的实施(数据内在质量和系统相关因素),还考虑了国家对数据开放计划的准备情况及潜在影响。ODB方法还有赖于更广泛的多样化信息输入,包括政府自我评估、专家评审、数据库评估和次要数据。

在下一节中,我们将审视以上各方法和数据源能否为数据开放生成可靠的计量标准。我们所用的相关性分析对开放数据观察[50]的方法做了调整和更新。