3.指数对比

3.指数对比

在初始阶段,我们研究三个指数的国别覆盖范围。为确保可比性,使用了三个指数涵盖的最新年份:恰好是2016年。涵盖94个国家的GODI主要关注高收入和中高收入国家,对偏低收入国家亦有所体现。ODM涵盖欧盟的32个国家;显然不包括任何低收入国家。覆盖115个国家的ODB的区域覆盖范围最为平衡,包括撒哈拉以南非洲和加勒比地区的若干国家。

指数的平均数反映了样本组成。主要由较富裕的欧盟国家组成的ODM的平均得分(45.4)高于GODI(37.0)和ODB(32.5)。数据开放的表现与各国经济状况密切相关。在全部三个指数中,高收入和中高收入国家的得分均高于中低收入和低收入国家。F统计量表明,三个指数中,不同国民收入等级的得分均存在显著差异,尽管ODM中的显著差异仅存在于p<0.1的水平上。

表3 按国别收入对比国家数量、平均数和标准差

接下来,计算指数间的相关性。由于三个指数衡量的基本概念相同,故应呈高度正相关。但是,ODB包含的副指数可能与开放数据的质量无关;具体而言,与其他指数试图衡量的数据开放质量相比,就绪度和影响是更为宽泛的概念。因此,ODB的实施副指数亦作为独立计量指标纳入相关性分析。结果如表4所示。

表4 GODI、ODM、ODB和ODB实施副指数的皮尔森相关系数

如表4所示,GODI、ODB和ODB实施彼此高度相关。对相关性的观察结果高于开放数据观察[51]2013年数据分析的结果。显然,2013年起对指数编制法的改动与GODI和ODB指数更为一致。此外亦观察到ODB与其ODB实施副指数间呈现高相关性。就绪度和实施(r=0.86,p<0.01,N=115)、影响和实施(r=0.79,p<0.01,N=115)以及就绪度和影响(r=0.83,p<0.01,N=115)之间亦呈明显正相关,表明ODB指数的可靠性较高。在数据开放质量方面取得进展的国家似乎也实施了良好的“数据生态系统”(就绪度)并从中受益(影响)。

然而,表4中的结果还表明ODM与GODI和ODB间并不存在显著相关性(尽管仍为正相关)。ODM的指数编制法更为自动化,依靠采集器收集元数据。另两种方法则主要依靠人力输入,包括众包数据库和专家人工评估数据库质量。人类编码人员显然能够找到数据开放质量的度量角度,而这些角度在单独的元数据中却并不明显。