2.2 开放数据监测(ODM)
2025年10月13日
2.2 开放数据监测(ODM)
与使用众包和专家评审生成数据开放指标的GODI相比,ODM利用数据采集过程创建目录,随后按照多个定性和定量指标对目录进行编码,从而得出分数。首先,ODM使用名为“采集器”的软件程序从外部数据库、目录和门户收集元数据。由于数据集所用的格式可能有所不同,ODM使用三个采集器:一个用于开源的综合知识档案网络(CKAN)、一个用于HTML、还有一个用于Socrata平台。之后将所有元数据进行协调统一(例如,统一缩写、对数据字段重新排序)。
元数据统一后,ODM便按照多个定性和定量计量指标对其进行编码(见方法论部分)[44]。定性计量指标包括开放式许可证的普及度(开放式许可证涵盖的数据集版本所占的百分比)、可机读的格式;元数据的完整性(许可、作者、生成组织和创建或更新日期);可用性(目录中可公开获取的数据集所占的百分比);可发现性(基于谷歌和Alexa流量排名系统);非专用格式。定量计量指标包括目录的大小(单位为KB)、目录中各数据集的分发总数(版本);数据集数量;目录中代表的独特出版机构的数量;各国的目录数量。
定性指标总得分为“开放式许可证、可机读、开放访问和开放元数据的平均值”。[45]