7.1.4 公共数字文化资源整合的技术难点

7.1.4 公共数字文化资源整合的技术难点

基于上述分析可以发现,公共数字文化资源整合的过程,其基础步骤是将不同来源的元数据映射至特定元数据标准/格式。正是由于该标准/格式中的各字段均具有特定的语义信息,才从根本上实现了对不同来源、不同组织形式的元数据的整合。因此,元数据收割可以被认为是公共数字文化资源整合的技术关键点。

然而,Roel的研究表明,虽然图书馆领域有大量针对OAIPMH等元数据收割协议的相关研究,但将这些元数据收割协议应用于实际资源整合的机构却少之又少[29]。究其原因,既有实践中遇到的现实问题,也有一定的历史障碍因素。而不同类型机构在元数据文化和相关实践方面的巨大差异,正是OAI-PMH等元数据收割协议很难广泛推广的重要原因之一。

以图书馆、档案馆和博物馆三类机构的资源为例,Roel分析了其各自的元数据特点:受历史沿革的影响,图书馆资源采用元数据表达的时间更早,元数据涵盖的范围更广,表达的粒度也更细;并且与其他机构相比,图书馆资源元数据的结构相对固化。档案馆资源则对内容语境化更加侧重,其元数据表达呈现较强的层级规律。此种表达方式有助于完整表达特定档案的背景和时空关系等要素,但不同档案在不同层级间的元数据很少构成关联,因此其一致性相对较差,不利于整合。博物馆中,藏品相关资源以提纲性文件(如藏品简介)为主,其往往不以元数据的形式进行组织和表达。另外,博物馆往往将其文字资源视为自身的知识财产,因而将其元数据化的意愿通常不强。

上述分析是Roel基于美国国情所做出的,不一定完全适用于中国,但三类机构在元数据构建方面的差异却可见一斑。当然,也如该作者所言,上述技术难点本身是相对容易解决和克服的,在公共数字文化资源整合过程中,更大的障碍大多源自非技术因素。