2.4.1 考古学领域形式本体
领域本体是对专业学科领域知识构建的概念框架和概念化约束。考古学领域本体由考古学类别、类别属性、类别之间的各种语义关系以及约束这些领域术语的内涵和使用的形式公理所构成。
考古学隶属于历史学和人类学,也是一门交叉学科。它是根据古代人类的遗址、遗迹和遗物研究人类古代社会历史的学科。考古学领域本体旨在为考古学领域知识提供概念化的、显式形式化的共享规范。其中,“概念化”是指通过识别现实世界中的实体类型、类别或概念及其属性和关系来对现实现象构建抽象模型。“显式”是指明确定义了概念或类别的内涵、关系及其使用约束。“形式化”是指本体应该是机器可读的,例如,以结构化方式进行处理和存储。“共享”是指本体捕获共有知识,这些知识不是个人的观点或认知,而是可以被一个群体所接受[13,14]。
对于领域本体概念空间或类别空间,包括类别以及类别之间的各种语义关系。例如,古文化遗址主要包括城堡、宫殿、村落、居室、作坊、矿穴、采石坑、窖穴、仓库、水渠、水井、窖址、壕沟、栅栏、围墙、界壕等。下面,基于实体之间的部分关系,给出类别之间的部分-整体关系的定义。
定义(部分-整体关系,Part-Whole Relation):给定两个类别C1和C2,定义如下映射f:
∀α∈Ext(C1),f(α)∈Ext(C2),f(α)是α的一部分,f是从类别C1的实例空间到类别C2实例空间的满射,则称C1是C2的整体类,C2是C1的部分类,记作Part-Whole(C2,C1)。
根据关系的性质,部分-整体关系满足非自反性、反对称性和传递性。非自反性是指部分-整体关系不满足自反性。具体地,若Part-Whole(C2,C1)成立,则∃x,y∈Ext(C1),f(x)是x的一部分,f(y)不是y的一部分。反对称性是指部分-整体关系满足不对称关系。具体地,若Part-Whole(C2,C1)成立,则Part-Whole(C1,C2)必不成立。传递性的含义是,若Part-Whole(C2,C1)和Part-Whole(C3,C2)成立,则Part-Whole(C3,C1)成立。
基于相关工作所描述的部分-整体关系分类[15],针对考古学领域的特殊性,本节阐述改进的部分-整体关系的分类。考古学的研究对象包括遗物和遗迹。遗物包括文化遗物和生态遗物。遗迹是能否反映人类活动的遗址和遗存等。本节将考古学领域中对象之间的部分-整体关系分类如下:
(1)收集物/成员(Collection/Member)。例如,“北京故宫属于世界文化遗产”,“器物是一组完整器物的一部分”;
(2)区域/地点(Area/Place)。例如,“北京故宫是北京的一部分”,“坟墓是墓地的一部分”;
(3)整体对象/组件(Integral-object/Component)。例如,“屋脊是北京故宫太和殿的一部分”,“墙是建筑残骸的一部分”;
(4)活动/特征(Activity/Feature)。例如,“金砖墁地是建设北京故宫太和殿的一部分”,“设计是制作陶器的一部分”;
(5)海量/部分(Mass/Portion)。例如,“地砖是北京太和殿广场地面”,“堆积物是堆积层的一部分”。
顶层本体侧重于刻画通用领域的概念及其关系,领域本体则着重于描述特定领域内概念及其关系。考古学的研究目的是阐明人类社会历史发展的规律,探索各个民族在每个历史阶段的社会历史发展的技术水平和文化传统。构建考古学形式领域本体(A Domain-Specific Formal Ontology of Archaeology),通常需要考虑如下基本问题:第一,什么是考古学领域本体;第二,如何表示考古学领域本体;第三,考古学领域本体的具体内容是什么;第四,如何验证考古学领域本体的正确性;第五,考古学领域本体具有哪些应用等。
(1)考古学领域本体设计准则。
形式领域本体构建的难点在于需要领域专家的参与,并需要系统化方法和构建准则来支撑不同知识工程师构建各自的领域本体,从而实现本体映射和集成。有关本体构建原则已在相关工作[16,17,18]中有详细的论述。为了共享和重用知识,设计领域考古学本体应该遵循如下准则。
清晰性、准确性和客观性。对于领域类别、领域实例、属性和关系等术语,给出其客观准确的自然语言定义。
完整性。对于领域类别,给出有关实例所属类别判别的必要和充分条件。通过本体表示语言形式化地给出实例隶属概念的充要条件。
命名标准性。采用考古学领域标准中的领域类别、属性和关系等术语的名称。对于领域标准中不存在的术语,通过咨询领域专家和阅读相关参考资料等进行命名。另外,给出这些领域术语的命名规范,增强不同知识工程师构建本体的可读性。
易转换性。从领域本体独立于本体表示语言的角度看,领域本体能够转换为采用其他本体表示语言表示的本体。例如,采用框架和一阶谓词逻辑相融合的领域本体语言表示的考古学领域本体能够转换为采用其他表示语言XML、RDF、XOL、OWL、DAML+OIL表示的本体。如果忽略领域本体的公理,领域本体也可以被认为是一个面向对象的语义模型。因此,它易于转换为其他面向对象的模型。
可共享性和可重用性。形式领域本体评估的一个重要因素是本体能否被其他用户和机构主体以及软件系统进行共享和重用。对于考古学领域知识应用,考古学领域本体为考古学对象提供了明确和形式化的概念描述,因此不同用户群体和组织机构(例如,图书馆和博物馆)之间以及不同软件代理之间的交流和通讯将变得更加容易和便捷。
可读性。基于领域本体的考古学知识表示,对于考古学领域专家来说,应该是清晰的和具有表达能力的。对于非考古学领域的用户来说,应该是易于理解和使用的。
(2)类别及其基本结构。
领域类别或领域概念之间存在多种关系。这里主要描述领域本体中两种最基本的关系:继承关系和部分-整体关系。本节识别考古学领域中的主要类别及其关系,并在知识层面为这些术语提供准确的内涵模型[19]。
下面给出了类别“遗物”“文化遗物”“生态遗物”和“装饰品”的子类以及这些类别之间的继承关系。