2.3.1 模式本体分类

2.3.1 模式本体分类

根据模式的不同分类依据,可分为五种类型,如图2.3所示。

(1)属性模式和关系模式。

图2.3 模式分类体系

根据模式提取的目标值所关联的知识类型,模式划分为属性模式和关系模式。公理1和公理2是属性模式和关系模式的类属公理。

公理1.(∀p)(Attribute-Pattern(p)↔Pattern(p))

∧∃c∃e∃a(Goal-Knowledge(p,AttributeValue(c,e,a)))

公理2.(∀p)(Relation-Pattern(p)↔Pattern(p))

∧∃c∃e∃r(Goal-Knowledge(p,RelationEntity(c,e,r)))

公理1表明,模式p是属性模式的充要条件是:p的目标值是“隶属于概念c的实体e”的属性a的属性值。公理2表明,模式p是关系模式的充要条件是:p的目标值是“隶属于概念c的实体e的”关系r的关系值。其中,

谓词Pattern(p)表示p是模式;

谓词Attribute-Pattern(p)表示p是属性模式;

谓词Relation-Pattern(p)表示p是关系模式;

Goal-Knowledge(p,AttributeValue(c,e,a))表示从匹配模式p的句子中提取隶属于概念c的实体e的属性a的属性值;

Goal-Knowledge(p,RelationEntity(c,e,r))表示从匹配模式p的句子中提取隶属于概念c的实体e的关系r的关系值。

(2)布尔型模式、枚举型模式、字符串型模式,以及数值型模式。

根据模式提取的目标值的类型,可将模式划分为布尔型模式、枚举型模式、字符串型模式,以及数值型模式。公理3至公理6给出了这四种模式的类属公理。

公理3.∀p(Boolean-Pattern(p)

↔Pattern(p)∧Number-of-Goal-Values(p,2))

公理4.∀p(Enumerable-Pattern(p)

↔Pattern(p)∧Number-of-Goal-Values(p,m)∧Morethan(m,2))

公理5.∀p(Numeric-Pattern(p)

↔Pattern(p)∧Type-of-Goal-Value(p,Numeric))

公理6.∀p(String-Pattern(p)

↔Pattern(p)∧Type-of-Goal-Value(p,String))

根据公理3,模式p是布尔型模式的充要条件是:从匹配模式p的句子中提取的目标值个数为2。根据公理4,模式p是枚举型模式的充要条件是:从匹配模式p的句子中提取的目标值个数大于2。根据公理5,模式p是数值型模式的充要条件是:从匹配模式p的句子中提取的目标值类型为数值型。根据公理6,模式p是字符串型模式的充要条件是:从匹配模式p的句子中提取的目标值类型为字符串型。其中,

谓词Boolean-Pattern(p)表示p是布尔模式;

谓词Enumerable-Pattern(p)表示p是枚举型模式;

谓词Numeric-Pattern(p)表示p是数值型模式;

谓词String-Pattern(p)表示p是字符串型模式;

谓词Number-of-Goal-Values(p,2)表示从匹配模式p的句子中提取的目标值个数为2;

谓词Type-of-Goal-Value(p,Numeric)表示从匹配模式p的句子中提取的目标值类型为数值型。

(3)显式模式和隐式模式。

根据模式的目标值所隶属概念c的属性a的词汇是否在句子中显式出现,可将模式划分为显式模式和隐式模式。公理7和公理8给出了这两种模式的类属公理。

公理7.∀p(Explicit-Pattern(p)↔Pattern(p)

∧∃w(ContainSet(Wl,w)∧IncludePattern(p,w)))

公理8.∀p(Implicit-Pattern(p)↔Pattern(p)

∧∀w(ContainSet(W,w)→﹁IncludePattern(p,w)))

给定模式p,设该模式的目标值是隶属于概念c的实体e属性a的属性值,Wl是属性a的名称词汇集合。公理7的含义是指模式p是显式模式的充要条件是:存在名称词汇集合Wl中的元素w,模式p包含元素w。公理8的含义是指模式p是隐式模式的充要条件是:对于名称词汇集合W中的任一元素w,模式p均不包含元素w。

(4)事实型模式、概念型模式、程序型模式。

根据模式目标值的知识类型,将模式划分为事实型模式、概念型模式,以及程序型模式。

事实型模式是指通过模式所提取目标值的类型为事实型知识;

概念型模式是指通过模式所提取目标值的类型为概念型知识;

程序型模式是指通过模式所提取目标值的类型为程序型知识。

程序型模式包括事件主体变量项、事件客体变量项、事件发生时间变量项、事件发生地点变量项、事件发生起因变量项、事件发生经过变量项、事件发生结果变量项、事件发生条件变量项、事件发生方向变量项、事件发生程度变量项、事件发生频率变量项等。

(5)通用领域模式、专业领域模式、类属模式。

根据模式所属领域和类别,模式划分为通用领域模式、专业领域模式、类属模式。

定义(类属模式):设模式所提取的目标值隶属于概念c的实体e的属性a的属性值,或关系r的关系值,若概念c隶属于领域类别,则将该模式称为类属模式。

定义(通用领域模式、专业领域模式):设模式所提取的目标值隶属于概念c的实体e的属性a的属性值,或关系r的关系值,若概念c隶属于通用领域的类别,则将该模式称为通用领域模式;若概念c隶属于专业领域的类别,则将该模式称为专业领域模式。

属性模式和关系模式均能够被重用。

命题1.∀p∀c1∀c2∀e1∀e2∀a(IS-A(c2,c1

∧Goal-Knowledge(p,AttributeValue(c1,e1,a))

→Goal-Knowledge(p,AttributeValue(c2,e2,a)))

命题1的含义是,若类c2是类c1的子类,模式p的目标值是隶属于概念c的实体e1属性a的属性值,则模式p能够应用于抽取隶属于概念c2的实体e2属性a的属性值。

例如,若模式p的目标值是隶属于概念“遗址”的实体“金牛山遗址”的属性“发掘时间”的属性值,则模式p能够应用于抽取隶属于概念“房址”的实体“仰韶文化房址”的属性“发掘时间”的属性值。也就是,下式成立。

∀p∀e1∀e2∀a(IS-A(房址,遗址)

∧Goal-Knowledge(p,AttributeValue(遗址,金牛山遗址,发掘时间))

→Goal-Knowledge(p,AttributeValue(房址,仰韶文化房址,发掘时间)))

命题2.∀p∀c∀e∀a1∀a2(IS-A(r2,r1

∧Goal-Knowledge(p,AttributeValue(c,e,r1))

→Goal-Knowledge(p,AttributeValue(c,e,r2)))

命题2的含义是,若关系r2是关系r1的子类,模式p的目标值是隶属于概念c的实体e关系r1的关系值,则模式p能够应用于抽取隶属于概念c的实体e的关系r2的关系值。

命题3.∀p∀c1∀c2∃c∀e1∀e2∀a(IS-A(c2,c)∧IS-A(c1,c)

∧Goal-Knowledge(p,AttributeValue(c1,e1,a))

→Goal-Knowledge(p,AttributeValue(c2,e2,a)))

命题3的含义是,若类c2和类c1均是类c的子类,模式p的目标值是隶属于概念c1的实体e1属性a的属性值,则模式p能够应用于抽取隶属于概念c2的实体e2的属性a的属性值。