2.3.2 模式关系

2.3.2 模式关系

给定概念c及其属性a或关系r,本节描述基于句袋的槽模式构建方法,具体步骤如下:

(1)构建属性a的属性触发词集合Stw(a);

(2)搜索数据集中包含Stw(a)中元素的句子集合Ss(a);

(4)对于句袋Bk,提取Bk中所有句子的最大公共子序列;

(5)基于最大公共子序列,构建用于提取属性a的属性值的槽模式集合。

进一步,基于迭代式学习的槽模式学习方法,主要步骤如下:

(1)给定属性a的属性值的槽模式集合;

(2)对于数据集,根据槽模式集合,提取隶属于概念c的实体e1,e2,…,em的属性a的属性值v1,v2,…,vm,即集合Sk={(ek,a,vk)},1≤k≤m;

(3)在数据集中搜索包含{(ek,a,vk)}的句子,采用基于句袋的槽模式构建方法,构建面向属性a的槽模式,将构建的新槽模式添加到槽模式集合中,转入步骤(2);

(4)提取隶属于概念c的实体的属性a的属性值,将提取的新元组添加到集合Sk;转入步骤(3)。

(5)直至提取完新元组和新槽模式。

对于模式之间的关系,可分为以下七类:模式相等关系、模式包含关系、模式继承关系、模式蕴含关系、子模式关系、子继承模式关系和子蕴含模式关系,如图2.4所示。

图2.4 模式关系分类

设p1=〈t11>〈t12>…〈t1m>,p2=〈t21>〈t22>…〈t2n>,

(1)模式相等关系。

谓词表示:SamePattern(p1,p2)。该谓词的含义是,若m=n,∀k,1≤k≤m,并且公式(t1 k=t2 k)成立,则模式p1和模式p2具有相等关系。对于句子s,若句子s匹配模式p1,则句子s匹配模式p2

(2)模式包含关系。

谓词表示:IncludePattern(p1,p2)。该谓词的含义是,若m=n,∀k,1≤k≤m,并且(t1 k=t2 k)∨(t1 k∈t2 k)成立,则模式p1和模式p2具有包含关系。其中,t1 k∈t2 k表示项t1 k属于项t2 k。例如,项“〈在>”属于项“〈关系动词集合>”。对于句子s,若句子s匹配模式p1,则句子s匹配模式p2

(3)模式继承关系。

谓词表示:InheritPattern(p1,p2)。该谓词的含义是,若m=n,∀k,1≤k≤m,并且(t1 k=t2 k)∨(IS-A(t1 k,t2 k))成立,则模式p1和模式p2具有继承关系。其中,IS-A(t1 k,t2 k)表示项t1 k与项t2 k具有上下位关系。例如,项“〈金刚山风景名胜区>”与项“〈遗址>”具有继承关系。对于句子s,若句子s匹配模式p1,则句子s匹配模式p2

(4)模式蕴含关系。

谓词表示:ImplyPattern(p1,p2)。该谓词的含义是,若m=n,∀k,1≤k≤m,并且(t1 k=t2 k)∨(Imply(t1 k,t2 k))成立,则模式p1和模式p2具有蕴含关系。其中,Imply(t1 k,t2 k)表示项t1 k与项t2 k具有蕴含关系。例如,项“〈关系动词>”与项“〈仿佛>”具有蕴含关系。对于句子s,若句子s匹配模式p1,则句子s匹配模式p2

(5)子模式关系。

谓词表示:SubPattern(p1,p2)。该谓词的含义是,若m>n,从集合{〈t21>,〈t22>,…,〈t2n>}到集合{〈t11>,〈t12>,…,〈t1m>}存在有序包含关系,则称模式p2是模式p1的子模式。

定义(有序包含关系):给定集合T1={〈t11>,〈t12>,…,〈t1m>}和T2={〈t21>,〈t22>,…,〈t2n>},若m>n,且从集合T2到集合T1存在有序映射关系,即

则称集合{〈t21>,〈t22>,…,〈t2n>}到集合{〈t11>,〈t12>,…,〈t1m>}存在有序包含关系。

(6)子继承模式关系。

谓词表示:SubInheritPattern(p1,p2)。该谓词的含义是,若m>n,且从集合{〈t11>,〈t12>,…,〈t1m>}到集合{〈t21>,〈t22>,…,〈t2n>}存在有序继承关系,则称模式p1是模式p2的子继承模式。

定义(有序继承关系):给定集合T1={〈t11>,〈t12>,…,〈t1m>}和T2={〈t21>,〈t22>,…,〈t2n>},若m>n,且从集合T2到集合T1存在有序映射关系,即

则称集合{〈t11>,〈t12>,…,〈t1m>}到集合{〈t21>,〈t22>,…,〈t2n>}存在有序继承关系。

(7)子蕴含模式关系。

谓词表示:SubImplyPattern(p1,p2)。该谓词的含义是,若m>n,且从集合{〈t11>,〈t12>,…,〈t1m>}到集合{〈t21>,〈t22>,…,〈t2n>}存在有序蕴含关系,则称为模式p2是模式p1的子蕴含模式。

定义(有序蕴含关系):给定集合T1={〈t11>,〈t12>,…,〈t1m>}和T2={〈t21>,〈t22>,…,〈t2n>},若m>n,且从集合T2到集合T1存在有序映射关系,即

则称集合{〈t21>,〈t22>,…,〈t2n>}到集合{〈t11>,〈t12>,…,〈t1m>}存在有序蕴含关系。

给定概念属性的属性值的槽模式,对于槽模式包含的模式集合,引入下面模式相似性的度量函数。

函数:Same-To(〈项t1>,〈项t2>,...,〈项tk>)。该函数的含义是:“k个项t1,t2,…,tk完全相同”。

函数:Same-To(〈类C>,〈槽S>;〈模式CP1>,〈模式CP2>,...,〈模式CPk>)。该函数的含义是:“类C的槽S的槽模式中k个模式CP1,CP2,…CPk完全相同”。

函数:Similar-To(〈类C>,〈槽S>;〈模式CP1>,〈模式CP2>,...,模式CPk;m;n1,n2,…,nm)。该函数的含义是:“类C的槽S的槽模式中k个模式CP1,CP2,…,CPk共有m个项相同,分别为第i个模式的第ni1,ni2,...,nim项,i=1,2,…,k”。

函数:Similar-To-Except-Content(〈类C>,〈槽S>;〈模式CP1>,〈模式CP2>;1;〈模式CP1项内容>,〈模式CP2项内容>)。该函数的含义是:“类C的槽S的槽模式中模式CP1和模式CP2只有一项不同,其余项的内容和连接符均完全相同”。该不同项在CP1和CP2中的内容分别为:〈模式CP1项内容>,〈模式CP2项内容>。

函数:Similar-To-Except-Content(〈类C>,〈槽S>;〈模式CP1>,...,〈模式CPR>;k;〈模式CP1内容>,…,〈模式CPk内容>)。该函数的含义是:“类C的槽S的槽模式中函数Similar-To-Except-Content(模式CP1,模式CP2;1;〈模式CP1项内容>,〈模式CP2项内容>)的非形式定义的推广”。具体地,类C的槽S的槽模式中模式CP1和模式CP2有k项不同,其余项的内容和连接符均完全相同。该不同项在CP1和CP2中的内容分别为:〈模式CP1第1项内容>,…,〈模式CP1第k项内容>,〈模式CP2第1项内容>,…,〈模式CP2第k项内容>。