6.1.1 研究任务
2025年09月26日
6.1.1 研究任务
领域实体知识获取任务是从自由文本语料中获取结构化的领域实体知识。形式化地,领域实体知识获取任务可以描述如下:
定义(领域实体知识获取任务):领域实体知识获取是一个六元组(Co,Ca,A,Kn,Su,Ga),
Co是语料;
Ca={C,A1,A2,…,Ak},C为类别或概念,A1,A2,…,Ak为C的属性;
A是算法;
Kn是所用的语境知识,包括本体层语境和领域槽语境;
Su={Ai(E,Vi)|IS-A(E,C),i=1,2,…,k}是系统输出结果,其中,Ai(E,Vi)表示实体E的属性Ai的属性值为Vi。
Ga={Aj(E,Vj)|IS-A(E,C),j=1,2,…,k}是目标输出结果,其中,Aj(E,Vj)表示实体E的属性Aj的属性值为Vj。
例如,属性或槽“分布区域”为类或概念“古文化”的属性。又如,实体或个体“西侯度文化”的槽“分布区域”的槽值为“中国华北地区”,表示为:(西侯度文化,分布区域,中国华北地区)。
根据槽的名称词汇是否出现在文本中,将槽分为三类:显式槽、隐式槽和混合槽。将领域实体的属性槽划分为显式槽、隐式槽和混合槽的目的在于,根据槽的名称词汇的显式或隐式出现方式,设计不同的领域个体知识获取方法。
定义(显式槽,Explicit Slot):将槽的名称词汇出现在文本中的槽称为显式槽。例如:槽“面积”。
定义(隐式槽,Implicit Slot):将槽的名称词汇不出现在文本中的槽称为隐式槽。例如:槽“分布区域”。
定义(混合槽,Hybrid Slot):将既为显式槽又为隐式槽的槽称为混合槽。例如,槽“年代”。