1.1 研究背景
当今诸多行业领域面临杂乱信息泛滥、精准知识匮乏的问题。在社会生产和日常生活中,随着人工智能技术的发展与深度应用,人们冀望获得高质量的精准知识服务。
人工智能的目标是通过计算机来模拟和延伸人类智能行为。当前,深度学习方法的广泛应用迅猛地推动着专用人工智能技术的发展。作为一种数据驱动的方法,深度学习在计算机视觉、自然语言处理、语音识别等领域获得了极大的成功。但是,随着开放环境的泛在以及复杂智能感知与决策任务需求的增长,纯数据驱动的人工智能技术发展到了极致阶段,技术上难以实现大超越。技术上,“知识”嵌入是实现高阶人工智能的必要基础。
知识工程是人工智能学科中的重要内容。作为知识工程的核心内容,知识表示、知识获取、知识推理的相关方法与技术已经广泛应用于诸多智能系统之中[1,2,3]。在诸多行业领域中,领域知识是广泛存在的。在方法论层面,领域知识描述特定领域的概念内涵与外延、领域实体关系以及领域实体属性知识等。将领域知识与计算机技术有机融合可有效地处理专业领域应用任务[4,5]。比如,在医学领域、金融领域以及气象领域中,现有人工智能系统充分利用了领域知识,提升了相关人工智能产品的性能和服务质量。另外,问答系统、信息推荐和知识融合等知识工程应用技术所取得的突破性进展,同样离不开对相关领域知识或常识知识的深度应用。知识工程技术主要包括知识表示、知识获取、知识验证或评估、知识推理等内容。知识表示是指对各种类型的知识进行表示与组织,为知识工程的众多下游任务提供知识支撑。知识获取是指从互联网、书籍、期刊以及专家等来源中获取知识。其中,涉及结构化数据、半结构化数据和非结构化数据。知识类型包括领域知识、常识知识,或事实性知识、程序性知识、过程性知识以及意见性知识。知识验证是指对于以自动方式、半自动方式或人工方式获取的知识,验证其一致性、正确性和完全性。知识推理是指根据已有知识推理出未知的新知识。
鉴于知识工程的相关内容十分广泛,本书主要聚焦于知识表示、知识获取和知识验证及应用四个层面。具体涉及以下内容:
(1)在知识表示方面,主要包括形式领域本体、领域知识获取本体、模式本体、课程本体、时间本体。
(2)在知识获取方面,主要包括时间信息抽取、实体识别、术语定义抽取、实体上下位关系抽取、实体对齐关系识别、领域实体属性知识获取、非结构化文本作者属性识别、博客作者属性识别、源代码作者属性识别、文本描述流抽取。
(3)在知识验证方面,主要包括概念分类层次知识评估或验证、实体属性知识评估或验证。
(4)在知识应用方面,主要呈现时间本体在问答系统中的应用,以及概念分类层次知识评估和实体属性知识评估方法在多领域知识验证中的应用。