第7章 描述流抽取
随着多源异构数据的迅猛增长,人们跟踪和定位所需要的信息已经变得越来越困难了。通过信息检索、文本分类、主题识别、主题检测和跟踪等文本处理和分析等任务,能够了解文本的内容。但是,仍然难以捕获文本描述主题的细粒度内容和其中蕴含的描述顺序。因此,本章引入文本分析任务:描述流提取。
描述流提取通过识别文本的主题、主题的描述方面以及它们的顺序来反映文本的内容。这对信息检索、知识获取和信息提取将起重要的作用。本章阐述领域本体驱动的描述流提取方法。描述流对关注概念描述的完整性。对概念的描述一般遵循一定的规律,例如从具体到抽象、从整体到部分、从表层到里层等。人们在学习新知识认识新事物的过程中也遵循一定的规律,例如由里到外、由上到下、从现象到本质、时空关系等。通过刻画文本中描述事物的规律,描述流可以反映和指导概念描述的有序性和完整性,同时也可以引导并提升人们学习的有序性和完整性。