一、数据挖掘与知识发现
KDD被认为是从数据中发现有用知识的整个过程。KDD过程定义为在数据中鉴别出有用模式的非平凡过程,该模式是新的,可能有用的和最终可理解的。而数据挖掘被认为是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式。数据挖掘是KDD最关键的步骤,也是技术点所在。研究KDD的人员中大部分都在研究数据挖掘技术,采用较多的技术有决策树、分类、聚类、粗糙集、关联规则、神经网络、遗传算法等。数据挖掘根据KDD的目标,选取相应算法的参数,分析数据,得到可能形成知识的模式模型。数据挖掘算法的好坏将直接影响到所发现知识的好坏。目前大多数的研究都集中在数据挖掘算法和应用上。人们往往不严格区分数据挖掘和数据库中的知识发现,把两者混淆使用。