||
数据挖掘与知识发现关系探析
化柏林
中国科学技术信息研究所,北京 100038
(发表于《情报理论与实践》2008年第4期)
以数据挖掘与知识发现的分类为切入点,详细探讨数据挖掘与知识发现的关系。总结出关于数据挖掘与知识发现的关系问题有三种观点,即数据挖掘就是知识发现,数据挖掘是知识发现的一个步骤,数据挖掘与知识发现是完全不同的两个概念。三种观点各有道理,取决于研究者的研究背景、研究范畴与目标。最后对数据挖掘与知识发现的发展趋势进行探讨。
****************************************************
第一种观点:数据挖掘就是知识发现。
数据挖掘是从数据中挖掘,知识发现并不是从知识中发现,而是发现知识。知识是从数据中发现的,是经过挖掘发现的。数据挖掘是从源头入手,知识发现视目标而论。前者强调过程,后者强调结果,应该是一个概念的两种表述。
****************************************************
第二种观点:数据挖掘是知识发现的一个步骤。
数据库知识发现指从数据中获取有用知识的整个过程。KDD过程除了数据挖掘之外,还有数据预处理、数据筛选、数据清洗、已有匹配知识的吸收、结果的解释与评估,以确保从数据中抽取的知识是有用的[9]。
****************************************************
第三种观点:数据挖掘与知识发现是完全不同的两个概念。
数据挖掘主要针对结构化数据,其数据项是不可分割的,符合一范式(1NF);而知识发现的处理对象是半结构化与非结构化的知识,数据项可以进一步分割,不符合1NF。数据挖掘主要运用回归分析、主成分分析、多元分析、关联规则、支持向量机、模糊集等方法[1],走统计与规则的技术路线;而知识发现主要是通过神经网络、遗传算法、决策树、范例推理、贝叶斯信念网络等方法[10],走归纳与演绎的推理过程。数据挖掘的结果往往是精确的、定量的(尽管有置信度这样一个指标);知识发现的结果往往是模糊的、定性的。数据挖掘主要应用于统计、数据分析等领域;而知识发现主要应用于人工智能领域。
****************************************************
数据挖掘与知识发现关系探析
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 15:43
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社