化柏林分享 http://blog.sciencenet.cn/u/huabolin

博文

数据挖掘与知识发现关系探析

已有 6928 次阅读 2008-10-27 10:33 |个人分类:知识抽取| 规则, 知识发现, 数据挖掘, 相关性研究

数据挖掘与知识发现关系探析

化柏林

中国科学技术信息研究所,北京 100038

(发表于《情报理论与实践》2008年第4期)

以数据挖掘与知识发现的分类为切入点,详细探讨数据挖掘与知识发现的关系。总结出关于数据挖掘与知识发现的关系问题有三种观点,即数据挖掘就是知识发现,数据挖掘是知识发现的一个步骤,数据挖掘与知识发现是完全不同的两个概念。三种观点各有道理,取决于研究者的研究背景、研究范畴与目标。最后对数据挖掘与知识发现的发展趋势进行探讨。

****************************************************

第一种观点:数据挖掘就是知识发现。

    数据挖掘是从数据中挖掘,知识发现并不是从知识中发现,而是发现知识。知识是从数据中发现的,是经过挖掘发现的。数据挖掘是从源头入手,知识发现视目标而论。前者强调过程,后者强调结果,应该是一个概念的两种表述。

****************************************************

第二种观点:数据挖掘是知识发现的一个步骤。

    数据库知识发现指从数据中获取有用知识的整个过程。KDD过程除了数据挖掘之外,还有数据预处理、数据筛选、数据清洗、已有匹配知识的吸收、结果的解释与评估,以确保从数据中抽取的知识是有用的[9]

****************************************************

第三种观点:数据挖掘与知识发现是完全不同的两个概念。

    数据挖掘主要针对结构化数据,其数据项是不可分割的,符合一范式(1NF);而知识发现的处理对象是半结构化与非结构化的知识,数据项可以进一步分割,不符合1NF。数据挖掘主要运用回归分析、主成分分析、多元分析、关联规则、支持向量机、模糊集等方法[1],走统计与规则的技术路线;而知识发现主要是通过神经网络、遗传算法、决策树、范例推理、贝叶斯信念网络等方法[10],走归纳与演绎的推理过程。数据挖掘的结果往往是精确的、定量的(尽管有置信度这样一个指标);知识发现的结果往往是模糊的、定性的。数据挖掘主要应用于统计、数据分析等领域;而知识发现主要应用于人工智能领域。

****************************************************

数据挖掘与知识发现关系探析

http://blog.sciencenet.cn/blog-91591-44276.html

上一篇:信息检索与信息抽取差异性探析
下一篇:“为人在世三大忙”农村版与城市版对比分析

0

发表评论 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-10-28 03:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部