武夷山分享 http://blog.sciencenet.cn/u/Wuyishan 中国科学技术发展战略研究院研究员;南京大学信息管理系博导

博文

几位学者对目前数据挖掘方法的“判词” 精选

已有 6618 次阅读 2011-11-1 06:50 |个人分类:图书情报学研究|系统分类:观点评述| 挖掘

几位学者对目前数据挖掘方法的“判词”

武夷山

美国Montclair州立大学的John Wang和另外两所大学的两位华裔学者在International Journal of Business Intelligence and Data Mining(企业情报和数据挖掘杂志)(注:黄富强博主认为,译为“商业智能”较好,不是企业情报2007年第2期发表文章,Diminishing downsides of data mining,文章评点了几种常用数据挖掘方法的特点,尤其是缺点。

1.             神经网络方法。很多挖掘工作都是基于神经网络方法,其缺点有两个,一是神经网络的学习过程很耗时,因此,对于大规模的数据集合,这个方法效率不高;二是不直观,仿佛是个黑箱处理过程。

2.             决策树方法。其主要缺点是,如果训练集是含有噪声的,就可能找不出有效的树。

3.             遗传算法。该算法需要很大的计算量,这就是其主要缺点。

4.             模糊逻辑。这个领域的研究,日本较发达,美国落后。在英语中,Fuzzy有负面含义,在日语中,却暗含“聪明”之义。

5.             数据可视化。这种方法,在数据量很大的时候,就不易发现潜藏的模式了。所以,要采用三维表现手法,这对模式识别有帮助。

 

博主:又过去四年了,数据挖掘领域在不断发展,但上面的“判词”似乎没有被颠覆。



https://blog.sciencenet.cn/blog-1557-503251.html

上一篇:[转载]中医原创思维研究列入“973”
下一篇:社会诚信缺失与政务诚信缺失--陆欣义父母的再次呼吁
收藏 IP: 219.142.136.*| 热度|

22 许培扬 赵明 钟炳 陈湘明 李学宽 赵凤光 金小伟 李泳 孙广东 刘用生 化柏林 刘锋 刘玉仙 黄富强 赵星 许浚远 黄锦芳 邹谋炎 吴吉良 陈绥阳 王芳 crossludo

该博文允许注册用户评论 请点击登录 评论 (14 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 18:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部