|||
几位学者对目前数据挖掘方法的“判词”
武夷山
美国Montclair州立大学的John Wang和另外两所大学的两位华裔学者在International Journal of Business Intelligence and Data Mining(企业情报和数据挖掘杂志)(注:黄富强博主认为,译为“商业智能”较好,不是企业情报)2007年第2期发表文章,Diminishing downsides of data mining,文章评点了几种常用数据挖掘方法的特点,尤其是缺点。
1. 神经网络方法。很多挖掘工作都是基于神经网络方法,其缺点有两个,一是神经网络的学习过程很耗时,因此,对于大规模的数据集合,这个方法效率不高;二是不直观,仿佛是个黑箱处理过程。
2. 决策树方法。其主要缺点是,如果训练集是含有噪声的,就可能找不出有效的树。
3. 遗传算法。该算法需要很大的计算量,这就是其主要缺点。
4. 模糊逻辑。这个领域的研究,日本较发达,美国落后。在英语中,Fuzzy有负面含义,在日语中,却暗含“聪明”之义。
5. 数据可视化。这种方法,在数据量很大的时候,就不易发现潜藏的模式了。所以,要采用三维表现手法,这对模式识别有帮助。
博主:又过去四年了,数据挖掘领域在不断发展,但上面的“判词”似乎没有被颠覆。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 18:53
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社