|
weka进行apriori关联规则挖掘,weka版本为3.6.10
1、将excel表格中的数据另存为csv格式,若弹出一下对话款,选择否,再另存为一份xlsx格式即可,否则在weka中无法打开。weka默认首行为属性名。
2、用weka打开.csv格式文件,另存为arff格式,再用arff格式的文件挖掘。
3、若原数据中存在离散数字的项目,如1,2,3等,在转换为arff格式的时候,属性类型默认为numeric(不是离散的),apriori不能处理这种类型,所以需要修改成nominal。
方法1:
(1)导入你的数据集
(2)再在下面选filter,Numeric To Nominal,位置:weka>>filters>>unsupervised>>attribute>>NumericToNominal
(3)选择后,在explorer界面点“apply”。
离散化之后,你会发现explorer里面的数据图形化显示由黑白色变成彩色了,这样再进associate就能选apriori了
方法2:
@Count numeric 改成@Count {1,2,3,4,5,……,10},如果数字不多的话,就手动修改吧。
4、在weka中打开转换后的arff格式的文件,就可以进行apriori算法的挖掘啦。
数据修改详细参考:
http://zhidao.baidu.com/link?url=uCM1F_CnorQP-IbbdlFHhnuDwLeVj4PXh9q8-4jm7iDVn6iZynFSuQle9xrpSxff3r321NKrLcdpMf-lxQl5Fa
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-27 20:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社