yewenjing的个人博客分享 http://blog.sciencenet.cn/u/yewenjing

博文

weka进行关联规则挖掘Apriori篇

已有 15159 次阅读 2013-11-17 22:18 |系统分类:科研笔记

weka进行apriori关联规则挖掘,weka版本为3.6.10

1、将excel表格中的数据另存为csv格式,若弹出一下对话款,选择否,再另存为一份xlsx格式即可,否则在weka中无法打开。weka默认首行为属性名。


2、用weka打开.csv格式文件,另存为arff格式,再用arff格式的文件挖掘。

3、若原数据中存在离散数字的项目,如1,2,3等,在转换为arff格式的时候,属性类型默认为numeric(不是离散的),apriori不能处理这种类型,所以需要修改成nominal。

方法1:

(1)导入你的数据集

(2)再在下面选filter,Numeric To Nominal,位置:weka>>filters>>unsupervised>>attribute>>NumericToNominal
(3)选择后,在explorer界面点“apply”。
离散化之后,你会发现explorer里面的数据图形化显示由黑白色变成彩色了,这样再进associate就能选apriori了

方法2:

@Count numeric 改成@Count {1,2,3,4,5,……,10},如果数字不多的话,就手动修改吧。

4、在weka中打开转换后的arff格式的文件,就可以进行apriori算法的挖掘啦。


数据修改详细参考:

http://zhidao.baidu.com/link?url=uCM1F_CnorQP-IbbdlFHhnuDwLeVj4PXh9q8-4jm7iDVn6iZynFSuQle9xrpSxff3r321NKrLcdpMf-lxQl5Fa



https://blog.sciencenet.cn/blog-882768-742595.html

上一篇:arcgis10 动态地图的制作
下一篇:加权关联规则权值的计算
收藏 IP: 211.162.33.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-27 20:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部