你来啦,我们谈谈人生和理想分享 http://blog.sciencenet.cn/u/iggcas010 机器学习、数据挖掘

博文

机器学习之关联分析——Apriori代码一

已有 916 次阅读 2018-6-23 21:41 |系统分类:科研笔记| 机器学习, 关联分析, Apriori, 代码

上次的代码终于调好了,好累啊!

接上次博文:

http://blog.sciencenet.cn/home.php?do=blog&id=1119829&mod=space&quickforward=1&uid=1966190&bsh_bid=2094879447

《机器学习实战》这本书里的代码可以用在python27中,我这python365得不到正确结果。

于是本人给代码进行“换血”改成python365可用的程序,费了我好几天时间。

附件竟然不支持这种文件上传,好吧,我传到了百度云。

7天内有效,时效过了还想要给我发邮件。邮件地址之前的博文有。

链接:https://pan.baidu.com/s/1hC9Ju9NFY1XIHKQT23dPqA 密码:uqp9

网上所见全部是上面那本书中的,甚至一点都不改,有的还抄人家的书发成博文,无耻!!!

本人仅仅参考思路,将程序进行了修改。

调用方法如下:

import my_apriori2 as ma

data=[[1,3,4],[2,3,5],[1,2,3,5],[2,5]]
#1 包子  2 油条 3 豆浆 4 煎饼 5 香肠
data2=[['包子','豆浆','煎饼'],['油条','豆浆','香肠'],['包子','油条','豆浆','香肠'],['油条','香肠']]
data=data2
min_supp=0.5
C_all,_=ma.ctotal(data,True)
#这个函数第二个参数要么是最小支持度,要么是True
#最小支持度时计算满足最小支持度的组合,是True时生成所有组合
print('所有的组合情况如下:\n',C_all)

C_length=ma.c_length(C_all)
clen=len(C_all[0])
##print(C_length==2**clen-1)

C,C_supp=ma.ctotal(data,min_supp)
print('满足最小支持度的组合如下:\n',C)


结果为:

所有的组合情况如下:

 [[['包子'], ['油条'], ['煎饼'], ['豆浆'], ['香肠']], [['包子', '油条'], ['包子', '煎饼'], ['包子', '豆浆'], ['包子', '香肠'], ['油条', '煎饼'], ['油条', '豆浆'], ['油条', '香肠'], ['煎饼', '豆浆'], ['煎饼', '香肠'], ['豆浆', '香肠']], [['包子', '油条', '煎饼'], ['包子', '油条', '豆浆'], ['包子', '油条', '香肠'], ['包子', '煎饼', '豆浆'], ['包子', '煎饼', '香肠'], ['包子', '豆浆', '香肠'], ['油条', '煎饼', '豆浆'], ['油条', '煎饼', '香肠'], ['油条', '豆浆', '香肠'], ['煎饼', '豆浆', '香肠']], [['包子', '油条', '煎饼', '豆浆'], ['包子', '油条', '煎饼', '香肠'], ['包子', '油条', '豆浆', '香肠'], ['包子', '煎饼', '豆浆', '香肠'], ['油条', '煎饼', '豆浆', '香肠']], [['包子', '油条', '煎饼', '豆浆', '香肠']]]

满足最小支持度的组合如下:

 [[['包子'], ['豆浆'], ['油条'], ['香肠']], [['豆浆', '包子'], ['豆浆', '油条'], ['豆浆', '香肠'], ['香肠', '油条']], [['豆浆', '香肠', '油条']]]


这种结果与将字符串换成数字是一样的,自己可以试试哈。

看到这个结果或许你再也不吃路边摊的早点了,老是包子、油条、豆浆、煎饼、香肠,都想吐了


本人的结果和那本书中结果一致。截图如下:


image.png

下期预告:发掘关联规则



http://blog.sciencenet.cn/blog-1966190-1120521.html

上一篇:醒醒吧,大清亡了
下一篇:为什么说人工智能是个坑?

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2018-7-22 21:05

Powered by ScienceNet.cn

Copyright © 2007-2017 中国科学报社

返回顶部