dennyhong的个人博客分享 http://blog.sciencenet.cn/u/dennyhong

博文

基于节点列表的项集表示框架的频繁项集挖掘最新进展

已有 2054 次阅读 2015-4-20 20:53 |个人分类:数据挖掘|系统分类:论文交流| 论文, 算法, 频繁项集挖掘

最新的论文在Expert Systems with Applications 2015 42卷13期上发表。

这篇论文采用等价类提升的策略,极大地提升了挖掘的速度,并且节省了内存消耗。所形成的PrePost+算法在时间和空间的性能度要明显优于PrePost和FIN算法。

PrePost+算法的下载地址为:http://www.cis.pku.edu.cn/faculty/system/dengzhihong/Source%20Code/prepost+.cpp

 

相关论文的下载地址:

http://www.sciencedirect.com/science/article/pii/S0957417415001803

 

由于节点列表的表示方法从底层极大减少了计算项集支持度的时间,所以PrePost+、PrePost和FIN可以扩张挖掘Rare Itemsets, Closed Itemsets, Maximal Itemsets, Frequent Generator Itemsets, Frequent Itemsets from Data Stream, Frequent Itemsets from Uncertain Data等。

另外,这三个算法也特别适合修改成并行的频繁模式挖掘算法(如基于GPU,Hadoop等并行计算平台)。有兴趣的同行可以开展上述工作的研究。



https://blog.sciencenet.cn/blog-754183-883946.html

上一篇:PrePost和FIN算法的JAVA版本
下一篇:能高效挖掘频繁模式的项集表示DiffNodesets
收藏 IP: 124.205.76.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-18 16:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部