|||
这篇论文是关于挖掘频繁模式的文章。频繁模式挖掘是数据挖掘的核心任务,我为频繁模式挖掘提出了一套全新的以树节点为索引单位的数据结构,我进一步证明了这种数据结构包含了挖掘频繁模式所必须的关键信息。由于这种结构是基于前缀树的,因此。它具有对原数据库的天然压缩性质。因此,挖掘效率要比基于事务ID号的垂直挖掘方法好很多。总体而言,也比FP-GROWTH方法好。这种结构的优势在于它不仅适应于处理“交”操作,也可以进行“并”操作或其他操作。因此,其应用面要比FP-GROWTH(本质上只适合处理“交”操作)要广。具体从以下地址下载:
http://info.scichina.com:8083/sciFe/EN/abstract/abstract508369.shtml
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-20 03:44
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社