Contents
1
[1] 基于数据流的任意形状聚类算法
[2] 基于相关分析的多数据流聚类
2
1
[1-]基于数据流的任意形状聚类算法
朱蔚恒, 印鉴, 谢益煌
Journal of Software, Vol.17, No.3, March 2006, pp.379−387
摘要:
详细分析了数据流聚类算法CluStream的不足之处,如对非球形的聚类效果不好、对周期性数据的聚类变化反映不完整等,并针对这些不足之处提出了一种采用空间分割、组合以及按密度聚类的算法ACluStream.实验结果表明,ACluStream在准确度和速度上都比CluStream有较大的提高.
关键词: 数据流;聚类;数据挖掘
数据流算法特点:
1) 首先,数据流速度快,对算法响应要求高
2) 数据流算法是不可回溯
数据流研究:
-- 对数据流工作模型的建模
-- 对数据流查询的响应
-- 如何管理数据流
-- 如何对数据流进行挖掘
research problem: 如何在数据流中进行有效聚类?
-- LocalSearch数据流聚类算法
算法基本思想: 基于分治的思想使用一个不断的迭代过程实现有限空间对数据流进行k-means聚类.
-- STREAM算法
the drawbacks of :
数据流中聚类3个要求:
(1) 压缩的表达;
(2) 快速、增长地处理新的数据点;
(3) 快速、清晰地判断独异点.
the organization of this paper:
1)
第1节分析CluStream算法存在问题,并简要提出新算法ACluStream所使用到基本概念和一些关于ACluStream理论证明.
2) 第2节给出一个完整的ACluStream算法,详细解析算法的思想和执行过程.
3) 第3节给出ACluStream与CluStream具体的实验比较,讨论ACluStream的不足以及继续研究的方向.
1 问题分析与算法概述
1.1 CluStream存在的问题
1.2 ACluStream使用的基本概念
1.3 ACluStream完备性和可行性的证明
证明完备性:使用聚类块结构能够完整地近似表达任意的空间形状.
1.4 聚类块内对聚类的表达
1.5 ACluStream算法简述
2 ACluStream算法
2.1 sdmicro-cluster过程
2.3 算 法
3 算法性能
[2-] 基于相关分析的多数据流聚类
基于相关分析的多数据流聚类
屠莉, 陈崚, 邹凌君
Journal of Software, Vol.20, No.7, July 2009, pp.1756−1767
摘要:
提出基于相关分析的多数据流聚类算法.该算法将多数据流的原始数据快速压缩成一个统计概要.根据这些统计概要,可以增量式地计算相关系数来衡量数据间的相似度.提出了一种改进的k-平均算法来生成聚类结果. 改进k-平均算法可以动态、实时地调整聚类数目,并及时检测数据流的发展变化.还将算法应用到按照用户要求的聚类问题(COD),使得用户可以在任意的时间区间上查询聚类结果.提出一种合理的时间片断划分机制,使得用户指定的任意时间区间都可以由这些时间片断组合而成.在模拟和真实数据上的实验结果都表明,该算法比其他方法具有更好的聚类质量、速度和稳定性,能够实时地反映数据流的变化.
关键词: 聚类;数据流;相关分析
1 Introduction
基于相关分析的多数据流聚类.pdf
https://blog.sciencenet.cn/blog-468147-544833.html
上一篇:
并行计算下一篇:
review: 网络协议的自动化模糊测试漏洞挖掘方法