Contents
1
2 信息网络的社区发现及其应用研究
Web社区谱聚类的比较研究
黄发良 肖南峰
小型微型计算机系统 2011-4
摘 要:
聚类分析是w eb社区发现的主要方法之一, 近年来基于谱图理论的谱聚类由于其诸多优点而备受关注, 在介绍谱聚类基本理论的基础上, 着重分析了包括SM、NJW、N y sto rmC ut与KA SP在内的4种典型谱聚类方法的基本流程与优缺点, 在聚类有效性与时间效率上对4种算法进行实验比较, 实验结论为w eb社区发现工程实践提供了借鉴.
关键词: 谱聚类; w eb社区发现; 谱图理论
1 引 言
problem: Web 社区发现
-- Web拓扑结构: 一Web社区是一个W eb图连通子图, 这个子图内的节点之间连接密度高于子图内
部节点与外部节点的连接密度;
-- W eb内容, 一Web社区是指内容上都是围绕某一主题具有一定相关性或相似性W eb实体集合.
谱聚类:
-- 首先以待聚类的对象集为顶点集构造加权图,
-- 然后通过分析一个与图相关的矩阵的特征向量和特征值来得到聚类结果.
the advantages:
2 谱聚类
2.1 相关理论
2.2 基本思想
谱聚类基本思想:
-- 根据原始数据集构建加权图, 数据对象对应于图中顶点,
-- 数据对象之间的相似度对应于图中边的权值,
-- 然后利用谱映射对相似图( 或相似图的变体)进行低维嵌入,
-- 最后在低维表示空间中进行后聚类操作.
2.2.1 预处理
2.2.2 谱映射
2.2.3 后聚类
2.3 典型算法
2.3.1 SM 算法
2.3.2 NJW 算法
2.3.3 Nystrom Cut
2.3.4 KASP
3 基于谱聚类的Web社区发现
信息网络的社区发现及其应用研究
黄发良
复杂系统与复杂性科学 2010
摘要:
在对信息网络社区发现研究的基本概念进行简单介绍的基础上,将目前的典型算法初步划分为5类,即传统发现方法、基于分割的方法、基于模块性质量优化的方法、基于动态模型的方法与基于谱分析的方法,然后着重对各种发现方法进行分类分析与比较,并以Web信息网络为例简述社区发现的应用,最后指出了目前
方法存在的缺陷与未来可能的改进方向。
关键词:信息网络;社区发现;复杂网络; 聚类
1 引言
-- 社会学: 社会信息网络的拓扑结构特征
-- 物理学: 复杂网络理论
--
社区: (德国社会学家腾尼斯)
-- 精神: 社区是由共同目标和共同利害关系的人组成
-- 地域: 生活在同一地区的有组织的人群
the organization of this paper:
1) 第2部分简单介绍社区定义,
2) 第3部分对社区发现方法的研究现状进行综述,
3) 第4部分举例说明社区发现的应用研究,
4) 最后对信息网络社区发现技术进行总结与展望。
2 社区的定义
3个不同的社区定义:
-- n-cliques
-- n-clan
-- n-club
3 信息网络社区发现的基本方法
3.1 传统的发现方法
传统发现方法主要有3类:
-- 图划分算法
-- 层次聚类法
-- 基于划分的聚类算法
https://blog.sciencenet.cn/blog-468147-530805.html
上一篇:
review: SOC应用系统中基于信用的QoS保证机制下一篇:
review: 一种 P2P 文件共享网络高精度自适应声誉机制