科技导报分享 http://blog.sciencenet.cn/u/kejidaobao

博文

基于Spark的大规模社交网络社区发现原型系统

已有 1847 次阅读 2018-12-29 09:57 |系统分类:论文交流

基于Spark的大规模社交网络社区发现原型系统

叶小榕1, 邵晴2

1. 中国科学技术信息研究所, 北京 100038;
2. 北龙中网(北京)科技有限责任公司, 北京 100190

摘要 为有效发掘大规模社交网络上的用户信息,提高对用户之间关系的深入了解,设计开发了基于Spark的大规模社交网络社区发现原型系统。系统利用ActiveMQ实现对大量用户数据的抓取,使用基于Spark的MLlib提供的朴素贝叶斯算法对用户数据进行清洗,利用Spark的GraphX提供的PageRank算法和MLlib提供的Z-Score算法计算用户排名,最终应用并优化LPA算法,将特征相近、联系较密切的用户快速地划分到同一社区中,为进一步分析利用社区用户数据打下了基础。

关键词 Spark,  GraphX,  MLlib,  社区发现 

(责任编辑  陈广仁)

http://www.kjdb.org/CN/Y2018/V36/I23/93



https://blog.sciencenet.cn/blog-336909-1154145.html

上一篇:考虑低渗点启动压力梯度的中东孔隙型碳酸盐岩油藏波及系数修正方法
下一篇:浙江大学数学学派传人谢庭藩
收藏 IP: 111.203.146.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 08:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部