||
怎样开展网络数据分析?
说起网络一词,大家普遍会想到计算机网络或万维网(World Wide Web,简称WWW)。然而,计算机网络只属于广义网络的一个分支。广义上,网络被定义为由若干节点和边所构成,表示诸多对象及其相互联系。所有的实体都可以成为网络中的对象或节点,因此有“万物皆可网络化”这一说法。
给定一个网络,尤其是大网络,我们就很想知道网络中到底隐藏了什么信息和什么规律。要想了解和解析网络,必然要对网络数据进行分析。这里指的分析一般指统计分析。关于网络数据分析,有许多专业性强的书籍,这些书籍基于的背景可以是社会学、经济学、生物医学等。如果不从事相关领域,要想了解网络数据分析的方法和技术,时间和精力投入还是有点大的。为了打破专业壁垒,现在就有一本不需要专业背景的网络数据分析书籍《网络数据的统计分析:R语言实践》。该书籍作者是美国埃里克・D・克拉泽克和加博尔・乔尔迪(扩展包igraph的主要开发者)教授合写的著作,依托的编程语言是R,讲述的都是广义网络的统计分析方法。虽然2016年就出版中文版了,但是对于网络数据分析人员仍然具有很大借鉴意义。
图1 《网络数据的统计分析:R语言实践》中文版
整本书分为三个部分:网络可视化与特征化、网络建模与推断和网络过程。第一部分(网络可视化与特征化)主要介绍网络研究的必要性、网络分析类型、操作网络数据、网络图的描述性分析,第二部分(网络建模与推断)主要介绍网络图的数学模型、网络图的统计模型、网络拓扑结构推断,第三部分(网络过程)主要讲述网络图上的过程建模与预测、网络流数据分析和动态网络。
为了使读者更好的分析网络数据,作者基于igraph扩展包还提供了R运行代码。所有实践R代码还打包成一个R扩展包sand(statistical analysis of network data,https://cran.r-project.org/web/packages/sand/)。
图2 sand扩展包
整体而言,《网络数据的统计分析:R语言实践》可以边看理论边进行实践操作,对于理解网络数据分析方法和模型有很大帮助。当然,运行代码的前提是你得知道R语言基础。
后话
除了R扩展包igraph,还有一些网络数据分析工具。例如最早出现的网络分析与可视化工具Pajek,还有多平台网络分析与可视化工具Cytoscape和Gephi(参见网络可视化软件推荐两款)。这些工具都支持互动式操作,并且无需编写代码就能够实现网络数据可视化和分析。
参考文献与链接
[1] 埃里克・ D ・克拉泽克, 加博尔・乔尔迪. 网络数据的统计分析:R语言实践[M]. 西安交通大学出版社, 2016.
[2] https://book.douban.com/subject/26818368/
[3] https://cran.r-project.org/web/packages/sand/
以往推荐如下:
1. 因果推理综述推荐一篇
2. 生物学家的机器学习指南
3. 基础模型的机遇与风险
4. 一份单细胞数据分析教程
8. 国外知乎:Quora
11. 预印本知多少?
14. mRNA表达无法取代蛋白质表达
15. scIB:单细胞数据融合基准框架
16. 临床医疗维修店铺
18. 怎样做好一项研究?
19. 怎样做开题报告?
20. 深度学习助力单细胞数据分析
21. Any RNA
22. 走进数据科学
23. 直抵自闭症核心
24. 癌症内RNA
25. 一对搭档:计算与生物
26. TF靶标
27. 生物组织内细胞通讯
28. 记一次主题编辑经历
29. 6个,10个,14个......
30. 你健康吗?
31. 你衰老了吗?
32. scIMC:填充单细胞转录组数据缺失值
34. 多组学的基本要素
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 03:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社