zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

怎样开展网络数据分析?

已有 3518 次阅读 2022-5-19 21:52 |个人分类:科普|系统分类:科普集锦

怎样开展网络数据分析?

 

说起网络一词,大家普遍会想到计算机网络或万维网(World Wide Web,简称WWW)。然而,计算机网络只属于广义网络的一个分支。广义上,网络被定义为由若干节点和边所构成,表示诸多对象及其相互联系。所有的实体都可以成为网络中的对象或节点,因此有“万物皆可网络化”这一说法。

 

给定一个网络,尤其是大网络,我们就很想知道网络中到底隐藏了什么信息和什么规律。要想了解和解析网络,必然要对网络数据进行分析。这里指的分析一般指统计分析。关于网络数据分析,有许多专业性强的书籍,这些书籍基于的背景可以是社会学、经济学、生物医学等。如果不从事相关领域,要想了解网络数据分析的方法和技术,时间和精力投入还是有点大的。为了打破专业壁垒,现在就有一本不需要专业背景的网络数据分析书籍《网络数据的统计分析:R语言实践》。该书籍作者是美国埃里克D克拉泽克和加博尔乔尔迪(扩展包igraph的主要开发者)教授合写的著作,依托的编程语言是R,讲述的都是广义网络的统计分析方法。虽然2016年就出版中文版了,但是对于网络数据分析人员仍然具有很大借鉴意义。

 

image.png

1 《网络数据的统计分析:R语言实践》中文版

 

 

整本书分为三个部分:网络可视化与特征化、网络建模与推断和网络过程。第一部分(网络可视化与特征化)主要介绍网络研究的必要性、网络分析类型、操作网络数据、网络图的描述性分析,第二部分(网络建模与推断)主要介绍网络图的数学模型、网络图的统计模型、网络拓扑结构推断,第三部分(网络过程)主要讲述网络图上的过程建模与预测、网络流数据分析和动态网络。

 

为了使读者更好的分析网络数据,作者基于igraph扩展包还提供了R运行代码。所有实践R代码还打包成一个R扩展包sandstatistical analysis of network datahttps://cran.r-project.org/web/packages/sand/)。

 

image.png

2 sand扩展包

 

整体而言,《网络数据的统计分析:R语言实践》可以边看理论边进行实践操作,对于理解网络数据分析方法和模型有很大帮助。当然,运行代码的前提是你得知道R语言基础。

 

后话

除了R扩展包igraph,还有一些网络数据分析工具。例如最早出现的网络分析与可视化工具Pajek,还有多平台网络分析与可视化工具CytoscapeGephi(参见网络可视化软件推荐两款)。这些工具都支持互动式操作,并且无需编写代码就能够实现网络数据可视化和分析。

 

参考文献与链接

[1] 埃里克 D 克拉泽克, 加博尔乔尔迪. 网络数据的统计分析:R语言实践[M]. 西安交通大学出版社, 2016.

[2] https://book.douban.com/subject/26818368/

[3] https://cran.r-project.org/web/packages/sand/

 

以往推荐如下:

1. 因果推理综述推荐一篇

2. 生物学家的机器学习指南

3. 基础模型的机遇与风险

4. 一份单细胞数据分析教程

5. R/Shiny交互式生物Web应用程序

6. VOSviewer:文献图谱可视化

7. 卡片式笔记工具:Roam Research

8. 国外知乎:Quora

9. 生信问答平台:Biostars

10. IT问答平台:Stack Overflow

11. 预印本知多少?

12. 借助Bioconductor策划单细胞分析

13. 要选哪个蛋白质互作数据库作为先验信息?

14. mRNA表达无法取代蛋白质表达

15. scIB:单细胞数据融合基准框架

16. 临床医疗维修店铺

17. NAguideR:填充蛋白质组学数据缺失值

18. 怎样做好一项研究?

19. 怎样做开题报告?

20. 深度学习助力单细胞数据分析

21. Any RNA

22. 走进数据科学

23. 直抵自闭症核心

24. 癌症内RNA

25. 一对搭档:计算与生物

26. TF靶标

27. 生物组织内细胞通讯

28. 记一次主题编辑经历

29. 6个,10个,14......

30. 你健康吗?

31. 你衰老了吗?

32. scIMC:填充单细胞转录组数据缺失值

33. 差异表达分析:经典方法未必逊色于流行方法

34. 多组学的基本要素

 

image.png

image.png 




https://blog.sciencenet.cn/blog-571917-1339336.html

上一篇:多组学的基本要素
下一篇:miRNA组学
收藏 IP: 39.128.55.*| 热度|

1 李宏翰

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-25 03:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部