育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

Python学生物统计-数据可视化-学习笔记5

已有 3705 次阅读 2018-11-17 09:49 |个人分类:Python和Julia学习|系统分类:科研笔记

5.1 作图的重要性

在分析一个数据之前, 我们首先要对数据进行检查, 在统计上看一下汇总统计, 比如最大值, 最小值, 中位数, 平均值, 方差, 标准差, 变异系数等等.

  • 直方图, 看一下数据的分布情况

  • 箱线图, 看一下数据的分布, 有无异常值

所谓一图胜千言.

python中的作图工具

  • plot.ly

  • bokeh是交互式的包

  • ggplot 是类似R语言的ggplot包

5.2 散点图

# Import standard packagesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport scipy.stats as statsimport seaborn as sns

这里生成了500个随机数, 使用plot进行作图

# Generate the data
x = np.random.randn(500)
# Plot-command start ---------------------
plt.plot(x, '.')
# Plot-command end -----------------------
# Show plot
a2 = plt.show()

5.3 直方图

a3 = plt.hist(x,bins=25)

5.4 箱线图

a4 = plt.boxplot(x);


练习corn.csv

corn是R包agridat中的smith.corn.uniformity玉米数据, 我们来看一下如何对其可视化?

  row col plot year yield
1  20   1  101   95  30.0
2  19   1  102   95  29.1
3  18   1  103   95  25.7
4  17   1  104   95  26.3
5  16   1  105   95  30.3
6  15   1  106   95  31.1

首先, 在R中将其保存为corn.csv, 保存到D盘根目录(方便读取)

library(agridat)
data(smith.corn.uniformity)
dat = smith.corn.uniformity
head(dat)
write.csv(dat,"d:/corn.csv",row.names = F)

用python读取数据, 使用pandas包

import pandas as pd
corn = pd.read_csv("d:/corn.csv")

查看前六行

corn.head()



rowcolplotyearyield
02011019530.0
11911029529.1
21811039525.7
31711049526.3
41611059530.3


对产量yield作图

import matplotlib.pyplot as plt
c1 = plt.plot(corn["yield"],".")
c2 = plt.hist(corn["yield"])

c3 = plt.boxplot(corn["yield"])
其它相关博客:

http://blog.sciencenet.cn/blog-2577109-1140649.html

http://blog.sciencenet.cn/blog-2577109-1141366.html

http://blog.sciencenet.cn/blog-2577109-1141365.html

http://blog.sciencenet.cn/blog-2577109-1141592.html






https://blog.sciencenet.cn/blog-2577109-1146684.html

上一篇:DMU-个体动物模型-学习笔记2
下一篇:DMU-单性状重复力模型-学习笔记3
收藏 IP: 106.39.56.*| 热度|

1 赵凤光

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-27 01:24

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部