菜鸟学飞记分享 http://blog.sciencenet.cn/u/yjjh143 每只菜鸟,都有鹰的梦想!

博文

《ggplot2:数据分析与图形艺术》笔记3:用图层构建图像

已有 1922 次阅读 2018-1-2 22:45 |个人分类:R 学习笔记|系统分类:科研笔记|关键词:ggplot2,图层| ggplot2, 图层

在前面的练习中,我们使用qplot练习作图,作为ggplot2的快速入门。然而,qplot的局限性在于它只能使用一个数据集和一组图形属性映射,当我们要进行复杂数据的统计分析时,qplot就不够用了。解决这一问题的方法就是使用图层,每一个图层可以有属于自己的数据集和图形属性映射,附加的数据元素可以通过图层添加到图形中。

创建绘图对象

当我们调用qplot()时,它其实为我们做了许多幕后工作:

  1. 创建一个图形对象

  2. 添加图层并展示结果
    如果想手动创建图形对象,就要使用ggplot()函数。该函数有两个主要的参数:数据和图形属性映射
    数据:指定绘图所使用的默认数据集(必须是数据框)
    映射:将图形属性和变量名放在函数aes()的括号中即可创建映射

比如,通过下面的代码,即可创建一组默认映射:

#x为carat,y为price,colour为cutp <- ggplot(diamonds, aes(carat, price, colour = cut))

不过,上面的图形对象在加上图层之前是无法显示的。

图层

创建好绘图对象后,我们可以使用+来添加图层:

p + geom_point()

再通过添加图层而添加几何对象时,我们需要注意:每一个几何对象都对应着一个默认的统计变换和位置参数,而每一个统计变换都对应着一个默认的几何对象参数。所以对于一个图层,我们只需要设定stat或geom参数即可。

数据

  • ggplot2要求数据集必须是一个数据框(data frame)

  • ggplot2会从我们给定的数据框中提取绘图所需的变量,并生成一个新的数据集,而不是直接在原数据上进行数据变换

  • 使用ggplot2作图时,数据是以副本二不是引用的形式存储在图形对象中的,这样可以使我们:

    • 1.即使数据改变了,绘图不会改变

    • 2.ggplot2的对象都是自含型的,所以它可以被存储到磁盘上,并可被直接加载(load())运行


图形属性映射

aes()函数用来将数据变量映射到图形中,从而使变量成为可以被感知的图形属性。
aes()函数中有一系列的图形属性参数:

#创建映射aes(x = weight, y = height, colour = age)#x,y可以省略,直接输入映射值aes(weight, height, colour = age)

几何对象

几何对象,简称为geom,它执行着图层的实际渲染,控制着生成的图像类型。

  • 每一个几何对象都有一组它能识别的图形属性和一组绘图所需的值。

  • 每一个几何对象都有一个默认的统计变换,并且每一个统计变换都有一个默认的几何对象。

统计变换

统计变换。简称为stat,即对数据进行统计变换,它通常以某种方式对数据信息进行汇总。

  • 统计变换可将输入的数据集看做输入,将返回的数据集作为输出,因此统计变换可向元数据集中插入新的变量。例如用来绘制直方图的stat_bin统计变量会生成如下的变量:

    • count:每个组里观测值得数目;

    • density:每个组里观测值的密度(占整体的百分数/组宽)

    • x:组的中心位置


  • 这些生成变量可被直接调用,调用生成变量时,必须使用..将其名字围起来,以和原数据集中的变量区分
    比如:

    ggplot(diamonds, aes(carat)) + geom_histogram(aes(y = ..density..), binwidth = 0.1)


位置调整

位置调整:是对图层中的元素位置进行微调。位置调整一般多见于处理离散型数据,连续型数据一般很少出现完全重叠的问题。

常用的位置调整参数见下图:

整合

一旦熟悉了图层操作,就可以把本章所介绍的各种图层功能结合起来,轻松做出复杂的图形。

结合几何对象和统计变换

将几何对象和不同的统计变换进行组合,可以轻松做出新颖的图形。下面,我们基于相同的直方图的统计变换,使用不同的几何对象,以不同的形式来展示结果:面积、点和瓦块图。

# 创建绘图对象d <- ggplot(diamonds, aes(carat)) + xlim(0,3)# 对数据进行统计变换,并绘制面积图层d + stat_bin(aes(ymax = ..count..), binwidth =0.1 , geom ="area")# 对数据进行统计变换,并绘制点图图层d + stat_bin(aes(size = ..density..), binwidth = 0.1, geom = "point", position = "identity")# 对数据进行统计变换,并绘制瓦块图图层d + stat_bin2d(aes(y = 1, fill = ..count..), binwidth = 0.1, geom = "tile", position = "identity")

绘制面积图图层:

绘制点图图层:

绘制瓦块图图层:




http://blog.sciencenet.cn/blog-505988-1092772.html

上一篇:《ggplot2:数据分析与图形艺术》笔记2:从qplot开始入门
下一篇:初识GATK

1 高建召

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2018-10-18 04:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部