luria的个人博客分享 http://blog.sciencenet.cn/u/luria

博文

alpha rarefaction curve 解析

已有 11958 次阅读 2017-8-3 09:11 |个人分类:Metagenomics|系统分类:科研笔记| diversity, curve, 16SrRNA, rarefaction

Alpha rarefaction curve主要用于检测测序量是否充足。这里用到的方法是逐步扩大随机抽样的样本容量,如果样本容量扩大了但曲线再无变化(准确来讲,变化非常微小)时,则认为测序量已充足,再增加测序量,样本的alpha多样性指标也不会有太多的变化,即样本alpha多样性指标达到稳定。

PD_whole_treechao1observed_otus指标变化趋势相近,这一组反应的是样本中物种的丰度,均表现为前期增长快,后期增长慢,但是会随着样本容量的扩大而一直增加,因为样本容量增加时每个样本中OTU数会不断增加。

shannonsimpson指标变化趋势相近,这一组反应的是样本中物种的多样性,均表现为前期快速改变,在某个点过后进入平台区。

Figure1. rarefaction curve 图片取自[1]


QIIME默认的抽样方法是从第10OUT代表序列开始,到第38895OUT代表序列截止,其间抽样10次,每次增加3888条序列。因为每个样本总体中物种的序列是随机分布的,而且样本容量是从小到大逐步增加,所以在解读结果时一定要清楚以下几点:

1. 有可能样本总体中靠前的序列shannon指数和simpson指数均高于平均值,那么在图上会出现先下降再到平台区的曲线。

2. 各样本中OTU数不同,而随机抽样时有可能有些样品的总量达不到38895,因此在网页结果的表格中会有nan(即Not a Number)表示缺损,同时反映在图上是每个样品的曲线终点并不同一x轴位置。

3. 用样本总体算出来的多样性指数和这种抽样算出来的曲线终点位置有出入,只是位置接近,并不相等,这很正常。rarefaction曲线的意义是反应一种变化情况,其终点位置仅供参考。因为有些样本OUT代表序列多于38895,有些少于38895,而如果用所有序列计算得到的只是最后的一个值。


[1] Comparison of the Oral Microbiomes of Canines and Their Owners Using Next-Generation Sequencing



https://blog.sciencenet.cn/blog-2970729-1069288.html

上一篇:QIIME中jackknifed_beta_diversity.py程序的运行过程
下一篇:Alpha多样性指数之shannon指数
收藏 IP: 58.62.32.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 11:21

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部