|||
首先,什么叫抽平分析呢,抽平分析可以用来对数据进行标准化,也可以通过抽平处理来生成一个数据子集。那么,在实际分析中我们是如何进行的呢?抽平是按照一定数量或各样本中序列最低数量,将所有样本的序列随机抽取至统一数据量,然后再进行各项分析。
那么问题来了,为什么要进行抽平分析呢,小编也是被问了N次后,决心给大家一个认为比较靠谱的解释:了解生态学的同学应该对“采样”这个词比较熟悉,“采样”前的工作之一就是要确定“样方大小(Sample size)”,就是说要保证采集的“样本”来自于相同大小的“样方”,这样才能保证在后续分析样品间的物种多度啊,物种多样性等指标是在同一个“尺度”上。那么,对于环境微生物,我们可以在起始采样时,也可以设置同样的采集量(都是5L水样、都是1g土样等等),但不得不说的是,等我们提取了DNA,再进行完PCR扩增后,上机测序后,由于样品中微生物含量的差异、实验操作引入的误差等原因(实际上实验中确实是进行过精确定量、均一化的),我们拿到的数据就不是每个样品完全相同了,而是在一定的数据范围内,但能够满足分析要求。在进行完OTU聚类后,大家可能会发现,数据好像又少了点儿,了解了我们的分析流程的同学应该明白,这是因为在聚OTU的过程中会去掉嵌合体序列和单序列OTU,生成的OTU表中各样品reads数确实就不同了。这时,我们根据此表进行抽平(subsample)后,计算alpha多样性和beta多样性,就能解决问题了。
说完理论接下来,大家该戴眼镜的戴眼镜(该掀刘海的掀刘海)赶紧看过来,小编给大家来个实际数据演示吧,看抽平分析对alpha多样性和beta多样性的影响。
首先来看一组测试数据计算出来的alpha多样性指数,见下表。分别对应未抽平、按最低reads数7325抽平、按1000抽平以及按500抽平的结果。
为了能找出规律,小编还按reads数5000和3000分别进行了抽平(上面未列出来),发现随着抽平reads数的减少,样本中物种的丰富度(OTU)呈下降趋势;但在一定reads范围内,alpha多样性指数相对稳定,这时说明测序量相对饱和,随着测序量的增大只有少量的稀有物种会被发现。那么此时也要注意了,如果老师关心样本中的稀有物种,就尽可能不要按太低的reads数抽平。
那么Beta多样性的影响如何呢,请看下图,分别对应未抽平、按最低reads数7325抽平、按1000抽平以及按500抽平的聚类分析(反应Beta多样性)结果。
从聚类分析结果可以看出,抽平后样品间的相似性跟原来还是有差异的,而且抽取reads数跟原来reads数相差得越多,对Beta多样性的影响越明显。所以按照一定的合理的序列条数进行抽平分析是妥妥的。
通过以上的理论与实践相结合,抽平分析您了解了伐,如果您还有建议或者问题,欢迎大家联系我们。
关注"美吉生物"公众号,可以了解更多精彩内容
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 15:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社