||
摘自https://www.cnblogs.com/leezx/p/6265216.html
二代测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的。碱基的质量值13(Q13)代表错误率为5%;Q20代表错误率为1%;Q30代表错误率为0.1%。测序报告中的Q20与Q30则表示质量值≥20或30的碱基所占百分比。例如一共测了1G的数据量,其中有0.9G的碱基质量值大于或等于20,那么Q20就是90%。
质量值是Q20,则错误识别的概率是1%,即错误率1%,或者正确率是99%;
质量值是Q30,则错误识别的概率是0.1%,即错误率0.1%,或者正确率是99.9%;
质量值是Q40,则错误识别的概率是0.01%,即错误率0.01%,或者正确率是99.99%;
质量值(Q)越高代表碱基被测错的概率(P)越小,其计算公式为Q=-10lgP。例如,Q20和Q30分别代表碱基被测错的概率为1%和1‰。Illumina官方一般以Q30作为评价标准,以目前最常用的HiSeq 2000平台2×100PE测序为例,Illumina官方保证80%以上的碱基准确度达Q30,而千年基因在合同中严格保证85%以上的碱基准确度达Q30。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-15 21:21
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社