illumina测序文件中的Q-score含义

关注微信公众号塔容万物

Q值定义

指定碱基的测序质量分值Q是按照如下公式定义的:

Q = -10log10(e)

其中e是预估的碱基错误检出率。Q值高,说明错误率低。Q值低,可能会导致不可用read的比例显著增高。还可能导致假阳性变异检出率增加,得出不正确的结论。

测序质量分值与碱基检出精确度的关系

质量分值碱基的错误检出率推断的碱基检出精确度
10 (Q10)1/1090%
20 (Q20)1/10099%
30 (Q30)1/100099.9%

参考文件

https://www.illumina.com.cn/content/dam/illumina-marketing/documents/products/technotes/technote_Q-Scores.pdf

https://www.illumina.com.cn/content/dam/illumina-marketing/documents/products/technotes/technote_understanding_quality_scores.pdf

https://www.illumina.com.cn/science/technology/next-generation-sequencing/plan-experiments/quality-scores.html

Ewing B, Green P. (1998): Base-calling of automated sequencer traces using phred. II. Error probabilities. Genome Res. 8(3):186-194