FASTQ格式介绍

/ #生物信息学 / 0 comment

FASTQ是一种存储了生物序列(通常是核酸序列)以及相应的质量评价的文本格式。

它们都是以ASCII编码的。现在几乎是高通量测序的标准格式。NCBI Short Read Archive也是这格式,多了一些描述性词汇而已。格式示例如下:

@SEQ_ID
GATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT
+
!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65

第一行@后面是描述性文字;
第二行是原始的数据;
第三行是描述性的+号;
最后一行是对第二行相应位置的质量评估。

详细的如Illumina软件格式,NCBI Short Read Archive格式,质量评价标准,ASCII详细编码等请看这里

回应