生信基础知识

FASTQ格式说明

2018-06-06  本文已影响306人  jlyq617

illumina下fastq文件命名

FASTQ文件在Illumina下通常会被命名为
SampleName_S1_L001_R1_001.fastq.gz
比如 NTC_S11_L001_R1_001.fastq.gz
其被下划线_分为了五个部分:
第一部分:SampleName,样本名,与上机时在Sample Sheet中填写的一致
第二部分:S1,S***,S后跟的数字与样本在Sample Sheet中的顺序一致,从1开始。不能分配到确定样本的read会归到S0(Undetermined_S0)
第三部分:L00*,泳道lane的编号
第四部分:R*,R1表示read1,R2表示read2。R1和R2为paired end reads。同一个样本的配对的FASTQ,只有这个地方不同
第五部分:001,通常为001

fastq格式

Each entry in a FASTQ file consists of four lines:
• Sequence identifier
• Sequence
• Quality score identifier line (consisting of a +)
• Quality score

Fastq

Sequence identifier
@<instrument>:<run number>:<flowcell ID>:<lane>:<tile>:<x-pos>:<y-pos><read>:<is filtered>:<control number>:<index sequence>
eg:

Quality score
The character '!' represents the lowest quality while '~' is the highest. Here are the quality value characters in left-to-right increasing order of quality (ASCII):

Quality score
上一篇下一篇

猜你喜欢

热点阅读