RNA-Seq

RNA-seq入门(二)质控及fastqc报告解读

2022-06-23  本文已影响0人  生信开荒牛

一、质控

前面我们从GEO下好了SRA数据并转换为fastq文件,现在需要对fastq文件进行质控,这里用的软件为fastqc。首先建好文件夹用来存放数据

mkdir 01raw 02clean 03alin 04count

fastqc

1.png
R1=/mnt/d/bioinfo/project/rna/01raw/SRR15859344_1.fastq.gz
R2=/mnt/d/bioinfo/project/rna/01raw/SRR15859344_2.fastq.gz
fastqc $R1 $R2

这步会产生一个html文件,这就是fastqc的结果,我们可以双击在网页中打开进行查看。(详见下面介绍的fastqc报告解读)


2.png

fastp

用于数据过滤


3.png
fastp -i $R1 -I $R2 -o ../02clean/SRR15859344_1.clean.fastq.gz -O ../02clean/SRR15859344_2.clean.fastq.gz &

经过质控后的fastq文件就可以进行后面的比对分析了。

二、fastqc报告解读

本文参考:

https://blog.csdn.net/qq_44520665/article/details/113779792

  1. Basic Statistics

Basic statistics是该fastq一些基本信息:

  1. Per base sequence quality

5.png
碱基质量值Q
  1. Per Sequence Quality Scores

  1. Per Base Sequence Content

  1. Per Sequence GC Content

8.png
  1. Per base N content

  1. Sequence Length Distribution

  1. Sequence Duplication Levels

  1. Overrepresented sequences

  1. Adapter Content

13.png

RNA-seq入门

RNA-seq入门(一)数据下载和格式转换

RNA-seq入门(二)质控及fastqc报告解读

RNA-seq入门(三)比对、输出表达矩阵

上一篇 下一篇

猜你喜欢

热点阅读