BS-Seq(2) -- 数据下载,质控

2022-12-11  本文已影响0人  Z_bioinfo

1.数据下载

教程的示例数据是 test _ datset. FastQ,下载地址

https://www.bioinformatics.babraham.ac.uk/projects/bismark/test_data.fastq

(它包含10,000个 FastQ 格式的读数,Phred33质量,50bp 长读数,来自人类定向 BS-Seq 库)。

wget --no-check-certificate  https://www.bioinformatics.babraham.ac.uk/projects/bismark/test_data.fastq

2.下载所需要的软件

conda install -c bioconda fastqc #质控
conda install multiqc
conda install -c "bioconda/label/main" sra-tools #下载数据
conda install bowtie2 #比对工具
conda install samtools
conda install bismark

3.主要流程

和RNA-seq前期流程类似 -- 质控、去接头、比对参考基因组、排序
后期就是要提取甲基化位点,包括CpG、CHG、CHH三种context,H代表非G位点(A、C、T)。得到bedgraph文件后将个样本汇总为一个GR (GenomicRanges)文件,便于后续分析

4.质控、去接头

mkdir fastqc
fastqc --outdir fastqc  --threads 16 test_data.fastq
cd fastqc
multiqc *.zip #将质控结果整合
image.png
image.png

trim-galore 去接头(可选)
如果测序的reads含有接头序列,可进行该步骤
使用trim_galore对数据进行质量控制-过滤 - 简书
(jianshu.com)

Trim Galore ——自动检测adapter的质控软件 - 简书 (jianshu.com)

上一篇下一篇

猜你喜欢

热点阅读