chip-seq数据分析流程
chip-seq数据分析流程
1.chip-seq数据下载及更换名称
1.1.根据文献提供的ncbi的编号,下载sra数据。
1.2.更换文件名:更换后的文件名能表明数据所对应的实验组。
2.sra文件转换为fastq格式
2.1.下载及安装sra-tools软件(NCBI-download-download tools-SRA Toolkit 选择linux版本)
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-ubuntu64.tar.gz #下载软件
tar xzvf sratoolkit.2.9.2-ubuntu64.tar.gz #解压
2.2.格式转换
fastq-dump -I --split-files file_name
3.quality control
软件fastQC、multQC、trim
3.1.软件安装
4.alignment
软件bowtie2,samtools
4.1 下载及安装软件
4.1.1 bowtie2 软件
wget https://nchc.dl.sourceforge.net/project/bowtie-bio/bowtie2/2.3.4.2/bowtie2-2.3.4.2-linux-x86_64.zip #下载软件
unzip bowtie2-2.3.4.2-linux-x86_64.zip #解压
4.1.2.samtools 软件
wget https://nchc.dl.sourceforge.net/project/samtools/samtools/1.9/samtools-1.9.tar.bz2 #下载软件
tar -xzvf samtools-1.9.tar.bz2 #解压软件
4.2.Indexing a reference genome
~/bowtie2-build ~/example/reference_genome.fa reference_index
4.3. mapping
4.4.bam QC and PCR duplicates
samtools
4.5.bam2sam and sorted
5.peakcalling
软件MACS2