走进转录组linux

有参转录组学习一:软件安装及数据下载

2019-05-15  本文已影响0人  颤抖吧__小虫子
Author:ligc
Date:19/5/15

参考文章:

AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034.

数据下载

第一步:在PubMeb上查找文献。
第二步:文章中method部分有数据存放在GEO数据库的GSE号,本文章为GSE81916。
第三步:GEO数据存放的FTP网址ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747 可以分为以下几个部分

1.软件安装

1.1 sratookit

功能:prefetch用于下载ncbi中SRA数据库中的.sra测序原始数据;fastq-dump用于将sra数据转换为fastq格式用于后续的质控和过滤。
软件官网:sratookit;documents
安装使用:

直接从官网下载软件压缩包,不用编译即可直接使用,注意将软件的可执行程序(bin/)加入到环境变量中,即可全局使用。

批量转换时容易报错,样本量不大时可以单个样本转换


Error
for i in 'seq 59 62'
do
    fastq-dump --gzip --split-3 -A /Storage/data003/ligc/AKAP95_rna_seq/raw_data/SRR35899${i}.sra
done

下载数据

推荐用aspera+prefetch下载NCBI或EBI上的sra或fastq文件

##EBI
 ascp -i ~/asperaweb_id_dsa.putty era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR346/SRR346368/SRR346368.fastq.gz .
##NCBI
 ascp -i ~/asperaweb_id_dsa.putty anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/litesra/SRR/SRR096/SRR096072/SRR096072.lite.sra .

1.2 fastqc

功能:测序数据的可视化工具
软件官网:fastqc
安装使用:
conda install fastqc -c bioconda
ls *.gz | while read id; do fastqc -t 20 $id; done
##OR
ls *.gz | xargs -i echo nohup fastqc -o ../Quality_control/fastqc/ {} \& > fastqc.sh

1.3 samtools

功能:SAM Tools provide various utilities for manipulating alignments in the SAM format, including sorting, merging, indexing and generating alignments in a per-position format.
软件官网:samtools
安装:conda安装

1.4 hisat2

功能:将reads比对到参考基因组上
软件官网:hisat2
安装:conda安装

1.5 htseq

功能:将比对到基因上的reads进行计数(read count)。
软件官网:htseq
安装:conda安装

1.6 featurecounts

功能:
软件官网:http://bioinf.wehi.edu.au/featureCounts/
安装:
if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install("Rsubread")
...未完待续
欢迎大家批评指正!
参考文章:

1.https://www.jianshu.com/p/b16ae34f9012
2.https://www.jianshu.com/p/9c2bf27c3921
3.https://www.plob.org/article/3013.html

上一篇 下一篇

猜你喜欢

热点阅读