RNAseq001 转录组入门(1) :资源准备
主要参考生信技能树RNA-seq基础入门
http://www.biotrainee.com/thread-1750-1-1.html
1. 系统准备
Win10自带Ubuntu子系统,开启详见:
Linux001 win10 linux子系统安装
Linux010 Miniconda安装及使用
2. 安装前准备
在安装转录组相关软件之前,我们需要新建一个虚拟环境,因转录组某些软件对Python版本有要求,如tophat要求Python=2.7,下面会有涉及到
另外因为尝试了多次,在安装多个软件的过程中,需要某些软件的安装会升级python,造成依赖于指定python版本的安装包不可用,因此在安装的时候,需要仔细核查
Linux018 conda虚拟环境
3. 软件安装
3.1 sratoolkit
https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software
Linux011 Sra toolkit安装及使用
linux025 SRA数据下载工具ascp的安装及使用
3.2 数据质控 fastqc
安装过程中,确认Python版本号为2.7
http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Linux012 Fastqc安装及使用
3.3 质控数据整合 multiqc
https://pypi.org/project/multiqc/
# 我也不确定这么做能不能指定multiqc为python2.7构建,但是确实安装成功了
conda install multiqc
multiqc --help
3.4 hisat2
https://daehwankimlab.github.io/hisat2/
conda install hisat2
3.5 samtools
conda install samtools
samtools
如果有报错,请参考linux023 conda安装常用生信软件
3.6 tophat
tophat安装过程我折腾了很久,主要是一开始不了解软件的要求,建议在安装软件之前,最好是在bioconda主页https://bioconda.github.io/index.html检索是否有该安装包,另外需要确认软件的安装要求。
我们在bioconda检索tophat,可以看到tophat要求的Python环境为2.7,这就是我们为什么在开始装软件之前要配置Python=2.7的虚拟环境的原因
http://bioconda.github.io/recipes/tophat/README.html#package-tophat
# 首先新建一个Python2.7版本的虚拟环境,如不指定Python版本号,则默认安装当下最新版本
# 如果指定Python=2.7,则安装软件过程中,会自动检索该环境下最新版本的软件
conda create -n rna python=2.7
# 如不在指定Python版本进行安装,会报错failed with initial frozen solve. Retrying with flexible solve
conda install tophat
tophat
3.7 htseq
conda install htseq
# 查看是否安装成功
htseq-count