NGS测序笔记

RNAseq001 转录组入门(1) :资源准备

2020-08-25  本文已影响0人  caoqiansheng

主要参考生信技能树RNA-seq基础入门

http://www.biotrainee.com/thread-1750-1-1.html

1. 系统准备

Win10自带Ubuntu子系统,开启详见:
Linux001 win10 linux子系统安装
Linux010 Miniconda安装及使用

2. 安装前准备

在安装转录组相关软件之前,我们需要新建一个虚拟环境,因转录组某些软件对Python版本有要求,如tophat要求Python=2.7,下面会有涉及到
另外因为尝试了多次,在安装多个软件的过程中,需要某些软件的安装会升级python,造成依赖于指定python版本的安装包不可用,因此在安装的时候,需要仔细核查
Linux018 conda虚拟环境

3. 软件安装

RNA-seq 基本分析流程

3.1 sratoolkit

https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software

Linux011 Sra toolkit安装及使用
linux025 SRA数据下载工具ascp的安装及使用

3.2 数据质控 fastqc

安装过程中,确认Python版本号为2.7
http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Linux012 Fastqc安装及使用

3.3 质控数据整合 multiqc

https://pypi.org/project/multiqc/

# 我也不确定这么做能不能指定multiqc为python2.7构建,但是确实安装成功了
conda install  multiqc 
multiqc --help

3.4 hisat2

https://daehwankimlab.github.io/hisat2/

conda install hisat2 

3.5 samtools

http://www.htslib.org/

conda install samtools 
samtools

如果有报错,请参考linux023 conda安装常用生信软件

3.6 tophat

tophat安装过程我折腾了很久,主要是一开始不了解软件的要求,建议在安装软件之前,最好是在bioconda主页https://bioconda.github.io/index.html检索是否有该安装包,另外需要确认软件的安装要求。

我们在bioconda检索tophat,可以看到tophat要求的Python环境为2.7,这就是我们为什么在开始装软件之前要配置Python=2.7的虚拟环境的原因
http://bioconda.github.io/recipes/tophat/README.html#package-tophat

image.png
# 首先新建一个Python2.7版本的虚拟环境,如不指定Python版本号,则默认安装当下最新版本
# 如果指定Python=2.7,则安装软件过程中,会自动检索该环境下最新版本的软件
conda create -n rna python=2.7
# 如不在指定Python版本进行安装,会报错failed with initial frozen solve. Retrying with flexible solve
conda install tophat 
tophat

3.7 htseq

conda install htseq 
# 查看是否安装成功
htseq-count
上一篇下一篇

猜你喜欢

热点阅读