使用bioconda配置自己的生物信息学环境
2018-01-23 本文已影响273人
因地制宜的生信达人
如果有了新的机器,那么要给新的机器安装好常见的生物信息学软件才能开始做数据分析,这个时候的自动化配置就可以用bioconda来解决。
定位需求
首先需要在https://bioconda.github.io/recipes.html 查找所需软件名,搞清楚自己需要安装哪些生物信息学软件并且哪些可以安装,安装哪个版本。(截止2017年09月28日已经有了近5000个软件包,几乎可以囊括常见的生物信息学软件)
配置文件
然后根据需求,制作YAML格式的配置文件,如下:
# version 1.0
# email: jmzeng1314@163.com
name: jimmy
channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
- https://nanomirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2
- defaults
dependencies:
- bcftools=1.3=0
- bedtools=2.19.1=0
- blat=35=1
- bowtie=1.2.1.1=py27pl5.22.0_0
- bowtie2=2.3.2=py27pl5.22.0_1
- bwa=0.7.15=1
- hisat2=2.1.0=py27pl5.22.0_0
- htslib=1.3=1
# Workflow
- nextflow
# Fastq Download And Quality Control Methods
- sra-tools
- fastx_toolkit
- fastqc
- trimmomatic
- multiqc
上面的下载源主要是为了大陆用户设置的,海外用户可以选其它。为了下面的脚本可以运行,请保证上面的配置文件的文件名是biosetup.yml
自动化安装软件
这里选择conda来根据上面的配置文件,自动化安装好所有的软件
#!/bin/bash
set -e
set -u
set -o pipefail
ENV=$1
# download miniconda and install
URL=https://nanomirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-$(uname -m).sh
PREFIX=$HOME/miniconda3
if [ ! -d $PREFIX ]
then
wget -4 $URL && bash $(basename $URL) -b -p $PREFIX && \
echo "successful installation" && \
echo "export PATH=$PREFIX/bin:"'$PATH' >> ~/.bashrc
fi
if [ ! -f biosetup.yml ]
then
echo "please prepare the file : biosetup.yml"
fi
if [ $ENV ]
then
$HOME/miniconda3/bin/conda env create -f=biosetup.yml -p $ENV
else
echo "software install path is unset"
exit 0
fi
上面的脚本可以指定软件的安装位置!
conda的其它用法
更改python版本
conda info --envs
conda create -n py27 python=2.7 anaconda
#conda create -n py36 python=3.6 anaconda
source activate py27
source deactivate py27
conda env remove -n py27
python --version
which python
更多用法欢迎打印 conda cheat sheet
PDF (1 MB)