《生物软件及应用》课程笔记

Linux系统下MultiQC软件安装运行

2019-11-19  本文已影响0人  Akuooo
首先我是尝试了用conda来安装,但是出现了一些问题。 错误信息.PNG

参考了两篇相关的文章:
ImportError: No module named conda.cli.
ln: failed to create symbolic link ‘/usr/bin/pip’: File exists
发现依然不成功,并且conda也无法运行了…

然后我卸载了conda,删除了之前设置的环境变量,重启了终端,重新安装了一遍conda。(感觉应该是在设置的时候把这个环境搞乱了)

conda的卸载

$ rm -rf anaconda3
$ vi .bashrc
# 删除了相关的环境变量
$ source .bashrc

conda的安装

(参照:conda的安装与使用)

$ sh Anaconda3-5.2.0-Linux-x86_64.sh
#激活
$ chmod 777 activate
# 添加channel
$conda config --add channels bioconda
$conda config --add channels conda-forge

下面就开始正式的安装MultiQC了

安装MultiQC

设置+激活环境

由于之前是直接在conda环境中安装的,所以如果出了错可能会导致自己的账户环境就不能用了。所以先要设置一个小环境
参照:conda管理生信软件一文就够

$ conda create -n py3.5 python=3.5
# 这三个都是用来查看已存在的小环境的
$ conda info -e
$ conda info --envs
$ conda env list
#激活小环境
$conda activate py3.5
# 此时便已经进入了设置的小环境,如图
查看conda环境.PNG
查找软件
查找multiqc.PNG
安装multiqc
conda install multiqc
# 调取其帮助文档,确认是否安装成功
$ multiqc -help
安装环境确认.PNG

在询问是否开始安装的时候,输入y(即yes)


安装完成.PNG
调取帮助文档.PNG

运用multiqc

1.首先在NCBI上找到两个序列,我找到的是SRR10338477和SRR10442162

$ prefetch SRR10338477
$ prefetch SRR10442162

于是下载的序列就存储在了/home/akuooo/ncbi/public/sra这个目录里


sra.PNG

copy到我的multiqc_test文件夹里

$ cp SRR10338477.sra ~/Seqs/multiqc_test
$ cp SRR10442162.sra ~/Seqs/multiqc_test
$ cd ~/Seqs/multiqc_test

2.批量解压文件

#编写一个程序,批量解压当前目录的sra文件(参照老师的PPT)
vi 1.sh
#!/bin/sh
for i in *sra
do
        echo $i
        fastq-dump --gzip --split-files $i
done
$ chmod +x 1.sh
$ ./1.sh

等待运行完成,ls可以看到


解压文件.PNG

3.运用fastqc进行数据质量评价

fastqc SRR10338477_1.fastq.gz SRR10442162_1.fastq.gz SRR10338477_2.fastq.gz SRR10442162_2.fastq.gz
fastqc.PNG

4.运行multiqc

# 直接在当前目录下输入:
$ multiqc .
report.PNG

可以进入图形界面进行查看,也可以把文件下载,在Windows下查看。(如图)


结果.PNG

5.数据解读
可参照:整合QC质控结果的利器——MultiQC

6.退出小环境

$ conda deactivate

ps.下一次激活conda的命令

source activate 环境名
上一篇下一篇

猜你喜欢

热点阅读