Phage Term----噬菌体分类(二)
2020-03-28 本文已影响0人
bcl_hx
1.Phege Term下载与安装、
Pheage Term可以在https://sourceforge.net/projects/phageterm 上下载。
#下载完成后上传至服务器
unzip phageterm-1.0.12.zip
注:要运行该软件需要有Python及以下库文件。

./PhageTerm.py
#出现以下报错,原因是服务器的python版本为3,而该软件需要的是python版本为2,很明显python代码里面print语句没用。python3的print语句必须要加()。

#解决方法
conda create --name python27 python=2.7 #创建一个名为python27的环境,指定Python版本是2.7
source activate python27 #安装好后,使用activate激活该环境
python --version #查看python版本是否变为2.7
#在该环境下装包
pip install matplotlib #注:conda安装时候报错,采用pip安装。
conda install numpy
conda install pandas
conda install scikit-learn
conda install scipy
conda install statsmodels
pip install reportlab
./PhageTerm.py #看看还报不报错


2.使用测试数据跑程序
source activate python27 #激活前面创建好的环境
cd phage/phageterm-1.0.12/ #进入软件所在文件夹
touch phageterm.sh #创建一个shell脚本
vim phageterm.sh
#在shell脚本中输入以下(以Mulike为例)
./PhageTerm.py -f test-data/Mu-like_R1.fastq -p test-data/Mu-like_R2.fastq -r test-data/Mu-like.fasta -n TEST_Mu-like -g test-data/Mu-like_host.fasta -c 10
#参数使用介绍
-f:pair-end测序得到的read1。
-p:pair-end测序得到的read2。
-r:噬菌体参考基因组(组装得到的fasta文件)。
-n:噬菌体的名字(也是最后生成报告的名字)。
-g:宿主的参考基因组(增加会导致程序跑的很慢,如果有建议使用该参数)
-c:需要用多少个processor(加快运算速度),可通过命令cat /proc/cpuinfo | grep processor查看有多少个processor。
#运行
chmod u+x phageterm.sh #加可执行权限
nohup ./phageterm.sh > TEST_Mu-like.log & #后台运行
3.结果
程序跑完后会生成以下3个文件:

(1)TEST_Mu-like_PhageTerm_report.pdf:会给出属于哪一类噬菌体,包装机制, 宿主基因组情况等信息。



(2)TEST_Mu-like_statistics.csv:给出各个位置的coverage,SPC等结果的统计表。

本文由博客一文多发平台 OpenWrite 发布!