2-【MacSyFinder】的安装和使用(2021.1.28)

2021-02-03  本文已影响0人  lkj666

安装时间:2021.1.28
 
在线版本:TXSScan
本地版本:MacSyFinder


1. 简介

    MacSyFinder用于预测细菌中是否存在蛋白分泌系统,其预测分泌系统类型和原理如下:

图片解释:

  1. 同一图片中,相同的颜色表示具有同源性;
  2. 实线方块说明该基因是成簇聚集的,虚线方块是指独立存在;
  3. d值表示相邻基因之间的间隔基因个数;

有关分泌系统那些事:

  1. T1SS和T5SS是分布最广的分泌系统;

2. 安装(mascyfinder_1.0.5)

2.1 利用conda建立环境,并安装相应依赖包

conda create -n mascyfinder_1.0.5 pyhon=2.7.15
conda activate mascyfinder_1.0.5
conda install blast=2.2.31
conda install hmmer

2.2 下载MacSyFinder_1.0.5并解压缩,解压缩后将其添加到环境变量中(或者直接将安装包移动到conda建立的mascyfinder_1.0.5环境目录下),之后进入该目录

python setup.py build
python setup.py test -vv
python setup.py install

注:

  1. 可能需要root权限;
  2. 执行python setup.py install时可能失败,此时添加python的绝对路径即可;

2.3下载并添加预测模板

    下载全部Macsyfinder_models-mastercode文件,找到Macsyfinder_models-master/models/TXSS/目录下的文件definitions(包含*.xml文件)以及profiles(包含*.hmm文件),并将这两个文件移动到任意工作目录。


3. 使用

macsyfinder all --db-type ordered_replicon  -d definitions所在目录 -p profiles所在目录  --sequence-db protein.fa -o outfile

安装心得

  1. 在所有程序都正确的情况下,程序仍然安装失败,很有可能是用conda自动安装相应软件的时候,软件的版本没有符合要求。比如,此次用conda直接安装blast的时候安装的是blast=2.6.0版本,后续安装就遇到了问题。

2. 安装(macsyfinder2.0)

    该版本改善了需要手动下载和添加分泌系统模板的问题,比之前要方便很多。

  1. 利用conda创建新环境,并下载依赖包
conda create -n macsyfinder2.0 python=3.7.10
conda activate macsyfinder2.0
conda install hmmer=3.3.2
  1. 下载安装mascyfinder2.0
git clone https://github.com/gem-pasteur/macsyfinder.git # 或者直接在github上下载macsyfinder,然后解压缩
cd macsyfinder
pip3 install .

用sudo apt install python3-pip,安装后pip3=20.0.2。(主要不要安装高版本的!!!最新的版本经常出现兼容性的问题),可用python -m pip install pip==20.02回退到低版本的pip3

  1. 下载所有可用模板
macsydata install TXSS

3. 使用(mascyfinder2.0)

macsyfinder --db-type ordered_replicon --sequence-db my_proteins.fasta --models TXSS all/T3SS

--db-type选项有两种常用的选项:

  1. unordered:未进行组装的全基因组(这个意思有点模糊,是下机数据还是说草图?)
  2. ordered_replicon:已经组装好的全基因组
  3. --e-value-search:预测阈值(模式是0.1)
  4. -o:结果输出的文件名
上一篇 下一篇

猜你喜欢

热点阅读