EDTA注释重复序列之安装篇
2023-02-18 本文已影响0人
小明的数据分析笔记本
github主页
https://github.com/oushujun/EDTA
按照主页的帮助文档 我用conda安装
conda env create -f EDTA.yml
可能是网络的问题 一直没有成功
用网络稍微好一点的服务器,运行
conda env create -f EDTA.yml
这个成功了
然后把这个环境打包下来
conda install conda-pack -y
conda pack -n EDTA -o EDTA.tar.gz
然后把打包好的文件下载下来,放到我分析数据的服务器上
mkdir EDTA
tar -xzf EDTA.tar.gz -C EDTA
然后把github主页的软件包下载下来
启动这个EDTA的环境
source EDTA/bin/activate
然后运行命令
perl ~/biotools/EDTA/EDTA.pl -genome at_chr1.fa -species others -step all -t 8
遇到报错
Fri Feb 17 09:58:03 CST 2023 Dependency checking:
Error: The RMblast engine is not installed in RepeatMasker!
查了一下这个报错,找到
https://github.com/oushujun/EDTA/issues/11
image.png可以指定repeatmasker的路径
我之前用conda安装过repeatmasker
试一下命令
EDTA.pl -genome at_chr1.fa -species others -step all -t 8 --repeatmasker /home/myan/anaconda3/envs/repeat/bin/RepeatMasker
这个也不行,还是有报错,忘记截图了,
猜测是打包的conda环境有关,一直提示的就是在某个路径下找不到某个脚本,而且那个路径很奇怪,我搜索了一下这个报错也没有找到对应的解决办法
github主页还介绍了使用mamba安装的方法,我再试这个方法
首先是运行这个命令
mamba install -c conda-forge -c bioconda edta python=3.6 tensorflow=1.14 'h5py<3'
有报错,但是报错忘记截图了
然后我把 -c参数的内容去掉 (为啥去掉这个参数 我也说不清楚,就是瞎试)
mamba install edta python=3.6 tensorflow=1.14 'h5py<3'
还是报错,而且这一步卡了很长时间,具体多长时间我也不知道,报错信息是
Could not solve for environment specs
Encountered problems while solving:
- nothing provides libmamba 0.23.1 h1566912_0 needed by libmambapy-0.23.1-py310hd09550d_0
The environment can't be solved, aborting the operation
猜测是python版本的问题,因为python3.6,有点老了
单独安装python3.6试试
mamba install python=3.6
和上面的报错一样
把python改成3.7试试
mamba install python=3.7
幸运这次没有报错了,然后再安装另外一个依赖
mamba install tensorflow=1.14 'h5py<3'
幸运没有报错
最后安装edta
mamba install edta -y
没有报错
使用
EDTA.pl -genome at_chr1.fa -species others -step all -t 8
这个好像成功了
运行完中间有个提示信息
Use of uninitialized value $seq_new in substr at /home/myan/anaconda3/envs/EDTA/share/EDTA/util/cleanup_nested.pl line 190.
Thread 1 terminated abnormally: substr outside of string at /home/myan/anaconda3/envs/EDTA/share/EDTA/util/cleanup_nested.pl line 190
不知道有没有影响
结果怎么看还得研究
前后折腾了好几天