基因组拼装软件getorganelle
2022-08-27 本文已影响0人
路人里的路人
1.安装getorganelle
cd /home/monkeyflower/biosoft
#生信软件都安在这个文件夹里
conda create -n getorganelle python=3.6.8
#创建getoganelle的环境,可通过python3 -V查看当前的python版本,使用系统中存在的python版本
conda install -n getorganelle -c bioconda getorganelle
#在miniconda2上安装getorganelle
2.安装blast(需依靠其下载各种数据库)
先将blast的压缩包下载到Windows上,再上传到服务的/home/monkeyflower/biosoft目录
cd /home/monkeyflower/biosoft
tar -zxvf ncbi-blast-2.13.0+-x64-linux.tar.gz
source ~/.bashrc 解压
export "PATH=/home/monkeyflower/biosoft/ncbi-blast-2.13.0+/bin/:$PATH"
#将其添加到环境变量
source ~/.bashrc
#激活环境
3.安装叶绿体基因组等数据库
get_organelle_config.py --add
安装叶绿体基因组等数据库
4.运行getorganelle
先将需要拼接的序列文件传输到/home/monkeyflower/bioworkplace目录下(最好每次建一个单独的文件夹以保存运行结果)
cd /home/monkeyflower/bioworkplace
conda activate getorganelle
#激活软件
5.拼接代码
get_organelle_from_reads.py -1 sampleA.1.gz -2 sampleA.2.gz -F embplant_pt -o organellefile -R 10 -t 2 -k 35,85,115
#文件名不得有任何空格
-1和-2 正向和反向测序原始数据文件(如果是单向测序,-u)
-F 设定要组装的基因组类型(植物叶绿体基因组:embplant_pt,植物线粒体基因 组:embplant_mt,植物核核糖体DNA片段:embplant_nr)
-o 结果输出保存的目录(文件夹)名称
-R 提取叶绿体基因 reads 的轮次(轮次越多,耗时越长)
-t 并行使用 CPU 的数量(多核可提速),默认值是1
-k 调用SPAdes进行 denovo组装的k-mer,数值必须是奇数,最大值是127
也可使用以下代码可缩短运行时间
get_organelle_from_reads.py -1 sampleA.1.gz -2 CaryopterissampleA.2.gz -F embplant_pt -o organellefile --fast -k 21,65,105 -w 0.68