生信log微生物生物数据分析

生信log7|用barrnap在细菌全基因组中抽取16sr RN

2021-05-19  本文已影响0人  小周的万用胶囊

使用软件:barrnap(需要在合适的环境中配合运行)

barrnap其实 除了自己一个文件以外,还会配合bedtools来抽取fasta中的序列,否则会因为格式问题报错而不产生所需的文件

准备文件:

软件安装

Conda
conda install -c bioconda -c conda-forge barrnap
Homebrew(MacOS/Linux用户)
brew install brewsci/bio/barrnap
到底需不需要特意去安装呢,笔者认为是不需要的,因为这个软件内置在微生物注释常用软件Prokka内,意味着使用prokka进行初步注释后已经可以抽取16S rRNA基因序列了

常用代码/命令

# 查看帮助
barrnap -h
# contigs.fa 输入的是拼接好的菌种.fasta的文件,两边的 'rrna.fa', 'rrna.gff'是为了
# 把gff上的信息与序列信息相对应)-o 是输出文件名&地址
barrnap -o output.fa contigs.fa your_species.gff 
##查看序列头三行
head -n 3 rrna.fa 

得到下列结果

16S_rRNA::gi|329138943|tpg|BK006945.2|:455935-456864(-)
ACGGTCGGGGGCATCAGTATTCAATTGTCAGAGGTGAAA
TTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTG
CCAAGGACGTTTTCATTA

如何验证

参考

下面的网址是官方详细的教程
https://github.com/tseemann/barrnap/blob/master/README.md#barrnap

上一篇 下一篇

猜你喜欢

热点阅读