gffread使用小妙招
2021-08-20 本文已影响0人
杨博士聊生信
大家好,今天给大家分享一个软件(cufflinks)中的一个命令gffread,前一段时间需要提取生菜所有基因的CDS序列,本来一开始准备自己写脚本,后来发现gffread就可以实现。
1. 安装:
#下载
wget http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz](http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz
#解压
tar -zvxf cufflinks-2.2.1.Linux_x86_64.tar.gz
#加入到自己环境变量中
export PATH=/home/software/cufflinks-2.2.1.Linux_x86_64/:$PATH
#进入软件目录
cd cufflinks-2.2.1.Linux_x86_64
#查看
ls -l
图1.png
这样即安装好了。
2.gffread使用
以生菜为例吧,现在我们有生菜基因组文件lettuce_genome.fa和gff文件。
2.1 使用gffread利用生菜生菜基因组文件lettuce_genome.fa和gff文件生成生菜所有基因的CDS序列文件,格式为fasta格式。
gffread Lactuca_sativa_lettuce.gff -g lettuce_genome.fa -x
Lactuca_sativa_lettuce_cds.fa
这样就好了,已经生成所有基因的CDS序列文件。
less Lactuca_sativa_lettuce_cds.fa
图 2.png
##还可以利用gffread提取参考基因组文件中的转录本,与上面提取CDS序列类似
gffread Lactuca_sativa_lettuce.gtf -g lettuce_genome.fa -w transcripts.fa
2.2 我们还可以使用gffread实现gff文件和gtf文件格式转换
#gff to gtf
gffread Lactuca_sativa_lettuce.gff -T -o Lactuca_sativa_lettuce.gtf
#gtf to gff
gffread Lactuca_sativa_lettuce.gtf -o tmp.gff
当然,这个软件还要很多其他功能,感兴趣的可以自己试试哦。