转录组

植物长链非编码RNA(lncRNA)数据的处理流程

2021-03-12  本文已影响0人  小明的数据分析笔记本

在简书看到的其他人的分享,我这里记录一下,简书对应的主页是

https://www.jianshu.com/p/94896e4cbb05

对应的github主页是 https://github.com/Dukunbioinfo/pipeline-for-lncRNAs

这个github主页还有其他关于转录组数据处理的内容,比如常用的一些R语言的脚本

https://github.com/Dukunbioinfo/R-scripts-for-RNA-seq

image.png

一些python脚本

https://github.com/Dukunbioinfo/RNA-seq

image.png

还有一个gtf文件的处理工具

https://github.com/Dukunbioinfo/in-house-gtftools

可以操作 stringtie 软件的输出结果,一个很有用的功能是根据gtf文件中的class code来提取想要的内容

安装方法

解压缩

unzip in-house-gtftools-master.zip

进入压缩得到的文件夹

cd in-house-gtftools-master/

安装用到的命令是

g++ *.cpp -o inhouseGTFtools

当前目录下回得到一个绿色的可执行文件

image.png

根据class code提取想要的内容

image.png

用我自己的数据试一下

~/Biotools/inhouseGTF/in-house-gtftools-master/inhouseGTFtools STscreen -classCode u -i merged.combined.gtf > u.gtf
~/Biotools/inhouseGTF/in-house-gtftools-master/inhouseGTFtools STscreen -classCode o -i merged.combined.gtf > o.gtf
~/Biotools/inhouseGTF/in-house-gtftools-master/inhouseGTFtools STscreen -classCode x -i merged.combined.gtf > x.gtf

之前自己做这个事情是利用python的pyGTF模块自己写脚本,有了这个工具就方便了很多

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

上一篇 下一篇

猜你喜欢

热点阅读