R语言读取gtf文件
2021-06-07 本文已影响0人
日月其除
library("rtracklayer")
gtf_data = import('gencode.v35.annotation.gtf') #gtf的路径
#这里使用import导入gtf文件, 生成一个GRangs对象
gtf_data = as.data.frame(gtf_data)
![](https://img.haomeiwen.com/i12333299/87ddb59c4b6f5431.png)
这样读取gtf文件回比直接使用read.table()好,因为生成的dataframe能够比较清楚地分开,并且有title。
![](https://img.haomeiwen.com/i12333299/bc0a954c297ec569.png)
除了import函数,rtracklayer包中还有一个导出数据的函数export()。
网页链接:
export: Import and export in rtracklayer: R interface to genome annotation files and the UCSC genome browser (rdrr.io)
这个函数将Grange对象导出为gtf或者bed文件等。
export(object, con, format, ....)
import(con, format, text, ...)
![](https://img.haomeiwen.com/i12333299/e5d837d9edb645d6.png)
其实这几个参数没咋完全看明白。
直接看例子吧
track = import(system.file("tests", "v1.gff", package = "rtracklayer"))
## Not run: export(track, "my.gff", version = "3")
##equivalently,
##Not run:
con = file("my.gff3")
export(track, con, "gff3")
##End(not run)
## or as a string
export(track, format = "gff3")