R语言与生物统计(别关注,自己当分类收藏夹用的)

R语言读取gtf文件

2021-06-07  本文已影响0人  日月其除
library("rtracklayer")
gtf_data = import('gencode.v35.annotation.gtf') #gtf的路径
#这里使用import导入gtf文件, 生成一个GRangs对象
gtf_data = as.data.frame(gtf_data)
image.png

这样读取gtf文件回比直接使用read.table()好,因为生成的dataframe能够比较清楚地分开,并且有title。

image.png
除了import函数,rtracklayer包中还有一个导出数据的函数export()。
网页链接:
export: Import and export in rtracklayer: R interface to genome annotation files and the UCSC genome browser (rdrr.io)
这个函数将Grange对象导出为gtf或者bed文件等。
export(object, con, format, ....)
import(con, format, text, ...)
image.png

其实这几个参数没咋完全看明白。
直接看例子吧

track = import(system.file("tests", "v1.gff", package = "rtracklayer"))
## Not run: export(track, "my.gff", version = "3")
##equivalently,
##Not run:
con = file("my.gff3")
export(track, con, "gff3")

##End(not run)
## or as a string
export(track, format = "gff3")

上一篇 下一篇

猜你喜欢

热点阅读