R语言-seqinr包-Genbank(以及许多其他序列数据库)

2024-03-22  本文已影响0人  潜叶虫

seqinr包简介

seqinr包为R语言提供了访问序列数据库的方式。

通过lseqinr()可以列举出包中的所有函数。

# 安装该包
install(seqinr)

导入数据

read.fasta函数:除fasta格式文件外,gzip压缩的fasta文件也能直接读取
read.alignment函数:用于读取其他软件生成(mase、clustal、phylip、fasta 或 msf)的比对序列数据,以进行多序列比对。format = "fasta"

read.fasta(file = system.file("sequences/ct.fasta.gz", package = "seqinr"),
  seqtype = c("DNA", "AA"), as.string = FALSE, forceDNAtolower = TRUE,
  set.attributes = TRUE, legacy.mode = TRUE, seqonly = FALSE, strip.desc = FALSE,
  whole.header = FALSE,
  bfa = FALSE, sizeof.longlong = .Machine$sizeof.longlong,
  endian = .Platform$endian, apply.mask = TRUE)
  
read.alignment(file, format, forceToLower = TRUE, oldclustal = FALSE, ...)

参数

数据库-检索下载

choosebank()查看支持的数据库,通过infobank参数可以查看数据库信息。
closebank()关闭服务器。
:国内用起来不好使。
query()检索数据。
getSequnce()获取序列。
getTrans()将核酸序列转为蛋白序列。

choosebank(bank = NA, host = "pbil.univ-lyon1.fr", port = 5558, server = FALSE,
                    blocking = TRUE, open = "a+", encoding = "", verbose = FALSE,
                    timeout = 5, infobank = FALSE, tagbank = NA)
                    
query(listname, query, socket = autosocket(),invisible = TRUE, verbose = FALSE, virtual = FALSE)
上一篇下一篇

猜你喜欢

热点阅读