03-05

2021-05-15  本文已影响0人  Everlyn

3-5函数与R包

谷歌中打开html文件或者 PPT R语言线上-3.R包
file:///Users/wangjingyi/Desktop/%E7%94%9F%E4%BF%A1%E6%8A%80%E8%83%BD%E6%A0%91/01-get_start/03_rpackages.html

3-6-1文件读取

打开PPTR语言线上-4.文件读写

3-6-2 文件读取代码

1.读取ex1.txt
> ex1=read.table("ex1.txt",header = T)

2.读取ex2_B cell receptor signaling pathway.csv
> ex2=read.csv("ex2_B cell receptor signaling pathway.csv",
+              row.names = 1,#以表格中的第一列作为行名
+              check.names = F)#分隔符不用.
> class(ex2)
[1] "data.frame"
> ex2<-as.matrix(ex2)
> class(ex2)
[1] "matrix" "array" 

3.读取GSE32575_series_matrix.txt,赋值给gse。
> gse=read.table("GSE32575_series_matrix.txt")
Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec,  : 
  line 31 did not have 2 elements
> gse=read.table("GSE32575_series_matrix.txt",
               comment.char = "!",#以!开头的文本不是表格的正文
               row.names=1,#以表格中的第一列作为行名
               header = T)#有列名,请识别

4.描述gse的属性
> dim(gse)
[1] 336  48

5.将gse导出为新的txt和csv文件。
> write.csv(gse,"z.csv")
> write.table(gse,"z.txt")

6.将gse保存为Rdata并加载。
> save(gse,file = "z.Rdata")
> load("z.Rdata")

练习4-1:
1.读取complete_set.txt(已保存在工作目录)
a=read.table("complete_set.txt")
a=read.table("complete_set.txt",header = T)
2.查看有多少行、多少列
nrow(a)
ncol(a)
3.获取行名和列名
row.names(a)
colnames(a)
4.导出为csv格式
write.csv(a,"a.csv")
5.保存为Rdata
save(a,file = "a.Rdata")
6.加载class.Rdata,查看数据类型
load("class.Rdata")
class("class.Rdata")
class(y)
ch

如何读取不在工作目录下的文件?

x=read.table("~/biotrainee/.Rproj.user/C382FEA1/bibliography-index/")
~/开头找路径,用TAB补齐

Rdata是R中特有的数据类型,用其他软件无法打开,可以用load加载(不需要赋值),save保存或生成。

R语言能读取的文件格式

通用格式:csv,xls,txt,tsv,json,pdf,spss等
生信格式:fasta,fastq,bam,vcf,bed,gtf等有专用函数和R包


image.png

fread适用于较大的数据
import-list可以读取有多个工作簿的电子表格

高阶数据读取指南https://www.jianshu.com/p/4ea320c0dcc6

上一篇 下一篇

猜你喜欢

热点阅读