统计与科研收藏

R语言基础学习十一-R初学者语言读取文件的注意事项

2023-02-18  本文已影响0人  小qqq

R中读取数据的常用几种类型:

Excel
csv
txt
其他格式

1. Excel 格式比较常见,以data.xlsx为例,内容如下:

image.png

使用readxl包读取Excel文件。首先我们要安装这个R包

install.packages("readxl") #安装包
library(readxl)#读取包
tmp <- read_xlsx("D:/data.xlsx", col_names = F) #读取包,需要注意如果表里面有列名需要col_names = T,否则会报错,如果文件不是是.xlsx格式的,那需要用其他函数,比如read_xls()函数读取.xls结尾的文件

2. csv文件是一种逗号分隔文件,打开后和excel看起来一模一样,如果不确定用什么分割符,可以用vscode打开查看;一般推荐把excel文件另存为csv文件,因为方便R语言读取,不需要安装R包就能读取

csv <- read.csv("D:/R/data.csv", header = T)
csv <- read.table("D:/R/data.csv", header = T,sep = ",") # 指定分隔符!!,两种方式都可以读取

3. txt文件也是常见的文件类型,通常这种数据也是可以直接读取的,不用安装R包;txt是tab键分隔的文件,在读取时,一定要指定分隔符!

tmp <- read.table("data.txt",sep = "\t", # 必须要指定分隔符
                  header = T)

4. 其他类型,如果是spss软件产生的.sav文件,可以使用foreign包中的read.spss()函数读取,或者使用haven包中的read_sav();如果是rdata/Rdata/RData文件或rds文件,是R自带的格式,直接load()即可

library(foreign)
spss <- foreign::read.spss("data.sav",to.data.frame = T) 
# haven包读取
library(haven)
spss <- read_sav("data.sav")
load(file = "data.rdata")
data <- readRDS(file = "data.rds") 

5.写出文件(从R语言另存为其他格式)

# 把data这个数据框保存为csv
write.csv(data, # 要保存的对象
          file = "D:/data.csv", 
          quote = F, # 不加引号
          row.names = F, # 行名
          col.names = T # 列名
          )
write.table(data,
            file = "D:/data.csv", 
            sep = ",",  # 必须指定分隔符!!!
            quote = F, # 不加引号
            row.names = F, # 行名
            col.names = T # 列名
            )
#保存为txt文件
write.table(data,
            file = "D:/data.txt",
            sep = "\t",
            quote = F, # 不加引号
            row.names = F, # 行名
            col.names = T # 列名
            )
#保存为rdata/Rdata/RData文件,直接用save()函数
save(data,csv, # 同时保存多个对象
     file = "data.rdata")
#保存为rds格式:
saveRDS(data, file = "data.rds")

6.注意事项

1)输入法需要是英文状态下的标点符号!

2)文件路径必须写对!

3)注意不同文件的分隔符!

4)不同文件使用不同函数读取/写出!不要所有的格式都用一个!

上一篇下一篇

猜你喜欢

热点阅读