在shell or R 中判断一个文件是否为空。

2020-08-30  本文已影响0人  记号晴系

1. shell 中判断文件是否存在或者是否为空文本

在lunix中写脚本时,总免不了判断文件是否存在,文件内容是否为空的等操作。而这些操作都可以用test指令来实现,可通过man test进行查看相关指令。

#! /bin/sh
if test -s file.txt;then
          echo "hi"
else
        echo "empty"
fi
### 另外一个等同的
#! /bin/sh
if  [ -s file.txt ];then
          echo "hi"
else
        echo "empty"
fi

-f判断是不是文件; -d判断是不是目录;-e判断文件/目录是否存在;-s判断文件长度是否不为0,当-s后面跟目录是,总是返回真

2. R语言文件操作

R语言的基础函数中也囊括了文件夹和文件的基本操作函数,由于使用R的过程中会常常需要与文件打交道,因此一些基本的文件操作函数在实际使用中是十分常见的,这里做了一些简单的整理。

2.1 构建文件路径:

file.path(..., fsep = .Platform$file.sep)

file.path用于构建文件路劲,默认会使用.Platform$file.sep作为文件分隔符,因此可以实现跨平台操作,该函数实际较为常用。

#按向量中元素对应的位置生成文件路劲
file.path(c('C:', 'D:'), c('R_script', 'R_data'))

2.2 列出路劲下的文件/目录 :

#列出当前目录下的文件和文件夹
list.files(path = ".", pattern = NULL, all.files = FALSE,
full.names = FALSE, recursive = FALSE, ignore.case = FALSE,include.dirs = FALSE, no.. = FALSE)
#列出当前目录下的文件和文件夹
dir(path = ".", pattern = NULL, all.files = FALSE,
full.names = FALSE, recursive = FALSE, ignore.case = FALSE,include.dirs = FALSE, no.. = FALSE)
#列出当前目录下的所有子目录,默认recursive = TRUE
list.dirs(path = ".", full.names = TRUE, recursive = TRUE)

返回给定路劲下文件名或文件夹组成的字符向量,如果没有返回空字符。如果给定的路劲不存在,或为非法路劲或没有读取权限,返回空字符。list.dirs隐式的包含all.files = TRUE。

2.3 创建文件夹及设置权限

path.expand(path)
dir.create(path, showWarnings = TRUE, recursive = FALSE, mode = "0777")
dir.exists(paths)
Sys.chmod(paths, mode = "0777", use_umask = TRUE)
Sys.umask(mode = NA)
#例子
#读取环境变量R_USER,返回C:/Users/XXXX/Documents
Sys.getenv('R_USER')
#使用home path替换波浪号,返回C:/Users/XXXX/Documents/foo
path.expand("~/foo")

#在当前工作目录下创建文件夹testfolder
dir.create(file.path(getwd(), 'testfolder'))
#默认的recursive为FALSE,创建子目录失败
dir.create(file.path(getwd(), 'testfolder2', 'subfolder'))
#文件夹不存在返回FALSE
dir.exists(file.path(getwd(), 'testfolder2', 'subfolder'))
#设置recursive为TRUE,创建子目录
dir.create(file.path(getwd(), 'testfolder2', 'subfolder'), recursive = TRUE)
#创建成功返回TRUE
dir.exists(file.path(getwd(), 'testfolder2', 'subfolder'))

#设置文件目录的最大权限
Sys.chmod(list.dirs("."), "777")

2.4 查询和设置R包使用路径

.libPaths(new)

不带参数时.libPaths()会显示当前使用的R包路劲,设置参数可用于设置当前R包路径,对于安装多版本R语言的情况,可以通过使用.libPaths设置使用的R包路劲。

#例子
#设置R包路劲为R-3.2.2下的library
.libPaths("C:/Users/XXXX/Documents/R/R-3.2.2/library")

2.5文件处理

file.create(..., showWarnings = TRUE)
file.exists(...)
#成功返回0,失败返回-1
file.access(names, mode = 0)
file.remove(...)
#删除文件及目录
unlink(x, recursive = FALSE, force = FALSE) 
file.rename(from, to)
file.append(file1, file2)
file.copy(from, to, overwrite = recursive, recursive = FALSE, copy.mode = TRUE, copy.date = FALSE)
file.show(..., header = rep("", nfiles),title = "R Information", delete.file = FALSE, pager = getOption("pager"), encoding = "")
file.symlink(from, to)
file.link(from, to)
Sys.junction(from, to)
#文件不存在则创建文件,存在则覆盖之前的文件
file.create('cretestfile.txt')
#判断文件是否存在,返回TRUE
file.exists('cretestfile.txt')
#默认mode = 0判断文件是否存在,存在返回0
file.access('cretestfile.txt')
#删除文件cretestfile.txt,文件不存在会返回warning信息
file.remove('cretestfile.txt')
#读取bin目录下所有文件及目录
d <- dir(file.path(R.home(), "bin"))
#读取bin目录下所有文件及目录(包含全路径)
df <- dir(file.path(R.home(), "bin"), full.names = TRUE)
#列出所有存在的文件
d[file.access(df, 0) == 0]
#列出所有可执行文件
d[file.access(df, 1) == 0]
#列出所有可写文件
d[file.access(df, 2) == 0]
#列出所有可读文件
d[file.access(df, 4) == 0]

#创建并写入数据到文件A.txt和B.txt
cat("file A\n", file = "A.txt")
cat("file B\n", file = "B.txt")
cat("file C\n", file = "C.txt")
#添加文件C.txt的内容到A.txt和B.txt
file.append(c("A.txt", "B.txt"), "C.txt")
#修改文件名C.txt为D.txt
file.rename("C.txt", "D.txt")
#复制D.txt中的内容10遍,添加到文件A.txt和B.txt各5次
file.append(c("A.txt", "B.txt"), rep("D.txt", 10))
#读取文件A.txt和B.txt的内容
file.show(c("A.txt", "B.txt"))
#复制文件D.txt到C.txt
file.copy("D.txt", "C.txt")
#C.txt已存在,设置overwrite = TRUE进行覆盖
file.copy("D.txt", "C.txt", overwrite = TRUE)
#新建tmp文件夹,并拷贝A.txt和B.txt到tmp文件夹下
dir.create("tmp")
file.copy(c("A.txt", "B.txt"), "tmp")
#删除tmp文件夹
unlink("tmp", recursive = TRUE)
#删除文件
unlink(c("A.txt", "B.txt", "C.txt","D.txt"))

文件信息查询
file.info(..., extra_cols = TRUE)
file.mode(...)
file.mtime(...)
file.size(...)

file.info返回文件相关信息:

~~~R
#返回当前目录下所有文件及目录的信息
file.info(list.files())
#返回当前目录下所有文件的mode
file.mode(list.files())
file.info(list.files())$mode
#返回当前目录下所有文件的最近一次修改时间
file.mtime(list.files())
file.info(list.files())$mtime
#返回当前目录下所有文件的大小,目录size返回为0
file.size(list.files(()))
file.info(list.files())$size
上一篇下一篇

猜你喜欢

热点阅读