R语言基础操作①
基础指令
程序辅助性操作:
运行
q()——退出R程序
tab——自动补全
ctrl+L——清空console
ESC——中断当前计算
调试查错
browser() 和 debug()——设置断点进行,运行到此可以进行浏览查看(具体调试看browser()帮助文档(c,n,Q))
stop(‘your message here.’)——输入参数不正确时,停止程序执行
cat()——查看变量?
帮助
help(solve) 和 ?solve 等同
??solve——检索所有与solve相关的信息
help(“[[“) 对于特殊含义字符,加上双引号或者单引号变成字符串,也适用于有语法涵义的关键字 if,for 和 function
help(package=”rpart”)——查看某个包
help.start()——得到html格式帮助
help.search()——允许以任何方式(话题)搜索帮助文档
example(topic)——查看某个帮助主题示例
apropos(”keyword”)——查找关键词keyword相关的函数
RSiteSearch(“onlinekey”, restrict=fuction)——用来搜索邮件列表文档、R手册和R帮助页面中的关键词或短语(互联网)RSiteSearch(‘neural networks’)
准备
文件目录设置
setwd()——设置工作文件目录
getwd()——获取当前工作文件目录
list.files()——查看当前文件目录中的文件
加载资源
search()——通过search()函数,可以查看到R启动时默认加载7个核心包。
基础函数:数学计算函数,统计计算函数,日期函数,包加载函数,数据处理函数,函数操作函数,图形设备函数
setRepositpries()——选择软件库(CRAN,Bioconductor,R-Forge)
(.packages())——列出当前包
(.packages(all.available=TRUE))——列出有效包
install.packages()——安装包
library()和require()——加载R包(package)至工作空间
data()——列出可以被获取到的存在的数据集(base包的数据集)
data(package=“nls”)——将nls包的datasets加载到数据库中
批处理文件和结果重定向
source(“commands.R”)——执行commands.R (存放批处理命令的)脚本文件。
cat(<rcommond style="font-family: "Microsoft Yahei";">,file=””)——可以把R命令输出至外部文件,然后调用source函数进行批处理
数据处理
输入输出(读入输出数据、文件)
assign(“x”,c(1,2,3)) 和 x <- c(1,2,3) 和 c(1,2,3)->x ——向量赋值
read.table(”infantry.txt”, sep=”\t”, header=TRUE)——seq属性用其它字符分割,比如文本文件用空格(tab)分隔,header设置为文件中已经存在表头名称
read.csv(“targets.csv”)——读入csv(Comma Seperated Values)文件,属性被逗号分割
read.csv(url(““))——read.csv() 和 url()的合体,读存在网上的数据
x <- scan(file=””)——手动输入数据,同时scan可以指定输入变量的数据类型,适合大数据文件
scan(“data.dat”, what = list(“”, 0, 0))——what指定变量类型列表
readLines(‘http:……’,n=10)——读取文本文件,将文档转为以行为单位存放的list格式,比如读取读取wikipedia的主页html文件的前十行
write.table(Data, file=”file.txt”, row.names = FALSE, quote=FALSE)——输出,quote为FALSE去掉字符串类型的双引号,write.table(stasum, “stasum.csv”,row.names = FALSE,col.name=FALSE,sep=”,”,append=TRUE)
write.csv(data,file=”foo.csv”,row.names=FALSE)——写成csv格式,row.names=FALSE去掉行号
print()——打印
save.image(”./data.RData”)——把原本在计算机内存中(工作空间)活动的数据转存到硬盘中。
load(“./RData”)——加载目录中的*.RData,把文档-词项矩阵从磁盘加载到内存中
数据查看
通用对象
R是一种基于对象(Object)的语言,对象具有很多属性(Attribute),其中一种重要的属性就是类(Class),最基本的类包括了数值(numeric)、逻辑(logical)、字符(character)、列表(list),符合类包括矩阵(matrix)、数组(array)、因子(factor)、数据框(dataframe)。
class() 和 data.class(object)——查看对象object的类或类型
unclass()——消除对象object的类
基本数据类型
mode()——查看基本数据类型
length()——查看长度
as.<数据类型>——改变对象的数据类型
混合类型
逻辑类型+数值类型=数值类型
逻辑类型+字符类型=字符类型
数值类型+字符类型=字符类型
ls() 和 objects()——查看当前工作空间中存在的对象(变量)
rm(list=ls())——删除工作空间的所有对象
methods(x)——查看x函数的源码,有些自带函数输入名称x可以直接看到,有一些需要调用methods方法才能查看函数x的源码,出现多重名,输入对应名称即可
str()——查看数据(框)中的数据总体信息(比如样本个数、变量个数、属性变量名称、类型)
nrow(dataframe)——查看数据集行数
NROW(vector)——查看向量的行数,等于length(x)
head(dataframe)——查看数据集前6行数据
tail(dataframe)——查看数据集尾6行数据