R语言基本操作
##R语言数据的基本操作 例子:mtcars数据
str(mtcars) #结构 变量几个
table(mpg) #每个数字有几个 有几个数值
#数据编辑
data.entry(mtcars)
#或者 edit(mtcars)
#数据内处理
attach(mtcars)
mpg
#数值数据 基础画图
barplot(table(mpg)) #频数直方图
barplot(mpg) ##所有数值的没有横坐标
stem(mpg) #茎叶图 两位数字 并且量少可用 一般不用
hist(mpg)# 直方图
boxplot(mpg) #
####二元关系
#1.散点图
plot(cyl,mpg)
#2.拟合线性关系
z <- lm(cyl ~ mpg)
#3. 相关系数(或R2)考查回归拟合好坏的程度
cor(cyl,mpg)^2 #得到R2为0.72618, 表明数据变化的72.6%可以用汽缸数(cyl)与每加仑的英里数(mpg)来刻划
#4. 残差分析::从残差分析我们可以得出汽车的汽缸数与每加仑的里程数可以用线性回归来刻划
lm.res <- lm(cyl ~ mpg)
lm.resids <- resid(lm.res) # 提取残差向量
plot(lm.resids) # 考查残差的散点图
hist(lm.resids) # 考查残差的直方图: 钟型?
qqnorm(lm.resids) # 残差的QQ图是否落在直线上?
detach(mtcars) # 从内存中清除数据集mtcars
q( ) # 退出R
### 数据框建立
x<-c(1,2,3,4) #x<-c(rep("asd",3))
row.names() #行名
names() #列名
#3数据保存
##save()函数保存为.Rdata文件 函数write.csv()保存为一个.csv文件
##1.数据 保存为简单文本
##write.table(d, file = "c:/data/foo.txt", row.names = F, quote = F) # 空格分隔
##write.table(d, file = "c:/data/foo.txt", row.names = F, quote = F, sep="\t") # tab 分隔的文件
##2.保存为逗号分割文本
write.csv(d, file = "c:/data/foo.csv", row.names = F, quote = F)
##2. 保存为R格式文件
save(d, file = "c:/data/foo.Rdata")
##win.metafile()、png() , jpeg() , tiff() , xfig() , postscript() pdf() pdf("filename")
#4.基本数据管理
1.添加列 merge(a,b,by="") cbind(a,b)
2. 添加行 rbind(x,y)
3. 选择变量组成新的数组或者frame x<-as.data.frame x1<-paste(c[,1:5]) new<-x[x1]
4.剔除变量 x1<-names(x) %in% c("a","b") new<-x[!x1]
5.选入观测值x1<-x[which(gender=="M" & age>30),]
6.选择观察值 subset(x,gender=="M" & age>30,select=gender:q4)
7.随机数 sample()