R语言R语言学习笔记与基本应用

R入门笔记-R数据集创建

2018-10-29  本文已影响17人  画长空_yin

创建向量

a<-c(1,2,3,4)
rep(2:5,2) #创建重复向量
a[3]#向量中第三个数据
a[a>3]#向量中满足大于3的要素
a[c(1,2,4)]#向量中第一个第二个和第四个要素
a[2:3] #向量中2到3的数据
a[-1]#去掉第一个值
a[-1:-3]#去掉前三个值

创建矩阵

x<-matrix(1:12,3,4)#默认按照列来进行排
x1<-matrix(1:12,3,4,byrow=T) #按照行来进行排
x2<-diag(3) #生成3阶单位矩阵

矩阵子元素的提取

x[2,2] #取第二行第二列的某个数
x[2,]#取遍第二行的数
x[,2]#取第二列数
x[c(1:2),c(2:3)]#取1到2行,2到3列的数据
x[2,c(1:3)]#取第二行,1到3列的数据

数据框的创建

col1<-c(1:4)
col2<-c('a','b','c','d')
col3<-c('famale','famale','male','male')
mydata<-data.frame(col1,col2,col3) #col1,col2,col3自动成为字段名称
name1<-colnames(mydata) #得到每列的字段名称
mydata[1:2]#取出1列和2列的全部要素
mydata$col1 #$取出col1的全部要素

列表数据list

R数据类型中最为复杂的一种数据结构,可以包含任何对象的组会,通过list()来创建,mylist <- list(object1, object2, …)

g <- "My First List" 
h <- c(25, 26, 18, 39) 
j <- matrix(1:10, nrow = 5) 
k <- c("one", "two", "three") 
mylist <- list(title= g, ages = h, j, k)
mylist

因子factor

概念:是一种向量对象,它给自己的组件指定了一个离散的分类(分组),它的组件由其他等长的向量组成。

province <- c("四川", "湖南", "江苏", "四川", "四川", "四川", "湖南", "江苏", "湖南", "江苏")
pf <- factor(province) 

数据的存储

保存为txt
write.table(mydata,file="d:/lucc area/mydata.txt",row.names = F,quote=F)
#  row.names = F :不写入行名,quote = F :变量名不用双引号。
#保存为csv格式的
write.csv(mydata,file ='d:/lucc area/mydata.csv' )
上一篇 下一篇

猜你喜欢

热点阅读