生信星球培训第四十一期

学习小组day5笔记--思亮

2020-03-06  本文已影响0人  思亮笔记

学习目标:数据结构

1. 向量

2. 从向量中提取元素

数字代表索引

  1. x[4]取出索引为4的元素
  2. x[-4]取出索引4**以外的其他元素
  3. x[1:3]取出索引13的元素
  4. x[-(1:3)]取出索引1到3以外的其他元素
  5. x[c(1,5)]取出索引15的元素
    数字代表值
  6. x[x==10]取出值为10的元素
  7. x[x<0]
  8. x[x %in% c(1,2,5)] 取出存在于向量c(1,2,5)的元素

3. 数据框

  1. 读取本地文件
    read.table(file = huahua.txt,sep = "\t", header = T)读取文件,需设置file,sep和header参数。

read.table() function reads a file into data frame in table format. The file can be comma delimited or tab or any other delimiter specified by parameter "sep=". If the parameter "header=" is "TRUE", then the first row will be treated as the row names.(from Bing)

  1. 设置行名列名
dd = read.csv('doudou.txt') #dd读取为数据框
colnames(dd)  #查看列名
rownames(dd)  #查看行名
colnames(dd)[1] = 'bioplanet' 
#有的公司返回数据,左上角第一格为空,R会自动补为,可用该命令修改
  1. 数据框的导出
write.table(dd, file = "sl.txt", sep = "." ,quote = F)
# 分隔符改为逗号,字符串不加双引号(默认字符串加双引号)
  1. 变量的保存与重加载
# 这次没有处理完的文件留着下次继续处理的方法,格式为Rdata
save.image(file = "biosl.Rdata")  # 保存当前所有变量
save(dd, file = "test.Rdata") # 保存dd这一个变量
load("test.Rdata") #再次使用时进行加载
  1. 提取数据框中的元素
dd[,y] # 提取第y列
dd$colnames # 提取第y列
  1. 直接使用数据框中变量

备注

  1. seq(1,10,by = 2) 从1到10,每隔2取一个数。
  2. rep(1:3,times = 2) 把1,2,3重复2遍。
  3. 确保需要读取的数据放在工作目录下。
  4. R语言区分大小写字母。
  5. R语言中脚本文件的后缀为R,可用Rstudio直接打开。
  6. read_csv和read_table的区别在于separator分隔符。csv是逗号分隔值(Comma-Separated Values),仅能正确读入以 “,” 分割的数据。read_table的分隔符是tab。
上一篇下一篇

猜你喜欢

热点阅读