生信星球培训第八期

学习小组Day5笔记--天天

2018-10-26  本文已影响27人  炽天使爱学习

R语言学习第二天

日常吐槽

?read.table查看帮助
read.table是要查看的代码

这玩意和jupyter notebook的帮助是类似的啊。。
看了英文才知道R语言的表格和pandas库里面的DataFrame是一个。好嘛,我又孤陋寡闻了。。

向量

一个数字or字符串组成的变量叫做标量

1
"hello"

多个数字or字符串有序排列组成的变量叫做向量
数字or字符串又名元素

c(1,2,3)
c("A","B","C")

1.变量要赋值

RSTDIO里面用alt+-即可快速输入那个坑爹的<-。

看变量这个我看图真的没有找到到底在哪里。。
我按照箭头点的时候发现是打开(小小的吐槽一下,这个图片上的字实在是太小了。)
但是没关系先搜为敬,后来发现我这个本来就有,因为只有值忘记给变量了,所以。就没了

2.从向量中提取元素(根据元素位置或者值大小来选取)
说实话这一部分让我想到了python的列表或者元组。很多类似的代码啊~

  1. 根据元素位置
x[4] 获取向量x的第四个元素
x[-4] 获取向量除了第四个之外的元素 #这一点和python有很大不同诶,这个还是需要好好记下来
x[2:4] 获取向量第二个到第四个元素 #此处尝试着去写了一下x[:4],python里面是从最开始到第四个值,但是这里面却报错了,看来这个也要注意
x[-(2:4)]这个就比较好理解了,排除2到4的数据外的数据
x[c(1,5)] 输出第一个和第五个元素

2.根据元素值大小

x[x==10] 这个是x等于10的元素
x[x<0] x小于0
x[x %in% c(1,2,3,10,20,50)] 

这个就比较牛逼了是在向量c里面的元素,这里面有个高级玩意 %in%,如果给%去掉的话,就会报错。看来是个高级玩意

数据框

1.读取本地数据

a < - read.table(file = "huahua.txt",sep = "\t",header=T)

把数据框赋值给a,期中数据框要读取文件,sep代表分隔符,\t代表tab分隔,header = T 是True的缩写
在此处我发现,尼玛居然报错了,我很是不解,后来敲了getwd(),发现又变C盘了。。
宝宝心里苦
从新敲下setwd()
我要查一下到底怎么永久性改变工作目录
2.设置行名和列名

x<-read.csv('doudou.txt') #新命令读取CSV文件
colnames(x) #读取列名
rownames(x) #读取行名,默认值是行号1234
colnames(X)[1]<-"bioplanet" #给列名第一个变为“bioplanet”
同理也可以给rownames变更名字
简单方法
X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1) #让第一列作为行名

最后一行代码让我很不理解,大写的X变量和小写的x变量来进行比较,神奇的发现第一行居然特么的没了,然后发现行号整个变化了

3.数据框的导出

write.table(变量名,file = "想保存的名",sep = ",",quote=F

sep=',' 分隔符用逗号
quote=F 代表字符串不用双引号,如果T则带,默认为T

4.变量的保存与从新加载
保存所有变量

save.image(file="aaa.RData")
 .RData是保存的变量格式

保存单个变量

save(变量名,file="aaa.RData"

再次加载的命令

load("aaa.RData")

5.提取元素
数据框里面的元素和向量里面的元素不同,是个二维的。(我敲的代码都改成了小写x哈哈哈,懒得设置变量名)

x[行,列]
x[行,]
x[,列] 横着写
x[列] 竖着写,这个比较正常
x[列a:列b] 第a列到第b列
x[c(a,b)] 第a列和第b列
X$列名,只能提取一列
行的话,我试了一下,在那个后面加逗号就可以了了

哈哈哈,第五天的学习也结束了see u

上一篇 下一篇

猜你喜欢

热点阅读