生信星球小组课day5笔记-老白
一、R语言的几个趣知识
- R的代码都是带括号滴,英文括号。里面都是一些参数设定。
- 数字或者字符串这些元素,可以组成向量。那么向量应该是属性一致的吧,比如都是由数字组成。应该不会有那种同时含有数字和字符串的向量。
- 要叫数据框(data frame),不是表格或者列表之类的俗气名字,虽然事实就是。
- 大小写是区分的。
- 最重要的两种数据类型:向量和数据框
二、向量
- 标量是一个元组组成,向量是多个元素组成,必须有序排列。
x<-c(1,3,5)产生有三个数字的数字型向量
y<-c(1:5)和y<-1:5效果一样,产生含有5个数字的数字型向量
z<-c("dawa","erwa","sanwa")产生字符型向量
还有高级些的赋值方式:
w<seq(1,10,by=0.5)产生1到10之间,间隔0.5的数字串的向量
t<-rep(1:3,times=2)产生1,2,3重复两遍,含有6个数字串的向量,即:1,2,3,1,2,3
r<-rep(c(1,3,5),times=3)产生重复1,3,5三遍,含有9个数字串的向量。即:1,3,5,1,3,5,1,3,5
- 从向量中提取元素
方法一,按照位置
t[4]就是向量t里第四个数:1
t[-4]就是向量t里,除了第四个之外的所有的数:1,2,3,2,3
t[2:4]就是向量t里,第二到第四个数:2,3,1,2
t[-(2:4)]就是向量t里,除了第二到第四个数之外的所有的数:1,3
t[c(2,4)]就是向量t里,第二和第四个数:2,1
方法二,按照数值条件
r[r==3]就是向量r里所有数值为3的数字
r[r<4]就是向量r里所有小于4的数字
r[r%in% c(1,2,5)]向量r里是1,2,5的数。显示为1,5,1,5,1,5
三、数据框
- 建立数据框read.csv()函数
在左上角象限中找到一个绿色加号,点开选择"Text file",即可新建一个文件.在左上角象限中输入:
X1,X2
A,1
B,
C,
D,3
E
之后从Flie选项卡中选择save as,命名为doudou.txt
在左下象限中输入X<-read.csv('doudou.txt')
,这里面的上撇符号是键盘上的"符号。一开始弄错了,怎么都不成功。
通过上面命令得到一个数据框X。
X.png
如果输入的时候不用逗号分隔,换成用空格来分隔。比如huahua.txt这样。
X1 X2
A 1
B
C
D 3
E
Y<-read.csv("huahua.txt")
结果会有不一样。
![](https://img.haomeiwen.com/i27995477/7c326f485990121b.png)
> Y<-read.csv("huahua.txt",sep = " ",header =T)
里面文件名可以双引号,也可以单引号啊。sep表示分隔符号是空格。header表示列名是有的T就是Ture。2.查看数据框
colnames(X) 显示X这个数据框的列名:X1,X2
rownames(X)显示其行名:就显示默认的1,2,3,4...
colnames(X)[1]<-"bioplanet"是给列名改名用的。把列名的第一个改成bioplanet
- 数据框导出
write.table(X,"yu.txt") ,打开这个名叫yu.txt的文件看看,有点儿怪。
导出.png
write.table(X,"lajiao.txt",sep=",",quote=F)
命令之后文件长这样。sep为指定的间隔符号为逗号,默认是空格哦。quote为False,就是不以字符串形式,不用引号。但还是挺奇怪,第一行第一列的位置应该是空格啊。多了1,2,3,4,5那一列数字序列。
lajiao.png
write.table(X,'jiang.txt',quote=F,row.names=F)
加了一个参数row.names为False,就是不用rowname的意思。这会就正常了。
![](https://img.haomeiwen.com/i27995477/311f2dd2bf8157d6.png)
- 从数据框中提取元素
X[3,1]X数据框中,第三行第一列的数据
X[3,]第三行的全部数据
X[,1]第一列的全部数据
X[2:4]第二到第四列的全部数据
X[c(2,4)]第二和第四列的全部数据
四、变量的保存和重新加载(调取)
save.image('bioplanetday5.RData')
命令,回把当前使用的这些变量都保存到这个RData文件中。
如果不用这个命令的话,直接点击右上角的×,关闭当前操作台的时候也会跳出一个对话框:Save workspace image to ~/test/.RData?点击yes后,自动存成.RData这样一个文件在工作目录下。
load('bioplanetday5.RData')
命令就可以重新加载这些变量。
五、直接使用数据框中的数据作图
输入Iris(这是一个内置的数据框)则显示了这具有150行,6列的数据框内容,用来玩耍。
用下面命令新建一个数据框Flower<-Iris
plot(Flower$Sepal.Length,Flower$Sepal.Width)
命令来做散点图。
六、脚本的使用
点击左上象限的绿色加号,选择R script,建立新脚本把上面命令粘贴或者敲到左上象限的脚本编辑区。并保存在工作目录下为*.R这样一个文件。大神们的代码都是保存在这样文件中的。
七、问题回答
save(x,file="test.RData")
这句代码如果报错object x not found
说明x这个变量应该是写错了。应该是大写的X。大小写在R语言中是不一样的。