学习小组Day6笔记—白兔儿溜溜
2020-05-23 本文已影响0人
白兔儿溜溜
R语言中包的相关操作
以dplyr包为例。
1.便捷配置Rstudio的下载镜像
运用R的配置文件 .Rprofile
第一步
运用file.edit编辑.Rprofile
file.edit('~/.Rprofile')
第二步
设置镜像
# options函数就是设置R运行过程中的一些选项设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
# 当然可以换成其他地区的镜像
第三步
check
options()$repos
options()$BioC_mirror
2.安装包
安装命令
R包安装命令是:install.packages("包")
或者BiocManager::install("包")
取决于要安装的包存在于CRAN网站还是Biocductor?可以问谷歌。
加载包
以下两种方式均可
library(包)
require(包)
下面开始test
install.packages("dplyr")
library(dplyr)
3.dplyr五个基础函数
测试数据使用,使用内置数据集iris的简化版
打破砂锅Iris数据集概况
Iris Data Set(鸢尾属植物数据集)首次出现在著名的英国统计学家和生物学家Ronald Fisher 1936年的论文《The use of multiple measurements in taxonomic problems》中,被用来介绍线性判别式分析。在这个数据集中,包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。每类收集了50个样本,因此这个数据集一共包含了150个样本的4个特征,分别是:
扁竹根,西南地区最常见的鸢尾科植物
sepal length(花萼长度cm);
sepal width(花萼宽度cm);
petal length(花瓣长度cm);
petal width(花瓣宽度cm)。
test <- iris[c(1:2,51:52,101:102),]