(一)GEO分析相关R包下载和加载——DAY2
2020-01-21 本文已影响0人
养猪场小老板
背景知识
hgu133plus2.db
1.注释包的作用:基因芯片给出的分析结果都是针对芯片探针组的,每个探针组只有一个公司自己定义的ID,既没有序列信息,也不知道来自于该物种的哪条基因,因此需要在注释包的帮助下对芯片处理结果进行注释。
2.注释包的组成:构建一个完整的芯片注释信息通常需要三个包,它们有统一的命名方式,例如Affymetrix公司的人类基因组表达芯片hgu133plus2(型号),其对应的三个注释包是hgu133plus2.db、hgu133plus2cdf和hgu133plus2probe。实际使用时,主要用“.db”那个包。
代码如下
> options("repos"="https://mirrors.ustc.edu.cn/CRAN/")#设置镜像
> if(!require("BiocManager")) install.packages("BiocManager",update = F,ask = F)#意思是,如果没有安装BiocManager包,那就安装BiocManager。、.
> options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
> cran_packages <- c('tidyr',#包里的主要函数gather和spread数据长宽变,separate和union列的切割和合并
+ 'tibble',#高效的显示表格数据的结构
+ 'dplyr',#数据清理
+ 'stringr',#一个字符串处理工具集
+ 'ggplot2',#画图
+ 'ggpubr',#画图
+ 'factoextra',#主成分分析
+ 'FactoMineR') #主成分分析
> Biocductor_packages <- c('GEOquery',
+ 'hgu133plus2.db',
+ "KEGG.db",
+ "limma",
+ "impute",
+ "GSEABase",
+ "GSVA",
+ "clusterProfiler",
+ "org.Hs.eg.db",
+ "preprocessCore",
+ "hugene10sttranscriptcluster.db",
+ "enrichplot")
> for (pkg in cran_packages){
+ if (! require(pkg,character.only=T) ) {#它只接受字符串值,它可以接受一个字符串变量;但是第一种不能识别字符串变量。
+ install.packages(pkg,ask = F,update = F)
+ require(pkg,character.only=T)
+ }
+ }#以上是向量的形式安装包
###############################################
> for (pkg in Biocductor_packages){
+ if (! require(pkg,character.only=T) ) {
+ BiocManager::install(pkg,ask = F,update = F)
+ require(pkg,character.only=T)
+ }
+ }#cran和bioconductor安装包的形式不一样
##################################################
> #前面的所有提示和报错都先不要管。主要看这里
> for (pkg in c(Biocductor_packages,cran_packages)){
+ require(pkg,character.only=T)
+ }#对所有的包进行加载