2020.2.2 R语言|Practice2

2020-02-03  本文已影响0人  哈喽迷人鬼们

2020.2.2 R语言|Practice2

今日学习内容一览

一、Jimmy 生信技能树B站P7-P10(课上积累)

二、R语言初级练习题目三道代码过程

三、Markdown和R Markdown的学习网站收藏

  1. 根据R包org.Hs.eg.db找到下面ensembl 基因ID 对应的基因名(symbol)
    • 首先得到gene_id和ensemble_id的关系矩阵g2e以及gene_id和symbol的关系矩阵g2s.

      library(org.Hs.eg.db) install.packages("org.Hs.eg.db") library(org.Hs.eg.db) g2s=toTable(org.Hs.egSYMBOL) g2e=toTable(org.Hs.egENSEMBL)

      g2e.png
g2s.png
`b=merge(a,g2e,by='ensembl_id',all.x=T)
 d=merge(b,g2s,by='gene_id',all.x=T)
 d=d[order(d$V1,)]
 d=d[match(a$ensembl_id,d$ensembl_id)]
 head(match(a$ensembl_id,d$ensembl_id,))
 d=d[match(a$ensembl_id,d$ensembl_id),]
 write.csv('d,gene find.csv')`
  1. 根据R包hgu133a.db找到下面探针对应的基因名(symbol)
    • 首先使用read.table函数读取样本文件

      rm(list=ls()) options(stringsAsFactors = F) a=read.table('基因ID转换.txt')

    • 其次使用hgu133plus2.db这个R包导出probe_id与symbol的对应矩阵,最终使用merge函数合并原样本矩阵和对应矩阵共有的probe_id即可

      library(hgu133plus2.db) ids=toTable(hgu133plus2SYMBOL) colnames(ids) colnames(a)='probe_id' d=merge(a,ids,by='probe_id')

      d.png
  1. 找到R包CLL内置的数据集的表达矩阵里面的TP53基因的表达量,并且绘制在 progres.-stable分组的boxplot图
    • 读取内置数据库CLL并查看矩阵,同时使用pData查看其分组信息

      rm(list=ls()) library(CLL) data(sCLLex) expr <- exprs(sCLLex) pdata <- pData(sCLLex) head(expr)

1974.png 31618.png
  1. Markdown基本语法
  2. 进阶版Markdown的使用
  3. R Markdown
上一篇 下一篇

猜你喜欢

热点阅读