生信基础知识

B站R语言视频笔记

2019-03-30  本文已影响9人  大吉岭猹

1. 介绍

1.1. 初学者运行代码

1.2. R studio界面

1.3. 重要函数

2. 变量

2.1. 变量类型

2.2. 创建变量

2.2.1. 向量

2.2.2. 矩阵

2.2.3. 数据框

2.2.4. 列表

2.3. 变量操作

3. 数据和导出

a = read.table('', head = T, sep = '\t')
b = read.table('', comment.char = '!', head = T, sep = '\t')  # 带感叹号的不读取
write.csv(b,'.csv')
d = read.csv('.csv')

read.table('', head = T, sep = '\t')
save(b,file = 'b_input.Rdata')
load(file = 'b_input.Rdata')
b = b[,-1]  # 取第一行
b = log2(b)
pheatmap::pheatmap(b[1:10,])

4. 中级变量操作

5. 热图

rm(list = ls())   #魔幻操作,一键清空
library(pheatmap)
a1 = rnorm(100)
dim(a1) = c(5,20)
pheatmap(a1)
a2 = rnow(100)+2
dim(a2) = c(5,20)
library(pheatmap)
pheatmap(a1, cluster_rows = F, cluster_cols = F)
pheatmap(cbind(a1,a2))
pheatmap(cbind(a1,a2), show_rownames = F, show_colnames = F)

6. 绘图

7. ID转换

strsplit('','[.]') #根据点号分割,注意中括号
duplicated() #去重

8. 任意基因任意癌症表达量分组的生存分析

library(ggstatsplot)
ggbetweenstats(data = dat, x = Group, y = Expression)

9. 任意基因任意癌症表达量和临床性状关联

10. 表达矩阵样本的相关性

    > cor(1:10,1:10)
    [1] 1
    > a = rnorm(10)
    > b = rnorm(10)
    > cor(a,b)
    [1] -0.1555608
    > a = rnorm(10)
    > b = 10*a+rnorm(10)
    > cor(a,b)
    [1] 0.9971822

11. 芯片表达矩阵下游分析

12. RNA-seq表达矩阵差异分析

13. 字符串操作

stringr包:vignette("stringr")查看说明书

13.1. 正则表达式

最后,向大家隆重推荐生信技能树的一系列干货!

  1. 生信技能树全球公益巡讲:https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g
  2. B站公益74小时生信工程师教学视频合辑https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw
  3. 招学徒https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw
上一篇 下一篇

猜你喜欢

热点阅读