根据转录组和KEGG代谢基因计算通路活性

2023-12-06 本文已影响0人 pudding815

！！！计算方法是以前初师兄根本文献扒的，后续把文章doi附上
！！！KEGG基因list,利用R可以很快扒下来，我后面再更新，百度一下你就知道

准备好转录组表达矩阵，KEGG基因list

step1:构建代谢基因表达矩阵

library(dplyr)
#读入表达矩阵
tpm <- read.csv("tpm.csv")
#读入代谢基因list
all <- read.csv("allgenelist.csv")
#构建代谢基因list表达矩阵
all_tpm <- all %>% left_join(y=tpm,by="gene_name")

全部代谢基因表达矩阵.png

step2：标准化代谢基因表达矩阵并加权

###标准化，即按行求均值，
ave <- rowMeans(all_tpm)
all_tpm_ave <- all_tpm/ave
write.csv(allgene_tpm_ave,"allgene_tpm_ave.csv")
##输出后，用excel打开，在gene_name前加一列countif,统计该基因在代谢list中出现的次数，即权重
#psR里这一步我还没不知道怎么计数，excel简单些，后续在改

加权后表达矩阵.png

step3：通路活性计算

关注通路的位置在第2523:2540行.png

#读入上述加权后表达矩阵
data<- read.csv("allgene_tpm_ave.csv")
#根据初师兄的表选取通路的行号2523:2540行
Pantothenate_and_CoA_biosynthesis <- data[2523:2540,]
###计算score
pathway_step1 <- colSums(Pantothenate_and_CoA_biosynthesis[,4:227]/Pantothenate_and_CoA_biosynthesis$countif)
pathway_step2 <- colSums(Pantothenate_and_CoA_biosynthesis[4:227])
SCORE <- as.data.frame(t(pathway_step1/pathway_step2))
write.csv(SCORE,"SCORE.csv")

score结果.png

计算结果即每一个样品在选取通路下的score值，后续作图个性化分析了，把生物学重复求均值后，整理为下述形式，自行作图

1701914973388.png

image.png

根据转录组和KEGG代谢基因计算通路活性

step1:构建代谢基因表达矩阵

step2：标准化代谢基因表达矩阵并加权

step3：通路活性计算

猜你喜欢

热点阅读