如何利用网络图给自己转录组数据的文章添彩
自己只做了几个样本的RNAseq测序或芯片,发愁文章里没有什么绚丽的图片可放?别着急,我们可以把差异分析的基因拿来做基因共表达网络分析,通过绘制网络图来给自己的文章增加一点色彩。
废话不多说,直接进入正题。
一、 准备差异基因表达文件:diff_gene_exp.txt
差异基因计算见前期教程:
一行命令完成RNAseq差异分析+画图

如果差异基因特别多的话,可以设置更严格的条件来过滤一下,如选FC 2倍以上且FDR<0.01的基因。
二、代码准备及运行
1、复制下面代码另存为co-exp.R,这一次不需要安装额外的R包。
#读取文件
data <- read.csv("diff_gene_exp.txt",header = TRUE,row.names=1, sep ="\t")
ngene <- nrow(data)
#生成空的结果矩阵
rMatrix <- matrix(ncol=4, nrow=((ngene*(ngene-1))/2))
##计算基因表达的相关性
n <-0
for(i in 1:(ngene-1)) {
for (j in (i+1):ngene) {
n<- n+1
gene1 <- data[i,]
gene2 <- data[j,]
rMatrix[n, 1] <- rownames(data)[i]
rMatrix[n, 2] <- rownames(data)[j]
rMatrix[n, 3] <- cor.test(as.numeric(gene1), as.numeric(gene2),method = "pearson")$estimate
rMatrix[n, 4] <- cor.test(as.numeric(gene1), as.numeric(gene2),method = "pearson")$p.value
}
}
colnames(rMatrix) = c("gene1", "gene2", "correlation","pvalue")
write.table(rMatrix,file = "diff_gene_cor.xls",sep = "\t",row.names = F)
大概解析一下代码的步骤:
① 读取文件
② 生成空的结果矩阵
③ 利用循环计算基因表达的相关性
④ 生成结果文件
2、代码运行
方法一:RStudio直接运行整个co-exp.R文件夹
方法二:打开DOS运行窗口或者linux服务器窗口,运行命令:
Rscript co-exp.R
三、生成结果文件diff_gene_cor.xls

第3列是相关性系数,第四列是相关性P值。
四、根据相关性系数和p值筛选基因对进行后面的绘图
这个看具体的情况,如果相关性都特别高则把阈值设的高一点,如果相关性都比较低可以把阈值设置的低一点。我这里把过滤的文件改名为diff_gene_cor_filter.txt,格式跟上面一样。
五、cytoscape绘图
1、导入diff_gene_cor_filter.txt文件
File 一> import 一> network from file
点击:OK
2、导入原来的差异分析N_vs_T_edgeR_different.csv用来根据FC或pvalue设置颜色
导入
3、删除些零碎或不想展示的点,为了最后展示图更美观。
Shift+鼠标选中 一> Edit一>Cut
4、设置node (包括颜色、形状、字体大小等),自己可以设置不同的值看看效果。
注意左下角选node
颜色设置示例:这里选中logFC来设置颜色,也可以选择其他的如FDR值。
Style 一> Fill Color 一> Column
4、计算Degree,最后点OK就行。

然后根据Degree设置圈的大小
5、设置线条Edge。
注意左下角选Edge,这里的线条粗细用相关性pvalue来展示,pvalue越小线越粗。
6、最后导出图片

最终效果图:
注:红色上调基因,绿色是下调基因。
到这里分析就结束了,如果您还想了解更多关于cytoscape绘图的细节,建议直接到cytoscape官网上学习相关的教程,操作的时候每个选项都点一点看看有什么变化。
cytoscape官网教程地址:https://github.com/cytoscape/cytoscape-tutorials/wiki
欢迎关注简生信!