走进转录组

bulk RNA-Seq (6)数据挖掘的准备

2022-07-03  本文已影响0人  Bioinfor生信云

欢迎关注Bioinfor 生信云 微信公众号!

我们做完了上游的基础分析之后,接下来就是数据挖掘了。我们先准备数据挖掘的三张表。

表达矩阵(gene_exp)

每一行是一个基因,每一列是一个样本,需要对数据进行标准化。
标准化之前的read count 矩阵,用于差异表达分析
标准化之后的TPM/FPKM 矩阵,用于其他分析(PCA分析、聚类分析等等)


样本信息表(sample_info)

每一行是一个样本,每一列是一个表型特征(光照、地上生物量、茎长等等),可以和基因进行关联分析


基因信息表(gene_info)

每一行是一个基因,每一列是该基因的信息(symbol、KO、GO),基因的信息可以通过eggnog-mapper在线网站注释得到。



准备好这三张表之后,我们就可以去画图啦,下期见。

上一篇 下一篇

猜你喜欢

热点阅读