bulk RNA-Seq （6）数据挖掘的准备

2022-07-03 本文已影响0人 Bioinfor生信云

欢迎关注Bioinfor 生信云微信公众号！

我们做完了上游的基础分析之后，接下来就是数据挖掘了。我们先准备数据挖掘的三张表。

每一行是一个基因，每一列是一个样本，需要对数据进行标准化。
标准化之前的read count 矩阵，用于差异表达分析
标准化之后的TPM/FPKM 矩阵，用于其他分析（PCA分析、聚类分析等等）

每一行是一个样本，每一列是一个表型特征（光照、地上生物量、茎长等等），可以和基因进行关联分析

每一行是一个基因，每一列是该基因的信息（symbol、KO、GO），基因的信息可以通过eggnog-mapper在线网站注释得到。