转录组数据分析差异表达分析Different expression analysismy RNA-seq

得到差异表达基因后怎么做

2019-02-07  本文已影响166人  Y大宽

不管芯片数据还是测序数据,得到的差异表达基因DEGs都是独立的基因,如果直接对这些基因分析叫单基因分析,这种分析会有很多弊端,比如:

所以要对这些DEGs进行整合分析,这也是下游分析的关键,也就是要发现这些DEGs所揭示的生物学意义。

1聚类分析

就是把表达模式相似的基因集合到一起,然后以基因集的形式进行合并分析。通俗来说,就是把一整个相对散乱的差异基因根据表达模式相似性,划分为不同的集合,也就是后续对这些集合进行分析。通常的聚类方法有K均值算法,层次聚类,自组织映射等。

2富集分析

富集分析需要有先验知识,那就是对已知的基因有功能注释,然后对目标基因进行功能富集。因为已经有对每个基因的功能注释,所以这种富集结果比较可靠,也有利于揭示生物学问题。
对基因功能注释比较常用的数据库是GO和KEGG,这基本已经成为基因注释和富集分析的标配和必需。富集分析也有两种,一种是Fisher精确检验;一种是GSEA分析,GSEA可以自己定义适合自己的基因集

注意:GSEA分析RNA-seq数据时,要对基因表达量进行标准化处理。

3共表达网络(WGCNA)

4RNA-seq数据还可以进行可变剪切,基因融合等分析

上一篇下一篇

猜你喜欢

热点阅读