转录组数据分析RNASEQmolecular biology

转录组数据挖掘方法原理

2020-07-09  本文已影响0人  嗒嘀嗒嗒嘀嗒嘀嘀

基因课FTP地址:ftp://http://gsx.genek.tv/2020-3-10%E7%9B%B4%E6%92%AD%E4%B8%80%E4%B8%AA%E5%AE%8C%E6%95%B4%E7%9A%84%E8%BD%AC%E5%BD%95%E7%BB%84%E9%A1%B9%E7%9B%AE/
听张旭东老师的课

发展情形

简单的分析流程

测序数据(上百G) --标准分析(需要服务器)→ 表达矩阵(几M) --数据挖掘(PC/R语言)→ 统计图表(几M)

表达数据挖掘

① 表达矩阵:每行一个gene,每列一个样本sample(可以在GEO数据库下载)

g/S Sample1 Sample2 Sample3
gene1 38 55 76
gene2 127 41 86
gene3 46 29 34
... ... ... ...

② 样本信息表:每行一个样本,每列一个表型特征(临床信息、表型特征、生化指标等)

S/Phenotype Group Weight Age Stage
Sample1 Cancer 20 10 I
Sample2 Cancer 34 39 III
Sample3 Normal 64 49 IV
Sample4 Normal 44 34 I
... ... ... ... ...

③基因信息表:每行一个基因,每列一个信息

g/Information Symbol Function
gene1 KCNA3 xxx
gene2 NCON3 Xxx
gene3 DDB1 xXx
... ... ...

分析方法

寻找关键基因和关键样本

功能分析

表达验证

功能验证

分子机制

TCGA等多组学关联分析

上一篇 下一篇

猜你喜欢

热点阅读