TCGA数据分析

TANRIC:肿瘤相关lncRNA数据库

2019-08-26  本文已影响1人  生信修炼手册

欢迎关注”生信修炼手册”!

TANRIC整合了来自TCGA, CCLE等大型肿瘤研究项目的数据,对多种肿瘤的lncRNA表达量进行分析,差异分析,并对lncRNA与临床信息,基因组等数据进行相关性分析,文章发表在Cancer Research上,链接如下

http://cancerres.aacrjournals.org/content/75/18/3728

网址如下

https://ibl.mdanderson.org/tanric/_design/basic/main.html

数据库构建的pipeline示意如下

  1. 以Gencode数据库中的lncRNA为标准进行分析,在分析前,过滤掉了其中与蛋白编码基因的exon有重叠的lncRNA

  2. 下载TCGA,CCLE等项目的RNA_seq数据,对肿瘤中的lncRNA进行定量,采用的是RPKM的定量方式,筛选表达量在所有样本中平均值大于0.3的lncRNA进行后续差异分析

  3. 从TCGA中下载样本对应的临床信息,基因组和蛋白组数据,分析lncRNA和这些数据之间的相关性,采用的是斯皮尔曼相关系数,以相关系数0.6作为阈值

网站分为了以下6个模块

1. Summary

这部分可以查看每种肿瘤的数据来源,样本个数等信息,示意如下

点击Show按钮,可以查看详细信息,示意如下

2.  Visualization

这部分查看每个肿瘤中lncRNA表达量的聚类结果,以热图的形式呈现,示意如下

3. Download

这部分用于下载数据,示意如下

4. Analysis

其他3个模块结果是类似的,都是用于查看lncRNA分析的结果,分成了如下所示的3种分析

结果展示示意如下

对于肿瘤中的lncRNA研究而言,该数据库非常值得参考。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

上一篇下一篇

猜你喜欢

热点阅读