生物信息生信学习泛癌研究(Pan-cancer)

100篇泛癌研究文献解读之lincRNA的生存分析情况

2019-05-10  本文已影响70人  因地制宜的生信达人

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
本研究发表在:EBioMedicine. 2016 May; 题目是:Pan-Cancer Analyses Reveal Long Intergenic Non-Coding RNAs Relevant to Tumor Diagnosis, Subtyping and Prognosis. 研究人员下载了12种癌症的共1200病人的RNA-seq的测序数据的bam文件,然后走自己的流程针对lincRNA进行定量。

文献解读属于100篇泛癌研究文献系列,首发于:http://www.bio-info-trainee.com/4132.html

分癌症进行差异分析

这里研究者选取最常见的DEseq2这个R包,如下:

image-20190502001223350

具有组织表达特异性的lincRNA在癌症里面差异被弱化

首先可以看到不同组织的lincRNA表达差异足够把它们区分开来:

image-20190502001318570

然后可以看到,同样的lincRNA对肿瘤进行PCA的时候,区分程度就没有那么好了:

image-20190502001354709

根据JS值也可以看到lincRNA具有组织表达特异性,相当于蛋白编码基因来说,效应非常明显。

image-20190502001501812

不同分类的异质性比较

与lincRNA类似,其它数据也可以来进行肿瘤内部区分亚型,但是它们的分类效果是具有一致性的,可以用卡方检验,如下:

image-20190502001758593

与PAM50的比较

可以看到,针对lincRNA表达矩阵对TCGA计划的BRCA进行分类,与PAM50的重合度非常高!

image-20190502001831851

在使用癌症表现一致的lncRNA

如下图:

image-20190507214919502

这6个lincRNA在不同癌症的上下调表现一致。其中3个序列是高度同源。

然后也使用了GEO数据库验证这6个lincRNA在不同癌症的表现。

后记

从流程图来看,本研究并不复杂,也很容易复现出来,后面我们会在GitHub公布数据复现的代码。

本文献解读属于100篇泛癌研究文献系列,首发于:http://www.bio-info-trainee.com/4132.html

上一篇下一篇

猜你喜欢

热点阅读