基因表达与甲基化表达谱纯生信分析4分文章,你也可以
2019-03-21 本文已影响50人
医科研
作者:白介素2
好久没有写稿子了,今天分享一篇纯生信文章,发表在scientific reports上,虽说很多人吐槽SR为水刊,个人认为其实人家发表的很多文章还是很值得学习的,比较喜欢直接一点,我们看图说话哈。
看完摘要,大概就清楚了本文用了CGGA,TCGA两个数据库,挖掘挖掘再挖掘发现了一个重要的基因,为何重要?当然是跟预后,或者可能用于治疗靶点啦。接下来是Introduction,首先介绍下这种肿瘤的大概情况呀,治疗现状,总之就是形势很严峻,然后话锋一转,来了这么一句:It is noteworthy that although the prognosis of malignant glioma patients remains generally poor, individual variation of the patients’ survival times is remarkable,意思就是病人的生存时间个体差异很大,这里很关键,因为它告诉我们一个很重要的信息,不要只会Cancer Vs. Normal。
image.png
第一个表格,这个我们很常见啦,几乎所有联系临床信息的分析,都会提供这么一个表格,让大家知道下病人临床信息大概的情况。
image.png
接下来作者提供一个流程图讲解是如何筛选到DCTD这个基因的,注意到了吧,Cancer Vs. Normal小伙伴们out啦,这里用的是CGGA数据库中,生存时间小于1年与大于3年分组比较获得:低甲基化,高表达的基因,并且做生存分析,再用CGGA数据库中剩下的生存时间1-3年之间的生存分析,再用TCGA验证下,最终得到7个基因
image.png
然后列出7个基因的HR,P值这些信息,继续往下走。当然啦,猪脚DCTD同志肯定是在里面的,接下来主要就是关心它了。
image.png
既然找到了猪脚,肯定是要验证验证再验证啦,于是作者分别在CGGA芯片数据,RNA-seq数据,TCGA芯片数据,RNA-seq数据,GSE16011,REMBRANDT四个数据集中进行了6次分析,就是为了说明,DCTD同志真的很不错,表现很稳定。然后用CGGA,TCGA做了3年和5年ROC曲线,还比较了跟年龄,分级之间的AUC当然发现还是不错,至少干掉了年龄啦。
image.png
接下来继续挖掘,看看DCTD在四个数据集中,不同Grade中的表达情况,发现表现还是很稳定,只有GSE16011稍微有点瑕疵,不过总体还是很好。不过,我们还没完,作者继续深入挖掘。
image.png
因为有人发现这个IDH基因突变跟这种肿瘤密切相关(为啥想到它呢?你猜),作者就挖掘了下DCTD在IDH突变组(Mutant)跟野生组WT的表达,在TCGA,CGGA两套数据,当然啦DCTD同志表现依旧稳定呀,然后继续看下在几套数据不同分组中的突变组,和野生组的,还是很稳定呀!
image.png
接下来,作者还看了下DCTD同志的表达跟各种常见的突变,亚型,分级之间的关系,做了热图表示下。
image.png
然后我们肯定想看下DCTD同志与哪些生物学过程有关呀,于是作者用DCTD的高低表达分组,筛选差异基因(不是cancer 和Normal哦),然后就是我们的老朋友DAVID啦,做了GO分析,然后以热图的形式展示(当然是R语言绘制的啦),还是在两套数据做的,说到这,小编同学为作者的绘图点个赞,摩拜下。
文章到这里基本上结束了,个人认为这篇文章有很多可圈可点的地方,值得大家学习。首先,本文的差异分析就是基于一个新的角度,结合真实的临床观察从生存时间长短的个体差异来分组,然后经过层层筛选,验证验证再验证,另外值得一提的是文章中的Chinese Glioma Cooperative Group (CGCG)数据库http://www.cgga.org.cn/,是由我国发布的中国脑胶质瘤基因组图谱计划,值得点赞,目前很多基于基因表达的预测模型,肿瘤分型都是基于国外数据库,继而将结果推广到国内可能并不合适。内容分享就到这里,希望对你有帮助。