疾病纯生信分析套路 基于表达谱研究疾病七大思路汇总

2020-09-24  本文已影响0人  概普生信

昨天我们推广的疾病的分析思路,火爆网络,索性今天再来一个返场小段,供大家消遣一下。

因为大部分的疾病不致死,或者说预后部分的信息收集并不全面,所以在做生信分析的时候跟肿瘤相比,就缺了最重要的一步预后效果验证如何。

我们之前说过肿瘤筛选marker有三大步骤,差异,降维,预后。

但是对于疾病来说没有了预后,文章思路就不完整了。

小编今天通过对AD研究的几篇文章来简单介绍下如果没有预后,我们如何研究,如何分析。

1、核心基因+多因子(6+)

2、WGCNA+多样本验证(3+)

3、WGCNA+多因子(1.9)

4、Network&pathway(2.4)

5、CeRNA思路:多套数据整合(3.6)

6、基因诊断模型+WB验证(2.8)

7、lncRNA诊断模型+SVM(8.9)

一、核心基因+多因子

Identification of molecular signatures and pathways to identify novel therapeutic targets in Alzheimer's disease: Insights from a systems biomedicine perspective

(Genomics IF: 6+)

核心基因是公号去年推广的一个免费视频,简单说来就是GEO数据筛选差异,通过网络降维,然后TCGA预后验证。但是如果对于疾病没有了预后,通常我们会增加TF、miRNA、Drug等因子的研究,筛序到核心的基因,再拓展下相关的因子、药物等等。

二、WGCNA+多样本表达验证

Identification of KIAA0513 and Other Hub Genes Associated With Alzheimer Disease Using Weighted Gene Coexpression Network Analysis

(Froniter in genetics IF: 3+)

这篇文章研究的是颞叶皮层AD样本的WGCNA分析,筛选到核心模块和基因之后,还是缺点东西,所以作者选择了去用其他的组织样本进行表达验证,甚至用了老鼠的样本。

同时,作者深知分析内容不够,生信来凑的实际情况,于是这篇文章的图,超级精美。

看到这有小伙伴就说了,难道不能WGCNA筛选降维之后,看看多因子么,当然可以。

三、WGCNA+多因子

Screening and Identification of Potential Peripheral Blood Biomarkers for Alzheimer’s Disease Based on Bioinformatics Analysis

(medical science monitor IF: 1.9+)

还记得小编说过的吧,要保证思路、分析、数据至少有一个不一样。

这篇文章也是WGCNA,虽然后面成了多因子,但是呢如果样本也都一样,还是有作弊的嫌疑。

但是呢,作者很厉害,选择的是PBMC的数据。

分析内容为筛选差异,WGCNA筛选核心基因和模块,富集分析,然后针对核心基因找多因子分析。

同样,图很漂亮。

说到疾病,不能忘记下面这个疾病研究的经典思路。

四、Network&pathway

Integrated identification of key genes and pathways in Alzheimer’s disease via comprehensive bioinformatical analyses

(hereditas IF: 2.4)

这个是什么意思呢,就是筛选差异,做完降维之后,更多的放在富集分析上,多做些富集分析的内容,不往后走了。

五、CeRNA思路:多套数据整合

Systematic Characterization of Circular RNA-Associated CeRNA Network Identified Novel circRNABiomarkers in Alzheimer’s Disease

(Frontiers in Bioengineering and Biotechnology IF: 3.6)

这个不多说,跟多因子的思路差不多,不过由于ceRNA研究涉及到lcnRNA就得验证,所以人家作者挑战了高难度选择了circRNA,这样不验证的理由可以是数据少喽,轻松过关。

换句话说,做这个思路不管是数据多少,其实就是辛苦活了,堆了很多的数据。

The data analyzed in this study were obtained from the GSE5281, GSE1297, GSE12685 GSE16759。

六、基因诊断模型+WB验证

Identification of Blood Biomarkers for Alzheimer’s Disease Through Computational Prediction and Experimental Validation

(Frontiers in Neurology IF: 2.8)

寻找marker ,降维,有分析意向(http://gaptechsxr.mikecrm.com/1vdMmqy)生信人WX公众号构建模型来做诊断模型,这个很经典,但是很难找到合适的数据验证的时候,就得需要通过实验来验证了,这个思路也很不错。

有小伙伴问了,如果诊断数据不够,我又想做诊断模型,应该怎么做。

我建议你提高难度系数,做lncRNA的诊断模型,同时构建诊断模型的时候选择一些高级的模型构建方法,比如这一篇。

七、lncRNA诊断模型+SVM

Analysis of long noncoding RNAs highlights region-specific altered expression patterns and diagnostic roles in Alzheimer’s disease

( briefings in bioinformatics IF:8.9)

通过整合芯片的原始数据,构建lncRNA的表达谱数据,然后筛选差异的lncRNA,构建基于lncRNA的诊断模型。差异的lncRNA+SVM,效果确实好啊。

上一篇下一篇

猜你喜欢

热点阅读