我们到9分SCI需要跨越几个银河系?
小编最近看了一篇发表在THORAX上的文章,题目为“Gene correlationnetwork analysis to identify regulatoryfactors in idiopathic pulmonary fibrosis”,影响因子为9.655,四舍五入就是10呀!回头想想自己,四舍五入就是0呀!科研愁就是漫无边际的黑洞,我在这头,高分文章在那头,中间可能隔着无数跨越不过去的银河系......不过仔细看过这篇文章后,本小编突然斗志昂扬,感觉自己也可以发高分的SCI啦,仿佛自己家里有矿一样自信!
下面就让我们看看,这篇文章都干了啥,竟让小编可以如此自信~
这篇文章研究的并不是最热门的癌症,而是特发性肺纤维化(idiopathicpulmonary fibrosis,IPF),这是一种慢性、进行性、纤维化性间质性肺疾病,病变局限在肺脏,好发于中老年人群,IPF诊断后的平均生存期仅2.8年,死亡率高于大多数肿瘤,IPF被称为一种“类肿瘤疾病”。可以看出IPF虽不是癌症,但其死亡率较高,仍需要我们高度的重视。
数据均来源于GEO:GSE47460,GSE72967,GSE93606,GSE53845和GSE110147。
关于文章研究的整体工作体现在下方的流程图中,可以直观的了解到分析的方式主要集中于差异表达分析,加权基因共表达网络分析以及富集分析等。
差异表达分析
将GSE47460中IPF和对照组样本随机分成两个非重叠组,每个IPF组与两个对照组分别进行比较从而确定差异表达的基因,选取被重复识别的基因定义为差异表达基因,最终识别出6425个差异表达的基因,并且进行主成分分析,IPF和对照样本之间表现出良好的分离。
加权基因共表达网络分析
基于加权基因共表达网络分析(WGCNA),使用差异表达的基因来确定两个IPF组之间的共表达基因及模块,最终共识别出16个模块,并根据个基因的Fold Change值来确定模块的上调或下调,最终获得6个在IPF中上调的模块和10个在IPF中下调的模块。
同时识别IPF组中与肺功能相关的模块,发现diffusion capacity(DLCO)与8个模块相关,forced vital capacity(FCV)与5个模块相关。
生物功能和转录因子的富集分析
利用gProfileR测定模块生物功能,确定每个模块显著富集的GO和Reactome pathways,同时,还采用Cytoscape中iRegulon插件对每个模块的转录因子进行识别,并且采用GSE47460和GSE72967数据集识别与模块相关的miRNA,最终识别到16个模块中富含25个转录因子和21个miRNA。
生存分析
最后利用IPF患者诊断时外周血标本,结合RNA基因表达和生存数据(GSE93606),确定各模块的临床相关性,并且用多变量Cox的比例风险模型评估每个模块在预测存活中的影响,最终确定有4个模块与生存显著相关,其中关联性最大的模块的总体一致性可以达到0.777,矫正后p值为0.001。
总体看来,这样的思路并不是很复杂,但是工作扎实,内容详细,不过如果以这样的方法去研究常见的癌症,小编觉得应该还是很难发到这么高的点数的,所以有的时候换个角度,或许就可以拨开云雾见明月啦~