paper.1

2018-12-19  本文已影响0人  Mabel娜

想要多做几篇纤维肌痛的前期基础,就开始学习别人的文章思路啦

Integrating MicroRNA Expression Profiling Studies to Systematically Evaluate the Diagnostic Value of MicroRNAs in Pancreatic Cancer and Validate Their Prognostic Significance with the Cancer Genome Atlas Data

IF5.5,题目真的好长,而且作者来自四个附属,同期还有类似papers online


paper1.0

主要是学习文章思路啦

workflow

背景略去,直接攻向材料方法偶哟

1. search strategy and inclusion criteria

分别从CEO和AE挖掘涉及PaCa病人的miRNA表达数据,对照哦包括良性胰腺疾病或者健康人,不足20个样本的排除,最终从561个GEO,62AE中只剩10个转录组用于分析。

2. data extraction and procesing

数据预处理:分位数标准化(具体可以参考statquest-Josh Starmer)或对数转换,并根据平台注释信息,将ID转换为通用名,得到表达矩阵,并分组。用pROC package计算最佳阈值,构建2*2列联表,得到每个miRNA二的FP,FN,TP,TN(?自我感觉这是关键一步)

3. diagnostic value assessment for miRNA

基于双变量(线性)随机回归模型,计算敏感性,特异性,标准误,95%CI,诊断比值比,阳性/阴性似然比,并画出ROC曲线,计算AUC,95%CI。在9个转录组中均有的miRNA作为分析数据,并根据AUC排序,筛选出TOP50。
metaregression探究基于Higgin's I^2 (I^2>50%)以评估异质性。

4.validating the prognostic significance of miRNA with TCGA data

从TCGA提取PaCa病人的miRNA表达和临床数据,经过Log2转换后得到的表达高低分为三组,即为高中低表达组,比较三组的K-M生存曲线,应用多变量Cox回归模型以验证哪些miRNA是总生存率,风险比率的独立文献因子。

5. pathway analysis of miRNA

首先使用miRWalk2.0预测miRNA的靶向基因集(p<.01),而后提取TCGA中mRNA表达,并于miRNA的表达变化进行Pearson 相关分析(P<.05),选取负相关(因为2者是负向调控,这就涉及到2者的作用机制啦,可以趁机补课啦)。miRNA-mRNA对子扔进cytoscape构建调控网络,并对靶向基因进行GO,KEGG enrichment analysis。

6. statistical analysis

general package for meta-analysis package。

数据处理细节

  1. 筛选出的TOP50 miRNA用TCGA数据验证,发现在癌症表达升高或降低(可能过高/低表达,但是是癌症的原因还是结果,不明确,相关不代表因果),5个与生存相关(可能促进/抑制癌症进展);

2.选择很重哟啊,作者选择在癌症组织中过表达的9个miRNA,一并作为后续分析,不多不少;

3.配对mRNA,mRNA的方法可以是通过数据库,找出miRNA的靶向基因,再与表达变化负相关的mRNA取交集,就可以得到miRNA-mRNA pairs啦。

上一篇下一篇

猜你喜欢

热点阅读