生信精读文献生信分析流程自然科学之文献阅读

如果导师丢给你一个基因让你去研究,不妨试一下这两个五分的套路(上

2019-02-28  本文已影响44人  vegene

很多研究都是集中在大样本的基因集中去筛选目标基因,这也是常规做数据挖掘的思路,但是做基础实验的人常常关注某个基因,那么只研究单个基因的时候,如果利用公共数据去开展自己的研究呢?这篇文章将为大家提供一个思路。

第一篇文章

标题:High Expression of CPT1A Predicts Adverse Outcomes: A Potential Therapeutic Target for Acute Myeloid Leukemia

发表于新贵杂志EBioMedicine,影响因子:6.182

这是一篇研究CPT1A 在急性髓性白血病中表达关系的文章,主要步骤如下:

1.本文首先观察了CPT1A基因在AML中的表达情况,从GEO数据库中找了几套不同类型的白血病样本和健康样本的芯片数据,从中提取出这个基因在各个样本中的表达,然后分析正常与疾病组的差异,发现CPT1A在白血病中显著高表达

2.既然CPT1A在白血病中表达上调,那么他是否与白血病患者的临床特征有关系呢?于是我们又从GEO上找了一套带有样本临床信息的表达谱数据,然后提取CPT1A的表达数据将样本按照CPT1A表达中位数进行高低表达分组,首先分析了一下CPT1A高表达组中年龄和低表达组年龄上是否有差异,发现存在明显的差异,高表达组患者明显更年轻,然后再看看其他临床信息,发现没啥可分析的了,于是灵机一动,可以看看高低两组样本中一些已经报道的白血病相关的基因标志物他们的表达水平是不是存在差异呢,通过文献检索找了一些已报道的白血病相关的基因标志物分别分析了他们在高低表达组中的差异情况,发现有好多个是存在表达差异的,而这些基因更多是预后标志物

3.于是我们猜想CPT1A是否与预后有关呢?我们又从GEO上找了一套带有预后信息的数据,然后提取CPT1A的表达数据将样本按照CPT1A表达中位数进行高低表达分组,观察高表达和低表达组样本的预后差异,发现高表达组的预后更差

4.想研究一下CPT1A的功能,但是CPT1A一个基因查一下文献就知道功能了,没操作空间,咋整?以前做lncRNA的时候,我们经常通过分析lncRNA共表达的基因来做lncRNA功能分析,难道在这里得不通吗,我们做了CPT1A全基因组表达关联分析(简单来说就是分别计算了CPT1A与其他所有基因的表达相关性),哦,不对,作者是根据CPT1A高低表达组进行了差异分析,然后找到了差异表达的基因,进一步的利用这些基因做功能富集分析,找到了显著富集的通路,观察这些通路与白血病的关系,同时在差异基因中观察这些差异基因有没有被报道过与白血病相关,有相关的则列出来讨论

插一句,我个人不是很喜欢简书的排版方式,所以这边不定期会更新,如果想连续看我的原创文章欢迎回到公众号:

原文链接:原文

上一篇下一篇

猜你喜欢

热点阅读