文献翻译

WEE家族激酶系统表达分析揭示PKMYT1在乳腺癌发生中的重要作

2020-04-11  本文已影响0人  一个没有感情的文献阅读机

本文选自cell proliferation ,DOI: 10.1111/cpr.12741,喜欢的朋友可以自行下载。

学了这么多高分文献了,今天给客官们换个口味,咱们吃点素。疫情期间,在家闲着已经要废了,朕的细胞,朕的老鼠,朕的天下,完犊子了。

但是,疫情也不能阻断我想毕业的心情啊,实验做不成了,那我只能想别的招了,挖数据,万一发现个什么,发个文章岂不是能笑醒,如果发现点其他的也可以给自己的课题找找思路啊!说着说着不禁笑醒了,混账,不好好读博,竟敢有二心,看我不给你来一波关注。无意中就看到这么一篇全生信的文章,我又不是程序员,虽然我是国家计算机四级,对编程也只是略有了解,现在让我写代码,只怕是代码认识我,我也不一定认识她啊。我就寻思着什么可以不写代码又能找点思路的,这不,找到了一个,Systematic expression analysis of WEE family kinases reveals the importance of PKMYT1 in breast carcinogenesis。IF=5,毕业算是差不多了,关键是可以批量化生产啊,真是一招鲜,吃遍天的绝技。来来来,赶紧学起来。(简书已经有老师解读过这篇,本文就是我自己的解读,也是为了我自己哈哈)

本文从一个蛋白家族入手,研究这个蛋白家族在肿瘤中的作用。这里提到的数据库及软件我都用过,哈哈,生信在手,天下我有。

WEE蛋白家族有G2检查点功能,WEE蛋白家族有三个成员,具体哪个成员在乳腺癌(为什么是乳腺癌?数据多啊,搞生信分析的都要馋哭了,我们搞胰腺癌,只能看着隔壁搞乳腺的,眼馋,手痒,想rua,但是没办法)有什么作用呢,以前我怎么说来着,存在即合理,数据库验证一波,看看这个蛋白家族各个 成员的表达情况(N:T)。下一步要看看这个蛋白(高表达)是怎么存在差异的(突变还是怎么了),在下一步是不是解决一下这个存在不一定合理的问题,这种差异蛋白是不是有临床应用价值,对于预后或者分期或者分型或者指导治疗有意义,这是不是像是基础研究先做的表型研究,明确了蛋白存在的意义后,就确定了研究价值了,生信分析和基础科研不太一样啊,一般来说如果发现一个蛋白升高了,我们可以找上游,也可以找下游,看看调控网络怎么样,也就是A调控B(B是我们的研究对象)调控C的过程,这里也是发不同文章的套路的过程,下面是我的个人理解,那么调控B或者受B调控的这些蛋白或者miRNA,lncRNA,circRNA与B就有相关性,这里需要研究于B相关性高的这些成分,所以要进一步研究这些相关性,但是去哪里找这些蛋白或者ncRNA呢?这里就要用到数据库分析和软件了,这里会找到一大堆数据,找到的蛋白可以通过KEGG和GO ,看看有没有感兴趣的通路后者功能富集,非编码的话要去做预测结合部位和结构域,蛋白的话要做共表达分析及PPI,找到作用最强的一些也就是一些蛋白,看看这些蛋白对生存或者临床表现有没有什么相关性,看看能不能找到和研究蛋白相关性最高的且通路功能一致的这些蛋白。最后再数据库验证一下这些蛋白相关性。如果是非编码的话,通过找到的这些蛋白然后和ncRNA互作网络,找到这些网络关键节点,在细胞后者组织中验证下一 这些ncRNA是不是存在,如果存在了,恭喜你,发财了,可以发PAPER了。下面开始学习一下找到的这个思路。

文章开头就介绍了乳腺癌预后多么不好,然后又说了DNA检查点对于肿瘤是多么重要(真是王婆卖瓜自卖自夸)。然后作者就有了想研究这个的想法。作者首先用Oncomine看了看不同肿瘤WEE家族成员表达情况。看到乳腺癌和结直肠癌中PKMYT1明显升高的,作者用用GEPIA网站验证了PKMYT1是在肿瘤中升高的,在TCGA数据库再次验证了一下,而且与正常组织是有差异的,这里解决了存在的问题,后续是不是该说说合理的问题了。(一直不明白为什么做生信的用不同的数据库做同样的事情,难道是为了减小大数据导致的系统误差,反正他们习惯用一个数据库找到数据, 另一个数据库验证数据,一致了才说明问题,不一致可能都不会进一步研究了)

Oncomine上看了看不同类型乳腺癌该基因的差异情况

突变在肿瘤中发生的比较常见,这种表达增多会不会是突变导致的呢?作者用cBioPortal评估了一下,发现这个基因突变极低,说明肿瘤有促进它表达的基因或蛋白存在啊。作者又在COSMIC数据库看了看该基因不同突变类型有哪些。发现错义突变最常见。核苷酸变化包括C>T,C>G,G>C和T>C突变,最大比例为C>G和G>C。使用Kaplan-Meier(KM)绘图作PKMYT1表达的预后指标,作者发现PKMYT1mRNA的表达增加与总生存率(OS)、进展后生存率(PPS)、无复发生存率(RFS)和远处转移生存率(DMF)显著相关。乳腺癌有很多亚型,但是对于不同亚型可能也会不一样,作者又对各个亚型进一步分析了一下,发现PKMYT1与乳腺癌亚型之间的关系,我们发现RFS受PKMYT1表达水平的影响很大

确定了PKMYT1与肿瘤预后及亚型的关系,那么和临床特征又有没有关系呢,作者又进一步在乳腺癌数据库bc-GenExMiner 4.0中进行数据挖掘,发现,ER组和PR组体内PKMYT1基因表达显著增加。(这一步就是为了确定研究的基因是有意义的,我是这么认为的)

下面该挖机制了。无非就是互作,共表达、甲基化等等吧。然后作者分别在cBioportal和Onncomine找到共表达的基因,去了个交集。找到80个一致的基因(还是我说的那样,两个数据库去交集的问题,这个cBioportal好像是不太友好,可以用GDC数据库,其实他们都是一样的),用这80个基因在DAVID上做KEGG和GO ,看看通路及功能如何。GO分析表明,细胞分裂、有丝分裂核分裂、姐妹染色单体结合、有丝分裂姐妹染色单体分离和有丝分裂细胞周期G2/M转换等生物学过程受到显著影响(图5D),与相应细胞位置的富集和拟议的分子功能一致。说明了这个基因在调节细胞增殖中的作用,和查询到的功能是一致的。(这估计和作者的目的一致吧我觉得,其实在string 上可以直接做KEGG和GO吗)

作者用这80个基因在string上作了蛋白-蛋白互作,这里他们用Cytoscape(MCODE插件)获得的,然后用CytoHubba plug-in (the cytoHubba plug-in, top 10)找到了10个HUB基因(也就是关键基因,可能在调控中起到重要作用的基因)PLK1, NCAPH, TRIP13,KIF4A, SPAG5, CDCA5, FOXM1, ESPL1, PRC1 and CENPN,利用BINGO插件进一步对hub基因进行了生物学过程分析。特别是肽生物合成过程、植物螯合素生物合成过程、细胞生物合成过程、肽代谢过程、次生代谢过程和植物螯合素代谢过程发生了较大的变化,提示它们可能参与了细胞分裂所需的蛋白质合成代谢

作者又把这10个HUB基因在UCSC上进行分层聚类,发现了他们表达是一致的,利用Kaplan-Meier曲线分析hub基因的总体存活率。所有这10个hub基因在高表达组中表现出较低的总体存活率(作者没说,估计还是oncomine)

文章做到这里,似乎也没有说明什么道理啊,上下游联系似乎也没有啊,cBioportal回归分析表明,PKMYT1和PLK1具有较高的相关系数(Spearman相关=0.79;Pearson相关=0.60)(图7A)。通过bc-GenExMiner4.0数据库(图7B)和GEPIA(图7C)的分析证实了PKMYT1和PLK1转录本之间的正相关。进一步证实了这一点,用UCSC XENA在不同的亚型中使用了具有一致相关性。这些数据表明PKMYT1与PLK1有很强的相关性,提示它们可能是乳腺癌的功能伙伴。(这里可能是文献的败笔,相关系数不是太高啊,很容易让别人给你拒的)

发现了新东西,是不是又要在研究一下,别动,这不就是PKMYT1发现的过程吗,对了,客官,又来一遍,还是原来的配方,还是原来的味道。作者又去oncomine挖了一下,发现PLK1在几乎所有不同的乳腺癌亚型中表达上调,)。随后,利用Kaplan-Meier绘图仪数据库研究PLK1在乳腺癌中的预后价值,并证实PLK1mRNA的高表达与乳腺癌中RFS、OS、DMFS和PPS的降低显著相关。

文章结束了,这隔壁搞胰腺的都馋哭了啊!!文章5分,就做这些,而且结果也并不是特别的理想,只能说明一个问题,这篇文章的通讯作者肯定是个高人,要不然这种纯生信,不写一行代码,不做一点实验验证的,发3分都困难,这几个在线的数据库来回倒着用,她不香吗?对于我们,只能踏踏实实做实验,生信只能为你的文章润色,但是不能决定你文章的高度,但是对于临床的医生来说,哪有时间做实验,这个她就是一个救命稻草啊,现在的体制和机制,打个不是特别恰当的比喻,如果说评级晋升就是一个老态龙钟的老太婆或者老大爷,不知道是有多少年轻英俊的小伙或者肤白貌美的妹子倒贴都愿意事啊,虽然恶心,但是她香啊!欢迎批评、指正。

上一篇下一篇

猜你喜欢

热点阅读