文献翻译

miRViz: a novel webserver applic

2020-04-24  本文已影响0人  一个没有感情的文献阅读机

本文选自Nucleic Acids Research,doi: 10.1093/nar/gkaa259,喜欢的小伙伴可以自行下载食用,安全无毒,11分的文章,可以用来放到你的文章里。

本文的这个miRViz是个网站,http://mirviz. prabi.fr/,旨在可视化和解释大型miRNA数据集,不需要编程技能,有两个主要目标:(i)帮助生物学家提出数据驱动的假说;(ii)通过可发表的高质量数据表示,以直接的方式共享miRNA数据集,重点是相关的miRNAs组。听着是不是很玄幻。总之就是miR的相互作用网络。看着这片文章里的图,我就觉得高大上(主要是精美),网页长这个样子。感觉有些lowby。。

microRNAs是由大约22个核苷酸组成的非编码RNA,通过将RNA诱导的沉默复合体(RISC)定向到其mRNA靶点,在转录后水平调节编码蛋白的基因产物。然后结合到5‘或者3‘UTR端发挥作用,知道为什么要突变mRNA的UTR端了吧。但是想要达到完美结合并不是这么容易,miR并不是特异性的,一个miR可以结合很多mRNA,当然,一个mRNA可以被很多miR结合。(感觉像是一夫多妻和一妻多夫,孰乐?)结合同一个mRNA的miR发挥的功能几乎一致,那么统称为miR家族(终于知道为什么抱团取暖了)

这下直观了

要会用,先明白这个网站不同的部分什么意义,其中那个graph是不同的network,当然作用也不一样,声明一下,这个网站所用到的miR只是predefined,那些没发现的就免谈了吧。

‘Seed2-7’,通过连接共享相同种子序列的多对miRNA节点,可以直接可视化miRNA家族(这个作为初选,初筛用的),

‘Genomic Distance’开头的显示的基因组上的neighboring miR(这个感觉作用更大)

那个2k显示的2k碱基对以内的neighboring miRs,就是为了识别多顺反子miRs(这个是原核生物的能用到吧,真核生物都是单顺反子)

那个50k其实并不只是50k碱基对以内,目的是鉴定和肿瘤相关的miRs

以上都是预测,初筛

‘Diana50’, ‘TargetScan54’ and ‘DianaTarBase50’,是更加精确的数据库,这里的数据是通过Diana MicroT v3 (16) or Target-Scan v6.2

(17), or by experimental validation and gathering in Diana-TarBase v8验证的miRs share 50%, 54% and 50% common mRNA targets。DianaTarBase50与前两个相反,是使用实验验证的mRNA靶标推断的。

这样的是有共同mRNA靶点的miRs

那3+和10+是为了便于可视化和解释的简化网络,像这样似的。3+的像这样似的

10+的像这样似的

下面是pre-load datasets,前两个是鼠的细胞和组织,第三个是人的

好吧,这让我凉了一半,pre-load dataset没有我要的,一贯白嫖上瘾的我,这次彻底白嫖失败。

接下来一起学习下这个pre-load dataset 怎么用吧。

目标:只需点击几下,即可在给定组织中可视化特定于组织的microRNA家族,图片里有步骤,而且是英文的(大家英语能力肯定比我好,我就不翻译了。)

灰色的MIR对应于数据集中不存在的MIR

作者这里说明了,color number 3适合total miRexpression,4适合差异表达的miRs,需要说明的是,这里的miR是log2处理后

以上就是pre-load dataset,下面介绍一下自己的数据是如何使用,当然了,软件不提供标准化数据,首先你的数据必须是在标准化以后的才能使用。

上传自己的数据只是在本地使用,不会上传到服务器中,还有很多tips:MiRViz使用与数值相关的色标对节点(每个节点代表一个唯一的miRNA)进行着色,从而帮助解释miRNA数据集。由于每个节点只授权一种颜色,如果表中每个miRNA有多行,则只考虑第一种颜色。如果是这种情况(例如,复制在不同的行上),我们建议使用第三方软件(R、EXCEL等)聚合每个microRNA的数据。数据不会上传到服务器,而是通过浏览器存储在用户计算机上。在浏览器中打开多个选项卡可能会减慢加载数据和导航图表的速度。数据格式对应于经典的CSV(COM分隔值):数据组织在一个表中,每行对应一个唯一的microRNA。一列对应于成熟的miR标识符:MIMAT(推荐,例如:MIMAT0003180),或者各种格式的miR名称(hsa-miR-487b、miR-487b-3p等)。也可以使用Premir标识符(示例:MI0003530)(但不能使用各种Premir名称)。在后一种情况下,具有相同前MIR(-3p和-5p)的两个MIR将具有相同的颜色。下面用屏幕截图解释了第一次单击加载数据时的情况。

这里上传的数据会进行数据库比对,然后反馈错误选项,如果是同一个miR的不同形式,只会识别第一种。还挺友好啊。

网站应用学完了,那么你学(裂)会(开)了吗?我反正是懂(暴)了(毙)。这个玩意儿到底可以干什么用啊。

总结一下:1.可视化一到四个microRNA(MiR)网络

2.导航和同步网络,适合多个网络共同分析时用的

3.加载客户自己的miR数据集

4.用假颜色将miR数据覆盖到miR网络上

5.显示节点信息

6.Focus on miR

7.显示miR工具提示和链接信息

8.导出屏幕上显示的图表以供发布

9.显示/隐藏miR节点

10.Highlight miR nodes

看完,我更不懂了。MiRViz允许分析较长的数据集,比以表格、火山图等格式更容易直观地比较它们。因此,它允许以互补且通常更清晰的视图表示miR-seq数据。利用不同的功能,可以快速鉴定出感兴趣的microRNA。microRNAs通常是冗余的,因为许多microRNAs可以针对相同的mRNAs。因此,在网络中高度连接的microRNA在一起研究可能会很有趣。尤其是microRNAs家族,即共享同一种子的一组microRNAs,值得共同研究。MiRViz极大地有助于快速识别同一家族的高分microRNAs(使用网络Seed2_7),或者可能针对类似途径的microRNAs(DianaTarBase50、TargetScan54和Diana50)。在DNA上接近的共表达的microRNAs可以受同一转录因子的调控。这样的情况可以在基因组距离网络中看到。

文中给了几个例子啊,我是没心情看下去了。本着舍己为人的精神,我再次裂开。

文章用到5个dataset你敢信,我怕我读不完啊。咱们一个一个数据集开始吧。

第一个数据集是说的结肠癌细胞系和它对应的外泌体及囊泡差异miR进行的分析结果。上图。

大家姑且把这些当做是三次重复试验吧,得到一个结果,就是一个家族的miR通常会有相似的表达形式,如右侧的图。这点我觉得还挺有用的,目前所有研究都是存在缺陷的,因为研究者凭借个人因素把所有的原因归结到一个方面,其实,更多情况下的因和果并非单一,而是复杂的组合网络关系,这个恰好就说明了这点。朕甚是欣喜。作者甚至用RT-PCR验证了这个观点。(厉害了)

还记得那个50k吗,文章介绍说可以用来研究肿瘤,第二个数据集说的就是这个。

这里可以发现两个可以预测预后的miR cluster,一个在14号染色体,提示预后不良(24/48hit),一个在X染色体,提示预后改善(9/13hit)。1号和7号染色体也发现了和预后改善相关的miR cluster(3/4)。如C图所示,在X染色体上也发现了和预后相关的miR cluster miR-450/503/424。为什么这几个miR没有显著富集呢,作者也给出了自己的解释,因为当有如此多的hit时(在这种情况下,241个命hit其中的44个,大多数hit都在14q32簇中),很可能只是偶然地发现其中7个miRNA。作者更是发现了miR-29家族有相同的seed序列,表明了miR功能的冗余。

上图说明了MiRViz直观地鉴定了miR-302/519干细胞家族在调节乳腺癌干细胞平衡中的作用,这是在Diana50网络下绘制的,A显示了miRNAs在人类胚胎干细胞中的差异表达,这两种细胞在两种有利于多能性或分化的不同条件下培养。红色为干细胞miR簇,这突出了多能干细胞中过表达的miRNAs。这些miRNAs中的大多数已经被假设为协同调节多能性。然后,作者又用乳腺癌干细胞进行了training,然后又有了B图,这个我真没有看懂。Figure3B represents a functional screening dataset where we measured the relative levels of breast cancer stem cells (bCSCs) in a human breast adenocarcinoma cell line (SUM159 cells) upon systematic and individual overexpression of miRNAs (21). The green (resp. red) nodes represent miRNAs that upon overexpression lead to smaller (resp.higher) bCSC proportions.原文奉上。作者两图对比,得出如此结论:这表明,这组特定的miRNAs的微调可能在维持正常细胞和癌细胞的“干”状态方面具有重要而未知的作用。有趣的是,miRViz识别了这组miRNAs,并表明了目标基因冗余,这可能解释了为什么在单独的实验(数据未显示)中,它们的单个击倒对BCSC平衡几乎没有影响。

Diana50 and TargetScan54 structures are correlated with biological functions。

作者进一步验证了不同miRs对应靶蛋白的功能,有进行GO富集分析,

这两个网络的上部以及另外两个中心子网络let-7和miR-17/93包含几乎所有被预测为调控基因表达的miRNAs,这两个网络的下部都含有许多miRNAs,它们被预测通过小的gtpase来调节信号转导。HITS在网络中的位置告诉用户可能的调控途径,例如上部的miRNA HITS可能是基因表达的重要调节因子。

最后作者又说明了该怎么选择的问题,

首先,我们建议使用所有的网络,从小的网络开始(人类的Seed2-7,Diana50和基因组距离50k簇3+)。然后,我们建议从视觉上识别高度连接的miRNAs组的富集。在我们的经验中,我们经常在Seed2 7 a n d/or Genomic Distance networks中发现富集。

其次,当聚焦于miRNAs抑制的mRNA靶点时,应使用Seed2 -7(第二次使用共调控网络:Diana50、DianaTarBase50和TargetScan54)

再次,当试图识别多顺反子时,基因组距离2k显示在基因组上的给定邻域中共表达的miRNAs。50k版本更多地致力于大规模的基因组重组,就像在癌症中发现的那样。

最后,得到这个结果有什么用呢,当研究给定miRNA的表型作用时,实际实验在于击倒(或过度表达)该miRNA并测量表型结果。如果一个给定家族的多个miRNAs是共表达的,那么调节整个家族中的一个miRNA可能导致没有表型效应或最小的表型效应,因为来自该家族的其他miRNAs仍然可能抑制mRNA靶标,这也许就是这个网站最大的用处。(我可以明确告诉大家,我不会用这玩意儿,除非我的实验进行不下去了)

本文是全网第一个介绍miRViz功能及使用的。

结束了,花了一天时间,只是懂了一个大概,看来还是要在看看才行。欢迎大家批评,指正。

上一篇下一篇

猜你喜欢

热点阅读