Cytoscape插件1:Centiscape
Cytoscape的插件或多或少都有一些弊端,Centiscape是目前(文章时间2009)唯一一个可以一次计算多个中心值的插件(相对于network analysis等).它可以根据拓扑和生物学属性寻找最显著差异的基因。它只适合于无向网络,可以计算的参数有(average distance,diameter直径,degree度数,stress压力,betweenness中介性,radiality放射性,closeness紧密度(接近中心性),centroid value质心值,eccentricity离心值。插件的帮助文件有以上的定义,描述,生物学意义和计算的复杂性。每个参数的max,min,mean值都有提供。还可以可视化。右边的滑动块可以调整作者的值(默认是mean)。如果必要的话,可以把其中几个参数给deactive掉,也就是不勾选acitive复选框。用户可以选择其中几个参数more/equal而另外的选择less/equal,也可以假如AND-OR 参数。这些可以马上知道结果例如“哪些节点有高中介性值和高stress同时低离心值?”要注意的是,threshold也可以手动设置。一旦根据用户的选定设置,相应的子图就可以提取显示。两类图的输出可以被支持,根据centrality 画图,根据node画图,以上两种都支持其他工具所不支持的分析。
The plot by node
可以提供任何一个node 的所有计算的centiscape值,并以bar 图展示。Mean,max,min以不同颜色显示。图中的所有值都是标准化的,当用鼠标指向某一个时候显示的是真实值。
The plot by centrality 根据中心性画图。可以有五种方式画图
1 centrality vs centrality
2.centrality vs experimental data
3.experimental data vs experimental data
4.centrality vs itself
5.experimental vs itself
仔细看怎么用(plot by centrality可以发掘根据特殊的拓扑或实验特性聚成一类的群。并可以提取子网络进一步分析。拓扑特性和实验数据的结合可以用来对子网络的功能进行更多的有意义的预测或实验证实。
文章作者然后用一个例子来具体说明
整个网络的拓扑性质的总体会首先看到诸如min,max,mean等。例如,degree的平均值是13.5,平均距离是3显示这是一个高度连接的网络,也就是其中蛋白发生了强烈的相互作用。为了找到最高分蛋白的找出,我们可以应用“plot by centrality”。
画degree over degree,显示,分布是不均匀的,大多数nodes有低degree,很少的有高degree的。这和已知的生物网络的无尺度架构一致。下面这个是我的ucco的值,结果差不多,低degree的多余高degree的。
image.png image.png
186个nodes的degree超过平均值。degreeTop10(64-102,注释,这是作者的数据的值)全是激酶,MAPK1度数最高(102),要注意,MAPK1在所有计算的参数里哪一个都是最高的,这揭示了它的中心调控作用在(kino-phosphatome)。相比较而言,PTPN1在所有的磷酸酶里有最高的degree,46(一共31个),也有一个相当高的其他中心值。由此,degree的分析显示,MAPK1和PTPN1分别是最中心的激酶和磷酸化酶。
为了进一步证实以上,作者又分析了centroid。画了centroid vs centroid图,以显示其线性分布 ,和degree一样,也不是一致的。Ucco用自己的数据画了这个图,看上面右图。
平均centroid是-393,242个点(206个激酶,36个磷酸化酶)比平均centroid高。Top10的centroid值的是(-79-18)全是激酶,还是MAPK1最高(18)。PTPN1在所有磷酸化酶里有最高的centroid值(-154)(它在所有节点里排名22)。由此,不管degree分析还是centroid分析,都显示无尺度分布,并且MAPK1和PTPN1是最关键的激酶和磷酸化酶。这个结论也可以通过话degree vs centroid图来证明。从分析中可以看出,nodes非线性的分布非常明显,非常少的nodes在plot的第一象限(高degree高centroid)。这些nodes可以代表最重要的调节作用的激酶和磷酸化酶。
这种分析可以通过评估所有其他的中心参数被重复。为了提取最相关的nodes,我们使用centiscape选择所有超过平均值的centrality值。通过筛选,我们取得了一个子网络,它包含97个nodes(82个激酶,15个磷酸化酶),962条相互关系。这个sub-network可能一组高相互作用的激酶和磷酸化酶,这揭示的是在人类细胞蛋白质磷酸化调节中扮演重要角色的蛋白。进一步的分析,可以用centiscape也可以用其他分析工具,比如MCODE,或network analyzer,执行GO数据库搜索或添加功能注释,可以对这个子网络进行更深层次的探索。
这个网络中蛋白的调控角色也可通过上下文选择的方式进行实验证实。而实际上,用centiscape的中心性分析比重叠的实验数据更可靠。
Centiscape和其他生物信息学工具结合使用,有助于分析高通量蛋白组和基因组实验数据,或许可以帮助做决定。
总之,centiscape是一个便捷友好的信息学工具,整合了基于中心性的网络分析。它的结果可以作为普通属性文件使用,丰富了cytoscape的核心分析也可以用其他插件进行分析。而它的plot by nodes和plot by centrality非常有意义而其他工具不具备这些。这有助于对大型复杂网络进行节点归类分析,而这些网络是由实验数据获得的。