BioNet: an R-Package for the fun
1.ABSTRACT
Motivation:
随着转录组学和交互组学数据的数量和质量的不断增加,对网络分析的综合方法的需求不断增加。在这里,我们提出了一个全面的用于生物网络分析的r包,包括确定功能模块的精确和启发式方法。
Result:
生物网络包提供了一个广泛的框架,综合网络分析R.这包括转录组和功能数据与生物网络整合的统计、节点评分以及网络搜索和可视化的方法。
1.Introduction
PPI很重要,主要目标是在大型网络中识别功能模块(显著差异表达的子网)。这可以通过为网络中的每个节点计算反映其功能相关性的分数来实现。随后,需要一个网络搜索算法来找到得分最高的子图。
事实上,这个问题已经被证明是NP-hard的.人们开始采用模拟退火启发式算法识别综合网络中的高分子图.
作者提出一个算法:利用整数线性规划(ILP)在合理运行时间内计算MSS问题的可证明最优解和次优解。并且打包成了一个R包:有以下几个功能
1.整合来自不同实验的p值
2.通过模块化评分功能对网络节点进行评分
3.计算可能的MMS问题的最优和次最优解
4.用一种新颖的启发式计算高分解
5.网络解决方案的2D和3D可视化
2.DESCRIPTION
BioNet包提供了一套全面的方法,用于基因表达数据和生物网络的综合分析.p值在原假设下呈均匀分布.
第一步,来自不同实验的多个p值被整合使用均匀顺序统计(aggrPvals--R包Function),这个合并的p值被认为是混合信号和噪声的,且信号部分被建模为Beta(a,1)分布.模型拟合可以通过所提供的诊断图来核实(plot.bum,hist.bum--R包Function).
第二步,通过拟合beta-uniform mixture (BUM)模型(fitBumModel--R包Function),可以得到混合模型的极大似然估计.这些参数随后被用来为网络的节点打分(scoreNodes, scoreFunction--R包Function)。这个调整的节点得分使用这个公式给出:(a−1)(log(x)−log(τ(FDR))),其中τ是给定的FDR的阈值.
第三步,最优解和启发式解可以通过runHeinz, runFastHeinz(R包Function)来计算。并且可以被graph,RBGL和igraph包的数据结构支持.网络可以导入或导出,允许与标准的网络分析工具如Cytoscape平滑的数据交换.
不明白的点:
1.合并p值是基于原理合并的?
2.为什么合并之后是符合BUM模型的
3.APPLICATION
作者将作者的包应用于扩散大b细胞淋巴瘤(DLBCL)的基因表达数据和生存数据,和基于人类蛋白质参考数据库的蛋白互作网络(PPI).资料包括112个具有生发中心的肿瘤b样表型(GCB)和82例b样表型激活的肿瘤(ABC),包括病人幸存信息.所有数据都可以在BioNet和DLBCL包中获得。作者使用标准的微阵列分析和Cox回归来分别获得基因方面的差异表达和风险相关性的p值.然后利用生物网络的二阶统计量对两个p值进行聚合。
(这一段不懂作者为什么使用二阶统计量对两个p值进行聚合)