Cook R生物信息学与算法

安装 pRRophetic 包

2020-04-12  本文已影响0人  王诗翔

该包的 GitHub 项目地址:https://github.com/paulgeeleher/pRRophetic2

从文档看这个包可以用基因表达数据预测表型和药物反应。

这是一个感觉有点古老的包,特别大。

我们先安装它的依赖包:

BiocManager::install(c('sva', 'car', 'genefilter', 'preprocessCore', 'ridge'))

这里 BiocManager 包需要提前安装好,使用 install.packages("BiocManager") 即可。

搞定之后我们需要把这个包下载下来,网页在 https://osf.io/5xvsg/wiki/home/,使用命令:

wget -O pRRophetic_0.5.tar.gz  https://osf.io/dwzce/?action=download

有 500+MB,我把它存在坚果云了,可以使用 https://www.jianguoyun.com/p/DdY8HJAQ6uuVCBjljo4D (微信推文点击原文链接)点击下载。

下载之后进行安装,在 R 控制台运行命令:

install.packages("pRRophetic_0.5.tar.gz", repos = NULL, dependencies = TRUE)

测试

安装好之后我们需要测试下包能不能正常使用,这里就跟着文档做个几步看看。

先载入包和进行设置:

> library(pRRophetic)
Warning message:
replacing previous import ‘car::Anova’ by ‘genefilter::Anova’ when loading ‘pRRophetic’ 
> set.seed(1234)

载入数据,画个图看看:

> data("bortezomibData")
> pRRopheticQQplot("Bortezomib")

五折交叉验证,这一点我的电脑有点 hold 不住:

> cvOut <- pRRopheticCV("Bortezomib", cvFold=5, testExprData=exprDataBortezomib)

 11683  gene identifiers overlap between the supplied expression matrices... 
 
Found2batches
Adjusting for0covariate(s) or covariate level(s)
Standardizing Data across genes
Fitting L/S model and finding priors
Finding parametric adjustments
Adjusting the Data


1 of 5 iterations complete.
2 of 5 iterations complete.
3 of 5 iterations complete.
4 of 5 iterations complete.
5 of 5 iterations complete.

画个结果图:

> plot(cvOut)

一般般的效果:

模型结果还是显著的:

> summary(cvOut)

Summary of cross-validation results:

Pearsons correlation: 0.4 , P =  4.45287272844977e-12 
R-squared value: 0.16
Estimated 95% confidence intervals: -4.23, 4.23
Mean prediction error: 1.64

有了模型就可以做预测了:

> predictedPtype <- pRRopheticPredict(exprDataBortezomib, "Bortezomib",
+                                     selection=1)

 11683  gene identifiers overlap between the supplied expression matrices... 
 
Found2batches
Adjusting for0covariate(s) or covariate level(s)
Standardizing Data across genes
Fitting L/S model and finding priors
Finding parametric adjustments
Adjusting the Data


 2324 low variabilty genes filtered.
Fitting Ridge Regression model... Done

Calculating predicted phenotype...Done

其他的我就不说了,感兴趣的读者可以把文档代码过一遍。这个是一个读者的问题,但我自己走下来发现没有难点,可能就这个包有点大。如果读者不会安装 R 包建议看下我在教程里写的有关 R 包安装的内容:https://shixiangwang.gitee.io/geek-r-tutorial/

上一篇下一篇

猜你喜欢

热点阅读