R语言与统计分析生物信息学与算法R小推车

《Modern Statistics for Modern Bi

2019-03-04  本文已影响24人  热衷组培的二货潜

《Modern Statistics for Modern Biology》Chapter 一: 离散数据模型的预测(1.1 - 1.3)

《Modern Statistics for Modern Biology》Chapter 一: 离散数据模型的预测(1.4 - 1.5)

2.1 本章的目标

在这一章我们将学到以下知识

参数是关键(Parameters are the key.)

2.2 统计模型和概率模型的区别

2.3 统计建模的一个简单例子

从数据开始

setwd("E:/compute language/NGS/Modern Statistics for Modern Biology/data")
load("e100.RData")
e99 = e100[-which.max(e100)]

拟合优度:可视化评估

barplot(table(e99), space = 0.8, col = "chartreuse4")
图 2.2
library("vcd")
gf1 = goodfit( e99, "poisson")
rootogram(gf1, xlab = "", rect_gp = gpar(fill = "chartreuse4"))

问题 2.1

答案

simp = rpois(100, lambda = 0.05)
gf2 = goodfit(simp, "poisson")
rootogram(gf2, xlab = "")

泊松分布参数的估计

> table(e100)
e100
 0  1  2  7 
58 34  7  1 
> table(rpois(100, 3))

 0  1  2  3  4  5  6  9 
 7 16 27 18 19  7  5  1 

问题 2.2

> prod(dpois(c(0, 1, 2, 7), lambda = 3) ^ (c(58, 34, 7, 1)))
[1] 1.392143e-110

问题2.3

> prod(dpois(c(0, 1, 2, 7), lambda = 0) ^ (c(58, 34, 7, 1)))
[1] 0
> prod(dpois(c(0, 1, 2, 7), lambda = 1) ^ (c(58, 34, 7, 1)))
[1] 5.766487e-50
> prod(dpois(c(0, 1, 2, 7), lambda = 2) ^ (c(58, 34, 7, 1)))
[1] 7.728814e-77
> prod(dpois(c(0, 1, 2, 7), lambda = 0.4) ^ (c(58, 34, 7, 1)))
[1] 8.5483e-46

loglikelihood  =  function(lambda, data = e100) {
  sum(log(dpois(data, lambda)))
}
> lambdas = seq(0.05, 0.95, length = 100)
> loglik = vapply(lambdas, loglikelihood, numeric(1))
> plot(lambdas, loglik, type = "l", col = "red", ylab = "", lwd = 2,
+      xlab = expression(lambda))  
> m0 = mean(e100)
> abline(v = m0, col = "blue", lwd = 2)
> abline(h = loglikelihood(m0), col = "purple", lwd = 2)
> m0
[1] 0.55

图 2.4

问题 2.4

> gf  =  goodfit(e100, "poisson")
> names(gf)
[1] "observed" "count"    "fitted"   "type"     "method"   "df"      
[7] "par"
> gf$par
$`lambda`
[1] 0.55

问题 2.5

goodfit本质上是计算离散分布(泊松分布、二项分布或负二项分布)在x中给出的计数数据的拟合值。如果未指定参数,则用ML或最小x平方估计它们。

要确定参数:par是一个指定参数lambda的命名列表,分别指定“泊松”的参数lambda和“二项”或“正态”的prob和size。如果为“二项式”,则不指定大小,
而是将其视为最大计数。

......未完待续.....。

上一篇 下一篇

猜你喜欢

热点阅读