统计相关数据-R语言-图表-决策-Linux-Python

R语言实现统计推断,T检验方差分析相关分析卡方检验

2017-01-20  本文已影响560人  DTAnalystLi

计算不同样本类型的T置信区间

data(sleep)
g1<-sleep$extra[1:10];g2<-sleep$extra[11:20];diff<-g2-g1
mn<-mean(diff);s<-sd(diff);n<-10
mn+c(-1,1)*qt(0.975,n-1)*s/sqrt(n)  ##置信区间计算原理
## [1] 0.7001142 2.4598858
t.test(diff)$conf[1:2]   
## [1] 0.7001142 2.4598858
t.test(g2,g1,paired=T)$conf[1:2]
## [1] 0.7001142 2.4598858
t.test(extra~I(relevel(group,2)),paired=T,data=sleep)$conf[1:2]
## [1] 0.7001142 2.4598858
t.test(extra~I(relevel(group,2)),paired=F,data=sleep)$conf[1:2]
## [1] -0.2054832 3.3654832
  1. 单样本T检验
t.test(rate,mu=0.1)
  1. 两样本T检验

R代码实现: 方差齐性检验 #先做方差齐性检验

var.test(avg_exp~gender)

R代码实现:T检验 #后做T检验

t.test(avg_exp~gender,var.equal=T)  #如果方差齐,equal选择true

方差分析:用于探讨连续型变量和分类型变量之间的关系

  1. 各组样本均服从正态分布或逼近正态分布。
par(mar=c(4,4,1,4))
boxplot(avg_exp~edu_class)   #图像描述

单因素方差分析

anova(lm(avg_exp~edu_class))  
```
多因素方差分析
```
anova(lm(avg_exp~edu_class+gender+edu_class*gender))  
```

##相关分析
- 数据描述
```
par(mar=c(4,4,1,4));plot(Income,avg_exp)
abline(lm(avg_exp~Income))
```
- 计算相关系数
```
cor.test(Income,avg_exp,method='pearson/spearman')
```

##卡方检验
- 数据描述
```
library(prettyR)   #加载相关包
xtab( ~bankruptcy_ind+bad_ind)
```
- 计算chisq
```
xtab( ~bankruptcy_ind+bad_ind,data=accepts,chisq = T)  #直接在交叉表里显示卡方
chisq.test(x=accepts$bankruptcy_ind,y=accepts$bad_ind) 
```
上一篇 下一篇

猜你喜欢

热点阅读