统计学习04:假设检验(t检验为例)与P值

2020-11-15  本文已影响0人  小贝学生信

假设检验Hypothesis Testing是数理统计学中根据假设条件由样本推断总体的一种方法。采用反证法的思路,主要根据概率分布的小概率事件(0.05)进行决策;其中概率分布基本是以正态分布为基础。

要点一、假设检验一般思路

Hypothesis Testing

始终要牢记的是:假设检验回答的问题是有没有,存不存在关系:而不能衡量这种关系有多大。

一般形如H0:μ1-μ2=0的称为双侧检验,而><之类的零假设称为单侧检验。一般来说双侧检验较为常见,下面也主要介绍这种方法。

one or two tailed test

要点二、以t检验示例演示上述假设检验思路

如上过程,计算了自由度为7的t分布情况下的t值。公式了解即可,不同的方法有不同的公式,这些交给统计软件做即可。

(4)查t分布表(双侧),t 0.05/2, 7 =2.365<4.2

t临界值表
(5)做决策:按 α= 0.05显著性水平,拒绝H0,接受H1,可以认为两种饲料喂养的两组大白鼠中维生素A的含量有差别。再根据均值,判断正常饲料组比缺乏维生素E饲料组的含量要高。

如第五步,虽然做的是双侧检验。但根据有差异的决策,以及均值差异,一样可以得到单侧检验的结果,也更方便。此外均值差异大小为0.01,p值也很小,也不要诧异。因为始终记住假设检验回答的问题是有没有,存不存在关系:而不能衡量这种关系有多大。此时使用置信区间相对P值来说,反应的信息就多一些了。

捎带补充下关于t检验的应用条件

要点三、p值与两类错误

通常在做组间比较计算样本量时,可以设定p值与把握度,然后根据相应的效应值(如组间差值)计算所需的样本量,也就是功效分析的过程
如上两类错误的2*2定义表,可类比机器学习中的二分类混淆矩阵,例如灵敏度(sensitive)、精确率(Precision)等概念。此外还有ROC曲线,在此提一下,以后有机会再学习下

上一篇 下一篇

猜你喜欢

热点阅读