大数据科研信息学

【Excel系列】Excel数据分析:假设检验

2017-07-02  本文已影响474人  数据科学社区

Excel数据分析工具库中假设检验含5个知识点:

Z-检验:双样本均值差检验

T-检验:平均值的成对二样本检验

T-检验:双样本等方差假设

T-检验:双样本异方差假设

F检验:双样本方差检验

Z检验:双样本平均差检验

Z检验:双样本均值差检验概述

(1)假设条件

两个样本是独立的样本

正态总体或非正态总体大样本(样本量不小于30)

两样本方差已知

(2)检验统计量及其分布、原假设及拒绝域

表 7‑1 z检验原假设、统计量及拒绝域

Z检验工具的使用

例:对如下两样本标准差均为10,试以0.05的显著水平检验两样本均值是否相等。

(1)在EXCEL中输入数据(图 7‑2 A:C列)。

(2)数据|分析|数据分析|z检验:双样本平均差检验,设置对话框如下。

图 7‑1 z检验:双样本平均差检验对话框

(2)单击“确定”生成分析报告。

图 7‑2 检验结果

本问题是检验两样本均值是否相等,故为双尾检验。由分析报告可见,截尾概率为0.001756<0.05,拒绝均值相等的原假设。

t检验:成对双样本平均值

t检验:成对双样本平均值检验概述

(1)假设条件

两个总体配对差值构成的总体服从正态分布

配对差是由总体差随机抽样得来的

数据配对或匹配(重复测量(前/后))

(2)检验统计量及其分布、原假设及拒绝域

t检验:成对双样本平均值工具的应用

例:对如下成对数据检验X的均值是否大于Y的均值。

图 8‑1 数据资料

(1)数据|分析|数据分析|t检验:成对双样本平均值,弹出对话框并设置如下:

图 8‑2 平均值成对双样本检验对话框

(2)单击“确定”得检验结果报告:

图 8‑3 检验结果

图 8‑4 单边t检验拒绝域

t检验:双样本等方差假设

t检验:双样本等方差假设检验概述

(1)假设条件

两个独立的小样本

两总体都是正态总体

两总体方差未知,但值相等

(2)检验统计量及其分布、原假设及拒绝域

表 9‑1 z检验原假设、统计量及拒绝域

t检验:双样本等方差假设工具的应用

例:对如下数据检验X与Y的均值,假设两总体方差相等,检验两总体均值是否存在显著差异(显著水平0.05)。

图 9‑1 数据资料

(1)数据|分析|数据分析|t检验:成对双样本平均值,弹出对话框并设置如下:

图 9‑2 单等方差检验对话框

(2)单击“确定”得检验结果报告:

报告结果显示,双尾P值0.84>0.05不拒绝原假设,即认为两总体均值无显著差异。

图 9‑3 检验结果报告

t检验:双样本异方差假设

t检验:双样本异方差假设检验概述

(1)假设条件

两总体都是正态总体

两总体方差未知,且值不等

(2)检验统计量及其分布、原假设及拒绝域

表 10‑1 z检验原假设、统计量及拒绝域

t检验:双样本异方差假设工具应用

例:对如下数据检验X与Y的均值,假设两总体方差不等,检验两总体均值是否存在显著差异(显著水平0.05)。

图 10‑1 数据资料

(1)数据|分析|数据分析|t检验:成对双样本平均值,弹出对话框并设置如下:

图 10‑2 异方差检验对话框

(2)单击“确定”得检验结果报告。由报告可见,双尾截尾概率(P值)为0.85>0.05不拒绝原假设,即两样本总体均值无显著差异。

我们关注的是P值,当该值小于显著水平时,图中的P值值远小于0.05,效应显著。

图 10‑3 检验结果报告

F检验:双样本方差齐性检验

F检验简介

F检验又叫方差齐性检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差 S2,以确定他们的精密度是否有显著性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t 检验。

查F分布临界值表得临界值Fα,如果F < Fα表明两组数据没有显著差异;F ≥ Fα表明两组数据存在显著差异。若能得到F所对应的截尾概率(P值),则P值小于显著水平时差异显著。F分布函数描述见(图 10‑3),分布曲线见(图 11‑2)。

图 11‑1 F分布基本概念

图 11‑2 F分布曲线

图11-2蓝色部分为面积为F分布累积概率=1-α;红色部分的概率则为α,横轴为F值。

F检验:双样本方差工具的使用

例:对如下数据,利用EXCEL的F检验工具检验两组数据方差是否有显著差异。

(1)在EXCEL中输入数据。

图 11‑3数据资料

(2)从“数据”选项卡选择“数据分析”,选择“F检验:双样本方差”,单击“确定”弹出对话框如下:

图 11‑4 F检验对话框

(3)单击“确定”得到输出结果(图 11‑5)

图 11‑5 F检验结果

由图3可见,F统计量=1.488,F临界值为3.1789,F0.05,没有落入否定域,不拒绝原假设。

大数据订阅号(ID:BigData07)
上一篇下一篇

猜你喜欢

热点阅读