产品经理方法论阅读书籍收录

不学统计,不谈逻辑 |《行为科学统计》

2017-03-21  本文已影响940人  TaraChen

为了学统计同时看了《行为科学统计》、《行为学统计基础》、《商务与经济统计》、《深入浅出统计学》。都是好书,但推荐前两本。第三本对公式和过程解释得不是特别简单,最后的不够系统,但是对核心概念解释得比较好,我是拿来参考不懂的概念的。本文以《行为科学统计》为主进行梳理,主要是围绕假设检验以及检验方法。更基础的概念下一篇梳理。


不学统计,不谈逻辑 |《行为科学统计》

支撑推断统计的学科是概率论(很重要!!),因此结论都是一定概率范围内的。

假设检验

含义

我的理解:
从一个总体中抽出许多个大小为 n 的样本,样本均值基本遵从正态分布(中心极限定理),定义 α 的概率为显著性水平,则认为大部分的抽样均值(比例为 1-α)在零假设(H0)定义的范围之内。而若某次抽样(实验抽样)均值出现在 α 对应的数值范围内,则与我的判断不符,拒绝 H0。
(α代表范围、分布概率,z代表距离)

这部分很重要,理解了就理解了统计学的核心思想。下面的各种方法都是基于这个概念。

《行为科学统计》的解释:


假设检验图.png

关键概念:

z-score 公式.png

步骤

统计方法

平均数检验:单样本

z 检验(总体方差已知)

z=(M-υ)/σM= (M-υ)/σ/√n
置信区间 υ=M±zσM

置信区间:已知α水平,可根据α/2求得标准正态分布(均值0,标准差1)的 z-score,(因为求区间,因此取α/2),再根据上面的公式求得置信区间。

t 检验(总体方差未知)

大多数情况下总体参数未知。xxx统计学家以 student 的化名发表了 t 分布。用样本方差估计总体方差。

公式中的分母 sM 是一个估计的标准误,用估计的标准差 s 替代总体标准差 σ

估计的标准误.png

s 如何计算呢?
总体方差 σ 平方=SS/n, SS=(总体每一数值-总体均值)的平方和,即总体数值与均值离差的平方和。

如下图是样本数值与均值的离差的平方和。它小于总体数值与均值离差的平方和。(因为总体的外延更大,会有极值没包含在样本内)


样本离差平方和.png

那么由于样本方差的分子小于总体方差的分子,在用样本数值估计总体方差时,改小分母,使估计精确。

因此用样本数值估计总体时,估计总体方差=s 平方=SS/n-1=SS/df

平均数检验:双样本

独立样本检验

独立样本研究两个完全独立的样本。重复样本对同一样本使用不同的处理。

重复样本检验

D 表示差值,sMD=独立样本检验的公式

t 检验中 总体均值的置信区间:


t检验总体均值置信区间.png

平均数检验:多样本 方差分析

和t检验的区别:

单因素:独立测量

54E63A7D-904F-4FF3-903A-9FBE2ECB762A.png

单因素:重复测量

方差分析重复测量计算.png

双因素/多因素

相关(待补充)

附:统计学符号表
υ
σ
M: 代表样本分布平均数,理解为单次抽样的样本均值。一个总体的许多个样本,每个样本的平均数是一个M值。

上一篇 下一篇

猜你喜欢

热点阅读