组间/组内标准差
以前遇到过自己算的标准差和Minitab 算出来的不一样,或者和别人算出来的不一样的情况。看了一下Minitab 中的算法,决定做个分享。
总体来说,导致其不一致的大致原因是,我计算的标准差不是Minitab计算的那个标准差。所以,当有人问你同样的数据为什么算出来的标准差不一致时,不要急于指责别人,也不要急于自己认错,你们都是对。
----------------------------------------------------------------------------------------------------------------------------
如下来自Minitab:
估计标准差 组间/组内基于以下四个标准差:
1. 子组内标准差 σ组内
σ组内是子组内变异的估计值(例如,一个班次、一个操作员或一个材料批次)。Minitab 使用以下方法之一估计 σ组内:
1.1 合并标准差:
注意: 如果更改默认方法并且选择不使用无偏常量,则用 Sp 估计 σ组内。
说明:
d: Sp= Σ (ni- 1) 的自由度; Xij: 第 i 个子组中的第 j 个观测值; X̅i: 第 i 个子组的均值;
ni :第 i 个子组中的观测值个数; C4(d+1): 无偏常量; Γ(.): Gamma 函数。
1.2 子组极差平均值 (Rbar):
说明:
ri: 第 i 个子组的极差; d2 (ni): 从表中读取的无偏常量(有关详细信息,请参见“无偏常量 d2()、d3() 和 d4()”部分); d3 (ni): 从表中读取的无偏常量(有关详细信息,请参见“无偏常量 d2()、d3() 和 d4()”部分); ni: 第 i 个子组中的观测值个数 。
1.3 子组标准差平均值 (Sbar):
注意: 如果更改默认设置并且不使用无偏常量,则用 Σ Si/子组数来估计 σ组内。
说明: C4(ni) 无偏常量(如为合并标准差所定义)。 Si: 子组 i 的标准差; ni: 第 i 个子组中的观测值个数。
2. 子组间标准差 σ组间
σ组间是子组间变异的估计值(例如,在设定的区间、批次中收集的子组,或由不同的操作员收集的子组)。
σ2Xbar 使用以下方法之一进行估计:
2.1 移动极差平均值:
说明:
Ri: 第 i 个移动极差; w: 在移动极差中使用的观测值个数;默认值为 w = 2; d2(w) :从表中读取的无偏常量(有关详细信息,请参见“无偏常量 d2()、d3() 和 d4()”部分)。
2.2 移动极差中位数:
说明:
MRi: 第 i 个移动极差; MRi: 的中位数 w 在移动极差中使用的观测值个数;默认值为 w = 2; d4(w): 从表中读取的无偏常量(有关详细信息,请参见“无偏常量 d2()、d3() 和 d4()”部分)。
2.3 递差均方和平方根 (MSSD):
3. 组间/组内标准差
4. 整体标准差
注意: 默认情况下,Minitab 在估计 σ整体 时不使用无偏常量。σ整体 用 S 来估计。如果要使用无偏常量来估计整体标准差,则可以在执行能力分析时更改估计子对话框上的此选项。如果希望 Minitab 始终默认使用无偏常量,请选择工具 > 选项 > 控制图和质量工具 > 估计标准差,然后选择适当的选项。
说明:
Xij: 第 i 个子组中的第 j 个观测值; X̅: 过程均值; ni: 第 i 个子组中的观测值个数;
C4 (N): 无偏常量(如为合并标准差所定义); N(或 Σ ni): 观测值总数。
以上就是组间/组内标准差的一些算法。另外一点需要提一下,如果数据经过Box-Cox变换或者Johnson变换后,那么标准差的计算就会又有些不同了,评估制程能力的时候需要留意。
最后总结一句话:同一个世界,很多个标准差!
虎啸山林 201903