实用统计：我想知道我换了改变一种生产方式后平均水平有没有变化

2020-06-12 本文已影响0人 echolvan

首先我们先抛出一个问题
案例1（大样本，均值检验）：
某一家机床厂加工车轴，根据经验知道，该厂加工的车轴的椭圆度渐近服从正态分布，其总体均值为0.081mm,今另外换一种新机床进行加工，取200个零件进行检验，得到椭圆度均值为0.076mm，样本标准差为0.025mm，问新机床加工零件的椭圆度总体均值与以前有没有显著的差别？？

看完问题你在想how to do 呢？首先说一下理论知识吧

均值和比例的检验

z统计量和t统计量

问题：对于均值和比例，我们什么时候使用z统计量，什么时候使用t统计量？
样本量的大小和总体标准差是否已知决定使用的统计量
比如：
样本量大的情况下，总体如果是服从正态分布，样本统计量服从正态分布；如果总体为非正态分布，样本统计量渐近服从正态分布，这样可以z统计量。
在总体标准差已知的情况下
其中总体标准差 $\sigma$ 已知
$z= \frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}$
总体方差未知的情况下
可以使用样本标准差 ${s}$ 来替代
$z= \frac{\overline{x}-\mu_0}{s/\sqrt{n}}$
样本量比较小的情况下，如果总体标准差已知，样本统计量服从正态分布，这时可以用z统计量。如果总体标准差未知，这样就使用t统计量。与正态分布于相比，t分布更为扁平，在相同概率条件下，t分布的临界点向两边更为扩展，临界点与中心距离更远，这意味着推断的精度下降，这是总体标准差 $\sigma$ 未知所要付出的代价

${t}$ 统计量的计算公式：
${t=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}}$
${t}$ 统计量的自由度为n-1
这个n就是样本量

补充：
当样本量比较小的时候，t分布和z分布的差异还是比较明显的，样本量n>30时，t分布于z分布非常接近，具备了用z分布取代t分布的理由。所以在n<30的时候， $\sigma$ 又不知道，那么我们就必须使用t统计量，至于n>30时用哪个就看使用者的喜好了。差别不大。

回到案例

案例一
案例一中，我们关心的是我们新机床加工的零件总体均值是不是和老机床加工的有所不同，这是个双侧检验问题
假设：
H0： ${\mu=0.081mm}$ 没有显著差别
H1: ${\mu }$ 不等于0.081mm 有显著差别
根据题意 ${\overline{x}}$ =0.076mm, s=0.025mm, ${\mu_0}$ =0.081mm。因为n>30,故选用z统计量
${z = \frac{\overline{x} - \mu_0}{s/\sqrt{n}}}=\frac{0.076-0.081}{0.025/\sqrt{200}}=-2.83$
${\alpha}$ 称为显著水平，它的含义是当原假设正确时却被拒绝的概率或风险，其实这就是起那么所说假设检验中弃真错误的概率