统计学习-笔记2

2018-12-30 本文已影响5人努力奋斗的durian

最近更新：2018-12-30

1.假设检验
2.T检验

对于这部分的内容还是比较熟悉的,都是复习比较多,更加注重于练习与理解.

显著性水平是估计总体参数落在某一区间内，可能犯错误的概率，也就是Type I Error

一个研究者想证明自己的研究结论是正确的，备择假设的方向就要与想要证明其正确性的方向一致；

下面总结一下单侧检验,具体如下:

单侧检验方向的选择可以依据信息原则。就是将一个不以本次检验为改变的一个先验的信息作为选择方向的基础。

先验信息有两种：

若样本支持的结论出现在备择假设中，则备择假设成立与否依赖于选取的显著性水平。

是用t分布理论来推论差异发生的概率，从而比较两个平均数的差异是否显著；一般检验水准α取0.05即可；

计算检验统计量的方法根据样本形式不同;

现在要分析男生和女生的身高是否相同两者的主要区别在于数据的来源和要分析的问题.

问题：为什么T检验查表时候要n-1?

样本均值替代总体均值损失了一个自由度

分析人的早晨和晚上的身高是否不同，于是找来一拨人测他们早上和晚上的身高，这里每个人就有两个值，这里出现了配对.

样本误差（Standard Error）

t检验-样本误差1

t检验-样本误差2

当样本平均数不一样，但实际上认为他们的方差是一样的时候，需要合并方差

不要被公式吓到，他的本质是两个样本方差加权平均

t检验-合并方差1

t检验-合并方差2

效应量(effect size):提示组间真正的差异占统计学差异的比例，值越大，组间差异越可靠。