统计学习-笔记2
2018-12-30 本文已影响5人
努力奋斗的durian
最近更新:2018-12-30
1.假设检验
2.T检验
对于这部分的内容还是比较熟悉的,都是复习比较多,更加注重于练习与理解.
1.假设检验
1.1显著性水平
显著性水平是估计总体参数落在某一区间内,可能犯错误的概率,也就是Type I Error
1.2备选检验和零假设
一个研究者想证明自己的研究结论是正确的,备择假设的方向就要与想要证明其正确性的方向一致;
下面总结一下单侧检验,具体如下:
单侧检验方向的选择可以依据信息原则。就是将一个不以本次检验为改变的一个先验的信息作为选择方向的基础。
先验信息有两种:
- 一种是自然的先验信息,我们都认为这种先验信息是正确的,普遍成立的,因此将其所代表的情况放入原假设。
- 另一种是样本的统计量提供的先验信息,它表明了样本支持和反对的结论,若样本反对的结论出现在备择假设中,则备择假设必然不会成立,检验不必进行。
若样本支持的结论出现在备择假设中,则备择假设成立与否依赖于选取的显著性水平。
2.T检验
- 主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。
![](https://img.haomeiwen.com/i9945523/401333d7fa816403.png)
是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著;一般检验水准α取0.05即可;
计算检验统计量的方法根据样本形式不同;
2.1 独立样本T检验
现在要分析男生和女生的身高是否相同两者的主要区别在于数据的来源和要分析的问题.
![](https://img.haomeiwen.com/i9945523/e04044ed691a4403.png)
问题:为什么T检验查表时候要n-1?
样本均值替代总体均值损失了一个自由度
2.2 配对样本T检验
分析人的早晨和晚上的身高是否不同,于是找来一拨人测他们早上和晚上的身高,这里每个人就有两个值,这里出现了配对.
![](https://img.haomeiwen.com/i9945523/c9a220f4764a3911.png)
样本误差(Standard Error)
![](https://img.haomeiwen.com/i9945523/5ddb4ab99db623f7.png)
![](https://img.haomeiwen.com/i9945523/592db7a6d6b67284.png)
2.3 Pooled varance 合并方差
当样本平均数不一样,但实际上认为他们的方差是一样的时候,需要合并方差
不要被公式吓到,他的本质是两个样本方差加权平均
![](https://img.haomeiwen.com/i9945523/bf8d6f951cf675fa.png)
![](https://img.haomeiwen.com/i9945523/94678c181faa444f.png)
2.4 Cohen's d
效应量(effect size):提示组间真正的差异占统计学差异的比例,值越大,组间差异越可靠。
![](https://img.haomeiwen.com/i9945523/6de31c174f42ae6c.png)