数据分析学习Day3---商务与统计(第六章)
2018-11-10 本文已影响0人
ghostdogss
1.置信区间是指以很高的置信度包含目标参数的一个数字范围。
2.总体均值的大样本(30个以上)置信区间:
大样本根据中心极限定理可知其均值分布服从正太分布,因此以95%的置信水平可得,均值的置信区间:
(ps:但总体的sigma未知时,可以用样本的标准差来替代)
![](https://img.haomeiwen.com/i14870522/b05a84c3436e02e0.png)
![](https://img.haomeiwen.com/i14870522/efa56e5678f0ab19.png)
3.总体均值的大样本(30个以下)置信区间(t统计量):
![](https://img.haomeiwen.com/i14870522/454dc39de2902618.png)
![](https://img.haomeiwen.com/i14870522/a5fc165ade65927d.png)
大样本数量确定的来源:
![](https://img.haomeiwen.com/i14870522/acba501d13b337a8.png)
4.总体比例的大样本(nq>=15且np>=15)置信区间
![](https://img.haomeiwen.com/i14870522/f0e68f33754795c0.png)
p的调整:
![](https://img.haomeiwen.com/i14870522/aedf62d8966aa2a2.png)
5.样本量的确定:
![](https://img.haomeiwen.com/i14870522/4995344eea4c0c18.png)
![](https://img.haomeiwen.com/i14870522/46a23ff21a7c2e7d.png)
![](https://img.haomeiwen.com/i14870522/a5b48997101c720e.png)
6.总体方差的估计:(卡方分布)
![](https://img.haomeiwen.com/i14870522/14d7708aceec665a.png)