@IT·互联网统计学读书笔记

2. 数据从哪里来?

2017-04-14  本文已影响0人  李小夭

1. 一张图看懂数据的来源


2. 数据的搜集

(1)调查数据:一张表看懂不同的抽样方法

(2)实验数据:改变A变量,观察B变量是否有变化。我们将改变A变量的称为实验组,未改变量的称为对照组

(3)间接数据:对已经存在的数据进行加工和整理。要注意的是,在使用间接数据时要特别注意数据的使用目的,以确定统计口径是否相同。

概率抽样依据随机原则抽取样本,样本统计量的分布有理论依据,可以对样本的调查结果对总体参数进行估计(后面展开)。而非概率抽样受多种因素影响,无法对总体参数进行推荐,但是非概率抽样适合做探索性研究和测试,发现目前存在的问题。


3. 数据误差

(1)抽样误差:由于抽样的随机性引起样本结果与总体真值的误差。样本量的大小,总体的变异性都会影响抽样误差。举个例子,总体的次品率在30%,在抽样的过程中,大部分的次品率落在27.2%-32.8%,这样的误差是由于抽样的随机性带来的。

(2)非抽样误差:除了随机抽样带来的误差,还有抽样框误差、被调查者和调查者的误差、调查工具的误差等,这些都会对抽样结果造成影响。

研究人员根据对数据精度的要求,确定允许的误差范围。确定好后,就可以用不同的方法去控制,比如增加样本量以减少误差。

上一篇下一篇

猜你喜欢

热点阅读