统计学习

统计学-导论

2020-05-10  本文已影响0人  limbo1996

参考书:《白话统计学》


总体和样本

总体是一个或者一组对象,样本是从更发的总体中抽取的子集。

来自总体并适用于总体的值是参数

例如:

计算某大学教授的平均收入,将此大学所有教授的输入取平均值的到的就是总体的参数

还有一种方法是选取教师的子集,然后计算子集的平均收入

子集就是样本, 计算的均值是一种统计量

样本

注意

在研究时要定义总体,不管是以明确的方式或者隐含的方式

推断统计和描述统计

描述统计只应用于那些手机数据的样本对象和总体成员
推断统计 是假定样本能够代表更大的总体,然后利用样本数据得到关于总体特征的一些结论

抽样问题

随机抽样

随机抽样 随机意味着总体的每一个对象被选入样本的概率是相等的,随机抽样的好处是样本与抽样总体之间的差异不是系统性的。

典型抽样

选取在具体特征上更家符合样本的对象:

如果要研究某地成年人的平均年收入
总体就是某地的所有成年人,但是成年人又分成的很多子集,比如不同工作的占据了不同比例,如果按照这些比例抽样,15%的警察,那样本中也要班汉15%的警察

典型抽样的样本结果更能推广到总体。

方便抽样

根据参与意愿等等其他条件即方便程度来选取样本

变量类型和测量尺度

变量是所有可能被编码的东西,比如收入,年龄等等等等。
常量就是具有唯一的取值,比如样本中所有对象都是男性,那性别就是男性常量。
变量包括:

定量就是用数字或者评分来赋值,例如身高就是一个定量变量或者连续变量,越大代表身高越高

定型赋值并不意味着特定性质的多少,比如

山东 = 1, 河南 = 2, 上海 = 3
男生 = 1, 女生 = 2

测量尺度

定类变量

使用无权重或者无符号识别变量的不同水平
比如某些研究需要探究男女之间是否有差异
男性用“0”表示, 女性用“1”表示,这里的不同类别只是标签而已,不代表优劣。

定序变量

定序变量的取值含有权重,比如富豪排名,第一的比第十的更富有

定距尺度和定比尺度

比如比较高度,因为高度的单位长度相等,比如一个人高1.65米,另一个高1.83米那就提供了行对位置和距离信息
无论是定距还是定比,用的测度的单位间距离都相等。


定序测量尺度与定距或定比测量尺度
上一篇 下一篇

猜你喜欢

热点阅读