统计学

《爱上统计学》——学习笔记

2018-10-10  本文已影响32人  芒果芭乐

Chapter1

Chapter2-平均数

平均数(average)是最能代表一组数据的数值,也叫做集中趋势量数(measures of central tendency),一般有三种形式:均值(也称为算术平均数 arithmetic mean),中位数和众数。要注意平均数不只是均值,它有很多种不同的类型。

中位数

在一些特定的分析中,使用中位数作为集中趋势量数,因为有时候存在太多的极值改变/扭曲了一个数据组或数据分布中心点的情况,因为中位数关注的是有多少个体而不是这些个体的数值,所以极值(奇异值)不会对它产生影响。
均值是一系列数值的中间点,而中位数是一系列个体的中间点。

众数

众数是最笼统/最不精准的集中趋势量数

三种平均数的选用

选用哪一种集中趋势量数要依赖于所要描述的数据类型。
定性数据/类别数据/定类数据(种族群体,眼睛颜色,收入档次,选举次序)的集中趋势只能使用众数来描述。
中位数和均值最适合定量数据(身高,年龄,反应时间)。

Chapter3-变异性

变异性(variability,也被叫做散步/离散度)可被看作是对不同数值之间的变异性的测量,可以看作每个数值和特定值之间的差异程度。
变异性的三种量数:极差/标准差/方差 。它们通常用于描述一组数据的变异性/散布/离散度。

极差

极差是对变异性最笼统的测量。

标准差

标准差(standard deviation 缩写为s或SD)表示一个数据组中变异性的平均数量。实际的含义是与均值的平均距离。标准差越大,每一个数据点与数据分布的均值的平均距离越大。

标准差的计算:
为什么是n-1而不是n?

因为s是总体标准差的估计值,但是只有我们用n-1的情况下才是无偏估计。使用n-1会是的标准差大于实际的大小。但在这种情况下,如果不得不出错,我们出差也是过高估计了总体的标准差。

Chapter4-图表

Chapter5-相关系数

相关系数(correlation coefficient)是反应两个变量之间的关系的量化指标。两个变量的相关又被称为二元相关。本章主要讨论的相关类型是皮尔逊积距相关(Pearson product-momentcorrelation)。
皮尔逊相关系数考察两个变量之间的关系,但这些变量的属性是连续的。不连续的变量可以使用其他相关。
相关反应量间关系的动态性质:如果变量变化方向相同,相关便是同向相关(direct correlation)或正相关(positive correlation)。如果变量变化方向相反,相关是反向相关(indirect correlation)或(negative correlation)。

相关系数反映两个变量共同变化的程度,如果两个变量之间不存在任何一起变化的部分(变异性),那么这两个变量便不相关。
如果限制或控制一个变量的值域范围,这个变量和其他变量之间的相关系数相对于变量的值没有限制的情况来说会更小。

计算简单相关系数

变异性产生影响,不应该人为地限制变异性。

相关的图示表达:散点图

一种非常简单/直观的表示相关的方式是建立散点图(scatterplot)或散布图(scattergram)

相关系数集:相关矩阵
在有两个以上变量时,可以建立相关矩阵,以表示变量之间两两相关的关系。
理解相关系数的含义
其他重要的相关系数

Chapter6-信度与效度

如果用来收集数据的工具是不可信或无效的,那么任何假设检验的结果都不会有结论。如果不能确定检验能够完成那些应该完成的工作,并且保持一致性,那么怎么知道得到的显著性结果是由于有问题的检测工具,而不是在零假设为真的情况下拒绝了零假设?为了得到一个清白的零假设检验,就应该关注信度(reliability)和效度(validity)。

测量
信度

信度(reliability)就是一个测试或者使用的其他任何测量工具对事物的测量可以保持一致性。(不同时间/不同工具/不同地点对事物测量结果的一致性)。

效度

效度(validity)表示工具能够测量想测量内容的程度。

效度的种类: 内容效度(centent validity):就是测试项目能代表要测量的总体项目的性质。

准则效度(criterion validity):是评价测试是否在现在和将来的情境中反应一组能力。如果准则是发生在现在,我们就讨论同步效应(concurrent criterion validity),如果发生在将来,我们就讨论预测效度(predictive criterion validity)。
建构效度(construct validity):建构效度是基于测试或测量工具背后的基本结构或概念的。

信度与效度

效度的最大值等于信度系数的平方根。测试的效度收到信度的约束。

Chapter7-假设

假设(hypothesis):一个好的假设将问题陈述或研究问题转换为更适合检验的形式。假设检验用于样本(sample),然后才将结论一般化到更大的总体(population)。
抽样误差(sampling error):测量样本和总体特征近似程度的量数。基本上是样本统计值和总体参数值之间的差异。抽样误差越大,抽样过程中的精确性越低,且应用样本中的发现真实反应总体中预期发现就更加困难。

零假设

Chapter8-概率

Chapter9-显著性

在大多数涉及假设检验的科学研究中一定存在一定数量的不可控误差(偶然性因素)。你愿意承担的风险水平或者概率水平就是显著水平。
显著水平(significance level)是不能100%确信试验中观察到的结果是处理因素或需要检验的因素引起的 所要承担的风险。
统计显著性(statistical significance level)是指零假设为真的情况下拒绝零假设所要承担的风险水平——犯第一类错误要承担的风险。

选择用于检验的方法
这是一般流程,快速但不总是最好
显著性检验介绍

推论统计的优势是由样本得到总体特征。进行推论的最有用的工具之一就是统计显著性检验。
显著性检验基于:每一类的零假设都与特定的统计类型联系在一起,而每一种统计类型与特定的分布联系在一起。

Chapter10-独立样本t检验

独立性表示两个群体在任何方面都不相关。

每一个统计检验都有特定的假设支持检验的使用。如t检验的一个主要假设是两个群体中每个群体的变异性的量是相等的(方差齐性假定)。

独立样本t检验的t值计算公式: 群体内与群体之间的变化的数量构成分母

独立样本t检验是检验两个不同群体或独立群体之间的均值差异。

自由度(degrees of freedom,df):自由度近似于样本规模。
独立样本t检验的自由度是n1-1+n2-1。

效应量

在知道了差异的显著性后,还应该讨论这么做是否有意义。

效应量(effect size)是对两个群体之间如何相互不同的测量(对处理规模的测量),类似于多大才能算是大。

效应量的表现是每个群体相对于另一个群体之间位置。效应量越大就意味着两个群体重叠的部分越少。

2- 稍微复杂的公式:使用综合的标准误差作为分母

Chapter11-非独立样本t检验

非独立样本均值检验表明的是相同的群体在不同的条件下进行相同的研究。

非独立样本t检验的自由度:n-1。n为配对观察的参与者数量。

在选择检验方法流程图里面,因为是两个群体所以选择非独立均值t检验,这里面两个群体不是参与者群体而是相同参与者的两组成绩。

Chapter12-简单方差分析

在需要检验两个以上的群体,并比较这些群体的平均成绩所以使用方差分析。简单方差分析简写:ANOVA。
方差分析的检验统计量是F统计量以建立者B.A.Fisher命名。

在讨论方差分析时,不需要确定单侧或双侧。因为要检验两个以上的群体,且因为F检验是综合的检验(检验均值之间的所有差异)。讨论特定差异的方向没有意义。

-事后比较检验/既成事实检验
在进行了群体之间的分析后,知道了群体之间存在差异,但是并不知道差异所处的位置,这时要进行事后(post hoc)比较检验或即成事实(after-the-fact)分析。也就是每一个群体的均值和另外一个群体的均值之间的比较。

上一篇下一篇

猜你喜欢

热点阅读