阅读笔记:心理学中如何应用统计学验证假设呢
之前提到过心理学家用统计学来解释收集的数据,也把统计作为实验量化的基础
我们来看一个研究中对统计学的应用[一个害羞的人如何变成S人犯的]
在调查研究方法过程中,熟人都形容故事的主人翁弗雷德是一个:友善的,安静的,和蔼可亲,喜欢孩子的绅士。
小学时关于信仰,合作,礼貌方面都拿了A
同事还反馈:他从来不谈任何人,属于老好人这类
在某个情人节,弗雷德带着自动B枪,S了一名同事和一位警员
[一组研究者怀疑害羞以及其他的个性特征与暴力行为间可能存在一定的联系]
于是根据这个假设收集可能揭示这种联系的数据
这里有一个常识性的推论:表面上看起来安静,害羞,不具备攻击性,但内心常经历控制强烈愤怒的斗争
还有就是没学会通过沟通等方式解决矛盾,最终把愤怒付诸行动
基于以上推理,研究者假设: 与惯犯相比,害羞更可能是突然S人犯的特性,突然S人犯比惯犯更能控制自己的冲动,突然S人犯的被动性和依赖性表现为更多的女性化和双性化的特征

为了验证以上观点,研究人员获得批准后对一组S人犯做心理问卷测验
[谋S罪之前,一些人已犯过罪,而样本中的其他人先前没有犯罪记录]
研究者这里搜集三类数据:羞怯分数,性别角色认同分数和冲动控制分数
第一个问卷是最重要的,询问参与者是否羞怯,然后进一步了解害羞程度和类型,以及有关害羞的一些起因
第二个是性别角色问卷,给参与者一系列形容词如:好斗的,多愁善感的…让参与者评估这些词描述自己的贴切程度
一些形容词具备典型的“女性化”,形容词的总分为女性化分数,一些评估“男性化”,形容词的总分为男性化分数
女性化分数减去男性化分数为最终性别角色分数
第三个问卷是多项人格测验,用于测量人格的不同方面,本次仅使用“自我过度控制”量表测量控制冲动的程度,分数越高,越表现出有过分的自我控制
研究者预期:与之前有犯Z记录的S人犯相比,突然S人犯①通常在羞怯调查中描述自己是害羞的②在性别角色量表中选择更多的女性化特性③自我过度控制的分数更高
分析数据,记住数学是工具;数学符号是一种为了阐明观点和概念操作的简略表达方法。
数据中的原始数据:实际分数或其他测量数据
通过问卷和形容词的选择还有自我控制的评估,我们得到一个数据表,我们对这串数据是会感到困惑的,那么接下来如何使用它们呢
通常依据描述统计和推论统计来解释数据并得出有意义的结论
描述统计:在客观的、统一的方法基础上使用数学程序描述数值数据的不同方面
为了理解分数的分布,我们得出频次分布:总结每种分数出现的频次,羞怯问卷非常容易统计出,有多少个回答的“是”,多少回答的“否”以及他们属于哪一类型
性别角色和自我控制又需要更进一步,譬如性别角色最高分是61(最女性化),最低分是-33(最男性化)
这些分数是如何分布的呢?用频次分布的方法是把这组数据从高到低排序(正数的最大对应着负数的最大),接着把排列好的分数进行分类,组成一些分数更小的类别(组距法)如这里把66到-33分为10类,每一类包含10个分数最后构建频次分布表((60~69[频次1]…-40~ -31[频次1]))
大部分狱犯的得分都偏离0不多,即他们的得分既不十分正也不十分负
之后是通过图表(条形图,柱状图等来呈现这些数据)
这里的图表看出,数据分布的基本情况是符合最初的假设:与S人惯犯相比,突然S人犯更可能会把自己描述成害羞的,也更可能会用女性化特质来描述自己。
以上的过程让我们对数据分布有了个大致印象,如果需要了解更多,譬如最能代表这一组数据的数值,这在一组或多组数据中非常有用,这里引入一个集中趋势的度量:只用一个有代表性的分数来作为一组参与者最典型分数的指标
这里心理学家主要采用三种集中趋势度量的测量方法:众数,中数和平均数
众数(mode)是一个比所有其他数值出现次数都要多的数值。
中数(median)明显也是一个中央分数;它将一组数据中高分的一半与低分的另一半区分开来
平均数(mean)是大多数人听到平均这个词时常常会想到的。 还是最常用到的描述一组数据的统计量。
我们接着需要了解集中趋势度量的代表性究竟如何,此时需要离散性的度量(measures of variability)是描述围绕在集中趋势度量周围的分数分布情况的统计量。
关于这一点的应用:教30名小学生阅读,了解到班上同学是能阅读一年级课本的水平,是安排课程的基础,但要了解孩子们的阅读水平的相似和差异,将更能因材施教,因此需要离散性的度量。
关于离散性的最简单度量是全距(range),即频次分布中最高值与最低值之间的差值。
在心理学研究中,更多的时候需要将所有数据都考虑进来,因此需要用到标准差:它代表着所有分数与其平均数之间的平均差值,计算时我们需要知道数据的平均值和各个分数
标准差越大,则数据分布越分散。它在整组数据中的代表性将减少
当标准差很小时,平均数是整个数据分布的一个很好的代表值。
相关系数:它是关于两个变量(如身高与体重或者性别角色得分与自我过控得分)之间相关程度和性质的度量
这也是解释心理学研究数据的一个有用工具
相关系数越高,则根据一个变量的信息,可以更好地预测另一个变量。相关系数的取值范围从+1(完全正相关)到0再到-1(完全负相关)
另一种解释数据并得出有意义结论的统计,推论统计:利用概率论做出可靠的推论:什么样的结果可能仅仅是由于随机变量产生的。

前面用描述统计量来研究得到的数据,然后看起来S人犯和S人惯犯确实有一些差异,那怎么确定这些差异足以产生意义呢?
再次重复这个研究会得到同样模式的结果么?…
推论统计被用来回答上面这些问题,利用概率论来确定一组数据完全由随机变化所得出的可能性。
正态曲线:当从大量个体身上收集关于某个变量(如身高、智商或过控性等)的数据时,数据的个数常常符合一条大致类似于正态曲线,离均值越远,曲线高度越低。曲线上,中数、众数以及平均数都是同一个数。
推论统计指明了所得到的特定分数样本与你所要测量的内容之间存在着真正关联的概率,或者说它们是否只是随机产生的。
当研究两组样本的均值之间发现有差异后,为了确定这是真正的差异还是随机性的,就用正态曲线来验证,随机差异也服从正态分布
根据已经达成的共识,当由随机因素导致差异的概率不足5%(以p<.05来表示)时,心理学家将接受这个差异为“真”,符合这一标准的差异为显著差异
根据前面的数据两组罪犯性别角色得分的分布差异已经达到了为“真”的程度。那么可以确定两组罪犯存在真正的差异
惯犯相比,突然杀人犯确实把自己评价为更女性化一些。另一方面,两组罪犯过控分数的差异并没有达到统计的显著性(p<.10),因此我们在讨论这个差异时必须非常谨慎
通过推论统计,就可以大致回答最开始提出的一些基本问题
[任何结论都只是关于所研究的事件之间可能存在相互关系的论断;它永远不会是确定性的。科学中的真理都是暂时的,总会被后来更好的研究数据所修正,通过更好的假设而得到发展。]
在生活中,会遇到错误使用统计学的情况,[避免出现此类错误的一个好方法是检查样本的大小。大样本比小样本出现误导结果的可能性要小。另一个方法是同时检查中数、众数以及平均数。当这三者近似而差别不大时,可以更有把握地对结果进行解释。我们应该始终仔细地检查所使用的方法和报告的研究结果]