心理咨询师三级第五章心理测量学知识点整理

2017-07-24 本文已影响0人背带裤BOBO

艾德教育：http://www.aidemuke.com/ 400-832-7770 咨询电话：022-58697826

一、测量要素：

参照点：1）绝对零点；2）相对零点。在心理测量中不可能找到绝对零点，只能人为的采用相对零点（常模）。

单位：（必须具备两个条件）：1）有确定的意义；2）有相同的价值。

二、测量量表：是一个有单位和参照点的连续体：从低级到高级分成四中水平：

(1)命名量表：数字只能用来做标记和分类，不能做数量化分析。

(2)顺序量表：数字仅表示等级，并不表示某种属性的真正量或绝对值。

(3)等距量表：有相同单位，其数值可以做加减运算，但没有绝对零点，因此不能做乘除运算。注：等距量表的数值加或减一个常数或用一个常数乘或除，不破坏原来数据的关系。

(4)等比量表：既有相等单位，又有绝对零点。所得的数值均可以做加、减、乘、除运算。如长度、重量和时间都是等比量表。注：心理测量首先是在顺序量表上进行的。然后运用某些统计学的方法，把这种顺序量表得到的数据，换算到等距数据进行转换。

三、测验的分类：

按测验的功能分类：1、智力测验2、特殊能力测验；3、人格测验。

按测验材料的性质分类：1、文字测验；2、操作测验（非文字测验）。

按测验材料的严谨程度分类：1、客观测验；2、投射测验（受社会赞许影响不大；受应试动机的影响较小）。

按测验的要求分类：1、最高作为测验（有正确的答案。如智力测验、成就测验等）；2、典型行为测验（没有正确答案。如人格测验均属典型行为测验）。

四、确定常模团体时，要先确定一般总体，再确定目标总体，最后确定样本。

常模团体的条件

1、群体的构成必须明确界定；

2常模团体必须是所测群体的代表性的样本；

3、样本的大小要适当（样本大小适当的关键是样本具有代表性，一般性常模：最低不少于30或100个）。

4、全国性常模：一般2000~3000人为宜。

5、标准化样组是一定时空的产物

五、常模团体取样的方法：从目标人群中选择有代表性的样本。分为：

1、简单随机抽样；

2、系统抽样（目标总体无序可排，也无等级机构存在）；

3、分组抽样（总体目标较大，如全国取样）；

4、分层抽样（分层比例抽样，分层非比例抽样）。

六、常模，是一种供比较的标准量数，由标准化样本测试结果计算而来，它是心理测验时用于比比较和解释测验结果的参照份数标准。常模分数：将被试者的原始分数按一定的规则换算出来的导出分数（又叫常模表）。常模分数的要素：原始分数；导出分数。

七、发展常模：年龄量表中的个人分数指出他的行为在按正常途径发展方面处于什么样的发展水平。智力年龄：1936年吴天敏和陆志韦修订的《中国比内--西蒙智力量表》为例。每个年龄有6个题目，答对每个题目代表2个月的智令，例如：某儿童6岁组的题目全部通过，7岁组通过4题，8岁组通过3题，9岁组通过2题，其智龄为：6岁+4*2（月）+3*2（月）+2*2（月）=6岁+18=7岁6个月。（满12个月令=1智龄）

八、百分位常模包括：百分等级：是指在常模样本中低于这个分数的人数的百分比。百分等级支出的是个体在常模团体中所处的位置，百分等级越低，个体所处的位置就越低。百分点也称百分数：是计算处于某一百分比例（百分等级）的人对应的测验分数（原始分数）是多少。在分数量表上，相对于某一百分等级的分数点就叫百分点或百分位数。通过这样的双向方式编制的原始分数百分等级对照表，就是百分位常模。四分位数和十分位数：1）四分位数：相当于百分等级的25%、50%、75%对应的三个百分位数分成的四段。注：最小的是1%；2）十分位数：1%-10%为第一段，41%-50%为第五段，91%-100%为第十段。百分等级

标准二十分离差智商

10（平均数）3（标准差）100（平均数）15（标准差）

1698%1302

1384%1151

1050%1000

716%85-1

42%70-2

九、标准分常模：是将原始分数与平均数的距离，以标准差为单位表示出来的量表。因为它的基本单位是标准差，所以叫标准分数。标准分数可分为通过线性转换和非线性转换两大类。常态化的标准分数（线性转化的标准分）有：T分数：以50为平均数（加一个常数50），以10为标准差（乘以一个常数10）所表示的标准分，通常叫T分数。T=50+10*z（相当于z）；标准九分：平均数为5，标准差为2，一般用于评价教学中成绩的分级和美国空军，标准十分：平均数为5.5，标准差为1.5,；标准二十分：平均数为10，标准差为3.离差智商是常态化标准分中应用最广，影响最大的标准分。非线性转换标准分：常态化过程：①将原始分转化为百分等级；②再将百分等级转化为常态分布上相应的标准分数。原始分数不是正态分布时，也可以通过非线性转换。

十、比率智商：局限性：因个体心理年龄与实足年龄并不同步增长的，所以它不适合年龄较大的受测者。离差智商：是依据测验分数常态分布来确定的。离差智商的平均数为100，标准差为15。其优点为：韦克斯勒的离差智商建立在统计学的基础上；它表示的是个体智力在同年龄组中所处的位置；离差智商是表示智力水平高低的一种理想指标。其公式：

IO=100+15*z=100+15*{X（量表分数）－X（平均量表分数）}/SD（量表分数的标准差）*100。

的斯坦福一比内量表中采用了离差智商平均数为100，标准差为16.

十一、信度评估的估计方法：1重测信度又称稳定性系数：主要考察了跨时间的一致性。优点：能提供有关测验是否随时间而变异的资料，可作为被试将来行为表现的依据。缺点：易受练习和记忆的影响。一般分为两周到四周为宜，间隔时间最好不超过六个月。2、复本信度又称等值性系数：它主要考察了跨形式的一致性（等值性）。如果两个复本的施测相隔一段时间，则称重测复本信度或稳定与等值系数。他既考虑了测验在时间上的稳定性，又考虑了不同题目反应的一致性。3、内部一致性信度；主要反映的是题目之间的关系，表示测验能够测量相同内容或特质的程度。4、评分者信度：一般要求在成对的受过训练的评分者之间平均一致性达0.90以上，才认为评分是客观的。

十二、信度解除个人分数的意义：一是估计真实分数的范围；二是了解实得分数再测试时可能的变化情形。标准误差：SE=SX√1－rxx。在95%的或然水平时，其置信区间为X－1.96SE

十三、影响信度的因素：

样本特征：

1、样本团体异质性的影响。样本团体较为异质的化，往往高估测验的信度，反之则会低估测验的信度。

2、样本团体平均能力水平的影响。

测验长度：测验越长测题取样或内容取样越有代表性；测验越长被试的猜测因素影响就越小。注：增加测验长度的效果应遵循报酬递减率原则，则测验过长会引起被试的疲劳和反感而降低可靠性。

3、测验难度：若测验对某团体太难或太易，则分数范围将缩小，从而使信度降低。如果某个测验适用范围很广，其难度水平通常适合于中等能力水平的受测者，而对较高水平或较低水平的受测者可能较易或较难，使得分数分布范围缩小，信度水平降低。

4、时间间隔：以再测法或复本法求信度，两次测验间隔时间越短，其信度系数越大；越久，其他变因介入的可能性越大，受外界影响也越大，信度系数便越小。

十四、效度的评估方法：

1、内容效度：它和测验的内容有关。内容效度的评估方法：

1）专家判断法（是一个逻辑分析的过程，因此又称逻辑效度）其步骤是：

①定义好测验内容的总体范围；

②编制双向细目表；

③制定评定量表来测量测验的整个效度；

2）统计分析法：除了描述性语言外，内容效度的统计方法可以采用一些统计分析方法如评分者信度。克伦巴赫提出，内容效度可由一组受测者在独立取自同样内容范围的两个测验复本上得分之复本相关来估计。再测法可用于内容效度的评估。

3）经验推测法。

2、构想效度的评估方法：

①对测验本身的分析：内容效度可作为构思效度的证据；测验的内部一致性指标可提供证据；被试者对题目的反应特点可提供证据。

②测验间的相互比较：相容效度可提供依据；区分效度可提供证据；因素分析法可提供验证方法。

③效标效度的证明研究；

④实验法和观察法证实。

3、效标效度又称实证效度：它分为同时效度和预测效度。

评估方法：

①相关法

②区分法；

③命中率法：是当测验用来做取舍的依据时，用其正确的比例作为效度指标的一种方法。它分为四种情况：预测成功实际也成功：预测成功但实际上失败；预测失败而实际上成功；预测失败实际上也失败。我们称正确的预测为命中，不正确的为失误。总命中率=命中/命中

+失误；正命中率=测验与效标皆成功的人数/预测成功人数=B/A+B。临界分数越高，正命中率越高；反之，就越低。

十五、效度的功能：

1、预测误差：效度系数常用决定性系数来表示，即相关系数的平方，它表示测验正确预测或解释的效标方差占总方差的比例。如：效度是0.8，则表示总方差中有64%的方差是测验分数的方差，即测验分数正确预测的比例是64%，其余36%则无法做出正确的预测。

2、预测效标分数：Y=a+byxX。Y是预测的效标分数，a是丛轴的截距，byx是斜率，X是测验分数。

十六、影响效度的因素：

1、测验本身的因素；

2、测验中的干扰因素：①主试的影响因素；②被试的影响因素；

3、样本团体的特质：

①样本团体异质性。样本团体越异质，分数分布范围越小，效度越低；反之亦然；

②干预变量（对于不同性质的团体，如年龄、性别、教育水平、智力、动机、兴趣、职业等，由于这些特征的影响，使得测验对于不同的团体具有不同的预测能力，而这些特征就是干预变量）。

十七、命题的一般原则：

（1）内容方面：符合测验目的：取样有代表性；题目间相互独立；

（2）文字方面：准确，避免使用生僻字词；简明扼要；一句话说明一个概念；尽量少用双重否定句；

（3）理解方面：应有确切答案；题目内容不超出受测团体的知识水平和理解能力；题目格式不会被人误解；

（4）社会敏感性方面：避开社会敏感性问题：题目不涉及社会禁忌或个人隐私，

其假设是：①命题时假定被试者具有某种行为；②命题时假定规范不一致；③指出该行为的常见的，虽然是违规的。

十八、项目分析包括定性分析和定量分析，通过项目分析可以选择和修改测验题目，以提高测验的信度和效度。难度的定义：难度的指标通常一通过率表示，即答对过通过该题的人数的百分比。P（项目的难度）=R（答对或通过该项目的人数）/N（全体被测人数）*100%数越多，难度越低；反之亦然。P值大小和难度高低成反比。在费能力测验中（如人格测验），类似的指标是“通俗性”。难度的计算：二分法记分的项目大多数选择题，通过记1分，错误记0分。被试人较多时，可分为三组：分数最高的27%被试者为高分组，分数最低的27%为低分组，中间的46%为中间组。公式：P=（Ph+Pl）/2。P代表难度；Ph代表和Pl分别代表高分组和低分组的通过率。项目的难度：取决与测验的目的、性质以及项目的形式。P值越接近0.50，区分力越好。在选择题目时，做好使试题的平均难度接近0.5，各题难度在0.5 ±0.2之间。对是非题，其难度应该为0.75最合适；四选一的题目，其难度为0.63最合适。大多数测验在设计时最好呈常态分布的模型。为了保证项目具有较高的区分度，项目得分最好呈现常态分布。

十九、编制的三条原则：

1、宜用问句形式。如用填充形式，空格尽量放到最后；

2、如果是填充形式，空格不宜太多，空出来的应是关键词句；

3、每题应只有一个正确答案，而且答案要简短而具体。对不完整的答案，应事先规定评分标准。

操作题：编制的四条原则：

（1）明确所要测的目标，将其操作化；

（2）尽量选择真实性程度（即逼真度）较高的项目；

（3）指导语要简明扼要；

（4）制定好评分标准和计分方法。选择题的编制要领：

题干简单明确，意义完整；

选择要简明扼要；

每道题只给一个正确答案，其他属于诱答；

各选项长度应相等，尽量不要长短不一；

题干用词与选项用词不一致；

最好用同一形式，选项最好随机排列

二十、选择应注意二个方面：

1所选测验必须适合测量的目的；

2选测验必须符合心理测量学的要求。受练习效应影响的具体表现为：

（1）教育背景差、经验较少、智力较高者，受练习效应的影响大；

（2）着重速度的测验练习效应比较明显；

（3）重复实施相同的测验，受练习效应影响的程度要大于复本测验；

（4）两次测验之间的时距与练习效应成正比，相距3个月以上可忽略不计；

（5）一般平均练习效应，约1/5个标准差以下，3次后则不明显。

二十一、测验分数的综合分析：1、根据心理测验的特点进行分析，波动范围通常是用所测的IQ之加减5（85%--90%的可信限水平），例如IQ=100，IQ的波动范围是95--105；2、不能把分数绝对化，更不能根据一次测验结果下结论；3、为了对测验分数做出确切的解释，只有常模资料是不够的，还应该有信度和效度资料，在解释测验分数时，一定要依据最相近的团体、最匹配的情境中获得资料；4、对于来自不同测验的分数，不能直接进行比较。

��Z�(3�

心理咨询师三级第五章心理测量学知识点整理

猜你喜欢

热点阅读