筑基课心理测量第三讲:测验的信度
中原焦点解决团队高级五期 讲师第13期 贺变丽坚持分享第2029天2024—1—12
第一单元信度的概念
一、信度的定义:
信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
信度只受随机误差(随机效应)的影响。
随机误差是不可避免的。
例:秤东西时手抖了
假如秤不标准,是八两的,再称也是不标准的,这就是系统误差。所以信度高,效度不一定高。效度高,信度一定高。心理测量的量表,要经过信度和效度的考验。一些心理测量的量表为适应人的心理发展,也是在不断修改的。
第二单元信度(可信任的程度)评估的方法
一、重测信度(test-retest reliabllity)
使用同一测验,在向样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数,叫重测信度,又称稳定性系数。
人的多数心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大变化。
重测就是重新测
优点:提供有关测验是香随时间变化的资料
缺点:易受练习和记忆的影响
一般是两周到四周较宜,间隔时间最好不超过六个月。
人生是慢慢累积的,不要有太多功利心。
二、复本信度(alternate—form liabillty)
以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。
复本信度反映的是测验在内容上的等值性,故又称等值性系数。
“复本”即“复印本”
父母确实对孩子会有很大影响,但不能说父母就是原件,孩子就是复印件,孩子是有很多改变的可能性的,即便是复印件,也可能复印了父母的一些优点和特质。
如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。
优点:避免重测信度的一些问题(记忆、学习效应等)
复本信度局限性:
其一,如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;
其二,由于第二个测验只改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题。
最后,对于许多测验来说,建立复本是十分困难的。
学心理学如果你掌握了最本质的东西,好多都是可以去做的,因为很多知识是相通的。
三、内部一致性信度
(一)分半信度(split—half reliability)
通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。
(二)同质性信度
代表测验内部所有题目间的一致性。
各题目得分有较高正相关时,测验是同质的;即使所有题目看起来好像测量同一特质,但相关很低或为负相关时,则测验为异质的。
“同质”即“共同质量”
物以类聚,人以群分。
四、评分者信度
随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。
一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。
实际上有多少误差的来源,便有多少估计信度的方法。
评分的时候去掉最高分和最低分,就是这个道理。
恪守咨询的伦理,坐稳咨询师的位置。
第三单元影响信度的因素
分数分布范围越大,相关越高,信度越高。
一、样本特征
(一)样本团体异质性的影响
一般而言一看获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。
(二)样本团体平均能力水平的影响
对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。
不要把鸡蛋放在同一个篮子里,就是异质。
二、测验长度
一般来说,在一个测验中增加同质的题目,可以便信度提高。
第一,测验越长,测验的测题取样或内容取样就越有代表性。
第二,测验越长,被试的猜测因素影响就越小。
增加测验长度的效果应遵循报酬递减率原则
有时反而会引起被试的疲劳和反感而降低可靠性。
孩子喜欢吃哪一种菜,父母可能经常给孩子做这个菜。
三、测验难度
难度太大或太小,使得分数范围缩小,信度会降低。
平均难度0.5,信度最大。
中等难度最好。
四、时间间隔
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大。
专栏:韦氏成人智力量表WAIS
言语量表——言语智商VIQ
操作量表——操作智商PIQ
总量表——总智商FIQ
第四节测验的效度
一、效度的定义
效度(有效的程度)是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。
效度受随机误差和系统误差影响!
二、效度的性质
(一)效度具有相对性
是什么测验就用在什么地方
在评鉴测验的效度时,必须考虑其目的与功能。
用对地方,稻草也可以变为黄金。
(二)效度具有连续性
用效度是较高还是较低来评价
专栏:信度和效度的关系
一、信度是效度的必要而非充分条件
信度好效度未必好
效度好信度一定好
二、效度是受信度制约的
信都不可信又谈何可靠?
第二单元效度评估的方法
美国心理学会進1924年所发行的《教育与心理测量之标推》一书中将效度分为三大类:
1.内容效度
2.构想效度
3.效标效度(实践出真知)
一、内容效度(content-related valldity)
(一)什么是内容效度
内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。又称“逻辑效度”。
(二)内容效度的评估方法
1.专家判断法
最常用的方法是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。
2.统计分析法
例如计算两个评分者之闻评定的一致性
两个测验复本上得分之相关
再测法(学习前测,学习后再测)
3.经验推测法
通过实践来检验效度
如儿童发展量表,通过率随年龄增高而增高。