IRT模型学习小结

2019-07-07  本文已影响0人  仰望星空的小狗

@[TOC]

IRT模型学习小结

关于IRT模型

与IRT模型相对应的经典测量理论CCT。经典测量理论与项目反应理论在测量领域均占有重要地位。经典测量理论形成较早,但是经典测量理论却有一些难以克服的缺点:

  1. 能力与观测分数之间的线性关系假设不合理。
    在经典测量理论中认为被试的能力与测试得到的分数是线性关系的,但是在实际情况中往往不程线性关系。比如我们在进行考试时,想要从50分考到60分很容易,但是想要从90分考到100分却很难。
  2. 被试的测验结果依赖于所施测项目的难度。
    被试由于做难易不同的题目而得到不同的分数,在经典测量理论中不同的分数表示不同的能力,这与常理不符。被试的能力不应由于所测题目的难度不同而不同,即,被试的能力应于所测题目的难度无关。
  3. 无法提供能力不同的被试如何对项目做出反应。
    对于已知能力的被试以及已知相关参数的题目,经典测量理论无法给出被试做该道题目的正确或错误概率

项目反应理论起源于 20 世纪三十年代,它是针对 CTT 所具有的不足而提出的,其基本思想是建立被试的潜在能力及其在项目上的作答反应之间的关系模型,即项目反应模型。它与经典测量理论相比,具有如下优点:

  1. 参数具有不变性。
    在项目反应理论下,项目的难度参数、区分度参数及被试的能力参数具有不变性。
  2. 被试的能力水平与项目参数之间关联化、模型化。
    在 IRT 中引入了项目特征曲线,这将项目难度、项目区分度以及被试的能力进行了有机的统一。
  3. IRT 定义了信息函数。
    IRT 中的信息函数反映了在不同的能力水平处,每个项目所提供的信息量的大小,信息量最大处的能力水平估计误差最小。
  4. 被试的能力参数与项目的难度参数具有配套性。
    被试的能力参数与项目的难度参数是定义在同一个量表上的,当一个被试的能力参数已知时,配一个项目参数已知的测验,即可预测被试的正确反应概率。

IRT模型原理

模型介绍

IRT模型是用于评估被试对某一项目或某一类项目的潜在特质。
IRT模型是建立在一定的假设之下:

被选择用来表示这种关系的函数比较多,用的比较多的是logistic模型,根据参数参数个数不同,可以分为单参数、双参数和三参数logistic模型。
IRT三参数logistic模型为:
p_i(\theta)=c_i+\frac{1-c_i}{1+exp(-da_i(\theta-b_i))}
该模型的曲线如下:

在这里插入图片描述
其中相关参数的定义如下
参数 定义 简单解释
d 常数 1.702
a_i 项目的区分度系数 表示项目或题目的区分度,在曲线中影响曲线中部的斜率,当斜率越小,那么就很难将被试的测试分数结果区分开
b_i 项目的难度系数 表示项目或题目的难度,在曲线中代表曲线横轴方向的位移,难度系数越大,则被试想要获得比较高的分数就需要比较高的能力
c_i 项目的猜测系数 表示即使被试对测试的项目一点先验知识都没有,靠蒙也能蒙对的概率,比如选择题有0.25的概率才对
\theta 被试的能力值 表示被试在项目或题目所要考核的知识点或能力方面的掌握程度
p_i(\theta) 被试做对该项目的概率

在使用IRT模型对被试进行能力评估的过程中,关键在于对参数的估计,包括对项目参数a_ib_ic_i,以及被试能力参数\theta的估计。

参数估计

IRT模型的参数估计方法有很多,包括极大似然估计,EM算法,贝叶斯算法等,本文将简单介绍使用极大似然估计方法进行参数估计过程。
在使用极大似然对IRT模型的项目参数和能力参数进行估计时,一般是当项目参数已知时,对能力参数进行极大似然估计,或当能力参数已知时,对项目参数进行极大似然估计。当项目参数和能力参数均未知时,则使用交替估计的方法来估计IRT模型的参数。大致步骤如下:

获取被试的得分矩阵,如下:

User item_1 item_2 item_3 ... item_M
u_1 1 0 1 ... 1
u_2 0 0 1 ... 0
u_3 1 1 1 ... 0
... ... ... ... ... ...
u_N 0 1 1 ... 1

其中u_n表示第n个被试,item_m表示第m个项目,表格中的0表示被试n做错了项目m,1表示被试n做对了项目m。

应用场景

上一篇下一篇

猜你喜欢

热点阅读