精华内容
下载资源
问答
  • 项目反应理论 EM估计

    千次阅读 2018-12-09 14:31:22
    项目反应理论参数的EM估计 IRT(项目反应理论)广泛应应用于心理测量学,相比CTT(传统测量理论)的主要优势在于不依赖于样本,能够为被试者提供具有一致性的测量结果。 IRT的基本假设: 单维性,即能力是单维度的...

    项目反应理论参数的EM估计

    写在前面:

    本文主要描述了整个IRT使用EM算法参数的估计过程,其中涉及大量公式,如只是需要了解IRT相关基础知识,请转战wiki~~
    预警: 大量公式来袭~~
    

    IRT(项目反应理论)广泛应应用于心理测量学,相比CTT(传统测量理论)的主要优势在于不依赖于样本,能够为被试者提供具有一致性的测量结果。

    IRT的基本假设:

    1. 单维性,即能力是单维度的。
    2. 局部独立性, 即项目间局部独立。
    3. 项目反应函数假设,即被试者对项目对反应符合项目反应方程。

    IRT 模型:

    常见的IRT模型包括2PL模型和3PL模型,其中2PL模型表达式如下:

    p i , j ( θ i ) = 1 1 + exp ⁡ [ − D a j ( θ i − b j ) ] p _ { i , j } \left( \theta _ { i } \right) = \frac { 1 } { 1 + \exp \left[ - D a _ { j } \left( \theta _ { i } - b _ { j } \right) \right] } pi,j(θi)=1+exp[Daj(θibj)]1

    其中 θ i \theta _ { i } θi表示被试者的能力, a j a _ { j } aj是项目的区分度, b j b _ { j } bj是项目的难度,D=1.7。

    参数估计:

    对于IRT参数估计有多种方法,如对于项目参数的估计有:边际极大似然估计(MMLE),极大边际后验法(MMAP),EM,MCMC等方法,对于能力参数的估计有极大似然(MLE),贝叶斯众数法(MAP),贝叶斯后验期望估计法(EAP)等。本文重点介绍对项目参数的EM估计。

    建模:

    1. 被观测数据 Y \mathbf { Y } Y是N*J维的,N表示有N个被试者,J表示有J个题目, Y = ( y 1 , y 2 , … , y N ) \mathbf { Y } = \left( \mathbf { y } _ { 1 } , \mathbf { y } _ { 2 } , \dots , \mathbf { y } _ { N } \right) Y=(y1,y2,,yN) y i = ( y i 1 , y i 2 , … , y i J ) \mathbf { y } _ { i }=\left( y _ { i 1 } , y _ { i 2 } , \ldots , y _ { i J } \right) yi=(yi1,yi2,,yiJ),其中 y i j y _ { i j } yij表示第i个被试者回答第j道题目的答案;
    2. 不可观测变量为 θ = ( θ 1 , θ 2 , … , θ N ) \boldsymbol { \theta } = \left( \theta _ { 1 } , \theta _ { 2 } , \ldots , \theta _ { N } \right) θ=(θ1,θ2,,θN) 其中 θ i \theta _ { i } θi是第i个被试者的能力值,模型中假定 θ i \theta _ { i } θi只能取离散的值 q k , k = 1 , … , K q _ { k } , k = 1 , \dots , K qk,k=1,,K,对应取 q k q _ { k } qk的概率为 π k , k = 1 , … , K \pi _ { k } , k = 1 , \ldots , K πk,k=1,,K,即 θ i \theta _ { i } θi为多项式分布,其概率为: π = ( π 1 , π 2 , … , π K ) \boldsymbol {\pi} = \left( \pi _ { 1 } , \pi _ { 2 } , \dots , \pi _ { K } \right) π=(π1,π2,,πK);不可观测变量为 θ = ( θ 1 , θ 2 , … , θ N ) \boldsymbol { \theta } = \left( \theta _ { 1 } , \theta _ { 2 } , \ldots , \theta _ { N } \right) θ=(θ1,θ2,,θN) 其中 θ i \theta _ { i } θi是第i个被试者的能力值,模型中假定 θ i \theta _ { i } θi只能取离散的值 q k , k = 1 , … , K q _ { k } , k = 1 , \dots , K qk,k=1,,K,对应取 q k q _ { k } qk的概率为 π k , k = 1 , … , K \pi _ { k } , k = 1 , \ldots , K πk,k=1,,K,即 θ i \theta _ { i } θi为多项式分布,其概率为: π = ( π 1 , π 2 , … , π K ) \boldsymbol {\pi} = \left( \pi _ { 1 } , \pi _ { 2 } , \dots , \pi _ { K } \right) π=(π1,π2,,πK)
    3. 完全数据为 [ ( y 1 , θ 1 ) , ( y 2 , θ 2 ) , … , ( y N , θ N ) ] \left[ \left( \mathbf { y } _ { 1 } , \theta _ { 1 } \right) , \left( \mathbf { y } _ { 2 } , \theta _ { 2 } \right) , \ldots , \left( \mathbf { y } _ { N } , \theta _ { N } \right) \right] [(y1,θ1),(y2,θ2),,(yN,θN)];完全数据为 [ ( y 1 , θ 1 ) , ( y 2 , θ 2 ) , … , ( y N , θ N ) ] \left[ \left( \mathbf { y } _ { 1 } , \theta _ { 1 } \right) , \left( \mathbf { y } _ { 2 } , \theta _ { 2 } \right) , \ldots , \left( \mathbf { y } _ { N } , \theta _ { N } \right) \right] [(y1,θ1),(y2,θ2),,(yN,θN)]
    4. 待估计参数为项目参数 Δ = ( δ 1 , δ 2 , . . . δ j ) \boldsymbol {\Delta}=(\boldsymbol { \delta } _ { 1 },\boldsymbol { \delta } _ { 2 },...\boldsymbol { \delta } _ { j }) Δ=(δ1,δ2,...δj),其中 δ j \boldsymbol { \delta } _ { j } δj为第j道题的参数。待估计参数为项目参数 Δ = ( δ 1 , δ 2 , . . . δ j ) \boldsymbol {\Delta}=(\boldsymbol { \delta } _ { 1 },\boldsymbol { \delta } _ { 2 },...\boldsymbol { \delta } _ { j }) Δ=(δ1,δ2,...δj),其中 δ j \boldsymbol { \delta } _ { j } δj为第j道题的参数。

    EM算法应用于IRT中是迭代估计 Δ \boldsymbol {\Delta} Δ π \boldsymbol {\pi} π:
    E step: 根据给定的缺失数据的分布,观察数据和参数初始值,求完全数据的对数似然函数的条件期望。
    M step: 极大化E-step给出的完全数据的对数似然函数的条件期望,求参数的值。

    似然函数

    给定观测变量 y = ( y 1 , y 2 , … , y J ) \mathbf { y } = \left( y _ { 1 } , y _ { 2 } , \ldots , y _ { J } \right) y=(y1,y2,,yJ)并假定能力参数分布为: π = ( π 1 , π 2 , … , π J ) \pi = \left( \pi _ { 1 } , \pi _ { 2 } , \dots , \pi _ { J } \right) π=(π1,π2,,πJ),项目参数为 Δ = ( δ 1 , δ 2 , . . . δ j ) \boldsymbol {\Delta}=(\boldsymbol { \delta } _ { 1 },\boldsymbol { \delta } _ { 2 },...\boldsymbol { \delta } _ { j }) Δ=(δ1,δ2,...δj),则观测变量的条件概率分布为:

    f ( y ∣ Δ , π ) = ∑ k = 1 K f ( y , q k ∣ Δ , π k ) f ( \mathbf { y } | \mathbf { \Delta } , \boldsymbol { \pi } ) = \sum _ { k = 1 } ^ { K } f \left( \mathbf { y } , q _ { k } | \Delta , \pi _ { k } \right) f(yΔ,π)=k=1Kf(y,qkΔ,πk) = ∑ k = 1 K f ( y ∣ q k , Δ ) π k = \sum _ { k = 1 } ^ { K } f ( \mathbf { y } | q _ { k } , \Delta ) \pi _ { k } =k=1Kf(yqk,Δ)πk

    由IRT的局部独立性假设,由于给定能力变量下项目反应结果是相互独立的,可得:
    f ( y ∣ q k , Δ ) = ∏ j = 1 J P ( q k ∣ δ j ) y j [ 1 − P ( q k ∣ δ j ) ] 1 − y j f ( \mathbf { y } | q _ { k } , \mathbf { \Delta } ) = \prod _ { j = 1 } ^ { J } P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) ^ { y _ { j } } \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] ^ { 1 - y _ { j } } f(yqk,Δ)=j=1JP(qkδj)yj[1P(qkδj)]1yj

    其中 P ( q k ∣ δ j ) P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) P(qkδj)是题目j的项目特征曲线,描述了给定能力下项目j答对的概率。由上式可以推出,完全数据的似然函数为: L ( Y , θ ∣ Δ , π ) = ∏ i = 1 N ∏ j = 1 J P ( θ i ∣ δ j ) y i j [ 1 − P ( θ i ∣ δ j ) ] 1 − y i j f ( θ i ∣ π ) = ∏ j = 1 J ∏ i = 1 N P ( θ i ∣ δ j ) y i j [ 1 − P ( θ i ∣ δ j ) ] 1 − y i j f ( θ i ∣ π ) = ∏ j = 1 J ∏ k = 1 K P ( θ k ∣ δ j ) r j k [ 1 − P ( q k ∣ δ j ) ] n k − r j k π k n k \begin{aligned} L ( \mathbf { Y } , \boldsymbol { \theta } | \mathbf { \Delta } , \boldsymbol { \pi } ) & = \prod _ { i = 1 } ^ { N } \prod _ { j = 1 } ^ { J } P \left( \theta _ { i } | \boldsymbol { \delta } _ { j } \right) ^ { y _ { i j } } \left[ 1 - P \left( \theta _ { i } | \boldsymbol { \delta } _ { j } \right) \right] ^ { 1 - y _ { i j } } f \left( \theta _ { i } | \boldsymbol { \pi } \right) \\ & = \prod _ { j = 1 } ^ { J } \prod _ { i = 1 } ^ { N } P \left( \theta _ { i } | \boldsymbol { \delta } _ { j } \right) ^ { y _ { i j } } \left[ 1 - P \left( \theta _ { i } | \boldsymbol { \delta } _ { j } \right) \right] ^ { 1 - y _ { i j } } f \left( \theta _ { i } | \boldsymbol { \pi } \right) \\ & = \prod _ { j = 1 } ^ { J } \prod _ { k = 1 } ^ { K } P \left( \theta _ { k } | \boldsymbol { \delta } _ { j } \right) ^ { r _ { j k } } \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] ^ { n _ { k } - r _ { j k } } \pi _ { k } ^ { n _ { k } } \end{aligned} L(Y,θΔ,π)=i=1Nj=1JP(θiδj)yij[1P(θiδj)]1yijf(θiπ)=j=1Ji=1NP(θiδj)yij[1P(θiδj)]1yijf(θiπ)=j=1Jk=1KP(θkδj)rjk[1P(qkδj)]nkrjkπknk
    其中, f ( θ i ∣ π ) = π k f \left( \theta _ { i } | \boldsymbol { \pi } \right) = \pi _ { k } f(θiπ)=πk if θ i = q k \theta _ { i } = q _ { k } θi=qk n k n _ { k } nk是N个被试者中能力为 q k q _ { k } qk的人数, r j k \boldsymbol { r }_{ j k} rjk则是 n k n _ { k } nk人中答题正确的人数。
    为方便计算,将上式化成对数似然函数为:
    log ⁡ [ L ( R , n ∣ Δ , π ) ] = ∑ j = 1 J ∑ k = 1 K r j k log ⁡ [ P ( q k ∣ δ j ) ] + ( n k − r j k ) log ⁡ [ 1 − P ( q k ∣ δ j ) ] + n k log ⁡ [ π k ] \log [ L ( \mathbf { R } , \mathbf { n } | \mathbf { \Delta } , \boldsymbol { \pi } ) ] = \sum _ { j = 1 } ^ { J } \sum _ { k = 1 } ^ { K } r _ { j k } \log \left[ P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] + \left( n _ { k } - r _ { j k } \right) \log \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] + n _ { k } \log \left[ \pi _ { k } \right] log[L(R,nΔ,π)]=j=1Jk=1Krjklog[P(qkδj)]+(nkrjk)log[1P(qkδj)]+nklog[πk]

    E-Step:

    E步估计隐变量 θ \boldsymbol { \theta} θ,在给定项目参数 Δ ( s ) \boldsymbol {\Delta}^{(s)} Δ(s) 和能力分布 π ( s ) \boldsymbol {\pi}^{(s)} π(s)(由M步迭代估计得到)的和观测变量下隐变量的条件分布为:
    f ( q k ∣ y i , Δ ( s ) , π ( s ) ) = f ( y i ∣ q k , Δ ( s ) ) π k ( s ) ∑ k ′ = 1 K f ( y i ∣ q k ′ , Δ ( s ) ) π k ′ ( s ) = π k ( s ) ∏ j = 1 J P ( q k ∣ δ j ( s ) ) y i j [ 1 − P ( q k ∣ δ j ( s ) ) ] 1 − y i j ∑ k ′ = 1 K π k ′ ( s ) ∏ j = 1 J P ( q k ′ ∣ δ j ( s ) ) y i j [ 1 − P ( q k ′ ∣ δ j ( s ) ) ] 1 − y i j \begin{aligned} f \left( q _ { k } | \mathbf { y } _ { i } , \Delta ^ { ( s ) } , \pi ^ { ( s ) } \right) & = \frac { f \left( \mathbf { y } _ { i } | q _ { k } , \mathbf { \Delta } ^ { ( s ) } \right) \pi _ { k } ^ { ( s ) } } { \sum _ { k ^ { \prime } = 1 } ^ { K } f \left( \mathbf { y } _ { i } | q _ { k ^ { \prime } } , \Delta ^ { ( s ) } \right) \pi _ { k ^ { \prime } } ^ { ( s ) } } \\ & = \frac { \pi _ { k } ^ { ( s ) } \prod _ { j = 1 } ^ { J } P \left( q _ { k } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) ^ { y _ { i j } } \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) \right] ^ { 1 - y _ { i j } } } { \sum _ { k ^ { \prime } = 1 } ^ { K } \pi _ { k ^ { \prime } } ^ { ( s ) } \prod _ { j = 1 } ^ { J } P \left( q _ { k ^ { \prime } } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) ^ { y _ { i j } } \left[ 1 - P \left( q _ { k ^ { \prime } } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) \right] ^ { 1 - y _ { i j } } } \end{aligned} f(qkyi,Δ(s),π(s))=k=1Kf(yiqk,Δ(s))πk(s)f(yiqk,Δ(s))πk(s)=k=1Kπk(s)j=1JP(qkδj(s))yij[1P(qkδj(s))]1yijπk(s)j=1JP(qkδj(s))yij[1P(qkδj(s))]1yij

    n k ( s ) = E ( n k ∣ Y , Δ ( s ) , π ( s ) ) = ∑ i = 1 N f ( q k ∣ y i , Δ ( s ) , π ( s ) ) = ∑ i = 1 N f ( y i ∣ q k , Δ ( s ) ) π k ( s ) ∑ k ′ = 1 K f ( y i ∣ q k ′ , Δ ( s ) ) π k ′ ( s ) = ∑ i = 1 N π k ( s ) ∏ j = 1 J P ( q k ∣ δ j ( s ) ) y i j [ 1 − P ( q k ∣ δ j ( s ) ) ] 1 − y i j ∑ k ′ = 1 K π k ′ ( s ) ∏ j = 1 J P ( q k ′ ∣ δ j ( s ) ) y i j [ 1 − P ( q k ′ ∣ δ j ( s ) ) ] 1 − y i j n _ { k } ^ { ( s ) } = E \left( n _ { k } | \mathbf { Y } , \Delta ^ { ( s ) } , \boldsymbol { \pi } ^ { ( s ) } \right)= \sum _ { i = 1 } ^ { N } f \left( q _ { k } | \mathbf { y } _ { i } , \mathbf { \Delta } ^ { ( s ) } , \boldsymbol { \pi } ^ { ( s ) } \right)= \sum _ { i = 1 } ^ { N } \frac { f \left( \mathbf { y } _ { i } | q _ { k } , \mathbf { \Delta } ^ { ( s ) } \right) \pi _ { k } ^ { ( s ) } } { \sum _ { k ^ { \prime } = 1 } ^ { K } f \left( \mathbf { y } _ { i } | q _ { k ^ { \prime } } , \boldsymbol { \Delta } ^ { ( s ) } \right) \pi _ { k ^ { \prime } } ^ { ( s ) } }= \sum _ { i = 1 } ^ { N } \frac { \pi _ { k } ^ { ( s ) } \prod _ { j = 1 } ^ { J } P \left( q _ { k } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) ^ { y _ { i j } } \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) \right] ^ { 1 - y _ { i j } } } { \sum _ { k ^ { \prime } = 1 } ^ { K } \pi _ { k ^ { \prime } } ^ { ( s ) } \prod _ { j = 1 } ^ { J } P \left( q _ { k ^ { \prime } } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) ^ { y _ { i j } } \left[ 1 - P \left( q _ { k ^ { \prime } } | \boldsymbol { \delta } _ { j } ^ { ( s ) } \right) \right] ^ { 1 - y _ { i j } } } nk(s)=E(nkY,Δ(s),π(s))=i=1Nf(qkyi,Δ(s),π(s))=i=1Nk=1Kf(yiqk,Δ(s))πk(s)f(yiqk,Δ(s))πk(s)=i=1Nk=1Kπk(s)j=1JP(qkδj(s))yij[1P(qkδj(s))]1yijπk(s)j=1JP(qkδj(s))yij[1P(qkδj(s))]1yij
    r j k ( s ) = y i j n k ( s ) r _ { j k } ^ { ( s ) } = {y}_{ij}n _ { k } ^ { ( s ) } rjk(s)=yijnk(s)

    M-Step:

    M步是使用E步计算的 n k ( s ) n _ { k } ^ { ( s ) } nk(s) r j k ( s ) r _ { j k } ^ { ( s ) } rjk(s)去迭代估计 Δ , π \Delta , \pi Δ,π。根据上述的对数似然函数可得:

    log ⁡ [ L ( R ( s ) , n ( s ) ∣ Δ , π ) ] = ∑ j = 1 J l ( δ j ) + l ( π ) \log \left[ L \left( \mathbf { R } ^ { ( s ) } , \mathbf { n } ^ { ( s ) } | \Delta , \boldsymbol { \pi } \right) \right] = \sum _ { j = 1 } ^ { J } l \left( \boldsymbol { \delta } _ { j } \right) + l ( \boldsymbol { \pi } ) log[L(R(s),n(s)Δ,π)]=j=1Jl(δj)+l(π)

    其中
    l ( δ j ) = ∑ k = 1 K r j k ( s ) log ⁡ [ P ( q k ∣ δ j ) ] + ( n k ( s ) − r j k ( s ) ) log ⁡ [ 1 − P ( q k ∣ δ j ) ] l \left( \boldsymbol { \delta } _ { j } \right) = \sum _ { k = 1 } ^ { K } r _ { j k } ^ { ( s ) } \log \left[ P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] + \left( n _ { k } ^ { ( s ) } - r _ { j k } ^ { ( s ) } \right) \log \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] l(δj)=k=1Krjk(s)log[P(qkδj)]+(nk(s)rjk(s))log[1P(qkδj)]
    l ( π ) = ∑ k = 1 K n k ( s ) log ⁡ [ π k ] l ( \boldsymbol { \pi } ) = \sum _ { k = 1 } ^ { K } n _ { k } ^ { ( s ) } \log \left[ \pi _ { k } \right] l(π)=k=1Knk(s)log[πk]

    使用极大似然估计求 Δ , π \Delta , \pi Δ,π,由于 π \pi π是服从多项式分布的,所以很容易得到

    π k ( s + 1 ) = n k ( s ) N \pi _ { k } ^ { ( s + 1 ) } = \frac { n _ { k } ^ { ( s ) } } { N } πk(s+1)=Nnk(s)

    为求 Δ \Delta Δ,对 l ( δ j ) l \left( \boldsymbol { \delta } _ { j } \right) l(δj)关于 δ j \boldsymbol { \delta } _ { j } δj求导:
    ∂ l ( δ j ) ∂ δ t j = 0 \frac { \partial l \left( \boldsymbol { \delta } _ { j } \right) } { \partial \delta _ { t j } } = 0 δtjl(δj)=0
    ∑ k = 1 K r j k ( s ) − n k ( s ) P ( q k ∣ δ j ) [ 1 − P ( q k ∣ δ j ) ] P ( q k ∣ δ j ) ∂ P ( q k ∣ δ j ) ∂ δ t j = 0 \sum _ { k = 1 } ^ { K } \frac { r _ { j k } ^ { ( s ) } - n _ { k } ^ { ( s ) } P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) } { \left[ 1 - P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) \right] P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) } \frac { \partial P \left( q _ { k } | \boldsymbol { \delta } _ { j } \right) } { \partial \delta _ { t j } } = 0 k=1K[1P(qkδj)]P(qkδj)rjk(s)nk(s)P(qkδj)δtjP(qkδj)=0

    结果:

    使用12000名学生的约100万条做题记录进行IRT参数估计,其中涉及题目约1000道左右,首先使用EM算法对题目参数进行估计,然后使用EAP对学生能力进行估计,结果分别如下:
    在这里插入图片描述
    上图中,ability为学生能力对评估结果,acc为学生实际答题的准确率,length为做题记录的长度,从图中可以看出,估计出的学生能力与实际答题的准确率正相关,且估计出的学生能力分布呈正态。相同做题准确率下,不同做题长度对评估结果也有影响。

    在这里插入图片描述

    上图为估计的题目参数,a表示题目的区分度,b表示题目的难度,可以看出题目难度和题目的准确率严格正相关,区分度和准确率呈倒U型。


    参考文献:

    1. http://www.openirt.com/b-a-h/papers/note9801.pdf IRT Parameter Estimation using the EM Algorithm
    2. https://zhuanlan.zhihu.com/p/29887184 Python与项目反应理论:基于EM和MCMC的参数估计算法
    [3]. https://www.cnblogs.com/jiangxinyang/p/9621997.html IRT模型的参数估计方法(EM算法和MCMC算法)
    [4]. https://www.john-uebersax.com/stat/irt2.htm How to Calculate Expected A Posteriori (EAP) Scores for Unidimensional and Multidimensional Latent Trait Models
    [5]. https://en.wikipedia.org/wiki/Item_response_theory Item response theory

    展开全文
  • 基于混合项目反应理论模型,实现了对客观题组和主观测试组成项目结构的模型构建,并给出一种改进人工蜂群算法实现该混合模型的参数估计.在模拟数据上通过与Winbug的对比结果验证了利用改进人工蜂群算法估计混合模型...
  • 利用DSY算法开发了多维二级评分模型的参数估计程序,推广了该类评分模型的参数估计方法,比较了MCMC和DSY算法,说明了DSY算法能有效估计该类型评分模型的参数,提出了一些有待研究的问题.
  • 多维项目反应理论补偿性模型参数估计:基于广义回归神经网络集合.pdf
  • 探讨了几种常用的基于项目反应理论(I RT) 的试题参数估计方法, 并分析了每一种估计方法的优缺点及各自的适用领域, 为构建基于IRT的试题库系统提供理论参考。
  • 项目反应理论

    万次阅读 2018-01-07 11:58:59
    项目反应理论(item response theory)是属于心理学中认知诊断常用的一种理论,即根据被测试者针对某个问题的答案来对被测者的认知状况进行估计。“项目”实质就是测试题,“反应”就是被测者的答案。也有学者称项目...

    项目反应理论(item response theory)是属于心理学中认知诊断常用的一种理论,即根据被测试者针对某个问题的答案来对被测者的认知状况进行估计。“项目”实质就是测试题,“反应”就是被测者的答案。也有学者称项目反应理论也是机器学习中的一个类别,即根据被测者对测试题的反应来判定被测者所属的类别。

    1、 项目特征曲线

    项目特征曲线可用来描述项目(问题)难度与区分度,即项目的难度与区分度是项目的两个维度。下图展示了一个典型的项目(问题)特征曲线。

    这里写图片描述

    图中,横坐标表示能力值,纵坐标表示做出该题的概率。显然,能力值越低做出该题的概率越小,能力值越高做出该题的概率越大。

    一个项目的难度可以分为[很容易,容易,中等,难,很难]五个层次
    一个项目的区分度可以分为[很低,低,中等,高,很高]五个层次
    因此,每一个项目都有25种可能的曲线

    上图中的项目特征曲线表示中等的难度与中等的区分度,类似地还有中等难度高区分度的曲线等等,详见item response theory

    2、项目特征曲线模型

    如何用一个数学表达式来表示项目特征曲线是项目特征曲线建模需要考虑的问题。目前主要有三种模型,这三种模型本质上都属于Logistic。

    2.1 Logistic模型

    P(θ)=11+ea(θb)

    • b:代表项目难度系数,理论上可以取(- ,+ ),典型值在[-3,3]之间
    • a:代表项目区分度系数,理论上可以取(- ,+ ),典型值在[-2.8,2.8]之间
    • θ :代表能力值

    2.2 Rasch模型

    Rasch是Logistic模型的一种情况,也称为一个参数的Logistic模型。当Logistic模型中项目区分度a的值为1时,即为Rasch模型。

    P(θ)=11+e1(θb)

    • b:代表项目难度系数,理论上可以取(- ,+ ),典型值在[-3,3]之间
    • θ :代表能力值

    2.3 三参数模型

    P(θ)=c+1c1+ea(θb)

    • b:代表项目难度系数,理论上可以取(- ,+ ),典型值在[-3,3]之间
    • a:代表项目区分度系数,理论上可以取(- ,+ ),典型值在[-2.8,2.8]之间
    • c:代表猜测参数,猜测参数取值范围是[0,1],典型值通常超过0.35
    • θ :代表能力值

    注意:猜测系数与个人能力值无关,也就是高能力与低能力值的被测试者有相同的概率通过猜测答对题目。

    展开全文
  • IRTPRO是使用项目响应理论(IRT)进行项目校准和测试评分的应用程序。它带有直观的图形用户界面,并提供内置的生产质量IRT图形。IRTPRO适合教育者,学生,研究人员和评估组织使用,在教育,心理,社会和健康科学领域的...

    IRTPRO是一套全新的使用IRT进行项目校准(item calibration)和测试评分(test scoring)的全新应用。

    IRTPRO是使用项目响应理论(IRT)进行项目校准和测试评分的应用程序。它带有直观的图形用户界面,并提供内置的生产质量IRT图形。IRTPRO适合教育者,学生,研究人员和评估组织使用,在教育,心理,社会和健康科学领域的应用越来越广泛。

    在IRTPRO中实施项目校准和评分的项目响应理论(IRT)模型基于以下广泛使用的响应函数的一维和多维验证性因子分析(CFA)或探索性因子分析(EFA)版本:双参数逻辑(2PL)(Birnbaum,1968){等式约束包括单参数逻辑(1PL)(Thissen,1982)}

    三参数物流(3PL)(Birnbaum,1968)

    Graded(Samejima,1969;1997)

    广义部分信贷(Muraki,1992,1997)

    Nominal(Bock,1972,1997;Thissen,Cai,&Bock,2010)

    这些项目响应模型可以在测试会规模内任何组合混合,并且可以指定参数之间的任何(可选的)用户指南的相等约束或参数的固定值。IRTPRO当前将IRT模型用用于单级多元数据集。

    IRTPRO实施项目参数估计(项目校准)的(ML)方法,或者计算MAP估计是否为项目参数指定(可选)先前分布。话虽如此,可以使用替代计算方法,每种计算方法都为维度和模型结构的某些组合提供了理想性能:

    Bock-Aitkin(BAEM)(Bock&Aitkin,1981)

    Bifactor EM(Gibbons&Hedeker,1992;Gibbons等,2007;Cai,Yang&Hansen(2011)

    广义降维EM(Cai,2010-a)

    自适应求积法(ADQEM)(Schilling&Bock,2005)

    Metropolis-Hasting Robbins-Monro(MHRM)(Cai,2010-b,2010-c)

    马尔可夫链蒙特卡洛(MCMC)Patz-Junker(1999-a,1999-b)

    可以使用以下任何方法来计算IRTPRO中的IRT量表分数:

    响应模式的MAP

    期望后验(EAP)用于响应模式(Bock&Mislevy,1982)

    期望后验(EAP)的总分(Thissen&Orlando,2001;Thissen,Nelson,Rosa,&McLeod,2001)

    IRTPRO中的数据结构可以将受访者分为几类,并且可以对多个组估计总体潜在变量均值和方差—协方差矩阵(Mislevy,1984,1985)。通常,如果只有一组,则总体潜在变量均值和方差是固定的(通常为0和1)以指定规模;对于多个组,通常将一组标为具有潜在值的“参考组”。

    为了检测差异项功能(DIF),IRTPRO使用Wald检验,该模型是根据Lord(1977)的建议建模的,但具有使用补充(SEM)算法计算的精确参数误差方差—协方差矩阵(Cai,2008)。

    根据项目的数量,响应类别和受访者,IRTPRO在项目校准后报告适合度和诊断统计数据的多种变化。通常报告-2对数似然、Akaike信息准则(AIC)(Akaike,1974)和Bayesian信息准则(BIC)(Schwarz,1978)的值。如果样本数量充分超过了基于项目响应模式对受访者进行完整交叉分类中的像元数,则会报告对一般多项式选择的总体似然比检验。对于某些型号,M2统计数据(Maydeu-Olivares&Joe,2005,2006;Cai,Maydeu-Olivares,Coffman,&Thissen,2006)也已计算。诊断统计包括对Chen&Thissen(1997)描述的局部依赖性(LD)统计量的多态反应的概括和Orlando&Thissen(2000,2003)建议的SS-X2项目拟合统计量。

    IRTPRO 5中的新功能

    导入文本数据(如.csv文件)时处理丢失的数据

    导入文本数据时,IRTPRO 5使用前50条非空白行来确定数据类型。在此检查过程中,主要发现任何单元格均为数字数据,该列即为数字。在以前的代码中,一旦找到字符串数据,就假定该列为字符类型,并将其转换为数值0。在以前的IRTPRO版本中,只有一个空字段(两个连续的逗号,中间用两个或多个空格分隔)被识别为缺失数据值,并编码为-1(默认缺失数据代码)。在IRTPRO 5中,字符串模式“NA”和“NIL”也被识别为丢失数据。这些特殊模式不区分大小写,如下所示:

    0,0,na,1,1

    0,0,0,1,1

    0,0,1,Nil,0

    0,0,1,0,1

    0,NA,1,1,0

    使用统计/传输版本15以确保与SPSS,SAS和STATA等软件包的导入/导出兼容性。

    数据导入功能已从Stat/Transfer版本14升级到新发布的版本15。其中,Stat/Transfer支持从新的SAS,SPSS,STATA,MINITAB,MATLAB和R软件导入数据。

    能够使用第三方程序来自动生成语法文件

    在生产中使用时,研究人员通常必须分析包含大量项目(通常超过200个)的数据。使用IRTPRO 5,可以按以下顺序简化按在数据集中出现的顺序指定的项目列表:-“符号”

    IRTPRO支持项目范围,例如,以下命令上的Item1-Item45:

    项目、代码、型号、BFA

    例如,假设在IRTPRO(.ssig)数据文件中,Calm、Tense、Regretful、AtEase、Anxious和Nervous项按该顺序出现

    代码(Calm)=0(0),1(1),2(2),3(3),4(4);

    代码(Tense)=0(0),1(1),2(2),3(3),4(4);

    代码(Regretful)=0(0),1(1),2(2),3(3),4(4);

    代码(AtEase)=0(0),1(1),2(2),3(3),4(4);

    代码(Anxious)=0(0),1(1),2(2),3(3),4(4);

    代码(Nervous)=0(0),1(1),2(2),3(3),4(4);

    可以写成

    代码(Calm-Nervous)=0(0),1(1),2(2),3(3),4(4)。

    展开全文
  • 44, No.10, 1402−1407Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2012.0 1402(西南大学数学与统计学院, 重庆 400715)基于因子分析和单维项目反应理论的多维项目反应理论是测量理论的新发展方向之一。...

    心理学报 2012, Vol. 44, No.10, 1402−1407

    Acta Psychologica Sinica DOI: 10.3724/SP.J.1041.2012.0 1402

    (西南大学数学与统计学院, 重庆 400715)

    基于因子分析和单维项目反应理论的多维项目反应理论是测量理论的新发展方向之一。但是 , 多

    维项目反应理论仍处于不成熟的发展阶段, 多数研究也只是以二级评分为主。本文首先介绍了逻辑斯蒂形式

    的多维等级反应模型, 并以二维等级反应模型为例 , 分析了模型的数学函数图像及其性质。然后, 推导出了

    多维等级反应模型的项目信息函数, 并结合实例进行了讨论。进一步地 , 本文阐述了使用联合极大似然估计

    和马尔科夫链蒙特卡洛方法估计多维等级反应模型参数的思想。最后, 指出了一些有待研究的问题。

    多维项目反应理论; 多维等级反应模型; 项目信息函数 ; 参数估计

    B841

    1 问题的提出 上世纪 70 年代就开始探索 MIRT 模型, Mulaik 于

    1972 年率先提出了一个二级评分的 MIRT 模型 , 之

    自 20 世纪 60 年代至今, 测量理论经历了从经 后, Sympon (1978)、Whitely (1981) 以及 Mckinley

    典测量理论(Classical Test Theory, CTT)到项目反应 和 Reckase (1982)等也相继提出了各自的模型。然

    理论(Item Response Theory, IRT)的巨大变革, IRT 而, 这些早期的模型以及之后的相关研究都是针对

    克服了 CTT 的种种局限, 实现了被试与项目关系 二级评分试题的, 对于多级评分的 MIRT 模型, 直

    间的模型化、参数化。特别是随着计算机技术的发 到 1993 年才由 Muraki 和 Carlson (1993)提出正态累

    展, 使得 IRT 得以迅速推广应用, 从而逐步取代了 积 形 式 的 多 维 等 级 反 应 模 型 (Multidimensional

    CTT 而成为现代心理测量学研究的主要内容之一。 Grade Response Model, MGRM), 其它一些多级模

    IRT 通常假设测验只测量被试的一种能力水平, 然 型 更 是 在 最 近 几 年 才 得 以 提 出 (Yao & Schwarz,

    而这种单维性假设与许多测验的实际不相符, 因为 2006; Ferrando, 2009) 。众所周知, 多级评分试题由

    测验数据的多维性与被试完成一项测验任务时需 于可以提供更多关于被试的信息而被普遍地采用,

    要多种能力共同支配是相符的。显然 , 如果用单维 多级评分模型特别是等级反应模型(Grade Response

    模型去拟合多维数据 , 势必会增大测量误差 , 对 Model, GRM)是当前测验发展的新方向之一。鉴于

    被试的能力水平做出不准确的结论。因此, 建立被 IRT 向多维发展的趋势以及等级反应模型的重要地

    试反应与多种能力及项目特征之间的多维项目反 位 , 结合国内多数理论和应用研究都集中在单维

    应 理 论 (Multidimensional Item Response Theory, IRT 上 的 现 状 , 本 文 将 对 具 有 逻 辑 斯 蒂 形 式 的

    MIRT)模型成为了 IRT 近

    展开全文
  • 项目反应理论的开端早在上世纪初,智力测验的发明者比奈(也可能是西蒙)便发现了一条神奇的曲线,这条曲线的x轴是智力水平,y轴是试题正确率,而这是项目反应理论(以下简称IRT)的最初雏形。上世界五六十年代,ETS的...
  • 项目反应理论(IRT item response theory) 概述 历史发展 特点 模型 A.项目反应理论(IRT item response theory) 概述 IRT理论即项目反应理论(Item Response Theory, IRT),又称题目反应理论、潜在特质...
  • 结果显示:数据符合项目反应理论的基本假设;多数项目的区分度、难度达到理论要求.但E、P、N三个分测验在划界分数点上得到的信息量有限,难以对被试做出良好的区分;三个分测验各自的总信息量未达到理论要求.
  • vipsyvipsy是《变分推断在教育测量模型中的...斯坦福大学项目存在的问题:多维项目反应模型的参数估计精度严重失真,乃至不收敛,该项目只适合单维项目反应理论。重参数方法不适用于认知诊断模型,不具备普适性本...
  • Girth是一个python软件包,用于估计项目响应理论(IRT)参数。 此外,还支持合成IRT数据生成。 以下是可用功能的列表,有关更多信息,请访问GIRTH。 对贝叶斯模型感兴趣? 出 。 它提供了马尔可夫链和变分推断估计...
  • 在现实生活中,由于被试者的能力不能通过可观测的数据进行描述,所以IRT模型用一个潜变量θθ来表示,并考虑与项目相关的一组参数来分析正确回答测试项目的概率。目前常见的IRT模型有2-PL模型和3-PL模型。其具体...
  • 针对统计方法难以解决小样本条件下项目反应理论(IRT)项目参数问题,提出了运用广义回归神经网络(GRNN)集成对小样本条件下项目参数进行估计的方法,运用计算机模拟的方法产生项目参数的真实值,根据双参数逻辑...
  • 研究了针对受试学生群体的实际能力作出能动反映的组卷算法,提出基于项目反应理论,采用参数估计的方法,对遗传算法的适应度进行改进,提高了组卷算法对学生群体的适应性.
  • 项目反应理论在题库建设中的应用研究.pdf第32卷第 1期 计算机应用与软件 Vo1.32 No.12015年 1月 ComputerApplicationsandSoftware Jan.2...
  • 程序错误数是一种度量项目进展的很好参数。但是程序错误数是不充分的,并且常常产生误导。程序错误数不能用来说明产品已经接近发布时所要求的质量,不赞同把程序错误到达率作为项目管理依据的统计模型,因为没有理由...
  • IRT模型学习小结

    千次阅读 2018-12-09 20:29:46
    经典测量理论与项目反应理论在测量领域均占有重要地位。经典测量理论形成较早,但是经典测量理论却有一些难以克服的缺点: 能力与观测分数之间的线性关系假设不合理。 在经典测量理论中认为被试的能力与测试得到...
  • 多维IRT模型的EM估计

    千次阅读 2019-05-28 09:22:01
    多维IRT模型的EM估计 MIRT (Multidimensional Item Response Theory)多维项目反应理论。模型如下, $$ $$
  • 【100个】计算机理论论文大纲,每一个论文提纲都是精选出来的,看了后定能知晓计算机理论论文提纲怎么写等相关写作技巧,让计算机理论论文写作轻松起来!五、多元智能理论在中等职业学校《计算机文化基础》教学中的应用...
  • ​ 极大似然估计是建立在极大似然原理上的一种参数估计方法。其目的是利用已知的样本结果,反推最有可能导致这样结果的参数值。 通俗地说,就是通过若干次试验,观察其结果,利用试验结果得到某个参数值能够使样本...
  • IRT模型估计-EM算法

    千次阅读 2019-05-22 09:12:28
    IRT(Item Response Theory) 项目反应理论。是教育评估与心理测量理论中的重要模型。主要目的是通过被试(examinees) 的对于一套试题的反应(responses), 对被试 的能力(ability parameters) 参数θ\thetaθ 和题目...
  • 软件项目管理 期末复习 第一章:工程项目管理基本概念 项目管理和目标控制的基本原理: 目标决定组织,组织是目标能否实现的决定性因素 1.项目的定义与项目生命周期 项目: 是指在一定资源约束下,为创造独特的产品或...
  • 现在,你已经学习了估计理论的基础知识, 3D 几何和一些常见的传感方式, 是时候将其付诸实践并思考我们如何使用所有这些工具了 一起构建一个我们可以在真正的自动驾驶汽车上使用的估计器。 真正的自动驾驶汽车,如...
  • 软件项目管理

    千次阅读 多人点赞 2019-08-16 15:53:35
    在IT行业,特别是管理软件实施行业能够成为一个成功的项目经理是非常困难的一件事情,一个成功的IT经理,被要求熟悉计算机软硬件知识,精通企业业务背景,拥有良好的沟通技巧和说服能力,当然在项目团队中还必须具有...
  • IntelliJ IDEA使用教程 (总目录篇) 首先这个插件怎么下载、安装、激活,windows版本的和mac版本的,请参考下面的链接。...然后我这篇文章就示范,他是怎么热部署的(单模块项目和多模块项目)。 1,单...
  • 从依恋理论出发,基于Smith等(1999)的研究,论述团体的功能以及可作为个体依恋对象的原因,介绍团体依恋的概念,并以亲密...但基于项目反应理论的信度分析表明部分题目及测验总体信度有待提高。效度分析表明团体依恋与
  • ·项目干系人:是指那些积极参与项目,或是其利益会受到项目执行的影响,或是其利益会受到项目结果影响的个人或组织,他们也可能会对项目及其结果施加影响。 ·项目管理系统:是指用于管理项目的工具、技术、方法...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 4,094
精华内容 1,637
关键字:

项目反应理论参数估计