第5講 回帰分析

変数選択

赤池情報量規準 (AIC)

AICの値が小さなモデルの方がよい.

AIC=2{最大対数尤度}+2(パラメタ数)=n{log2πSen+1}+2(p+2)
Se=i=1n(yiy^i)2

次の線形回帰モデルを考える.

y=Xβ+ϵ
ϵNn(0,σ2In)
β=(β0,β1,,βp)T
このとき,
yNn(Xβ,σ2In)
となる.ここで,yX が観測値として得られたとすると,尤度関数は,
L(β^,σ^2)f(yX;β,σ2)=1(2π)n2|σ2In|12exp[12(yXβ)T(σ2In)1(yXβ)]=1(2πσ2)n2exp[12σ2(yXβ)T(yXβ)]
対数尤度関数は,
l(β^,σ^2)logL(β^,σ^2)=n2log(2πσ2)12σ2(yXβ)T(yXβ)
βσ2 で偏微分して 0 とおくと,
βl(β^,σ^2)=1σ2(XTyXTXβ)=0
σ2l(β^,σ^2)=n2σ2+1σ4(yXβ)T(yXβ)=0
よって,βσ2 の最尤推定値は,
β^=(XTX)1XTy
σ^2=1n(yXβ^)T(yXβ^)=Sen
これらより,最大対数尤度は,
l(β^,σ^2)=n2log(2πσ^2)(yXβ^)T(yXβ^)2σ^2=n2log2πSenn2
よって,
AIC=2{l(β^,σ^2)(p+2)}=nlog2πSen+n+2(p+2)