第6講 各種データ解析法

因子分析

因子分析の考え方

次のように観測データが得られたとする. ただし,平均0,分散1に標準化されているものとする.

個体No. z1 z1 zp
1 z11 z21 zp1
2 z12 z22 zp2
n z1n z2n zpn

変量 zj (j=1,,p)の関係をみるため,次のモデルで,m 個の因子を考えてみる.

{z1i=a11f1i+a12f2i++a1mfmi+e1i        zji=aj1f1i+aj2f2i++ajmfmi+eji        zpi=ap1f1i+aj2f2i++apmfmi+epi     (1)
i=1,2,,n
zj (j=1,,p) : 変量 (確率変数)

zji : 観測値 (定数)

fk (k=1,,m) : 共通因子 (確率変数)

fk(0,12)
fki : 共通因子fk の個体 i の因子得点

ajk : 因子負荷量 (定数)

ej : 独立因子 (確率変数)

ej(0,dj2)
eji : 独立因子の得点 (定数)

e1,,ep は互いに無相関とし,また, f1,,fme1,,ep は互いに無相関とする.

: f1,,fm が互いに無相関のとき

: f1,,fm に相関があるとき

(1) を確率変数でまとめて表すと,

zj=aj1f1+aj2f2++ajmfm+ej     (2)
期待値を求めると,
E[zj]=E[aj1f1+aj2f2++ajmfm+ej]=E[aj1f1]+E[aj2f2++E[ajmfm]+E[ej]=aj1E[f1]+aj2E[f2]++ajmE[fm]+E[ej]=0
ここで,直交解を考えることにする.つまり,fk,fk に対し,
Cov[fk,fk]=E[fkfk]E[fk]E[fk]=E[fkfk]=0
また,
E[fk2]=V[fk]+(E[fk])2=V[fk]=1
Cov[fk,ej]=0 より
E[fkej]=Cov[fk,ej]+E[fk]E[ej]=0
これらと (2) より,
σjj=V[zj]=V[aj1f1+aj2f2++ajmfm+ej]=V[k=1majkfk+ej]=k=1mV[ajkfk]+V[ej]=k=1majk2V[fk]+V[ej]=k=1majk2+dj2     (3)
σjj=Cov[zj, zj]=E[zjzj]E[zj]E[zj]=E[zjzj]=E[(aj1f1+aj2f2++ajmfm+ej)(aj1f1+aj2f2++ajmfm+ej)]=E[k=1majkfkajkfk]+E[kkajkfkajkfk]+E[k=1majkfkej]+E[k=1mejajkfk]+E[ejej]=k=1mE[ajkfkajkfk]+kkE[ajkfkajkfk]+k=1mE[ajkfkej]+k=1mE[ejajkfk]+E[ejej]=k=1majkajkE[fk2]+kkajkajkE[fkfk]+k=1majkE[fkej]+k=1majkE[ejfk]+E[ejej]=k=1majkajk     (4)

行列を用いて (1) を表すと,

zi=Afi+ei,    i=1,,n
zi=(zi1zip)
A=(a11a1map1apm)
fi=(f1ifmi)
ei=(ei1eip)
(3) と (4) の分散と共分散は,
Σ=AA+D     (5)
Σ=(σ11σ1pσp1σpp)
D=(d1200dp2)

Afi は推定することになる.ここで,T を任意の p×p の正規行列 T とすると,

zi=Afi+ei=A(TT1)fi+ei=Afi+ei
ただし,
A=AT
fi=T1fi
つまり,モデル (1) を満たす解 A, fi には回転の不定性があることがわかる.

1組の解 A, fi が得られたとき,因子の意味付けをするために,f1,,fm で構成される因子軸の回転を行う.