第6講 各種データ解析法
主成分分析
主成分
次の観測値が得られたとする.
この観測値に対して主成分分析を行ってみる.
この観測値を標準化したものを
とする.このとき,分散は,
これより,
また,相関係数は,
これより,
第 1 主成分を次のように定義する.
ここで,
とおくと,
の分散は,
ただし,
は相関係数行列である.
また,分散を最大化するような
を求めるが,次の制約条件を設ける.
ラグランジュの未定乗数法を用いると,
で微分して
とおくと,
よって,
左から
をかけると,
よって,分散の最大値は
となる.
固有値問題
を解いて,
最大固有値
に対する固有ベクトルを求めれば,第 1 主成分の係数
を求めることができる.
次に,第 2 主成分を求める.
ここで,
と
が無相関であるという制約を設ける.
よって,無相関であるためには,
そこで,ラグランジュの未定乗数法を用いると,
で微分して
とおくと,
左から
をかけると,
これより,
よって,(1) より
左から
をかけると,
よって,分散の最大値は
となり,第 2 主成分の係数は,
固有値問題
の第 2 固有値に対する固有ベクトルを求めればよいことになる.
第 3 主成分についても同様である.第 3 主成分 は, と に無相関になるように制約を設けて,
同様にして第 3 主成分の係数を求めていけばよい.
寄与率
の固有値 の和は,
第
主成分の寄与率は,
第
主成分までの累積寄与率は,