統計検定 準1級 過去問 解答/解答例と解説
2016年06月19日 (日) 試験

選択問題及び部分記述問題 問14

問題の要約

[1]

  • A(0, I)

  • B((1.31.3), 0.6I)

  • A 群の観測値 : 150

  • B 群の観測値 : 20

  • 手法 (ア),(イ) を用いて判別 (LDA または SVM)

    ※図は省略

  • 手法 (ア),(イ) の正誤表

    (ア)

    判別結果  
    A B
    真の群 A 130 20
    B 0 20

    (イ)

    判別結果  
    A B
    真の群 A 146 4
    B 5 15
  • (1) (ア),(イ) のどちらが LDA または SVM であるか.その理由も述べよ.誤判別率を求めよ.

  • (2) 交差検証法を説明せよ.

[2]

  • 判別領域を描け.

  • 描き方を説明せよ.

※図は省略

解答
  1. (1)

    (ア)

    • LDA

    • 2つの群を分ける境界が直線であるから.

    • 誤判別率 : 20170

    (イ)

    • SVM

    • 一般に非線形の手法であるSVMの方が線形判別より判別精度が良いから.

    • 誤判別率 : 9170

    (2)

    • 判別モデルのパラメータが多い場合,過学習が生じる. モデル作成した以外のデータに対して判別すると,当てはまりが悪く,誤判別率が大きくなってしまう. これを防ぐ方法として,交差検証法がある.

    • 交差検証法では,観測値を N 個のグループに分割し,そのうちの N1 のグループを選んで判別モデルを推定する.残りの 1 個のグループで判別を行い,誤判別率を求める.これを N 回くり返してモデルを評価する.

    • 3つの重心を結んで三角形を作る.

    • 各辺で垂直二等分線を引く.