統計検定 準1級 過去問 解答/解答例と解説
2017年06月18日 (日) 試験

選択問題及び部分記述問題 問13

問題の要約
  • 5人の生徒の数学 (Math) と英語 (Eng) のテスト結果

    表1
    番号 1 2 3 4 5
    Math 10 10 9 7 6
    Eng 10 8 6 8 7
  • 横軸を数学,縦軸を英語とした散布図

    ※図は省略

  • 観測点間のユークリッド距離

    表2
    1 2 3 4 5
    1 0 2 17 13 5
    2 2 0 5 3 17
    3 17 5 0 8 10
    4 13 3 8 0 2
    5 5 17 10 2 0
  1. (ア) と (イ) は階層的クラスター分析を行ったデンドログラム.

    最近隣法 (最短距離法) または最遠隣法 (最長距離法) のいずれか.

    ※図は省略

    A 〜 E は5人の生徒の番号のいずれかに対応.

    (ア) と (イ) の分析手法と,A 〜 E に対応する生徒番号を答えよ.

  2. 2-平均法 (2-means 法) クラスター分析を行う.

    • 2個のクラスター中心の初期点を選ぶ.

    • 以下の 3, 4 を,クラスター中心の変化が起きなくなるまで繰り返す.

    • 各観測点を,クラスター中心からの距離の近い方のクラスターに割当てる.

    • 各クラスターに割当てられた観測点の重心を計算し,クラスター中心とする.

    • 各クラスターに割当てられた観測点を出力する.

    1. クラスター中心の初期点を (生徒1, 生徒2).

      2-平均法クラスター分析を 行ったところ,クラスター中心は初期点から 2 回変化した.

      クラスター中心の初期点に対して割当てられてできたクラスターと,出力されたクラスターを求めよ.

    2. クラスター中心の2通りの初期点 初期点(a) : (生徒2, 生徒4) 初期点(b) : (生徒3, 生徒4) について,2-平均法によりクラスター分析を行った.いずれの場合も,初期 点に対して割当てられてできたクラスターが,そのまま出力となった.初期 点と 2-平均法の出力の組合せとして,次の 1 ~ 5 のうちから最も適切なも のを一つ選べ.

解答
  1. 答 : ① (ア): 最近隣法,(イ): 最遠隣法,A: 1, B: 2, C: 3, D: 4, E: 5

    (ア) と (イ) のテンドログラムでは,A と B,D と E が併合されている.

    A と B の高さは 2 である.表2から距離が 2 であるものは,生徒1 と 2 である.

    D と E の高さは 21.414 であり,表2から距離が 2 であるものは,生徒4 と 5 である.

    よって,C は生徒3 である.

    C (生徒3) と 各群との最短距離と最長距離は,次のとおりである.

    最短距離 最長距離
    {A, B} 5 17
    {D, E} 8 10

    このことから,最近隣法ならば,C と {A, B}群が併合されることがわかる.

    よって,(ア) は最近隣法,(イ) は最遠隣法である.

    1. 答 : ① 初期: {1}, {2,3,4,5},出力: {1, 2}, {3, 4, 5}

      1. クラスタ重心 : (10, 10), (10, 8)

      2. クラスタ : {1}, {2,3,4,5}

      3. クラスタ重心 : (10, 10), (8, 7.25) ※1回目の変化

      4. クラスタ : {1, 2}, {3,4,5}

      5. クラスタ重心 : (9.67, 8), (6.5, 7.5) ※2回目の変化

      6. クラスタ : {1, 2}, {3,4,5}

      7. クラスタ重心 : (9.67, 8), (6.5, 7.5) ※変化なしなので終了

    2. 答 : ④ (a): {1, 2, 3}, {4, 5},(b): {1, 4, 5}, {2, 3}

      表2より初期点に対するクラスタを求めると,④が正解であるとわかる.