統計検定 1級 過去問 解答/解答例と解説
2014年11月30日 (日) 試験

統計応用 問5

問題の要約
  • N 人の対象を 2 種類の属性で分類し,2×2 分割表形式で表すデータは多くの応 用場面でよく見られる.たとえば表 5.1 は,年齢層別と高血圧症状の有無で分類した 2 元表データである.一般に,観測度数を表 5.2 のように表し,対応する確率を表 5.3 のように表す.

    表 5.1. 年齢層と高血圧症状の 2 元表
    観測度数 高血圧症 正常
    60歳以下 50 90 140
    60歳超え 50 50 100
    100 140 240
    表 5.2. 年齢層と高血圧症状の度数
    観測度数 高血圧症 正常
    60歳以下 y11 y12 y1
    60歳超え y21 y22 y2
    y1 y2 N
    表 5.3. 年齢層と高血圧症状の確率
    確率 高血圧症 正常
    60歳以下 p11 p12
    60歳超え p21 p22
  • 3通りのサンプリング計画

    • 年齢層別の 60 歳以下が 140 例,60 歳超えが 100 例となるように計画してデータを収集.

    • 高血圧症が 100 例,正常が 140 例となるように計画してデータを収集.

    • 総例数が 240 となるように計画してデータを収集.

  • それぞれの確率分布

    • y11 および y21 は,互いに独立にそれぞれ二項分布に従う.

    • y11 および y12 は,互いに独立にそれぞれ二項分布に従う.

    • y11,y12,y21,y22 は,多項分布 (四項分布) に従う.

  • β=log(p12/p22)

    γ=log(p21/p22)

    δ=log{(p11p22)/(p12p21)}