
適合度検定と独立性の検定の違いをマスターしよう!
適合度検定:
理論的に起こるであろう回数と実際に起きた回数のズレが有意であるかの検定
独立性の検定:
2つ以上の分類基準を持つクロス集計表において、分類基準間に関連があるかどうかの検定
◯注意するポイントは自由度
・適合度検定はn-1
・独立性の検定は(n-1)×(m-1)
適合度検定
適合度検定は、理論的に起こるであろう回数と実際に起きた回数のズレが有意であるかの検定です。
では、適合度検定の例を考えてみます。
あるクジではA賞、B、C、D、E賞の当たる確率がそれぞれ4%、6%、10%、20%、30%と言われており、残りはハズレです。
ここで100人の実際の結果がA:2人 B:4人 C:9人 D:13人 E:36人となっていた。有意水準5%で適合度検定せよ。
問題文を表で表します。
A賞 | B賞 | C賞 | D賞 | E賞 | ハズレ | |
理論値(確率) | 4% | 6% | 10% | 20% | 30% | 30% |
実際に引いたクジ | 2人 | 4人 | 9人 | 13人 | 36人 | 36人 |
このままでは、単位が%と人で異なるため、理論値の単位を人にします。
理論値(人数)は \[ n \times 理論値(確率) \] で計算できるので、 \[ 100人 \times 0.04 = 4人 \] \[ 100人 \times 0.06 = 6人 \] \[ 100人 \times 0.1 = 10人 \] \[ 100人 \times 0.2 = 20人 \] \[ 100人 \times 0.3 = 30人 \] \[ 100人 \times 0.3 = 30人 \]から、
A賞 | B賞 | C賞 | D賞 | E賞 | ハズレ | |
期待度数(理論値:人数) | 4人 | 6人 | 10人 | 20人 | 30人 | 30人 |
(観測値)実際に引いたクジ | 2人 | 4人 | 9人 | 13人 | 36人 | 36人 |
となります。この検定では、観測値(実際に引いたくじ)と期待度数(理論値)が大きくずれている場合、帰無仮説を棄却すると判断したいので、検定統計量Tは、
\[ T = \sum \frac{(観測値 – 期待度数)^2}{期待度数} \]で計算され、自由度n -1 のカイ二乗分布に従います。
今回はnが6なので自由度は(6-1)で5であることがわかります。
表データに対して実際にTを求めると、
T = 65.6と求められる。
ここで自由度5の、有意水準5%のカイ二乗分布表の値をみると、11.07であることがわかります。

よって、
\[ T = 65.6 > 11.07 = \chi_5^2(0.95) \]となり、帰無仮説は棄却されます。
つまり、当たりくじがその通りとは言い切れない。と結論づけることができます。
独立性の検定
独立性の検定は、2つ以上の分類基準を持つクロス集計表において、分類基準間に関連があるかどうかを検定することです。
では独立性の検定の例を考えてみます。
ある都市の男性に勉強時間を調査したところ、下記のようなデータが得られた。この時、年齢と勉強時間の間に関係があるかどうかを有意水準5%で検定せよ。
20歳以下 | 20~30歳 | 30歳以上 | 計 | |
2時間以内 | 5 | 30 | 91 | 126 |
2~3時間 | 15 | 30 | 39 | 84 |
3時間以上 | 30 | 40 | 20 | 90 |
計 | 50 | 100 | 150 | 300 |
独立性の検定では、帰無仮説を「独立である」として考えます。
今回の場合だと、帰無仮説は「年齢と勉強時間は独立である」となります。
独立性の検定の期待度数(理論値)を求めていきます。
①まず年齢は勉強時間と関係がないと考えます。
②年齢別の人数の割合は50:100:150で1:2:3となる。
20歳以下 | 50人 |
20~30歳 | 100人 |
30歳以上 | 150人 |
③なので、2時間以内の人の合計126人を1:2:3で分割すると、下記の表のように計算できる。
20歳以下 | 20~30歳 | 30歳以上 | 計 | |
2時間以内 | 21 | 42 | 63 | 126 |
2~3時間 | 84 | |||
3時間以上 | 90 | |||
計 | 50 | 100 | 150 | 300 |
同様に全て計算する。下記が理論値(期待度数)となる。
20歳以下 | 20~30歳 | 30歳以上 | 計 | |
2時間以内 | 21 | 42 | 63 | 126 |
2~3時間 | 14 | 28 | 42 | 84 |
3時間以上 | 15 | 30 | 45 | 90 |
計 | 50 | 100 | 150 | 300 |
今回は1:2:3の割合でした。そのため、
\[ 1:2:3 = \frac{1}{6}:\frac{2}{6}:\frac{3}{6} (6 = 1 + 2 + 3) \]それぞれ分子が1になるように約分すると、
\[ 1:2:3 = \frac{1}{6}:\frac{1}{3}:\frac{1}{2} \]この分母の値でそれぞれ割ることで簡単に計算することができる。
③の場合、
126 ÷ 6 = 21
126 ÷ 3 = 42
126 ÷ 2 = 63
と求めることができます。
検定統計量Tは先ほどの適合度検定と同じく、
\[ T = \sum \frac{(観測値 – 期待度数)^2}{期待度数} \]注意点は、自由度です。
今回の場合は、3×3のクロス集計表です。そのため自由度は、(3-1)×(3-1) = 4になります。
そのため、自由度4のカイ二乗分布に従います。
表データに対して実際にTを求めると、
T = 60.64と求められる。
ここで自由度4の、有意水準5%のカイ二乗分布表の値をみると、9.488であることがわかります。

よって、
\[ T = 60.64 > 9.488 = \chi_4^2(0.95) \]となり、帰無仮説が棄却されます。
よって、勉強時間と年齢は関連してないとは言い切れない。という結論がづけることができます。
まとめ
適合度の検定は、事象の分布を仮定としている。
独立性の検定は、各セルの生起確率が独立な事象の積に分解できると仮定している。
適合度検定も独立性の検定も理論値(期待度数)を計算してカイ二乗検定を行うけど、どっちが何を検定しているのかぐちゃぐちゃになっちゃう。