この章で学ぶこと
第 7 章で 「推定 (どこにあるか)」 を学びました。 この章では 検定 (この主張は正しいか?) を学びます。 科学・医療・社会調査の 判断基盤 です。
- 帰無仮説 H0 と 対立仮説 H1
- 有意水準 α と 棄却域
- 両側検定 と 片側検定
- 母平均 の検定 (σ既知)
- 母比率 の検定 (二項分布 → 正規近似)
- 第 1 種・第 2 種の過誤
ポイント: 検定は 「背理法 の統計版」。 「H0 が正しい」 と仮定 して計算 した結果が異常であれば、 H0 を 棄却 します。
1. 仮説検定の 5 ステップ
| ステップ | やること |
|---|
| ① | 帰無仮説 H0 と 対立仮説 H1 を立てる |
| ② | 有意水準 α を決める (通常 5 % か 1 %) |
| ③ | H0 の下で検定統計量 (z や t) を計算 |
| ④ | 棄却域 に入るか判定 |
| ⑤ | 入れば H0 を 棄却、 入らなければ 「棄却 できない」 |
帰無仮説と対立仮説
| 用語 | 意味 |
|---|
| H0 (帰無仮説) | 「差はない」 「偏りはない」 という 守り の主張 |
| H1 (対立仮説) | 「差がある」 という 示したい 主張 |
大事: 検定で 「示す」 ことができるのは 対立仮説H1 の方。 「H0 を示した」 とは言えない (「棄却 できなかった」 と控えめに表現)。
2. 有意水準と棄却域
有意水準α
「H0 が正しいときに誤って棄却してしまう確率」 を α とし、 通常 5 % (= 0.05) を使う。
棄却域 (α=5%、 両側検定)
検定統計量z が
∣z∣>1.96
を満たせば棄却。 (片側では z>1.645 や z<−1.645 を使う)
| 検定の形 | 棄却域 (α=5%) |
|---|
| 両側 (≠) | ∥z∥>1.96 |
| 右側 (>) | z>1.645 |
| 左側 (<) | z<−1.645 |
注: 1.645 は標準正規分布の上側 5% 点。 教科書によっては 1.64 に丸めて表記しますが、 本サイトでは 1.645 で統一します。
大事: α を小さくするほど 棄却 しにくく なり (慎重)、 大きくするほど 棄却 しやすく なる (誤棄却 が 増える)。 トレードオフ。
3. 母平均の検定 (σ既知)
検定統計量
z=σ/nxˉ−μ0
例題 1
ある工場の製品の重さは過去のデータから母平均μ0=50.0 g、 母標準偏差σ=5 g であった。 新ラインで 100 個を無作為抽出 したところ平均が xˉ=51.5 g であった。 新ラインの母平均は 50.0 g から 異なる か、 有意水準 5 % で検定せよ。
解:
① H0:μ=50.0、 H1:μ=50.0 (両側検定)
② α=0.05
③ z=(51.5−50.0)/(5/10)=1.5/0.5=3.0
④ ∣z∣=3.0>1.96 → 棄却域に入る
⑤ H0 を棄却。 「新ラインの母平均は 50 g と異なる (有意差あり)」 と結論 する。
4. 母比率の検定 (コインの公平性)
検定統計量
z=p0(1−p0)/np^−p0
例題 2
コインを 100 回投げたところ表が 60 回出た。 このコインは 公平でない (表と裏の出やすさが違う) と言えるか、 5 % で検定せよ。
解:
① H0:p=0.5、 H1:p=0.5 (両側)
② α=0.05
③ p^=0.6、 z=(0.6−0.5)/0.5⋅0.5/100=0.1/0.05=2.0
④ ∣z∣=2.0>1.96 → 棄却域に入る
⑤ H0 を棄却。 「コインは公平でない (有意差あり)」。
直感確認: 公平なコインで 100 回中 60 回以上表が出る確率は約 2.3 % (前章の例題 2)。 両側で約 4.6 % なので、 5 % より小。 「珍しいことが起こった」 と判断して棄却。
5. 片側検定と両側検定の使い分け
どちらを使うか
| 状況 | 使う検定 |
|---|
| 「平均が 50 と 違う」 を示したい | 両側 (=) |
| 「新薬が既存薬より 良い」 を示したい | 片側 (>) |
| 「故障率が 下がった」 を示したい | 片側 (<) |
大事: 片側の方が 棄却 しやすい (棄却域が片側だけで OK なので境界値が 1.645 と緩い)。 どちらを使うかは 問題文の主張 で決める。
6. 第1種の過誤と第2種の過誤
2 つの誤り
| 真実: H0正しい | 真実: H1正しい |
|---|
| 判定: H0棄却 | 第 1 種の過誤 (α) | 正解 |
| 判定: 棄却 せず | 正解 | 第 2 種の過誤 (β) |
- 第 1 種の過誤 α: 「ない」 のに 「ある」 と言う (偽陽性)
- 第 2 種の過誤 β: 「ある」 のに 「ない」 と言う (偽陰性)
トレードオフ
α を下げると β が上がり、 両方を同時に下げるには 標本サイズ n を増やす しかない。
大事: 医療 では 「病気を見落とす (β)」 を避けたい場面、 法廷では 「無罪を有罪にする (α)」 を避けたい場面 など、 場面 によって重視 すべき過誤 が違う。
7. まとめ
| 検定の種類 | 棄却域 (α=5%) |
|---|
| 両側 | ∥z∥>1.96 |
| 右側 | z>1.645 |
| 左側 | z<−1.645 |
| 用途 | 検定統計量 |
|---|
| 母平均 (σ既知) | z=(xˉ−μ0)/(σ/n) |
| 母比率 | z=(p^−p0)/p0(1−p0)/n |
8. 例題 (片側検定と p 値)
例題 3 (片側検定)
ある薬の既存治療 での改善率は 60 % であった。 新薬で 100 人中 70 人が改善 した。 新薬の改善率は既存より高いと言えるか、 有意水準 5 % で検定せよ。
解:
① H0:p=0.6、 H1:p>0.6 (右側片側検定)
② α=0.05 → 棄却域は z>1.645
③ p^=0.7、 z=0.6⋅0.4/1000.7−0.6=0.00240.1≈0.048990.1≈2.04
④ z≈2.04>1.645 → 棄却域に入る
⑤ H0 を棄却。 「新薬の改善率は既存治療より有意に高い」 と結論。
p 値 (発展)
p値 とは、 「H0 が正しいと仮定 したときに、 観察 された値以上に極端 な結果 が出る確率」。 例題 3 では、 z=2.04 より大きい確率を標準正規分布表から求めると、 約0.5−0.4793=0.0207 → p≈0.021。
| 判断基準 |
|---|
| p<α → H0棄却 |
| p≥α → H0棄却 せず |
例題 3 では p=0.021<0.05 なので棄却。 棄却域を使う方法 と結論 は一致 します。
大事: p 値は 「H0 が正しい確率」 ではない。 「H0 が正しいとしたときの データの珍しさ」 です。 この区別 が科学報道でよく混同されます。
検定をする上での注意
- 多重検定の罠: 同じデータに何回も検定を行うと、 偶然 の 「有意」 が出やすくなる (多重比較 の問題)
- 有意 ≠ 重要: 大標本では微小な差でも 「有意」 になるが、 実務的に重要とは限らない (効果量 も併せて評価)
- 再現性: 1 回の検定で結論 せず、 別のデータで確認 してこそ信頼 できる
次の章: 第 9 章から ベクトル に入ります。 平面 ベクトルの 成分・内積・図形への応用 を学び、 高校数学の重要単元の一つをマスターします。