この章で学ぶこと
第 5 章の 離散型 に続き、 この章では 連続型確率分布 を学びます。 身長や体重 のように 「どんな値でも取りえる」 量を 扱う道具 です。
- 確率密度関数 f(x) の意味を知る
- 連続型の期待値・分散 (積分 で定義)
- 正規分布 N(μ,σ2) の形と性質
- 標準正規分布 N(0,1) と 標準化
- 標準正規分布表の読み方
- 二項分布 → 正規分布 の近似
ポイント: 連続型では 「ピンポイントの確率 P(X=x)」 は 0 で、 「P(a≤X≤b)」 という 区間 の確率を使います。 この発想 の切り替えが第一関門。
1. 連続型確率変数
確率密度関数
確率密度関数 f(x) とは、 確率を 面積 で表すときの 高さ。 区間 [a,b] での確率は
P(a≤X≤b)=∫abf(x)dx
確率密度関数の条件
| 条件 | 意味 |
|---|
| ① f(x)≥0 | 高さは負でない |
| ② ∫−∞∞f(x)dx=1 | 全体 の面積 は 1 |
ピンポイントの確率は 0
P(X=a)=∫aaf(x)dx=0
→ 連続型では ≤ と < の区別 は結果 に影響 しない。
連続型の期待値・分散
E[X]=∫−∞∞xf(x)dx
V[X]=∫−∞∞(x−E[X])2f(x)dx=E[X2]−(E[X])2
大事: 離散型では ∑、 連続型では ∫ と、 足し算 が積分 に変わるだけ。 期待値・分散 の概念自体 は同じ。
2. 一様分布 (もっとも単純な例)
区間 [a,b] で一定 の高さを持つ分布 を 一様分布 U(a,b) と呼び、 確率密度は
f(x)=⎩⎨⎧b−a10(a≤x≤b)(x<a または x>b)
区間[a,b] の 外では f(x)=0 であることに注意しましょう ([a,b]上だけ一定値をとる)。
期待値と分散は
E[X]=2a+b,V[X]=12(b−a)2
3. 正規分布N(μ,σ2)
確率密度関数
統計学の中心にある 正規分布 (ガウス分布) は、 平均μ、 分散σ2 を持ち、 確率密度関数は
f(x)=2πσ1exp(−2σ2(x−μ)2)
正規分布の形と性質
- 釣鐘型 (ベルカーブ) で左右 対称
- 中心μ で最大、 μ±σ で 変曲点
- σ が小さいほど 細く高く、 大きいほど 広く低く
「68 - 95 - 99.7」 の法則
| 区間 | 含まれる確率 (近似) |
|---|
| [μ−σ,μ+σ] | 約 68 % |
| [μ−2σ,μ+2σ] | 約 95 % |
| [μ−3σ,μ+3σ] | 約 99.7 % |
大事: 「3σ を超えることは 1000 回に約 3 回以下」 → 工業製品の 品質管理 で 「3σ ライン」 が標準。
4. 標準化と標準正規分布
標準化 (z スコア)
任意 の正規分布 を 標準正規分布 N(0,1) に直す操作 を 標準化 と呼ぶ。
Z=σX−μ
すると E[Z]=0、 V[Z]=1 となり、 平均 0、 分散 1 の標準形に揃う。
標準正規分布表の読み方
統計表 (教科書巻末) には P(0≤Z≤z) の値が載っている。 例:
| z | P(0≤Z≤z) |
|---|
| 0.5 | 0.1915 |
| 1.0 | 0.3413 |
| 1.5 | 0.4332 |
| 1.96 | 0.4750 |
| 2.0 | 0.4772 |
| 2.58 | 0.4951 |
→ P(−1≤Z≤1)=2×0.3413=0.6826 ≈ 68 %
例題 1
身長が N(170,102) (平均 170 cm、 標準偏差 10 cm) に従う集団で、 身長が 180 cm 以上の人の割合 を求めよ。
解: X=180 を標準化すると
Z=10180−170=1
P(Z≥1)=0.5−P(0≤Z≤1)=0.5−0.3413=0.1587
→ 約 15.9 %。
5. 二項分布と正規分布の関係
中心極限定理 (簡略)
X∼B(n,p) で n が大きいとき、 X の分布 は 正規分布 N(np,np(1−p)) で良く近似 できる。
例題 2
B(100,0.5) (コイン を 100 回投げた表の回数) で、 表が 60 回以上出る確率を近似 せよ。
解: μ=np=50、 σ=np(1−p)=25=5。
X=60 を標準化すると Z=(60−50)/5=2。
P(X≥60)≈P(Z≥2)=0.5−0.4772=0.0228
→ 約 2.3 %。
大事: 二項分布 の個別確率を計算 するのは大変 (組合せ nCk が出る) ですが、 正規分布近似 で一気にラクになります。 これは第 7 章で学ぶ 統計的推定 の基盤 でもあります。
6. まとめ
| 概念 | 連続型 |
|---|
| 確率 | P(a≤X≤b)=∫abf(x)dx |
| 期待値 | E[X]=∫xf(x)dx |
| 分散 | V[X]=E[X2]−(E[X])2 |
| 正規分布 | N(μ,σ2)、 f(x)=2πσ1exp(−2σ2(x−μ)2) |
| 標準化 | Z=(X−μ)/σ |
7. もう少し練習
例題 3 (両側確率)
X∼N(50,102) のとき、 40≤X≤65 となる確率を求めよ。
解: 標準化で
Z1=1040−50=−1,Z2=1065−50=1.5
P(40≤X≤65)=P(−1≤Z≤1.5)=P(0≤Z≤1)+P(0≤Z≤1.5)
=0.3413+0.4332=0.7745
→ 約 77 %。
例題 4 (上位何 %)
ある試験の得点が N(60,152) に従うとき、 上位 5 % に入るには何点以上必要か。
解: P(Z≥z)=0.05 となる z は標準正規分布表から z=1.645 (上側 5% 点)。
X=μ+zσ=60+1.645⋅15=60+24.675≈84.7 点以上
→ 約 85 点 取れば上位 5 % に入る。
大事: この 「標準化して表を引く」 流れは 統計学の基本動作。 受験の偏差値 (T=10Z+50) も同じ発想 で計算 されています。
次の章: 第 7 章では 統計的推定 を学び、 標本平均 から 母平均 を 信頼区間 で 推定 する方法を身につけます。 正規分布 が主役になります。