この 章 で 学ぶ こと
第 5 章 の 離散型 に 続 き、 こ の 章 で は 連続型確率分布 を 学 び ま す。 身長 や 体重 の よ う に 「ど ん な 値 で も 取 り え る」 量 を 扱う 道具 で す。
- 確率密度関数 f(x) の 意味 を 知 る
- 連続型 の 期待値・分散 (積分 で 定義)
- 正規分布 N(μ,σ2) の 形 と 性質
- 標準正規分布 N(0,1) と 標準化
- 標準正規分布表 の 読 み 方
- 二項分布→正規分布 の 近似
ポイント: 連続型 で は 「ピン ポイ ント の 確率 P(X=x)」 は 0 で、 「P(a≤X≤b)」 と いう 区間 の 確率 を 使 い ま す。 こ の 発想 の 切 り 替 え が 第一関門。
1. 連続型確率変数
確率密度関数
確率密度関数 f(x) と は、 確率 を 面積 で 表 す と き の 高 さ。 区間[a,b] で の 確率 は
P(a≤X≤b)=∫abf(x)dx
確率密度関数 の 条件
| 条件 | 意味 |
|---|
| ① f(x)≥0 | 高 さ は 負 で な い |
| ② ∫−∞∞f(x)dx=1 | 全体 の 面積 は 1 |
ピン ポイント の 確率 は 0
P(X=a)=∫aaf(x)dx=0
→ 連続型 で は ≤ と < の 区別 は 結果 に 影響 し な い。
連続型 の 期待値・分散
E[X]=∫−∞∞xf(x)dx
V[X]=∫−∞∞(x−E[X])2f(x)dx=E[X2]−(E[X])2
大事: 離散型 で は ∑、 連続型 で は ∫ と、 足 し算 が 積分 に 変 わ る だ け。 期待値・分散 の 概念自体 は 同 じ。
2. 一様分布 (もっとも 単純 な 例)
区間[a,b] で 一定 の 高 さ を 持 つ 分布 を 一様分布 U(a,b) と 呼 び、 確率密度 は
f(x)=⎩⎨⎧b−a10(a≤x≤b)(x<a ま た は x>b)
区間[a,b] の 外 で は f(x)=0 で あ る こ と に 注意 し ま し ょ う ([a,b]上 だ け 一定値 を と る)。
期待値 と 分散 は
E[X]=2a+b,V[X]=12(b−a)2
3. 正規分布N(μ,σ2)
確率密度関数
統計学 の 中心 に あ る 正規分布 (ガウス分布) は、 平均μ、 分散σ2 を 持 ち、 確率密度関数 は
f(x)=2πσ1exp(−2σ2(x−μ)2)
正規分布 の 形 と 性質
- 釣鐘型 (ベルカーブ) で 左右対称
- 中心μ で 最大、 μ±σ で 変曲点
- σ が 小 さい ほど 細 く 高 く、 大 きい ほど 広 く 低 く
「68 - 95 - 99.7」 の 法則
| 区間 | 含 ま れ る 確率 (近似) |
|---|
| [μ−σ,μ+σ] | 約 68 % |
| [μ−2σ,μ+2σ] | 約 95 % |
| [μ−3σ,μ+3σ] | 約 99.7 % |
大事: 「3σ を 超える こ と は 1000 回 に 約 3 回以下」 → 工業製品 の 品質管理 で 「3σ ライン」 が 標準。
4. 標準化 と 標準正規分布
標準化 (z スコア)
任意 の 正規分布 を 標準正規分布 N(0,1) に 直 す 操作 を 標準化 と 呼 ぶ。
Z=σX−μ
す る と E[Z]=0、 V[Z]=1 と な り、 平均 0、 分散 1 の 標準形 に 揃 う。
標準正規分布表 の 読み 方
統計表 (教科書巻末) に は P(0≤Z≤z) の 値 が 載 っ て い る。 例:
| z | P(0≤Z≤z) |
|---|
| 0.5 | 0.1915 |
| 1.0 | 0.3413 |
| 1.5 | 0.4332 |
| 1.96 | 0.4750 |
| 2.0 | 0.4772 |
| 2.58 | 0.4951 |
→ P(−1≤Z≤1)=2×0.3413=0.6826 ≈ 68 %
例題 1
身長 が N(170,102) (平均 170 cm、 標準偏差 10 cm) に 従 う 集団 で、 身長 が 180 cm 以上 の 人 の 割合 を 求 め よ。
解: X=180 を 標準化 す る と
Z=10180−170=1
P(Z≥1)=0.5−P(0≤Z≤1)=0.5−0.3413=0.1587
→ 約 15.9 %。
5. 二項分布 と 正規分布 の 関係
中心極限定理 (簡略)
X∼B(n,p) で n が 大 き い と き、 X の 分布 は 正規分布N(np,np(1−p)) で 良 く 近似 で き る。
例題 2
B(100,0.5) (コイン を 100 回投 げ た 表 の 回数) で、 表 が 60 回以上出 る 確率 を 近似 せ よ。
解: μ=np=50、 σ=np(1−p)=25=5。
X=60 を 標準化 す る と Z=(60−50)/5=2。
P(X≥60)≈P(Z≥2)=0.5−0.4772=0.0228
→ 約 2.3 %。
大事: 二項分布 の 個別確率 を 計算 す る の は 大変 (組合 せ nCk が 出 る) で す が、 正規分布近似 で 一気 に ラク に な り ま す。 こ れ は 第 7 章 で 学 ぶ 統計的推定 の 基盤 で も あ り ま す。
6. まとめ
| 概念 | 連続型 |
|---|
| 確率 | P(a≤X≤b)=∫abf(x)dx |
| 期待値 | E[X]=∫xf(x)dx |
| 分散 | V[X]=E[X2]−(E[X])2 |
| 正規分布 | N(μ,σ2)、 f(x)=2πσ1exp(−2σ2(x−μ)2) |
| 標準化 | Z=(X−μ)/σ |
7. もう 少 し 練習
例題 3 (両側確率)
X∼N(50,102) の とき、 40≤X≤65 と な る 確率 を 求 め よ。
解: 標準化 で
Z1=1040−50=−1,Z2=1065−50=1.5
P(40≤X≤65)=P(−1≤Z≤1.5)=P(0≤Z≤1)+P(0≤Z≤1.5)
=0.3413+0.4332=0.7745
→ 約 77 %。
例題 4 (上位何 %)
ある 試験 の 得点 が N(60,152) に 従 う と き、 上位 5 % に 入 る に は 何点以上必要 か。
解: P(Z≥z)=0.05 と な る z は 標準正規分布表 か ら z=1.645 (上側 5% 点)。
X=μ+zσ=60+1.645⋅15=60+24.675≈84.7 点 以 上
→ 約 85 点 取 れ ば 上位 5 % に 入 る。
大事: こ の 「標準化 し て 表 を 引 く」 流 れ は 統計学 の 基本動作。 受験 の 偏差値 (T=10Z+50) も 同 じ 発想 で 計算 さ れ て い ま す。
次 の 章: 第 7 章 で は 統計的推定 を 学 び、 標本平均 か ら 母平均 を 信頼区間 で 推定 す る 方法 を 身 に つ け ま す。 正規分布 が 主役 に な り ま す。