この 章 で 学ぶ こと
中学 で 学んだ 「平均」 「中央値」 を 高校 では 統計学 の 入口 として 体系化 し、 さらに 分散・標準偏差 と いう データ の 「ばらつき」 を 表す 量 を 学び ます。 第 10 章 の 相関 と セット。
- データ の 代表値 (平均値・中央値・最頻値)
- 四分位数 と 箱ひげ図
- 分散 と 標準偏差 の 計算
- 公式V=x2−(xˉ)2 の 使い 方
- データ の 変換 と 統計量 の 変化
ポイント: 「データ が どれ くらい 中央 に 集まって いる か」 を 数 で 表す 章 です。 大学入試共通 テスト で 必出 の テーマ。
1. データ の 代表値
3 つ の 代表値
| 名前 | 定義 | 強み |
|---|
| **[[平均値 | へいきんち]]** xˉ | n1∑xi |
| **[[中央値 | ちゅうおうち]]** (メジアン) | データ を 並べた 真ん 中 |
| **[[最頻値 | さいひんち]]** (モード) | 最も 多 く 出 る 値 |
例題
データ: 3,5,7,8,8,10,12 (n=7)。
| 代表値 | 値 |
|---|
| 平均値 | 73+5+7+8+8+10+12=753≈7.57 |
| 中央値 | 並 べ た 4 番目 = 8 |
| 最頻値 | 2 回出 る 8 |
偶数個 の 中央値
データ 数 が 偶数 の とき、 中央値 は 中央 の 2 つ の 平均。
例: 1,3,5,8 → 中央値=23+5=4。
大事: 外れ値 (極端 に 大きい / 小さい 値) が ある とき は 中央値 の ほう が 実態 を 表 し ま す。 平均 だ け を 信 じ な い こ と。
2. 四分位数 と 箱ひげ図
四分位数
データ を 大き さ の 順 に 並 べ て 4 等分 する 区切り の 値:
| 名前 | 記号 | 意味 |
|---|
| **第 1 [[四分位数 | しぶんいすう]]** | Q1 |
| 第 2 四分位数 | Q2 | 50% (= 中央値) |
| 第 3 四分位数 | Q3 | 75% |
四分位範囲
四分位範囲=Q3−Q1
これ が データ の 「中央半分 の はば」 を 表 し ま す。
例題
データ (n=9): 2,3,5,6,7,8,9,11,14。
中央値Q2=7 (5 番目)。
下半分2,3,5,6 の 中央値 → Q1=23+5=4。
上半分8,9,11,14 の 中央値 → Q3=29+11=10。
四分位範囲=10−4=6。
箱ひげ図
最小値・Q1・Q2・Q3・最大値 の 5 数 を 箱 と ひげ で 表す 図。
| 部分 | 表す もの |
|---|
| 箱 の 左端 | Q1 |
| 箱 の 中 の 線 | Q2 (中央値) |
| 箱 の 右端 | Q3 |
| ひげ の 左端 | 最小値 |
| ひげ の 右端 | 最大値 |
| 5 数 | 値 |
|---|
| 最小値 | 2 |
| Q1 | 4 |
| Q2 | 7 |
| Q3 | 10 |
| 最大値 | 14 |
ポイント: 箱ひげ図 は 複数 の データ を 並 べ て 比較 す る の に 強 い。 平均値 だ け で は 見 え な い 「ば ら つ き」 が 一目 で わ か り ま す。
3. 分散 と 標準偏差
偏差
各 データ xi と 平均xˉ の 差:
xi−xˉ
これ が 偏差。 偏差 を そのまま 平均 する と 必ず 0 に なる (+ と − が 打 ち 消 し 合 う)。
分散
偏差 の 平方 の 平均:
V=n1∑i=1n(xi−xˉ)2
標準偏差
分散 の 平方根:
σ=V
(ギリシャ 文字 シグマ で 表す。 単位 が 元 の データ と 同じ に 戻 る)
例題
データ: 2,4,6,8,10 (n=5)。
平均xˉ=6。
| xi | xi−xˉ | (xi−xˉ)2 |
|---|
| 2 | −4 | 16 |
| 4 | −2 | 4 |
| 6 | 0 | 0 |
| 8 | 2 | 4 |
| 10 | 4 | 16 |
| 計 | 0 | 40 |
分散V=540=8、 標準偏差σ=8=22。
大事: 標準偏差 は 「データ が 平均 から どれ くらい 離 れ て い る か の 平均的 な 大 き さ」。 単位 が データ と 同じ な ので 直感的 に わ か り や す い。
4. 分散 の 別公式
公式
V=x2−(xˉ)2
(平均 の 平方 を 引 い た 「平方 の 平均」)
由来
V=n1∑(xi−xˉ)2=n1∑xi2−2xˉ⋅n1∑xi+xˉ2
=x2−2xˉ2+xˉ2=x2−xˉ2
例題 (再掲)
データ 2,4,6,8,10:
x2=54+16+36+64+100=5220=44
V=44−62=44−36=8
(さき の 結果 と 一致)
ポイント: データ 数 が 多い とき は こ の 別公式 の ほう が 速 い。 偏差 を いち いち 出 さ ず に 済 む。
5. データ の 変換 と 統計量
平均・分散 の 性質
各 データ を yi=axi+b と 線形変換 した とき:
| 統計量 | 変化 |
|---|
| 平均 | yˉ=axˉ+b |
| 分散 | Vy=a2Vx |
| 標準偏差 | $\sigma_y = |
例題
平均50, 標準偏差10 の テスト の 点数 を y=0.5x+25 に 変換 すると:
| 統計量 | 値 |
|---|
| yˉ | 0.5⋅50+25=50 (変 わ ら ず) |
| σy | 0.5⋅10=5 (半分 に) |
偏差値
T=σx−xˉ⋅10+50
平均50, 標準偏差10 に 標準化 した 値。 自分 が 集団 の どの あたり に いる か を 比較 する の に 使 い ま す。
大事: 線形変換 で 平均 は 同 じ よ う に 動 く が、 分散 は a2倍 (定数b は 影響 し な い)。 ここ が 試験 で よ く 問 わ れ ま す。
6. 例題 (総合)
10 人 の テスト 点数: 40,50,60,60,65,70,75,80,85,95。
(1) 平均
xˉ=1040+50+60+60+65+70+75+80+85+95=10680=68
(2) 中央値 (n=10, 偶数)
5 番目 と 6 番目 の 平均: 265+70=67.5
(3) 分散 (別公式)
x2=101600+2500+3600+3600+4225+4900+5625+6400+7225+9025=1048700=4870
V=4870−682=4870−4624=246
(4) 標準偏差
σ=246≈15.7
ポイント: 「平均 → 平方 の 平均 → 分散 = 平方 の 平均 - 平均 の 平方 → 標準偏差」 の 4 ステップ。 計算 を 表 に し て 進 め る と ミス が 減 り ま す。
まとめ
- 代表値 は 平均・中央値・最頻値 を 状況 で 使い 分 け
- 四分位数 と 箱ひげ図 で データ の 「広 が り」 を 視覚化
- 分散 = 偏差平方 の 平均、 標準偏差 = 分散 の
- 別公式V=x2−(xˉ)2 が 計算 に 便利
- y=ax+b で 平均 は 線形、 分散 は a2倍
次章 で は 「2 つ の デ ー タ の 関係」 を 表 す 相関係数 と 散布図 を 学 び、 データの分析 を 完結 さ せ ま す。