この 章 で 学ぶ こと
中 1 で は 度数分布表 や ヒストグラム で データ を 「お お ま か に 見 る」 方法 を 学 び ま し た。 中 2 で は さ ら に 進 ん で、 四分位数 と 箱ひげ図 で 「散 ら ば り」 を 数字 と 図 で 比較 で きる よう に な り ま す。
- 四分位数 (Q1、 Q2、 Q3) の 求 め 方 が わかる
- 四分位範囲 (IQR) の 意味 を 言え る
- 箱ひげ図 が かけ る・読 め る
- 外れ値 の 見つけ方 が わかる
- 複数 の データ の 分布 を 比較 で きる
ポイント: 中 1 の 平均値・中央値・最頻値 と 中 2 の 四分位数 を 合 わ せ て 「データ を 代表値 + 散らばり」 で 見 る 力 が つ き ま す。
1. データ を 並 べ る
中 2 の データ 単元 は、 まず データ を 小さ い 順 に 並 べ る こと か ら 始 ま り ま す。
例: 9 人 の テスト の 点 (10 点満点)
4,7,5,8,6,3,9,6,7
小さ い 順 に 並 べ る:
3,4,5,6,6,7,7,8,9
2. 中央値 (第 2 四分位数)
中 1 で 学んだ 中央値 は、 「並 べ た と き の 真 ん 中」 の 値。 別名 第 2 四分位数 (Q2) と も 言 い ま す。
| データ の 個数 | 中央値 |
|---|
| 奇数 個 (例: 9 個) | 真ん中 の 1 個 (5 番目) |
| 偶数 個 (例: 8 個) | 真 ん 中 の 2 個 の 平均 |
上 の 9 個 の 例 で は、 5 番目 の 6 が 中央値。
3. 第 1 四分位数 と 第 3 四分位数
データ を 真ん中 で 半分 に し て、 さ ら に そ れ ぞ れ の 半分 の 中央 を 取 り ま す。
| 名前 | 意味 |
|---|
| **[[第 1 四分位数 | だい 1 よんふんいすう]]** (Q1) |
| **[[第 2 四分位数 | だい 2 よんふんいすう]]** (Q2) |
| **[[第 3 四分位数 | だい 3 よんふんいすう]]** (Q3) |
例 (9 個 の データ)
3,4,5,6,6,7,7,8,9
(中央値Q2=6、 5 番目)
中央値Q2 を 除 い た 下半分 と 上半分:
| 下半分 | 3,4,5,6 |
|---|
| 上半分 | 7,7,8,9 |
| 値 | 求 め 方 | 結果 |
|---|
| Q1 | 下半分3,4,5,6 の 中央 (4 個 → 2 個 の 平均) | 24+5=4.5 |
| Q2 | 全体 の 中央 | 6 |
| Q3 | 上半分7,7,8,9 の 中央 | 27+8=7.5 |
大事: データ の 個数 が 奇数 の と き は、 中央値 を 除 い て 上下 を 分 け る (この 教科書 の 流儀)。 偶数 の と き は 真 ん 中 で 半分。
4. 四分位範囲 (IQR)
四分位範囲 (IQR、 Inter Quartile Range) は、
IQR=Q3−Q1
「真 ん 中 50 % の 散 ら ば り の 幅」 を 表 し ま す。
上 の 例
IQR=7.5−4.5=3
なぜ IQR を 使 う か
範囲 = (最大値) − (最小値) は、 1 つ の 極端 な 値 で 大き く 変 わ っ て し ま い ま す。 IQR は 真 ん 中 の 50 % だけ を 見 る の で、 外れ値 の 影響 を 受 け に く い 安定 し た 指標 で す。
| 指標 | 影響 を 受 け る か |
|---|
| 平均値 | 受 け や す い |
| 中央値 | 受 け に く い |
| 範囲 | 受 け や す い |
| IQR | 受 け に く い |
5. 五数要約 と 箱ひげ図
データ の 散 ら ば り を 5 つ の 数字 で ま と め る の が 五数要約。
| 略称 | 意味 |
|---|
| 最小値 | い ち ば ん 小 さ い 値 |
| Q1 | 第 1 四分位数 |
| Q2 | 中央値 |
| Q3 | 第 3 四分位数 |
| 最大値 | い ち ば ん 大き い 値 |
上 の 例 の 五数要約
[3,4.5,6,7.5,9]
箱ひげ図 の かき方
- 横軸 に 数直線 を かく
- 箱 を Q1 か ら Q3 ま で
- 箱 の 中 に Q2 の 線 を 引く
- ひげ を 最小 か ら 箱 の 左、 箱 の 右 か ら 最大 ま で
最小 Q1 Q2 Q3 最大
3 4.5 6 7.5 9
|---ひげ---|------箱-------|---ひげ---|
読み 方 の ポイント
| 見 る ポイント | 何 が わかる か |
|---|
| 箱 の 位置 | データ が ど こ あ た り に 集中 し て い る か |
| 箱 の 幅 | 散 ら ばり (IQR) |
| ひげ の 長さ | 外れ や す さ |
| 中央線 が 箱 の どこ | データ の 左右 の 偏 り |
6. 外れ値
ほか の データ か ら 大き く 離 れ た 値 を 外れ値 と 言 い ま す。 一般 に は つ ぎ の 範囲 を 外 れ た もの を 外 れ 値 と み な し ま す。
Q1−1.5×IQR<ruby>未<rt>み</rt></ruby><ruby>満<rt>まん</rt></ruby>
Q3+1.5×IQR超 え
上 の 例 で
- IQR =3、 1.5×3=4.5
- 下限: Q1−4.5=4.5−4.5=0
- 上限: Q3+4.5=7.5+4.5=12
⇒ 0 未満 や 12 超 が あ れ ば 外 れ 値。 こ の データ で は な し。
大事: 「外 れ 値 だ か ら 削 る」 と は 限 り ま せ ん。 入試 で は 「な ぜ 外 れ た か」 を 考 え させ る 問題 が 多 い (機械 の 故障、 入力 ミ ス、 例外的 な 出来事等)。
7. データ の 比較
複数 の グループ を 比 べ る と き、 箱 ひげ 図 を 並 べ て かく と 違 い が 一目 で わか り ま す。
例
| クラス A | Q1=5,Q2=7,Q3=8 |
|---|
| クラス B | Q1=4,Q2=6,Q3=9 |
| 観点 | クラス A | クラス B |
|---|
| 中央値 | 7 | 6 |
| IQR | 3 | 5 |
| 散 ら ば り | 小さ い | 大き い |
| 全体 と し て | 安定 し て 高 い | ば ら つ き が 大 き い |
ポイント: 「平均 だ け で は な く 散 ら ば り も 見 る」 が 中 2 デ ー タ の メイン メッセ ー ジ。 代表値 + IQR の セッ ト で 見 る 習慣 を つ け る。
8. ふりかえり