この 章 で 学ぶ こと
世の中 に は 数 の 集まり (データ) が あふれて い ます。 「数 が 多い」 と わけ が わから なく なる ので、 整理 し、 数 で 特ちょう を つかむ こと が 大切 です。
- 度数分布表 と ヒストグラム を 作れる・読める
- 階級・階級の幅・度数・相対度数・累積度数 の 用語 を 区別 できる
- 平均値・中央値・最頻値 の 求め方 と 違い を 知る
- 範囲 で データ の 散らばり が わかる
- 代表値 を 場面 で 使い 分ける
- 相対度数 を 確率 の 見当 と して 利用 できる
ポイント: 中 1 で は 「ばらばら の 数 を ひと まとめ に 見る」 こと が 目標。 中 2 で の 「箱ひげ 図」、 中 3 で の 「標本調査」 へ つながり ます。
1. 度数分布表
用語
| 用語 | 意味 |
|---|
| **[[階級 | かいきゅう]]** |
| **[[階級の幅 | かいきゅうのはば]]** |
| **[[度数 | どすう]]** |
| **[[階級値 | かいきゅうち]]** |
| **[[累積度数 | るいせきどすう]]** |
| **[[相対度数 | そうたいどすう]]** |
例 — 50 m 走 の 記録
| 階級 (秒) | 階級値 | 度数 (人) | 累積度数 | 相対度数 |
|---|
| 7.0〜8.0 | 7.5 | 2 | 2 | 0.05 |
| 8.0〜9.0 | 8.5 | 10 | 12 | 0.25 |
| 9.0〜10.0 | 9.5 | 18 | 30 | 0.45 |
| 10.0〜11.0 | 10.5 | 8 | 38 | 0.20 |
| 11.0〜12.0 | 11.5 | 2 | 40 | 0.05 |
| 合計 | — | 40 | — | 1.00 |
大事: 「○以上 △未満」 の 表記 で、 境目 の 値 (ちょうど 8.0 秒) は 下 の 階級 に 入る。
2. ヒストグラム と 度数折れ線
ヒストグラム
度数分布表 を 棒 で 表した もの が ヒストグラム。 棒 と 棒 の 間 は すきま なく 並べる (棒グラフ と 違う 点)。
度数折れ線
各階級 の 階級値 の 上 に 度数 を 点 で 打ち、 直線 で 結んだ もの。 両端 は 0 度数 まで 下ろす。
大事: ヒストグラム は 山 の 形 を 見る。 「左 に かたよる」 「中央 に 集まる」 「2 つ の 山」 など、 形 から データ の 性質 を 読み 取る。
3. 代表値
たくさん の データ を 1 つ の 値 で 代表 さ せ た もの を 代表値 と いい、 主 に 3 つ あり ます。
平均値
すべて の データ を たして 個数 で わった もの。
平均値=データ の 個数データ の 合計
例: 4,6,8,10,12 の 平均 = 540=8
中央値 (メジアン)
データ を 小さい 順 に 並べた とき の まんなか の 値。
| 個数 | 中央値 の 求め方 |
|---|
| 奇数個 | まんなか の 1 個 |
| 偶数個 | まんなか 2 個 の 平均 |
例: 1,3,5,7,9 → 中央値5
例: 1,3,5,7,9,11 → 中央値25+7=6
最頻値 (モード)
データ の 中 で 一番多く 出て くる 値。 度数分布表 で は 度数 が 最大 の 階級 の 階級値。
例題
例題
| データ | 平均 | 中央 | 最頻 |
|---|
| 5,7,7,8,10,10,10,12,15 | 984≒9.3 | 10 | 10 |
| 20,30,40,50,60 | 40 | 40 | なし (全部 1 回 ずつ) |
やって みよう: 4,6,6,8,11 の 平均値 と 中央値 と 最頻値 を 求めよ。 (答え: 平均7、 中央6、 最頻6)
4. 範囲 と 散らばり
範囲 (レンジ)
データ の 最大値 から 最小値 を ひいた 値。 散らばり の 大ざっぱ な 目安。
範囲=(最大値)−(最小値)
例: 5,7,9,12,15 → 範囲15−5=10
代表値 と 散らばり
| 比べる もの | 例 |
|---|
| A 組: 50, 60, 70, 80, 90 | 平均 70、 範囲 40 |
| B 組: 60, 65, 70, 75, 80 | 平均 70、 範囲 20 |
平均 は 同じ で も、 B 組 の 方 が ばらつき が 小さい こと が 範囲 で わかる。
大事: 平均 だけ で は データ の 全体像 が わから ない。 散らばり も あわせて 見る。
5. 代表値 の 使い分け
| 状況 | 適 し た 代表値 | 理由 |
|---|
| ふつう の 連続 した データ (身長、 テスト 点) | 平均値 | 全体 を バランス よく 反映 |
| 極端 に 大きな (小さな) 値 が 混じる | 中央値 | 平均 は 外れ値 に 引っ張ら れる |
| 「人気 の 商品」 「最も 多い 反応」 | 最頻値 | 一番多く 出 る 値 を 知り たい |
例: 給料 の データ で、 1 人 だけ ものすごく 高い 給料 の 人 が いる と 平均 は 大きく ふくらむ。 こ う い う と き は 中央値 が 実感 に 近い。
6. 相対度数 と 確率 の 見当
相対度数 と は
ある 階級 の 度数 が 全体 に 占める 割合。
相対度数=度数 の 合計その 階級 の 度数
すべて の 階級 の 相対度数 を たす と 1 に なる。
「確率 の 見当」 と して
実験 や 観察 を 多数行う と、 ある 事 がら の 起こる 相対度数 が 一定 の 値 に 近づく こと が ある。 この とき、 その 値 を 「起こり やすさ (確率) の 見当」 と 考える こと が できる。
例: コイン を 100 回投げて 表 が 53 回出た → 「表 の 出る 相対度数 = 0.53」、 「表 の 出る 確率 ≒ 0.5」 と 見当 を つける。
大事: 「相対度数 が 多数試行 で 一定 の 値 に 近づく」 と いう 見方 が、 中 2 以降 で 学ぶ 「確率」 へ つながる。
まとめ
- データ は 度数分布表 や ヒストグラム で 整理 する
- 代表値 = 平均値・中央値・最頻値、 状況 で 使い 分ける
- 範囲 で 散らばり の 目安 が わかる
- 平均 と 散らばり の 両方 を 見る こと が 重要
- 相対度数 は 全体 の 中 で の 割合、 多数試行 で 確率 の 見当 に なる