この章で学ぶこと
世の中には数の集まり (データ) があふれています。 「数が多い」 とわけがわからなくなるので、 整理し、 数で特ちょうをつかむ ことが大切です。
- 度数分布表 と ヒストグラム を作れる・読める
- 階級・階級の幅・度数・相対度数・累積度数 の用語を区別できる
- 平均値・中央値・最頻値 の求め方と違いを知る
- 範囲 でデータの散らばりがわかる
- 代表値 を場面で使い分ける
- 相対度数 を 確率の見当 として利用できる
ポイント: 中 1 では 「ばらばらの数をひとまとめに見る」 ことが目標。 中 2 での 「箱ひげ図」、 中 3 での 「標本調査」 へつながります。
1. 度数分布表
用語
| 用語 | 意味 |
|---|
| 階級 | データを区切った区間 (例: 50 cm 以上 60 cm 未満) |
| 階級の幅 | 区間のはば (例: 10 cm) |
| 度数 | その階級に入るデータの個数 |
| 階級値 | 階級のまんなかの値 (例: 50〜60 → 55) |
| 累積度数 | その階級までの度数の合計 |
| 相対度数 | 合計度数 |
例 — 50 m 走の記録
| 階級 (秒) | 階級値 | 度数 (人) | 累積度数 | 相対度数 |
|---|
| 7.0〜8.0 | 7.5 | 2 | 2 | 0.05 |
| 8.0〜9.0 | 8.5 | 10 | 12 | 0.25 |
| 9.0〜10.0 | 9.5 | 18 | 30 | 0.45 |
| 10.0〜11.0 | 10.5 | 8 | 38 | 0.20 |
| 11.0〜12.0 | 11.5 | 2 | 40 | 0.05 |
| 合計 | — | 40 | — | 1.00 |
大事: 「○以上 △未満」 の表記で、 境目の値 (ちょうど 8.0 秒) は 下の階級 に入る。
2. ヒストグラムと度数折れ線
ヒストグラム
度数分布表 を棒で表したものが ヒストグラム。 棒と棒の間は すきまなく 並べる (棒グラフと違う点)。
度数折れ線
各階級の 階級値 の上に度数を点で打ち、 直線で結んだもの。 両端は 0 度数まで下ろす。
大事: ヒストグラムは 山の形 を見る。 「左にかたよる」 「中央に集まる」 「2 つの山」 など、 形からデータの性質を読み取る。
3. 代表値
たくさんのデータを 1 つの値 で代表させたものを 代表値 といい、 主に 3 つあります。
平均値
すべてのデータをたして個数でわったもの。
平均値=データの個数データの合計
例: 4,6,8,10,12 の平均 = 540=8
中央値 (メジアン)
データを 小さい順に並べたときのまんなか の値。
| 個数 | 中央値の求め方 |
|---|
| 奇数個 | まんなかの 1 個 |
| 偶数個 | まんなか 2 個の平均 |
例: 1,3,5,7,9 → 中央値5
例: 1,3,5,7,9,11 → 中央値25+7=6
最頻値 (モード)
データの中で 一番多く出てくる 値。 度数分布表では 度数が最大の階級の 階級値。
例題
例題
| データ | 平均 | 中央 | 最頻 |
|---|
| 5,7,7,8,10,10,10,12,15 | 984≒9.3 | 10 | 10 |
| 20,30,40,50,60 | 40 | 40 | なし (全部 1 回ずつ) |
やってみよう: 4,6,6,8,11 の平均値と中央値と最頻値を求めよ。 (答え: 平均7、 中央6、 最頻6)
4. 範囲と散らばり
範囲 (レンジ)
データの 最大値から最小値をひいた値。 散らばりの大ざっぱな目安。
範囲=(最大値)−(最小値)
例: 5,7,9,12,15 → 範囲15−5=10
代表値と散らばり
| 比べるもの | 例 |
|---|
| A 組: 50, 60, 70, 80, 90 | 平均 70、 範囲 40 |
| B 組: 60, 65, 70, 75, 80 | 平均 70、 範囲 20 |
平均は同じでも、 B 組の方が ばらつきが小さい ことが範囲でわかる。
大事: 平均だけではデータの全体像がわからない。 散らばり もあわせて見る。
5. 代表値の使い分け
| 状況 | 適した代表値 | 理由 |
|---|
| ふつうの連続したデータ (身長、 テスト点) | 平均値 | 全体をバランスよく反映 |
| 極端に大きな (小さな) 値 が混じる | 中央値 | 平均は外れ値に引っ張られる |
| 「人気の商品」 「最も多い反応」 | 最頻値 | 一番多く出る値を知りたい |
例: 給料のデータで、 1 人だけものすごく高い給料の人がいると平均は大きくふくらむ。 こういうときは 中央値 が実感に近い。
6. 相対度数と確率の見当
相対度数とは
ある階級の度数が 全体に占める割合。
相対度数=度数の合計その階級の度数
すべての階級の相対度数をたすと 1 になる。
「確率の見当」 として
実験や観察を多数行うと、 ある事がらの起こる 相対度数 が一定の値に近づくことがある。 このとき、 その値を 「起こりやすさ (確率) の見当」 と考えることができる。
例: コインを 100 回投げて表が 53 回出た → 「表の出る相対度数 = 0.53」、 「表の出る確率 ≒ 0.5」 と見当をつける。
大事: 「相対度数 が多数試行で一定の値に近づく」 という見方が、 中 2 以降で学ぶ 「確率」 へつながる。
まとめ
- データは 度数分布表 や ヒストグラム で整理する
- 代表値 = 平均値・中央値・最頻値、 状況で使い分ける
- 範囲 で散らばりの目安がわかる
- 平均と散らばりの 両方 を見ることが重要
- 相対度数 は全体の中での割合、 多数試行で 確率の見当 になる