相関係数 とは、共分散を 各々の標準偏差でわった無次元量です。
| の値 | 関係 |
|---|---|
| 完全な正の相関(一直線) | |
| 完全な負の相関(一直線) | |
| 直線的な関係なし |
必ず の範囲に収まります。 が に近いほど点が一直線に近く、強い相関を表します。単位によらないので、異なる種類のデータでも相関の強さを比べられます。
注意 は「直線的な」関係の強さしか測れない。 でも曲線的な関係(無相関の項参照)はありうるので、必ず散布図と合わせて判断する。
相関係数(Correlation Coefficient、r)は、2 つの変数の直線的な関係の強さを 〜 の値で示す統計指標です。
| 相関係数 r | 関係 | 例 |
|---|---|---|
| +1 に近い | 強い正の相関 | 身長が高いほど体重も重い |
| 0 に近い | ほぼ無相関 | 関係が薄い |
| −1 に近い | 強い負の相関 | 価格が高いほど販売数が減る |
散布図と併用してデータの傾向を把握します。注意点として、相関は因果関係を示すものではありません(たまたま一緒に動くだけの「疑似相関」もあります)。回帰分析や機械学習の特徴量選択でも使われます。
試験では 「+1〜−1 の範囲」「0 が無相関」と、相関と因果は別である点が問われます。