※本記事は、心理学を学ぶ上で欠かせない「統計学」の基礎として、記述統計の中核である「ばらつき(散布度)」について整理した学習記録です。専門用語をなるべく噛み砕き、初学者にも伝わるようにまとめています。
---
散布度は「データの安定感」を測るもの
前回の記事では、代表値と散布度の基本を確認しました。
今回はその続きとして、**標準偏差(SD)と四分位範囲(IQR)**という2つの代表的な散布度を掘り下げてみます。
散布度は、単に「データがどのくらいバラついているか」を示す指標です。
平均値だけでは「だいたい真ん中」しか分かりませんが、散布度をあわせて見ることで、データが「安定しているのか」「バラバラなのか」が具体的に見えてきます。
---
標準偏差(SD):平均からのズレの大きさ
標準偏差は「一つ一つのデータが平均からどれくらい離れているか」を数値化したものです。
例として、5つのデータ「1, 2, 4, 7, 11」を考えます。平均は5です。
平均との差は -4, -3, -1, +2, +6。
そのまま合計すると0になってしまうので、差を二乗して足し合わせます。
16, 9, 1, 4, 36 \quad → \quad 合計 = 66
66をデータ数5で割ると13.2。
平方根をとって√13.2 ≈ 3.63。
つまり、このデータの標準偏差は 3.63 となります。
これは「平均値5を中心に、おおよそ±3.63の範囲にデータが散らばっている」と解釈できます。
👉 標準偏差が大きいほどデータの広がりが大きく、小さいほど安定していると考えられます。
---
四分位範囲(IQR):外れ値に強い散布度
一方、外れ値(極端に大きい/小さい値)があると、平均や標準偏差はその影響を受けやすくなります。
そこで役立つのが IQR(四分位範囲) です。
IQRは「データの中央50%がどのくらい広がっているか」を示す指標で、第1四分位点(Q1)から第3四分位点(Q3)を引いて求めます。
中央値を基準に計算されるため、外れ値が混じっていても大きく崩れにくいのがメリットです。
👉 一般的には、中央値とセットでIQRを使うことが多く、外れ値に左右されにくい堅牢な分析が可能になります。
---
散布度の使い分け
平均値を使うとき → 標準偏差(SD)をあわせる
中央値を使うとき → 四分位範囲(IQR)をあわせる
このように、代表値と散布度はペアで見ることが基本です。
同じ平均値を持つ2つのグループでも、散布度が違えば「安定したグループ」か「バラついたグループ」かという印象は大きく変わってきます。
---
まとめ
標準偏差(SD)は「平均を基準にした散らばり」
四分位範囲(IQR)は「中央値を基準にした散らばり」
外れ値がなければSD、外れ値の影響を避けたいならIQR、と使い分けるのがポイント
---
次回予告
次回は「平均値と標準偏差の活用例」として、試験の成績など、実際の研究でどのように使われるかを整理していきます。
---
#心理統計 #記述統計 #標準偏差 #四分位範囲 #外れ値 #心理学部 #学び直し #大人の学び #データ分析