箱ひげ図と四分位数
統計・データ分析 — 分布の形を 5 数要約で捉える
操作
0.0
1.0
最小値
—
Q1(第1四分位数)
—
中央値 Q2
—
Q3(第3四分位数)
—
最大値
—
IQR = Q3 − Q1
—
Q1
Q2(中央値)
Q3
外れ値
通常データ
箱ひげ図はデータの分布を 5 数(最小値・Q1・中央値・Q3・最大値)で要約した図です。
箱の中に中央 50% のデータが収まり、ひげが分布の広がりを示します。
外れ値は Q1−1.5×IQR より小さい、または Q3+1.5×IQR より大きい値で、個別の点として表示されます。
いま何が起きている?
スライダーを動かしてください。
ここがポイント
- 5 数要約: 最小値・Q1・中央値(Q2)・Q3・最大値の 5 つでデータ全体を要約できる
- IQR(四分位範囲) = Q3 − Q1 は中央 50% のデータが占める幅で、外れ値に影響されない頑健な散らばりの指標
- 外れ値の基準: Q1−1.5×IQR 〜 Q3+1.5×IQR の範囲を外れた点が外れ値とみなされる(Tukey の基準)
- 歪みの可視化: 箱の中で中央値の位置が偏っているほど、データ分布に歪みがある。分布を一目で比較するのに適した図