代表値(平均・中央値・最頻値)と外れ値
データをドラッグして3つの代表値がどう変わるか体感しよう
操作
ドット(●)を左右にドラッグして値を変えられます。
同じ値のドットは縦に積み重なります。
平均 (mean)
中央値 (median)
最頻値 (mode)
平均
—
中央値
—
最頻値
—
データ数
—
← ドットを左右にドラッグ →
データの「中心」を表す値には 平均・中央値・最頻値 の3種類があります。
データが左右対称なときはほぼ一致しますが、外れ値(極端に大きい/小さい値)が入ると平均だけが大きく引っ張られます。
中央値と最頻値はその影響を受けにくく、ロバスト(頑健)と呼ばれます。
ドットをドラッグして、3つの代表値の動きの違いを確かめてみましょう。
いま何が起きている?
データをドラッグして変えてみよう。
データをドラッグして変えてみよう。
ここがポイント
- 平均(mean)は全データの合計 ÷ 個数。1つの外れ値でも大きく変わる。
- 中央値(median)は並べたときの真ん中の値。外れ値に引っ張られない(ロバスト)。
- 最頻値(mode)は最も多く出現する値。離散データやカテゴリに特に有効。
- 分布が左右非対称(歪んでいる)と平均 ≠ 中央値になり、そのズレが歪みの大きさを表す。