分散と標準偏差で「散らばり」を測る
統計・データ分析 — kobo-ideas 018 POC
操作パネル
×1.0
平均 μ
—
分散 σ²
—
標準偏差 σ
—
±σ 内の点
—
σ² = (偏差²の平均)
σ = √σ²(単位をデータに戻す)
データ点
平均 μ
偏差
偏差²
±σ 帯
データが「どれだけ散らばっているか」を一つの数で表したいとき、分散と標準偏差を使います。
各データ点が平均からどれだけ離れているか(偏差)を計算し、
プラスとマイナスが打ち消し合わないよう 二乗して平均した値が分散(σ²)、
さらに √ を取って単位を元に戻したものが標準偏差(σ)です。
スライダーで散らばりを変えて、σ の変化を確認しましょう。
いま何が起きている?
スライダーを動かして散らばりを変えてみましょう。
スライダーを動かして散らばりを変えてみましょう。
ここがポイント
- 偏差²の平均 = 分散(σ²)。偏差をそのまま足すと+−で打ち消されるため、二乗して必ず正にする。
- √分散 = 標準偏差(σ)。二乗で変わった単位を √ で元に戻すので、データと同じ単位になる。
- σ が大きいほどデータが散らばっている。σ が小さければ点が平均の近くに集まっている。
- 平均±σ の範囲はデータの散らばりの「目安」。正規分布では約 68 % の点がこの範囲に入る。