不偏分散 — なぜ n−1 で割るのか?
標本分散(÷n)の偏りとベッセル補正のしくみを「繰り返し実験」で体感する
母集団の設定
固定値 25(σ = 5, μ = 0)
25
4
真の分散 σ²
25.000
÷n の累積平均
—
÷(n−1) の累積平均
—
標本数
0
÷n の期待値(理論値)
σ² × (n−1)/n = 25 × 3/4 = 18.750
÷n(標本分散)の累積平均
÷(n−1)(不偏分散)の累積平均
真の σ² = 25
標本から分散を推定するとき、標本平均まわりの偏差²を n で割る方法と、n−1 で割る(ベッセル補正)方法があります。
繰り返し標本をとってその平均を見ると、÷n は真の母分散 σ² を系統的に過小評価し、÷(n−1) は σ² にぴったり一致することが確認できます。 標本サイズ n を変えながら「何標本集めても÷n が収束しない場所」を体感してみてください。
繰り返し標本をとってその平均を見ると、÷n は真の母分散 σ² を系統的に過小評価し、÷(n−1) は σ² にぴったり一致することが確認できます。 標本サイズ n を変えながら「何標本集めても÷n が収束しない場所」を体感してみてください。
▶ 「+1 標本」や「▶ 連続」を押して標本を積み上げると、赤線と青線の差が見えてきます。
ここがポイント
- ÷n は偏りがある(過小評価):標本平均は標本に最も近い「中心」なので、母平均まわりより偏差²の合計が必ず小さくなる。
- 偏りの大きさは −σ²/n:E[÷n 推定量] = σ²·(n−1)/n ≠ σ²。n が小さいほど大きく外れる。
- ÷(n−1) が不偏分散:分母を n−1(自由度)にすることで偏りがキャンセルされ、E[S²] = σ² になる。
- n が大きくなると差は縮まる:n → ∞ では (n−1)/n → 1 となり、÷n も ÷(n−1) も σ² に近づく。