主成分分析(PCA)
分散最大の方向=主成分 / 統計・多変量 / 次元削減
パラメータ
0.80
20°
PC1 寄与率
—
PC2 寄与率
—
PC1 方向(角度)
—
全分散
—
PC1(第1主成分)
PC2(第2主成分)
PC1 への射影
PCA(主成分分析)とは、多次元データを「分散が最大になる方向」へ投影することで次元を削減する手法です。データの共分散行列を固有値分解し、最大固有値に対応する固有ベクトルが第1主成分(PC1)になります。PC1 に射影するだけで、もとの情報をできるだけ保ったまま 2 次元 → 1 次元に圧縮できます。
いま何が起きている?
—
—
ここがポイント
- 分散最大の直交方向=主成分。PC1 は最も情報を多く持つ方向、PC2 はそれと直交する残差方向。
- 共分散行列の固有ベクトルが主成分の方向を決める。固有値がその方向の分散量に対応。
- 寄与率=説明できる分散の割合(λ₁ / (λ₁ + λ₂))。相関が強いほど PC1 に分散が集中する。
- 主成分への射影=次元削減。各点を PC1 軸上の点に落とし込むことで 1 次元表現を得る。
- PCA は線形手法。非線形な構造は捉えられない(その場合は t-SNE, UMAP 等)。