UMAP — 近傍グラフを低次元へ
非線形次元削減 / 高次元→2D / 近傍グラフ+引力斥力
パラメータ
15
n_neighbors
15
反復回数
0
クラスタ数
4
状態
待機中
※ このデモは UMAP の考え方(近傍グラフ+引力斥力)を簡略化した実装です。実際の UMAP はファジィ単体集合と交差エントロピー最適化を使います。
元データ(高次元 5D の第1・2軸)
UMAP 風 2D 埋め込み(反復更新)
反復: 0
いま何が起きている?
リセット後、▶ 実行 を押すと近傍グラフを構築してアニメーションが始まります。
UMAP(Uniform Manifold Approximation and Projection) は、高次元データを低次元に圧縮する非線形次元削減手法です。
高次元空間での「近傍関係(どの点が近くにあるか)」をグラフとして捉え、そのグラフ構造を低次元でも保つように点を配置します。
t-SNE と似ていますが、大域構造(クラスタ間の関係)を保ちやすく、計算も高速なのが特徴です。
n_neighbors を小さくすると局所構造重視、大きくすると大域構造重視になります。
ここがポイント
- 近傍グラフ:高次元で各点の k 近傍を求め、近いほど重いエッジを張る
- 引力(近傍)+斥力(非近傍):近傍ペアは引き寄せ、非近傍ペアはランダムサンプルして押し離す
- t-SNE より高速で大域構造も保ちやすい:負サンプリングにより全ペア計算を避ける
- n_neighbors で局所/大域のバランス:小さい → 局所構造重視、大きい → 大域構造重視
- 非線形次元削減:線形な PCA では捉えられない複雑な多様体構造も展開できる