t-SNE(非線形次元削減)

高次元の近傍関係を保って 2 次元へ — 反復最適化による埋め込みのアニメ

perplexity
15
反復回数
0
クラスタ数
4
状態
停止
15
高次元データ(最初の 2 次元で可視化)
t-SNE 埋め込み(反復で更新)
いま何が起きている?
「▶ 実行」を押すと t-SNE の最適化が始まります。右のキャンバスでクラスタが分離していく様子を観察できます。
t-SNE(t-distributed Stochastic Neighbor Embedding)は、高次元データを 2 〜 3 次元に圧縮する非線形の次元削減手法です。
PCA などの線形手法と異なり、近傍(近い点どうし)の関係を優先的に保つことでクラスタ構造をはっきり可視化できます。
左図は 5 次元データの最初の 2 次元を切り出したもの。クラスタが重なり気味で見分けにくいことに注目してください。 右図が t-SNE による 2 次元埋め込みで、反復するにつれてクラスタが鮮明に分離していきます。

ここがポイント