畳み込み演算
CNN(畳み込みニューラルネット)の心臓部 ── 小さなフィルタが画像をスライドして特徴マップを作る様子を 1 マスずつ見ます。
カーネルのプリセット
入力画像のプリセット
0
入力画像 (8×8)
カーネル (3×3)
特徴マップ (6×6)
いま計算しているマス
畳み込みは、小さな カーネル(フィルタ)を画像の上で少しずつずらしながら、
重なった部分の 掛け算の合計を計算する操作です。
その結果が 特徴マップ ── 「縦の境目」「明るさの変化」などフィルタが反応した場所が浮かび上がります。
入力マスをクリックで塗り替え、カーネルの数値を編集して、何が抽出されるか試してください。
その結果が 特徴マップ ── 「縦の境目」「明るさの変化」などフィルタが反応した場所が浮かび上がります。
入力マスをクリックで塗り替え、カーネルの数値を編集して、何が抽出されるか試してください。
ここがディープラーニングの核心
- 畳み込み=同じ小さなフィルタを画像全体にスライドさせて掛け算の和をとるだけ。
- フィルタの数値しだいで「縦の線」「明るさの段差」など 抽出される特徴が変わる。
- CNN では このフィルタの数値そのものを学習する ── 何に注目すべきかを自分で見つける。
- 層を重ねると、エッジ → 模様 → 物体パーツ → 物体、と特徴が抽象化していく。