5/17 代表勉強通信～画像処理のプロセス可視化、CNN Explainer試してみた

草場代表

2020/05/17

こんばんは。代表の草場です。

PyCaretは一休みして、本日はCNN Explainerに関してです。どこかのサイトでお勧め論文として載っていた、「CNN Explainer: Learning Convolutional Neural Networks with Interactive Visualization」を試しました。AI使った画像処理はどんどん進んでいますが、初心者にはわかりづらいので可視化したよ、という論文です。ありがたや。

まずはGitHubに移動し、レポジトリをデスクトップにダウンロード。Anacondaで仮想環境作って、以下で依存環境をダウンロードします。なんと、Node.jsが入ってなかったので、Anaconda　Navigator使ってインストールしました。
npm install
そして、以下を実行すると、http://localhost:5000/　が出てくるので、そこに移動します。
npm run dev

上記ページにCNNの解説含めて、詳細に記載があります。とりあえずいじってみます。CNN Explainerで使われているネットワーク・アーキテクチャはTiny VGGです。これは、「最先端のCNNで使われているのと同じレイヤーと操作を多く含んでいますが、より小さなスケールで使われいる」とのことです。

パンダが好きなので、パンダを選びます。CNNは、ざっくりいうと畳み込み（Conv）→活性化関数（ReLuとか）→Max Pool（やらないこともある）の繰り返しで、最後に平たん化（Flatten）→ソフトマックスで合体で判定、という流れです。色が三色（RGB）なので、パンダの写真が三枚に分かれています。

・畳み込み層で起こっていること
Conv1.1をクリックすると、以下の画面になります。フィルターで中間層のニューロンの特徴を取り込んでいる様子です。

Intermidiateの写真をクリックすると、もとの写真からフィルターを通して特徴量をIntermideiate層に取り込む様子が見れます。