代表通信～React Tinder CardとStackGAN

草場代表

2020/08/04

こんばんは。代表の草場です。

本日は打ち合わせは2件のみで、比較的落ち着いた一日でした。朝プログラミングを再開（何度か。。）。Reactのコンポーネントで、React Tinder Cardというのがあります。Tinderはマッチングアプリですが、スワイプしながら相手を選んでいきます。それが簡単に入れれるコンポーネントです（デモはこちら）。なんでもありますね。Tinderのクローンを作ります。

さて、文章から写真を生成する、StackGANというモノがあります。もう四年前に出ていますが、これ使いたいなーというので実装を始めています。なんでStackなの？というと、2つのGANを積み重ねて高解像度の画像を生成できるネットワークを形成しているからです。このネットワークには、Stage-IとStage-IIの2つのステージがあります。Stage-Iネットワークでは、テキストの埋め込みを条件に、基本色やラフスケッチなどの低解像度の画像を生成。Stage-IIネットワークでは、Stage-Iネットワークで生成された画像を用いて、テキストの埋め込みを条件に高解像度の画像を生成します。Stage-IIでは、欠陥を補正し、細部に説得力を持たせることで、よりリアルな高解像度画像を生成しています。
StackGANのネットワークを画家の仕事に例えられます。
線や円、長方形などの原始的な形を描き、色を塗っていきます。絵が進むにつれて、こまかい構造が追加されます。StackGANでは、Stage-Iは原始的な図形を描く作業、Stage-IIはStage-Iのネットワークで生成された画像の欠陥を修正する作業です。また、Stage-IIでは、画像をよりフォトリアルに見せるために細かい点を追加します。
両ステージの生成ネットワークは、Conditional Generative Adversarial Networks（CGAN）です。第1のGANはテキスト記述を条件とし、第2のネットワークはテキスト記述と第1のGANで生成された画像を条件としています。

明日以降、結果を載せていきます。

明日もGAN。

この記事を書いた人

草場代表

エディター

EVENTS