代表通信～Youtube部、VR/AI、Text-to-Image

草場代表

2020/08/15

こんばんは。代表の草場です。

本日はYoutube部ミーティングです。動画のプロの大澤さん、有名YouTuberの方も参画。細かい改善点が議論できました。Youtuberの方が言う通り、とにかくいろいろ試して具体的な結果を得ること。来週撮影です。演者として参画してくれる方、ありがとうございます！

VRいじろうという話で様々試しています。Facebookの動きで、「Facebook Develops AI Supersampling to Boost Rendering Performance for High-resolution VR Headsets」とう記事が勉強になりました。以下、簡単にまとめて抜粋。

「Facebookは、リアルタイムでレンダリングされたコンテンツをスーパーサンプリングするためのAI支援手法を開発した（”Neural Supersampling for Real-time Rendering”）。
ニューラルネットワークを使用して、低解像度の画像を入力し、リアルタイムレンダリングに適した高解像度の出力を得ることができるシステムを開発。これにより、計算オーバーヘッドを節約しつつ、シャープなディテールを復元することができるという。Facebookの研究者によると、よく似たコンセプトであるNvidiaのディープラーニング・スーパーサンプリングは、「アップサンプリングされた画像に明らかな視覚的なアーチファクトを導入し、特に2×2よりも高いアップサンプリング比では、すべてのプラットフォームで利用できない可能性のある独自の技術やハードウェアに依存している」とのこと。さらに、FacebookのNeural Supersamplingアプローチは、最新のゲームエンジンに簡単に組み込むことができ、専用ドライバなどの特別なハードウェアやソフトウェアを必要としない。」

ハードウェアに依存しない方法を開発したということですね。原論文を訳して勉強します。

ざて、昨日に引き続き、StackGANにてテキストから写真を生成。今回は人がうまく生成されるか、焦点を当ててみました。

a young boy using a computer on a kitchen table（机の上でパソコンを使う子供）