代表通信~キャプショニング自動生成
草場代表
2020/07/17

こんばんは。代表の草場です。
本日は2年くらい付き合いのあるStartup Ladyの代表の鈴木さんと久々食事に行きました。相変わらず精力的に活動されており、大変勉強になりました。学生時代に通われていたアメリカの大学のことを詳しく聞かせてもらいました。なんと、50ヵ国から人が集まる大学だそうです。多様性という観点で話を聞かせてもらいましたが、自然と大学のころに多様性が当たり前の環境にいらっしゃって、うらやましいなと思いました。今後も連携できれば!
さて、「ビジュアルアテンションを用いた画像キャプショニング」で遊んでいます。が、、データが重すぎる。。以下のような写真から、キャプションを自動的に生成するモデルです。

上記だと、”a surfer riding on a wave”というキャプションが生成されます。MS-COCO データセットをダウンロードし、Inception V3 を使って画像のサブセットを前処理し、キャッシュします。その後、エンコーダー・デコーダーモデルを訓練し、訓練したモデルを使って新しい画像のキャプションを生成します。訓練用のMS-COCOデータセットが13GBととても重く、ダウンロードするときに何回も止まってしまいました。。
InceptionV3 を使った画像の前処理→InceptionV3 を初期化し Imagenet で学習済みの重みをロード→InceptionV3 から抽出した特徴量のキャッシング
と進むんですが、InceptionV3 から抽出した特徴量のキャッシングでまた止まりました。原因究明中ですが、ストレスですね!
明日も転移学習。
この記事を書いた人
草場代表
エディター
EVENTS
03/23(月)20:00~ 【初心者向け】GAS基礎講座 スプレッドシート操作1(シートアクセス、セルの値の取得及び入力)
2026/03/23 (月) 20:00 ~ 21:00
無料
オンライン
03/16(月)20:00~ 【初心者向け】GASで学ぶWebアプリ – CSSフレームワーク入門
2026/03/16 (月) 20:00 ~ 21:00
無料
オンライン
【02/27(金)20:00~】【初心者向け】言葉と指差しだけでアプリ開発!?Google最新AIで「自分だけの旅行ガイド」を作ろうハンズオン
2026/02/27 (金) 20:00 ~ 21:00
無料
オンライン
【02/13(金)20:00~】Google Gemini Gemsで“記憶するAIパートナー”を育てる初心者向けハンズオン
2026/02/13 (金) 20:00 ~ 21:00
無料
オンライン
02/16(月)20:00~ 【初心者向け】GAS基礎講座 配列・ループ処理
2026/02/16 (月) 20:00 ~ 21:00
無料
オンライン