【注目AIスタートアップ100社】neptune.aiの紹介
こんにちは。草場です。
エクスポネンシャルテクノロジーの一つ、AIに関して、CBインサイツでリストアップされている注目スタートアップ100社、1社ずつ見ていきます。
「AI 100: The Artificial Intelligence Startups Redefining Industries」
AI、機械学習について見直したい方は、シンラボの人気記事「OpenCVによるAIの実装方法」をご参考ください。
本日取り上げるスタートアップは、ML Experiments Tracking分野のneptune.aiです。どういうプロダクトかというと、
多くの実験を行う研究・生産チームのために作られたMLOps用メタデータストア
すべてのメタデータを1つの場所に整理することで、モデルや実験をコントロールできるようになります。メタデータの管理はNeptuneに任せて、MLに集中しましょう。5分で始められます。
以下の流れのようです(HPより)
MLメタデータストアは、モデル構築時のメタデータ管理を行うMLOpsスタックの重要な部分です。MLモデルのライフサイクルで生成されたすべてのメタデータの記録、保存、表示、整理、比較、問い合わせを簡単に行うことができます。
では、そもそもMLメタデータとは?
実験とモデルトレーニングのメタデータ・・MLの実行中に発生したあらゆる事象を記録することができます。
メトリクス
ハイパーパラメータ
学習曲線
学習コードおよび設定ファイル
予測結果(画像、表など)
診断チャート(混同行列、ROC曲線など)
コンソールログ
ハードウェア
ログ
その他アーティファクトのメタデータ・・データセット、予測、またはモデルについて、ログを取ることができます。
データセットまたはモデルへのパス(s3バケット、ファイルシステム)
データセットのハッシュ
データセット/予測のプレビュー(テーブルの先頭、画像フォルダのスナップショット)
説明
フィーチャーのカラム名(表形式のデータの場合作成者/変更者最終更新日データセットのサイズ)
その他モデルのメタデータ・・学習したモデル(製品版か否かに関わらず)については、以下のようなログを取ることができます。
モデルのバイナリまたはモデル資産の場所
データセットのバージョン
記録されたモデルのトレーニングランや実験へのリンク
誰がモデルをトレーニングしたか
モデルの説明とメモ
観測性ダッシュボード(Grafana)へのリンク
その他
以下の公式が成り立つそうです。
Neptune Metadata Store for MLOps=クライアント+データベース+ダッシュボード
使ってみましょう。
EVENTS