未来を創る、テックコミュニティー

4/29 代表のお勉強通信~TFX: A TensorFlow-Based Production-Scale Machine Learning Platform

草場代表
2020/04/29

こんばんは。代表の草場です。

MLOpsに関心があり、TFXについて勉強しています。機械学習システムの構築の話です。機械学習システムでは学習アルゴリズムに注目しがちですが、実運用を考えると学習アルゴリズムよりもその周辺の仕組みの規模が圧倒的に大きい。それではどうすればいいか?

TFX: A TensorFlow-Based Production-Scale Machine Learning Platform」という論文でGoogleさんが事例発表してくれています。ありがたや。Netflixなど、他の会社がどうしているかは、「Re:ゼロから始めるML生活」さんのこの記事に細かく記載があります。ありがたや。

まだまだ勉強中で全然腑に落ちません。とりあえず、アブストラクトのDeepL訳が以下。

「機械学習モデルを確実に生成し、展開するためのプラットフォームを構築し、維持するには、多くのコンポーネントを慎重に、または協調させなければなりません。これは、データが時間の経過とともに変化し、新しいモデルを継続的に生成する必要がある場合に特に重要になります。残念ながら、このようなオーケストレーションは、個々のチームが特定のユースケースに合わせて開発したグルーコードやカスタムスクリプトを使ってアドホックに行われていることが多く、二重化してしまい、技術的な負債を抱えた脆弱なシステムになってしまうことがあります。前述のコンポーネントを1つのプラットフォームに統合することで、コンポーネントの標準化、プラットフォームの構築の簡素化、生産期間を数ヶ月単位から数週間単位に短縮することが可能となった。本発表では、Google PlayアプリストアにTFXを導入した事例を紹介する。」

「技術的な負債」に関してはこの記事が原点です。詳しくは今後書いていきますが、機械学習システムを一つのプラットフォームまで統合するとか、マジ天才や(小並感)。個人的にはNetflixさんの方法(参考記事)がいいなと思っています。

乞うご期待。

この記事を書いた人
草場代表
エディター