mercari AI

Blog

メルカリUSで機械学習のトレーニングインフラコストを最適化した方法

Making Mercari」は、メルカリのUS事業のエンジニアリングブログです。今後、「Making Mercari」に投稿されたAI関連の投稿について、本Webサイトでもご紹介していきます。


今回は、メルカリUSのマシンラーニングプラットフォームのソフトウェアエンジニア・Abhishek Munagekarによる投稿を紹介します。本ブログポストでは、機械学習のトレーニングのためのコンピューティングリソースのコストを最適化した方法について紹介しています。具体的には、機械学習のトレーニング用のKubernetesクラスターのダウンスケールに課題があり、PodDisruptionBudget、専用のnode pool、Gatekeeper Assign CRDを組み合わせて利用することでそれを解決しています。

How we optimized our Machine Learning Training Infrastructure Costs | by Abhishek Munagekar | Making Mercari | Apr, 2022 | Medium
※こちらの記事は英語でのポストとなっています