最近「機械学習基盤を Kubernetes (Amazon EKS) で作るか Amazon SageMaker で作るか迷っています!」という質問を受けることがあります。モチベーションとしてコンテナ化による環境統一を目的とした上で、オーケストレーションツールとして Amazon EKS (Kubernetes + Kubeflow) や Amazon SageMaker が候補に挙がっているようです。機械学習基盤の選定においてトータルコスト (TCO) の観点から議論し、その答えを整理したいと思います。