Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SageMaker AIワークフローのあれこれ紹介

Shota Totsuka
February 12, 2025
36

SageMaker AIワークフローのあれこれ紹介

Shota Totsuka

February 12, 2025
Tweet

Transcript

  1. 自己紹介 ©Blueish 2024. All rights reserved. 戸塚 翔太|BLUEISH Shota Totsuka

    ・LLMアプリ開発者(Go/Python …etc) ・生成AI, 機械学習 ・趣味: スキー/スノボ, 最近はDifyにContribute ・静岡県(浜松)に住んでます  近くの方がいれば、一緒に勉強会しましょう! Xアカウント @totsukash
  2. 01 SageMaker AIのワークフロー 02 Pipelines 03 Kubernetesのオーケストレーション 04 SageMakerノートブックジョブ 目次

    ©Blueish 2024. All rights reserved. 05 Airflow ワークフロー 06 Step Functionsによるワークフロー
  3. ©Blueish 2024. All rights reserved. SageMaker AIのワークフロー - Pipelines -

    ML パイプラインを構築して管理するためのツール - Kubernetesのオーケストレーション - Kubernetes クラスターの SageMaker AI カスタム演算子と Kubeflow Pipelines のコンポーネント - SageMakerノートブックジョブ - Jupyter Notebook のオンデマンドまたはスケジュール済み非インタラクティブなバッチ実行 - Airflowワークフロー - Airflow ワークフローを作成および管理するための設定をエクスポートする SageMaker API - Step Functions - リソースを個別にプロビジョニングすることなく SageMaker AI インフラストラクチャを調整する Python の複数ステップの ML ワークフロー ワークフローの種類
  4. ©Blueish 2024. All rights reserved. Pipelines - SageMaker Studioの中でVisual Blockで作成できる

    - 有向非巡回グラフ (DAG) で相互接続された一連のステップ - JSONスキーマを使用してパイプラインを構築することもできる - import/export 可能 - MLパイプラインを構築して管理するためのツール Pipelinesとは?
  5. ©Blueish 2024. All rights reserved. Pipelines Pipelinesとは? - Create model

    - Deploy model(batch inference) - Deploy model(endpoint) - Fine tune - Process data - Register model - Run notebook or code - Train model - Condition - Fail
  6. ©Blueish 2024. All rights reserved. Kubernetesのオーケストレーション - SageMaker AI Operators

    for Kubernetes - Kubernetes を使用して SageMaker AI で機械学習 (ML) モデルを簡単にト レーニング、調整、デプロイできる - Kubeflow Pipelines 用 SageMaker AI コンポーネント - データ処理ジョブとトレーニングジョブを Kubernetes クラスターから SageMaker AI の機械学習最適化マネージドサービスに移動できる Kubernetesのオーケストレーション
  7. ©Blueish 2024. All rights reserved. Kubernetesのオーケストレーション - SageMaker AI OperatorsをEKSのK8sクラスターにインストール

    - k8sクラスターから SageMaker AI でモデルトレーニング, ハイパーパラメータ調整, 推論が可能 SageMaker AI Operators for Kubernetes
  8. Kubernetesのオーケストレーション - Kubernetes クラスターから SageMaker AI のジョブを管理できる - Kubernetes API

    を使用して Kubernetes クラスター内から SageMaker AI でモデルトレーニングを実行可能 AWS Controllers for Kubernetes (ACK)
  9. ©Blueish 2024. All rights reserved. Kubernetesのオーケストレーション - Kubeflow Pipelines からネイティブ

    SageMaker AI トレーニング、チューニング、エンドポイ ントデプロイ、バッチ変換ジョブを作成およびモニタリングできる - Kubeflow Pipelines SDK を使用してコンポーネントを読み込み、パイプラインを記述 - コンポーネント - Ground Truth / 作業チーム - データ処理(Processing) - トレーニング / ハイパーパラメータの最適化 - 推論: ホスティングデプロイ / バッチ変換 / モデルモニター ※IAM周りでハマったので、ドキュメントは要確認!!! Kubeflow Pipelines用 SageMaker AI コンポーネント
  10. ©Blueish 2024. All rights reserved. SageMakerノートブックジョブ - オンデマンド, スケジュールに従って実行できる -

    JupyterLab から直接ジョブをスケジュール - SageMaker AI Python SDK を使用してジョブをスケジュールすることもできる - 複数のノートブックを並列に実行し、ノートブック内のセルをパラメータ化して入力パラメー タをカスタマイズできる SageMakerノートブックジョブ
  11. ©Blueish 2024. All rights reserved. Step Functionsによるワークフロー サポートされている SageMaker AI

    APIs - CreateEndpoint - CreateEndpointConfig - CreateHyperParameterTuningJob - CreateLabelingJob - CreateModel - CreateProcessingJob - CreateTrainingJob - CreateTransformJob - UpdateEndpoint
  12. ©Blueish 2024. All rights reserved. 振り返り 01 SageMaker AIのワークフロー 02

    Pipelines 03 Kubernetesのオーケストレーション 04 SageMakerノートブックジョブ 05 Airflow ワークフロー 06 Step Functionsによるワークフロー