Slide 1

Slide 1 text

Amazon SageMaker AIで モデル開発からデプロイまで試す AWS活用 AI/ML/LLM #6 機械学習/大規模言語モデル モデリング 株式会社BLUEISH Software Engineer 戸塚 翔太 @totsumaru_dot

Slide 2

Slide 2 text

©Blueish 2025. All rights reserved. 自己紹介 株式会社BLUEISH
 AI Lead Engineer @ t o t s u m a r u _ d o t 戸塚 翔太 o 普段はLLMアプリケーションの開発をしていまg o 現在は法人向けAIエージェントプラットフォーム「BLUEISH Agents」 の開発を担当していまg o 静岡県(浜松)に住んでいますが、今年中に東京へ引っ越したい...

Slide 3

Slide 3 text

©Blueish 2025. All rights reserved. AWS認定(今年1月から開始)

Slide 4

Slide 4 text

©Blueish 2025. All rights reserved. イベントを多数開催しています!

Slide 5

Slide 5 text

01 データの前処理 02 学習 03 デプロイ 04 まとめ アジェンダ ©Blueish 2025. All rights reserved.

Slide 6

Slide 6 text

01 データの前処理 02 学習 03 デプロイ 04 まとめ アジェンダ ©Blueish 2025. All rights reserved.

Slide 7

Slide 7 text

データの前処理 Amazon Textract PDFや画像データからテキストや表 データを自動抽出するサービス AWS Glue DataBrew ノーコードでデータのクレンジングや 変換ができるサービス AWS Glue ETL(抽出・変換・ロード)処理を コードベースで柔軟に実行できる
 データ統合サービス Amazon SageMaker 
 Ground Truth モデルのトレーニングに必要な
 高品質なラベル付きデータセットを
 効率よく作成するためのサービス Amazon SageMaker 
 Data Wrangler ノーコードでデータの準備・前処理・ 分析までをサポートするサービス Amazon Comprehend テキストデータからエンティティ抽出 や感情分析を行う
 自然言語処理サービス ©Blueish 2025. All rights reserved.

Slide 8

Slide 8 text

01 データの前処理 02 学習 03 デプロイ 04 まとめ アジェンダ ©Blueish 2025. All rights reserved.

Slide 9

Slide 9 text

学習 SageMaker AIのワークフロー % Pipeline % % % %  ML パイプラインを構築して管理するためのツー‘ Kubernetesのオーケストレーショ€ ~ K8sクラスターの SageMaker AIカスタム演算子とKubeflow Pipelines のコンポーネンw SageMakerノートブックジョs ~ Jupyter Notebook のオンデマンドまたはスケジュール済み非インタラクティブなバッチ実H AirflowワークフロŽ ~ Airflow ワークフローを作成および管理するための設定をエクスポートする SageMaker APk Step Function ~ リソースを個別にプロビジョニングすることなく SageMaker AI インフラストラクチャを調整する Python の複数ステッ プの ML ワークフロー ©Blueish 2025. All rights reserved.

Slide 10

Slide 10 text

学習 Pipelines ©Blueish 2025. All rights reserved.

Slide 11

Slide 11 text

学習 JupyterLab ©Blueish 2025. All rights reserved.

Slide 12

Slide 12 text

学習 JupyterLab in SageMaker Studio ©Blueish 2025. All rights reserved.

Slide 13

Slide 13 text

学習 [注意] 起動したインスタンスは止めましょう!! ©Blueish 2025. All rights reserved.

Slide 14

Slide 14 text

01 データの前処理 02 学習 03 デプロイ 04 まとめ アジェンダ ©Blueish 2025. All rights reserved.

Slide 15

Slide 15 text

デプロイ 推論エンドポイント ©Blueish 2025. All rights reserved.

Slide 16

Slide 16 text

デプロイ 推論エンドポイント ©Blueish 2025. All rights reserved. リアルタイム推論 一度に 1 つの予測を行う永続的なリアルタイム エンドポイント サーバーレス推論 トラフィックの急増の間にアイドル期間があり、コールドスタートを許容 できるワークロード 非同期推論 最大 1 GB の大きなペイロードサイズ、長い処理時間、ほぼリアルタイムの レイテンシー要件を持つリクエスト バッチ変換 データセット全体の予測を取得する

Slide 17

Slide 17 text

01 データの前処理 02 学習 03 デプロイ 04 まとめ アジェンダ ©Blueish 2025. All rights reserved.

Slide 18

Slide 18 text

データの前処理 Amazon Textract PDFや画像データからテキストや表 データを自動抽出するサービス AWS Glue DataBrew ノーコードでデータのクレンジングや 変換ができるサービス AWS Glue ETL(抽出・変換・ロード)処理を コードベースで柔軟に実行できる
 データ統合サービス Amazon SageMaker 
 Ground Truth モデルのトレーニングに必要な
 高品質なラベル付きデータセットを
 効率よく作成するためのサービス Amazon SageMaker 
 Data Wrangler ノーコードでデータの準備・前処理・ 分析までをサポートするサービス Amazon Comprehend テキストデータからエンティティ抽出 や感情分析を行う
 自然言語処理サービス ©Blueish 2025. All rights reserved.

Slide 19

Slide 19 text

学習 Pipelines ©Blueish 2025. All rights reserved.

Slide 20

Slide 20 text

デプロイ 推論エンドポイント ©Blueish 2025. All rights reserved. リアルタイム推論 一度に 1 つの予測を行う永続的なリアルタイム エンドポイント サーバーレス推論 トラフィックの急増の間にアイドル期間があり、コールドスタートを許容 できるワークロード 非同期推論 最大 1 GB の大きなペイロードサイズ、長い処理時間、ほぼリアルタイムの レイテンシー要件を持つリクエスト バッチ変換 データセット全体の予測を取得する

Slide 21

Slide 21 text

Thank you!