$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Sagemaker Jump Startを用いて爆速でモデルを作成してみる
Search
ttnyt8701
March 12, 2025
Programming
3
81
Amazon Sagemaker Jump Startを用いて爆速でモデルを作成してみる
【AWS活用 AI/ML/LLM #6】機械学習/大規模言語モデル モデリング
https://blueish.connpass.com/event/348098/
ttnyt8701
March 12, 2025
Tweet
Share
More Decks by ttnyt8701
See All by ttnyt8701
Gemini CLI のはじめ方
ttnyt8701
1
220
ObsidianをMCP連携させてみる
ttnyt8701
3
3.1k
Claude Codeの使い方
ttnyt8701
2
340
FastMCPでMCPサーバー/クライアントを構築してみる
ttnyt8701
3
560
LangChain Open Deep Researchとは?
ttnyt8701
2
350
Vertex AI Agent Builderとは?
ttnyt8701
4
300
A2A(Agent2Agent )とは?
ttnyt8701
2
430
Amazon Bedrock LLM as a Judgeを試す
ttnyt8701
2
92
Amazon SageMaker Lakehouseでデータのサイロ化による課題を解決する
ttnyt8701
2
44
Other Decks in Programming
See All in Programming
Why Kotlin? 電子カルテを Kotlin で開発する理由 / Why Kotlin? at Henry
agatan
2
6.5k
20 years of Symfony, what's next?
fabpot
2
320
UIデザインに役立つ 2025年の最新CSS / The Latest CSS for UI Design 2025
clockmaker
18
6.9k
配送計画の均等化機能を提供する取り組みについて(⽩⾦鉱業 Meetup Vol.21@六本⽊(数理最適化編))
izu_nori
0
130
エディターってAIで操作できるんだぜ
kis9a
0
660
MAP, Jigsaw, Code Golf 振り返り会 by 関東Kaggler会|Jigsaw 15th Solution
hasibirok0
0
220
手軽に積ん読を増やすには?/読みたい本と付き合うには?
o0h
PRO
1
150
251126 TestState APIってなんだっけ?Step Functionsテストどう変わる?
east_takumi
0
300
NUMA環境とコンテナランタイム ― youki における Linux Memory Policy 実装
n4mlz
1
170
ZOZOにおけるAI活用の現在 ~モバイルアプリ開発でのAI活用状況と事例~
zozotech
PRO
8
4.2k
ゲームの物理 剛体編
fadis
0
210
無秩序からの脱却 / Emergence from chaos
nrslib
2
12k
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
100
5.9k
BBQ
matthewcrist
89
9.9k
Designing for Performance
lara
610
69k
Rebuilding a faster, lazier Slack
samanthasiow
84
9.3k
Leading Effective Engineering Teams in the AI Era
addyosmani
8
1.3k
Documentation Writing (for coders)
carmenintech
76
5.2k
Done Done
chrislema
186
16k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Making Projects Easy
brettharned
120
6.5k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
700
Site-Speed That Sticks
csswizardry
13
990
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.6k
Transcript
Amazon Sagemaker Jump Startを用いて爆速でモデル を作成してみる🚀 2025.03.13 ©BLUEISH 2025. All rights
reserved.
立野 祐太 Yuta Tateno WEB開発(Go、GCP) 画像認識やRAGを用いた開発 WEBエンジニア 自己紹介 ©BLUEISH 2024.
All rights reserved.
ゴール Amazon Sagemaker Jump Startを用いたモデル作成方法を共有し、簡単に爆速でモ デルが作れるイメージを掴んでもらうこと
Amazon Sagemaker Jump Start とは? 機械学習のスターターキット 主な機能 ❏ 事前学習済みモデルの利用 :
すぐに使える AI モデルが多数用意 ❏ 簡単なカスタマイズ : ファインチューニング可能 ❏ 簡単なデプロイ : ボタン数クリックか SDK で本番環境に展開ができる ❏ モデル比較 : 品質や責任に関する指標でモデルを比較・選択ができる ❏ 組織内共有 : チーム内でモデルやノートブックを共有ができる
人物画像を入力することで年齢推定できるモデルを作成する さっそくやってみましょう! 🚀
Sagemaker Studioにアクセス
Jump Start 学習済みのモデルを利用できる
モデル選定 用途: 画像認識を用いた年齢推定
モデル選定
モデル選定 EfficientNet-B3を選択
モデル選定
モデルの検証 デプロイをし、素のモデル出力を確認する
モデルの検証 顔画像を入力し、モデル出力を確認 期待値 : 24 モデルの予測 : jersey モデルの予測 (上位5):
jersey, window shade, Band Aid, sunscreen, bulletproof vest 👉ファインチューニングを行い年齢推定 モデルにしていく
1. 人物画像と年齢のデータセットを収集 2. データセットをラベリング(前処理) 3. ファインチューニングを行う 4. デプロイ 5. モデルを検証
ファインチューニングの流れ
https://susanqq.github.io/UTKFace/ 人物の画像と年齢のデータセットを収集 UTKFaceで1~110歳までの学習データを約1万 枚 データセットの準備
データセットの前処理 ラベリング方法についてモデルページを確認 ディレクトリ名: 正解ラベル、ディレクトリの中: 学習用データとなるようにする
データセットのアップロード S3に前処理したデータセットをアップロード
ファインチューニング
ファインチューニング 1. S3にアップロードしたデータセット の選択 2. ハイパーパラメータの設定など行 う(今回はデフォルト)
ファインチューニング 1万枚のデータに対して約10分で完了(インスタンス:ml.p3.2xlarge) デプロイをしてモデルを検証
モデルの検証 顔画像を入力し、モデル出力を確認 期待値 : 24 モデルの予測 : 14 モデルの予測 (上位5):
14,52,26,27,29 正解はしなかったが、年齢推定モデルを 開発することができた 🚀
モデルの検証 正解はしなかったが、年齢推定モデルを開発することができた 🚀 アジア人のデータセットの学習量を増やす、より適切・高精度なモデル・アルゴリズムを 選択することで精度向上を望めそう!
まとめ 🔰 非エンジニアでもモデルを簡単に作成することが可能 🧠 適切なモデル選定、適切なデータセットがあれば精度向上可能 🚀 学習時間約10分、トータルでも約数十分で爆速開発可能だった (データセットのアップロード時間除く)