Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SageMaker Hyperpod 101 #regrowth_sapporo
Search
takakuni
December 12, 2024
1
210
SageMaker Hyperpod 101 #regrowth_sapporo
takakuni
December 12, 2024
Tweet
Share
More Decks by takakuni
See All by takakuni
Classmethod AI Talks #13
takakuni
0
160
Allowed to prefixes
takakuni
0
190
About Extended Threat Detection in Amazon GuardDuty
takakuni
0
180
What is Amazon Bedrock knowledge base with an Amazon Kendra GenAI index?
takakuni
0
300
New Security Challenges and Countermeasures Brought by Generative AI in Classmethod Cloud Security Fes
takakuni
0
290
サンプルサンプル株式会社 会社説明資料
takakuni
0
2.3k
re:Inforce 2024 コンテナセキュリティアップデートまとめ
takakuni
0
400
AWS re:Inforce 2024 個人的推しアップデート総まとめ(仮)
takakuni
0
1.2k
Backlog Git を AWS に繋ぎ コンテナイメージをビルドしてみた
takakuni
0
190
Featured
See All Featured
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.3k
4 Signs Your Business is Dying
shpigford
182
22k
Producing Creativity
orderedlist
PRO
343
39k
Adopting Sorbet at Scale
ufuk
74
9.2k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
98
18k
Bash Introduction
62gerente
610
210k
Testing 201, or: Great Expectations
jmmastey
41
7.2k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
Designing for humans not robots
tammielis
250
25k
Visualization
eitanlees
146
15k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Transcript
2024/12/12 re:Growth 2024 札幌 たかくに SageMaker HyperPod 101
⾃⼰紹介 • 部署 ◦ AWS 事業本部コンサルティング部 • 名前(ニックネーム) ◦ たかくに
• ロール ◦ ソリューションアーキテクト • re:Invent どうだった? ◦ 楽しかった!が釣りタイトル踏んでしまう
オーバーしたらごめんなさい❤
re:Invent 2024 どうでしたか?
re:Invent 2024 どうでしたか??
re:Invent 2024 どうでしたか???
SageMaker HyperPod すごかったですね!!!!!!!!
Dr. Swami’s Key Note
Dr. Swami’s Key Note
Dr. Swami’s Key Note
Dr. Swami’s Key Note
Dr. Swami’s Key Note
Dr. Swami’s Key Note
SageMaker HyperPod すごかったですね!!!!!!!!
問題です
re:Invent 2023 の Dr.Swami は 何枚⽬でしたでしょう?
正解:2枚⽬
そうです。 2023年に出てきたサービスです。
• ⼤規模な⾔語モデルの推論や分散並列学習を ⾏うプラットフォーム • Slurm と EKS オーケストレーターをサポート • 回復⼒のあるプラットフォームを提供
SageMaker HyperPod
モデルにわたす データセット、トークン、パラメータ
でかい!!!!!!!!!!!
SageMaker HyperPod
安定した機械学習ワークロードを 提供するように設計されている AWS ParallelCluster と⽐べて
SageMaker HyperPod のここがすごい • クラスターヘルスチェック ◦ 起動中やワーカーノード追加前にヘルスチェック ▪ GPU, Trainium,
EFA ▪ EKS の場合はハードウェアまで確認 • ⾃動ノード復旧/再開 ◦ 障害を検知しノードを交換 ◦ 新規ノードはチェックポイントから⾃動で再開
やっと、アップデート紹介です。
• EKS のみサポート • 起動しているインスタンス/タスクの可視化 ◦ GPU の使⽤率、使⽤時間等 • クラスターポリシーを使い統制可能に
Amazon SageMaker HyperPod task governance
Amazon SageMaker HyperPod task governance
• 利⽤可能なコンピュートサイズ、期間を予約 する機能 • 予約期間は1⽇から182⽇まで1⽇単位で設定 • 安くなるわけではない Amazon SageMaker HyperPod
flexible training plans
Amazon SageMaker HyperPod flexible training plans
None