Slide 35
Slide 35 text
スケールアップ及びスケールアウトによる対応と課題
スケールアップ
• p4d.24xlarge (A100×8) オンデマンド 32.77 USD/h (5,000円/h) 360万円/月
• P5.48xlarge (H100×8) オンデマンド 98.32USD/h (15,000円/h) 1,080万円/月
• 高速処理が可能で処理時間短縮に伴い、キューの待ち時間も短縮される
• そもそも本来LLMや画像生成AIの学習用途に利用されるもの
• 非常に多くのサービスの利用者が見込まれるか、高額な利用料が前提となる
スケールアウト
• g4dn.12xlarge オンデマンド 3.912 USD/h 43万円/月 × 複数インスタンス
• 複数のGPUインスタンスを立ち上げておき、ロードバランサー等でリクエストを振り分ける
• 複数アクセスには対応できるが処理時間は短縮できない
• いずれにしても利用者(リクエスト)の状況がわからないため必要数の判断が難しい
• 動的にスケールアウトも可能。キャパシティ予約(有料)が必要(SageMakerでは未対応→EC2)
一般的なWebサービスと比較して、何れも時間単価が桁違いに高額なため、
それに見合う高額なサービス利用料が成り立つかが判断基準となる