Slide 9
Slide 9 text
© 2024 ForgeVision, Inc.
9
・ メモリ利用率、CPU使用率、ロードバランサーからのリクエスト数などをもとにした静的な
オートスケーリング閾値を設定する必要がない。
・ システムの需要状況を学習することで動的かつプロアクティブなスケーリングを行う。
・ 予測スケーリングに任せない明確なスケーリングを閾値を既存スケーリングで設定可能。
・ パターン化された負荷変動には予測スケーリング、断続的な負荷変動に既存スケーリングなどの使い分け。
・ 予測のみを行いスケーリングは行わない 「予測のみ」 モードで予測精度と適合性を評価。
・ 予測はするが実際のスケーリング動作は行わない。(AWS WAF のカウントモードのようなイメージ)
機械学習を利用し、需要予測に先行したオートスケーリングを行う
「予測のみ」モードを利用して事前に予測精度と適合性を確認できる
予測スケーリングと既存スケーリングを併用できる(基本的に併用が前提 ※後述)
予測スケーリングとは
コンテナによって1つの処理単位を小さくし、処理状況に応じたスケーリングをより適切に実行することで
システム全体の弾力性を向上できる。プロダクションでの利用をおすすめしたい pre:Invent アップデートです。