Upgrade to Pro — share decks privately, control downloads, hide ads and more …

クラウドネイティブ時代のシステム運用・監視とは? 自動化・効率化のベストプラクティスを紹介

NCDC
January 31, 2024

クラウドネイティブ時代のシステム運用・監視とは? 自動化・効率化のベストプラクティスを紹介

AWSをはじめとしたクラウドサービスをうまく活用すれば、システム運用・監視業務の多くを自動化・効率化して、より付加価値の高い業務にリソースを振り分けることかできます。
しかし、実際にはクラウドを利用していても運用・監視の効率化までは実現できていない企業が数多く存在します。

オンプレのシステムを単にクラウドに移行するだけではなく、クラウド環境のメリットを最大限生かした「クラウドネイティブ」な設計を行えるかどうかが、システム運用・監視の効率化に大きな影響を与えることがその大きな理由です。

ひとくちに「クラウド環境のメリットを生かす」といっても、どこにゴールを設定すればいいのか? 具体的にどのサービスを使い、どのようなアーキテクチャにすれば運用・監視業務を効率化できるのか? そのノウハウを得るのは意外と難しいかもしれません。

本セミナーでは、クラウドネイティブな環境の代表格であるサーバレスアーキテクチャに精通するコンサルタントが、先進的なシステム運用・監視の方法やベストプラクティスをご紹介します。

NCDC

January 31, 2024
Tweet

More Decks by NCDC

Other Decks in Technology

Transcript

  1. 3 NCDCのサービス体系 Business 新規事業⽴ち上げからの伴⾛ 業務改⾰やIT改⾰の⽀援 Design ユーザ視点での設計 Technology 技術による課題解決 Innovation

    • 新規サービス企画 • PoC⽀援 • デザイン思考 • UX/UIデザイン • モバイル・Web先端技術 • IoT / AI • クラウドインテグレーション
  2. 知識、経験、および実績 に基づく認定 クラウドに関する強み 4 自社運営で培った豊富な AWSのノウハウ NCDCは、内製化支援推進AWSパートナー、 サーバーレス(AWS Lambda)のサービス デリバリーパートナーなど

    AWS利用の知識、経験、 および実績に基づく認定を 取得しています。 AWSサービスデリバリープログラムとは、特定のAWSサービ スをお客さまに提供する上で深い技術的知識、経験、および 実際の成功事例があるAWSパートナーをAWSが認定するプロ グラムです https://aws.amazon.com/jp/partners/programs/service-delivery/ NCDCは、AWS上で稼働する自社サービス も提供しており、システム開発からサー ビス運営まで行っています。 サービスを自社運営する中で長年蓄積し てきたノウハウを基に、コストの最適化 から、AWSの多様なサービスをフルに活 用するクラウドネイティブなアーキテク チャの設計まで、実践的なサポートを行 います。
  3. 目次 l クラウド時代の運用・監視とは l オンプレミスの運用・監視 l クラウドだからできる監視設定 l サーバレス・マネージドサービスの活用 l

    サービス内での監視設定 l 賢く使いたい「自動」監視サービス l クラウドでサービスを運用するということ l クラウドネイティブなサービスの構築 l シンプルで強力な自動監視体制の構成 8
  4. クラウド時代の運用監視 l ある会社の事例 10 システム JP1等の 統合監視ツール 運用監視担当 アプリ担当 インフラ担当

    各種情報の 収集 ②解決できない場合は、 ルールに基づいて 共有、エスカレーション ①規定されているエラーであれば、 手順に基づいて再起動などの 対応を実施 従来の体制 システム オンプレ基盤 アラート 発生 :保守ベンダー :自社 :自社
  5. クラウド時代の運用監視 l ある会社の事例 11 システム クラウド監視 サービス アプリ担当 インフラ担当 各種情報の

    収集 ②自動復旧できない場合は、 ルールに基づいて 自動エスカレーション 現在の体制 システム 自動復旧 AWS 上基盤 ①ルールに基づいて、自動復旧できる エラーは自動復旧を実施 (再起動、オートスケール、リトライ) チーム自体が消滅 アラート 発生 →保守契約なし、自社で完結 :自社 :自社
  6. サーバレス・マネージドサービスの活用 l 監視はするが、自動で解決するものが多い l 監視自体もサービスに含まれる=意識するところが少ない l サーバレス l アプリのクラッシュ→自動再実行 l

    アクセススパイク→オートスケールアウト l サーバー上のディスク容量など→考慮不要 l マネージドサービス l ログ監視も不要な場合あり l CPU/メモリなどを管理しないものもある 16
  7. サーバレス・マネージドサービスの活用 l クラウドにおける監視はほとんどお膳立てされている l (AWSの場合)CloudWatch メトリクスが必要な項目を網羅している l CloudWatchで条件を設定→必要なアクション(通知、再起動etc) l 上記のために特別な設定をする必要はほとんどない

    l アクションはLambdaでカスタマイズ可能→ほとんどのことが自動化可能 l エラーログ監視 l CloudWatch Logsに集約→エラー文言を一括で監視→アクション l Java/Nodejsを使っている場合のメモリ使用量など、一部デフォルトで は取れないものも 18
  8. サービス内での監視設定 l 例)ECS (コンテナサービス)における監視 l CPU/メモリ:一定値以上になるとオートスケールする →オートスケールすることで対応済みのため通知は不要 l ディスク:ステートレスになっており監視不要 l

    死活:サービスで監視・自動再起動してくれる l ALB等で正常レスポンスを返すかもチェック可能 l 遅延:監視の設定が必要、遅い場合再起動(自動化可能) l アプリログ:監視の設定が必要、通知して対応 l インフラログ:基本不要 l →通知をもらって作業するのがアプリケーションエラーしかない 19
  9. 賢く使いたい「自動」監視サービス l Amazon Macie l 機密情報の検知 l 機密データがあるかどうか・データの保護が適切にされているかを検 知 l

    Amazon DevOps Guru l AIにおける障害の自動検知 l ログ監視と併用することで漏れなく障害検知が可能 22
  10. 賢く使いたい「自動」監視サービス l AWS Cost Anomaly DetecDon l コスト異常検出 l 通常とは異なるコストが発生した場合に通知

    l 勝手にリソースを作られてマイニングされていた、などの事例も l AWS SecurityHub l 自動検出系のサービスをまとめて見れる l 異常があるかどうかが一目でわかる 23
  11. シンプルで強力な自動監視体制の構成 l クラウドサービス内で必要なものが網羅されているため、 追加のツールで自前で構築する必要がない l Zabbixなども不要に l 自動化されている領域が多く、追加の自動化も容易 l プログラムで自動対応をカスタマイズ可能

    l 人間が見てマニュアル対応しなければならないものは 実はかなり少なくできる l より本質的なエラー・障害にリソースを集中できる l システムを見守る部隊は縮小・消滅 26