Upgrade to Pro — share decks privately, control downloads, hide ads and more …

IT未経験者が参画4ヶ月で既存監視(JP1)を廃止しAWSサービスに移行する知られざる戦いの全貌

Avatar for shoma nakashima shoma nakashima
March 26, 2024
750

 IT未経験者が参画4ヶ月で既存監視(JP1)を廃止しAWSサービスに移行する知られざる戦いの全貌

Avatar for shoma nakashima

shoma nakashima

March 26, 2024
Tweet

Transcript

  1. 4,既存環境 Nagios サーバー 各EC2インスタンス notification.log JP1 アラート通知 0,nrpeがインストール 1,Nagiosサーバと nagiosエージェントが通信

    2,通信後、各EC2インスタンスのエラーログ を「notification.log」へ格納 3,エラーログを拾う 4,ログを所定の形式の文面に成形 + 必要な文言(ID)を付与してEメールを送付
  2. 4,構築環境 SNS Nagios サーバー 各EC2インスタ ンス CloudWatch Logs Lambda S3

    (監視定義用CSVファイル格納) アラート通知 notification.log 0,nrpeがインストール 2,通信後、各EC2インスタンスのエラーログ を「notification.log」へ格納 3,エラーログを拾い CloudWatch Logsに格納 4,サブスクリプションフィルターに検 知された対象ログを Lambdaに引き 渡す 5,ログを所定の形式の文面に成形 + 監視定義用CSVファイルを 参照して必要な文言 (ID)を付与 6,5で出来た通知文をSNSに 引き渡す 7,Eメールで送信 1,Nagiosサーバと nagiosエージェントが通信
  3. 5,使用するAWSサービス •CloudWatch Logs ・各種AWSサービスのログを収集して監視や保存を行うサービス ・各サーバーにCloudWatch エージェントを インストールし設定することで利用出来る •Simple Notification Service

    (SNS) ・AWSが提供する分散型のフルマネージドのメッセージングサービス ・Eメール、SMS、スマートフォンへの通知が可能 ・容量制限があるため長文コンテンツを届ける用途には不向き
  4. 【苦労ポイント】 ・Nagios / JP1 / AWS 等のサービス理解 ⇒これはそもそも何の目的で使用しているのか? ⇒使用用途・各種機能はどうなっているの? 【対応】 ・各サービスの調査

    ⇒ここでひたすらメモを取る ⇒得た情報は1か所に集約することで見返しが容易に (Excelのシート毎に調査内容を区分け) ・疑問点はチャットで質問 ⇒調べた内容/自分なりの理解/躓いている点 ⇒この3点を共有 •各種サービス理解 メモメモっと♪ Excel メモ1 メモ3 メモ2