Slide 1

Slide 1 text

EC2を再起動したいがために New Relicを使った話 NRUG運営/コープさっぽろ 若松 剛志 2022/12/14 NRUG (New Relic User Group) Vol.5 Day1

Slide 2

Slide 2 text

生活協同組合コープさっぽろ
 デジタル推進本部 インフラチームリーダー
 若松 剛志
 SESのインフラエンジニア アイレット(cloudpack)でエンジニア兼 マネージャー コープさっぽろでクラウド/オンプレを 含めたインフラ全般を担当 @t_wkm2 ご挨拶と自己紹介


Slide 3

Slide 3 text

みなさん、 サーバーを再起動したく なることありませんか?

Slide 4

Slide 4 text

• 障害のとき みなさん、サーバーを再起動したくなることありませんか?


Slide 5

Slide 5 text

• 障害のとき • ハウスキーピングしたいとき みなさん、サーバーを再起動したくなることありませんか?


Slide 6

Slide 6 text

• 障害のとき • ハウスキーピングしたいとき • むしゃくしゃしてるとき みなさん、サーバーを再起動したくなることありませんか?


Slide 7

Slide 7 text

みなさん、サーバーを再起動したくなることありませんか?
 障害のとき、サーバーを再起動 したいんだけど、夜間バッチに 影響を与えたくない。
 だから、特定時間帯だけ閾値 を越えたら再起動したいんだよ ね


Slide 8

Slide 8 text

みなさん、サーバーを再起動したくなることありませんか?
 障害のとき、サーバーを再起動 したいんだけど、夜間バッチに 影響を与えたくない。
 だから、特定時間帯だけ閾値 を越えたら再起動したいんだよ ね
 めんどくせぇ!!

Slide 9

Slide 9 text

なんでめんどくさいかと言うと... • CloudWatchにメンテナンス時間を 設ける機能がない • Lambdaとかでスクリプトを書けば できるけど、なるべく作り込みたくない みなさん、サーバーを再起動したくなることありませんか?


Slide 10

Slide 10 text

みなさん、サーバーを再起動したくなることありませんか?
 だったら、New Relic
 噛ませばいいんじゃね?
 お?お? 


Slide 11

Slide 11 text

構成

Slide 12

Slide 12 text

CloudWatchメトリクスが閾値を超えた場合にNew RelicのAlertでEventBridgeへ通知 構成
 EC2 CloudWatch EventBridge EC2再起動 AWSインテグレーション機 能でメトリクスを連携 New Relic AlertのDestinationを EventBridgeに指定

Slide 13

Slide 13 text

New Relic AlertのMuting rulesを 使うのがミソ 特定時間帯はAlertを上げない仕組み 今回の場合は再起動したくない 時間帯を指定 構成
 ココ!!

Slide 14

Slide 14 text

New Relic AlertのMuting rulesを 使うのがミソ 特定時間帯はAlertを上げない仕組み 今回の場合は再起動したくない 時間帯を指定 構成
 ココ!! うまくできたし、New Relic Alert → Amazon EventBridgeも 試せて満足!

Slide 15

Slide 15 text

と、思ってたら出てしまった。。 構成


Slide 16

Slide 16 text

と、思ってたら出てしまった。。 Amazon EventBridge Scheduler 構成
 参考:Amazon EventBridge で新しいスケジューラーの提供を開始

Slide 17

Slide 17 text

CloudWatch AlarmのEnable/Disableを制御できる ので、同じことができてしまう。。 構成
 参考:特定時刻だけ CloudWatch アラームを抑制する、 Amazon EventBridge Scheduler で。

Slide 18

Slide 18 text

まとめ

Slide 19

Slide 19 text

• というわけで、あっという間に オワコン化してしまった構成でした。 • Muting rules自体はとっても便利 なのでお試しあれ! まとめ