Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
EC2を再起動したいがためにNew Relicを使った話
Search
wkm2
December 15, 2022
Technology
1
450
EC2を再起動したいがためにNew Relicを使った話
NRUG (New Relic User Group) Vol.5 Day1 登壇資料
wkm2
December 15, 2022
Tweet
Share
More Decks by wkm2
See All by wkm2
AWS CLIの新しい認証情報設定方法aws loginコマンドの実態
wkm2
7
1k
API叩くだけのLambdaを作るつもりがコンテナ on EC2になった話
wkm2
0
23
AWSネイティブなセキュリティを考える
wkm2
1
320
KAGが関わるアカウント全てにSecurity Hubを導入した(い)話
wkm2
0
200
地方在住フルリモートワークエンジニアのリアル 〜ジモトで_活きる_エンジニアライフ〜
wkm2
1
740
Keynote以外のアップデートピックアップ!
wkm2
1
160
Bedrock素人がKnowledgeBaseでRAGを構築するまで
wkm2
2
440
ネットワークサービスフル活用で実現するハイブリッド構成 〜コープさっぽろのネットワーク全体像〜
wkm2
2
2.1k
AWS SSO でログインを簡単に〜IAMユーザ管理をしたくない〜
wkm2
1
620
Other Decks in Technology
See All in Technology
Application Performance Optimisation in Practice (60 mins)
stevejgordon
0
110
システムのアラート調査をサポートするAI Agentの紹介/Introduction to an AI Agent for System Alert Investigation
taddy_919
2
1.5k
データ民主化のための LLM 活用状況と課題紹介(IVRy の場合)
wxyzzz
2
620
日本語テキストと音楽の対照学習の技術とその応用
lycorptech_jp
PRO
1
410
インフラエンジニア必見!Kubernetesを用いたクラウドネイティブ設計ポイント大全
daitak
0
160
toCプロダクトにおけるAI機能開発のしくじりと学び / ai-product-failures-and-learnings
rince
6
5.3k
会社紹介資料 / Sansan Company Profile
sansan33
PRO
15
400k
Azure SRE Agent x PagerDutyによる近未来インシデント対応への期待 / The Future of Incident Response: Azure SRE Agent x PagerDuty
aeonpeople
0
290
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
GCASアップデート(202510-202601)
techniczna
0
240
DatabricksホストモデルでAIコーディング環境を構築する
databricksjapan
0
230
SREが向き合う大規模リアーキテクチャ 〜信頼性とアジリティの両立〜
zepprix
0
360
Featured
See All Featured
The Art of Programming - Codeland 2020
erikaheidi
57
14k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.6k
What does AI have to do with Human Rights?
axbom
PRO
0
2k
So, you think you're a good person
axbom
PRO
2
1.9k
Git: the NoSQL Database
bkeepers
PRO
432
66k
Speed Design
sergeychernyshev
33
1.5k
How to build a perfect <img>
jonoalderson
1
4.9k
The Language of Interfaces
destraynor
162
26k
The Cult of Friendly URLs
andyhume
79
6.8k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
93
How to Ace a Technical Interview
jacobian
281
24k
Building Adaptive Systems
keathley
44
2.9k
Transcript
EC2を再起動したいがために New Relicを使った話 NRUG運営/コープさっぽろ 若松 剛志 2022/12/14 NRUG (New Relic
User Group) Vol.5 Day1
生活協同組合コープさっぽろ デジタル推進本部 インフラチームリーダー 若松 剛志 SESのインフラエンジニア アイレット(cloudpack)でエンジニア兼 マネージャー コープさっぽろでクラウド/オンプレを 含めたインフラ全般を担当
@t_wkm2 ご挨拶と自己紹介
みなさん、 サーバーを再起動したく なることありませんか?
• 障害のとき みなさん、サーバーを再起動したくなることありませんか?
• 障害のとき • ハウスキーピングしたいとき みなさん、サーバーを再起動したくなることありませんか?
• 障害のとき • ハウスキーピングしたいとき • むしゃくしゃしてるとき みなさん、サーバーを再起動したくなることありませんか?
みなさん、サーバーを再起動したくなることありませんか? 障害のとき、サーバーを再起動 したいんだけど、夜間バッチに 影響を与えたくない。 だから、特定時間帯だけ閾値 を越えたら再起動したいんだよ ね
みなさん、サーバーを再起動したくなることありませんか? 障害のとき、サーバーを再起動 したいんだけど、夜間バッチに 影響を与えたくない。 だから、特定時間帯だけ閾値 を越えたら再起動したいんだよ ね めんどくせぇ!!
なんでめんどくさいかと言うと... • CloudWatchにメンテナンス時間を 設ける機能がない • Lambdaとかでスクリプトを書けば できるけど、なるべく作り込みたくない みなさん、サーバーを再起動したくなることありませんか?
みなさん、サーバーを再起動したくなることありませんか? だったら、New Relic 噛ませばいいんじゃね? お?お?
構成
CloudWatchメトリクスが閾値を超えた場合にNew RelicのAlertでEventBridgeへ通知 構成 EC2 CloudWatch EventBridge EC2再起動 AWSインテグレーション機 能でメトリクスを連携 New
Relic AlertのDestinationを EventBridgeに指定
New Relic AlertのMuting rulesを 使うのがミソ 特定時間帯はAlertを上げない仕組み 今回の場合は再起動したくない 時間帯を指定 構成 ココ!!
New Relic AlertのMuting rulesを 使うのがミソ 特定時間帯はAlertを上げない仕組み 今回の場合は再起動したくない 時間帯を指定 構成 ココ!!
うまくできたし、New Relic Alert → Amazon EventBridgeも 試せて満足!
と、思ってたら出てしまった。。 構成
と、思ってたら出てしまった。。 Amazon EventBridge Scheduler 構成 参考:Amazon EventBridge で新しいスケジューラーの提供を開始
CloudWatch AlarmのEnable/Disableを制御できる ので、同じことができてしまう。。 構成 参考:特定時刻だけ CloudWatch アラームを抑制する、 Amazon EventBridge Scheduler
で。
まとめ
• というわけで、あっという間に オワコン化してしまった構成でした。 • Muting rules自体はとっても便利 なのでお試しあれ! まとめ