「めんどくさい」をそのままにしない
by
sioremon
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
「めんどくさい」を そのままにしない id:cd_sioremon / @cd_sioremon 2024/05/24 Road to SRE Next 1
Slide 2
Slide 2 text
自己紹介 ● id:cd_sioremon / @cd_sioremon ● はてなのSRE(2024年度新卒入社) ● アイドルオタク ○ ももいろクローバーZ ○ 私立恵比寿中学 2
Slide 3
Slide 3 text
3 アルバイト時代にやった Toilの解消
Slide 4
Slide 4 text
AWSのヘルスイベント通知地獄 4 AWS Health Dashboard AWS Event Bridge AWS Lambda GitHub Slack Slack通知 Issuesを作成
Slide 5
Slide 5 text
AWSのヘルスイベント通知地獄 5
Slide 6
Slide 6 text
AWSのヘルスイベント通知地獄 ● 影響を受けるリソース毎に通知を飛ばしてい たため通知(=新規作成されるissue)が膨大に ● 一個ずつ手でcloseするという最悪が発生して いた 6
Slide 7
Slide 7 text
最悪が発生した背景 ● 通知の仕組みを作った当初はEC2がほとんど だった ● RDSやECSが後から増えてきたために通知さ れるイベントの数が増えてしまった ● 直すのがめんどくさくて放置されていた 7
Slide 8
Slide 8 text
● ある日, 107個の通知(同一イベント)が飛んで きた AWSのヘルスイベント通知地獄 8
Slide 9
Slide 9 text
● ある日, 107個の通知(同一イベント)が飛んで きた AWSのヘルスイベント通知地獄 9
Slide 10
Slide 10 text
AWSのヘルスイベント通知地獄 10 AWS Health Dashboard AWS Event Bridge AWS Lambda GitHub Slack Slack通知 Issuesを作成 イベント毎に通知を 流すように改善
Slide 11
Slide 11 text
改善後 ● Issueをイベント単位で作成 ● 影響を受けるリソースはIssueのコメントに チェックボックス付きで表示 11
Slide 12
Slide 12 text
改善後 12
Slide 13
Slide 13 text
通知の様子 13
Slide 14
Slide 14 text
みなさまのお声 14 今まで大量に通知が出ていたものが一つにまとまり 快適になった。最高 最高!便利!感謝感謝! たまに大量の Issue をぷちぷち消してるのは気持ちよかったのですが、冷静 になるとあれは騙されてました。正気に戻れてよかったです。 表記も似ているため見逃しのないよう確認するのが大変だったのですが、集 約のおかげでオペミスに対する安全性も高まって最高です。
Slide 15
Slide 15 text
15 まとめ
Slide 16
Slide 16 text
まとめ ● AWSヘルスイベント通知の仕組みが古くなっ たことで, 作成当時とは違い大量の通知が送ら れてくるようになった ● 技術的に難しいことはないが, どうにかするの がめんどくさくて放置されていた 16
Slide 17
Slide 17 text
まとめ ● 面倒事にきちんとメスを入れたことでチーム がハッピーに 17
Slide 18
Slide 18 text
まとめ ● 学び ○ 作った仕組みは進化しなければならない ○ 仕組みを適切に動かすためには継続的なメンテが不可 欠 ■ 「動いているからヨシ!」ではない 18
Slide 19
Slide 19 text
hatena.co.jp/recruit 19 19