みんなでエラー監視するSRE夕会の効果_ゆるSRE勉強会1
by
aboy
×
Copy
Open
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Slide 1
Slide 1 text
みんなでエラー監視する SRE夕会の効果 2023/08/28 ゆるSRE勉強会 #1 5min LT @aboy
Slide 2
Slide 2 text
自己紹介 aboy 2 - aboy (あぼ) - コネヒト株式会社 – AI・検索グループ - Webアプリケーション開発が主担当 - PHP (CakePHP) / Go / TypeScript (React) X(Twitter) @suxisuxido
Slide 3
Slide 3 text
SRE夕会とは
Slide 4
Slide 4 text
4 SRE夕会とは こうして始まった - 参照)息をするようにエラー監視する(当時始めた人の関連資料) https://speakerdeck.com/sukun1899/xi-wosuruyounierajian-shi-suru - エラーを放置せず、みんなで監視をしていくための取り組みとして 3年ほど前に開始 - ※自分はファーストペンギンではありませんが、現在続けている当事者の一人として紹介しに来 ました ✋
Slide 5
Slide 5 text
5 SRE夕会とは 概要 - コネヒトで行っている SRE夕会は、毎日夕方に有志で集まって、その日発生したエラーをみんな で確認する場 - Slack ハドルに集まって一人が画面共有してモブ作業的なことする - 主に(Web)ソフトウェアエンジニアが参加している - SREng や SRE チームがあるわけじゃない - Slack にいくつかの基準でエラーが通知されるのでそれを確認する
Slide 6
Slide 6 text
6 SRE夕会とは どうやっているか - 夕会までに、Slack に通知されたエラーを見れる人が確認する、新規エラーであれば 🆕スタンプ を付ける - 夕会では、前回以降に発生したエラーをざっと見て、 🆕が付いた新規エラーがあれば優先して確 認し、見終わったら残りのエラーを確認する - 調査したことはエラーごとに GitHub Issue に記録する
Slide 7
Slide 7 text
SRE夕会の効果
Slide 8
Slide 8 text
8 SRE夕会の効果 参加者に学びがある - 使用している言語やフレームワークの知識 - 監視ツール、分析ツールの使い方 - エラー調査の勘所 - ドメイン知識
Slide 9
Slide 9 text
9 SRE夕会の効果 エラーの情報がたまる - 誰でも、それまでの情報を元に調査・対応ができる
Slide 10
Slide 10 text
10 SRE夕会の効果 重要な発見、異変に気づける - 複数の脳みそで考えられることによって、ビジネス上の機会損失になっているかもとか、 Bad UX になっているかもとか、あるいはエラーの再現方法などの発見がある - 継続することで「よくはわからないけどいつもと違う」など異変に気づける
Slide 11
Slide 11 text
11 SRE夕会の効果 運用の意識がつく - 例えばログの大切さに気づいて、開発段階から運用を意識したログを考えるようになる - 例えば監視ツールの便利さに気づいて、新機能リリース後関連するエンドポイントのメトリクスを 見るようになる
Slide 12
Slide 12 text
まとめ
Slide 13
Slide 13 text
13 まとめ - コネヒトにおけるエラー監視の取り組みの一つ SRE夕会を紹介しました - みんなで集まり、エラーを確認し、情報を記録する - さまざまな効果を実感しています - 参加者に学びがある、情報の蓄積、重要な発見や異変に気づける、運用の意識がつく - みんなで SRE していきましょう!