みんなでエラー監視するSRE夕会の効果_ゆるSRE勉強会1
by
aboy
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
みんなでエラー監視する SRE夕会の効果 2023/08/28 ゆるSRE勉強会 #1 5min LT @aboy
Slide 2
Slide 2 text
自己紹介 aboy 2 - aboy (あぼ) - コネヒト株式会社 – AI・検索グループ - Webアプリケーション開発が主担当 - PHP (CakePHP) / Go / TypeScript (React) X(Twitter) @suxisuxido
Slide 3
Slide 3 text
SRE夕会とは
Slide 4
Slide 4 text
4 SRE夕会とは こうして始まった - 参照)息をするようにエラー監視する(当時始めた人の関連資料) https://speakerdeck.com/sukun1899/xi-wosuruyounierajian-shi-suru - エラーを放置せず、みんなで監視をしていくための取り組みとして 3年ほど前に開始 - ※自分はファーストペンギンではありませんが、現在続けている当事者の一人として紹介しに来 ました ✋
Slide 5
Slide 5 text
5 SRE夕会とは 概要 - コネヒトで行っている SRE夕会は、毎日夕方に有志で集まって、その日発生したエラーをみんな で確認する場 - Slack ハドルに集まって一人が画面共有してモブ作業的なことする - 主に(Web)ソフトウェアエンジニアが参加している - SREng や SRE チームがあるわけじゃない - Slack にいくつかの基準でエラーが通知されるのでそれを確認する
Slide 6
Slide 6 text
6 SRE夕会とは どうやっているか - 夕会までに、Slack に通知されたエラーを見れる人が確認する、新規エラーであれば 🆕スタンプ を付ける - 夕会では、前回以降に発生したエラーをざっと見て、 🆕が付いた新規エラーがあれば優先して確 認し、見終わったら残りのエラーを確認する - 調査したことはエラーごとに GitHub Issue に記録する
Slide 7
Slide 7 text
SRE夕会の効果
Slide 8
Slide 8 text
8 SRE夕会の効果 参加者に学びがある - 使用している言語やフレームワークの知識 - 監視ツール、分析ツールの使い方 - エラー調査の勘所 - ドメイン知識
Slide 9
Slide 9 text
9 SRE夕会の効果 エラーの情報がたまる - 誰でも、それまでの情報を元に調査・対応ができる
Slide 10
Slide 10 text
10 SRE夕会の効果 重要な発見、異変に気づける - 複数の脳みそで考えられることによって、ビジネス上の機会損失になっているかもとか、 Bad UX になっているかもとか、あるいはエラーの再現方法などの発見がある - 継続することで「よくはわからないけどいつもと違う」など異変に気づける
Slide 11
Slide 11 text
11 SRE夕会の効果 運用の意識がつく - 例えばログの大切さに気づいて、開発段階から運用を意識したログを考えるようになる - 例えば監視ツールの便利さに気づいて、新機能リリース後関連するエンドポイントのメトリクスを 見るようになる
Slide 12
Slide 12 text
まとめ
Slide 13
Slide 13 text
13 まとめ - コネヒトにおけるエラー監視の取り組みの一つ SRE夕会を紹介しました - みんなで集まり、エラーを確認し、情報を記録する - さまざまな効果を実感しています - 参加者に学びがある、情報の蓄積、重要な発見や異変に気づける、運用の意識がつく - みんなで SRE していきましょう!