Slide 1

Slide 1 text

みんなでエラー監視する SRE夕会の効果 2023/08/28 ゆるSRE勉強会 #1 5min LT @aboy

Slide 2

Slide 2 text

自己紹介 aboy 2 - aboy (あぼ) - コネヒト株式会社 – AI・検索グループ - Webアプリケーション開発が主担当 - PHP (CakePHP) / Go / TypeScript (React) X(Twitter) @suxisuxido

Slide 3

Slide 3 text

SRE夕会とは

Slide 4

Slide 4 text

4 SRE夕会とは こうして始まった - 参照)息をするようにエラー監視する(当時始めた人の関連資料) https://speakerdeck.com/sukun1899/xi-wosuruyounierajian-shi-suru - エラーを放置せず、みんなで監視をしていくための取り組みとして 3年ほど前に開始 - ※自分はファーストペンギンではありませんが、現在続けている当事者の一人として紹介しに来 ました ✋

Slide 5

Slide 5 text

5 SRE夕会とは 概要 - コネヒトで行っている SRE夕会は、毎日夕方に有志で集まって、その日発生したエラーをみんな で確認する場 - Slack ハドルに集まって一人が画面共有してモブ作業的なことする - 主に(Web)ソフトウェアエンジニアが参加している - SREng や SRE チームがあるわけじゃない - Slack にいくつかの基準でエラーが通知されるのでそれを確認する

Slide 6

Slide 6 text

6 SRE夕会とは どうやっているか - 夕会までに、Slack に通知されたエラーを見れる人が確認する、新規エラーであれば 🆕スタンプ を付ける - 夕会では、前回以降に発生したエラーをざっと見て、 🆕が付いた新規エラーがあれば優先して確 認し、見終わったら残りのエラーを確認する - 調査したことはエラーごとに GitHub Issue に記録する

Slide 7

Slide 7 text

SRE夕会の効果

Slide 8

Slide 8 text

8 SRE夕会の効果 参加者に学びがある - 使用している言語やフレームワークの知識 - 監視ツール、分析ツールの使い方 - エラー調査の勘所 - ドメイン知識

Slide 9

Slide 9 text

9 SRE夕会の効果 エラーの情報がたまる - 誰でも、それまでの情報を元に調査・対応ができる

Slide 10

Slide 10 text

10 SRE夕会の効果 重要な発見、異変に気づける - 複数の脳みそで考えられることによって、ビジネス上の機会損失になっているかもとか、 Bad UX になっているかもとか、あるいはエラーの再現方法などの発見がある - 継続することで「よくはわからないけどいつもと違う」など異変に気づける

Slide 11

Slide 11 text

11 SRE夕会の効果 運用の意識がつく - 例えばログの大切さに気づいて、開発段階から運用を意識したログを考えるようになる - 例えば監視ツールの便利さに気づいて、新機能リリース後関連するエンドポイントのメトリクスを 見るようになる

Slide 12

Slide 12 text

まとめ

Slide 13

Slide 13 text

13 まとめ - コネヒトにおけるエラー監視の取り組みの一つ SRE夕会を紹介しました - みんなで集まり、エラーを確認し、情報を記録する - さまざまな効果を実感しています - 参加者に学びがある、情報の蓄積、重要な発見や異変に気づける、運用の意識がつく - みんなで SRE していきましょう!