Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
いつもみてるよ、エラーもその先も
Search
wind-up-bird
April 24, 2025
Programming
0
77
いつもみてるよ、エラーもその先も
wind-up-bird
April 24, 2025
Tweet
Share
More Decks by wind-up-bird
See All by wind-up-bird
CDNの自動割当ドメインをすべて独自ドメインに移行したよ
w1ndupb1rd
0
21
Teachme Biz で利用するドメインを統合して安心安全に静的コンテンツを取得する
w1ndupb1rd
0
130
studist tech talk #1
w1ndupb1rd
1
190
トレタの大規模バックエンドを移行するまでの道のりと舞台裏
w1ndupb1rd
1
120
トレタを支える技術(インフラ編)
w1ndupb1rd
0
84
Other Decks in Programming
See All in Programming
Benchmark
sysong
0
280
High-Level Programming Languages in AI Era -Human Thought and Mind-
hayat01sh1da
PRO
0
610
Blazing Fast UI Development with Compose Hot Reload (droidcon New York 2025)
zsmb
1
260
Webの外へ飛び出せ NativePHPが切り拓くPHPの未来
takuyakatsusa
2
440
エンジニア向け採用ピッチ資料
inusan
0
170
iOSアプリ開発で 関数型プログラミングを実現する The Composable Architectureの紹介
yimajo
2
220
VS Code Update for GitHub Copilot
74th
1
480
童醫院敏捷轉型的實踐經驗
cclai999
0
200
ふつうの技術スタックでアート作品を作ってみる
akira888
0
200
イベントストーミング図からコードへの変換手順 / Procedure for Converting Event Storming Diagrams to Code
nrslib
1
520
プロダクト志向ってなんなんだろうね
righttouch
PRO
0
170
PicoRuby on Rails
makicamel
2
110
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.4k
Practical Orchestrator
shlominoach
188
11k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
5
230
Navigating Team Friction
lara
187
15k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
940
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Writing Fast Ruby
sferik
628
62k
StorybookのUI Testing Handbookを読んだ
zakiyama
30
5.8k
Side Projects
sachag
455
42k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Transcript
いつも監視(み)てるよ 〜ヤバいオブザーバビリティLT会〜 いつもみてるよ、エラーもその先も yabaibuki.dev 株式会社スタディスト CREグループ 柳楽瑛
⾃⼰紹介 2 名前: 柳楽瑛 (X: @_windupbird_) 所属: 株式会社スタディスト CREグループ 仕事:
Ruby, Rails, AWS, kubernetes, Terraform etc… 趣味: 筋トレ、散歩
⽬的 3 • スタディストでやっているかなり泥臭いエラー改善活動を紹介したい。
Teachme Biz 4 画像や動画を中⼼としたオンラインマニュアル を作成、共有、管理できるサービスです。 Teachme Biz is 何?
背景 5 • 開発‧運⽤しているマイクロサービスの増加 • 機能別にチームが存在(≠マイクロサービス担当) • チームの⽣成、統廃合 • エンジニアも増加
開発‧運⽤が⽇々複雑になっている
課題 6 • エラー発⽣の通知が来たけど、何のエラー? • エラー出たけど、これはどこのチームの管轄? • エラーの対応管理と進捗管理 「これは何のエラー?」「どこのチーム担当?」
課題 7 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス 担当
課題 8 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス 担当
課題 9 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス 担当
課題 10 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス 依存
課題 11 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス チーム D D マイクロサービス (廃⽌) 担当 担当
課題 12 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス チーム D D マイクロサービス (廃⽌) 担当 担当 500 Internal Server Error NoMethodError: undefined method `xxx' for nil
課題 13 • エラー発⽣の通知が来たけど、何のエラー? • エラー出たけど、これはどこのチームの管轄? • エラーの対応管理と進捗管理 「これは何のエラー?」「どこのチーム担当?」
どうするか? 14 • 各チームから1⼈以上のエンジニアを招集 • 毎⽇30分程度の時間を使って、過去24時間に発⽣したエラーの確認 • 全マイクロサービスを確認する • 加えて...各種メトリクスも確認して、問題が発⽣しそうな兆候がないか点検する
エラーを⾒る会の発⾜
何をしているか? 15 エラーを⾒る会の発⾜
ポイント 16 • 毎⽇やる、継続してやる • エラー発⽣の記録をつける、担当チームに割り振る • クリティカルになりそうなものは、その場でみんなで原因を調査する(可能な限り) • 常にアップデートして、エラーを⾒る会以外でも使える状態にする
• グラフは⾒やすいか?過不⾜はないか? • こんなグラフがあれば、いいのではないか? エラーを⾒る会の発⾜
効果 17 • エラーが放置されることなく、最短で修正‧リリースされるようになった • エラーに現れない兆候もキャッチアップし、未然にユーザー影響を防ぐことができた • 他のチームやマイクロサービスが何をやっているか分かるようになった • 他のエンジニアの原因究明プロセスを知ることができる
• エラー対応の進捗もここで確認できる 地道な改善がユーザー体験をよくする
まとめ 18 • 最終的には、サービスを使ってもらっているユーザーによりよい体験をしてもらうため • 「毎⽇5分」から「クリティカルなエラーを⾒る」から始めてみるのもいいかもしれない 地道な改善がユーザー体験をよくする
最後に 19 ⼀⾏のログの向こうには、⼀⼈のユーザがいる 引⽤ “ アクセスログの⼀⾏の200からは、その⽅を幸せにできたのかどうかはわかりません。ただ、⼀⾏の 500の向こうには、確実に、⼀つのがっかり体験があるはずです。” “ ⼤量にあるアクセスの中のたった⼀つかもしれませんが、そのエラーが出た瞬間、残念な思いをさ れる⽅が、インターネットのその先に確実にいらっしゃる。”
https://www.tumblr.com/ihara2525/17029509298
いつも監視(み)てるよ 〜ヤバいオブザーバビリティLT会〜 いつもみてるよ、エラーもその先も
https://studist.jp/