Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
いつもみてるよ、エラーもその先も
Search
wind-up-bird
April 24, 2025
Programming
0
100
いつもみてるよ、エラーもその先も
wind-up-bird
April 24, 2025
Tweet
Share
More Decks by wind-up-bird
See All by wind-up-bird
CDNの自動割当ドメインをすべて独自ドメインに移行したよ
w1ndupb1rd
0
22
Teachme Biz で利用するドメインを統合して安心安全に静的コンテンツを取得する
w1ndupb1rd
0
140
studist tech talk #1
w1ndupb1rd
1
190
トレタの大規模バックエンドを移行するまでの道のりと舞台裏
w1ndupb1rd
1
120
トレタを支える技術(インフラ編)
w1ndupb1rd
0
91
Other Decks in Programming
See All in Programming
CSC509 Lecture 07
javiergs
PRO
0
260
Swift Concurrency 年表クイズ
omochi
3
220
Designing Repeatable Edits: The Architecture of . in Vim
satorunooshie
0
240
PyCon mini 東海 2025「個人ではじめるマルチAIエージェント入門 〜LangChain × LangGraphでアイデアを形にするステップ〜」
komofr
3
420
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
240
CSC305 Lecture 12
javiergs
PRO
0
250
AI時代に必須!状況言語化スキル / ai-context-verbalization
minodriven
2
330
CSC509 Lecture 08
javiergs
PRO
0
280
EMこそClaude Codeでコード調査しよう
shibayu36
0
590
O Que É e Como Funciona o PHP-FPM?
marcelgsantos
0
250
pnpm に provenance のダウングレード を検出する PR を出してみた
ryo_manba
1
180
iOSでSVG画像を扱う
kishikawakatsumi
0
180
Featured
See All Featured
For a Future-Friendly Web
brad_frost
180
10k
A Modern Web Designer's Workflow
chriscoyier
697
190k
Statistics for Hackers
jakevdp
799
220k
Docker and Python
trallard
46
3.6k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Building an army of robots
kneath
306
46k
Context Engineering - Making Every Token Count
addyosmani
8
340
RailsConf 2023
tenderlove
30
1.3k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.1k
Agile that works and the tools we love
rasmusluckow
331
21k
Side Projects
sachag
455
43k
Balancing Empowerment & Direction
lara
5
710
Transcript
いつも監視(み)てるよ 〜ヤバいオブザーバビリティLT会〜 いつもみてるよ、エラーもその先も yabaibuki.dev 株式会社スタディスト CREグループ 柳楽瑛
⾃⼰紹介 2 名前: 柳楽瑛 (X: @_windupbird_) 所属: 株式会社スタディスト CREグループ 仕事:
Ruby, Rails, AWS, kubernetes, Terraform etc… 趣味: 筋トレ、散歩
⽬的 3 • スタディストでやっているかなり泥臭いエラー改善活動を紹介したい。
Teachme Biz 4 画像や動画を中⼼としたオンラインマニュアル を作成、共有、管理できるサービスです。 Teachme Biz is 何?
背景 5 • 開発‧運⽤しているマイクロサービスの増加 • 機能別にチームが存在(≠マイクロサービス担当) • チームの⽣成、統廃合 • エンジニアも増加
開発‧運⽤が⽇々複雑になっている
課題 6 • エラー発⽣の通知が来たけど、何のエラー? • エラー出たけど、これはどこのチームの管轄? • エラーの対応管理と進捗管理 「これは何のエラー?」「どこのチーム担当?」
課題 7 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス 担当
課題 8 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス 担当
課題 9 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス 担当
課題 10 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス 依存
課題 11 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス チーム D D マイクロサービス (廃⽌) 担当 担当
課題 12 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス チーム D D マイクロサービス (廃⽌) 担当 担当 500 Internal Server Error NoMethodError: undefined method `xxx' for nil
課題 13 • エラー発⽣の通知が来たけど、何のエラー? • エラー出たけど、これはどこのチームの管轄? • エラーの対応管理と進捗管理 「これは何のエラー?」「どこのチーム担当?」
どうするか? 14 • 各チームから1⼈以上のエンジニアを招集 • 毎⽇30分程度の時間を使って、過去24時間に発⽣したエラーの確認 • 全マイクロサービスを確認する • 加えて...各種メトリクスも確認して、問題が発⽣しそうな兆候がないか点検する
エラーを⾒る会の発⾜
何をしているか? 15 エラーを⾒る会の発⾜
ポイント 16 • 毎⽇やる、継続してやる • エラー発⽣の記録をつける、担当チームに割り振る • クリティカルになりそうなものは、その場でみんなで原因を調査する(可能な限り) • 常にアップデートして、エラーを⾒る会以外でも使える状態にする
• グラフは⾒やすいか?過不⾜はないか? • こんなグラフがあれば、いいのではないか? エラーを⾒る会の発⾜
効果 17 • エラーが放置されることなく、最短で修正‧リリースされるようになった • エラーに現れない兆候もキャッチアップし、未然にユーザー影響を防ぐことができた • 他のチームやマイクロサービスが何をやっているか分かるようになった • 他のエンジニアの原因究明プロセスを知ることができる
• エラー対応の進捗もここで確認できる 地道な改善がユーザー体験をよくする
まとめ 18 • 最終的には、サービスを使ってもらっているユーザーによりよい体験をしてもらうため • 「毎⽇5分」から「クリティカルなエラーを⾒る」から始めてみるのもいいかもしれない 地道な改善がユーザー体験をよくする
最後に 19 ⼀⾏のログの向こうには、⼀⼈のユーザがいる 引⽤ “ アクセスログの⼀⾏の200からは、その⽅を幸せにできたのかどうかはわかりません。ただ、⼀⾏の 500の向こうには、確実に、⼀つのがっかり体験があるはずです。” “ ⼤量にあるアクセスの中のたった⼀つかもしれませんが、そのエラーが出た瞬間、残念な思いをさ れる⽅が、インターネットのその先に確実にいらっしゃる。”
https://www.tumblr.com/ihara2525/17029509298
いつも監視(み)てるよ 〜ヤバいオブザーバビリティLT会〜 いつもみてるよ、エラーもその先も
https://studist.jp/