Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
いつもみてるよ、エラーもその先も
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
wind-up-bird
April 24, 2025
Programming
120
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
いつもみてるよ、エラーもその先も
wind-up-bird
April 24, 2025
More Decks by wind-up-bird
See All by wind-up-bird
CDNの自動割当ドメインをすべて独自ドメインに移行したよ
w1ndupb1rd
0
26
Teachme Biz で利用するドメインを統合して安心安全に静的コンテンツを取得する
w1ndupb1rd
0
170
studist tech talk #1
w1ndupb1rd
1
210
トレタの大規模バックエンドを移行するまでの道のりと舞台裏
w1ndupb1rd
1
120
トレタを支える技術(インフラ編)
w1ndupb1rd
0
100
Other Decks in Programming
See All in Programming
Java × distroless で 軽量なコンテナイメージを / Java on Distroless
contour_gara
0
560
AIで効率化できた業務・日常
ochtum
0
140
「AIで開発し、AIを届ける」をEvalでつなぐ 〜AIネイティブに始めるプロダクト開発の実践〜 / Connecting "Develop with AI, deliver AI" with Eval
rkaga
4
5.4k
Datadog × OpenTelemetry 入門と実践のあいだ
kn_to_maxpno
1
170
Strategic Design in the Frontend: Moduliths & Micro Frontends @DDDEurope
manfredsteyer
PRO
0
130
なぜ型を書くのか? TSKaigi2026で改めて考える #tskaigi_smarthr
kajitack
0
140
AIだと陥りがちなJakarta EE最新技術への移行時の落とし穴と解決策
tnagao7
0
120
OSもどきOS
arkw
0
580
New "Type" system on PicoRuby
pocke
1
1k
Signal Forms: Details & Live Coding @enterJS 2026 in Mannheim
manfredsteyer
PRO
0
180
TSKaigi Night Talks 2026_TypeScriptでサプライチェーンの整合性を型に閉じ込める
geekplus_tech
0
400
The NotImplementedError Problem in Ruby
koic
1
910
Featured
See All Featured
We Are The Robots
honzajavorek
0
250
Believing is Seeing
oripsolob
1
150
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
610
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
200
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
560
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
400
How to build a perfect <img>
jonoalderson
1
5.7k
Designing for Performance
lara
611
70k
GraphQLとの向き合い方2022年版
quramy
50
15k
Transcript
いつも監視(み)てるよ 〜ヤバいオブザーバビリティLT会〜 いつもみてるよ、エラーもその先も yabaibuki.dev 株式会社スタディスト CREグループ 柳楽瑛
⾃⼰紹介 2 名前: 柳楽瑛 (X: @_windupbird_) 所属: 株式会社スタディスト CREグループ 仕事:
Ruby, Rails, AWS, kubernetes, Terraform etc… 趣味: 筋トレ、散歩
⽬的 3 • スタディストでやっているかなり泥臭いエラー改善活動を紹介したい。
Teachme Biz 4 画像や動画を中⼼としたオンラインマニュアル を作成、共有、管理できるサービスです。 Teachme Biz is 何?
背景 5 • 開発‧運⽤しているマイクロサービスの増加 • 機能別にチームが存在(≠マイクロサービス担当) • チームの⽣成、統廃合 • エンジニアも増加
開発‧運⽤が⽇々複雑になっている
課題 6 • エラー発⽣の通知が来たけど、何のエラー? • エラー出たけど、これはどこのチームの管轄? • エラーの対応管理と進捗管理 「これは何のエラー?」「どこのチーム担当?」
課題 7 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス 担当
課題 8 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス 担当
課題 9 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス 担当
課題 10 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス 依存
課題 11 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス チーム D D マイクロサービス (廃⽌) 担当 担当
課題 12 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス チーム D D マイクロサービス (廃⽌) 担当 担当 500 Internal Server Error NoMethodError: undefined method `xxx' for nil
課題 13 • エラー発⽣の通知が来たけど、何のエラー? • エラー出たけど、これはどこのチームの管轄? • エラーの対応管理と進捗管理 「これは何のエラー?」「どこのチーム担当?」
どうするか? 14 • 各チームから1⼈以上のエンジニアを招集 • 毎⽇30分程度の時間を使って、過去24時間に発⽣したエラーの確認 • 全マイクロサービスを確認する • 加えて...各種メトリクスも確認して、問題が発⽣しそうな兆候がないか点検する
エラーを⾒る会の発⾜
何をしているか? 15 エラーを⾒る会の発⾜
ポイント 16 • 毎⽇やる、継続してやる • エラー発⽣の記録をつける、担当チームに割り振る • クリティカルになりそうなものは、その場でみんなで原因を調査する(可能な限り) • 常にアップデートして、エラーを⾒る会以外でも使える状態にする
• グラフは⾒やすいか?過不⾜はないか? • こんなグラフがあれば、いいのではないか? エラーを⾒る会の発⾜
効果 17 • エラーが放置されることなく、最短で修正‧リリースされるようになった • エラーに現れない兆候もキャッチアップし、未然にユーザー影響を防ぐことができた • 他のチームやマイクロサービスが何をやっているか分かるようになった • 他のエンジニアの原因究明プロセスを知ることができる
• エラー対応の進捗もここで確認できる 地道な改善がユーザー体験をよくする
まとめ 18 • 最終的には、サービスを使ってもらっているユーザーによりよい体験をしてもらうため • 「毎⽇5分」から「クリティカルなエラーを⾒る」から始めてみるのもいいかもしれない 地道な改善がユーザー体験をよくする
最後に 19 ⼀⾏のログの向こうには、⼀⼈のユーザがいる 引⽤ “ アクセスログの⼀⾏の200からは、その⽅を幸せにできたのかどうかはわかりません。ただ、⼀⾏の 500の向こうには、確実に、⼀つのがっかり体験があるはずです。” “ ⼤量にあるアクセスの中のたった⼀つかもしれませんが、そのエラーが出た瞬間、残念な思いをさ れる⽅が、インターネットのその先に確実にいらっしゃる。”
https://www.tumblr.com/ihara2525/17029509298
いつも監視(み)てるよ 〜ヤバいオブザーバビリティLT会〜 いつもみてるよ、エラーもその先も
https://studist.jp/