Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
いつもみてるよ、エラーもその先も
Search
wind-up-bird
April 24, 2025
Programming
0
85
いつもみてるよ、エラーもその先も
wind-up-bird
April 24, 2025
Tweet
Share
More Decks by wind-up-bird
See All by wind-up-bird
CDNの自動割当ドメインをすべて独自ドメインに移行したよ
w1ndupb1rd
0
21
Teachme Biz で利用するドメインを統合して安心安全に静的コンテンツを取得する
w1ndupb1rd
0
140
studist tech talk #1
w1ndupb1rd
1
190
トレタの大規模バックエンドを移行するまでの道のりと舞台裏
w1ndupb1rd
1
120
トレタを支える技術(インフラ編)
w1ndupb1rd
0
85
Other Decks in Programming
See All in Programming
オープンセミナー2025@広島LT技術ブログを続けるには
satoshi256kbyte
0
120
tool ディレクティブを導入してみた感想
sgash708
1
150
サイトを作ったらNFCタグキーホルダーを爆速で作れ!
yuukis
0
490
一人でAIプロダクトを作るための工夫 〜技術選定・開発プロセス編〜 / I want AI to work harder
rkaga
13
2.8k
なぜ今、Terraformの本を書いたのか? - 著者陣に聞く!『Terraformではじめる実践IaC』登壇資料
fufuhu
4
650
LLMOpsのパフォーマンスを支える技術と現場で実践した改善
po3rin
8
980
パスタの技術
yusukebe
1
400
技術的負債で信頼性が限界だったWordPress運用をShifterで完全復活させた話
rvirus0817
1
2.1k
オープンセミナー2025@広島「君はどこで動かすか?」アンケート結果
satoshi256kbyte
0
200
AHC051解法紹介
eijirou
0
620
AWS Serverless Application Model入門_20250708
smatsuzaki
0
130
新世界の理解
koriym
0
140
Featured
See All Featured
Done Done
chrislema
185
16k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.4k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Fireside Chat
paigeccino
39
3.6k
The Straight Up "How To Draw Better" Workshop
denniskardys
236
140k
How to train your dragon (web standard)
notwaldorf
96
6.2k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Unsuck your backbone
ammeep
671
58k
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.4k
GitHub's CSS Performance
jonrohan
1031
460k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
For a Future-Friendly Web
brad_frost
179
9.9k
Transcript
いつも監視(み)てるよ 〜ヤバいオブザーバビリティLT会〜 いつもみてるよ、エラーもその先も yabaibuki.dev 株式会社スタディスト CREグループ 柳楽瑛
⾃⼰紹介 2 名前: 柳楽瑛 (X: @_windupbird_) 所属: 株式会社スタディスト CREグループ 仕事:
Ruby, Rails, AWS, kubernetes, Terraform etc… 趣味: 筋トレ、散歩
⽬的 3 • スタディストでやっているかなり泥臭いエラー改善活動を紹介したい。
Teachme Biz 4 画像や動画を中⼼としたオンラインマニュアル を作成、共有、管理できるサービスです。 Teachme Biz is 何?
背景 5 • 開発‧運⽤しているマイクロサービスの増加 • 機能別にチームが存在(≠マイクロサービス担当) • チームの⽣成、統廃合 • エンジニアも増加
開発‧運⽤が⽇々複雑になっている
課題 6 • エラー発⽣の通知が来たけど、何のエラー? • エラー出たけど、これはどこのチームの管轄? • エラーの対応管理と進捗管理 「これは何のエラー?」「どこのチーム担当?」
課題 7 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス 担当
課題 8 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス 担当
課題 9 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス 担当
課題 10 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス 依存
課題 11 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス チーム D D マイクロサービス (廃⽌) 担当 担当
課題 12 チーム A 「これは何のエラー?」「どこのチーム担当?」 A マイクロサービス チーム B B
マイクロサービス チーム C C マイクロサービス チーム D D マイクロサービス (廃⽌) 担当 担当 500 Internal Server Error NoMethodError: undefined method `xxx' for nil
課題 13 • エラー発⽣の通知が来たけど、何のエラー? • エラー出たけど、これはどこのチームの管轄? • エラーの対応管理と進捗管理 「これは何のエラー?」「どこのチーム担当?」
どうするか? 14 • 各チームから1⼈以上のエンジニアを招集 • 毎⽇30分程度の時間を使って、過去24時間に発⽣したエラーの確認 • 全マイクロサービスを確認する • 加えて...各種メトリクスも確認して、問題が発⽣しそうな兆候がないか点検する
エラーを⾒る会の発⾜
何をしているか? 15 エラーを⾒る会の発⾜
ポイント 16 • 毎⽇やる、継続してやる • エラー発⽣の記録をつける、担当チームに割り振る • クリティカルになりそうなものは、その場でみんなで原因を調査する(可能な限り) • 常にアップデートして、エラーを⾒る会以外でも使える状態にする
• グラフは⾒やすいか?過不⾜はないか? • こんなグラフがあれば、いいのではないか? エラーを⾒る会の発⾜
効果 17 • エラーが放置されることなく、最短で修正‧リリースされるようになった • エラーに現れない兆候もキャッチアップし、未然にユーザー影響を防ぐことができた • 他のチームやマイクロサービスが何をやっているか分かるようになった • 他のエンジニアの原因究明プロセスを知ることができる
• エラー対応の進捗もここで確認できる 地道な改善がユーザー体験をよくする
まとめ 18 • 最終的には、サービスを使ってもらっているユーザーによりよい体験をしてもらうため • 「毎⽇5分」から「クリティカルなエラーを⾒る」から始めてみるのもいいかもしれない 地道な改善がユーザー体験をよくする
最後に 19 ⼀⾏のログの向こうには、⼀⼈のユーザがいる 引⽤ “ アクセスログの⼀⾏の200からは、その⽅を幸せにできたのかどうかはわかりません。ただ、⼀⾏の 500の向こうには、確実に、⼀つのがっかり体験があるはずです。” “ ⼤量にあるアクセスの中のたった⼀つかもしれませんが、そのエラーが出た瞬間、残念な思いをさ れる⽅が、インターネットのその先に確実にいらっしゃる。”
https://www.tumblr.com/ihara2525/17029509298
いつも監視(み)てるよ 〜ヤバいオブザーバビリティLT会〜 いつもみてるよ、エラーもその先も
https://studist.jp/