Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
障害対応のあるあると僕らの選択肢
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
norinux
March 25, 2015
Technology
540
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
障害対応のあるあると僕らの選択肢
障害対応周りのあるあると、対応策やツールの話。
https://reactio.jp
norinux
March 25, 2015
More Decks by norinux
See All by norinux
NoCode開発で「オウ、ノーー!
norinux
2
1.1k
インターネット基礎講座
norinux
0
170
スタートアップスタジオ流の開発プロセス
norinux
0
110
会社で書いてるコードも「OSSで公開しちゃえ!」ってしたいからそうした話 in OSS開発してる(したい)エンジニア交流会 /gx-oss-guideline-at-techmeetups
norinux
0
480
My Lightning Talk 「副業している(したい) エンジニア交流会 #2」
norinux
0
200
エンジニア流? こだわりのミーティング手法
norinux
1
190
スタートアップスタジオでの検証フェーズと技術
norinux
0
670
2018年新卒エンジニア研修 プログラミング研修【公開版】
norinux
0
120
2018年新卒エンジニア研修 セキュリティ
norinux
0
130
Other Decks in Technology
See All in Technology
Kiroで書いた 設計書 が AI レビューの 採点基準 になる
ezaki
0
130
2026年6月23日 Syncable Tech + Start Python Club にて
hamukazu
0
140
LayerX コーポレートエンジニアリング室におけるサプライチェーンセキュリティへの取り組み / Supply Chain Security at LayerX Corporate Engineering
yuyatakeyama
2
680
AI時代のコスト管理を考えよう〜明日から使える実践AWSノウハウ~
yoshimi0227
0
310
PostgreSQL 19 新機能概要 OSC Hokkaido 2026
nori_shinoda
0
140
入門!AWS Blocks
ysuzuki
1
160
iOS アプリの「これって不具合ですか?」を AI に調べてもらう
miichan
0
100
いまさら聞けない「仕様駆動開発入門」 〜AI活用時代の開発プロセスを考える〜
findy_eventslides
2
160
サイバーエージェントにおけるAI推進戦略と変革への取り組み
shotatsuge
0
130
Chainlitで作るお手軽チャットUI
ynt0485
0
280
iAEONの段階的リアーキテクト戦略 / iAEON's_Gradual_Re-architecture_Strategy
aeonpeople
0
230
【セミナー資料】Claude Code をセキュアに使うための考え方と設定の勘どころ / Claude Code Webinar 20260616
masahirokawahara
2
420
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
290
GitHub's CSS Performance
jonrohan
1033
470k
Discover your Explorer Soul
emna__ayadi
2
1.1k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
62
44k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
260
Abbi's Birthday
coloredviolet
2
8.1k
The SEO Collaboration Effect
kristinabergwall1
1
490
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
750
XXLCSS - How to scale CSS and keep your sanity
sugarenia
250
1.3M
The agentic SEO stack - context over prompts
schlessera
0
820
Transcript
障害対応のあるある と僕らの選択肢 of Gotanda.pm #4 by 佐々木喜徳 @gaiax
自己紹介(佐々木喜徳) Perlの会社で Perlを書かずに、 インフラ基盤やり続けて早7.7年 はい。すみません。プログラマじゃないっす。
最近気になることは、 趣味の写真を格納したHDDがSPOFだから 不安な毎日を過ごしている。 (Google Nearline Storage にバックアップしようかな) h?ps://www.facebook.com/yoshinori.sasaki ←ポチっとな
趣味の写真
障害対応のあるある ガイアックスでよくある、障害対応の事象。 僕らの選択肢 それをどのように対処してきたのかの軌跡
障害対応のあるある 原因不明のメモリーリーク
僕らの選択肢 原因が見つかるまで障害防止 – とりあえず影響出る前に解消させる。 /etc/crontab – グラフを見て、遠くを眺める。 00 3
* * * root /bin/bash /etc/init.d/h?pd restart
障害対応のあるある 原因は Kenel Panic !?
僕らの選択肢 Kernel Panic の原因を調べる手段を模索 – syslogサーバに飛ばして、ログを追う – kdumpのメモリダンプを追う サービス
サーバ /var/log/messages Syslog サーバ /var/log/messages サービス サーバ ファースト カーネル セカンド カーネル ダ ン プ kern.*
障害対応のあるある そもそもアラートメールに すぐ気づけないわ
僕らの選択肢 通知方法を模索(特に営業時間外) – 携帯/スマフォにもメールを飛ばす – メールだけじゃなくて、電話もかける – 障害だけ判断して連絡する サービス
サーバ サービス サーバ サービス サーバ
障害対応のあるある 深夜に発生 関係者に連絡がつかない (連絡先リストが古くて使えない)
障害対応のあるある そのアラートは、 障害継続中?障害再発?
障害対応のあるある よし!復旧した! 障害記録・報告書かねば、、、
僕らの選択肢 • 技術的課題 – エンジニアリングで解決できる。してる。 • 運用的課題 – ルールとか、手順とか、で解決しようとしがち
– でも上手くいかない。 障害発生時の対応を支えるツールを作ったった。
僕らのツール 参考: Yahoo! Japanの爆速連絡ツール 一斉に電話連絡機能 (機械音声で読み上げ) プロジェクトごとのチャット
トピック機能 インシデント単位で、 連絡内容とチャット内容 サマリ情報、報告書を管理
僕らのこれから 障害対応基盤 コミュニケーション基盤 各種監視基盤 API Webhook NEW NEW
サービス化の準備してます! 60日間の無料トライアル版を提供可能! 4月下旬 正式版リリース予定
宣伝しちゃってすみません。 Perlだから許して!><