Slide 21
Slide 21 text
起きている問題
高負荷クエリ、広域DBロック、ネットワーク障害、急激なCPU,Memの使用・枯渇等の様々な障害
が起きてシステムダウンや詰まりが起きるが経路が複雑で特定に時間がかかる
開発案件毎にミドルウェアの種類が増えていくがメトリクスが取得できない
監視ボードから原因追うのが専門職状態 (AppEngrがとっつきにくい)
細かいメトリクスの確認(丸め)や過去の数字との比較ができない
マルチクラウド時に監視システムの保守や経路確保が辛い
XymonのインストールがOS変わると動かない。
カスタムプラグイン書くの…?誰が使うねん。
コンテナに対応していない。
モチベーションわかない、モチベーションわかない。モチベーションわかない。
システム
トラブル
運用苦労
誰も障害対応に参加してこれない
開発チームからの主体的なアクションが取りづらい