rights reserved. テレメトリがあっても解決できるとは限らない Web Server AP Server DB Server Load Balanserにレスポンスが 届く前にセッションが閉じられる • メトリクス、ログ、トレースすべて取得 • Keep-Aliveタイムアウト値、同時接続数の設定に問題なし • 再現せず、詳細ログを添付してサポートに問い合わせたが原因不明※ • 結果として根本原因が特定できないままクローズ Load Balancer ※ クラウド環境では、利⽤者が低レイヤーのテレメトリまで取得できない制約があり、 インフラ基盤内部での事象については解明が困難な場合がある クライアントでタイムアウトが発⽣したケース
rights reserved. 13 私がおすすめする”ここからはじめる” ① 4⼤シグナル [ Four Golden signals ] ② アプリケーション(フロント・バックエンド)ログ /インフラ ログ ③ クラウドで提供される標準的なメトリクス ④ 分散トレース + ここから始めて(継続的な)テストで 「このテレメトリは取っておかないとサービスの信頼性、およびビジネスに影響がでるな」と なった場合にはそのテレメトリを都度追加していく ※準拠すべきレギュレーションがある場合やミッションクリティカルなシステムを除く これらを1年未満の保存期間で管理・分析する(できれば数週間から数ヶ⽉)
rights reserved. 33 私がおすすめする”ここからはじめる” ① 4⼤シグナル [ Four Golden signals ] ② アプリケーション(フロント・バックエンド)ログ /インフラ ログ ③ クラウドで提供される標準的なメトリクス ④ 分散トレース + ここから始めて(継続的な)テストで 「このテレメトリは取っておかないとサービスの信頼性、およびビジネスに影響がでるな」と なった場合にはそのテレメトリを都度追加していく ※準拠すべきレギュレーションがある場合やミッションクリティカルなシステムを除く これらを1年未満の保存期間で管理・分析する(できれば数週間から数ヶ⽉)