Slide 28
Slide 28 text
●
DB の CPU、メモリ、ネットワークトラフィックなどはメトリクス上枯渇していなかった
●
アプリで記録される DB クエリのレイテンシが⻑い( 例 : 300ms )のに対して、Cloud SQL の
ログに表⽰されるクエリレイテンシは⾮常に短かった( 例 : 1ms )
●
アプリを重点的に調査したが問題を⾒つけられず、Cloud SQL の確認も実施
●
Cloud SQL のログが⽋損していることを(たまたま)発⾒
○
BigQuery で本番環境でも 30 秒以上ログが出⼒されない期間があることなどを確認
●
その後サポートと連携し調査を進めることで原因を特定
Google Cloud の提供するメトリクスやログから原因が特定できないこと
困難だったこと