Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Kyashの決済部分におけるDatadog監視事例

C66fb70cac46ba5b613e766bfa3669e7?s=47 Seiya Sato
September 15, 2020

 Kyashの決済部分におけるDatadog監視事例

Inside Fintech Meetup ~ Finatext × Kyash × FOLIO ~ の登壇資料

C66fb70cac46ba5b613e766bfa3669e7?s=128

Seiya Sato

September 15, 2020
Tweet

Transcript

  1. Kyashの決済部分における Datadog監視事例 Inside Fintech Meetup 〜 Finatext x Kyash x

    FOLIO 〜 2020/09/15 株式会社 Kyash Paymentチーム 佐藤 聖也
  2. 2 佐藤 聖也(さとう せいや) - 2020年3月入社 - Paymentチーム所属 - Visa決済、QUICPay決済関係のお仕事

    - 決済履歴の漢字対応とかとか。。。 自己紹介
  3. 3 01. 監視の構成/ツール 02. Datadogで利用している機能 03. 独自で監視しているもの 04. これから Agenda

  4. 01. 監視の構成/ツール

  5. 監視の構成/ツール サーバーやDB その他マネージドサー ビス Datadog PagerDuty Slack

  6. 02. Datadogで利用している機能

  7. 7 よく使っている機能 - ダッシュボード - Datadog Logs - APM Trace

    Datadogさん素晴らしい ↑ロゴもかわいい
  8. 8 - CPU使用率、I/Oなど基本的なメトリクス - 決済にかかっている時間 - Critical、Emergency Logの出力量 - 存在しないカード番号や有効期限間違いが発生しているオー

    ソリ要求の量 - etc... ダッシュボードに出しているもの(一部)
  9. 9 - CPU使用率、I/Oなど基本的なメトリクス - 決済にかかっている時間 - Critical、Emergency Logの出力量 - 存在しないカード番号や有効期限間違いが発生しているオー

    ソリ要求の量 ダッシュボードに出しているもの(一部) ←トラフィック、  サチュレーション ← レイテンシ ← エラー ↑ エラー 4大シグナルは把握できるようになっている
  10. ダッシュボードの活用 - オフィスの大きい液晶にダッシュボードを出す - 現在フルリモートなので使えてない - チーム内で設定したSLI/SLOの確認 - 負荷試験を行う時に専用ダッシュボードを作る

  11. ダッシュボードの余談

  12. ダッシュボードの余談 テザリングでダッシュボードを見てると めっちゃくちゃギガが減る…らしい?

  13. Datadog Logs - 使うのは基本的にリリース後や問題を検知したとき - Live Tailを意味もなく見ている - ログが流れるということは利用しているユーザー様がいる ということの証明

    - 各マイクロサービスがどのようなログを出しているのか見 る - 当然カード番号など重要な情報はマスクされている
  14. Datadog Logs のいいところ - SSHしてEC2にログインしなくてもログを見れる - ログが1箇所に集約される - Slackに貼るときログ詳細のURLを貼ればSlackの会話ログを 汚染しない

  15. Datadog Logs を活用するために。。。 - 当たり前ではあるがノイズをへらすこと - 適切なログレベルにする - そもそもそのログ出力は今必要なのか?

  16. APM Traces - 激重リクエストがあったときに何がどのくらいかかっているの か把握する - TracesをDurationでソートすると重いリクエストがわかる - リクエスト内で何がどれだけ時間を使っているか把握する -

    激重クエリ?別のサービスが遅い?
  17. 17 ダッシュボードからTraceをすぐ確認できる ダッシュボードから把握できる Tracesへ即遷移できるのですぐ見に行ける

  18. APM Traces - 快適な決済体験を実現するのに一番役に立っている - まだ完璧ではなくspanの設置の仕方はまだ模索中 - カジュアルに改善している

  19. 03. 独自で監視しているもの

  20. 独自の監視について - VisaのサーバーとのTCPコネクション - TCPコネクションは張りっぱなし

  21. ある夜。。。 突然決済が失敗し始める 決済サーバーのログを見ても特に変な挙動をした様子もない

  22. ある夜。。。 オンコール中にログなどからみんなネットワーク周りと予想は していたけど証明できるものがなかった しばらく経ち専用線サービスからの障害通知を遅れて受 け取る

  23. 対処 自分たちで把握しなければという課題感 - tcpdumpを使ってTCPコネクションの状態を確認できるス クリプトを設置 - 同様の症状が何度か発生したがスクリプトでFINが来てお り切断されたことを把握できるようになった

  24. 04. これから

  25. まだまだ課題はたくさん - 今現状の監視で満足ということはない - より素早くサービスの状態が把握できるようにしたい - Twitterとか見てるとまだ把握しきれていない問題がありそ う - Twitterも優秀なモニタリングツール!?

    より快適な決済体験実現のため 改善を続けていきます!
  26. We’re Hiring! Kyashではアプリエンジニア、サーバーサイドエンジニア、SREな ど様々な職種の募集を行っております! 一緒に新しいお金の文化を創っていきませんか? https://kyash.co/recruit @kyashrecruit_jp

  27. ご清聴ありがとうございました!