Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Kyashの決済部分におけるDatadog監視事例
Search
Seiya Sato
September 15, 2020
Technology
0
380
Kyashの決済部分におけるDatadog監視事例
Inside Fintech Meetup ~ Finatext × Kyash × FOLIO ~ の登壇資料
Seiya Sato
September 15, 2020
Tweet
Share
Other Decks in Technology
See All in Technology
猫でもわかるAmazon Q Developer CLI 解体新書
kentapapa
1
150
オブザーバビリティと育てた ID管理・認証認可基盤の歩み / The Journey of an ID Management, Authentication, and Authorization Platform Nurtured with Observability
kaminashi
2
1.3k
会社を支える Pythonという言語戦略 ~なぜPythonを主要言語にしているのか?~
curekoshimizu
4
910
知覚とデザイン
rinchoku
1
630
JAWS UG AI/ML #32 Amazon BedrockモデルのライフサイクルとEOL対応/How Amazon Bedrock Model Lifecycle Works
quiver
1
120
激動の時代を爆速リチーミングで乗り越えろ
sansantech
PRO
1
170
AIがコードを書いてくれるなら、新米エンジニアは何をする? / komekaigi2025
nkzn
3
550
パフォーマンスチューニングのために普段からできること/Performance Tuning: Daily Practices
fujiwara3
2
150
AI駆動で進める依存ライブラリ更新 ─ Vue プロジェクトの品質向上と開発スピード改善の実践録
sayn0
1
340
個人でデジタル庁の デザインシステムをVue.jsで 作っている話
nishiharatsubasa
3
5.2k
可観測性は開発環境から、開発環境にもオブザーバビリティ導入のススメ
layerx
PRO
4
1.9k
AWSが好きすぎて、41歳でエンジニアになり、AAIを経由してAWSパートナー企業に入った話
yama3133
2
190
Featured
See All Featured
Building Adaptive Systems
keathley
44
2.8k
Why Our Code Smells
bkeepers
PRO
340
57k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Building an army of robots
kneath
306
46k
We Have a Design System, Now What?
morganepeng
53
7.8k
Site-Speed That Sticks
csswizardry
13
930
It's Worth the Effort
3n
187
28k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
658
61k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
Product Roadmaps are Hard
iamctodd
PRO
55
11k
Context Engineering - Making Every Token Count
addyosmani
8
310
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.2k
Transcript
Kyashの決済部分における Datadog監視事例 Inside Fintech Meetup 〜 Finatext x Kyash x
FOLIO 〜 2020/09/15 株式会社 Kyash Paymentチーム 佐藤 聖也
2 佐藤 聖也(さとう せいや) - 2020年3月入社 - Paymentチーム所属 - Visa決済、QUICPay決済関係のお仕事
- 決済履歴の漢字対応とかとか。。。 自己紹介
3 01. 監視の構成/ツール 02. Datadogで利用している機能 03. 独自で監視しているもの 04. これから Agenda
01. 監視の構成/ツール
監視の構成/ツール サーバーやDB その他マネージドサー ビス Datadog PagerDuty Slack
02. Datadogで利用している機能
7 よく使っている機能 - ダッシュボード - Datadog Logs - APM Trace
Datadogさん素晴らしい ↑ロゴもかわいい
8 - CPU使用率、I/Oなど基本的なメトリクス - 決済にかかっている時間 - Critical、Emergency Logの出力量 - 存在しないカード番号や有効期限間違いが発生しているオー
ソリ要求の量 - etc... ダッシュボードに出しているもの(一部)
9 - CPU使用率、I/Oなど基本的なメトリクス - 決済にかかっている時間 - Critical、Emergency Logの出力量 - 存在しないカード番号や有効期限間違いが発生しているオー
ソリ要求の量 ダッシュボードに出しているもの(一部) ←トラフィック、 サチュレーション ← レイテンシ ← エラー ↑ エラー 4大シグナルは把握できるようになっている
ダッシュボードの活用 - オフィスの大きい液晶にダッシュボードを出す - 現在フルリモートなので使えてない - チーム内で設定したSLI/SLOの確認 - 負荷試験を行う時に専用ダッシュボードを作る
ダッシュボードの余談
ダッシュボードの余談 テザリングでダッシュボードを見てると めっちゃくちゃギガが減る…らしい?
Datadog Logs - 使うのは基本的にリリース後や問題を検知したとき - Live Tailを意味もなく見ている - ログが流れるということは利用しているユーザー様がいる ということの証明
- 各マイクロサービスがどのようなログを出しているのか見 る - 当然カード番号など重要な情報はマスクされている
Datadog Logs のいいところ - SSHしてEC2にログインしなくてもログを見れる - ログが1箇所に集約される - Slackに貼るときログ詳細のURLを貼ればSlackの会話ログを 汚染しない
Datadog Logs を活用するために。。。 - 当たり前ではあるがノイズをへらすこと - 適切なログレベルにする - そもそもそのログ出力は今必要なのか?
APM Traces - 激重リクエストがあったときに何がどのくらいかかっているの か把握する - TracesをDurationでソートすると重いリクエストがわかる - リクエスト内で何がどれだけ時間を使っているか把握する -
激重クエリ?別のサービスが遅い?
17 ダッシュボードからTraceをすぐ確認できる ダッシュボードから把握できる Tracesへ即遷移できるのですぐ見に行ける
APM Traces - 快適な決済体験を実現するのに一番役に立っている - まだ完璧ではなくspanの設置の仕方はまだ模索中 - カジュアルに改善している
03. 独自で監視しているもの
独自の監視について - VisaのサーバーとのTCPコネクション - TCPコネクションは張りっぱなし
ある夜。。。 突然決済が失敗し始める 決済サーバーのログを見ても特に変な挙動をした様子もない
ある夜。。。 オンコール中にログなどからみんなネットワーク周りと予想は していたけど証明できるものがなかった しばらく経ち専用線サービスからの障害通知を遅れて受 け取る
対処 自分たちで把握しなければという課題感 - tcpdumpを使ってTCPコネクションの状態を確認できるス クリプトを設置 - 同様の症状が何度か発生したがスクリプトでFINが来てお り切断されたことを把握できるようになった
04. これから
まだまだ課題はたくさん - 今現状の監視で満足ということはない - より素早くサービスの状態が把握できるようにしたい - Twitterとか見てるとまだ把握しきれていない問題がありそ う - Twitterも優秀なモニタリングツール!?
より快適な決済体験実現のため 改善を続けていきます!
We’re Hiring! Kyashではアプリエンジニア、サーバーサイドエンジニア、SREな ど様々な職種の募集を行っております! 一緒に新しいお金の文化を創っていきませんか? https://kyash.co/recruit @kyashrecruit_jp
ご清聴ありがとうございました!