Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Kyashの決済部分におけるDatadog監視事例
Search
Seiya Sato
September 15, 2020
Technology
0
300
Kyashの決済部分におけるDatadog監視事例
Inside Fintech Meetup ~ Finatext × Kyash × FOLIO ~ の登壇資料
Seiya Sato
September 15, 2020
Tweet
Share
Other Decks in Technology
See All in Technology
Autonomous Database Cloud 技術詳細 / adb-s_technical_detail_jp
oracle4engineer
PRO
14
35k
〜小さく始めて大きく育てる〜データ分析基盤の開発から活用まで
kniino
0
2k
Oracle Cloud Infrastructure:2024年4月度サービス・アップデート
oracle4engineer
PRO
1
110
コンパウンドスタートアップのためのスケーラブルでセキュアなInfrastructure as Codeパイプラインを考える / Scalable and Secure Infrastructure as Code Pipeline for a Compound Startup
yuyatakeyama
3
2.1k
小さな開発会社がWebサービスを作る理由
polidog
PRO
1
150
"好き"との生活/Regularly update profile with GitHub Actions
judeeeee
0
150
SREとその組織類型
tatsuo48
8
1.5k
ChatGPT for IT Service Management (IT Pro)
dahatake
2
120
エンタープライズ環境下での Active Directory の運用 TIPS
tamaiyutaro
1
1.5k
マルチアカウント環境への発見的統制の導入
ch1aki
1
1.3k
WebアプリケーションにおけるPDOの使い方入門 / phpcon odawara 2024
meihei3
2
430
HEXA OSINT CTF V3 作戦会議
meow_noisy
0
110
Featured
See All Featured
Raft: Consensus for Rubyists
vanstee
132
6.2k
What's new in Ruby 2.0
geeforr
337
31k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
658
120k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
24
2.3k
Music & Morning Musume
bryan
41
5.6k
Teambox: Starting and Learning
jrom
128
8.4k
The Cost Of JavaScript in 2023
addyosmani
14
3.8k
Writing Fast Ruby
sferik
620
60k
Designing the Hi-DPI Web
ddemaree
276
33k
[RailsConf 2023] Rails as a piece of cake
palkan
22
3.9k
The Language of Interfaces
destraynor
151
23k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
321
20k
Transcript
Kyashの決済部分における Datadog監視事例 Inside Fintech Meetup 〜 Finatext x Kyash x
FOLIO 〜 2020/09/15 株式会社 Kyash Paymentチーム 佐藤 聖也
2 佐藤 聖也(さとう せいや) - 2020年3月入社 - Paymentチーム所属 - Visa決済、QUICPay決済関係のお仕事
- 決済履歴の漢字対応とかとか。。。 自己紹介
3 01. 監視の構成/ツール 02. Datadogで利用している機能 03. 独自で監視しているもの 04. これから Agenda
01. 監視の構成/ツール
監視の構成/ツール サーバーやDB その他マネージドサー ビス Datadog PagerDuty Slack
02. Datadogで利用している機能
7 よく使っている機能 - ダッシュボード - Datadog Logs - APM Trace
Datadogさん素晴らしい ↑ロゴもかわいい
8 - CPU使用率、I/Oなど基本的なメトリクス - 決済にかかっている時間 - Critical、Emergency Logの出力量 - 存在しないカード番号や有効期限間違いが発生しているオー
ソリ要求の量 - etc... ダッシュボードに出しているもの(一部)
9 - CPU使用率、I/Oなど基本的なメトリクス - 決済にかかっている時間 - Critical、Emergency Logの出力量 - 存在しないカード番号や有効期限間違いが発生しているオー
ソリ要求の量 ダッシュボードに出しているもの(一部) ←トラフィック、 サチュレーション ← レイテンシ ← エラー ↑ エラー 4大シグナルは把握できるようになっている
ダッシュボードの活用 - オフィスの大きい液晶にダッシュボードを出す - 現在フルリモートなので使えてない - チーム内で設定したSLI/SLOの確認 - 負荷試験を行う時に専用ダッシュボードを作る
ダッシュボードの余談
ダッシュボードの余談 テザリングでダッシュボードを見てると めっちゃくちゃギガが減る…らしい?
Datadog Logs - 使うのは基本的にリリース後や問題を検知したとき - Live Tailを意味もなく見ている - ログが流れるということは利用しているユーザー様がいる ということの証明
- 各マイクロサービスがどのようなログを出しているのか見 る - 当然カード番号など重要な情報はマスクされている
Datadog Logs のいいところ - SSHしてEC2にログインしなくてもログを見れる - ログが1箇所に集約される - Slackに貼るときログ詳細のURLを貼ればSlackの会話ログを 汚染しない
Datadog Logs を活用するために。。。 - 当たり前ではあるがノイズをへらすこと - 適切なログレベルにする - そもそもそのログ出力は今必要なのか?
APM Traces - 激重リクエストがあったときに何がどのくらいかかっているの か把握する - TracesをDurationでソートすると重いリクエストがわかる - リクエスト内で何がどれだけ時間を使っているか把握する -
激重クエリ?別のサービスが遅い?
17 ダッシュボードからTraceをすぐ確認できる ダッシュボードから把握できる Tracesへ即遷移できるのですぐ見に行ける
APM Traces - 快適な決済体験を実現するのに一番役に立っている - まだ完璧ではなくspanの設置の仕方はまだ模索中 - カジュアルに改善している
03. 独自で監視しているもの
独自の監視について - VisaのサーバーとのTCPコネクション - TCPコネクションは張りっぱなし
ある夜。。。 突然決済が失敗し始める 決済サーバーのログを見ても特に変な挙動をした様子もない
ある夜。。。 オンコール中にログなどからみんなネットワーク周りと予想は していたけど証明できるものがなかった しばらく経ち専用線サービスからの障害通知を遅れて受 け取る
対処 自分たちで把握しなければという課題感 - tcpdumpを使ってTCPコネクションの状態を確認できるス クリプトを設置 - 同様の症状が何度か発生したがスクリプトでFINが来てお り切断されたことを把握できるようになった
04. これから
まだまだ課題はたくさん - 今現状の監視で満足ということはない - より素早くサービスの状態が把握できるようにしたい - Twitterとか見てるとまだ把握しきれていない問題がありそ う - Twitterも優秀なモニタリングツール!?
より快適な決済体験実現のため 改善を続けていきます!
We’re Hiring! Kyashではアプリエンジニア、サーバーサイドエンジニア、SREな ど様々な職種の募集を行っております! 一緒に新しいお金の文化を創っていきませんか? https://kyash.co/recruit @kyashrecruit_jp
ご清聴ありがとうございました!