クラウドネイティブに支える従量課金集計―Mackerel「daifukucho」の設計と運用

ja.mackerel.io クラウドネイティブに支える従量課金集計 Mackerel「daifukucho」の設計と運用 2025.11.18 CloudNative Days Winter 2025

登壇者の紹介 id:ne-sachirou .｡oO(さっちゃんですよヾ(〃l _ l)ﾉﾞ☆) 　 Mackerelでテックリードをやってゐます id:yset0 株式会社はてなにて、Mackerelの開発に従事
2

ものすごく大雑把に見たMackerelの仕組み 4 メトリック投稿保存グラフを表示アラートを発報等

従量課金集計システム「daifukucho」名の由来は「大福帳」大福帳は江戸時代に日本全国に普及した商業帳簿である。大帳（だいちょう）または本帳（ほんちょう）ともいう。「大福帳」は家の繁盛を願った美称で、商家によって名称は異なり、「大宝恵（おぼえ）帳」や「日加栄（ひかえ）帳」といった美称も多く用いられた。 https://ja.wikipedia.org/wiki/%E5%A4%A7%E7%A6%8F%E5%B8%B3 (プロトタイプ時点では “emmacho”(「閻魔帳」)といふ名だった) 5

従量課金集計システム「daifukucho」 Mackerelの課金体系 (ものすごく大雑把に言ふと) • ホスト数×n円 • メトリック数×m円オーガニゼーション (テナント) ごとにホスト数やメトリック数を数へ記
録するのがdaifukucho 2024/11にリリース 6

daifukucho以前 (2014〜2024) 7 メトリック投稿計数集計結果を移動適宜集計を繰り返す

daifukucho以前 : 課題 • 集計の計算がすごく難しい ◦ 集計のタイミングなどに起因して仕様に直感的でない妥協が複数あり、全容を把握するのがすごく難しい ◦ 実際に積年のbugが見つかりつつあった…
• メトリック投稿システムのbugの影響を受けやすい ◦ 誤ってメトリックを重複して投稿すると、重複して課金される • メトリック投稿の証跡が残ってゐない ◦ 計数・データ移動・数度の集計のたびに情報を失ってゐた ▪ 元データを捨ててゐた ◦ 何か問題があると、集計済みの情報を失ったデータと、アクセスログをもとに起こった事を想像するしかなかった 8

daifukucho以前 : 2024年初頭の状況 • 数々の金銭上の問題が起こってゐた ◦ AWSインテグレーション WAF連携のメトリック数の過剰カウントに関するご報告 ▪ 【続報】クラウドインテグレーション
メトリック数の過剰カウントに関するご報告 ▪ （2022/06/15追記）クラウドインテグレーションメトリック数の過剰カウントついてのお詫びと詳細のお知らせ ◦ 月途中にホストの利用が全てなくなった場合に利用料金を過剰に請求していた事象についてのお詫びと詳細のお知らせ ◦ Google Cloudインテグレーションにおける監視の不備に関するご報告 ◦ ごめんなさい • OpenTelemetryメトリック対応の課金システムを作る必要があった 9

これらの課題を一度に解決する魔法がないものか • 見通しがよくbugを作り込みづらく • メトリック投稿システムのbugの影響を受けづらく • 問題が起こった時に証跡から調べ直せ • パフォーマンスも申し分なく •
コストもほどほどで • OpenTelemetryメトリックの課金根拠の集計にも対応したそんな魔法の解決策が… 10

解決策 • 課金プランを整理する ◦ OpenTelemetryメトリックの課金方法(メトリック数×n円)に、他の商品の課金方法を合はせる ▪ ユーザーにも不評だった部分をわかりやすくする ▪ わかりやすいプランは集計もしやすい
◦ B2Bらしい様々な契約条件も、営業と協力して整理する • 新しい課金根拠集計システムを作る ◦ →daifukucho 11

新しい課金根拠システムへの要求 • 月毎のメトリック数・ホスト数を正しく集計する ◦ 「1メトリック」「1ホスト」の意味が月の日数によって変はる ◦ メトリックは往々にして遅れて届く • できるかぎり生の証跡を残す ◦
メトリックが一点投稿されるごとに一つの証跡が残ると理想 • 利用量がユーザーに可視化される ◦ テナント毎に毎日集計する • 集計ロジックは柔軟である ◦ 重複して投稿されたメトリックをある程度は「1メトリック」としてまとめたりできる • 移行期間は旧集計システムと併存する 12

完成したdaifukuchoの設計 13

完成したdaifukuchoの処理性能 • 近日時点で毎日1.3TBのデータを受信してゐる • 毎日20分弱で前日のデータを集計してゐる • インフラコストは課題になってゐない 14

daifukuchoをどう設計したか素朴な設計を考へる • メトリック1点毎にJSONを1つ生成して保存する • 保存したデータから毎日集計するこれを充分に実現できるなら、より複雑な仕組みは考へなくてよい 15

素朴な設計 16

実稼働環境でプロトタイピングする • Athenaで一気に集計する手法で、そもそもMackerelの料金を計算できるか? • 極端に遅延せず保存できるか? • 充分な速さで集計できるか? • 高速に日々の利用量を閲覧できるか?
• 実際のインフラ代金はどれほどのものか? • IaCできるか? • ロジックはテスト可能か? 17

データを保存できるか? • 本番の実全データをFirehoseにも送って性能を確かめる ◦ 初めは社内利用のデータだけを流す ▪ 段階的に、安全に ◦ 本番の処理に影響を与へないやう ▪
Firehoseへの送信に失敗してもエラーを起こさない(ログを吐くだけ)やうにする • Parquetに変換しストレージを節約する • 商品毎にFirehoseを分ける ◦ 商品ごとに流量や集計処理が全く異なるので、一緒に処理しない 18

データを保存できるか? バッチし忘れコスト爆発事件 • 証跡1個ごとに新たなレコードとしてFirehoseに送ってゐた ◦ Firehoseは1レコードを最低5KBに切り上げて料金を計算する ▪ すごいデータ量を処理してゐる事になった • 1000KB未満にバッファしてFirehoseに送るやうにした
19

Mackerelの料金を計算できるか? • 実データを元にクエリーを書きつつ、複雑な仕様は営業と協力して調整してゆく • 協力が鍵 20

集計できるか? AWSのSAに相談して案を貰った比較した案 • Athena • Glue Databrew • Quicksight
• Redshift 21

集計できるか? : Athena 本命 • データはS3に保存するのがコストも低く管理も楽 ◦ S3から大量のデータを集計するならAthenaが本命 • Glue
Crawlerでテーブルを作る ◦ 毎時単位でパーティショニングする • Step Functionsで商品毎に並列処理し、エラーに対処する • SAと議論し、「そのデータ量を処理できるかはやってみないとわからない」とやってみたところ、できたので採用 22

集計できるか? : Athena Amazon Athena のパフォーマンスチューニング Tips トップ 10 |
Amazon Web Services ブログを大いに参考とした 23

集計できるか? : Glue Databrew • 当時はTerraformで管理できなかった • 悪くはなかったので試した本命のAthenaで充分動いたのでAthenaを選んだ 24

集計できるか? : Quicksight • 利用量を表示する画面を構築できそうだった • 不特定多数のユーザーが自由に見られるページに置くと、料金がめっちゃ高くなる • 画面は構築できるが、課金システムが使ふ月毎のデータを集計するに
はどうせ別のシステムが必要料金、そして二重にシステムを作って管理するのは大変なので、不採用 25

集計できるか? : Redshift • 想定したデータ量を安定して処理できそうではあった • ストレージ料金が嵩む • 我々には運用ノウハウが無い •
AthenaでもGlue Databrewでも作れなかった時にはこれを採用する Athenaで作れたので不採用 26

利用量を閲覧できるか? 比較した案 • パーティショニングし都度クエリーする • 日毎のデータを集計しておき、それを参照する 27

利用量を閲覧できるか? : 都度クエリー • 都度クエリーするコストを抑へたいので、テナント×日毎にパーティショニングする ◦ Firehoseでパーティショニング ▪ Firehoseの上限(500個/ストリーム)を超える
◦ Glue Databrewでパーティショニング ▪ パーティション数の上限はあり、考慮する必要がある • そもそも都度クエリーする事による、パフォーマンスと料金への影響が予想しづらい事前に集計するのが、実装も難しくなく、料金も安い事がわかったので、不採用 28

利用量を閲覧できるか? : 事前に集計 • 毎日前日のデータを集計し、Auroraに保存しておく • Auroraのパフォーマンスは予想しやすい • Auroraの料金も予想しやすい •
課金用に、もともとはAthenaで一月分のデータを集計するつもりでゐたが、データが多過ぎた ◦ 一日分のデータは充分に集計できる ◦ 課金用にも日毎に集計しておいたデータを使ふ以上多数の利点があり、採用 29

ロジックはテスト可能か? • S3にダミーのデータを置き、クエリー結果をCIでスナップショットテストする 30

完成したdaifukuchoの設計 31

完成したdaifukuchoの設計 : 保存・集計 • メトリックの投稿を受け付けるシステムが証跡を生成し、一定バッファ毎にFirehoseに送る • Parquetに変換しS3に保存する • 毎日Step
Functionsを起動する ◦ Glue CrawlerでAthenaのパーティションを作る ◦ 商品毎に並列で集計する ▪ Athenaで計算する ▪ 結果をAuroraに書き込む 32

完成したdaifukuchoの設計 : 集計結果の利用利用量画面 • Auroraの内容を表示する課金 • Auroraの内容を集計し金額を計算する 33

利用量画面 34

完成したdaifukuchoの設計（再掲） 35

素朴な設計（再掲） 36

• RDSを追加することとなった • 月末にデータが出せないと事故になるので、影響が大きい ◦ 日次バッチで、毎日稼働状況を確認する ◦ 稼働しなくなったとしても、障害時の対応やコンポーネントの状態可視化もバッチの集計期間が短ければ対処しやすくなる •
利用状況データもふつうのレスポンスで出せるようになる • しかし、データを守る範囲が増える ◦ S3だけではなく、RDSを改ざんなどから守る必要が出てきたデータストアは2段構成に 37

• 強い権限を配らない形とするため、作業者に直接権限を渡さないようにした ◦ 具体的には、RDSのIAM認証を行うことにした ◦ 参照ユーザーを整備、IAMでの許可範囲の権限のみ実行可能に • ただし、作業でマスターパスワードは必要なことはある ◦
これまでも接続ログの監査を実施しており、同一の業務手順に載せることにした • RDSのIAM認証の存在は把握していたが、今回初めて採用した ◦ 使い心地はよかった RDSのIAM認証と接続ログの監査 38

• 利用状況画面を開発するにあたって、アプリケーションからRDSに接続する必要が出てきた ◦ この従量課金システムが障害時に、このアプリケーション自体への影響は最小限に抑える必要がある ◦ “サブシステムのメンテナンス”で、本体を停止するのは、サブシステムではない •
さまざまなパラメータを見極めて、直接実装するのは難儀に思われた ◦ いい感じにサーキットブレーカーする仕組みが今のところない • いい感じのサーキットブレーカーを簡単に実装する必要性が出てきた既存のシステムからのRDSの参照 39

• RDSには、計算の結果が入っているだけなので、RDSに高度なクエリを実行する訳ではない • データのユースケースからして、参照クエリは数本に収まることがわかった • 既存アプリケーションから直接のDB接続を行わず、HTTP APIとして切り離したほうが、障害が起きた際の影響を最小限度に収めやすいと
判断した ◦ HTTP APIを、Goで実装し、Lambdaに仕立て、API Gatewayで載せることにした RDSを参照するプロキシを実装する 40

• awslabs/aws-lambda-go-api-proxy を用いて、Lambda内にHTTPアプリケーションを実装 ◦ このライブラリはアーカイブされている • OpenAPI 定義からジェネレータでコード生成 ◦
コードとして書く部分は、SQLのクエリ、入出力だけ。という状態にする • WebアプリケーションはECSを基盤として実装することがこれまで多かったが、想定されるリクエスト数から、Lambdaを採用することにした RDSを参照するプロキシを実装する 41

• Mackerelのシステムから、HTTP APIを通じて、RDSのデータを参照することができるようになった • 利用状況を知ることができる画面づくり • これまでのお客様の声 ◦ 毎月何台の利用になるか月末にならないとわからないから心配だ
▪ 台数が変わらなければ、問題ない。とお伝えするものの、お客様側で、台数が変わっていないことを可視化までは至らない ◦ 使いすぎては困るので見積もり、金額がどうなるか教えてほしい ▪ 平均されますよ。と伝えても、響かない利用状況を知ることができる仕組みお客様のクラウド破産を防ぎたい 42

• どういう機能が満たせている必要があるか洗い出した • 下記のような要件が見えた ◦ リアルタイムは不要 ◦ 商品ごとに日毎で見える ◦
グラフで見たい ◦ 過去の月も遡れる ◦ 昨日のデータが見れる • 通知は必要か？という議論もあったが、まずは見れるところまで。を要件としたユーザーストーリーマップとMVP 43

• 自分たちのサービスにないグラフの形だったので、どういう見せ方が良いか。を議論 • 積み重ね棒グラフで商品の積み重ねと1日を表現する ◦ 商品の種類が違えば、違
うグラフにするモックの手前までアイディアを出す 44

• 10年を超えるサービス、グラフのコンポーネントは大きなデザイン変更を経験しておらず、愛着のある人も多い • 積み重ね棒グラフのデザインは、実装されていない •
これまでのグラフのコンポーネントとは異なるライブラリを採用しつつも、カラースキームを踏襲装飾にはこだわりたい 45

• Mackerelは、AWSなどのクラウド監視も専門とするところ • これまでAthena向けの機能を開発していなかった • 自分たちのシステムの様子は自分たちのシステムで監
視しておきたい • Athena用の機能を開発し、リリースしました自分たちのシステムの監視は、自分たちで 46

• 運用開始、1ヶ月前から本番運用さながらの体制にしていく ◦ オペレーション、監視 ◦ ユーザーには見えない形での利用状況画面の公開 ▪ データが取得できていることを開発チーム側で把握し、ドッグフーディング ▪
気になったところは改善を回す • そんなある日、Athenaの調子がおかしくなった... 大福帳の仮運用を開始する 47

• 昨日までは動作していたが、突然実行時間が90分まで増えた ◦ 普段は20分程度 • 実行計画の結果は特に変わっていない • Athena がクエリする先の S3バケットも、昨日のクエリ対象のバケッ
トと今日の対象を見比べても、データ量に違いはあんまりない • 複数のクエリの実行時間の増大（2倍）を確認した • 色々手を尽くしたが、抜本的な改善はできなかった。 ◦ もはやこれまでか....AWSのサポートに連絡する Athenaの調子が悪い 48

解消した 49

• お問い合わせのお返事があり、詳細をやりとりした後... ◦ 本件事象の状況が改善する可能性のある修正が実施されました • 対応してくださったことがわかった ◦ 無事、元に戻った。 • 日頃のモニタリングが功を奏する形となった
◦ 従量課金に影響は出ずに、事故を防ぐことができた障害の翌日 50

• Glue crawlerの実行時間がだんだん延びてしまっていた • バケット全てをクロールする設定になっていた ◦ 増分クロールがあること
を忘れていた • 増分クロールに切り替え、実行時間が大幅に短縮こぼれ話 51

• その後、MackerelはOpenTelemetryのトレースに対応した • 商品が増えたので、改造作業を行うことになった • Firehoseを増設し、Athenaのクエリの設計を行う • RDSへ保存するテーブルを追加し、画面を作る • これまでの作業を成功パターンとして真似をすることで、高速な開発
ができたその後 52

今のdaifukucho 53

• Athenaによる集計処理がコアとなり、Mackerelの従量課金集計システムは作られています • Firehose、Athena、S3、RDS、API Gateway等、マネージドサービスを主体とした構成でメンテナンスフリーを達成しています • プロトタイピングで実装を本番環境に組み込み、実データを持ちいた開発工程を実現することで、実稼働さながらのクエリチューニング等
で手戻りを減らすことができましたまとめ 54

ご清聴ありがとうございました 55

クラウドネイティブに支える従量課金集計―Mackerel「daifukucho」の設計と運用

クラウドネイティブに支える従量課金集計―Mackerel「daifukucho」の設計と運用

More Decks by mackerelio

Other Decks in Technology

Featured

Transcript