Slide 1

Slide 1 text

事例で学ぶ! B2B SaaSにおけるSREの実践例 株式会社ビットキー 星野貴信 2025.07.11 / SRE NEXT 2025 ランチスポンサーセッション ハッシュタグ #srenext_c

Slide 2

Slide 2 text

星野貴信 X @0x11FE SRE 2022年11月株式会社ビットキー入社 主にオブザーバビリティ、CI/CD、IaC周りを 担当 2

Slide 3

Slide 3 text

スポンサーランチセッションこれだけ覚えてください! この後13:00からTrackBでビットキー三河内が発表します 隣の部屋になります。ぜひ聴きに来てください! 3

Slide 4

Slide 4 text

1. はじめに 2. 事例1: 基幹システム連携のパフォーマンス計測 3. 事例2: 特定顧客のテレメトリデータがSLIに影響を与える 4. まとめ 5. 関連セッションと合同アフターイベントのお知らせ 目次 4

Slide 5

Slide 5 text

1. はじめに 5

Slide 6

Slide 6 text

6

Slide 7

Slide 7 text

「つなげよう。人は、もっと自由になれる」 このセッションでは、ビットキーが提供するサービスのつなげるをSREの事例を通して 紹介します 事例を通して視聴者の皆さんにつながりを感じてもらいます ランチセッションの後に予定されているビットキーセッションにつながることを目指し ます はじめに 7

Slide 8

Slide 8 text

ビットキーの会社紹介をする際は、 「スマートロックの会社」 、 「IoTの会社」と紹介することが 多く、すでに会社をご存知の方もそのようなイメージの持っていることが多いと想像します しかしながら、いわゆる普通のWebアプリケーションやモバイルアプリケーションも提供す るサービスの中核を担っています ビットキーのSREチームは現在、B2B SaaS領域のうち、Webアプリケーション領域を中心に 活動しており、事例から活動内容の一端を紹介します はじめに 8

Slide 9

Slide 9 text

1. はじめに 2. 事例1: 基幹システム連携のパフォーマンス計測 3. 事例2: 特定顧客のテレメトリデータがSLIに影響を与える 4. まとめ 5. 関連セッションと合同アフターイベントのお知らせ 目次再掲 9

Slide 10

Slide 10 text

事例1: 基幹システム連携のパフォーマンス 計測 10

Slide 11

Slide 11 text

B2B SaaSにおいて、顧客の基幹システム連携は頻出する要件と個人的に考えています ビットキーが提供するhomehubにおいて、基幹システム連携のAPIレイテンシをSLIとして計 測することを軸に、サービスの安定稼働へ繋げた事例を紹介します 事例1: 基幹システム連携のパフォーマンス計測 11

Slide 12

Slide 12 text

ビットキーが提供するhomehubで賃貸向けに提供するサービスの1つに、1日1回基幹シ ステムと連携し、データを取得するコンポーネントがあります 賃貸の特性上、引越しシーズンの繁忙期に当たる3月末に基幹システムの連携データ数が 大幅に増加します 一定時間内に基幹システムとの連携処理を完了できない場合にシステムエラーに繋がっ てしまうため、パフォーマンスを計測して改善する活動を始めました 事例1: 基幹システム連携のパフォーマンス計測 12

Slide 13

Slide 13 text

# 事例1: 基幹システム連携のパフ ォーマンス計測 過去のデータを元に繁忙期のデータ連携 数を予測し、APIレスポンスのレイテンシを 掛け合わせてバジェットを算出しました 算出したバジェットを元に、SLOを設定 したところ、当時のレイテンシでは十分なサ ービスレベルではないと予測できました レイテンシの改善と、その後の継続的な モニタリングによるデグレの監視により、繁 忙期を無事に乗り切ることができました 13

Slide 14

Slide 14 text

この事例から伝えたいこと ビットキーのサービスは時には基幹システムともつながることで快適なサービス体験を 提供しています B2B SaaSにおいて、基幹システム連携はよくある要件であると予想しており、外部シス テム連携のパフォーマンスも計測していくことで安定したサービス稼働につながります プレモーテムを行うことで、繁忙期の予測を立てることができ、事前に対策を打つこと ができます また、ランチタイム明けのビットキーセッションは隣の部屋のTrackBになります 事例1: 基幹システム連携のパフォーマンス計測 14

Slide 15

Slide 15 text

事例2: 特定顧客のテレメトリデータがSLI に影響を与える 15

Slide 16

Slide 16 text

ビットキーのworkhubでは、iPhone/iPad上に顔認証用の専用アプリケーションを展開してい ます 顔認証用デバイスの設置数は顧客によって大きく異なり、その数字の差がSLIの設計に影響を 与えるため、対策した事例を紹介します 事例2: 特定顧客のテレメトリデータがSLIに影響を与える 16

Slide 17

Slide 17 text

事例2: 特定顧客のテレメトリデータがSLIに影響を与える 顔認証アプリが利用するあるAPIエンドポ イントのリクエストログを顧客別に上位5件 まで表示しました TOP1だけで25%以上でTOP5で50%以上 になることがわかります 17

Slide 18

Slide 18 text

事例2: 特定顧客のテレメトリデータがSLIに影響を与える シンプルにAPIエンドポイント全体の成功 率と失敗率をベースにSLIにするとリクエス トボリュームの大きい顧客のエラーは検知し やすいが、相対的に小さい顧客は目立たなく なってしまいます このケースでは顧客毎にリクエストの成 功率をSLIとして定義しました 18

Slide 19

Slide 19 text

一般に顧客毎の細かいSLIを定義すると、同時にアラートも線形に増えていくため、アラート 疲れを起こしやすくアンチパターンに見えることもあります しかしながら、B2B SaaSでは顧客毎にリクエストボリュームが大きく異なるため、特性に合 わせて個別にSLIを定義する判断をしています また、今回は一例としてログを挙げましたが、トレースについても同じ状況が発生していま す 今後の展望としてトレースデータはコスト負担やノイズになるデータはAPIエンドポイント毎 にヘッドベースサンプリングとテイルベースサンプリングを組みあわせて、分析しやすい状 態を目指しています 事例2: 特定顧客のテレメトリデータがSLIに影響を与える 19

Slide 20

Slide 20 text

この事例から伝えたいこと ビットキーでは多数の顔認証アプリが稼働しており、それぞれテレメトリデータを収集 しています B2B SaaSでは顧客毎のリクエストボリュームに傾斜がかかることが多いため、テレメト リデータを愚直に集計してSLIにすると有意な指標にならないことがあります 一見するとアンチパターンにも見える顧客毎のSLIを定義することも時には必要になりま す また、ランチタイム明けのビットキーセッションは隣の部屋のTrackBになります 事例2: 特定顧客のテレメトリデータがSLIに影響を与える 20

Slide 21

Slide 21 text

まとめ 21

Slide 22

Slide 22 text

ビットキーのSREチームは、2025年の時点では提供サービスのうちB2B SaaSのWebア プリケーション領域を中心に活動しています B2B SaaSは、B2Bのサービス特性があり、特性に合わせたチューニングがより良い指標 の設計につながります このセッションでは触れなかったIoT、フィジカル領域の活動については、この後のセッ ションで詳しく紹介しています まとめ 22

Slide 23

Slide 23 text

この後13:00からTrackBでビットキーのセッションがあります 7/29(火)に8社合同のアフターイベントを開催します いずれもよろしくお願いします! 関連セッションと合同アフターイベントのお知らせ 23