Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オフィスビルを監視しよう:フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ / ...
Search
株式会社ビットキー / Bitkey Inc.
July 10, 2025
Technology
0
40
オフィスビルを監視しよう:フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ / Monitoring Office Buildings: The Challenge of Physical-Digital SLI/SLO Design & Operation
登壇者名:三河内 拓也
登壇したイベントタイトル:SRE NEXT 2025
登壇したイベントのURL:
https://sre-next.dev/2025/
株式会社ビットキー / Bitkey Inc.
July 10, 2025
Tweet
Share
More Decks by 株式会社ビットキー / Bitkey Inc.
See All by 株式会社ビットキー / Bitkey Inc.
事例で学ぶ!B2B SaaSにおけるSREの実践例/SRE for B2B SaaS: A Real-World Case Study
bitkey
0
18
整頓のジレンマとの戦い〜Tidy First?で振り返る事業とキャリアの歩み〜/Fighting the tidiness dilemma〜Business and Career Milestones Reflected on in Tidy First?〜
bitkey
3
17k
遠隔で同時に4人教育!? 〜リモート新人の「孤立」を防ぐオンボーディング事例〜/Educating 4 people at the same time remotely!〜Onboarding Case Studies to Prevent “Isolation” of Remote Newcomers〜
bitkey
0
54
ファームウェアは土管になるべきか 翻訳機になるべきか/Should firmware be a clay pipe or a translator?
bitkey
0
53
テストは合意形成をすべし!/Testing should be consensus building!
bitkey
0
63
Agentic Coding と 山登り と TypeScript〜体系的に考えてみよう!〜/Agentic Coding, Mountain Climbing and TypeScript~Let's think systematically!~
bitkey
0
250
"発信文化"をどうやって計測する?技術広報のKPI探索記/How do we measure communication culture?
bitkey
4
630
MCP でモノが動くとおもしろい/It is interesting when things move with MCP
bitkey
3
770
カオスに立ち向かう小規模チームの装備の選択〜フルスタックTSという装備の強み _ 弱み〜/Choosing equipment for a small team facing chaos ~ Strengths and weaknesses of full-stack TS~
bitkey
1
210
Other Decks in Technology
See All in Technology
生まれ変わった AWS Security Hub (Preview) を紹介 #reInforce_osaka / reInforce New Security Hub
masahirokawahara
0
480
Lakebaseを使ったAIエージェントを実装してみる
kameitomohiro
0
130
使いたいMCPサーバーはWeb APIをラップして自分で作る #QiitaBash
bengo4com
0
2k
Lufthansa ®️ USA Contact Numbers: Complete 2025 Support Guide
lufthanahelpsupport
0
200
ビズリーチにおけるリアーキテクティング実践事例 / JJUG CCC 2025 Spring
visional_engineering_and_design
1
130
敢えて生成AIを使わないマネジメント業務
kzkmaeda
2
450
マネジメントって難しい、けどおもしろい / Management is tough, but fun! #em_findy
ar_tama
7
1.1k
Core Audio tapを使ったリアルタイム音声処理のお話
yuta0306
0
190
IPA&AWSダブル全冠が明かす、人生を変えた勉強法のすべて
iwamot
PRO
2
150
無意味な開発生産性の議論から抜け出すための予兆検知とお金とAI
i35_267
5
13k
CRE Camp #1 エンジニアリングを民主化するCREチームでありたい話
mntsq
1
130
american airlines®️ USA Contact Numbers: Complete 2025 Support Guide
supportflight
1
110
Featured
See All Featured
How GitHub (no longer) Works
holman
314
140k
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
How to Think Like a Performance Engineer
csswizardry
25
1.7k
The Cost Of JavaScript in 2023
addyosmani
51
8.5k
Building a Modern Day E-commerce SEO Strategy
aleyda
42
7.4k
Scaling GitHub
holman
460
140k
The Straight Up "How To Draw Better" Workshop
denniskardys
234
140k
Typedesign – Prime Four
hannesfritz
42
2.7k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Designing Experiences People Love
moore
142
24k
Testing 201, or: Great Expectations
jmmastey
43
7.6k
Transcript
Copyright © 2025 Bitkey Inc. All right reserved. オフィスビルを監視しよう: フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ
株式会社ビットキー 三河内 拓也 2025.07.11 ※スライド内に登場する会社名・サービス名・製品名などは、それぞれの企業の商 標または登録商標です。無断での内容の改変・加工はご遠慮ください。
2 Copyright © 2025 Bitkey Inc. All right reserved. 突然ですが
3 Copyright © 2025 Bitkey Inc. All right reserved. 皆さんSLI/SLOを定義してますか?
4 Copyright © 2025 Bitkey Inc. All right reserved. してますよね!
5 Copyright © 2025 Bitkey Inc. All right reserved. すんなり定義できましたか?
6 Copyright © 2025 Bitkey Inc. All right reserved. 理想通りに運用できてますか?
7 Copyright © 2025 Bitkey Inc. All right reserved. 実際、考慮しないといけない
ポイントがいっぱいありますよね...
8 Copyright © 2025 Bitkey Inc. All right reserved. ビットキーも同様でした...
9 Copyright © 2025 Bitkey Inc. All right reserved. ビットキー特有の考慮ポイントを
一部紹介します
10 Copyright © 2025 Bitkey Inc. All right reserved. 様々な物理的な要因で解錠信号(Bluetooth通信)が
届きづらい時がある... ・距離が遠い ・中継機器の置き場所が悪い ・遮蔽物が分厚い、電波を通しづらい素材 etc
11 Copyright © 2025 Bitkey Inc. All right reserved. Client側のデバイス観点でも
考慮しないといけないポイントがある... BLE ・顔認証端末の電源が落ちていてる ・ビル制御盤と疎通出来ていない etc
12 Copyright © 2025 Bitkey Inc. All right reserved. 掲示されたポスターのQRコードが認証画面に映り込み、
延々に解錠失敗が記録される お客様のオフィスに掲示された ポスターのQRコード
13 Copyright © 2025 Bitkey Inc. All right reserved. これらはSLI計測に関する考慮ポイント
14 Copyright © 2025 Bitkey Inc. All right reserved. SLO運用においても
“モヤみ”ポイントがあります
15 Copyright © 2025 Bitkey Inc. All right reserved. “果たしてこのサービスレベルの
調査対応は開発マターなのか?”
16 Copyright © 2025 Bitkey Inc. All right reserved. 今回例に上げたモヤみは
”フィジカル”と”デジタル”に またがるサービスがゆえに起こり 得るものです
17 Copyright © 2025 Bitkey Inc. All right reserved. “デジタル”だけで完結しない分、
SLI/SLOをどう定義し、どう運用 するかには、定説にはない独自の 工夫が求められます
18 Copyright © 2025 Bitkey Inc. All right reserved. 今回はビルを監視するという
SLI/SLOにおいて、定説にはない Tipsを紹介していきます
19 Copyright © 2025 Bitkey Inc. All right reserved. ビットキーにデータアナリストとしてジョイン。
入社初年度から、プロダクト品質の可視化を担当。 この時、サービスレベルというプラクティスと出会う 自己紹介 三河内 拓也 Takuya Mikouchi 2017 2020 データコンサル企業でデータアナリストとしてのキャ リアをスタート。様々な業界のデータ活用プロジェク トに従事 2025 現在もSREチームと共にサービスレベルの計測と運用 を推進
20 Copyright © 2025 Bitkey Inc. All right reserved. Outline
1. ビルモニタリングにおいて定義したSLI 2. ビルモニタリングで得られた5つのTips 1. CUJ(Critical User Journey)は普遍である 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち 3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? 5. CS(いわゆる顧客対応チームのこと)を巻き込んだSLO運用のポイント 3. まとめ
21 Copyright © 2025 Bitkey Inc. All right reserved. 1.
ビルモニタリングにおいて定義したSLI
None
23 Copyright © 2025 Bitkey Inc. All right reserved. プロダクトはhomehubとworkhubの2つ。
本日お話しするworkhubは、働く空間にまつわる体験のDXを実現 1. ビルモニタリングにおいて定義したSLI フレキシブル オフィス オフィス テナント テンポラリーユー ス ビル(オーナー) ワーカー 不動産管理会社 マンション オーナー 管理組合 デベロッパー 居住者 暮らしサービス デリバリー会社 対象カスタマー/ユーザー
24 Copyright © 2025 Bitkey Inc. All right reserved. workhubの機能群
1. ビルモニタリングにおいて定義したSLI 共通 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 スマートロッカー 混雑判定 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 個室ブース運営 パブリックアカウント 地図で検索 ⽬的で検索 正式提供開始 フレキシブルオフィス オフィステナント テンポラリーユース ビル(オーナー) さらなる 拡張 さらなる 拡張
25 Copyright © 2025 Bitkey Inc. All right reserved. ビルに導入する場合によく提供している機能
1. ビルモニタリングにおいて定義したSLI 共通 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 スマートロッカー 混雑判定 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 個室ブース運営 パブリックアカウント 地図で検索 ⽬的で検索 正式提供開始 フレキシブルオフィス オフィステナント テンポラリーユース ビル(オーナー) さらなる 拡張 さらなる 拡張
26 Copyright © 2025 Bitkey Inc. All right reserved. 1.
ビルモニタリングにおいて定義したSLI 多様な機能群から、SLIとして定義したい体験・機能を整理 今回は、フラッパーゲート 及び ビル共用部→テナント専有部への顔・QR認証による出入りを選定 「テナント専有部」への出入り フラッパーゲートなど 「ビルエントランス」の出入り 業務開始
27 Copyright © 2025 Bitkey Inc. All right reserved. 選定した体験フローをベースに、顔認証成功率/QR認証成功率の2つのSLIを定義
1. ビルモニタリングにおいて定義したSLI 顔認証成功率 認証後、カギまたは扉が開いた回数/ 認証端末に顔をかざした回数 QR認証成功率 認証後、カギまたは扉が開いた回数/ 認証端末にQRをかざした回数 ※補足:出入りの体験の気持ちよさとして、認証→ 解施錠にかかった時間もSLIとして計測してます。 が、単純化のため本発表では割愛しています 「テナント専有部」への出入り フラッパーゲートなど 「ビルエントランス」の出入り 業務開始
28 Copyright © 2025 Bitkey Inc. All right reserved. 定義されたSLIは、DatadogでSLOを設定し、エラーバジェットベースのアラートを作成し監視運用中
※あくまで社内的な目標値としてSLOを運用中 1. ビルモニタリングにおいて定義したSLI
29 Copyright © 2025 Bitkey Inc. All right reserved. 2.
ビルモニタリングで得られた5つのTips
30 Copyright © 2025 Bitkey Inc. All right reserved. 本題に行く前に、、、このTipsで伝えたいこと
2. ビルモニタリングで得られた5つのTips 【To SREの皆さん】 サービス特性に応じてSLI/SLOの設計や運用はチューニングの余地があるのでは? 【To フィジカル×デジタルなサービスに従事するSREの皆さん】 難しさはあるが、工夫次第でSLI/SLOの運用は可能
31 Copyright © 2025 Bitkey Inc. All right reserved. Tips1
CUJ(Critical User Journey)は普遍である 設計
32 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの課題:多様な機能が内包され、どの機能も重要かつ監視しがいがあり、監視指標の
選定が難しい 1. CUJ(Critical User Journey)は普遍である 共通 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 スマートロッカー 混雑判定 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 個室ブース運営 パブリックアカウント 地図で検索 ⽬的で検索 正式提供開始 フレキシブルオフィス オフィステナント テンポラリーユース ビル(オーナー) さらなる 拡張 さらなる 拡張
33 Copyright © 2025 Bitkey Inc. All right reserved. 解決策:CUJ(Critical
User Journey)を整理すること。開発者視点では監視すべき体験の目線合わせが ができる。そして、それは自然とユーザのコア体験の信頼性の定義となるというメリットを持つ 1. CUJ(Critical User Journey)は普遍である 「テナント専有部」への出入り フラッパーゲートなど 「ビルエントランス」の出入り 業務開始
34 Copyright © 2025 Bitkey Inc. All right reserved. ユーザー⇔システムの詳細なフロー図を整理することで、フィジカル特有の誤動作や例外を洗い出し、
より堅牢なSLIの定義 や ログ設計が可能になる 1. CUJ(Critical User Journey)は普遍である ログ設計・実装→計測へ ユーザの目的は達成できてないが、 あえて成功にしたい動作もリストアップ 詳細フロー ※登壇用に簡略化しています 誤動作や例外を考慮したより堅牢なSLIの算出式
35 Copyright © 2025 Bitkey Inc. All right reserved. Tips1のまとめ
1. CUJ(Critical User Journey)は普遍である CUJを整理することで、目線の揃った監視指標を定義できる これは”フィジカル”と”デジタル”にまたがるサービスにおいても普遍 更に詳細な体験と処理のフローを整理することで、より堅牢なSLIを定義できる ”デジタル”だけで完結するサービスでも、多様な機能を内包していたり、 外部システムとの連携が絡むなど、複雑性の高いシステムの場合などでは有用
36 Copyright © 2025 Bitkey Inc. All right reserved. モノも含めたSLI設計の難しさ:
前提となる「モノ」の監視は見落としがち 設計 Tips2
37 Copyright © 2025 Bitkey Inc. All right reserved. 今回定義したCUJとSLI(再掲)
2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち 顔認証成功率 認証後、カギまたは扉が開いた回数/ 認証端末に顔をかざした回数 QR認証成功率 認証後、カギまたは扉が開いた回数/ 認証端末にQRをかざした回数 「テナント専有部」への出入り フラッパーゲートなど 「ビルエントランス」の出入り 業務開始
38 Copyright © 2025 Bitkey Inc. All right reserved. iPadの電源が落ちている
このSLIは実は見落としがあり、そもそも顔・QRを端末にかざせなくなる状況が考慮されていない アプリが落ちている ビル制御システムと疎通できてない ためメンテナンスモードに 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち
39 Copyright © 2025 Bitkey Inc. All right reserved. iPadの電源が落ちている
ユーザ体験を考えた時に、体験の前提となる「モノ」の状態の監視が必要になってくる アプリが落ちている ビル制御システムと疎通できてない ためメンテナンスモードに 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち
40 Copyright © 2025 Bitkey Inc. All right reserved. 弊社では、物理デバイスの死活監視、物理デバイス間の連携に関するSLIを定めて監視している
死活監視 SLI:ビル制御システムとの疎通率 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち iPadの電源が落ちている アプリが落ちている ビル制御システムと疎通できてない ためメンテナンスモードに
41 Copyright © 2025 Bitkey Inc. All right reserved. モノを監視するSLIはclient側からbackendに一定間隔でheartbeatを飛ばし続けることで実現
2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち Cloud Run Pub/Sub heartbeat
42 Copyright © 2025 Bitkey Inc. All right reserved. Tips2のまとめ
“フィジカル”がまたがるサービスにおいては、モノが動いているか?といった、 体験の前提となる状況が満たされているかも、サービスレベルを定義できると良い 上記は体験のサービスレベルとは分けて定義・計測するとシンプル 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち
43 Copyright © 2025 Bitkey Inc. All right reserved. Tips3
DatadogでのID単位のSLO監視は、SLOベースのMonitor ではなくMetricベースのMonitorで実現 計測 ツール
44 Copyright © 2025 Bitkey Inc. All right reserved. 前提:弊社が利用しているDatadogにはSLOsというサービスが存在しており、SLI/SLOの設定と
Monitor(アラート)設定を行うことができる 3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 Datadog公式ドキュメントより
45 Copyright © 2025 Bitkey Inc. All right reserved. 前提:ビルモニタリングの特性
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 SLIの低下要因
46 Copyright © 2025 Bitkey Inc. All right reserved. 前提:ビルモニタリングの特性
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 機能単位やシステム全体でSLIが下 がることは稀 SLIの低下要因 ビルモニタリングの特性
47 Copyright © 2025 Bitkey Inc. All right reserved. 前提:ビルモニタリングの特性
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 機能単位やシステム全体でSLIが下 がることは稀 ↓ ビルや出入り口の単位で成功率が下 がったり、元々低かったりする傾向 がある SLIの低下要因 ビルモニタリングの特性
48 Copyright © 2025 Bitkey Inc. All right reserved. 前提:ビルモニタリングの特性
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 機能単位やシステム全体でSLIが下 がることは稀 ↓ ビルや出入り口の単位で成功率が下 がったり、元々低かったりする傾向 がある ↓ ビルという単位でSLOを割った際に アラートを設定したい SLIの低下要因 ビルモニタリングの特性
49 Copyright © 2025 Bitkey Inc. All right reserved. SLOsの導線で設定したMonitorでは、指標全体の監視はできるが、ID単位(Group単位)のアラート通知
が設定できなかった(2025 H1時点 登壇者調べ) 3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 Datadog公式ドキュメントより
50 Copyright © 2025 Bitkey Inc. All right reserved. MetricベースのMonitorを採用し、ビルID単位でのSLO監視を実現し対処
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 Monitors > New Monitor > Metricを選択 Aggregation > Multi Alert設定をすることでID(Group) 単位でのアラート設定が可能
51 Copyright © 2025 Bitkey Inc. All right reserved. ハマりポイント:7日間レンジのSLIを計測した際に、Metricの計測タイミングの仕様?に影響されて、
意図した計算結果に中々ならなかった... 3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 - Monitorを用いた代替運用の紹介:moving_rollback, with lookback, Evaluation Details などの設定 今回は試行錯誤の結果、moving_rollup関数を設定 / 過去10分間の平均値で評価 / 「as rate」を採用し計測を安定化
52 Copyright © 2025 Bitkey Inc. All right reserved. Tips3のまとめ
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 ID単位でSLOを監視したい場合は、MetricベースのMonitorを使おう (SLOsベースでもできるようにしてほしいけど・・・) Datadog Monitorの仕組みを理解して意図通りの計測するとより堅牢なSLIになる
53 Copyright © 2025 Bitkey Inc. All right reserved. Tips4
「SLOを毀損したら、初手SREまたは開発チームが動く」 は本当に正解か? 運用 組織
54 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? SLIの低下要因
55 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す SLIの低下要因 SLIが下がったときの調査
56 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 認証成功率の低下要因 SLIが下がったときの調査
57 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 🗣 調査者「現地行って電波強度を測定してきま す!」 ※もちろん施工時に検査するが、それでも調整が入ることがある 🗣 調査者「実は計画停電だったので問題ないやつ でした」 🗣 調査者「なんかQRコードがずっと映り込んで たりしませんか?」 ※流石にログを改善したので今は失敗扱いされないが、過去何度かあったケース 認証成功率の低下要因 SLIが下がったときの調査
58 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? 認証成功率の低下要因 SLIが下がったときの調査 初手の調査内容はフィジカル側に寄る ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 🗣 調査者「現地行って電波強度を測定してきま す!」 ※もちろん施工時に検査するが、それでも調整が入ることがある 🗣 調査者「実は計画停電だったので問題ないやつ でした」 🗣 調査者「なんかQRコードがずっと映り込んで たりしませんか?」 ※流石にログを改善したので今は失敗扱いされないが、過去何度かあったケース
59 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? 認証成功率の低下要因 これらは初手 開発者が調査するのが効率的だろうか? ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 🗣 調査者「現地行って電波強度を測定してきま す!」 ※もちろん施工時に検査するが、それでも調整が入ることがある 🗣 調査者「実は計画停電だったので問題ないやつ でした」 🗣 調査者「なんかQRコードがずっと映り込んで たりしませんか?」 ※流石にログを改善したので今は失敗扱いされないが、過去何度かあったケース SLIが下がったときの調査
60 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? 認証成功率の低下要因 SLIが下がったときの調査 NOですよね ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 🗣 調査者「現地行って電波強度を測定してきま す!」 ※もちろん施工時に検査するが、それでも調整が入ることがある 🗣 調査者「実は計画停電だったので問題ないやつ でした」 🗣 調査者「なんかQRコードがずっと映り込んで たりしませんか?」 ※流石にログを改善したので今は失敗扱いされないが、過去何度かあったケース
61 Copyright © 2025 Bitkey Inc. All right reserved. 弊社は”ビルモニタリングにおいては”初手CSがフィジカル領域の調査をする体制を構築
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か?
62 Copyright © 2025 Bitkey Inc. All right reserved. Tips4のまとめ
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? ※補足①:一方でObservabilityの向上 や ドメイン知識獲得のための工夫 を突き詰めるという方向性もアリだと思う ※補足②:もちろんビットキーにも、APIのエラー率など開発者やSREが主導して対応するSLOも多々ある ビルモニタリングの例のように、サービスやプロダクトの特性によっては、 初手の調査対応の適任者が開発者やSREではないケースがありそう そういった場合、柔軟にSLOの運用フローを再構築するのも選択肢として取りうる
63 Copyright © 2025 Bitkey Inc. All right reserved. Tips5
CSを巻き込んだSLO運用のポイント ツール 運用 組織
64 Copyright © 2025 Bitkey Inc. All right reserved. 弊社の”ビルモニタリング”においてはCSが初手の調査対応を担っている。
このフローには、いくつか定着のための工夫ポイントがあるため紹介していく 5. CSを巻き込んだSLO運用のポイント
65 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント①:経験上、運用の定着には既存の業務に寄り添うことが肝要。
CSも含むインシデント対応に活用されていたWaroomとSlackを中心としたアーキテクチャを採用 5. CSを巻き込んだSLO運用のポイント
66 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント②:調査対応内容をWaroomのRunbook機能を用いて再現性を向上
5. CSを巻き込んだSLO運用のポイント
67 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント②:調査対応内容をWaroomのRunbook機能を用いることで再現性を向上
5. CSを巻き込んだSLO運用のポイント
68 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント③:ダッシュボードでは、見る人の認知負荷を考慮しSummary
> Transition > Detailと いうレイアウトを意識 5. CSを巻き込んだSLO運用のポイント
69 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント③:ダッシュボードでは、見る人の認知負荷を考慮しSummary
> Transition > Detailと いうレイアウトを意識 5. CSを巻き込んだSLO運用のポイント Summary (ぱっと見たい情報) Title Filter Transition (時系列の分析軸) Detail (その他の分析軸) 構成 ビルモニタリングダッシュボード(イメージ) ※Datadogはカードに時系列グラフを 重ねられるので、それで表現 ログ一覧や補 足的な時系列 情報を可視化
70 Copyright © 2025 Bitkey Inc. All right reserved. Tips5のまとめ
5. CSを巻き込んだSLO運用のポイント 運用の定着には、その主体となる人の既存の業務フローに寄り添うことが肝要 (Waroom × Slackを中心としたアーキテクチャ) 開発者が慣れているツールを運用に使う場合、 どう使ってほしいかをガイドしてあげることが定着を助ける (Waroom Runbook機能、Datadogダッシュボードの統一的なレイアウト)
71 Copyright © 2025 Bitkey Inc. All right reserved. 3.
Conclusion
72 Copyright © 2025 Bitkey Inc. All right reserved. 1
CUJは普遍か? CUJはフィジカル領域が絡むサービスでも有用でした。特に複雑なサービスにおいては普遍と思われます 2 SLIは体験の計測のみで十分か? フィジカル領域が絡むサービスの場合、必要に応じて前提となる「モノ」や「状態」も監視しましょう 3 DatadogでのSLOの監視はDatadog SLOsを用いればよいか? 現状はビル単位のようなID単位でアラートを通知したい場合は、Datadog Monitorを使う必要があります 4 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? サービスの特性に応じて、柔軟にSLO運用フローを構築するのも選択肢として取りうるのではと考えてます 5 SLO運用が定着するには? 最後に次のスライド以降で語ろうと思います... Conclusion
73 Copyright © 2025 Bitkey Inc. All right reserved. “SLOは単なるデータである
” * オライリー・ジャパン「 SLO サービスレベル目標」 の P15 より参照 Conclusion:SLO運用が定着するには?
74 Copyright © 2025 Bitkey Inc. All right reserved. “データ”(≒SLI/SLO)を作る際は、ユーザの動きや取り巻く状況に
ディープダイブして、より有意義なデータを作りましょう ”データ”の定着という観点では、 “活用者”中心の運用設計やツール選定をすることを突き詰めましょう Conclusion:SLO運用が定着するには?
75 Copyright © 2025 Bitkey Inc. All right reserved. End
of file