Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
オフィスビルを監視しよう:フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ / ...
Search
株式会社ビットキー / Bitkey Inc.
July 10, 2025
Technology
0
47
オフィスビルを監視しよう:フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ / Monitoring Office Buildings: The Challenge of Physical-Digital SLI/SLO Design & Operation
登壇者名:三河内 拓也
登壇したイベントタイトル:SRE NEXT 2025
登壇したイベントのURL:
https://sre-next.dev/2025/
株式会社ビットキー / Bitkey Inc.
July 10, 2025
Tweet
Share
More Decks by 株式会社ビットキー / Bitkey Inc.
See All by 株式会社ビットキー / Bitkey Inc.
事例で学ぶ!B2B SaaSにおけるSREの実践例/SRE for B2B SaaS: A Real-World Case Study
bitkey
0
27
整頓のジレンマとの戦い〜Tidy First?で振り返る事業とキャリアの歩み〜/Fighting the tidiness dilemma〜Business and Career Milestones Reflected on in Tidy First?〜
bitkey
3
17k
遠隔で同時に4人教育!? 〜リモート新人の「孤立」を防ぐオンボーディング事例〜/Educating 4 people at the same time remotely!〜Onboarding Case Studies to Prevent “Isolation” of Remote Newcomers〜
bitkey
0
54
ファームウェアは土管になるべきか 翻訳機になるべきか/Should firmware be a clay pipe or a translator?
bitkey
0
53
テストは合意形成をすべし!/Testing should be consensus building!
bitkey
0
63
Agentic Coding と 山登り と TypeScript〜体系的に考えてみよう!〜/Agentic Coding, Mountain Climbing and TypeScript~Let's think systematically!~
bitkey
0
250
"発信文化"をどうやって計測する?技術広報のKPI探索記/How do we measure communication culture?
bitkey
4
630
MCP でモノが動くとおもしろい/It is interesting when things move with MCP
bitkey
3
770
カオスに立ち向かう小規模チームの装備の選択〜フルスタックTSという装備の強み _ 弱み〜/Choosing equipment for a small team facing chaos ~ Strengths and weaknesses of full-stack TS~
bitkey
1
210
Other Decks in Technology
See All in Technology
KubeCon + CloudNativeCon Japan 2025 Recap by CA
ponkio_o
PRO
0
300
生まれ変わった AWS Security Hub (Preview) を紹介 #reInforce_osaka / reInforce New Security Hub
masahirokawahara
0
480
LLM時代の検索
shibuiwilliam
2
200
対話型音声AIアプリケーションの信頼性向上の取り組み
ivry_presentationmaterials
1
120
データグループにおけるフロントエンド開発
lycorptech_jp
PRO
1
110
Lufthansa ®️ USA Contact Numbers: Complete 2025 Support Guide
lufthanahelpsupport
0
200
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
27k
OPENLOGI Company Profile for engineer
hr01
1
34k
Claude Code に プロジェクト管理やらせたみた
unson
6
4.3k
マネジメントって難しい、けどおもしろい / Management is tough, but fun! #em_findy
ar_tama
7
1.1k
AWS認定を取る中で感じたこと
siromi
1
190
OSSのSNSツール「Misskey」をさわってみよう(右下ワイプで私のOSCの20年を振り返ります) / 20250705-osc2025-do
akkiesoft
0
170
Featured
See All Featured
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
34
5.9k
The Language of Interfaces
destraynor
158
25k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Into the Great Unknown - MozCon
thekraken
40
1.9k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
820
The Cult of Friendly URLs
andyhume
79
6.5k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.9k
Testing 201, or: Great Expectations
jmmastey
43
7.6k
Designing for humans not robots
tammielis
253
25k
Facilitating Awesome Meetings
lara
54
6.4k
Transcript
Copyright © 2025 Bitkey Inc. All right reserved. オフィスビルを監視しよう: フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ
株式会社ビットキー 三河内 拓也 2025.07.11 ※スライド内に登場する会社名・サービス名・製品名などは、それぞれの企業の商 標または登録商標です。無断での内容の改変・加工はご遠慮ください。
2 Copyright © 2025 Bitkey Inc. All right reserved. 突然ですが
3 Copyright © 2025 Bitkey Inc. All right reserved. 皆さんSLI/SLOを定義してますか?
4 Copyright © 2025 Bitkey Inc. All right reserved. してますよね!
5 Copyright © 2025 Bitkey Inc. All right reserved. すんなり定義できましたか?
6 Copyright © 2025 Bitkey Inc. All right reserved. 理想通りに運用できてますか?
7 Copyright © 2025 Bitkey Inc. All right reserved. 実際、考慮しないといけない
ポイントがいっぱいありますよね...
8 Copyright © 2025 Bitkey Inc. All right reserved. ビットキーも同様でした...
9 Copyright © 2025 Bitkey Inc. All right reserved. ビットキー特有の考慮ポイントを
一部紹介します
10 Copyright © 2025 Bitkey Inc. All right reserved. 様々な物理的な要因で解錠信号(Bluetooth通信)が
届きづらい時がある... ・距離が遠い ・中継機器の置き場所が悪い ・遮蔽物が分厚い、電波を通しづらい素材 etc
11 Copyright © 2025 Bitkey Inc. All right reserved. Client側のデバイス観点でも
考慮しないといけないポイントがある... BLE ・顔認証端末の電源が落ちていてる ・ビル制御盤と疎通出来ていない etc
12 Copyright © 2025 Bitkey Inc. All right reserved. 掲示されたポスターのQRコードが認証画面に映り込み、
延々に解錠失敗が記録される お客様のオフィスに掲示された ポスターのQRコード
13 Copyright © 2025 Bitkey Inc. All right reserved. これらはSLI計測に関する考慮ポイント
14 Copyright © 2025 Bitkey Inc. All right reserved. SLO運用においても
“モヤみ”ポイントがあります
15 Copyright © 2025 Bitkey Inc. All right reserved. “果たしてこのサービスレベルの
調査対応は開発マターなのか?”
16 Copyright © 2025 Bitkey Inc. All right reserved. 今回例に上げたモヤみは
”フィジカル”と”デジタル”に またがるサービスがゆえに起こり 得るものです
17 Copyright © 2025 Bitkey Inc. All right reserved. “デジタル”だけで完結しない分、
SLI/SLOをどう定義し、どう運用 するかには、定説にはない独自の 工夫が求められます
18 Copyright © 2025 Bitkey Inc. All right reserved. 今回はビルを監視するという
SLI/SLOにおいて、定説にはない Tipsを紹介していきます
19 Copyright © 2025 Bitkey Inc. All right reserved. ビットキーにデータアナリストとしてジョイン。
入社初年度から、プロダクト品質の可視化を担当。 この時、サービスレベルというプラクティスと出会う 自己紹介 三河内 拓也 Takuya Mikouchi 2017 2020 データコンサル企業でデータアナリストとしてのキャ リアをスタート。様々な業界のデータ活用プロジェク トに従事 2025 現在もSREチームと共にサービスレベルの計測と運用 を推進
20 Copyright © 2025 Bitkey Inc. All right reserved. Outline
1. ビルモニタリングにおいて定義したSLI 2. ビルモニタリングで得られた5つのTips 1. CUJ(Critical User Journey)は普遍である 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち 3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? 5. CS(いわゆる顧客対応チームのこと)を巻き込んだSLO運用のポイント 3. まとめ
21 Copyright © 2025 Bitkey Inc. All right reserved. 1.
ビルモニタリングにおいて定義したSLI
None
23 Copyright © 2025 Bitkey Inc. All right reserved. プロダクトはhomehubとworkhubの2つ。
本日お話しするworkhubは、働く空間にまつわる体験のDXを実現 1. ビルモニタリングにおいて定義したSLI フレキシブル オフィス オフィス テナント テンポラリーユー ス ビル(オーナー) ワーカー 不動産管理会社 マンション オーナー 管理組合 デベロッパー 居住者 暮らしサービス デリバリー会社 対象カスタマー/ユーザー
24 Copyright © 2025 Bitkey Inc. All right reserved. workhubの機能群
1. ビルモニタリングにおいて定義したSLI 共通 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 スマートロッカー 混雑判定 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 個室ブース運営 パブリックアカウント 地図で検索 ⽬的で検索 正式提供開始 フレキシブルオフィス オフィステナント テンポラリーユース ビル(オーナー) さらなる 拡張 さらなる 拡張
25 Copyright © 2025 Bitkey Inc. All right reserved. ビルに導入する場合によく提供している機能
1. ビルモニタリングにおいて定義したSLI 共通 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 スマートロッカー 混雑判定 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 個室ブース運営 パブリックアカウント 地図で検索 ⽬的で検索 正式提供開始 フレキシブルオフィス オフィステナント テンポラリーユース ビル(オーナー) さらなる 拡張 さらなる 拡張
26 Copyright © 2025 Bitkey Inc. All right reserved. 1.
ビルモニタリングにおいて定義したSLI 多様な機能群から、SLIとして定義したい体験・機能を整理 今回は、フラッパーゲート 及び ビル共用部→テナント専有部への顔・QR認証による出入りを選定 「テナント専有部」への出入り フラッパーゲートなど 「ビルエントランス」の出入り 業務開始
27 Copyright © 2025 Bitkey Inc. All right reserved. 選定した体験フローをベースに、顔認証成功率/QR認証成功率の2つのSLIを定義
1. ビルモニタリングにおいて定義したSLI 顔認証成功率 認証後、カギまたは扉が開いた回数/ 認証端末に顔をかざした回数 QR認証成功率 認証後、カギまたは扉が開いた回数/ 認証端末にQRをかざした回数 ※補足:出入りの体験の気持ちよさとして、認証→ 解施錠にかかった時間もSLIとして計測してます。 が、単純化のため本発表では割愛しています 「テナント専有部」への出入り フラッパーゲートなど 「ビルエントランス」の出入り 業務開始
28 Copyright © 2025 Bitkey Inc. All right reserved. 定義されたSLIは、DatadogでSLOを設定し、エラーバジェットベースのアラートを作成し監視運用中
※あくまで社内的な目標値としてSLOを運用中 1. ビルモニタリングにおいて定義したSLI
29 Copyright © 2025 Bitkey Inc. All right reserved. 2.
ビルモニタリングで得られた5つのTips
30 Copyright © 2025 Bitkey Inc. All right reserved. 本題に行く前に、、、このTipsで伝えたいこと
2. ビルモニタリングで得られた5つのTips 【To SREの皆さん】 サービス特性に応じてSLI/SLOの設計や運用はチューニングの余地があるのでは? 【To フィジカル×デジタルなサービスに従事するSREの皆さん】 難しさはあるが、工夫次第でSLI/SLOの運用は可能
31 Copyright © 2025 Bitkey Inc. All right reserved. Tips1
CUJ(Critical User Journey)は普遍である 設計
32 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの課題:多様な機能が内包され、どの機能も重要かつ監視しがいがあり、監視指標の
選定が難しい 1. CUJ(Critical User Journey)は普遍である 共通 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 スマートロッカー 混雑判定 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 会員向け検索予約 契約‧会員管理 決済エンジン 請求‧⼊⾦管理 スマートロック 受付 顔認証 制御盤連携 会議室予約 位置検知 スマートロッカー 混雑判定 BACNet連携 座席予約 稼働率レポート マルチテナント エレベーター ビル総合受付 個室ブース運営 パブリックアカウント 地図で検索 ⽬的で検索 正式提供開始 フレキシブルオフィス オフィステナント テンポラリーユース ビル(オーナー) さらなる 拡張 さらなる 拡張
33 Copyright © 2025 Bitkey Inc. All right reserved. 解決策:CUJ(Critical
User Journey)を整理すること。開発者視点では監視すべき体験の目線合わせが ができる。そして、それは自然とユーザのコア体験の信頼性の定義となるというメリットを持つ 1. CUJ(Critical User Journey)は普遍である 「テナント専有部」への出入り フラッパーゲートなど 「ビルエントランス」の出入り 業務開始
34 Copyright © 2025 Bitkey Inc. All right reserved. ユーザー⇔システムの詳細なフロー図を整理することで、フィジカル特有の誤動作や例外を洗い出し、
より堅牢なSLIの定義 や ログ設計が可能になる 1. CUJ(Critical User Journey)は普遍である ログ設計・実装→計測へ ユーザの目的は達成できてないが、 あえて成功にしたい動作もリストアップ 詳細フロー ※登壇用に簡略化しています 誤動作や例外を考慮したより堅牢なSLIの算出式
35 Copyright © 2025 Bitkey Inc. All right reserved. Tips1のまとめ
1. CUJ(Critical User Journey)は普遍である CUJを整理することで、目線の揃った監視指標を定義できる これは”フィジカル”と”デジタル”にまたがるサービスにおいても普遍 更に詳細な体験と処理のフローを整理することで、より堅牢なSLIを定義できる ”デジタル”だけで完結するサービスでも、多様な機能を内包していたり、 外部システムとの連携が絡むなど、複雑性の高いシステムの場合などでは有用
36 Copyright © 2025 Bitkey Inc. All right reserved. モノも含めたSLI設計の難しさ:
前提となる「モノ」の監視は見落としがち 設計 Tips2
37 Copyright © 2025 Bitkey Inc. All right reserved. 今回定義したCUJとSLI(再掲)
2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち 顔認証成功率 認証後、カギまたは扉が開いた回数/ 認証端末に顔をかざした回数 QR認証成功率 認証後、カギまたは扉が開いた回数/ 認証端末にQRをかざした回数 「テナント専有部」への出入り フラッパーゲートなど 「ビルエントランス」の出入り 業務開始
38 Copyright © 2025 Bitkey Inc. All right reserved. iPadの電源が落ちている
このSLIは実は見落としがあり、そもそも顔・QRを端末にかざせなくなる状況が考慮されていない アプリが落ちている ビル制御システムと疎通できてない ためメンテナンスモードに 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち
39 Copyright © 2025 Bitkey Inc. All right reserved. iPadの電源が落ちている
ユーザ体験を考えた時に、体験の前提となる「モノ」の状態の監視が必要になってくる アプリが落ちている ビル制御システムと疎通できてない ためメンテナンスモードに 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち
40 Copyright © 2025 Bitkey Inc. All right reserved. 弊社では、物理デバイスの死活監視、物理デバイス間の連携に関するSLIを定めて監視している
死活監視 SLI:ビル制御システムとの疎通率 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち iPadの電源が落ちている アプリが落ちている ビル制御システムと疎通できてない ためメンテナンスモードに
41 Copyright © 2025 Bitkey Inc. All right reserved. モノを監視するSLIはclient側からbackendに一定間隔でheartbeatを飛ばし続けることで実現
2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち Cloud Run Pub/Sub heartbeat
42 Copyright © 2025 Bitkey Inc. All right reserved. Tips2のまとめ
“フィジカル”がまたがるサービスにおいては、モノが動いているか?といった、 体験の前提となる状況が満たされているかも、サービスレベルを定義できると良い 上記は体験のサービスレベルとは分けて定義・計測するとシンプル 2. モノも含めたSLI設計の難しさ:前提となる「モノ」の監視は見落としがち
43 Copyright © 2025 Bitkey Inc. All right reserved. Tips3
DatadogでのID単位のSLO監視は、SLOベースのMonitor ではなくMetricベースのMonitorで実現 計測 ツール
44 Copyright © 2025 Bitkey Inc. All right reserved. 前提:弊社が利用しているDatadogにはSLOsというサービスが存在しており、SLI/SLOの設定と
Monitor(アラート)設定を行うことができる 3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 Datadog公式ドキュメントより
45 Copyright © 2025 Bitkey Inc. All right reserved. 前提:ビルモニタリングの特性
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 SLIの低下要因
46 Copyright © 2025 Bitkey Inc. All right reserved. 前提:ビルモニタリングの特性
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 機能単位やシステム全体でSLIが下 がることは稀 SLIの低下要因 ビルモニタリングの特性
47 Copyright © 2025 Bitkey Inc. All right reserved. 前提:ビルモニタリングの特性
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 機能単位やシステム全体でSLIが下 がることは稀 ↓ ビルや出入り口の単位で成功率が下 がったり、元々低かったりする傾向 がある SLIの低下要因 ビルモニタリングの特性
48 Copyright © 2025 Bitkey Inc. All right reserved. 前提:ビルモニタリングの特性
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 機能単位やシステム全体でSLIが下 がることは稀 ↓ ビルや出入り口の単位で成功率が下 がったり、元々低かったりする傾向 がある ↓ ビルという単位でSLOを割った際に アラートを設定したい SLIの低下要因 ビルモニタリングの特性
49 Copyright © 2025 Bitkey Inc. All right reserved. SLOsの導線で設定したMonitorでは、指標全体の監視はできるが、ID単位(Group単位)のアラート通知
が設定できなかった(2025 H1時点 登壇者調べ) 3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 Datadog公式ドキュメントより
50 Copyright © 2025 Bitkey Inc. All right reserved. MetricベースのMonitorを採用し、ビルID単位でのSLO監視を実現し対処
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 Monitors > New Monitor > Metricを選択 Aggregation > Multi Alert設定をすることでID(Group) 単位でのアラート設定が可能
51 Copyright © 2025 Bitkey Inc. All right reserved. ハマりポイント:7日間レンジのSLIを計測した際に、Metricの計測タイミングの仕様?に影響されて、
意図した計算結果に中々ならなかった... 3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 - Monitorを用いた代替運用の紹介:moving_rollback, with lookback, Evaluation Details などの設定 今回は試行錯誤の結果、moving_rollup関数を設定 / 過去10分間の平均値で評価 / 「as rate」を採用し計測を安定化
52 Copyright © 2025 Bitkey Inc. All right reserved. Tips3のまとめ
3. DatadogでのID単位のSLO監視は、SLOベースのMonitorではなくMetricベースのMonitorで実現 ID単位でSLOを監視したい場合は、MetricベースのMonitorを使おう (SLOsベースでもできるようにしてほしいけど・・・) Datadog Monitorの仕組みを理解して意図通りの計測するとより堅牢なSLIになる
53 Copyright © 2025 Bitkey Inc. All right reserved. Tips4
「SLOを毀損したら、初手SREまたは開発チームが動く」 は本当に正解か? 運用 組織
54 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? SLIの低下要因
55 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す SLIの低下要因 SLIが下がったときの調査
56 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 認証成功率の低下要因 SLIが下がったときの調査
57 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 🗣 調査者「現地行って電波強度を測定してきま す!」 ※もちろん施工時に検査するが、それでも調整が入ることがある 🗣 調査者「実は計画停電だったので問題ないやつ でした」 🗣 調査者「なんかQRコードがずっと映り込んで たりしませんか?」 ※流石にログを改善したので今は失敗扱いされないが、過去何度かあったケース 認証成功率の低下要因 SLIが下がったときの調査
58 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? 認証成功率の低下要因 SLIが下がったときの調査 初手の調査内容はフィジカル側に寄る ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 🗣 調査者「現地行って電波強度を測定してきま す!」 ※もちろん施工時に検査するが、それでも調整が入ることがある 🗣 調査者「実は計画停電だったので問題ないやつ でした」 🗣 調査者「なんかQRコードがずっと映り込んで たりしませんか?」 ※流石にログを改善したので今は失敗扱いされないが、過去何度かあったケース
59 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? 認証成功率の低下要因 これらは初手 開発者が調査するのが効率的だろうか? ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 🗣 調査者「現地行って電波強度を測定してきま す!」 ※もちろん施工時に検査するが、それでも調整が入ることがある 🗣 調査者「実は計画停電だったので問題ないやつ でした」 🗣 調査者「なんかQRコードがずっと映り込んで たりしませんか?」 ※流石にログを改善したので今は失敗扱いされないが、過去何度かあったケース SLIが下がったときの調査
60 Copyright © 2025 Bitkey Inc. All right reserved. ビルモニタリングの特性(運用編)
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? 認証成功率の低下要因 SLIが下がったときの調査 NOですよね ①どのトビラでSLIが下がっている か把握し、使われ方や設置環境を思 い出す ↓ ②現地環境を直接確認 or お客様に 確認後、改善アクションを実施 🗣 調査者「現地行って電波強度を測定してきま す!」 ※もちろん施工時に検査するが、それでも調整が入ることがある 🗣 調査者「実は計画停電だったので問題ないやつ でした」 🗣 調査者「なんかQRコードがずっと映り込んで たりしませんか?」 ※流石にログを改善したので今は失敗扱いされないが、過去何度かあったケース
61 Copyright © 2025 Bitkey Inc. All right reserved. 弊社は”ビルモニタリングにおいては”初手CSがフィジカル領域の調査をする体制を構築
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か?
62 Copyright © 2025 Bitkey Inc. All right reserved. Tips4のまとめ
4. 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? ※補足①:一方でObservabilityの向上 や ドメイン知識獲得のための工夫 を突き詰めるという方向性もアリだと思う ※補足②:もちろんビットキーにも、APIのエラー率など開発者やSREが主導して対応するSLOも多々ある ビルモニタリングの例のように、サービスやプロダクトの特性によっては、 初手の調査対応の適任者が開発者やSREではないケースがありそう そういった場合、柔軟にSLOの運用フローを再構築するのも選択肢として取りうる
63 Copyright © 2025 Bitkey Inc. All right reserved. Tips5
CSを巻き込んだSLO運用のポイント ツール 運用 組織
64 Copyright © 2025 Bitkey Inc. All right reserved. 弊社の”ビルモニタリング”においてはCSが初手の調査対応を担っている。
このフローには、いくつか定着のための工夫ポイントがあるため紹介していく 5. CSを巻き込んだSLO運用のポイント
65 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント①:経験上、運用の定着には既存の業務に寄り添うことが肝要。
CSも含むインシデント対応に活用されていたWaroomとSlackを中心としたアーキテクチャを採用 5. CSを巻き込んだSLO運用のポイント
66 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント②:調査対応内容をWaroomのRunbook機能を用いて再現性を向上
5. CSを巻き込んだSLO運用のポイント
67 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント②:調査対応内容をWaroomのRunbook機能を用いることで再現性を向上
5. CSを巻き込んだSLO運用のポイント
68 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント③:ダッシュボードでは、見る人の認知負荷を考慮しSummary
> Transition > Detailと いうレイアウトを意識 5. CSを巻き込んだSLO運用のポイント
69 Copyright © 2025 Bitkey Inc. All right reserved. 工夫ポイント③:ダッシュボードでは、見る人の認知負荷を考慮しSummary
> Transition > Detailと いうレイアウトを意識 5. CSを巻き込んだSLO運用のポイント Summary (ぱっと見たい情報) Title Filter Transition (時系列の分析軸) Detail (その他の分析軸) 構成 ビルモニタリングダッシュボード(イメージ) ※Datadogはカードに時系列グラフを 重ねられるので、それで表現 ログ一覧や補 足的な時系列 情報を可視化
70 Copyright © 2025 Bitkey Inc. All right reserved. Tips5のまとめ
5. CSを巻き込んだSLO運用のポイント 運用の定着には、その主体となる人の既存の業務フローに寄り添うことが肝要 (Waroom × Slackを中心としたアーキテクチャ) 開発者が慣れているツールを運用に使う場合、 どう使ってほしいかをガイドしてあげることが定着を助ける (Waroom Runbook機能、Datadogダッシュボードの統一的なレイアウト)
71 Copyright © 2025 Bitkey Inc. All right reserved. 3.
Conclusion
72 Copyright © 2025 Bitkey Inc. All right reserved. 1
CUJは普遍か? CUJはフィジカル領域が絡むサービスでも有用でした。特に複雑なサービスにおいては普遍と思われます 2 SLIは体験の計測のみで十分か? フィジカル領域が絡むサービスの場合、必要に応じて前提となる「モノ」や「状態」も監視しましょう 3 DatadogでのSLOの監視はDatadog SLOsを用いればよいか? 現状はビル単位のようなID単位でアラートを通知したい場合は、Datadog Monitorを使う必要があります 4 「SLOを毀損したら、初手SREまたは開発チームが動く」は本当に正解か? サービスの特性に応じて、柔軟にSLO運用フローを構築するのも選択肢として取りうるのではと考えてます 5 SLO運用が定着するには? 最後に次のスライド以降で語ろうと思います... Conclusion
73 Copyright © 2025 Bitkey Inc. All right reserved. “SLOは単なるデータである
” * オライリー・ジャパン「 SLO サービスレベル目標」 の P15 より参照 Conclusion:SLO運用が定着するには?
74 Copyright © 2025 Bitkey Inc. All right reserved. “データ”(≒SLI/SLO)を作る際は、ユーザの動きや取り巻く状況に
ディープダイブして、より有意義なデータを作りましょう ”データ”の定着という観点では、 “活用者”中心の運用設計やツール選定をすることを突き詰めましょう Conclusion:SLO運用が定着するには?
75 Copyright © 2025 Bitkey Inc. All right reserved. End
of file