オンコールの負荷軽減のためのBits Assistant 活用方法 / How to Use Bits Assistant to Reduce the Workload on On-Call Staff
by
SMS tech
×
Copy
Open
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Slide 1
Slide 1 text
© SMS Co., Ltd. 加我 貴志 (株式会社エス・エム・エス) Japan Datadog User Group Meetup#17@沖縄 (2026/05/28) オンコールの負荷軽減のための Bits Assistant 活用方法
Slide 2
Slide 2 text
© SMS Co., Ltd. 自己紹介 ● 加我 貴志 ( TAKA_0411) ● 株式会社エス・エム・エス プロダクト推進本部 カイポケ開発部 ● JDDUG札幌の運営やってます ● Datadog Ambassador 2026 ● 最近の私 : Bits Assistantの案内人
Slide 3
Slide 3 text
© SMS Co., Ltd. Bits Assistantとは ● DatadogのAIサービス (Bits AI) の1つ ○ Bits AI Dev Agent ○ Bits AI SRE Agent ○ Bits Assistant ← New!! ● 生成AIを活用し、DatadogのWeb UIから チャット形式によるデータの調査・可視化・操作を支援してくれる
Slide 4
Slide 4 text
© SMS Co., Ltd. Bits Assistantでできること ● データの調査 ○ テレメトリーデータ ○ アプリケーションコード ● Dashboardの管理 ● Monitorの管理 ● Notebookの管理 ● 公式ドキュメントの検索・回答
Slide 5
Slide 5 text
© SMS Co., Ltd. Bits Assistantでできないこと ● 外部システムの操作 ○ AWSマネジメントコンソール ○ GitHub ● Datadogのデータ削除や破壊的変更 ● リアルタイム監視・未来予測
Slide 6
Slide 6 text
© SMS Co., Ltd. Bits Assistantの使い方 画面右上にあるAsk Bitsをクリック ※色々なページからAsk Bitsを実行できるが、 適切なページから実行すると適切なコンテキスト を渡しやすい。 (会話の中でもコンテキストを別途渡せる) Web UIの右側にチャット画面が 表示されるので、対話形式でデータの 調査などを依頼できる ダッシュボード : ダッシュボードID、ウィジェット情報、テンプレート変数 モニター : モニターID、クエリ、閾値設定 エラーログ : ログの内容、サービス名、エラーメッセージ トレース : トレースID、サービス、レイテンシ情報 インシデント : インシデントID、重要度、ステータス
Slide 7
Slide 7 text
© SMS Co., Ltd. 社内での活用方法 ● オンコールにおけるアラートの原因調査 (トリアージ) ● システムの定期的なパフォーマンス分析 ● ダッシュボード改善 (今回は割愛)
Slide 8
Slide 8 text
© SMS Co., Ltd. 社内での活用方法 ● オンコールにおけるアラートの原因調査 (トリアージ) ● システムの定期的なパフォーマンス分析 ● ダッシュボード改善 (今回は割愛)
Slide 9
Slide 9 text
© SMS Co., Ltd. オンコールにおけるアラートの原因調査 (トリアージ) アラート発生 オンコール検知 オンコール担当者が 調査担当者となり 諸々のデータを確認 ・ テレメトリーデータの調査 ・ アプリケーションコードの調査 ・ 直近のデプロイの調査 ・ ドキュメントの調査 ・ チーム横断のコミュニケーション 原因調査 これまでの対応フロー 焦り 不安 重圧
Slide 10
Slide 10 text
© SMS Co., Ltd. オンコールにおけるアラートの原因調査 (トリアージ) アラート発生 オンコール検知 オンコール担当者がBits Assistantにアラートの 原因分析を依頼し、作成した Notebookをレビューする 調査依頼 Bits Assistant導入後 (検証中)
Slide 11
Slide 11 text
© SMS Co., Ltd. オンコールにおけるアラートの原因調査 (トリアージ) Bits Assistant がやってくれること ● テレメトリーデータの調査 ● アプリケーションコードの調査 ● 直近のデプロイの調査 ● 分析結果のまとめのNotebook作成 人間が調査・分析をやるよりも効率的!!
Slide 12
Slide 12 text
© SMS Co., Ltd. 社内での活用方法 ● オンコールにおけるアラートの原因調査 (トリアージ) ● システムの定期的なパフォーマンス分析 ● ダッシュボード改善 (今回は割愛)
Slide 13
Slide 13 text
© SMS Co., Ltd. システムの定期的なパフォーマンス分析
Slide 14
Slide 14 text
© SMS Co., Ltd. システムの定期的なパフォーマンス分析
Slide 15
Slide 15 text
© SMS Co., Ltd. Bits Assistantを活用するためのポイント ● テレメトリーデータを十分蓄積しておく ○ メトリクス, ログ, トレース, プロファイル, etc... ● 調査の効率化を意識してタグ情報を設定しておく ○ service, env, version, etc... ● 必要なIntegrationを設定しておく ○ AWS, GitHub, Slack, etc...
Slide 16
Slide 16 text
© SMS Co., Ltd. まとめ
Slide 17
Slide 17 text
© SMS Co., Ltd. データの調査や分析はBits Assistantに 移譲していき、私たちはテレメトリーデータの 拡充や計装に注力しよう! まとめ (1)
Slide 18
Slide 18 text
© SMS Co., Ltd. 一方で障害対応によりデータの不足に気づける こともある。常にサービスに関心を持って Bits Assistantに頼り切りにならないように しよう! まとめ (2)
Slide 19
Slide 19 text
© SMS Co., Ltd. おわり