Slide 1

Slide 1 text

© SMS Co., Ltd. 加我 貴志 (株式会社エス・エム・エス) Japan Datadog User Group Meetup#17@沖縄 (2026/05/28) オンコールの負荷軽減のための Bits Assistant 活用方法

Slide 2

Slide 2 text

© SMS Co., Ltd. 自己紹介 ● 加我 貴志 (  TAKA_0411) ● 株式会社エス・エム・エス プロダクト推進本部 カイポケ開発部 ● JDDUG札幌の運営やってます ● Datadog Ambassador 2026 ● 最近の私 : Bits Assistantの案内人

Slide 3

Slide 3 text

© SMS Co., Ltd. Bits Assistantとは ● DatadogのAIサービス (Bits AI) の1つ ○ Bits AI Dev Agent ○ Bits AI SRE Agent ○ Bits Assistant ← New!! ● 生成AIを活用し、DatadogのWeb UIから チャット形式によるデータの調査・可視化・操作を支援してくれる

Slide 4

Slide 4 text

© SMS Co., Ltd. Bits Assistantでできること ● データの調査 ○ テレメトリーデータ ○ アプリケーションコード ● Dashboardの管理 ● Monitorの管理 ● Notebookの管理 ● 公式ドキュメントの検索・回答

Slide 5

Slide 5 text

© SMS Co., Ltd. Bits Assistantでできないこと ● 外部システムの操作 ○ AWSマネジメントコンソール ○ GitHub ● Datadogのデータ削除や破壊的変更 ● リアルタイム監視・未来予測

Slide 6

Slide 6 text

© SMS Co., Ltd. Bits Assistantの使い方  画面右上にあるAsk Bitsをクリック ※色々なページからAsk Bitsを実行できるが、 適切なページから実行すると適切なコンテキスト を渡しやすい。  (会話の中でもコンテキストを別途渡せる)  Web UIの右側にチャット画面が  表示されるので、対話形式でデータの  調査などを依頼できる ダッシュボード : ダッシュボードID、ウィジェット情報、テンプレート変数 モニター : モニターID、クエリ、閾値設定 エラーログ : ログの内容、サービス名、エラーメッセージ トレース : トレースID、サービス、レイテンシ情報 インシデント : インシデントID、重要度、ステータス

Slide 7

Slide 7 text

© SMS Co., Ltd. 社内での活用方法 ● オンコールにおけるアラートの原因調査 (トリアージ) ● システムの定期的なパフォーマンス分析 ● ダッシュボード改善 (今回は割愛)

Slide 8

Slide 8 text

© SMS Co., Ltd. 社内での活用方法 ● オンコールにおけるアラートの原因調査 (トリアージ) ● システムの定期的なパフォーマンス分析 ● ダッシュボード改善 (今回は割愛)

Slide 9

Slide 9 text

© SMS Co., Ltd. オンコールにおけるアラートの原因調査 (トリアージ) アラート発生 オンコール検知 オンコール担当者が 調査担当者となり 諸々のデータを確認 ・ テレメトリーデータの調査 ・ アプリケーションコードの調査 ・ 直近のデプロイの調査 ・ ドキュメントの調査 ・ チーム横断のコミュニケーション 原因調査 これまでの対応フロー 焦り 不安 重圧

Slide 10

Slide 10 text

© SMS Co., Ltd. オンコールにおけるアラートの原因調査 (トリアージ) アラート発生 オンコール検知 オンコール担当者がBits Assistantにアラートの 原因分析を依頼し、作成した Notebookをレビューする 調査依頼 Bits Assistant導入後 (検証中)

Slide 11

Slide 11 text

© SMS Co., Ltd. オンコールにおけるアラートの原因調査 (トリアージ) Bits Assistant   がやってくれること ● テレメトリーデータの調査 ● アプリケーションコードの調査 ● 直近のデプロイの調査 ● 分析結果のまとめのNotebook作成 人間が調査・分析をやるよりも効率的!!

Slide 12

Slide 12 text

© SMS Co., Ltd. 社内での活用方法 ● オンコールにおけるアラートの原因調査 (トリアージ) ● システムの定期的なパフォーマンス分析 ● ダッシュボード改善 (今回は割愛)

Slide 13

Slide 13 text

© SMS Co., Ltd. システムの定期的なパフォーマンス分析

Slide 14

Slide 14 text

© SMS Co., Ltd. システムの定期的なパフォーマンス分析

Slide 15

Slide 15 text

© SMS Co., Ltd. Bits Assistantを活用するためのポイント ● テレメトリーデータを十分蓄積しておく ○ メトリクス, ログ, トレース, プロファイル, etc... ● 調査の効率化を意識してタグ情報を設定しておく ○ service, env, version, etc... ● 必要なIntegrationを設定しておく ○ AWS, GitHub, Slack, etc...

Slide 16

Slide 16 text

© SMS Co., Ltd. まとめ

Slide 17

Slide 17 text

© SMS Co., Ltd. データの調査や分析はBits Assistantに 移譲していき、私たちはテレメトリーデータの 拡充や計装に注力しよう! まとめ (1)

Slide 18

Slide 18 text

© SMS Co., Ltd. 一方で障害対応によりデータの不足に気づける こともある。常にサービスに関心を持って Bits Assistantに頼り切りにならないように しよう! まとめ (2)

Slide 19

Slide 19 text

© SMS Co., Ltd. おわり