Upgrade to Pro — share decks privately, control downloads, hide ads and more …

バクラクのSREにおけるAgentic AIへの挑戦/Our Journey with Age...

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for SadayoshiTada SadayoshiTada
February 28, 2026

バクラクのSREにおけるAgentic AIへの挑戦/Our Journey with Agentic AI

SRE Kaigi 2026 延長戦で発表した資料です。

Avatar for SadayoshiTada

SadayoshiTada

February 28, 2026
Tweet

More Decks by SadayoshiTada

Other Decks in Technology

Transcript

  1. 多田 貞剛 @taddy_919 自己紹介 2022/03 入社 バクラク事業部 Platform Engineering部 SREグループ

    全国穴掘り大会に出場して331チーム 中178位でした 身体を動かすのが好きです © LayerX Inc. 2
  2. Agentic AIの広がり © LayerX Inc. 生成AI時代における我々を取り巻く環境の変化 Agentic AI:チャットで答えるだけのAIから、AIがコンテキストを踏まえ自律的にツール を呼び出し、複雑なタスクを実行する 昨年からSREの職域においても「人が調べてから対処する」から

    「AIが調査し人が判断 する」 への転換が進みつつある Agentic AIに関するサービスが各社から発表されている ※以下は一例 AWS DevOps Agent: AWSリソースの調査・トラブルシュートを自律的に実行 Datadog Bits AI SRE: Datadogの監視データを活用した自動アラート調査・根本原因分析 Azure SRE Agent: Azureの障害検知から修復提案までを自動化 10
  3. AWS DevOps Agentとの比較 AWS DevOps Agent : re:Invent 2025で発表された自律的なAIエージェント(プレビュー中) ©

    LayerX Inc. 他ソリューションとの比較 利用者はAWSにログインしないとDevOps Agentを使用できない AWSにログインしなくても利用できることを目指したかった Slackから調査依頼を行うことができない 業務のインターフェースとしてSlackが主のため 19
  4. AWS DevOps Agentとの比較サマリー 項目 AWS DevOps Agent 内製 データソースの統合 ◯

    ◯ Slackからの利用 ✕ (調査ステータスの通知のみ) ◯ カスタマイズ性 ✕ ◯ 初期導入の手軽さ ◯(ボタン数クリックで利用可能) △ (エージェント実行環境の構築が必要) 料金 ◯ (プレビュー期間は無料) △ (AWSの従量課金) © LayerX Inc. 他ソリューションとの比較 20
  5. Datadog Bits AI SREとの比較 Datadog Bits AI SRE : Datadog内で動作する自動アラート調査AIエージェント

    © LayerX Inc. 他ソリューションとの比較 バクラクの大半のメトリクス、ログ、トレース情報はDatadogに集まってくるが、一部 Datadog外の情報(CloudWatch)を必要とする場合もある 全ての調査がBits AI SREで完結できるわけではなく、AWSにエージェントを配置し、Datadogの調査はMCP経由 で行うことにした 21
  6. Datadog Bits AI SREとの比較サマリー 項目 Datadog Bits AI 内製 データソースの統

    合 △ (Datadogのみ) ◯ (Datadog + CloudWatch等) Slackからの利用 ◯ ◯ カスタマイズ性 △ (Datadog提供機能のみ) ◯ (独自拡張可能) 初期導入の手軽さ ◯ (設定のみ) △ (エージェント実行環境の構築が必 要) 料金 △ (オンデマンドだと1件の調査につき $36) △ (AWSの従量課金) © LayerX Inc. 他ソリューションとの比較 22
  7. 使用している技術(1) © LayerX Inc. アーキテクチャ・技術スタック Python uv: Pythonのパッケージ・プロジェクト管理ツール Strands Agent:

    AIエージェントSDK Claude Sonnet 4.6: Anthropic社の最新世代の大規模言語モデル Slack Bolt: Slackアプリ開発用のフレームワーク 27
  8. 使用している技術(2) © LayerX Inc. アーキテクチャ・技術スタック Datadog MCP Server(プレビュー機能): Datadogの監視データにアクセスするための MCPサーバー

    CloudWatch MCP Server: AWS CloudWatchのメトリクスやログ分析等を行うための MCPサーバー AWS Documentation MCP Server: AWS公式ドキュメントにアクセスするためのMCPサ ーバー 28
  9. 実行環境 © LayerX Inc. アーキテクチャ・技術スタック AWS上に構築 ALB + ECS Fargate

    + Bedrock(日本リージョン) バクラクでは大半のコンピューティングリソースがECS Fargateで構成されており、CI/CDやインフラの自動 生成等既存のプラットフォームに載ることで高速に検証を回せるため採用した Amazon Bedrockのモデルでは学習のオプトアウトが適用済みのため採用した AWS公式ドキュメント 29
  10. コンテキストウィンドウの超過対策 © LayerX Inc. 実装上の考慮点 調査計画策定時、各MCPへ問い合わせた結果を統合してBedrockに渡す事を行ってお り、稼働させてみたところコンテキストウィンドウを超過するエラーが発生した bedrock threw context

    window overflow error プロンプトの指示としてトークン数を過剰に使用しないようにレポートを簡潔にするよ う指示を追加し、一旦エラーは解消 上記のエラーはClaude Sonnet 4.5で発生したが、Claude Sonnet 4.6ではコンテキストの圧縮が利用できるため 試したい コンテキストウィンドウオーバーフローとその対策,Compaction 35
  11. 調査レポートにおけるタイムウィンドウの統一 © LayerX Inc. 実装上の考慮点 エージェントのレポートでのタイムウィンドウに実際の時間帯よりも過去になっている ことがあった ex) 調査期間が2026年2月28日の16:00-16:30とレポートしてほしいところ、2024年2月28日の16:00-16:30とレポ ートされてしまう事象

    開発初期エージェントに対して時間に関するコンテキストを与えておらずタイムウィン ドウがばらつきがあったため、コンテキストで明確に指示するようにした 明確に時間の指定がなければ現在時刻で調査を行うようにプロンプトで指示するのと、Strands Agentのtoolsで 現在時刻を取得するようにした 36
  12. 今後の展望:SRE Kaigi 2026での学び © LayerX Inc. システム調査エージェントの今後の展望 SRE Kaigiで以下のセッションを聴講して、本発表の延長線上にある取り組みで私自身 大変勉強になりました

    AIと新時代を切り拓く。これからのSREとメルカリIBISの挑戦 botへのメンションによる調査依頼は利用が進まなかったことは勉強になり、ユーザーの状況を先読みして 自律的にアクションを起こす、Ambient Agentのようにしないといけないと感じた 42