Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DevOps/MLOpsに学ぶエージェントの可観測性
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yunosuke Yamada
October 03, 2025
1.1k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
DevOps/MLOpsに学ぶエージェントの可観測性
Yunosuke Yamada
October 03, 2025
More Decks by Yunosuke Yamada
See All by Yunosuke Yamada
AI時代に成長するエンジニアに必要なスキルとは.pdf
yunosukey
0
190
Gemini CLIでもセキュアで堅牢な開発をしたい!
yunosukey
1
610
Agent Development Kitで作るマルチエージェントアプリケーション(AIAgent勉強会)
yunosukey
4
1.7k
Agent Development Kitで作るマルチエージェントアプリケーション(GCNT2025)
yunosukey
0
75
AIエージェントのオブザーバビリティについて
yunosukey
1
900
OpenTelemetry + LLM = OpenLLMetry!?
yunosukey
2
1.1k
クラウド開発環境Cloud Workstationsの紹介
yunosukey
0
460
フロントエンドオブザーバビリティ on Google Cloud
yunosukey
1
360
ChatGPTのアルゴリズム
yunosukey
0
440
Featured
See All Featured
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
380
Raft: Consensus for Rubyists
vanstee
141
7.5k
The Pragmatic Product Professional
lauravandoore
37
7.3k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
580
From π to Pie charts
rasagy
0
210
sira's awesome portfolio website redesign presentation
elsirapls
0
280
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
62
44k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
300
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
120k
Rails Girls Zürich Keynote
gr2m
96
14k
Transcript
DevOps/MLOpsに学ぶエージェントの可観測性 生成 AI オブザーバビリティのはじめの一歩 株式会社スリーシェイク 山田悠之介 2025/10/3 Copyright © 3-shake,
Inc. All Rights Reserved.
はじめに ターゲット • DevOpsやMLOpsを実践してきた人 • 生成AIやエージェントのオブザーバビリティについて知りたい人 今日伝えたいこと • エージェントのオブザーバビリティにDevOps/MLOpsの知見を活かせる 2
About US 会社名 株式会社スリーシェイク 設立日 2015/1/15 Mission: インフラをシンプルにして イノベーションが起こりやすい世界を作る Vision:
労苦〈Toil〉を無くすサービスを適正な価格で提供し続ける Value: エンジニアリングレイヤーに横たわる人、手法、ツールが サイロ化されて労苦が発生しているプロセスをシンプルにし サービス機能開発に集中できるソリューション (SRE、DevSecOps、DataOps、HROps)を提供する 2015 2016 2017 2018 2019 2020 2021 2022 0 50 100 従業員: 200名over Engineer 60% 所在地 東京都中央区銀座8丁目21番1号 住友不動産汐留浜離宮ビル7F 代表者 代表取締役社長 吉田 拓真 沿革 2021年1月 JAFCOから総額5億円の資金調達 2022年8月 自動脆弱性診断ツール「Securify Scan」をリ リース。JAFCO、MUCAPから総額8.48億円の資金調達 2024年11月 NTTデータ、SCSKから10億円の資金調達及 び資本業務提携を締結 Google Cloud・AWSの両方のエンジニアリングに強みを持つ (2025年9月にGoogleCloudのAppDevスペシャライゼーションを取得) 3
SREを主軸にクラウドネイティブ化/エンジニアリング内製化を支援 SRE/DevOps SecOps BizOps HR ・SRE総合支援からセキュリティ対 策を全方位支援 ・Geminiを用いた生成AIの活用支援 ・ワンストップで脆弱性診断を行う セキュリティ対策SaaS
・クラウド型ETL/データパイプ ラインSaaSの決定版 ・あらゆるSaaSをノーコードで連携 ・ハイスキルフリーランスエンジニ ア紹介エージェント IT内製化 / 高度化 クラウドネイティブ化 モダナイゼーション ITアジリティ向上 4
目次 1. DevOpsとオブザーバビリティ 2. MLOpsとオブザーバビリティ 3. AIエージェントのオブザーバビリティ 5
DevOpsとオブザーバビリティ 01 Copyright © 3-shake, Inc. All Rights Reserved.
DevOpsとオブザーバビリティ DevOpsについて統一的な定義は存在しないが • DevとOpsの融合であること • 文化、プラクティス、ツールなどで構成されること という性質を持つ思想であることは概ね一致[1][2][3] 一方で「制御理論では、オブザーバビリティとは、外部出力の知識からシステムの内部状態を どれだけうまく推測できるかの尺度として定義」[4]されており、本来DevOpsとは独立した概念 7
DevOpsとオブザーバビリティ ただし現在は両者は密接に結びついている • 「オブザーバビリティは、孤立して存在するのではなく、DevOps、SRE、 およびクラウドネイティブの動きの結果であり、不可欠な要素」[4] • 『The DevOpsハンドブック 理論・原則・実践のすべて』では、 フィードバックの技術的実践としてテレメトリデータの作成と分析が紹介
• DORAのFour Keysの1つである「デプロイ失敗時の復旧までの時間」を短縮するために オブザーバビリティが必要[5] 8
DevOpsとオブザーバビリティ 最も重要なのは「ビジネス課題を解決しているか」 そしてそのために • 正常に動作しているか(機能要件を満たしているか) • 素早く動作しているか(非機能要件を満たしているか) • 上記に反した時には問題の詳細 を知る必要がある。
具体的な手段としてはログ、トレース、メトリクスがある。 9
MLOpsとオブザーバビリティ 02 Copyright © 3-shake, Inc. All Rights Reserved.
MLOps MLOpsについてもDevOpsと同様に統一的な定義は存在しないが • DevOpsをMLに適用したものである • 技術だけでなく文化、プラクティスなどを含む ということは概ね一致[6][7][8] 11
MLOpsとオブザーバビリティ 「ビジネス課題を解決しているか」が重要であることは変わらない 大きな違いはモデルがブラックボックスであること。 これに対してMLOpsではドリフト検知がある。 12
モデルのドリフト 2種類ある • コンセプトドリフト:入力と出力の関係が変わる ◦ 例:不動産価格予測モデルを作ったがパンデミックで市場環境が変わってしまった • データドリフト :入力、もしくは出力の分布が変わる ◦
例:スパム判定モデルを作ったが新しい手口が登場した ドリフト検知は構造化データに対して様々なアルゴリズムが存在 非構造化データの場合はベクトル化などで構造化データに帰着させる 13
AIエージェントとオブザーバビリティ 03 Copyright © 3-shake, Inc. All Rights Reserved.
AIエージェントとは • AIエージェントについての明確かつ広く受け入れられた定義は存在しない ◦ 特にどの程度自律的に振る舞うべきかどうかについて • 本セッションでは以下の条件を満たすシステムをAIエージェントと呼びます ◦ 生成AIをベースとする(いわゆるLLM-based Agents)
◦ 人間の指示に対してプランニングと実行を行う 15
AIエージェントとオブザーバビリティ 重要なことは変わっていない • ビジネス課題を解決しているか • 機能要件、非機能要件を満たしているか • 問題が起きた場合の詳細 収集するための形式はすでに持っている •
DevOpsにおけるログ、トレース、メトリクス 唯一異なるのは生成AIという新しいブラックボックス • しかしブラックボックスにオブザーバビリティを与えるプラクティスもすでに持っている ◦ MLOpsにおけるドリフト検知 16
AIエージェントとオブザーバビリティ • 直接的な情報 ◦ ビジネスKPI:メトリクス • 間接的な情報 ◦ エージェント全体の入出力が妥当か ▪
ドリフト検知(後述) ◦ エージェント内部の動きが妥当か ▪ ツール実行やワークフローの経路:トレース ◦ エージェントからの生成AI呼び出しが妥当か ▪ 次ページ 17
生成AI呼び出しが妥当か モデルの非決定性に対して • 推論の入出力 • 生成時間 • 生成のパラメータ • 使用トークン数
• 課金額 を収集する必要がある 複数のベンダー、モデルを使う場合は合わせて • ベンダー • モデルID も必要 18 これらは全て生成AI固有の情報だが、 ログかスパン属性として収集可能
AIエージェントのドリフト検知 AIエージェントの入出力は多くの場合、非構造化データ(テキスト、音声、画像、動画) 以下の手法でモニタリング可能な形式にできる • 入力に対して ◦ 対応可能な入力かを生成AIにチェックさせる ◦ ベクトル化などを行なってから従来手法 •
出力に対して ◦ LLM as a Judgeでの妥当性チェック ◦ ユーザによるグッド/バッド評価 19
どう収集するか • モニタリングツールに依存したくない場合 ◦ OpenLLMetryやOpenLITなどのOpenTelemetry系OSSで計装 • LangChain、LangGraphを使っている場合 ◦ LangSmith、LangfuseなどのGenAIOps系サービスを導入 •
監視SaaSを使っている場合 ◦ そのSaaSの機能を使う • クラウドで監視をしている場合 ◦ Strands Agentsで作ってAmazon Bedrock AgentCoreにデプロイ ◦ Microsoft Agent Frameworkで作ってAzure AI Foundryにデプロイ ◦ Agent Development Kitで作ってVertex AI Agent Engineにデプロイ 20
まとめ • AIエージェントでも重要なことは「ビジネス課題を解決しているか」 • ログ、トレース、メトリクス、ドリフト検知などの既存の知見は AIエージェントのオブザーバビリティでも引き続き有用 • 生成AIやAIエージェントといったゲームチェンジャーによって 具体的な手段は変わったが抽象の部分は変わっていない 21
参考 [1]: https://aws.amazon.com/jp/devops/what-is-devops/ [2]: https://azure.microsoft.com/ja-jp/resources/cloud-computing-dictionary/what-is-devops/ [3]: https://www.atlassian.com/ja/devops [4]: 『オブザーバビリティ・エンジニアリング』 [5]:
https://newrelic.com/blog/best-practices/dora-metrics [6]: https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning?hl=ja [7]: https://aws.amazon.com/jp/what-is/mlops/ [8]: 『事例でわかるMLOps 機械学習の成果をスケールさせる処方箋』 22