Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIエージェントの開発と評価、GenAIOps(LLM Ops)

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for Kento.Yamada Kento.Yamada
September 27, 2025
270

AIエージェントの開発と評価、GenAIOps(LLM Ops)

2025年09月27日に開催された .NETラボ 勉強会 2025年9月の登壇資料です。

Azure AI Foundryを使って、生成AIの評価方法について説明し、Evaluatorのデモをしました。

デモ用のリポジトリ
https://github.com/ymd65536/azure_ai_eval_sdk.git

スライド内にある資料
生成 AI のエージェント エバリュエーター - Azure AI Foundry - Microsoft Learn
https://learn.microsoft.com/ja-jp/azure/ai-foundry/concepts/evaluation-evaluators/risk-safety-evaluators?wt.mc_id=MVP_357747

Avatar for Kento.Yamada

Kento.Yamada

September 27, 2025
Tweet

Transcript

  1. 山田顕人(Kento.Yamada) @ymd65536 自己紹介 2 仕事:クラウドインテグレーション開発 ロール:マルチクラウドデベロッパー 活動:.NETラボ勉強会の運営、Azure AI Community運営 最近:Microsoft

    MVP 2年目になりました。 受賞歴 LAPRAS OUTPUT AWARD 2024 01 Google Cloud Partner Top Engineer 2025 DataAnalytics(2024年〜) Google Cloud Partner Tech Blog Challenge 2023 Cloud AI/ML 部門
  2. 前回の話 4 Dev Ops 簡単にまとめると • DevとOpsの両輪でDevOpsである • ソフトウェアを作ることとAIエージェントを作ることは別 •

    ソフトウェア開発の手法はAIエージェント開発に適用できない AIエージェント作るならLLM Ops(GenAIOps)もセットでやろうねって話 作ったものを評価するプロセスを入れないことにはAIエージェント開発は続かない
  3. ソフトウェアはテスト、AIエージェント(LLM)は評価 5 func add 1+1 2 pass 1+1 3 NG

    ソフトウェアは入ってきたものをそのまま解釈して実行する。 一方でAIエージェントはナレッジを元に出力する。(もちろん正解することもある。)
  4. エバリュエーターとは 12 引用:Azure AI Foundry を使用したジェネレーティブ AI の可観測性 - Azure

    AI Foundry | Microsoft Learn https://learn.microsoft.com/ja-jp/azure/ai-foundry/concepts/observability