Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIエージェントの開発と評価、GenAIOps(LLM Ops)

Avatar for Kento.Yamada Kento.Yamada
September 27, 2025
90

AIエージェントの開発と評価、GenAIOps(LLM Ops)

2025年09月27日に開催された .NETラボ 勉強会 2025年9月の登壇資料です。

Azure AI Foundryを使って、生成AIの評価方法について説明し、Evaluatorのデモをしました。

デモ用のリポジトリ
https://github.com/ymd65536/azure_ai_eval_sdk.git

スライド内にある資料
生成 AI のエージェント エバリュエーター - Azure AI Foundry - Microsoft Learn
https://learn.microsoft.com/ja-jp/azure/ai-foundry/concepts/evaluation-evaluators/risk-safety-evaluators?wt.mc_id=MVP_357747

Avatar for Kento.Yamada

Kento.Yamada

September 27, 2025
Tweet

Transcript

  1. 山田顕人(Kento.Yamada) @ymd65536 自己紹介 2 仕事:クラウドインテグレーション開発 ロール:マルチクラウドデベロッパー 活動:.NETラボ勉強会の運営、Azure AI Community運営 最近:Microsoft

    MVP 2年目になりました。 受賞歴 LAPRAS OUTPUT AWARD 2024 01 Google Cloud Partner Top Engineer 2025 DataAnalytics(2024年〜) Google Cloud Partner Tech Blog Challenge 2023 Cloud AI/ML 部門
  2. 前回の話 4 Dev Ops 簡単にまとめると • DevとOpsの両輪でDevOpsである • ソフトウェアを作ることとAIエージェントを作ることは別 •

    ソフトウェア開発の手法はAIエージェント開発に適用できない AIエージェント作るならLLM Ops(GenAIOps)もセットでやろうねって話 作ったものを評価するプロセスを入れないことにはAIエージェント開発は続かない
  3. ソフトウェアはテスト、AIエージェント(LLM)は評価 5 func add 1+1 2 pass 1+1 3 NG

    ソフトウェアは入ってきたものをそのまま解釈して実行する。 一方でAIエージェントはナレッジを元に出力する。(もちろん正解することもある。)
  4. エバリュエーターとは 12 引用:Azure AI Foundry を使用したジェネレーティブ AI の可観測性 - Azure

    AI Foundry | Microsoft Learn https://learn.microsoft.com/ja-jp/azure/ai-foundry/concepts/observability