Upgrade to Pro — share decks privately, control downloads, hide ads and more …

さまざまなAgent FrameworkとAIエージェントの評価

Avatar for Kento.Yamada Kento.Yamada
October 25, 2025

さまざまなAgent FrameworkとAIエージェントの評価

2025年10月25日に開催された .NETラボ 勉強会 2025年10月の登壇資料です。

※docswell、始めました。
https://www.docswell.com/s/ymd65536/5VMNWL-ms-agent-framework-eval-2025-10-25

Microsoft AgentframeworkでAIエージェントを開発して
Microsoft.Extensions.AIとAzure AI FoundryでAIエージェントを評価するデモをやりました。

デモで使ったリポジトリ:https://github.com/ymd65536/CloudRunBlazor

スライド内のリンク

Strands Agents
https://github.com/strands-agents/sdk-python

サンプルコード:
https://github.com/ymd65536/strands_agents_sdk/blob/main/sample/getting_started/agent.py

ADK徹底解説
https://speakerdeck.com/ymd65536/google-agent-development-kit-deline-botwozuo-tutemita

Microsoft Agent Framework
https://learn.microsoft.com/ja-jp/agent-framework/overview/agent-framework-overview

【GitHub Codespaces】Microsoft Agent FrameworkをBlazorで動かしてみる
https://zenn.dev/ymd65536/articles/ms_agent_framework_codespaces

Microsoft Agent Framework: インテリジェント AI エージェントのためのオープンソース エンジン - YouTube
https://www.youtube.com/watch?v=yOBcPuLLmuY&t=32s

リスクおよび安全性評価者 (プレビュー)
https://learn.microsoft.com/ja-jp/azure/ai-foundry/concepts/evaluation-evaluators/risk-safety-evaluators

汎用エバリュエーター
https://learn.microsoft.com/ja-jp/azure/ai-foundry/concepts/evaluation-evaluators/general-purpose-evaluators

Relevance
https://learn.microsoft.com/ja-jp/azure/ai-foundry/concepts/evaluation-evaluators/rag-evaluators#relevance

Avatar for Kento.Yamada

Kento.Yamada

October 25, 2025
Tweet

More Decks by Kento.Yamada

Other Decks in Research

Transcript

  1. 山田顕人(Kento.Yamada) @ymd65536 自己紹介 2 仕事:クラウドインテグレーション開発 ロール:マルチクラウドデベロッパー 活動:.NETラボ勉強会の運営、Azure AI Community運営 最近:Microsoft

    MVP 2年目になりました。 受賞歴 LAPRAS OUTPUT AWARD 2024 01 Google Cloud Partner Top Engineer 2025 DataAnalytics(2024年〜) Google Cloud Partner Tech Blog Challenge 2023 Cloud AI/ML 部門
  2. 今日話すこと ゴール:AIエージェントを開発/評価するといった内容を学ぶ • 前回の話 ここから本題:AIエージェントの評価方法について • AIエージェントとは何か(定義の話) • さまざまなAgent Framework

    • AIエージェントの評価・モニタリング • Microsoft Agent Frameworkとは • デモ • そもそも:~を使えば良いんじゃないかって? • まとめ 3
  3. さまざまなAgent Framework(一部紹介) • LangChain • Strands Agents(AWS) • Agent Development

    Kit(Google) • Mastra • CrewAI • Claude Agents SDK • OpenAI Agents SDK 今回紹介するものに関連 • Semantic Kernel • AutoGen • Microsoft.Extensions.AI 6
  4. Google Agent Development Kitの構造 11 SessionService Agent Runner name model

    description instruction Tool エージェントの情報 Toolの設定 チャットセッションの管理 ルートエージェント エージェントの起動 SubAgent SubAgentの設定 MemoryService チャット履歴の管理
  5. 14

  6. インテリジェント AI エージェントのためのオープンソース エンジン 16 Microsoft Agent Framework: インテリジェント AI

    エージェントのためのオープンソース エンジン - YouTube https://www.youtube.com/watch?v=yOBcPuLLmuY&t=32s
  7. 自然言語の回答からAIエージェントを評価する 大事なこと • 性能の検証 • 信頼性と安全性の確保(Azure Content Safetyの機能) • ユーザー体験の向上

    以下の2つで実現可能 Azure AI Evaluation SDK Microsoft.Extensions.AI.Evaluation ※他の方法もあるけど、それは最後のオチで説明します 20
  8. AIエージェントの信頼性と安全性の確保(前回やった) • HateUnfairnessEvaluator ◦ ヘイト判定 • SexualEvaluator ◦ 性的コンテンツ判定(Learnではエロ用語という記述もある) •

    ViolenceEvaluator ◦ 暴力コンテンツ判定 • SelfHarmEvaluator ◦ 自傷コンテンツ判定 • CodeVulnerabilityEvaluator ◦ コードの脆弱性 22 参考:https://learn.microsoft.com/ja-jp/azure/ai-foundry/concepts/evaluation-evaluators/risk-safety-evaluators
  9. ユーザー体験の向上 ユーザにとって受け取りやすいか(流暢性)などを評価する。 • 一貫性 ◦ CoherenceEvaluator ◦ 次のスライドで例を紹介 • 流暢性

    ◦ FluencyEvaluator • 質問と応答の関連性 ◦ RelevanceEvaluator 参考 :https://learn.microsoft.com/ja-jp/azure/ai-foundry/concepts/evaluation- evaluators/general-purpose-evaluators 23
  10. 25 デモ用の構成 Cloud Run Blazor Server Cloud Monitoring Microsoft Azure

    Secret Manager マネージドIDを呼び出し Cloud Build
  11. オチ:そもそも~を使えば良いんじゃないかって? 30 Azure AI Foundry Agent Serviceではなく Azure AI Evaluation

    SDKやMicrosoft.Extensions.AI.Evaluationを使う理由 • 特定の評価項目に対してより小さいアプローチをかけたい • ローカルテストコードに組み込みたい • CI/CDに組み込む ◦ GitHub Actionsに組み込むなど
  12. まとめ • 前回の振り返り • さまざまなAgent Framework • Microsoft Agent Frameworkについて

    • 評価器の説明をいくつか • 実際にいくつかデモを見た • 使い分けが大事 31