Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIAgentの限界を超え、 現場を動かすAgentic Workflowの設計と実践

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.
Avatar for Koji Miyata Koji Miyata
October 05, 2025

AIAgentの限界を超え、 現場を動かすAgentic Workflowの設計と実践

東京AI祭 2025で登壇させていただいた資料です。
AIAgentのPoCの壁を超えて、実際に業務で効果を出し、業務改善をする為の設計パターンと、
その中でのトレードオフと課題についてまとめています。

【イベントリンク】
https://www.aisai.tokyo/
https://ai-fest-tokyo.connpass.com/event/365303/

【イベント概要】
📌 概要
東京AI祭は日本最大級のAIテックカンファレンスです。専門家によるセッションやブース展示に加え、ハッカソン・生成AI作品コンテストなどの参加型企画を通じて、開発者・クリエイター・学生が最先端の知見とネットワークを深める場となります。

📆 開催日時
DAY1 :2025年10月4日(土) 12:00–18:00 (受付11:30〜)
DAY2 :2025年10月5日(日) 11:00–17:00 (受付10:30〜)

📍 開催場所
Abema Towers 10F・11F (J渋谷駅徒歩7分)

Avatar for Koji Miyata

Koji Miyata

October 05, 2025
Tweet

More Decks by Koji Miyata

Other Decks in Technology

Transcript

  1. © 2025 Algoage, Inc. Profile 2013〜 学生ベンチャー等でエンジニア活動  スマホアプリ •Web開発/VR•AR開発 2015〜

    コロプラ  VRゲーム/IPを使った位置ゲー /スマホゲーム開発 2020〜 DMM.com  2020〜   マーケティングテクノロジー横断部署 EM/TL  2023〜   株式会社DMMCrypto CTO   ブロックチェーン構築 /Crypto事業開発  2025〜   株式会社Algoage CTO   既存事業の運用体制改善 /新規事業の開発 /AIのR&D等 宮田航志 @miyata_17_ このXアカウントで 本日の資料を配布予定です 2
  2. © 2025 Algoage, Inc. R&D HISTORY これまでの R&D事例 創 業

    期 から、 私 たちは「 研 究 × 実 装 × 商 ⽤ 適 ⽤ 」を 強 みとして、AI 技 術 で ⼤ 企 業 の 難 題 を 解 決 してきました。 この課題解決⼒と数々の実績が、DMMグループへのスピーディーな参画を実現させ、現在の“事業創造”の礎となっています。 独自ディープラーニングエンジンの 構築(大手ガス会社向け) 遮蔽物下でも⼈物を追跡するために⾻格 推定モデルを改良。データ拡張や軽量化 を⾏い、リアルタイム処理を実現。 深層学習による画像再構成の研究 (不動産 VR向け) パノラマ特 有の幾 何 歪みやノイズを、 CNN+inpaintingで補正。VRサービス に耐えうる画質で商⽤レベルに適⽤。 画像解析とエンタメを接続する生成 モデル(アニメ業界向け) 1枚のイラストからキャラクターを動か すモデルを開発。少データ環境でも⾃然 なモーションを⽣成できるよう⼯夫。 4
  3. © 2025 Algoage, Inc. © 2025 Algoage, Inc. なぜ今Agentic Workflow?背景と課題

    業務フローの形式化と評価 信頼性/安全性を担保する実行環境 事例と今後の話 設計原則と全体アーキテクチャ AGENDA 本日のアジェンダ 6
  4. © 2025 Algoage, Inc. 自律性に頼りすぎると、小手先のガードレール設計に追われる 再現性の壁:振る舞いが予測不能 同じ指示でも結果が安定しない LLMの内側で都度計画生成させると、外から固定・検証しずらい AIAgentの現場導入を阻む壁 コストの壁:複雑化すると遅くて高くなる

    複雑なタスクほどLLM呼び出しが雪だるま式に増え、待ち時間と費用が読めない 計画と実行が混線し、探索や再試行を外側で制御・キャッシュできない セキュリティ・ガバナンスの壁:運用コストと監査コスト 越権操作やPII露出の懸念で、運用・監査・本番導入が止まる 全体のリスクが掴めないと本番導入は進みずらい ⚠ ⚠ ⚠ 8
  5. © 2025 Algoage, Inc. PoC⇨現場導入のために、業務と環境を見極めて適切な設計選定が必要 ◾外部環境:実際の効果を出す為に  ・LLMの性能向上と共に自律的に任せれるスコープも増えているが、   PoCを超える為の信頼性の壁は高い  ・「顧客が求めていた物」は LLMのビックリ体験の時もあれば、

      普段の業務をミスせず任せられる小さな体験の時もある ◾開発側の観点:コストと実現性  ・”いかに作りこまないか ”が鉄則だが、シンプルなプロンプト /シングルエージェント   マル チエージェント・宣言方ワークフロー /暗黙的ワークフロー等々、日進月歩で   選択肢が変わっている  ・R&D開発コストと要求を踏まえてトレードオフを理解した設計と評価が必要 業務効率化に必要な観点 9
  6. © 2025 Algoage, Inc. 設計パターンマッピング どこまで”宣言”し、どこを “自律”にするか LLM の自 律性

    ワークフロー宣言/ルールの厳密さ 特徴:計画/実行をLLM中心に行う    柔軟性は高い /再現性+コストに難 用途:リサーチ/PoC 等 自律高 × 宣言低 特徴:外側でフローを宣言 ,内側の判断は      LLMで補助。再現性と適応性を両立    安全設計・評価を外付け可能 用途:本番運用の半自動化    採用・要件定義など 自律高 × 宣言高 特徴:単発プロンプト+軽いツール連結    状態を持たない。    立ち上げ最速・再現性低 用途:下書き/要約/軽い調査 自律低 × 宣言低 特徴:フローを厳密に宣言、 LLMは抽出    分類など点部品    決定論的で監査に強いが柔軟性は低い 用途:審査/与信/定型処理・締め作業 自律低 × 宣言高 11
  7. © 2025 Algoage, Inc. 設計パターンマッピング どこまで”宣言”し、どこを “自律”にするか LLM の自 律性

    ワークフロー宣言/ルールの厳密さ 特徴:計画/実行をLLM中心に行う    柔軟性は高い /再現性+コストに難 用途:リサーチ/PoC 等 自律高 × 宣言低 特徴:外側でフローを宣言 ,内側の判断は      LLMで補助。再現性と適応性を両立    安全設計・評価を外付け可能 用途:本番運用の半自動化    採用・要件定義など 自律高 × 宣言高 特徴:単発プロンプト+軽いツール連結    状態を持たない。    立ち上げ最速・再現性低 用途:下書き/要約/軽い調査 自律低 × 宣言低 特徴:フローを厳密に宣言、 LLMは抽出    分類など点部品    決定論的で監査に強いが柔軟性は低い 用途:審査/与信/定型処理・締め作業 自律低 × 宣言高 12 AI Agent Agentic Workflow
  8. © 2025 Algoage, Inc. 設計パターンマッピング どこまで”宣言”し、どこを “自律”にするか LLM の自 律性

    ワークフロー宣言/ルールの厳密さ 特徴:計画/実行をLLM中心に行う    柔軟性は高い /再現性+コストに難 用途:リサーチ/PoC 等 自律高 × 宣言低 特徴:外側でフローを宣言 ,内側の判断は      LLMで補助。再現性と適応性を両立    安全設計・評価を外付け可能 用途:本番運用の半自動化    採用・要件定義など 自律高 × 宣言高 軽量プロンプト連結 単発ツール 簡易オートメーション 小粒タスク/補助用途 自律低 × 宣言低 完全宣言 (DSL100%・テーブル駆動) 従来の仕組みに近い、今までの業務に一部 LLM ワークフローを入れる 自律低 × 宣言高 ⭐ 今日はこれを 深掘りします 13
  9. © 2025 Algoage, Inc. 4つの段階と評価サイクルで、マニュアルの形式知化から安全な実行までを実現する 全業務フロー作成 状態を ストリーム配信 Formalize Intent

    check Exec/Observe Control MCPツール PIIフィルタ    HaaT etc… Agentic Workflow アーキテクチャ 意図解釈と ワークフロー選定 結果ログ 評価ログ 業務改善提案 実行 評価 LangGraph等 でフロー実行 エージェントに 指示 評価/改善 安全実行 14
  10. © 2025 Algoage, Inc. 4つの段階と評価サイクルで、マニュアルの形式知化から安全な実行までを実現する 全業務フロー作成 状態を ストリーム配信 Formalize Intent

    check Exec/Observe Control MCPツール PIIフィルタ    HaaT etc… Agentic Workflow アーキテクチャ 意図解釈 ワークフロー選定 結果ログ 評価ログ 業務改善提案 実行 評価 LangGraph等 でフロー実行 エージェントに 指示 評価/改善 安全実行 16
  11. © 2025 Algoage, Inc. 構文的に正しくても、業務の意図に沿っているとは限らない Validation(構文妥当性) 1. ドメインに特化したDSL定義 2. 人間マニュアルから自動生成

    3. 構文を検証するツールの開発 難所:DSL定義に業務理解が必須 Verification(意味的正しさ) 1. 評価指標の決定 2. 各種ログ分析による評価 3. 価値と網羅性の担保 難所:評価プロセスの構築 業務フロー構築の勘所 17
  12. © 2025 Algoage, Inc. 曖昧な自然言語マニュアルを、 DSLに変換しワークフロー化 人間が書いたマニュアルをLLMが変換 Validation(構文妥当性) LLMによる 変換

    特定ルールによる 自己修正 これにより、構文的な正しさ (Validation) は自動的に担保される DSLのスキーマ辞書をツールとして渡し 文法エラーがなくなるまでLLMが自己修正を繰り返す 18
  13. © 2025 Algoage, Inc. 各業務フローに対するワークフローの網羅性担保と、評価改善 業務フローの深い理解 これまで以上に深く業務に入り込んで深く理解が必要 Verification(意味的正しさ /価値) 網羅性担保

    評価改善 プロセス これにより、ワークフローの網羅率が上がり、AIAgentに任せれる量が増え、 質の担保もされていく 実行環境のログとワークフロー成果物を照らして ワークフロー自体の価値を評価・改善が必須 19
  14. © 2025 Algoage, Inc. 4つの段階と評価サイクルで、マニュアルの形式知化から安全な実行までを実現する 全業務フロー作成 状態を ストリーム配信 Formalize Intent

    check Exec/Observe Control MCPツール PIIフィルタ    HaaT etc… Agentic Workflow アーキテクチャ 意図解釈 ワークフロー選定 結果ログ 評価ログ 業務改善提案 実行 評価 LangGraph等 でフロー実行 エージェントに 指示 評価/改善 安全実行 21
  15. © 2025 Algoage, Inc. 実行すべきワークフローの選定 意図解釈に必要な情報を過去ログ含め検索 必要あれば依頼元に確認する。 実行時の為の コンテキスト 意図解釈の為の

    コンテキスト 実行側のエージェント設計に強く依存するが コンテキストエンジニアリングのチューニングの必要性がある 関連データから外部連携してデータを取得 必要あれば依頼元に確認する 出された指示がどのワークフローにあたるのかの選定 22
  16. © 2025 Algoage, Inc. 4つの段階と評価サイクルで、マニュアルの形式知化から安全な実行までを実現する 全業務フロー作成 状態を ストリーム配信 Formalize Intent

    check Exec/Observe Control PIIフィルタ MCPツール    HaaT etc… Agentic Workflow アーキテクチャ 意図解釈 ワークフロー選定 結果ログ 評価ログ 業務改善提案 実行 評価 LangGraph等 でフロー実行 エージェントに 指示 評価/改善 安全実行 23
  17. © 2025 Algoage, Inc. 重要な判断や操作は、 AIが自律実行せず人間に「止めて、人に尋ねる」 ・ワークフローの途中で人間の判断が必要なステップで プロセスを一時停止 ・ユーザーに情報を提示し、入力を求める (例:承認、追加情報の提供

    ) ・人間の回答を受けて、ワークフローを 安全に再開 する ・AIと人間の自然な協調 を実現する中心的な仕組み、 DSLでも詳細に定義が必要 安全設計例 : Human-as-a-Tool (HaaT) 26
  18. © 2025 Algoage, Inc. 全てのツール実行を中央集権化し、最小権限の原則を徹底する ・権限分離 : 参照系(GET)は自動実行、更新系 (POST)は人間による承認 を必須とする等々

    ・Dry-run: 破壊的操作の前には必ず 差分を提示し、承認後にのみ実行する ・高コストが予想されるアクションに関する事前確認 安全設計例 : MCP呼び出しツールの権限制御 27
  19. © 2025 Algoage, Inc. 状況に応じて適切なワークフロー(子)を動的に生成・実行する 1 親Agent: 依頼内容を解釈 2 親Agent:

    最適なワークフローを選択 3 親Agent: 実行担当の子Agentを生成 4 子Agent: ワークフローをグラフ展開し、忠実に実行 応用例:親子エージェントによる動的な実行 実行段階の設計に関しても速度と信頼性において様々なトレードオフが存在する コンテキストエンジニアリング /エージェントの分割粒度 等々が設計の肝 29
  20. © 2025 Algoage, Inc. 本質的に価値がありインパクトが出せる事業の開発をしています AI R&Dエンジニア AIに関する様々なリサーチとPoC実装 データエンジニア 評価プロセスにおける分析・改善・実装

    フルスタックエンジニア ソフトウェア全般の開発と運用/スクラム運営 EM / PjM / PdM 新規事業のプロダクト開発におけるマネジメント We're Hiring! 30