Upgrade to Pro — share decks privately, control downloads, hide ads and more …

失敗しないAIエージェント開発:階層的タスク分解の実践

 失敗しないAIエージェント開発:階層的タスク分解の実践

三宅雄紀(@zawakin ) / 株式会社ナレッジワーク AIエンジニア エキスパート
2025/3/10 LLM Tech Night #5 by LayerXでの登壇資料です

https://layerx.connpass.com/event/346351/

More Decks by KNOWLEDGE WORK / 株式会社ナレッジワーク

Other Decks in Technology

Transcript

  1. © Knowledge Work Inc. ⾃⼰紹介 zawakin (@zawawahoge) 株式会社ナレッジワーク AIエンジニア エキスパート

    (2020年⼊社) 業務 • プロダクトのAI機能検証‧開発 • 戦略策定 • 組織のAIイネーブルメント など 2
  2. © Knowledge Work Inc. Profile 会社概要 3 Profile 会社概要 創業日 代表者

    事業内容 2020年4月1日 麻野 耕司 ナレッジワークの開発・提供
  3. © Knowledge Work Inc. Agenda ⽬次 5 • イントロダクション ◦

    階層的タスク分解とは? • AIエージェント開発の課題 ◦ 失敗パターン1: 不適切なタスク分解(ドメイン知識の⽋如) ◦ 失敗パターン2: 不安定な下位層タスク(ツール信頼性の不⾜) • まとめ
  4. © Knowledge Work Inc. Agenda ⽬次 6 • イントロダクション ◦

    階層的タスク分解とは? • AIエージェント開発の課題 ◦ 失敗パターン1: 不適切なタスク分解(ドメイン知識の⽋如) ◦ 失敗パターン2: 不安定な下位層タスク(ツール信頼性の不⾜) • まとめ
  5. © Knowledge Work Inc. 階層的タスク分解とは 8 機能を リリース する ソフトウェアエンジニアの「機能をリリースする」を

    階層的タスク分解すると... 設計 実装 デプロイ 運⽤ 要件確認 設計作成 レビュー 依頼 Slackで レビュー依頼 ファイルを読む 質問箇所をメモ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ Slackで質問
  6. © Knowledge Work Inc. 階層的タスク分解とは 機能を リリース する 設計 実装

    デプロイ 運⽤ 要件確認 設計作成 レビュー 依頼 ファイルを読む 質問箇所をメモ ‧ ‧ ‧ 上位タスク (ゴール) 下位タスク (プリミティブ アクション) 9 Slackで レビュー依頼 ‧ ‧ ‧ ‧ ‧ ‧ Slackで質問
  7. © Knowledge Work Inc. Agenda ⽬次 10 • イントロダクション ◦

    階層的タスク分解とは? • AIエージェント開発の課題 ◦ 失敗パターン1: 不適切なタスク分解(ドメイン知識の⽋如) ◦ 失敗パターン2: 不安定な下位層タスク(ツール信頼性の不⾜) • この時代に求められるエンジニア像 • まとめ
  8. © Knowledge Work Inc. 失敗パターン①:不適切なタスク分解(ドメイン知識の⽋如) 11 業務プロセスの階層構造を⼗分に理解できていないと AIエージェントが上⼿く作れない 「機能リリースフロー」を知らない⼈がAIエージェントを作る例 •

    失敗例: ◦ 設計レビュー時には、要件なんて変わらないと思い込む • 実際は: • もっと柔軟に「要件変更をPdMに相談する」とかをやる → 汎⽤性‧網羅性に⽋けたAIエージェント
  9. © Knowledge Work Inc. 14 対策①:ドメインエキスパートとの協働によるタスク分解 無意識で このタスクやってるわ ドメイン
 エキスパート

    
 AIエージェント 
 作る側
 もっと具体的に 聞きたい! ドメインエキスパートの⾔語化をサポートする 傾聴⼒も重要
  10. © Knowledge Work Inc. Agenda ⽬次 15 • イントロダクション ◦

    階層的タスク分解とは? • AIエージェント開発の課題 ◦ 失敗パターン1: 不適切なタスク分解(ドメイン知識の⽋如) ◦ 失敗パターン2: 不安定な下位層タスク(ツール信頼性の不⾜) • まとめ
  11. © Knowledge Work Inc. 失敗パターン②:不安定な下位タスク(ツールの信頼性不⾜) 要件確認 ファイルを読む 質問箇所をメモ 16 ‧

    ‧ ‧ PdMにSlackで 質問 5%でファイルの 読み書きに失敗しちゃう 下位層のタスクが不安定では上位層も機能しない
  12. © Knowledge Work Inc. 下位タスクこそ、厳密に評価をして信頼性を上げましょう 17 対策②:下位タスクの信頼性を上げる 参考文献 : Anthropic

    シリーズは本当に参考になる ブログ:Building Effective AI Agents | Anthropic 動画:Tips for building AI agents 評価も考慮した開発ツール:mastra-ai • 結果を測定する⽅法を確保する ◦ うまく⾏ってるかのフィードバッ クを得る ◦ 実はうまくいったのにそれに気 づかないまま、変えてしまう • シンプルなものから始めて、徐々に複 雑さを増していく
  13. © Knowledge Work Inc. Agenda ⽬次 21 • イントロダクション ◦

    階層的タスク分解とは? • AIエージェント開発の課題 ◦ 失敗パターン1: 不適切なタスク分解(ドメイン知識の⽋如) ◦ 失敗パターン2: 不安定な下位層タスク(ツール信頼性の不⾜) • まとめ
  14. © Knowledge Work Inc. 成功へのキーポイント • 階層的タスク分解の視点でAIエージェント開発を捉え直す • 各階層レベルでの適切な抽象化と安定性の確保 •

    ドメインエキスパートとの協働による正確なタスク分解 結論 • 階層的タスク分解の考え⽅がAIエージェント開発の質を決定する(かも) 22 まとめ