Slide 17
Slide 17 text
© Knowledge Work Inc.
下位タスクこそ、厳密に評価をして信頼性を上げましょう
17
対策②:下位タスクの信頼性を上げる
参考文献 :
Anthropic シリーズは本当に参考になる
ブログ:Building Effective AI Agents | Anthropic
動画:Tips for building AI agents
評価も考慮した開発ツール:mastra-ai
● 結果を測定する⽅法を確保する
○ うまく⾏ってるかのフィードバッ
クを得る
○ 実はうまくいったのにそれに気
づかないまま、変えてしまう
● シンプルなものから始めて、徐々に複
雑さを増していく