「OutputOps」なエージェントを作りたかった… ~エージェント開発Tipsを添えて~

「OutputOps」なエージェントを… 作りたかった… ~エージェント開発Tipsを添えて~ 2025/09/27 (土) JAWS-UG 茨城 #7 JAWS FESTA2025
CfP･LT供養祭り福地開

Who am I ? 福地開 (ふくちはるき) @har1101mony 所属：NECソリューションイノベータ株式会社
年次：3年目業務：LLMで遊ぶだけ選出：AWS Community Builders (AI Engineering) 2025 Japan AWS Jr.Champions 2025 Japan All AWS Certifications Engineers

今日話すこと ◆私が作っている、「OutputOpsエージェント」とは？ • よくある悩み • OutputOpsエージェントとは • プロダクトとしての設計思想 ◆アーキテクチャ •
AWSとしてのアーキテクチャ • AIエージェントにおける処理フロー ◆実装で難しかったところ&エージェント開発のTips ※資料中で「AI」と記載しているものは「生成AI」とりわけ「LLM」のことを指します ※所属組織とは一切関係ない、私個人の意見・考えとなります ※AIエージェントとは、みたいな基礎基本の話は省略しております。すみません。

JAWS界隈の人たちはアウトプット熱が高い！！

ただ、そのアウトプット、どのくらい振り返り・改善できていますか…？ (私は全く振り返ってないです)

振り返りは大事 ◆振り返りの軸その1：自身のアウトプット歴 • 何か目標があるとして、自分が今どこまでできているのかを振り返る • 今月は何件ブログ書いて、何回登壇して、聴講者何人で…な感じ ◆振り返りの軸その2：アウトプット内容のフィードバック • 技術ブログ/登壇資料の内容がどうだったのか、聴講者の学びになったのか •
人から直接貰う+今ならLLMからも貰える

振り返りは大事 ◆振り返りの軸その1：自身のアウトプット歴 • 何か目標があるとして、自分が今どこまでできているのかを振り返る • 今月は何件ブログ書いて、何回登壇して、聴講者何人で…な感じ ◆振り返りの軸その2：アウトプット内容のフィードバック • 技術ブログ/登壇資料の内容がどうだったのか、聴講者の学びになったのか •
人から直接貰う+今ならLLMからも貰える https://github.com/minorun365/aws-level-checker

振り返りは大事、とはいえ面倒くさい… ◆アウトプット履歴をまとめたり、フィードバック集めて改善したりする暇があったら次のアウトプットに向けて準備をしたい… ◆ただ、この履歴・フィードバック収集が避けられないこともある • 社内の報告向け • Community Builders/Top Engineersなどの表彰応募
• (特殊)Jr.Champions内でも定期的にアウトプットの報告が必要

振り返りは大事、とはいえ面倒くさい… ◆アウトプット履歴をまとめたり、フィードバック集めて改善したりする暇があったら次のアウトプットに向けて準備をしたい… ◆ただ、この履歴・フィードバック収集が避けられないこともある • 社内の報告向け • Community Builders/Top Engineersなどの表彰応募
• (特殊)Jr.Champions内でも定期的にアウトプットの報告が必要 ◆「差別化されない重労働」 • AWS(もといサーバーレス)の思想に則れば、改善するべきポイント • GPT-5 Thinkingにやらせると、しっちゃかめっちゃかな内容が返ってきた

じゃあOutputOps Agent 作るか…

プロダクト設計：設計思想 ◆作りたいもの：アウトプットの保存・フィードバックなどを自動で行ってくれる AIエージェント

プロダクト設計：設計思想 ◆作りたいもの：アウトプットの保存・フィードバックなどを自動で行ってくれる AIエージェント ◆絶対にデータの格納に手間を掛けたくない！！！ • (前提：AIエージェントはデータが有って初めて真価を発揮する) • わざわざ専用のアンケートフォームやWebアプリを作っても開くのが億劫 •
できるだけデータ格納のハードルを下げたい →毎日自然とアクセスする場所で、URLだけ貼り付ければOK、が理想 ◆複数人や組織、コミュニティでも使えるようにしたい • 自分だけのアウトプット履歴を蓄えるなら、既存のAIチャットで十分 • アウトプットは他人に共有すると更に有意義なもの

プロダクト設計：作っているもの ◆アウトプットのリンクをSlackに投げるだけで、記録完了 • アウトプット履歴を記録(日付、投稿者、内容…) • レベル判定などのフィードバックも実施ブログ書いたで！ https://blog.com/~ りょ

プロダクト設計：作っているもの ◆アウトプットのリンクをSlackに投げるだけで、記録完了 • アウトプット履歴を記録(日付、投稿者、内容…) • レベル判定などのフィードバックも実施 • Slackならスケールしやすい、組織やコミュニティでも使えるワイも書いたで！ https://blog.com/-
りょ

プロダクト設計：作っているもの ◆とはいえSlackにそんな便利機能はないどうしろと…

プロダクト設計：作っているもの ◆とはいえSlackにそんな便利機能はない ◆無いならAIエージェント作れば良いじゃない！ AIエージェントくん頼んだ！おｋさんきゅー

プロダクト設計：作っているもの ◆保存だけじゃなく、振り返りもしたい 8月は5件やね 2025年単位で見ると一番多いで！先月何個ブログ書いたっけ？

プロダクト設計：作っているもの ◆保存だけじゃなく、振り返りもしたい ◆社内報告・表彰応募時のレポート叩き台も作ってほしい！！！ 1年でブログ300件、登壇50回してるでカテゴリーどうする？ CB申し込むからこの1年のアウトプット内容まとめて

プロダクト設計：作っているもの ◆保存だけじゃなく、振り返りもしたい ◆社内報告・表彰応募時のレポート叩き台も作ってほしい！！！関連するブログが60件、登壇が10件やなじゃあ申し込み文考えるわ〜じゃあAI Engineeringで

作るAIエージェントのイメージ 1. アウトプット格納エージェント • Slackのメッセージを取得する • メッセージ内のURLを元に、Web検索を行う • 取得した内容を元に、フィードバック文とレベル判定を考える •
諸々のデータをデータベースに格納する • 投稿者にフィードバックを返す 2. アウトプットに関する質問受付エージェント(Agentic RAG的な) • アウトプット履歴の参照 • 年単位・月単位でのフィードバック作成 • 表彰申込時の叩き台作成

作るAIエージェントのイメージ 1. アウトプット格納エージェント(まだこっちしか喋れません…) • Slackのメッセージを取得する • メッセージ内のURLを元に、Web検索を行う • 取得した内容を元に、フィードバック文とレベル判定を考える •
諸々のデータをデータベースに格納する • 投稿者にフィードバックを返す 2. アウトプットに関する質問受付エージェント(Agentic RAG的な) • アウトプット履歴の参照 • 年単位・月単位でのフィードバック作成 • 表彰申込時の叩き台作成

アーキテクチャ

アーキテクチャ・エージェントは定期実行させたい・ただ、EventBridgeからAgentCoreを直接実行できない・EventBridgeはオーケストレーター Lambdaを起動するだけ

アーキテクチャ・Slack APIで特定のチャンネルからメッセージを取得

アーキテクチャ・LambdaからinvokeAgentRuntime API をコール・Firecrawl MCPでURL検索・レベル判定を行い、Lambdaへ返す

アーキテクチャ・レスポンスを元に、 Lambda側でデータを格納

アーキテクチャ・処理が終わったらSNSで管理者へ通知・バックグラウンドで動作するため、エラーでも成功でも必ず通知が必要・Langfuseにはエージェントのトレースが出力されている・コスト管理、品質管理を目的に参照

アーキテクチャ ※Step Functionsは現状無理です。 Step FunctionsからBedrock AgentCore がコールできないため。ちなみにBedrock Agentsもコール不可。

実装で難しかったところ& エージェント開発のTips

アーキテクチャ設計で難しかった点 ◆良くも悪くもAgentCoreの自由度が高すぎる • やろうと思えばSlackアクセス~ユーザー通知まで、全部AgentCore Runtimeの中に閉じ込めることも可能(多分) ◆ただ現状はEventBridgeからAgentCoreを直接実行できないので Lambdaを挟んだ • Lambdaを挟むのであれば、LambdaでできることはLambdaでやりたい
• その場合はAgentCoreにはエージェントのロジックだけ入れておくようにする方が良いと判断(役割分担)

アーキテクチャ設計で難しかった点 ◆無理やりAgentCoreの中に閉じ込めると、こんな感じ • エージェントがSlackメッセージ取得、Web検索、データ格納まで実施 • Strands Agents SDKのGraph採用→自律性+安定性を両立 • こっちの方が「AIエージェント」っぽい！
◆動きはする、が色んなものを犠牲にする…

プロトタイプのデモ

Tips1. マルチエージェントから始めるな ◆初手でマルチエージェントやAgentic Workflowに手を出すと大変 • Anthropic「シンプルに設計しろ」(Building Effective Agents) • ワイ「やってみたいからGraph使ったろｗいけるやろｗ」←終わりの始まり
◆まずはLLM+Tooluse、もしくはシングルエージェントで設計 • 試して、思ったより精度が出ないときに拡張していく • コスト・処理時間・複雑度はトレードオフなことを理解しておく • (さっきのデモだと1メッセージの処理に2-3分、約10万トークン消費 ) ◆「その処理はエージェントが実行しないといけないか？」を考える • 今回で言えば「Slackからのメッセージ取得はエージェントの仕事か？」 • 安定性と柔軟性のどちらを取るか？は要検討

Tips2. Strands Agent Graphにかなり癖あり ◆複数のエージェントを繋ぎ、決まった順序で確実に実行する設計図 • Agentic Workflowをコードベースで定義できる機能 ◆登場人物 •
ノード：エージェントや関数そのもの • エッジ：ノード間の接続パーツ • Step Functionsを完全にコードベースで定義するようなイメージ ◆何が嬉しい？ • 複雑な作業を小さな専門ノードに分割し、順序と受け渡しを明示できる • 精度向上、処理の安定化、開発とデバッグがやりやすい…など

Tips2. Strands Agent Graphにかなり癖あり ◆ノードがAgentなのが難しい • 同じようなことができるLangGraphだと、ノードがLLMとツール • ある程度柔軟にカスタマイズ可能(な認識、分岐処理やステート管理など) •
Strands AgentsのGraphだと、ノードがAgent • LLMとツール実行のカスタマイズに限りがある(エージェント数珠つなぎみたいになる)

Tips3. AgentCore GatewayのMCPツールに注意 ◆Gatewayには3rdパーティのMCPサーバーが予め用意されている • 問題は、このMCPサーバーの中身がほとんど見えないこと ◆Anthropic「ツールには説明と仕様を詳細に書け」 • Gatewayだと何も見えない…(かろうじてツール名は出力できる) •
GAされたら見えるようになっているといいなぁ… • 現状Gateway使うなら、ツールを自前実装して使う方が良いかも？ Writing effective tools for agents with agents

Tips4. エージェント開発とObservability ◆LLMを組み込んだアプリ開発においては、不確実性が付き纏う • 開発者はLLMの挙動を把握できるようにしておくべき • 開発〜運用まで、幅広い領域で有効活用できる ◆GenAI Observability(CloudWatch +
X-ray) • AWS環境上でもエージェントの挙動はある程度確認できる • ログ出力も確認できる

Tips4. エージェント開発とObservability ◆AgentCoreからLangfuseへのトレース送信方法 • AgentCoreはデフォルトだとCloudWatch+X-rayへトレースを送信する • Langfuseは上記の方法だとトレースを受け取れないので、少しアレンジ • つよつよBedrockerなお二方に助けていただきました https://github.com/har1101/strands-
agent-with-langfuse-on-agentcore https://github.com/moritalous/ strands-agents-langfuse

Tips4. エージェント開発とObservability ◆現状だと正直Langfuseの方が見やすいのでこちらが必須かなと…

おまけ：Bedrock AgentCoreのIaC化 ◆AWS CDK ver.2.217.0にて待望のL1 Construct登場 ◆既に記事が出ているのでぜひご一読ください https://qiita.com/Syoitu/items/65fda40c75d d467b5cd7?utm_campaign=post_article&utm _medium=twitter&utm_source=twitter_share
https://zenn.dev/aws_japan/articles/ 2025-09-25-agentcore-runtime-l1

おまけ：Bedrock AgentCoreのIaC化 ◆ちなみにAgentCore SDKを使ってのデプロイには、 CDK(およびCloudFormation)だと対応していないようです (@app.entrypoint などのラッパー関数を使う方法、ハンズオンだとこちらが一般的でした) https://strandsagents.com/latest/documentation/docs/user- guide/deploy/deploy_to_bedrock_agentcore/#option-b-custom-agent

◆今作っているものと過程で詰まったポイントのお話をしました！ • シンプルなエージェントから始めよう • Strands Agent Graphは癖あり • AgentCore Gatewayの既成MCPサーバーはほぼブラックボックス
• エージェント開発においてObservabilityは必須 • 祝・AgentCoreのIaC対応 ◆懺悔：完成品を持ってこれずすみません…… • これがPJだったら今頃大炎上 • とはいえ手を動かすことでしか得られない経験値もある(多分) • エージェント開発やっていきましょう！ • 完成次第公開するので良ければ使ってみてください！まとめ

2025.12.20(土) AI Builders Day！

「OutputOps」なエージェントを作りたかった…~エージェント開発Tipsを添えて~

「OutputOps」なエージェントを作りたかった… ~エージェント開発Tipsを添えて~

Har1101

More Decks by Har1101

Featured

Transcript