Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
手動からの解放!!Strands Agents で実現する総合テスト自動化
Search
井手亮太
July 23, 2025
Technology
4
750
手動からの解放!!Strands Agents で実現する総合テスト自動化
JAWS-UG 東京 Strands Agents Meetupで登壇した内容です。
井手亮太
July 23, 2025
Tweet
Share
More Decks by 井手亮太
See All by 井手亮太
Strands Agents & Amazon Bedrock AgentCoreで広がるAIエージェントの可能性
ideaws
0
12
Japan AWS Jr. Champions を目指して、そしてその先へ
ideaws
0
91
描くのはAI、創るのはあなた Amazon Nova Canvas の世界
ideaws
0
3
Other Decks in Technology
See All in Technology
【Grafana Meetup Japan #6】Grafanaをリバプロ配下で動かすときにやること ~ Grafana Liveってなんだ ~
yoshitake945
0
100
Jaws-ug名古屋_LT資料_20250829
azoo2024
3
180
進捗
ydah
1
210
DeNA での思い出 / Memories at DeNA
orgachem
PRO
5
1.8k
知られざるprops命名の慣習 アクション編
uhyo
11
2.8k
攻撃と防御で実践するプロダクトセキュリティ演習~導入パート~
recruitengineers
PRO
3
1.4k
ソフトウェア エンジニアとしての 姿勢と心構え
recruitengineers
PRO
22
11k
トヨタ生産方式(TPS)入門
recruitengineers
PRO
5
1.2k
ドキュメントはAIの味方!スタートアップのアジャイルを加速するADR
kawauso
3
460
実践データベース設計 ①データベース設計概論
recruitengineers
PRO
4
1.6k
退屈なことはDevinにやらせよう〜〜Devin APIを使ったVisual Regression Testの自動追加〜
kawamataryo
4
900
帳票Vibe Coding
terurou
0
150
Featured
See All Featured
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
570
How to Think Like a Performance Engineer
csswizardry
26
1.8k
Build your cross-platform service in a week with App Engine
jlugia
231
18k
Automating Front-end Workflow
addyosmani
1370
200k
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
9
790
Music & Morning Musume
bryan
46
6.8k
How GitHub (no longer) Works
holman
315
140k
StorybookのUI Testing Handbookを読んだ
zakiyama
30
6k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.8k
Transcript
Strands Agents で実現する総合テスト自動化 手動からの 解放 !!
自己紹介 3 ある日のお仕事 4 やってみた 8 今後の展望 17
c o n n p a s s https://tech.nri-net.com/archive/author/r-ide-ryota
井手 亮太 Activity BORN IN AGE JOB HOBBY 大阪府吹田市 基盤構築・運用 25歳 社会人 2年目 海外サッカー観戦(リバプール・ブライトン) いで りょうた 執 筆 ブ ロ グ https://nrinetcom.connpass.com/ https://nrinetcom.connpass.com/
c o n n p a s s https://tech.nri-net.com/archive/author/r-ide-ryota
井手 亮太 Activity BORN IN AGE JOB HOBBY 大阪府吹田市 基盤構築・運用 25歳 社会人 2年目 海外サッカー観戦(リバプール・ブライトン) いで りょうた 執 筆 ブ ロ グ https://nrinetcom.connpass.com/ https://nrinetcom.connpass.com/ 8/19(火) 19:00~20:00 勉強会開催します!
実践 02
総合テスト 調査 エビデンス取得 定期実行されてる? エラーを吐いてない? 正常なログ吐いてる? システムログ 画面キャプチャ システムが仕様通りの動作をしているか確認するテストのこと
AWS上のシステムにおけるテスト手法 テストケースを確認 コンソールを開く エビデンス用の スクリーンショットを撮る 手動 テストケースを確認 シェルスクリプトを実装 実行したコマンドと その結果を
エビデンスとする AWS CLI とにかく時間がかかる 人的ミスが発生しやすい シェルの知識が必要 汎用的な活用が難しい
そんな時に出会ったのが。。。 MCP Server にも対応 数多くの組み込みツール が用意されていること Strands Agents テスト自動化 実現できるん
じゃない?
やってみた 02
テスト対象システム AWS Cloud Amazon EventBridge AWS Lambda Amazon Bedrock AWS最新ニュース通知アプリ
定期実行 Slackに通知 翻訳 ニュース取得
テストケース 0 1 EventBridge 実行状況 ✓ 定期実行されているか Lambda メトリクス ✓
Invocations が1以上 ✓ Errorsが0 Lambda ログ ✓ 正常なログが出力されているか ✓ エラーログを吐いていないか Slack 通知 ✓ ニュースが通知されているか 0 2 0 3 0 4
テストケース 0 1 EventBridge 実行状況 ✓ 定期実行されているか Lambda メトリクス ✓
Invocations が1以上 ✓ Errorsが0 Lambda ログ ✓ 正常なログが出力されているか ✓ エラーログを吐いていないか Slack 通知 ✓ ニュースが通知されているか 0 2 0 3 0 4
テストケース テスト手法、及びテストに必要な パラメータの情報を記載 テストの期待される結果 テストの期待される結果が 得られた場合⇒ OK そうでない場合 ⇒ NG
をAIが記載する
Strands Agents テストケース ① テストケースの読み取り(file_read) ① テストの流れ (EventBridge 実行状況) SDK
で作成 ※ 赤字はStrands Agents に デフォルトで組み込まれているツール
Strands Agents ③ テストケース ② AWS Cloud ① テストケースの読み取り(file_read) ②
AWS CLIの実行 (Shell) ③ Lambda MCP Server 経由で メトリクスグラフ保存Lambda を実行 Amazon CloudWatch AWS Lambda Amazon S3 ① テストの流れ (EventBridge 実行状況)
Strands Agents ③ テストケース ② AWS Cloud ① テストケースの読み取り(file_read) ②
AWS CLIの実行 (Shell) ③ Lambda MCP Server 経由で メトリクスグラフ保存Lambda を実行 ④ S3 に保存したメトリクスグラフを CLI でダウンロード(Shell) Amazon CloudWatch AWS Lambda Amazon S3 ① エビデンスフォルダ ④ テストの流れ (EventBridge 実行状況)
Strands Agents ③ テストケース ② AWS Cloud ⑤ 実行したコマンドとその結果をエビデンスとして ファイルにまとめる(file_write)
⑥ テスト結果と期待値を照合し、結果列を更新(editor) Amazon CloudWatch AWS Lambda Amazon S3 ① エビデンスフォルダ ④ エビデンスフォルダ ⑤ ⑥ テストの流れ (EventBridge 実行状況)
Strands Agents ② テストケース ② ※ 認証情報を基にチャンネルにアクセスして、 メッセージ内容を確認(slack) ④ テスト結果と期待値を照合し、結果列を更新(editor)
① エビデンスフォルダ ③ ④ ニュースが通知されたスレッド ※ 認 証 情 報 S l a c k a p i で ト ー ク ン 発 行 ⇒ 環 境 変 数 S L A C K _ B O T _ T O K E N と S L A C K _ A P P _ T O K E N を 設 定 す る ③ エビデンスとして スレッドURLを保存(file_write) テストの流れ (Slack 通知確認)
こんなこともできる テストケースが多く、1つのエージェントじゃ大変 Strands Agents はマルチエージェントにも対応 コーディネーター AWS CLI エージェント メトリクスグラフ取得エージェント
Slack エージェント ユーザー テストケース1はAWS CLI テストケース2はSlack エージェント
具体的な実装方法 コーディネーター Lambda MCP Server エージェント @tool を用いることで独自ツールを作成 エージェントもツールとして扱える コーディネーターエージェントにツールを登録する
実践 02
今後の展望 セキュリティ面での考慮 ⚫ 適切な権限の設定 ⚫ データの保護 今後、本格利用していくためには。。。 ツールを育てる ⚫ トライ&エラーを繰り返して継続的な改善
⚫ プロンプトの微調整、コンテキストの最適化 テストツール自体の評価 ⚫ AIエージェントの評価方法を学ぶ&明確に ⚫ 人間によるレビューが必須のため 技術的な知識は必要
「テストは話しかけるだけ」を「個人」で実現していこう!! Strands Agentsによるテスト自動化 ⚫ 組み込みツールを用いたファイル・シェル操作 ⚫ MCP Server を用いた AWS
環境との連携 ⚫ 本格的な利用には、セキュリティ面の考慮やツールの評価 方法を確立する必要性がある
THANKYOU