$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
手動からの解放!!Strands Agents で実現する総合テスト自動化
Search
井手亮太
July 23, 2025
Technology
5
910
手動からの解放!!Strands Agents で実現する総合テスト自動化
JAWS-UG 東京 Strands Agents Meetupで登壇した内容です。
井手亮太
July 23, 2025
Tweet
Share
More Decks by 井手亮太
See All by 井手亮太
Strands Agents & Amazon Bedrock AgentCoreで広がるAIエージェントの可能性
ideaws
0
21
Japan AWS Jr. Champions を目指して、そしてその先へ
ideaws
0
120
描くのはAI、創るのはあなた Amazon Nova Canvas の世界
ideaws
0
11
Other Decks in Technology
See All in Technology
Knowledge Work の AI Backend
kworkdev
PRO
0
280
『君の名は』と聞く君の名は。 / Your name, you who asks for mine.
nttcom
1
120
Next.js 16の新機能 Cache Components について
sutetotanuki
0
190
半年で、AIゼロ知識から AI中心開発組織の変革担当に至るまで
rfdnxbro
0
150
AI との良い付き合い方を僕らは誰も知らない
asei
0
270
Authlete で実装する MCP OAuth 認可サーバー #CIMD の実装を添えて
watahani
0
190
Amazon Bedrock Knowledge Bases × メタデータ活用で実現する検証可能な RAG 設計
tomoaki25
6
2.4k
2025-12-18_AI駆動開発推進プロジェクト運営について / AIDD-Promotion project management
yayoi_dd
0
160
20251203_AIxIoTビジネス共創ラボ_第4回勉強会_BP山崎.pdf
iotcomjpadmin
0
140
フィッシュボウルのやり方 / How to do a fishbowl
pauli
2
390
モダンデータスタックの理想と現実の間で~1.3億人Vポイントデータ基盤の現在地とこれから~
taromatsui_cccmkhd
2
270
LayerX QA Night#1
koyaman2
0
270
Featured
See All Featured
Heart Work Chapter 1 - Part 1
lfama
PRO
3
35k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
97
The World Runs on Bad Software
bkeepers
PRO
72
12k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
51
A Tale of Four Properties
chriscoyier
162
23k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
0
22
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
130
Git: the NoSQL Database
bkeepers
PRO
432
66k
Balancing Empowerment & Direction
lara
5
820
Side Projects
sachag
455
43k
Statistics for Hackers
jakevdp
799
230k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Transcript
Strands Agents で実現する総合テスト自動化 手動からの 解放 !!
自己紹介 3 ある日のお仕事 4 やってみた 8 今後の展望 17
c o n n p a s s https://tech.nri-net.com/archive/author/r-ide-ryota
井手 亮太 Activity BORN IN AGE JOB HOBBY 大阪府吹田市 基盤構築・運用 25歳 社会人 2年目 海外サッカー観戦(リバプール・ブライトン) いで りょうた 執 筆 ブ ロ グ https://nrinetcom.connpass.com/ https://nrinetcom.connpass.com/
c o n n p a s s https://tech.nri-net.com/archive/author/r-ide-ryota
井手 亮太 Activity BORN IN AGE JOB HOBBY 大阪府吹田市 基盤構築・運用 25歳 社会人 2年目 海外サッカー観戦(リバプール・ブライトン) いで りょうた 執 筆 ブ ロ グ https://nrinetcom.connpass.com/ https://nrinetcom.connpass.com/ 8/19(火) 19:00~20:00 勉強会開催します!
実践 02
総合テスト 調査 エビデンス取得 定期実行されてる? エラーを吐いてない? 正常なログ吐いてる? システムログ 画面キャプチャ システムが仕様通りの動作をしているか確認するテストのこと
AWS上のシステムにおけるテスト手法 テストケースを確認 コンソールを開く エビデンス用の スクリーンショットを撮る 手動 テストケースを確認 シェルスクリプトを実装 実行したコマンドと その結果を
エビデンスとする AWS CLI とにかく時間がかかる 人的ミスが発生しやすい シェルの知識が必要 汎用的な活用が難しい
そんな時に出会ったのが。。。 MCP Server にも対応 数多くの組み込みツール が用意されていること Strands Agents テスト自動化 実現できるん
じゃない?
やってみた 02
テスト対象システム AWS Cloud Amazon EventBridge AWS Lambda Amazon Bedrock AWS最新ニュース通知アプリ
定期実行 Slackに通知 翻訳 ニュース取得
テストケース 0 1 EventBridge 実行状況 ✓ 定期実行されているか Lambda メトリクス ✓
Invocations が1以上 ✓ Errorsが0 Lambda ログ ✓ 正常なログが出力されているか ✓ エラーログを吐いていないか Slack 通知 ✓ ニュースが通知されているか 0 2 0 3 0 4
テストケース 0 1 EventBridge 実行状況 ✓ 定期実行されているか Lambda メトリクス ✓
Invocations が1以上 ✓ Errorsが0 Lambda ログ ✓ 正常なログが出力されているか ✓ エラーログを吐いていないか Slack 通知 ✓ ニュースが通知されているか 0 2 0 3 0 4
テストケース テスト手法、及びテストに必要な パラメータの情報を記載 テストの期待される結果 テストの期待される結果が 得られた場合⇒ OK そうでない場合 ⇒ NG
をAIが記載する
Strands Agents テストケース ① テストケースの読み取り(file_read) ① テストの流れ (EventBridge 実行状況) SDK
で作成 ※ 赤字はStrands Agents に デフォルトで組み込まれているツール
Strands Agents ③ テストケース ② AWS Cloud ① テストケースの読み取り(file_read) ②
AWS CLIの実行 (Shell) ③ Lambda MCP Server 経由で メトリクスグラフ保存Lambda を実行 Amazon CloudWatch AWS Lambda Amazon S3 ① テストの流れ (EventBridge 実行状況)
Strands Agents ③ テストケース ② AWS Cloud ① テストケースの読み取り(file_read) ②
AWS CLIの実行 (Shell) ③ Lambda MCP Server 経由で メトリクスグラフ保存Lambda を実行 ④ S3 に保存したメトリクスグラフを CLI でダウンロード(Shell) Amazon CloudWatch AWS Lambda Amazon S3 ① エビデンスフォルダ ④ テストの流れ (EventBridge 実行状況)
Strands Agents ③ テストケース ② AWS Cloud ⑤ 実行したコマンドとその結果をエビデンスとして ファイルにまとめる(file_write)
⑥ テスト結果と期待値を照合し、結果列を更新(editor) Amazon CloudWatch AWS Lambda Amazon S3 ① エビデンスフォルダ ④ エビデンスフォルダ ⑤ ⑥ テストの流れ (EventBridge 実行状況)
Strands Agents ② テストケース ② ※ 認証情報を基にチャンネルにアクセスして、 メッセージ内容を確認(slack) ④ テスト結果と期待値を照合し、結果列を更新(editor)
① エビデンスフォルダ ③ ④ ニュースが通知されたスレッド ※ 認 証 情 報 S l a c k a p i で ト ー ク ン 発 行 ⇒ 環 境 変 数 S L A C K _ B O T _ T O K E N と S L A C K _ A P P _ T O K E N を 設 定 す る ③ エビデンスとして スレッドURLを保存(file_write) テストの流れ (Slack 通知確認)
こんなこともできる テストケースが多く、1つのエージェントじゃ大変 Strands Agents はマルチエージェントにも対応 コーディネーター AWS CLI エージェント メトリクスグラフ取得エージェント
Slack エージェント ユーザー テストケース1はAWS CLI テストケース2はSlack エージェント
具体的な実装方法 コーディネーター Lambda MCP Server エージェント @tool を用いることで独自ツールを作成 エージェントもツールとして扱える コーディネーターエージェントにツールを登録する
実践 02
今後の展望 セキュリティ面での考慮 ⚫ 適切な権限の設定 ⚫ データの保護 今後、本格利用していくためには。。。 ツールを育てる ⚫ トライ&エラーを繰り返して継続的な改善
⚫ プロンプトの微調整、コンテキストの最適化 テストツール自体の評価 ⚫ AIエージェントの評価方法を学ぶ&明確に ⚫ 人間によるレビューが必須のため 技術的な知識は必要
「テストは話しかけるだけ」を「個人」で実現していこう!! Strands Agentsによるテスト自動化 ⚫ 組み込みツールを用いたファイル・シェル操作 ⚫ MCP Server を用いた AWS
環境との連携 ⚫ 本格的な利用には、セキュリティ面の考慮やツールの評価 方法を確立する必要性がある
THANKYOU