Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
手動からの解放!!Strands Agents で実現する総合テスト自動化
Search
井手亮太
July 23, 2025
Technology
5
840
手動からの解放!!Strands Agents で実現する総合テスト自動化
JAWS-UG 東京 Strands Agents Meetupで登壇した内容です。
井手亮太
July 23, 2025
Tweet
Share
More Decks by 井手亮太
See All by 井手亮太
Strands Agents & Amazon Bedrock AgentCoreで広がるAIエージェントの可能性
ideaws
0
16
Japan AWS Jr. Champions を目指して、そしてその先へ
ideaws
0
110
描くのはAI、創るのはあなた Amazon Nova Canvas の世界
ideaws
0
6
Other Decks in Technology
See All in Technology
研究開発部メンバーの働き⽅ / Sansan R&D Profile
sansan33
PRO
3
20k
アウトプットから始めるOSSコントリビューション 〜eslint-plugin-vueの場合〜 #vuefes
bengo4com
3
1.7k
ソフトウェアエンジニアの生成AI活用と、これから
lycorptech_jp
PRO
0
890
AI駆動で進める依存ライブラリ更新 ─ Vue プロジェクトの品質向上と開発スピード改善の実践録
sayn0
1
290
もう外には出ない。より快適なフルリモート環境を目指して
mottyzzz
13
10k
頭部ふわふわ浄酔器
uyupun
0
110
オブザーバビリティと育てた ID管理・認証認可基盤の歩み / The Journey of an ID Management, Authentication, and Authorization Platform Nurtured with Observability
kaminashi
1
610
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
5
44k
GraphRAG グラフDBを使ったLLM生成(自作漫画DBを用いた具体例を用いて)
seaturt1e
1
130
Contract One Engineering Unit 紹介資料
sansan33
PRO
0
9k
難しいセキュリティ用語をわかりやすくしてみた
yuta3110
0
390
OCIjp_Oracle AI World_Recap
shinpy
1
180
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
49
14k
Site-Speed That Sticks
csswizardry
13
920
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6k
Being A Developer After 40
akosma
91
590k
Building Adaptive Systems
keathley
44
2.8k
Keith and Marios Guide to Fast Websites
keithpitt
411
23k
KATA
mclloyd
PRO
32
15k
Six Lessons from altMBA
skipperchong
29
4k
Fireside Chat
paigeccino
41
3.7k
The Cost Of JavaScript in 2023
addyosmani
55
9.1k
Transcript
Strands Agents で実現する総合テスト自動化 手動からの 解放 !!
自己紹介 3 ある日のお仕事 4 やってみた 8 今後の展望 17
c o n n p a s s https://tech.nri-net.com/archive/author/r-ide-ryota
井手 亮太 Activity BORN IN AGE JOB HOBBY 大阪府吹田市 基盤構築・運用 25歳 社会人 2年目 海外サッカー観戦(リバプール・ブライトン) いで りょうた 執 筆 ブ ロ グ https://nrinetcom.connpass.com/ https://nrinetcom.connpass.com/
c o n n p a s s https://tech.nri-net.com/archive/author/r-ide-ryota
井手 亮太 Activity BORN IN AGE JOB HOBBY 大阪府吹田市 基盤構築・運用 25歳 社会人 2年目 海外サッカー観戦(リバプール・ブライトン) いで りょうた 執 筆 ブ ロ グ https://nrinetcom.connpass.com/ https://nrinetcom.connpass.com/ 8/19(火) 19:00~20:00 勉強会開催します!
実践 02
総合テスト 調査 エビデンス取得 定期実行されてる? エラーを吐いてない? 正常なログ吐いてる? システムログ 画面キャプチャ システムが仕様通りの動作をしているか確認するテストのこと
AWS上のシステムにおけるテスト手法 テストケースを確認 コンソールを開く エビデンス用の スクリーンショットを撮る 手動 テストケースを確認 シェルスクリプトを実装 実行したコマンドと その結果を
エビデンスとする AWS CLI とにかく時間がかかる 人的ミスが発生しやすい シェルの知識が必要 汎用的な活用が難しい
そんな時に出会ったのが。。。 MCP Server にも対応 数多くの組み込みツール が用意されていること Strands Agents テスト自動化 実現できるん
じゃない?
やってみた 02
テスト対象システム AWS Cloud Amazon EventBridge AWS Lambda Amazon Bedrock AWS最新ニュース通知アプリ
定期実行 Slackに通知 翻訳 ニュース取得
テストケース 0 1 EventBridge 実行状況 ✓ 定期実行されているか Lambda メトリクス ✓
Invocations が1以上 ✓ Errorsが0 Lambda ログ ✓ 正常なログが出力されているか ✓ エラーログを吐いていないか Slack 通知 ✓ ニュースが通知されているか 0 2 0 3 0 4
テストケース 0 1 EventBridge 実行状況 ✓ 定期実行されているか Lambda メトリクス ✓
Invocations が1以上 ✓ Errorsが0 Lambda ログ ✓ 正常なログが出力されているか ✓ エラーログを吐いていないか Slack 通知 ✓ ニュースが通知されているか 0 2 0 3 0 4
テストケース テスト手法、及びテストに必要な パラメータの情報を記載 テストの期待される結果 テストの期待される結果が 得られた場合⇒ OK そうでない場合 ⇒ NG
をAIが記載する
Strands Agents テストケース ① テストケースの読み取り(file_read) ① テストの流れ (EventBridge 実行状況) SDK
で作成 ※ 赤字はStrands Agents に デフォルトで組み込まれているツール
Strands Agents ③ テストケース ② AWS Cloud ① テストケースの読み取り(file_read) ②
AWS CLIの実行 (Shell) ③ Lambda MCP Server 経由で メトリクスグラフ保存Lambda を実行 Amazon CloudWatch AWS Lambda Amazon S3 ① テストの流れ (EventBridge 実行状況)
Strands Agents ③ テストケース ② AWS Cloud ① テストケースの読み取り(file_read) ②
AWS CLIの実行 (Shell) ③ Lambda MCP Server 経由で メトリクスグラフ保存Lambda を実行 ④ S3 に保存したメトリクスグラフを CLI でダウンロード(Shell) Amazon CloudWatch AWS Lambda Amazon S3 ① エビデンスフォルダ ④ テストの流れ (EventBridge 実行状況)
Strands Agents ③ テストケース ② AWS Cloud ⑤ 実行したコマンドとその結果をエビデンスとして ファイルにまとめる(file_write)
⑥ テスト結果と期待値を照合し、結果列を更新(editor) Amazon CloudWatch AWS Lambda Amazon S3 ① エビデンスフォルダ ④ エビデンスフォルダ ⑤ ⑥ テストの流れ (EventBridge 実行状況)
Strands Agents ② テストケース ② ※ 認証情報を基にチャンネルにアクセスして、 メッセージ内容を確認(slack) ④ テスト結果と期待値を照合し、結果列を更新(editor)
① エビデンスフォルダ ③ ④ ニュースが通知されたスレッド ※ 認 証 情 報 S l a c k a p i で ト ー ク ン 発 行 ⇒ 環 境 変 数 S L A C K _ B O T _ T O K E N と S L A C K _ A P P _ T O K E N を 設 定 す る ③ エビデンスとして スレッドURLを保存(file_write) テストの流れ (Slack 通知確認)
こんなこともできる テストケースが多く、1つのエージェントじゃ大変 Strands Agents はマルチエージェントにも対応 コーディネーター AWS CLI エージェント メトリクスグラフ取得エージェント
Slack エージェント ユーザー テストケース1はAWS CLI テストケース2はSlack エージェント
具体的な実装方法 コーディネーター Lambda MCP Server エージェント @tool を用いることで独自ツールを作成 エージェントもツールとして扱える コーディネーターエージェントにツールを登録する
実践 02
今後の展望 セキュリティ面での考慮 ⚫ 適切な権限の設定 ⚫ データの保護 今後、本格利用していくためには。。。 ツールを育てる ⚫ トライ&エラーを繰り返して継続的な改善
⚫ プロンプトの微調整、コンテキストの最適化 テストツール自体の評価 ⚫ AIエージェントの評価方法を学ぶ&明確に ⚫ 人間によるレビューが必須のため 技術的な知識は必要
「テストは話しかけるだけ」を「個人」で実現していこう!! Strands Agentsによるテスト自動化 ⚫ 組み込みツールを用いたファイル・シェル操作 ⚫ MCP Server を用いた AWS
環境との連携 ⚫ 本格的な利用には、セキュリティ面の考慮やツールの評価 方法を確立する必要性がある
THANKYOU