Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
手動からの解放!!Strands Agents で実現する総合テスト自動化
Search
井手亮太
July 23, 2025
Technology
1k
5
Share
手動からの解放!!Strands Agents で実現する総合テスト自動化
JAWS-UG 東京 Strands Agents Meetupで登壇した内容です。
井手亮太
July 23, 2025
More Decks by 井手亮太
See All by 井手亮太
マンスリーアップデート2月分
ideaws
0
45
ECSネイティブのBlue/Green デプロイを攻略しよう ~CodeDeployとの違いから、デプロイフロー実装まで~
ideaws
4
420
re:Invent のとあるアップデートについて~UFO隊は来させません~
ideaws
0
44
12月マンスリーアップデート
ideaws
0
55
Strands Agents & Amazon Bedrock AgentCoreで広がるAIエージェントの可能性
ideaws
0
36
Japan AWS Jr. Champions を目指して、そしてその先へ
ideaws
0
150
描くのはAI、創るのはあなた Amazon Nova Canvas の世界
ideaws
0
24
Other Decks in Technology
See All in Technology
AgentCore Managed Harness を使ってみよう
yakumo
2
280
はじめての MagicPod生成AI機能 機能紹介から活用方法まで
magicpod
0
130
Scovilleモバイルエンジニア募集中.pdf
julienrudin
0
140
プラットフォームエンジニアリングの実践 - AWS コンテナサービスで構築する社内プラットフォーム / AWS Containers Platform Meetup #1
literalice
1
230
独断と偏見で試してみる、 シングル or マルチエージェント どっちがいいの?
shichijoyuhi
1
220
ブラウザの投機的読み込みと投機ルールAPIを理解し、Webサービスのパフォーマンスを最適化する
shuta13
1
220
Cortex Codeのコスト見積ヒントご紹介
yokatsuki
0
130
AWS Transform CustomでIaCコードを自由自在に変換しよう
duelist2020jp
0
220
バイブコーディングで3倍早く⚪⚪を作ってみた
samakada
0
200
AIでAIをテストする - 音声AIエージェントの品質保証戦略
morix1500
1
160
UIライブラリに依存しすぎないReact Native設計を目指して
grandbig
0
180
AI時代に越境し、 組織を変えるQAスキルの正体 / QA Skills for Transforming an Organization
mii3king
0
200
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
23k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
680
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
760
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Git: the NoSQL Database
bkeepers
PRO
432
67k
Between Models and Reality
mayunak
3
270
Evolving SEO for Evolving Search Engines
ryanjones
0
180
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
130
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.4k
Facilitating Awesome Meetings
lara
57
6.8k
Transcript
Strands Agents で実現する総合テスト自動化 手動からの 解放 !!
自己紹介 3 ある日のお仕事 4 やってみた 8 今後の展望 17
c o n n p a s s https://tech.nri-net.com/archive/author/r-ide-ryota
井手 亮太 Activity BORN IN AGE JOB HOBBY 大阪府吹田市 基盤構築・運用 25歳 社会人 2年目 海外サッカー観戦(リバプール・ブライトン) いで りょうた 執 筆 ブ ロ グ https://nrinetcom.connpass.com/ https://nrinetcom.connpass.com/
c o n n p a s s https://tech.nri-net.com/archive/author/r-ide-ryota
井手 亮太 Activity BORN IN AGE JOB HOBBY 大阪府吹田市 基盤構築・運用 25歳 社会人 2年目 海外サッカー観戦(リバプール・ブライトン) いで りょうた 執 筆 ブ ロ グ https://nrinetcom.connpass.com/ https://nrinetcom.connpass.com/ 8/19(火) 19:00~20:00 勉強会開催します!
実践 02
総合テスト 調査 エビデンス取得 定期実行されてる? エラーを吐いてない? 正常なログ吐いてる? システムログ 画面キャプチャ システムが仕様通りの動作をしているか確認するテストのこと
AWS上のシステムにおけるテスト手法 テストケースを確認 コンソールを開く エビデンス用の スクリーンショットを撮る 手動 テストケースを確認 シェルスクリプトを実装 実行したコマンドと その結果を
エビデンスとする AWS CLI とにかく時間がかかる 人的ミスが発生しやすい シェルの知識が必要 汎用的な活用が難しい
そんな時に出会ったのが。。。 MCP Server にも対応 数多くの組み込みツール が用意されていること Strands Agents テスト自動化 実現できるん
じゃない?
やってみた 02
テスト対象システム AWS Cloud Amazon EventBridge AWS Lambda Amazon Bedrock AWS最新ニュース通知アプリ
定期実行 Slackに通知 翻訳 ニュース取得
テストケース 0 1 EventBridge 実行状況 ✓ 定期実行されているか Lambda メトリクス ✓
Invocations が1以上 ✓ Errorsが0 Lambda ログ ✓ 正常なログが出力されているか ✓ エラーログを吐いていないか Slack 通知 ✓ ニュースが通知されているか 0 2 0 3 0 4
テストケース 0 1 EventBridge 実行状況 ✓ 定期実行されているか Lambda メトリクス ✓
Invocations が1以上 ✓ Errorsが0 Lambda ログ ✓ 正常なログが出力されているか ✓ エラーログを吐いていないか Slack 通知 ✓ ニュースが通知されているか 0 2 0 3 0 4
テストケース テスト手法、及びテストに必要な パラメータの情報を記載 テストの期待される結果 テストの期待される結果が 得られた場合⇒ OK そうでない場合 ⇒ NG
をAIが記載する
Strands Agents テストケース ① テストケースの読み取り(file_read) ① テストの流れ (EventBridge 実行状況) SDK
で作成 ※ 赤字はStrands Agents に デフォルトで組み込まれているツール
Strands Agents ③ テストケース ② AWS Cloud ① テストケースの読み取り(file_read) ②
AWS CLIの実行 (Shell) ③ Lambda MCP Server 経由で メトリクスグラフ保存Lambda を実行 Amazon CloudWatch AWS Lambda Amazon S3 ① テストの流れ (EventBridge 実行状況)
Strands Agents ③ テストケース ② AWS Cloud ① テストケースの読み取り(file_read) ②
AWS CLIの実行 (Shell) ③ Lambda MCP Server 経由で メトリクスグラフ保存Lambda を実行 ④ S3 に保存したメトリクスグラフを CLI でダウンロード(Shell) Amazon CloudWatch AWS Lambda Amazon S3 ① エビデンスフォルダ ④ テストの流れ (EventBridge 実行状況)
Strands Agents ③ テストケース ② AWS Cloud ⑤ 実行したコマンドとその結果をエビデンスとして ファイルにまとめる(file_write)
⑥ テスト結果と期待値を照合し、結果列を更新(editor) Amazon CloudWatch AWS Lambda Amazon S3 ① エビデンスフォルダ ④ エビデンスフォルダ ⑤ ⑥ テストの流れ (EventBridge 実行状況)
Strands Agents ② テストケース ② ※ 認証情報を基にチャンネルにアクセスして、 メッセージ内容を確認(slack) ④ テスト結果と期待値を照合し、結果列を更新(editor)
① エビデンスフォルダ ③ ④ ニュースが通知されたスレッド ※ 認 証 情 報 S l a c k a p i で ト ー ク ン 発 行 ⇒ 環 境 変 数 S L A C K _ B O T _ T O K E N と S L A C K _ A P P _ T O K E N を 設 定 す る ③ エビデンスとして スレッドURLを保存(file_write) テストの流れ (Slack 通知確認)
こんなこともできる テストケースが多く、1つのエージェントじゃ大変 Strands Agents はマルチエージェントにも対応 コーディネーター AWS CLI エージェント メトリクスグラフ取得エージェント
Slack エージェント ユーザー テストケース1はAWS CLI テストケース2はSlack エージェント
具体的な実装方法 コーディネーター Lambda MCP Server エージェント @tool を用いることで独自ツールを作成 エージェントもツールとして扱える コーディネーターエージェントにツールを登録する
実践 02
今後の展望 セキュリティ面での考慮 ⚫ 適切な権限の設定 ⚫ データの保護 今後、本格利用していくためには。。。 ツールを育てる ⚫ トライ&エラーを繰り返して継続的な改善
⚫ プロンプトの微調整、コンテキストの最適化 テストツール自体の評価 ⚫ AIエージェントの評価方法を学ぶ&明確に ⚫ 人間によるレビューが必須のため 技術的な知識は必要
「テストは話しかけるだけ」を「個人」で実現していこう!! Strands Agentsによるテスト自動化 ⚫ 組み込みツールを用いたファイル・シェル操作 ⚫ MCP Server を用いた AWS
環境との連携 ⚫ 本格的な利用には、セキュリティ面の考慮やツールの評価 方法を確立する必要性がある
THANKYOU