スクリプトの先へ！AIエージェントと組み合わせるモバイルE2Eテスト

スクリプトの先へ！ AIエージェントと組み合わせるモバイルE2Eテスト Ebisu.mobile #13 | 2026.03.10 naberyo (@error96num)

2 自己紹介 naberyo @error96num STORES 株式会社テクノロジー部門モバイル開発本部モバイルPOSグループ Android
エンジニア Kotlin Multiplatform / Compose Multiplatform

3 STORES モバイルオーダー店舗向け注文管理アプリ（通称キッチンディスプレイ）注文受付調理管理提供管理 https://2025.droidkaigi.jp/timetable/944860/

4 E2Eテストの導入状況 Maestro によるE2Eテスト 2025年末に導入、CIで自動実行中 E2Eテストの第一歩は踏み出した。ここからどう発展させるか？ maestro.mobile.dev

5 テスト自動化の理想と現実 As-Is 10件のスモークテストを自動化最重要操作のハッピーパスのみ → To-Be: QAコストを削減 200件以上
のリグレッションテストを自動化問題（ギャップ） E2Eテストを拡充したくても、メンテナンスコストがネックになる → 原因を分解すると、2つの課題が見えてきた

6 課題1：UIのアップデートへの追従手動テスト「オーダーの商品をすべてタップする」 UIが変わっても記述を変える必要がないスクリプトベースの自動テスト tapOn(id="item_001") tapOn(id="item_002") tapOn(id="item_003") ...
UIが変わると自動テストは簡単に壊れる IDやテキストに依存したスクリプトはUI → の変更に弱い変化の多いプロダクトとの相性が悪い

7 課題2：テストシナリオ間の依存関係管理ログイン注文受付開始注文注文取得調理済みにする提供済みにする → →
→ → → ※ お客様側操作 ↘ 注文キャンセル Maestro の設計思想との衝突 Maestro — では「各シナリオは独立して実行可能であるべき」依存関係を宣言する仕組みがない順序指定とシャーディング（並列実行）は排他的で併用不可

8 Arbigent とは AI エージェント × Maestro のテスティングフレームワーク根本的な違い：「手順」ではなく「ゴール」を書く Maestro（手順）
tapOn: メールアドレス inputText: ... tapOn: パスワード inputText: ... tapOn: ログイン Arbigent（ゴール）「email: ... password: ... でログインして」 github.com/takahirom/arbigent

9 動作の仕組み 1 入力 UI ツリー + スクリーンショットをAIに渡す 2
判断 AIがゴール達成のために次に何をすべきか判断 3 実行 Maestroのコマンドとしてデバイスで実行 4 反復結果を見て次のアクションへ（ループ） AI → → が画面を見て判断操作結果を確認、のループでゴールを達成

10 2つの課題に対する構造的な解課題1 UIのアップデートへの追従 • → 自然言語でゴールを書くセレクタに依存しないのでUIの変化にAIが適応課題2 テストシナリオ間の依存関係管理
• dependency フィールドで依存関係を明示的に宣言 • 依存関係を保ったまま並列実行（シャーディング）が可能

D E M O 「注文日時が古いオーダーから順に、含まれる商品をすべてタップし、お客様に提供してください。すべてのオーダーが「提供済み」タブに移動されるまで続けてください。」この指示だけで、AIが画面を見て判断しながら順次さばく

20 ※ 倍速で再生

13 確実性 vs 柔軟性テストシナリオの特性に応じて使い分けるスクリプトで実行ログイン • 変更が少ない •
失敗すると後続全てに影響 → 確実性を最優先 AIエージェントで実行注文処理 • 入力データが毎回変わる • UIが頻繁にアップデートされる → 柔軟性を最優先

まとめ 1. 自動E2Eテストのメンテナンスコストの増大に直面課題1 UI のアップデートへの追従 + 課題2 テストシナリオ間の依存関係管理 2.
Arbigent は2つの課題に構造的に効く自然言語ゴール + 依存関係の明示的宣言 3. 従来のスクリプトベースのテスト × AIエージェントの組み合わせ E2Eテストの発展に新しい道筋が見えてきた

スクリプトの先へ！AIエージェントと組み合わせるモバイルE2Eテスト

スクリプトの先へ！AIエージェントと組み合わせるモバイルE2Eテスト

Ryo WATANABE

More Decks by Ryo WATANABE

Other Decks in Technology

Featured

Transcript