20260320_JaSST26_Tokyo_登壇資料.pdf

© estie Inc. JaSST’26 Tokyo 村上槙 / Murakami Shin
AIを活用したリバースエンジニアリングで考える自動テストの全体方針 1

© estie Inc. 自己紹介 2 x: @mura_shin0928 経歴： estie QAマネージャー
← Shippio QAエンジニア ← SHIFT QAキャリアスタート ← 愛知で自動車のソフトウェア開発 ← 福岡県生まれ趣味： - マンガ、アニメ - お酒、ゴルフ（初心者） - 男性アイドル（妻の影響） - 最近けん玉株式会社estie 2025/1：入社, 2025/8〜：QAマネージャー村上槙（murashi）

© estie Inc. AIで「振る舞いのテスト」は書きやすくなった最近ではAIの力で、コードの振る舞いを理解するハードルが下がった DevinやClaude Codeに「この機能の振る舞いを教えて」と聞けばわかる世界振る舞いを理解できれば、それに対するテストは書ける → 振る舞いのテスト
は書きやすくなった

© estie Inc. それだけで充分？自動テストの目的は：システム全体が正しく動き続けていることを保証すること適切なサイズのフィードバックを素早く得られることのはず AIによる超高速開発時代において、 E2Eテストが簡単に書ける！で満足している場合ではないし、
E2Eテスト以外を「開発者テスト」と言っている場合ではない。 → QAエンジニアもシステム構造を踏まえた自動テスト設計に今一度目を向けよう

© estie Inc. 本日のテーマ振る舞いのテスト構造に基づくテスト設計ポイントこの機能は正しく動くか？どこに・何を・どの順でテストを配置するか？ AI活用
書きやすくなった ★本日の話効果的な自動テストをどう設計していけばいいか？ → AIを活用した一つのやり方として、本日の内容を共有します。

© estie Inc. Where: どこに・どんなテストを配置するか？「Software Engineering at Google」を参考に2軸で整理 small
medium large Test Size 単一プロセス単一マシン制約なしリソース DB・ネットワーク不要 Docker等でローカル完結外部環境含む unit integration e2e Test Scope 単一モジュール複数モジュール連携システム全体 → どのSize × Scopeをどこに配置するか = システム構造を踏まえて決める引用：https://abseil.io/resources/swe-book/html/ch11.html

© estie Inc. What first: どこから着手するか？ Emily Bache (Test Desiderata
2.0)：「良いソフトウェアテストとはどのようなものか」を評価するためのモデル *Kent Beck氏考案のTest Desiderata 12の性質を4つのマクロ目標に再整理したもの ① Predict production success 本番環境で動くことの保証 ② Fast feedback 素早いフィードバック ③ Support design change コード変更を支える ④ Low cost of ownership 総保有コストを低く → 4つのマクロ目標をどれだけ広く満たせるかで優先度が決まる引用：https://coding-is-like-cooking.info/2025/12/test-desiderata-2-0/

© estie Inc. 問いの再定義 Where（配置）システム構造の理解が必要 What first（優先度）判断基準が必要一方でドキュメントは不完全、コードが神様という状態...
まず「コードからシステム構造を復元してみる」 → これをAIで加速するのが、本日の本題

© estie Inc. リバースエンジニアリングの流れ Step1: システム全体像を把握 Architecture Summary を取得 AI
↓ Step 2: Test Sizeで分類テスト配置を導出 AI ↓ Step 3: 優先度判断 4つのマクロ目標で導出 AI+人間ツール：Claude Code + drawio MCP

© estie Inc. Step 1: システム全体像を把握（INPUT）プロンプトイメージ：リポジトリはモノレポ＋外部サービス連携の構成です。テスト戦略のために全体像を把握したいです。以下を「サービス単位」の粒度で整理してください。
コンポーネントレベルの詳細は不要です。 1. サービス/アプリの一覧と一言説明 2. サービス間の依存関係（A→B = AがBを呼ぶ） 3. 外部サービス・インフラとの連携 4. 同期リクエスト以外の処理パターン： - 非同期処理（キュー、Webhook、ジョブ非同期実行、ポーリング取得） - 定期実行処理（cron、バッチ等）出力：(A) drawio構成図 (B) Architecture Summary ポイント：粒度を明示「サービス単位」を支持し、コンポーネントレベルは不要非同期パターンを「処理の形」で例示構造として重要だが指示しないとスキップされがち Architecture Summaryを出力させる → Step 2にそのまま渡せる情報

© estie Inc. Step 1: システム全体像を把握（OUTPUT） → コードから、サービス構成・依存関係・非同期パターン・定期実行が一覧化されるシステム構成図イメージ： Architecture
Summaryイメージ：

© estie Inc. Step 2: Test Sizeで分類する（INPUT）プロンプトイメージ：【前提情報】（Step
1のArchitecture Summaryを使う）【目的】 Test Size × Test Scopeでテスト配置の全体方針を決めたいです。 Test Sizeの定義： - small: 単一プロセス内。外部依存なし - medium: 単一マシン内。DBはローカル - large: 制約なし。外部環境をまたぐ実行トリガー: Commit / Deployed / Scheduled 出力形式：対象|Scope|Size|トリガー|外部依存|備考重要：同一対象で複数行を作らないモックOK→medium、実環境必須→large ポイント： Step 1の出力をそのまま渡すコピペだけで済むようにする Test Sizeの定義を明示 Google準拠でAIの解釈ブレを防ぐ実行トリガーを分類軸に追加 CIで回せるかが一目でわかる重複排除を明示指示後続の分類で重複が増える（integrationとe2eの区別が曖昧になるなど）の問題を防止

© estie Inc. Step 2: Test Sizeで分類（OUTPUT）テスト対象 Scope Size
トリガー外部依存 FE 純粋ロジック unit small Commit なし FE コンポーネント統合 integration medium Commit GraphQL: MSW mock BE 純粋ロジック unit small Commit なし BE + DB integration medium Commit MySQL: Docker Cron 純粋ロジック unit small Commit なし Cron + MySQL integration medium Commit MySQL: Docker BE 外部サービス integration large Deployed Staging実API E2E e2e large Deployed 全実サービス Embulk ETL integration large Scheduled Staging実DB → システム構造からテスト配置が導出された

© estie Inc. Where どこに・どんなテストを配置するか？ What first どこから着手するか？システム構造をもとにTest Size
x Scopeでテスト配置を設計

© estie Inc. 【再掲】What first: どこから着手するか？ Emily Bache (Test Desiderata
2.0)：「良いソフトウェアテストとはどのようなものか」を評価するためのモデル *Kent Beck考案のTest Desiderata 12の性質を4つのマクロ目標に再整理したもの ① Predict production success 本番環境で動く保証 ② Fast feedback 素早いフィードバック ③ Support design change コード変更を支える ④ Low cost of ownership 総保有コストを低く → 4つのマクロ目標をどれだけ広く満たせるかで優先度が決まる引用：https://coding-is-like-cooking.info/2025/12/test-desiderata-2-0/

© estie Inc. Step3: 優先度判断テスト対象 Size トリガー ①Predict ②Fast
③Change ④Low cost BE + DB medium Commit ◦ ◎ ◎ ◦ FE コンポーネント統合 medium Commit ◦ ◎ ◎ ◦ BE 純粋ロジック small Commit △ ◎ ◎ ◎ FE 純粋ロジック small Commit △ ◎ ◦ ◎ Cron + MySQL medium Commit ◦ ◎ △ ◦ Cron 純粋ロジック small Commit △ ◎ △ ◎ BE 外部サービス large Deployed ◎ ✗ △ ✗ E2E large Deployed ◎ ✗ ✗ ✗ Embulk ETL large Sched ◦ ✗ ✗ ✗ 凡例：◎強く満たす ◦満たす △部分的 ✗満たさない各テスト対象を4つの評価軸で採点し、多くの目標を同時に満たすものから優先的に自動化する

© estie Inc. Step3: 優先度判断テスト対象 Size トリガー優先度 BE
+ DB medium Commit 高 FE コンポーネント統合 medium Commit 高 BE 純粋ロジック small Commit 高 BE 外部サービス large Commit 中 E2E large Deployed 中 FE 純粋ロジック small Commit 低 Cron + MySQL medium Commit 低 Cron 純粋ロジック small Commit 低 Embulk ETL large Sched 低優先度「高」は CIで回せる medium/small に集中 AI -> 人間判断

© estie Inc. 今回のアプローチで得られたもの E2Eテスト一辺倒から脱却テスト配置表で「システム全体のどこを何で守るか」が設計され、各レイヤーで適切なテストが分かるようになった適切なサイズのフィードバック small/medium/largeが適切に配置されることで、適切な自動テストを書くための方針が明確になったコンテキストゼロからの高速キャッチアップシステム構成図
+ テスト配置表で”現在の状態”が簡単にキャッチアップできる SLO測定の議論の土台 SREなどチーム外メンバーと議論する際の土台にもなる

© estie Inc. 今回のアプローチで得られたもの E2Eテスト一辺倒から脱却テスト配置表で「システム全体のどこを何で守るか」が設計され、各レイヤーで適切なテストが分かるようになった適切なサイズのフィードバック small/medium/largeが適切に配置されることで、適切な自動テストを書くための方針が明確になったコンテキストゼロからの高速キャッチアップ Architecture
Summary + テスト配置表が「現在地の地図」になる SLO測定の議論の土台 SREなどチーム外メンバーと議論する際の土台にもなる高速に変化する事業・複数プロダクト・外部連携がある環境だからこそ、キャッチアップの高速化と構造の整理が重要全体像がわかる土台があることで氷山の一角だけでなく、普段意識していなかった課題にも目が行くきっかけになる

© estie Inc. 今後の展望今日（完了） ✓ 完了全体方針 — Where・What
first 次：個別テストの設計・実装優先度に基づいて、さらに内部構造を深ぼった上で各テストを実装する → 方針に基づき具体的なモジュールや関数 (What) を決めた上でテスト実装する with AI その先：ハーネスエンジニアリング今回作った構造化ドキュメントが、エージェントにテストを書かせる「文脈」になる AIエージェントにテストを書かせるための開発環境設計＝ハーネスエンジニアリング進行中引用：https://openai.com/ja-JP/index/harness-engineering/

ご清聴ありがとうございました！

20260320_JaSST26_Tokyo_登壇資料.pdf

20260320_JaSST26_Tokyo_登壇資料.pdf

Shin Murakami

More Decks by Shin Murakami

Other Decks in Technology

Featured

Transcript

© estie Inc. JaSST’26 Tokyo 村上槙 / Murakami Shin

© estie Inc. 自己紹介 2 x: @mura_shin0928 経歴： estie QAマネージャー

© estie Inc. AIで「振る舞いのテスト」は書きやすくなった playwright-cliやagent-browserを使えば自然言語でE2Eテスト実装ができる時代 Skillsなどと組み合わせれば自律実装も実現できる

© estie Inc. AIで「振る舞いのテスト」は書きやすくなった playwright-cliやagent-browserを使えば自然言語でE2Eテスト実装ができる時代本当にそれだけで充分？ Skillsなどと組み合わせれば自律実装も実現できる

© estie Inc. 本日のテーマ振る舞いのテスト構造に基づくテスト設計ポイントこの機能は正しく動くか？どこに・何を・どの順でテストを配置するか？ AI活用

© estie Inc. 自動テスト全体方針におけるポイント Where どこに・どんなテストを配置するか？ What first どこから着手するか？

© estie Inc. Where: どこに・どんなテストを配置するか？「Software Engineering at Google」を参考に2軸で整理 small

© estie Inc. What first: どこから着手するか？ Emily Bache (Test Desiderata

© estie Inc. 問いの再定義 Where（配置）システム構造の理解が必要 What first（優先度）判断基準が必要一方でドキュメントは不完全、コードが神様という状態...

© estie Inc. リバースエンジニアリングの流れ Step1: システム全体像を把握 Architecture Summary を取得 AI

© estie Inc. Step 1: システム全体像を把握（OUTPUT） → コードから、サービス構成・依存関係・非同期パターン・定期実行が一覧化されるシステム構成図イメージ： Architecture

© estie Inc. Step 2: Test Sizeで分類する（INPUT）プロンプトイメージ：【前提情報】（Step

© estie Inc. Step 2: Test Sizeで分類（OUTPUT）テスト対象 Scope Size

© estie Inc. Where どこに・どんなテストを配置するか？ What first どこから着手するか？システム構造をもとにTest Size

© estie Inc. 【再掲】What first: どこから着手するか？ Emily Bache (Test Desiderata

© estie Inc. Step3: 優先度判断テスト対象 Size トリガー ①Predict ②Fast

© estie Inc. Step3: 優先度判断テスト対象 Size トリガー優先度 BE

© estie Inc. Where どこに・どんなテストを配置するか？ What first どこから着手するか？システム構造をもとにTest Size

© estie Inc. 今後の展望今日（完了） ✓ 完了全体方針 — Where・What

ご清聴ありがとうございました！