コーディングAIが導くリスクベースド探索的テストの実践

by LINEヤフーTech (LY Corporation Tech)

Embed

Start on current slide

Slide 1

Slide 1 text

Slide 2

Slide 2 text

© LY Corporation 2 Satoshi Fukuyama 2019年新卒入社ローカル・UGC SBU所属 Orchestration Guildメンバーローカル領域のフロントエンド開発チームをリードし、生成AIを活用した開発プロセスの最適化と品質向上に取り組む。また複数のハッカソンにおいて多数の受賞経験を持ち、社内外での技術的挑戦を続けている。 LINEヤフー株式会社 Frontend Engineer & Div Lead

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

© LY Corporation 9 本日のテーマ：リスクベースド × AIエージェント過去のバグ傾向から "リスク" を可視化し、テスト深度に "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない？ ③AIによる自動テスト = どう試すべき？ ②テストケースの生成 = 何を確認すべき？ ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─

Slide 10

Slide 10 text

Slide 11

Slide 11 text

© LY Corporation 11 ①でやること：リスク分析表の生成バグ起票チケットから、起きやすさ×影響に応じたリスク分析表をAIで生成するバグ起票チケット (GitHub Issue や JIRA チケットを想定) 出典：Sky株式会社 (2025) 発生確率・影響度マトリックス（リスクマネジメント）https://www.skygroup.jp/tech-blog/article/636/ ※サンプルアプリにおける結果

Slide 12

Slide 12 text

© LY Corporation 12 リスク分析表を生成するスキルを作るリスク分析表を生成するスキル(risk-table-generation)を実装以下のようにスキルをコマンドとして実行するだけでリスク表が生成される # Claude CodeやCodexの起動 claude # リスク分析表を生成するスキル(risk-table-generation)を実行する # jira, githubなどのオプションがあり、それぞれの入力ソースに対応する › /risk-table-generation --jira # レポート用のMarkdownファイルおよびHTMLが生成されれば成功 • risk-table-generation --local を実行し、ローカルバグレポート10件からリスク表を生成しました。 - Markdown: risk-tables/risk-table-YYYYMMDD-HHMMSS.md - HTML: risk-tables/risk-table-YYYYMMDD-HHMMSS.html

Slide 13

Slide 13 text

Slide 14

Slide 14 text

© LY Corporation 14 リスク分析スキルの実行結果(1) # ローカルに配置したバグレポートで分析 › /risk-table-generation --local ローカルバグレポートを使用してリスク表を生成します。まず、リファレンスファイルとバグレポートを読み込みます。全バグレポートを読み込みました。Step 2の正規化を行います。正規化の結果: - BUG-03: 機能領域なし → 原因コード(cartRepository.ts)から「カート・注文確定」に分類。優先度 Low → High（在庫超過注文の可能性 → データ整合性に影響） - BUG-06: 機能領域なし → 原因コード（クーポン適用条件判定）から「クーポン適用」に分類。優先度 Low → High（不正なクーポン適用 → 金額計算に影響） - その他8件: 補正なし TSVファイルを作成し、集計スクリプトを実行します。集計完了。 A B C ※サンプルアプリにおける結果

Slide 15

Slide 15 text

© LY Corporation 15 Step 4: リスク表のMarkdownファイルを生成します。 Write(省略/risk-tables/risk-table-20260427-000844.md) ⎿ Wrote 72 lines to 省略/risk-tables/risk-table-20260427-000844.md Step 5: HTMLレポートに変換します。 Bash(bash .agents/skills/risk-table-generation/scripts/convert.sh risk-tables/risk-table-20260427-000844.md) ⎿ Generated: risk-tables/risk-table-20260427-000844.html HTML path: risk-tables/risk-table-20260427-000844.html D リスク分析スキルの実行結果(2) ※サンプルアプリにおける結果

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

© LY Corporation 18 本日のテーマ：リスクベースド × AIエージェント過去のバグ傾向から "リスク" を可視化し、テスト深度に "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない？ ③AIによる自動テスト = どう試すべき？ ②テストケースの生成 = 何を確認すべき？ ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

© LY Corporation 21 テストケースを生成するスキルを作るテストケースを生成するスキル(test-case-generation)を実装以下のようにスキルをコマンドとして実行するだけでテストケースが生成される # Claude CodeやCodexの起動 claude # リスク分析表を生成するスキル(test-case-generation)を実行する › /test-case-generation --pr 3 • --pr 3 の差分と最新リスク表をもとに、テストケースを生成して保存しました。作成ファイル: - test-cases/test-cases-20260406-215854.md

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

© LY Corporation 25 本日のテーマ：リスクベースド × AIエージェント過去のバグ傾向から "リスク" を可視化し、テスト深度に "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない？ ③AIによる自動テスト = どう試すべき？ ②テストケースの生成 = 何を確認すべき？ ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

© LY Corporation 28 テストケースを実行するスキルを作る # Claude CodeやCodexの起動 claude # リスク分析表を生成するスキル(test-case-execution)を実行する › $test-case-execution • テストケース実行を完了し、結果を test-cases/test-cases-2026MMDD-HHMM.md の末尾に追記しました。 - 対象URL: http://localhost:3000 - 実行件数: 18 - 結果: PASS 17 / FAIL 1 / SKIP 0 - FAIL: C-4（商品追加導線で上限超過時に代金引換が自動解除されない） - スクリーンショット: test-cases/screenshots/C-4-20260413.png テストケースを実行するスキル(test-case-execution)を実装以下のようにスキルをコマンドとして実行するだけでplaywright-mcpを使ってテストを実行できる

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

© LY Corporation 32 本日のテーマ：リスクベースド × AIエージェント過去のバグ傾向から "リスク" を可視化し、テスト深度に "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない？ ③AIによる自動テスト = どう試すべき？ ②テストケースの生成 = 何を確認すべき？ ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─

Slide 33

Slide 33 text

Slide 34

Slide 34 text

© LY Corporation 対象となる環境 34 直近対応したタスクについてリスク分析表生成、テストケース生成、AIによる自動テストを実施した検証の概要一部機能に対してローカル環境で検証 02 01 対象となる修正内容パフォーマンス改善のPR（数百行規模） 03 検証内容リスク分析表の生成 +テストケースの生成 + AIによる自動テストの実施 04 使ったツール / モデル Claude Code / Claude Opus 4.7

Slide 35

Slide 35 text

© LY Corporation リスクを考慮したテストケース数 34% 自動生成されたテストケース数 41件 PRレビューの所要時間 35 検証結果：手動テスト以外を 30分で完了完了したテストケース数 70% 成果①：過去の重大なバグが再発してないことを確認できた過去発生したリスクレベルの高いバグの再発無しを直接担保成果②：人手だと1時間相当の作業を30分まで短縮リスク表生成からテストケース生成・実行までAIが一気通貫で完走 ※本結果は特定の検証環境・条件下での一例です。すべてのプロジェクトで同様の効果を保証するものではありません。

Slide 36

Slide 36 text

© LY Corporation 良かった点 36 良かった点 / 改善が必要な点 02 01 03 「自動テスト可能」と判定したケースがモックやデータの都合で検証不能になり、テスト環境整備はE2Eと同じ課題が残った改善が必要な点集中力が切れがちな異常系の繰り返し検証を、AIが淡々と代行してくれてムラなく網羅できたリスクから考える過程で実装漏れUTが浮上し、AIがコード修正まで提案してくれて、過去バグの再発を防止できた任せるべき領域（観点生成・繰り返し検証）と人が向き合うべき領域（テスト環境整備）の境界が、今回のフローで明確になった ※本結果は特定の検証環境・条件下での一例です。すべてのプロジェクトで同様の効果を保証するものではありません。

Slide 37

Slide 37 text

Slide 38

Slide 38 text

© LY Corporation 38 本日のテーマ：リスクベースド × AIエージェント過去のバグ傾向から "リスク" を可視化し、テスト深度に "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない？ ③AIによる自動テスト = どう試すべき？ ②テストケースの生成 = 何を確認すべき？ ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─

Slide 39

Slide 39 text

© LY Corporation 起きやすさ×影響に沿ったリスク分析表の生成：どこが危ない？過去3ヶ月分のバグ報告書(JIRAやIssueなど)を入力するだけで、5分で試作可能。既存のデータがあれば、明日からでもリスク傾向が見えてきます。リスク分析表に基づくテストケースの生成：何を確認すべき？ 1つの PR・1つの機能領域から始めるのがおすすめ。 AI が生成したケースと既存テストケースの差分から、テストの抜け漏れが浮かび上がります。 AIによるリスクベースド探索的テストの実践：どう試すべき？最初は1ケースだけ、AI に実行させて感覚を掴む。繰り返しが必要な操作やシンプルな回帰テストを試してみて、日々の開発作業を楽にする。 01 03 02 39 これから取り組むチームへのおすすめステップ以下の3つを小さく試しながら、自分たちのチームに合った形にカスタマイズしていくのがおすすめです具体的なAgent Skillsの内容は近日中にテックブログで公開予定です！

Slide 40

Slide 40 text

Slide 41

Slide 41 text

© LY Corporation 出典 Playwright MCP https://github.com/microsoft/playwright-mcp 41 Sky株式会社 (2025) 発生確率・影響度マトリックス（リスクマネジメント） https://www.skygroup.jp/tech-blog/article/636/ GitHub Logo © GitHub, Inc. https://github.com/logos