Upgrade to Pro — share decks privately, control downloads, hide ads and more …

生成AI活用によるPRレビュー改善の歩み

 生成AI活用によるPRレビュー改善の歩み

コーディングAIの普及でPR数が増加し「レビュー渋滞」という新たなボトルネックが生まれています。本資料では、AIスクリーニングレビューを導入してレビューの一次確認を自動化し、数か月で活用率が45%→68.5%・継続活用層が15%→27.6%へと改善した事例を紹介します。経験の浅いメンバーがAIの視点を借りてレビューに参加できるようになった変化も解説します。

More Decks by LINEヤフーTech (LY Corporation Tech)

Other Decks in Technology

Transcript

  1. © LY Corporation 2 Satoshi Fukuyama 2019年入社 ローカル・UGC SBU所属 Orchestration

    Guildメンバー 飲食系サービスのフロントエンド開発チームをリードし、 生成AIを活用した開発プロセスの最適化と品質向上に取り組む。 また複数のハッカソンにおいて多数の受賞経験を持ち、 社内外での技術的挑戦を続けている。 これまでの社内の取り組み • Yahoo!プレイス リニューアルリリース • PayPayグルメ ChatGPTプラグインのテックリード • 社内ハッカソンで複数の受賞 • 特許取得:複数 LINEヤフー株式会社 Frontend Engineer & Div Lead
  2. © LY Corporation ①コードレビューの現状と「レビュー渋滞」という課題 私の実体験を元にレビュー渋滞という課題について解説します。 ② AIレビュー支援の導入:レビュー渋滞解消への挑戦 AIスクリーニングレビューを導入し、レビュー渋滞解消に挑戦した 経緯についてお話します。 ③

    AIレビュー支援の導入による社内の変化 この仕組みを組織・チームへ導入してを実際に社内で変化した事例 を紹介します。 3 Agenda ※本資料に含まれる画像の一部は生成AIで作成されています
  3. © LY Corporation レビューには、多くの観点を同時に確認する負荷がある • バグやリスクの発見 • 設計思想との整合性の確認 • 修正が目的に沿っているかの確認

    • 既存コードへの副作用の有無の確認 → 経験豊富なメンバーに依存しやすく、“レビュー渋滞”の種が生まれる 5 プルリクエストのレビューは負荷が高い
  4. © LY Corporation マージできたPR数 +98% タスク完了数 +21% PRレビューの所要時間 +91% 6

    実装スピードはあがったが、レビュー時間の負担は増加 コーディングAIの登場でレビューの負担はより大きく 出典:Faros AI (2025) The AI Productivity Paradox Report 2025 https://www.faros.ai/blog/ai-software-engineering ※Nはチーム数
  5. © LY Corporation 10 実体験:レビューが集中した現場で何が起きていたか レビュー対応が集中したが 実装とレビューを同時に担当 レビューに追われて 自分の実装に集中できない 個人の努力だけでは

    限界があることを実感 開発ペースにレビューが 追いつかずPRが積み上がる 2024年下期にYahoo!プレイス開発チーム でバックエンドのテックリードを担当
  6. © LY Corporation レビュー待ちPRが滞留し、実装メンバーが次のタスクに進みづらい 一日の作業のほとんどがレビューに回り、自分のタスクが後回しになる 短時間で大きめのPRをレビューしなければならず、質の高いレビューを実施できない 01 03 02 11

    “レビュー渋滞”について → レビュー窓口が一部のメンバーに集中する脆さ(SPOF: Single Point of Failure)が露呈 → 「レビュー効率と品質のトレードオフ」が解くべき課題として明確になった
  7. © LY Corporation レビュー待ちPRが滞留し、実装メンバーが次のタスクに進みづらい 一日の作業のほとんどがレビューに回り、自分のタスクが後回しになる 短時間で大きめのPRをレビューしなければならず、質の高いレビューを実施できない 01 03 02 12

    “レビュー渋滞”について → レビュー窓口が一部のメンバーに集中する脆さ(SPOF: Single Point of Failure)が露呈 → 「レビュー効率と品質のトレードオフ」が解くべき課題として明確になった
  8. © LY Corporation レビュー待ちPRが滞留し、実装メンバーが次のタスクに進みづらい 一日の作業のほとんどがレビューに回り、自分のタスクが後回しになる 短時間で大きめのPRをレビューしなければならず、質の高いレビューを実施できない 01 03 02 13

    “レビュー渋滞”について → レビュー窓口が一部のメンバーに集中する脆さ(SPOF: Single Point of Failure)が露呈 → 「レビュー効率と品質のトレードオフ」が解くべき課題として明確になった
  9. © LY Corporation レビュー待ちPRが滞留し、実装メンバーが次のタスクに進みづらい 一日の作業のほとんどがレビューに回り、自分のタスクが後回しになる 短時間で大きめのPRをレビューしなければならず、質の高いレビューを実施できない 01 03 02 14

    “レビュー渋滞”について → レビュー窓口が一部のメンバーに集中する脆さ(SPOF: Single Point of Failure)が露呈 → 「レビュー効率と品質のトレードオフ」が解くべき課題として明確になった
  10. © LY Corporation レビュー待ちPRが滞留し、実装メンバーが次のタスクに進みづらい 一日の作業のほとんどがレビューに回り、自分のタスクが後回しになる 短時間で大きめのPRをレビューしなければならず、質の高いレビューを実施できない 01 03 02 15

    “レビュー渋滞”について → レビュー窓口が一部のメンバーに集中する脆さ(SPOF: Single Point of Failure)が露呈 → 「レビュー効率と品質のトレードオフ」が解くべき課題として明確になった
  11. © LY Corporation • AIによるPR概要自動生成を行うプロンプトを実装し、自身のレビュープロセスに導入 • 変更内容の把握は効率化できた • しかし、影響範囲の調査や潜在的な問題発見の負担は変わらず •

    毎回プロンプトをChatGPTやGitHub Copilotに貼り付ける手間も大きかった • 結果、2週間ほどで使わなくなった 18 失敗談:PR解説プロンプトを使ったレビュー プルリクエストのサマリをAIで生成
  12. © LY Corporation 19 AIレビューの実用レベルへの転換: Claude Code登場 出典:Anthropic (2025) Claude

    Code https://www.claude.com/ja-jp/product/claude-code Claude Codeが2025年夏頃に社内で導入が進む コードベースを横断した文脈理解や影響範囲や潜在的な問題の指摘にも対応 → AIによる一次チェック(=AIスクリーニングレビュー)が現実的なものになる コード全体の文脈を踏まえた解析と潜在的な問題検知が可能に
  13. © LY Corporation レビュワーが人手でレビュー作業を実施 AI時代のレビュー 20 AIスクリーニングレビューとは? 従来のレビュー AIが一次チェック 人が最終判断

    → 人の負担を軽減しつつ、 レビュー品質を維持 変更内容と 影響範囲の確認 コーディング スタイルのチェック 潜在的な バグの確認 実装者に伝える コメント案の検討 AIが一次チェックし、人が最終判断をするAI時代のレビュー方法
  14. © LY Corporation レビュワーが人手でレビュー作業を実施 AI時代のレビュー 21 AIスクリーニングレビューとは? 従来のレビュー AIが一次チェック 人が最終判断

    → 人の負担を軽減しつつ、 レビュー品質を維持 変更内容と 影響範囲の確認 コーディング スタイルのチェック 潜在的な バグの確認 実装者に伝える コメント案の検討 AIが一次チェックし、人が最終判断をするAI時代のレビュー方法
  15. © LY Corporation レビュワーが人手でレビュー作業を実施 AI時代のレビュー 22 AIスクリーニングレビューとは? 従来のレビュー AIが一次チェック 人が最終判断

    → 人の負担を軽減しつつ、 レビュー品質を維持 変更内容と 影響範囲の確認 コーディング スタイルのチェック 潜在的な バグの確認 実装者に伝える コメント案の検討 AIが一次チェックし、人が最終判断をするAI時代のレビュー方法
  16. © LY Corporation レビュー準備・一次チェック AIスクリーニングレビュー 23 A. 大きな違いはないが、人間が最終的に判断することを前提にしているかどうかが異なる Q. AIコードレビュー(e.g.

    CodeRabbit)との違いは? レビューそのものを肩代わりする AIコードレビュー 人間の判断のための材料づくり 人間の判断を部分的に置き換える レビューの負荷軽減 レビューの自動化 最終判断は完全に人間 AIの判断が直接レビュー判断に響く 人間の監視介入により安全性を高める リスク判断をAIに委ねる可能性あり 目的 位置づけ 期待値 責任範囲 安全性
  17. © LY Corporation 24 定着させる仕組み: スラッシュコマンド 出典:Anthropic (2026) Extend Claude

    with skills https://code.claude.com/docs/en/skills 頻繁に使用するプロンプトをClaude Codeで実行可能なMarkdownファイルとして登録できる →レビュー開始までの準備を大きく減らすことができます AIスクリーニングレビューを日常のフローに定着させることができる Claude Codeでプロンプトを簡単に呼び出せる機能
  18. © LY Corporation 26 AIスクリーニングレビュー と スラッシュコマンド 変更内容と 影響範囲の確認 コーディング

    スタイルのチェック 潜在的なバグ (セキュリティ・パフォーマンスなど) の確認 実装者へ伝える コメント案の検討 レビューの一次チェックを目的として、下記の4つの機能をプロンプトで実装 プロンプトはClaude CodeのAgent Skillsとして登録することでスラッシュコマンドからすぐ実行できる
  19. © LY Corporation 27 実装したレビュー用のプロンプトについて LINEヤフー Tech Blog | AIで"レビュー渋滞"を解消する

    〜PRレビュー支援と社内ワークショップでレビュー文化を変えた実践記録〜 https://techblog.lycorp.co.jp/ja/20251127c LINEヤフー レビュー渋滞解消 ※ テックブログ執筆時点ではスラッシュコマンドとAgent Skillsは未統合
  20. © LY Corporation 段階的なレビュー手順: レビュー要件をCLAUDE.mdから読み取る → PR全体像の把握 → 各ファイルの詳細レビュー →

    コードベース 全体への影響調査 → 最終判断、という流れで漏れなくレビュー コードベースへの影響調査: ① 修正されたコードが、既存コードのスタイルと大きくズレていないかチェック ② レビュー対象ファイルに依存している他のファイルについても確認し、影響が出てないかチェック レビュアー向けのコメント提案: 指摘事項について、レビュアーが実装者に送るコメントの文章を具体的に提案し、レビューコミュニケーショ ンの質を向上 01 03 02 28 プロンプトで工夫したところ
  21. © LY Corporation レビュー手順を下記のステップで実施 レビュー要件をCLAUDE.mdから読み取る ↓ PR全体像の把握 ↓ 各ファイルの詳細レビュー ↓

    コードベース全体への影響調査 ↓ 最終判断 29 プロンプトで工夫したところ 段階的なレビュー手順
  22. © LY Corporation チェック観点 指摘事項について、レビュアーが実装者に 送るコメントの文章を具体的に提案し、レ ビューコミュニケーションの質を向上 ▼ 特色 ①

    コメントのプレフィックスを明示 ② 具体的なバグの指摘の明示 ③ マージをブロックすべき指摘、ブロック しなくてもOKな指摘に分けて提案 36 プロンプトで工夫したところ レビュアー向けのコメント提案
  23. © LY Corporation チェック観点 指摘事項について、レビュアーが実装者に 送るコメントの文章を具体的に提案し、レ ビューコミュニケーションの質を向上 ▼ 特色 ①

    コメントのプレフィックスを明示 ② 具体的なバグの指摘の明示 ③ マージをブロックすべき指摘、ブロッ クしなくてもOKな指摘に分けて提案 37 プロンプトで工夫したところ レビュアー向けのコメント提案
  24. © LY Corporation チェック観点 指摘事項について、レビュアーが実装者に 送るコメントの文章を具体的に提案し、レ ビューコミュニケーションの質を向上 ▼ 特色 ①

    コメントのプレフィックスを明示 ② 具体的なバグの指摘の明示 ③ マージをブロックすべき指摘、ブロッ クしなくてもOKな指摘に分けて提案 38 プロンプトで工夫したところ レビュアー向けのコメント提案
  25. © LY Corporation チェック観点 指摘事項について、レビュアーが実装者に 送るコメントの文章を具体的に提案し、レ ビューコミュニケーションの質を向上 ▼ 特色 ①

    コメントのプレフィックスを明示 ② 具体的なバグの指摘の明示 ③ マージをブロックすべき指摘、ブロック しなくてもOKな指摘に分けて提案 39 プロンプトで工夫したところ レビュアー向けのコメント提案
  26. © LY Corporation 段階的なレビュー手順: レビュー要件をCLAUDE.mdから読み取る → PR全体像の把握 → 各ファイルの詳細レビュー →

    コードベース 全体への影響調査 → 最終判断、という流れで漏れなくレビュー コードベースへの影響調査: ① 修正されたコードが、既存コードのスタイルと大きくズレていないかチェック ② レビュー対象ファイルに依存している他のファイルについても確認し、影響が出てないかチェック レビュアー向けのコメント提案: 指摘事項について、レビュアーが実装者に送るコメントの文章を具体的に提案し、レビューコミュニケーショ ンの質を向上 01 03 02 40 プロンプトで工夫したところ(再掲)
  27. © LY Corporation 41 サクッと使ってみたい人向け:公式プラグインの導入 出典:Anthropic (2025) Code Review Plugin

    https://github.com/anthropics/claude-code/tree/main/plugins/code-review Claude Codeの公式マーケットプレイスにコードレビューのプラグインが提供済み
  28. © LY Corporation レビュワーが人手でレビュー作業を実施 AI時代のレビュー 42 まとめ:AIスクリーニングレビューとは? 従来のレビュー AIが一次チェック 人が最終判断

    → 人の負担を軽減しつつ、 レビュー品質を維持 変更内容と 影響範囲の確認 コーディング スタイルのチェック 潜在的な バグの確認 実装者に伝える コメント案の検討 AIが一次チェックし、人が最終判断をするAI時代のレビュー方法 レビュー依頼前のセルフチェックでも有効!
  29. © LY Corporation AI活用率 46 ワークショップ後に実施した「AIツールを活用したPRレビューの実践状況」のアンケート結果を分析 ワークショップの成果 実施後:68.5% (+23.5ポイント) 実施前:45.0%

    02 01 03 継続利用者 実施後:27.6% (+12.6ポイント) 実施前:15.0% 活用していない人 実施後:12.2% (-15.8ポイント) 実施前:28.0% • ワークショップ後、約7割のエンジニアが何らかの形でAIのレビュー支援を活用するようになる • 特に「継続的に活用している」層が倍近くに増加 AIのレビュー支援の効果を実感し自分のチームでもできるという確信が得られたことを示唆
  30. © LY Corporation AI活用率 47 ワークショップ後に実施した「AIツールを活用したPRレビューの実践状況」のアンケート結果を分析 ワークショップの成果 実施後:68.5% (+23.5ポイント) 実施前:45.0%

    02 01 03 継続利用者 実施後:27.6% (+12.6ポイント) 実施前:15.0% 活用していない人 実施後:12.2% (-15.8ポイント) 実施前:28.0% • ワークショップ後、約7割のエンジニアが何らかの形でAIのレビュー支援を活用するようになる • 特に「継続的に活用している」層が倍近くに増加 AIのレビュー支援の効果を実感し自分のチームでもできるという確信が得られたことを示唆
  31. © LY Corporation AI活用率 48 ワークショップ後に実施した「AIツールを活用したPRレビューの実践状況」のアンケート結果を分析 ワークショップの成果 実施後:68.5% (+23.5ポイント) 実施前:45.0%

    02 01 03 継続利用者 実施後:27.6% (+12.6ポイント) 実施前:15.0% 活用していない人 実施後:12.2% (-15.8ポイント) 実施前:28.0% • ワークショップ後、約7割のエンジニアが何らかの形でAIのレビュー支援を活用するようになる • 特に「継続的に活用している」層が倍近くに増加 AIのレビュー支援の効果を実感し自分のチームでもできるという確信が得られたことを示唆
  32. © LY Corporation AI活用率 49 ワークショップ後に実施した「AIツールを活用したPRレビューの実践状況」のアンケート結果を分析 ワークショップの成果 実施後:68.5% (+23.5ポイント) 実施前:45.0%

    02 01 03 継続利用者 実施後:27.6% (+12.6ポイント) 実施前:15.0% 活用していない人 実施後:12.2% (-15.8ポイント) 実施前:28.0% • ワークショップ後、約7割のエンジニアが何らかの形でAIのレビュー支援を活用するようになる • 特に「継続的に活用している」層が倍近くに増加 AIのレビュー支援の効果を実感し自分のチームでもできるという確信が得られたことを示唆
  33. © LY Corporation AI活用率 50 ワークショップ後に実施した「AIツールを活用したPRレビューの実践状況」のアンケート結果を分析 ワークショップの成果 実施後:68.5% (+23.5ポイント) 実施前:45.0%

    02 01 03 継続利用者 実施後:27.6% (+12.6ポイント) 実施前:15.0% 活用していない人 実施後:12.2% (-15.8ポイント) 実施前:28.0% • ワークショップ後、約7割のエンジニアが何らかの形でAIのレビュー支援を活用するようになる • 特に「継続的に活用している」層が倍近くに増加 AIのレビュー支援の効果を実感し自分のチームでもできるという確信が得られたことを示唆
  34. © LY Corporation 「自分の知識では不十分では?」とレ ビューコメントを出すことに躊躇し ていた AIのレビュー支援導入後 51 AIのレビュー支援導入前 慣れないプロジェクトのキャッチ

    アップに時間が掛かっていた AIが提案するレビュー観点を参考にす ることで、自信を持ってレビューコメ ントを出せるようになった → 「何を見るべきか」を学べる環境 が整った AIがコードの背景や影響範囲を要約 することで、迅速にプロジェクトを 理解し、建設的なレビューコメント を投稿できるようになった → 早期戦力化に効果的 エンジニア層 経験の浅いメンバー 新規アサインや ブランク明けの開発者 AIのレビュー支援を活用するエンジニアにインタビューしました AIのレビュー支援による開発文化の変化
  35. © LY Corporation 「自分の知識では不十分では?」とレ ビューコメントを出すことに躊躇して いた AIのレビュー支援導入後 52 AIのレビュー支援導入前 慣れないプロジェクトのキャッチ

    アップに時間が掛かっていた AIが提案するレビュー観点を参考に することで、自信を持ってレビュー コメントを出せるようになった → 「何を見るべきか」を学べる環境 が整った AIがコードの背景や影響範囲を要約 することで、迅速にプロジェクトを理 解し、建設的なレビューコメントを 投稿できるようになった → 早期戦力化に効果的 エンジニア層 経験の浅いメンバー 新規アサインや ブランク明けの開発者 AIのレビュー支援による開発文化の変化 AIのレビュー支援を活用するエンジニアにインタビューしました
  36. © LY Corporation 「自分の知識では不十分では?」とレ ビューコメントを出すことに躊躇し ていた AIのレビュー支援導入後 53 AIのレビュー支援導入前 慣れないプロジェクトのキャッチ

    アップに時間が掛かっていた AIが提案するレビュー観点を参考に することで、自信を持ってレビュー コメントを出せるようになった → 「何を見るべきか」を学べる環境 が整った AIがコードの背景や影響範囲を要約 することで、迅速にプロジェクトを 理解し、建設的なレビューコメント を投稿できるようになった → 早期戦力化に効果的 エンジニア層 経験の浅いメンバー 新規アサインや ブランク明けの開発者 AIのレビュー支援による開発文化の変化 AIのレビュー支援を活用するエンジニアにインタビューしました
  37. © LY Corporation AIスクリーニングレビューの導入: まずはレビュアー向けのカスタムコマンドを用意し、「AIが一次チェック、人が最終判断」という二段階レ ビューの型をつくる PRテンプレートとPR自動生成の整備: PRテンプレートを整えたり、AIにPR本文のたたきを書いてもらったりすることで、PRのコンテキストを標準 化しつつ、作成コストを下げる シンプルなレビュー指標の可視化:

    レビューが本当に効率化されたかどうか効果測定を実施する。いきなり高度なダッシュボードを作る必要は なく、「48時間以内にレビューが完了したPRの割合」など、シンプルな指標から始めて効果を確認する 01 03 02 54 これから取り組むチームへのおすすめステップ 以下の3つを小さく試しながら、自分たちのチームに合った形にカスタマイズしていくのがおすすめです
  38. © LY Corporation AIスクリーニングレビューの導入: まずはレビュアー向けのAgent Skillsを用意し、「AIが一次チェック、人が最終判断」という二段階レビュー の型をつくる PRテンプレートとPR自動生成の整備: PRテンプレートを整えたり、AIにPR本文のたたきを書いてもらったりすることで、PRのコンテキストを標準 化しつつ、作成コストを下げる

    シンプルなレビュー指標の可視化: レビューが本当に効率化されたかどうか効果測定を実施する。いきなり高度なダッシュボードを作る必要はな く、「48時間以内にレビューが完了したPRの割合」など、シンプルな指標から始めて効果を確認する 01 03 02 55 これから取り組むチームへのおすすめステップ 以下の3つを小さく試しながら、自分たちのチームに合った形にカスタマイズしていくのがおすすめです
  39. © LY Corporation AIスクリーニングレビューの導入: まずはレビュアー向けのAgent Skillsを用意し、「AIが一次チェック、人が最終判断」という二段階レビュー の型をつくる PRテンプレートとPR自動生成の整備: PRテンプレートを整えたり、AIにPR本文のたたきを書いてもらったりすることで、PRのコンテキストを標準 化しつつ、作成コストを下げる

    シンプルなレビュー指標の可視化: レビューが本当に効率化されたかどうか効果測定を実施する。いきなり高度なダッシュボードを作る必要はな く、「48時間以内にレビューが完了したPRの割合」など、シンプルな指標から始めて効果を確認する 01 03 02 56 これから取り組むチームへのおすすめステップ 以下の3つを小さく試しながら、自分たちのチームに合った形にカスタマイズしていくのがおすすめです
  40. © LY Corporation AIスクリーニングレビューの導入: まずはレビュアー向けのAgent Skillsを用意し、「AIが一次チェック、人が最終判断」という二段階レビュー の型をつくる PRテンプレートとPR自動生成の整備: PRテンプレートを整えたり、AIにPR本文のたたきを書いてもらったりすることで、PRのコンテキストを標準 化しつつ、作成コストを下げる

    シンプルなレビュー指標の可視化: レビューが本当に効率化されたかどうか効果測定を実施する。いきなり高度なダッシュボードを作る必要は なく、「48時間以内にレビューが完了したPRの割合」など、シンプルな指標から始めて効果を確認する 01 03 02 57 これから取り組むチームへのおすすめステップ 以下の3つを小さく試しながら、自分たちのチームに合った形にカスタマイズしていくのがおすすめです
  41. © LY Corporation AIスクリーニングレビューの導入: まずはレビュアー向けのAgent Skillsを用意し、「AIが一次チェック、人が最終判断」という二段階レビュー の型をつくる PRテンプレートとPR自動生成の整備: PRテンプレートを整えたり、AIにPR本文のたたきを書いてもらったりすることで、PRのコンテキストを標準 化しつつ、作成コストを下げる

    シンプルなレビュー指標の可視化: レビューが本当に効率化されたかどうか効果測定を実施する。いきなり高度なダッシュボードを作る必要はな く、「48時間以内にレビューが完了したPRの割合」など、シンプルな指標から始めて効果を確認する 01 03 02 61 これから取り組むチームへのおすすめステップ 以下の3つを小さく試しながら、自分たちのチームに合った形にカスタマイズしていくのがおすすめです
  42. © LY Corporation レビュワーが人手でレビュー作業を実施 AI時代のレビュー 63 まとめ 従来のレビュー AIが一次チェック 人が最終判断

    → 人の負担を軽減しつつ、 レビュー品質を維持 変更内容と 影響範囲の確認 コーディング スタイルのチェック 潜在的な バグの確認 実装者に伝える コメント案の検討 レビュー渋滞を解消するAIスクリーニングレビューをご紹介しました レビュー依頼前のセルフチェックでも有効!
  43. © LY Corporation 出典(1) Faros AI (2025) The AI Productivity

    Paradox Report 2025 https://www.faros.ai/blog/ai- software-engineering Anthropic (2025) Claude Code https://www.claude.com/ja-jp/product/claude-code Anthropic (2026) Extend Claude with skills https://code.claude.com/docs/en/skills LINEヤフー (2025) AIで"レビュー渋滞"を解消する 〜PRレビュー支援と社内ワークショップで レビュー文化を変えた実践記録〜 https://techblog.lycorp.co.jp/ja/20251127c 65 Anthropic (2025) Code Review Plugin https://github.com/anthropics/claude- code/tree/main/plugins/code-review