生成AI活用によるPRレビュー改善の歩み

© LY Corporation LINEヤフー株式会社福山怜史生成AI活用による PRレビュー改善の歩み LINEヤフー Development
with Agents Meetup #1

© LY Corporation 2 Satoshi Fukuyama 2019年入社ローカル・UGC SBU所属 Orchestration
Guildメンバー飲食系サービスのフロントエンド開発チームをリードし、生成AIを活用した開発プロセスの最適化と品質向上に取り組む。また複数のハッカソンにおいて多数の受賞経験を持ち、社内外での技術的挑戦を続けている。これまでの社内の取り組み • Yahoo!プレイスリニューアルリリース • PayPayグルメ ChatGPTプラグインのテックリード • 社内ハッカソンで複数の受賞 • 特許取得：複数 LINEヤフー株式会社 Frontend Engineer & Div Lead

© LY Corporation ①コードレビューの現状と「レビュー渋滞」という課題私の実体験を元にレビュー渋滞という課題について解説します。 ② AIレビュー支援の導入：レビュー渋滞解消への挑戦 AIスクリーニングレビューを導入し、レビュー渋滞解消に挑戦した経緯についてお話します。 ③
AIレビュー支援の導入による社内の変化この仕組みを組織・チームへ導入してを実際に社内で変化した事例を紹介します。 3 Agenda ※本資料に含まれる画像の一部は生成AIで作成されています

© LY Corporation レビューには、多くの観点を同時に確認する負荷がある • バグやリスクの発見 • 設計思想との整合性の確認 • 修正が目的に沿っているかの確認
• 既存コードへの副作用の有無の確認 → 経験豊富なメンバーに依存しやすく、“レビュー渋滞”の種が生まれる 5 プルリクエストのレビューは負荷が高い

© LY Corporation マージできたPR数 +98% タスク完了数 +21% PRレビューの所要時間 +91% 6
実装スピードはあがったが、レビュー時間の負担は増加コーディングAIの登場でレビューの負担はより大きく出典：Faros AI (2025) The AI Productivity Paradox Report 2025 https://www.faros.ai/blog/ai-software-engineering ※Nはチーム数

© LY Corporation 9 実体験：レビューが集中した現場で何が起きていたかレビュー対応が集中したが実装とレビューを同時に担当開発ペースにレビューが追いつかずPRが積み上がるレビューに追われて
自分の実装に集中できない 2024年下期にYahoo!プレイス開発チームでバックエンドのテックリードを担当

© LY Corporation 10 実体験：レビューが集中した現場で何が起きていたかレビュー対応が集中したが実装とレビューを同時に担当レビューに追われて自分の実装に集中できない個人の努力だけでは
限界があることを実感開発ペースにレビューが追いつかずPRが積み上がる 2024年下期にYahoo!プレイス開発チームでバックエンドのテックリードを担当

© LY Corporation レビュー待ちPRが滞留し、実装メンバーが次のタスクに進みづらい一日の作業のほとんどがレビューに回り、自分のタスクが後回しになる短時間で大きめのPRをレビューしなければならず、質の高いレビューを実施できない 01 03 02 11
“レビュー渋滞”について → レビュー窓口が一部のメンバーに集中する脆さ（SPOF: Single Point of Failure）が露呈 → 「レビュー効率と品質のトレードオフ」が解くべき課題として明確になった

© LY Corporation • AIによるPR概要自動生成を行うプロンプトを実装し、自身のレビュープロセスに導入 • 変更内容の把握は効率化できた • しかし、影響範囲の調査や潜在的な問題発見の負担は変わらず •
毎回プロンプトをChatGPTやGitHub Copilotに貼り付ける手間も大きかった • 結果、2週間ほどで使わなくなった 18 失敗談：PR解説プロンプトを使ったレビュープルリクエストのサマリをAIで生成

© LY Corporation 19 AIレビューの実用レベルへの転換: Claude Code登場出典：Anthropic (2025) Claude
Code https://www.claude.com/ja-jp/product/claude-code Claude Codeが2025年夏頃に社内で導入が進むコードベースを横断した文脈理解や影響範囲や潜在的な問題の指摘にも対応 → AIによる一次チェック(=AIスクリーニングレビュー)が現実的なものになるコード全体の文脈を踏まえた解析と潜在的な問題検知が可能に

© LY Corporation レビュワーが人手でレビュー作業を実施 AI時代のレビュー 20 AIスクリーニングレビューとは？従来のレビュー AIが一次チェック人が最終判断
→ 人の負担を軽減しつつ、レビュー品質を維持変更内容と影響範囲の確認コーディングスタイルのチェック潜在的なバグの確認実装者に伝えるコメント案の検討 AIが一次チェックし、人が最終判断をするAI時代のレビュー方法

© LY Corporation レビュー準備・一次チェック AIスクリーニングレビュー 23 A. 大きな違いはないが、人間が最終的に判断することを前提にしているかどうかが異なる Q. AIコードレビュー(e.g.
CodeRabbit)との違いは？レビューそのものを肩代わりする AIコードレビュー人間の判断のための材料づくり人間の判断を部分的に置き換えるレビューの負荷軽減レビューの自動化最終判断は完全に人間 AIの判断が直接レビュー判断に響く人間の監視介入により安全性を高めるリスク判断をAIに委ねる可能性あり目的位置づけ期待値責任範囲安全性

© LY Corporation 24 定着させる仕組み: スラッシュコマンド出典：Anthropic (2026) Extend Claude
with skills https://code.claude.com/docs/en/skills 頻繁に使用するプロンプトをClaude Codeで実行可能なMarkdownファイルとして登録できる →レビュー開始までの準備を大きく減らすことができます AIスクリーニングレビューを日常のフローに定着させることができる Claude Codeでプロンプトを簡単に呼び出せる機能

© LY Corporation 25 定着させる仕組み: スラッシュコマンド頻繁に使用するプロンプトをClaude Codeで実行可能なMarkdownファイルとして登録できる →レビュー開始までの準備を大きく減らすことができます AIスクリーニングレビューを日常のフローに定着させることができる
現在、スラッシュコマンドはAgent Skillsに統合済み Claude Codeでプロンプトを簡単に呼び出せる機能出典：Anthropic (2026) Extend Claude with skills https://code.claude.com/docs/en/skills

© LY Corporation 26 AIスクリーニングレビューとスラッシュコマンド変更内容と影響範囲の確認コーディング
スタイルのチェック潜在的なバグ (セキュリティ・パフォーマンスなど) の確認実装者へ伝えるコメント案の検討レビューの一次チェックを目的として、下記の4つの機能をプロンプトで実装プロンプトはClaude CodeのAgent Skillsとして登録することでスラッシュコマンドからすぐ実行できる

© LY Corporation 27 実装したレビュー用のプロンプトについて LINEヤフー Tech Blog | AIで"レビュー渋滞"を解消する
〜PRレビュー支援と社内ワークショップでレビュー文化を変えた実践記録〜 https://techblog.lycorp.co.jp/ja/20251127c LINEヤフーレビュー渋滞解消 ※ テックブログ執筆時点ではスラッシュコマンドとAgent Skillsは未統合

© LY Corporation 段階的なレビュー手順: レビュー要件をCLAUDE.mdから読み取る → PR全体像の把握 → 各ファイルの詳細レビュー →
コードベース全体への影響調査 → 最終判断、という流れで漏れなくレビューコードベースへの影響調査: ① 修正されたコードが、既存コードのスタイルと大きくズレていないかチェック ② レビュー対象ファイルに依存している他のファイルについても確認し、影響が出てないかチェックレビュアー向けのコメント提案: 指摘事項について、レビュアーが実装者に送るコメントの文章を具体的に提案し、レビューコミュニケーションの質を向上 01 03 02 28 プロンプトで工夫したところ

© LY Corporation レビュー手順を下記のステップで実施レビュー要件をCLAUDE.mdから読み取る ↓ PR全体像の把握 ↓ 各ファイルの詳細レビュー ↓
コードベース全体への影響調査 ↓ 最終判断 29 プロンプトで工夫したところ段階的なレビュー手順

© LY Corporation レビュー手順を下記のステップで実施 30 プロンプトで工夫したところ段階的なレビュー手順レビュー要件をCLAUDE.mdから読み取る ↓ PR全体像の把握
↓ 各ファイルの詳細レビュー ↓ コードベース全体への影響調査 ↓ 最終判断

© LY Corporation チェック観点 ① 修正されたコードが、既存コードのスタイルと大きくズレていないかチェック ② レビュー対象ファイルに依存している他のファイルについても確認し、修正による不
具合が発生しないかをチェック 34 プロンプトで工夫したところコードベースへの影響調査

© LY Corporation チェック観点 ① 修正されたコードが、既存コードのスタイルと大きくズレていないかチェック ② レビュー対象ファイルに依存している他のファイルについても確認し、修正による不
具合が発生しないかをチェック 35 プロンプトで工夫したところコードベースへの影響調査

© LY Corporation チェック観点指摘事項について、レビュアーが実装者に送るコメントの文章を具体的に提案し、レビューコミュニケーションの質を向上 ▼ 特色 ①
コメントのプレフィックスを明示 ② 具体的なバグの指摘の明示 ③ マージをブロックすべき指摘、ブロックしなくてもOKな指摘に分けて提案 36 プロンプトで工夫したところレビュアー向けのコメント提案

© LY Corporation 段階的なレビュー手順: レビュー要件をCLAUDE.mdから読み取る → PR全体像の把握 → 各ファイルの詳細レビュー →
コードベース全体への影響調査 → 最終判断、という流れで漏れなくレビューコードベースへの影響調査: ① 修正されたコードが、既存コードのスタイルと大きくズレていないかチェック ② レビュー対象ファイルに依存している他のファイルについても確認し、影響が出てないかチェックレビュアー向けのコメント提案: 指摘事項について、レビュアーが実装者に送るコメントの文章を具体的に提案し、レビューコミュニケーションの質を向上 01 03 02 40 プロンプトで工夫したところ(再掲)

© LY Corporation 41 サクッと使ってみたい人向け：公式プラグインの導入出典：Anthropic (2025) Code Review Plugin
https://github.com/anthropics/claude-code/tree/main/plugins/code-review Claude Codeの公式マーケットプレイスにコードレビューのプラグインが提供済み

© LY Corporation レビュワーが人手でレビュー作業を実施 AI時代のレビュー 42 まとめ：AIスクリーニングレビューとは？従来のレビュー AIが一次チェック人が最終判断
→ 人の負担を軽減しつつ、レビュー品質を維持変更内容と影響範囲の確認コーディングスタイルのチェック潜在的なバグの確認実装者に伝えるコメント案の検討 AIが一次チェックし、人が最終判断をするAI時代のレビュー方法レビュー依頼前のセルフチェックでも有効！

© LY Corporation AI活用率 46 ワークショップ後に実施した「AIツールを活用したPRレビューの実践状況」のアンケート結果を分析ワークショップの成果実施後：68.5% (+23.5ポイント) 実施前：45.0%
02 01 03 継続利用者実施後：27.6% (+12.6ポイント) 実施前：15.0% 活用していない人実施後：12.2% (-15.8ポイント) 実施前：28.0% • ワークショップ後、約7割のエンジニアが何らかの形でAIのレビュー支援を活用するようになる • 特に「継続的に活用している」層が倍近くに増加 AIのレビュー支援の効果を実感し自分のチームでもできるという確信が得られたことを示唆

© LY Corporation 「自分の知識では不十分では?」とレビューコメントを出すことに躊躇していた AIのレビュー支援導入後 51 AIのレビュー支援導入前慣れないプロジェクトのキャッチ
アップに時間が掛かっていた AIが提案するレビュー観点を参考にすることで、自信を持ってレビューコメントを出せるようになった → 「何を見るべきか」を学べる環境が整った AIがコードの背景や影響範囲を要約することで、迅速にプロジェクトを理解し、建設的なレビューコメントを投稿できるようになった → 早期戦力化に効果的エンジニア層経験の浅いメンバー新規アサインやブランク明けの開発者 AIのレビュー支援を活用するエンジニアにインタビューしました AIのレビュー支援による開発文化の変化

アップに時間が掛かっていた AIが提案するレビュー観点を参考にすることで、自信を持ってレビューコメントを出せるようになった → 「何を見るべきか」を学べる環境が整った AIがコードの背景や影響範囲を要約することで、迅速にプロジェクトを理解し、建設的なレビューコメントを投稿できるようになった → 早期戦力化に効果的エンジニア層経験の浅いメンバー新規アサインやブランク明けの開発者 AIのレビュー支援による開発文化の変化 AIのレビュー支援を活用するエンジニアにインタビューしました

© LY Corporation AIスクリーニングレビューの導入: まずはレビュアー向けのカスタムコマンドを用意し、「AIが一次チェック、人が最終判断」という二段階レビューの型をつくる PRテンプレートとPR自動生成の整備: PRテンプレートを整えたり、AIにPR本文のたたきを書いてもらったりすることで、PRのコンテキストを標準化しつつ、作成コストを下げるシンプルなレビュー指標の可視化:
レビューが本当に効率化されたかどうか効果測定を実施する。いきなり高度なダッシュボードを作る必要はなく、「48時間以内にレビューが完了したPRの割合」など、シンプルな指標から始めて効果を確認する 01 03 02 54 これから取り組むチームへのおすすめステップ以下の3つを小さく試しながら、自分たちのチームに合った形にカスタマイズしていくのがおすすめです

© LY Corporation AIスクリーニングレビューの導入: まずはレビュアー向けのAgent Skillsを用意し、「AIが一次チェック、人が最終判断」という二段階レビューの型をつくる PRテンプレートとPR自動生成の整備: PRテンプレートを整えたり、AIにPR本文のたたきを書いてもらったりすることで、PRのコンテキストを標準化しつつ、作成コストを下げる
シンプルなレビュー指標の可視化: レビューが本当に効率化されたかどうか効果測定を実施する。いきなり高度なダッシュボードを作る必要はなく、「48時間以内にレビューが完了したPRの割合」など、シンプルな指標から始めて効果を確認する 01 03 02 55 これから取り組むチームへのおすすめステップ以下の3つを小さく試しながら、自分たちのチームに合った形にカスタマイズしていくのがおすすめです

© LY Corporation レビュワーが人手でレビュー作業を実施 AI時代のレビュー 63 まとめ従来のレビュー AIが一次チェック人が最終判断
→ 人の負担を軽減しつつ、レビュー品質を維持変更内容と影響範囲の確認コーディングスタイルのチェック潜在的なバグの確認実装者に伝えるコメント案の検討レビュー渋滞を解消するAIスクリーニングレビューをご紹介しましたレビュー依頼前のセルフチェックでも有効！

© LY Corporation 出典(1) Faros AI (2025) The AI Productivity
Paradox Report 2025 https://www.faros.ai/blog/ai- software-engineering Anthropic (2025) Claude Code https://www.claude.com/ja-jp/product/claude-code Anthropic (2026) Extend Claude with skills https://code.claude.com/docs/en/skills LINEヤフー (2025) AIで"レビュー渋滞"を解消する〜PRレビュー支援と社内ワークショップでレビュー文化を変えた実践記録〜 https://techblog.lycorp.co.jp/ja/20251127c 65 Anthropic (2025) Code Review Plugin https://github.com/anthropics/claude- code/tree/main/plugins/code-review

生成AI活用によるPRレビュー改善の歩み

生成AI活用によるPRレビュー改善の歩み

More Decks by LINEヤフーTech (LY Corporation Tech)

Other Decks in Technology

Featured

Transcript