ML@Loft リポジトリをまるごとAIでレビューする

© EXNOA LLC • 合同会社EXNOA • 技術統括本部技術推進部サーバーグループ •
川瀧嘉和自己紹介 2

© EXNOA LLC 背景と課題 • 自社でパブリッシュするゲームタイトルの技術面のレビューを横断的に行っているが、様々な言語、アーキテクチャやプラットフォームのものがあり、レビュワーの技術スタックでカバーしきれないことある。 • 比較的短期間にアプリケーションやインフラストラクチャーなど、資料物
量が多く、幅広い範囲をレビューする必要があり、全てを網羅的にレビューしきれない場合がある。 3

© EXNOA LLC レビューシステム概要本システムは、LongContextモデルを活用し、リポジトリ全体を単一のコンテキストとして捉え、複数の評価基準に基づいて包括的に分析します。これにより、プロジェクト全体の文脈を考慮した、改善提案を自動生成するレビュー
ツールです。 4

© EXNOA LLC アーキテクチャ概要 5 Amazon Web Services、“Powered by AWS”ロゴ、［およびかかる資料で使用されるその他のＡＷＳ商標］
は、米国その他の諸国における、 Amazon.com, Inc.またはその関連会社の商標です。 • シンプルなECSによる構成 • WebインタフェースはGradioを採用 • 処理部分はフルスクラッチで開発

© EXNOA LLC レビュープロセス概要レビュープロセスの中で Claude 3.5 Sonnet と Gemini
1.5 Proを使用・レビュー対象ファイルリストの作成・レビューの実施・レビュー結果の評価 6 レビュー対象ファイルリスト作成 Gemini レビュー用プロンプトを構築レビューを実行 Claude Gemini OR 提案を評価有効？ Claude Gemini OR はいいいえ提案に追加提案を破棄結果を出力視点ごとのレビュー提案の評価とフィルタリング

© EXNOA LLC 技術的なポイント • AIによる回答に一貫性をもたせキャッシュできるよう常にTemperature=0 • コンテキスト長が長くなったと言っても、一度に全体を取り込めないリポジトリは多い • レビューするファイルそのものもAIに選定させて無駄なファイルを除外
• 出力コンテキストが長くなるとJSONで出力が不安定になる • マークダウンで出力し、正規表現で解析 • 地道なプロンプトのチューニング • いろいろなリポジトリをレビューにかけ繰り返し調整 13

© EXNOA LLC メリットと効果 • 操作が簡単で誰でもAIレビューの提案出力が可能になった。 • 関連した複数のファイルを横断する指摘や提案もしてくれる。 • レビュワー担当者の技術スタックによらず一定精度のレビューが可能になっ
た。 • 提案の再確認は必要だが、確実にレビュー品質は向上した。 • 精度の高いモデルを入れ替えるだけで、レビュー精度の向上が期待できる。 14

© EXNOA LLC 課題 • 担当者の技術スタックによらずレビューはできるものの、提案内容の妥当性を人間が評価できる必要がある。 • レビュー対象ファイルリストの選定の精度がファイルパスに依存してしまう。
• CodacyやSonarQubeなどの競合になると思われるサービスとの比較ができていない。 15

© EXNOA LLC まとめ • LongContextモデルを利用することで、プロジェクト全体を包括的にレビューすることが可能になった。 • Claudeをはじめ世の中には様々なモデルが公開されてきているので、その時の最善のものを利用することで、より高精度なレビューを実現
できるようになる。 • AIによるレビューはできても最終的に人の確認は必要。 16

ML@Loft リポジトリをまるごとAIでレビューする

ML@Loft リポジトリをまるごとAIでレビューする

Kawataki Yoshikazu

Other Decks in Technology

Featured

Transcript

© EXNOA LLC 1 リポジトリをまるごと AIでレビューする Long Contextモデルを利用したレビューシステムの紹介

© EXNOA LLC • 合同会社EXNOA • 技術統括本部技術推進部サーバーグループ •

© EXNOA LLC アーキテクチャ概要 5 Amazon Web Services、“Powered by AWS”ロゴ、［およびかかる資料で使用されるその他のＡＷＳ商標］

© EXNOA LLC レビュープロセス概要レビュープロセスの中で Claude 3.5 Sonnet と Gemini

© EXNOA LLC 試しにvllmをレビューしてみました 7 https://github.com/vllm-project/vllm.git

© EXNOA LLC 8

© EXNOA LLC 9

© EXNOA LLC 10

© EXNOA LLC 11

© EXNOA LLC 提案の一例 12

© EXNOA LLC 課題 • 担当者の技術スタックによらずレビューはできるものの、提案内容の妥当性を人間が評価できる必要がある。 • レビュー対象ファイルリストの選定の精度がファイルパスに依存してしまう。