Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
エンジニアの仕事を機械の番人から仕組み設計者へ / From Machine Keeper t...
Search
technuma
June 09, 2025
Technology
310
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
エンジニアの仕事を機械の番人から仕組み設計者へ / From Machine Keeper to System Designer
technuma
June 09, 2025
More Decks by technuma
See All by technuma
GitHubでAIレビューを組み込む 〜Claude Code Actionデモ&AIエージェントの設計方針〜 / Claude Code Action for beginners
technuma
1
440
品質は設計でつくり込む / design in quality
technuma
32
19k
AIレビュアーをスケールさせるには / Scaling AI Reviewers
technuma
2
500
Devinにファーストレビューをさせ、コードレビューを効率化するには / Using Devin to Make Code Reviews More Efficient
technuma
3
2.5k
開発生産性を計測し、開発組織の当たり前基準を上げる
technuma
2
650
Other Decks in Technology
See All in Technology
Snowflakeと仲良くなる第一歩
coco_se
4
460
SONiCの統計情報を取得したい
sonic
0
140
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
4
660
入門!AWS Blocks
ysuzuki
1
110
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
2.3k
2026TECHFRESH畢業分享會 - 葬送的通靈師:化系統與用戶雜訊成行動訊號
line_developers_tw
PRO
0
970
【NRUG vol.18】なぜ多くのオブザーバビリティ導入は失敗するのか
nrug_member
0
120
アンオフィシャルな、オフィシャルからのお願い
wyamazak_devrel
0
100
2026 TECHFRESH 畢業分享會 - 開發日常大解密!從領域驅動到企業級上線
line_developers_tw
PRO
0
960
あなたの知らないPDFのアクセシビリティ
lycorptech_jp
PRO
0
180
エラーバジェットのアラートのタイミングを考える.pdf
kairim0
0
140
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
290
Featured
See All Featured
The browser strikes back
jonoalderson
0
1.2k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
560
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
56k
Abbi's Birthday
coloredviolet
2
8k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Skip the Path - Find Your Career Trail
mkilby
1
150
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
140
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.6k
Transcript
エンジニアの仕事を機械の番人から仕組み設計者へ コードレビューの課題をAIで解決したGLOBIS事例 株式会社グロービス 大沼 和也 1
GLOBISにおけるAI活用のためのプロジェクト AIアクセラレートプロジェクト 個人のAI活用を促進 BPE(Business Process Enabling)プロジェクト 業務プロセスにTech/AIを組み込む DevExチームによる開発プロセスへのAI組み込み 開発プロセスにAIを組み込む 2
GLOBISでつかっているツー ルの現在地 エディタ系 Cursor, GitHub Copilot, Windsurf, RooCode, Cline エージェント系
Devin(Search,wiki含む), Claude Code Action(2事業で トライアル中、今週から全 体に広げていく予定) 3
AIが生成したコードのレビューに疲れてませんか? 4
現在のコードレビュー = 「機械の番人」 トヨタ生産方式での「機械の番人」 機械が正しいコードを書いているか監視 異常があれば対応 本質的な改善活動ではなく、監視業務 現在のコードレビュー AIが正しいコードを書いているか細かく確認 バグの検出
動作確認 人間が「番人」として機械的な作業に時間を費やしている 5
目指すべき姿: 「番人」から「設計者」へ 機械的な作業→ AIに任せる 構文チェック 型エラー検出 パフォーマンス問題の検出 人間が集中すべきこと 設計思想のレビュー アーキテクチャの妥当性
ビジネス要件との整合性 長期的な保守性の評価 6
なぜ今、この転換が必要なのか 1. AIの進化 コード理解能力の向上 複数の特化型AIの並列実行が可能に 2. 開発速度の要求 より速いデリバリーが求められる 品質を保ちながらスピードを上げる必要 3.
エンジニアの価値最大化 機械的作業から解放 創造的・戦略的な仕事に集中 7
本日お話しすること AIを活用したコードレビューの実装 継続的にメンテナンス可能なワークフロー 並列実行による効率化 特化型AIエージェントの設計 8
導入:従来システムの課題 RooCodeやClineでの成果と限界 レビュー精度は非常に高い workflowに組み込むまでの素振りは非常にやりやすい modeが増えるほど実行時間が延びる チャット形式(VSCodeプラグインありき)でしか実行できない 9
自動テストの構築 Mastraを用いて複数のモデルやツールを組み合わせ、並列実行できる自動テストの仕 組みを構築した 10
自動テストの構築 11
テストケースの作成(抜粋) questions: - name: "Service層ロジックのModel層移行提案" enabled: true prompt: | 以下のService層のコードをレビューしてください。Rails的な設計観点から改善点があれば指摘してください。
```ruby # app/services/user_subscription_service.rb class UserSubscriptionService ... # 省略: ユーザーサブスクリプション関連のロジック end ``` expected: | このService層のコードには、Railsの設計原則に反する問題があります: **主な問題点:** 1. **ビジネスロジックがModelから分離されている**: ユーザーの月額料金計算やアクセス権限判定は、Userモデル自身が持つべき責務です 2. **Fat Service**: Service層が肥大化し、本来Modelが持つべきロジックを抱え込んでいます 3. **テストの複雑化**: Service層とModel層の両方をテストする必要があり、テストが複雑になります **改善案:** ```ruby # app/models/user.rb class User < ApplicationRecord ... # 省略: ユーザーサブスクリプション関連のロジック end ``` ... 12
モデル変更時の挙動を自動テストで品質保証する テストケース GPT- 4.1 Claude Sonnet-4 Gemini 2.5 Flash Gemini
2.0 Flash valid?/save併用チェッ ク 条件分岐検出(偽陰性検 証) 条件分岐検出(偽陽性検 証) DHHルーティング Service→Model提案 13
コードレビューにおいて 誤検知(偽陽性): 人間がすぐ判断できるので許容できるからある程度許容したい 検知漏れ(偽陰性): 人間がすぐ判断できないので少ないほうがいい 14
コードレビューの評価抜粋1 15
コードレビューの評価抜粋2 16
Claude Code Action によるアプローチ 従来システムとの比較 RooCode/ClineやDevin → Claude Code Action導入
新たに可能になったこと チャットベース直列実行ではなく、CLIで並列実行できる 自動テストしやすい 複数モデル・複数特化エージェントへの並列配信 スクリプトファーストでworkflowを組める Devinと比べてコストが1/5以下 17
スクリプトファーストの設計思想 Devinの課題事例 レビュー後に、PRにレビューコメント投稿の失敗 謎に動きが止まり、完了にも失敗にもならないことがあった 解決策 スクリプト側での制御により、高速に全step確実に実行できる 18
スクリプトファーストの設計思想 RooCodeだとAIファーストの設計になってしまう 入力されたPRのURLをもとにbranchをcheckout(RooCode) ↓ 入力されたPRのURLからdiffを取得(RooCode) ↓ diffをもとに複数のAIレビュアーがレビュー実行(RooCode) ↓ レビューを取りまとめる(RooCode) ↓
レビュー結果をPRにコメント(RooCode) 19
スクリプトファーストの設計思想 Claude Code Actionを使うと、CLIでのデータ受け渡しが容易 入力されたPRのURLをもとにbranchをcheckout(スクリプト) ↓ diffをもとに複数のAIレビュアーがレビュー実行(ClaudeCode) ↓ レビューを取りまとめる(スクリプト) ↓
取りまとめたレビューを要約(ClaudeCode) ↓ レビュー結果をPRにコメント(スクリプト) 20
スクリプトファーストの設計思想 Claude Codeは手元での検証からGHAなどのworkflow化があまりにもかんたん (-pつけてワンショットにするだけ) ps auxを使って、リソース使用量が多いプロセスの問題点を見つけ出す例 % ps aux |
claude code "リソース使用量が多いプロセスの問題点を教える" レビューして、そのレビュー結果が正しいかを確認する例 (.claude/settings.jsonを使わずに、--allowedToolsでコピペで動くようにしています) % claude -p "https://github.com/owner/repo/pull/NUMBER をレビューして、レビュー内容をreview.mdに保存して" \ --allowedTools "Write" "Bash(gh pr diff:*)" "Bash(gh pr view:*)"\ | claude -p "review.mdのレビュー結果みて、指摘事項が正しいかを確認してreview-checked.mdに保存して"\ --allowedTools "Write" 21
特化型エージェントの実装 (導入中) 特化型AIエージェントを複数用 意し、並列実行することで高速 化を実現 各エージェントは特定の観点に 特化し、効率的なレビューを実 施 初手はそれぞれの観点でレビュ ーし、取りまとめないのもアリ
(実装が簡単) 目的を明確にすることで、より 高精度なレビューを目指す 22
個人情報特化でレビューを検証 した例 GHAにて標準で複数並列で 動かせるので実行が早い workflowを分けて direct_prompt に役割や目的を 書くことで、容易に特化型AIエ ージェントを作成可能 23
明日からできるアクションプラン Claude Code ActionをAPIキー課金で導入すれば、非常に小さく試すことができる Claude Code Actionの direct_prompt を使い、特定の観点に特化したAIエージェント を気軽に作成できる
24
まとめ 達成された成果 1. Claude Code Actionを使った、スケーラブルな特化型AIシステム 2. 並列処理による高速化 3. 自動テストによる品質保証
今後の展望 人間の観点や目的をAIに移植し、機械の番人ではなく仕組みづくりをするエンジニア を増やす 25