Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AIを賢くしたいなら、まずは人間の改善ループから

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 AIを賢くしたいなら、まずは人間の改善ループから

サポーターズCoLab・ハーネスエンジニアリング事例共有LT会のLT資料です。
https://supporterz-seminar.connpass.com/event/391344/

Avatar for subroh_0508

subroh_0508

May 11, 2026

More Decks by subroh_0508

Other Decks in Technology

Transcript

  1. 坂上 晴信 Harunobu Sakaue 経歴 1995年生まれ。東京の離島・伊豆大島出身。 エンジニア → DevHR(= 開発組織専任の人事)→

    エンジニア 2016年 3月 東京高専 情報工学科卒 2016年 4月 株式会社TOKIUM 入社 Android/Webエンジニア 2023年 1月 DevHRにロールチェンジ 育成・組織づくり・採用広報 2025年12月 再びエンジニアにロールチェンジ Webエンジニア NOW! 自己紹介 / リアルのすがた ⚫︎ ⚫︎ ⚫︎ ⚫︎ ⚫︎ 2
  2. にしこりさぶろ〜 @subroh_0508 好きなもの Kotlin / アイドルマスター / ラブライブ! Kotlin本体へのContribute経験、Kotlin Festへの複数回の

    登壇経験アリ。DevHR時代も趣味でKotlinを書き続け、 "200名収容の会場で技術登壇をした人事"になった。 プライベートでは、アイマスPとライブライバーを兼任。 『シャニマス』三峰結華と『蓮ノ空』村野さやかが 人生のロールモデル。 自己紹介 / インターネットのすがた 3
  3. 新規PJで実際に運用している(広義の)ハーネスを 2つ 紹介 1. チケットから実装・Pull Request作成まで自動化 jita-to-pr 2. コードレビューの自動化 self-review

    … AI生成コードの品質磨き込み code-review … マージ前ガード + 変更意図のチーム共有知化 実践事例 7
  4. jira-to-pr スキル jira-to-pr TICKET-XXX で実行、以下4ステップを一気通貫で通す 1. タスクの目的・完了条件が記載されたJiraチケットから、実装計画を立案 2. 計画をGitHub Issueに蓄積、修正点がないか開発者に確認

    3. GitHub Issueを参照して、クラウド上 or ローカル上で実装 4. Pull Requestをdraftで作成 3人で週30PR、溺れかけた開発チームがClaude Codeスキルでレビューを回した話 | TOKIUMプロダクトチーム テックブログ zenn.dev/tokium_dev/articles/pr-review-workflow-with-claude-code-skills 事例 1: チケットからPull Request作成まで自動化 1つのJIRAチケットから複数のPRが出てくることも珍しくなく、週30 PR (※注: 3名のチーム) の土台はこのスキルです。 “ 8
  5. スタートは、Pull Request作成時に自動実行される「Codexによる自動レビューアクション」 当初、人間が見落としてしまう観点をカバーしてもらうために導入したところ… → 運用してみると 「同じ AI レビューでも、目的によって設計が変わる」 ことに気付き、 1ヶ月ほどで

    2系統に分岐 していった。 系統 対象 目的 self-review 自分のPull Request (AI生成コード) AI生成コードの 品質磨き込み code-review 他メンバーのPull Request マージガード + 変更意図の共有知化 事例 2: コードレビューの自動化 9
  6. AI生成コードの品質を、AI自身のループで磨き込む 役割 自分のPull Requestに対し レビュー → 修正 を 指摘収束まで反復 動き

    Agent Teamsで複数観点からレビュー 結果をマージし、重要度を3段階に分類 指摘をPull Requestに投稿 → 修正まで実行 ねらい AIの生成物の品質を 人間のレビュー前に磨く 事例 2-A: self-review 10
  7. マージ前の品質検証 + Pull Requestの意図をチーム全体に共有 役割 他メンバーのPull Requestに対し マージ前のガード + 意図の整理・構造化

    動き Jira/Slack/レビュー指摘から 意図 を収集 Google's Code Review Guidelineに沿って マージのブロッカーを洗い出し、修正提案 ねらい マージを意識した修正提案 + 意図の共有 事例 2-B: code-review 11
  8. 未知の技術、かつ成果物に揺らぎが生まれるAIだからこそ、 失敗時のコストが少ない箇所から 組み込むことが重要! jira-to-pr : 最終成果物はDraftのPull Request作成、人間の最終承認 を経てマージ しっくりこなかったら closeすればOK

    code-review : Pull Requestのopen時に Codex で走らせ、簡単なプロンプトで指摘 的外れなコメントは 無視すればOK / 動かなければ 削除(レビューが人間に戻るだけ) そもそも Linterや単体テスト等の(AIよりも)枯れた技術 で品質向上ができるなら、 最優先で組み込む Tips 1: 失敗しても良いところから入れる 15
  9. 開発者の思惑からズレた挙動 / 効率の悪い挙動を察知できる状態を整える 残すもの 生成物 スキル実行の 過程 実装計画・進捗管理 → Issue

    / Pull Request の descriptionやcomment AIの思考過程 → ローカル( tmp ディレクトリ等) 集計・分析の 基盤 分析レポート → レポジトリに蓄積 ※AIの自動レビュー結果から 指摘再発率 / 修正サイクル数 / カテゴリ集中度 等 を計測し、ハーネスの改善に還元 Tips 2: AIの思考過程を記録し、観察する スキル定義の改善につながるものは レポジトリ外に、 プロジェクトコードの改善につながるものは レポジトリ内に蓄積! 16