AIを賢くしたいなら、まずは人間の改善ループから

AIを賢くしたいならまずは人間の改善ループから 2026/05/12 ハーネスエンジニアリング事例共有LT会株式会社TOKIUM Webエンジニア坂上晴信

坂上晴信 Harunobu Sakaue 経歴 1995年生まれ。東京の離島・伊豆大島出身。エンジニア → DevHR（= 開発組織専任の人事）→
エンジニア 2016年 3月東京高専情報工学科卒 2016年 4月株式会社TOKIUM 入社 Android/Webエンジニア 2023年 1月 DevHRにロールチェンジ育成・組織づくり・採用広報 2025年12月再びエンジニアにロールチェンジ Webエンジニア NOW! 自己紹介 / リアルのすがた ⚫︎ ⚫︎ ⚫︎ ⚫︎ ⚫︎ 2

にしこりさぶろ〜 @subroh_0508 好きなもの Kotlin / アイドルマスター / ラブライブ！ Kotlin本体へのContribute経験、Kotlin Festへの複数回の
登壇経験アリ。DevHR時代も趣味でKotlinを書き続け、 "200名収容の会場で技術登壇をした人事"になった。プライベートでは、アイマスPとライブライバーを兼任。『シャニマス』三峰結華と『蓮ノ空』村野さやかが人生のロールモデル。自己紹介 / インターネットのすがた 3

ハーネスエンジニアリングめちゃめちゃ盛り上がってる！ 4

他社のハーネスがどうなってるか見て学びたい！ 5

実際に運用中のハーネスの紹介ハーネス構築におけるTipsの紹介おしながき 6

新規PJで実際に運用している（広義の）ハーネスを 2つ紹介 1. チケットから実装・Pull Request作成まで自動化 jita-to-pr 2. コードレビューの自動化 self-review
… AI生成コードの品質磨き込み code-review … マージ前ガード + 変更意図のチーム共有知化実践事例 7

jira-to-pr スキル jira-to-pr TICKET-XXX で実行、以下4ステップを一気通貫で通す 1. タスクの目的・完了条件が記載されたJiraチケットから、実装計画を立案 2. 計画をGitHub Issueに蓄積、修正点がないか開発者に確認
3. GitHub Issueを参照して、クラウド上 or ローカル上で実装 4. Pull Requestをdraftで作成 3人で週30PR、溺れかけた開発チームがClaude Codeスキルでレビューを回した話 | TOKIUMプロダクトチームテックブログ zenn.dev/tokium_dev/articles/pr-review-workflow-with-claude-code-skills 事例 1: チケットからPull Request作成まで自動化 1つのJIRAチケットから複数のPRが出てくることも珍しくなく、週30 PR （※注: 3名のチーム）の土台はこのスキルです。 “ 8

スタートは、Pull Request作成時に自動実行される「Codexによる自動レビューアクション」当初、人間が見落としてしまう観点をカバーしてもらうために導入したところ… → 運用してみると「同じ AI レビューでも、目的によって設計が変わる」ことに気付き、 1ヶ月ほどで
2系統に分岐していった。系統対象目的 self-review 自分のPull Request (AI生成コード) AI生成コードの品質磨き込み code-review 他メンバーのPull Request マージガード + 変更意図の共有知化事例 2: コードレビューの自動化 9

AI生成コードの品質を、AI自身のループで磨き込む役割自分のPull Requestに対しレビュー → 修正を指摘収束まで反復動き
Agent Teamsで複数観点からレビュー結果をマージし、重要度を3段階に分類指摘をPull Requestに投稿 → 修正まで実行ねらい AIの生成物の品質を人間のレビュー前に磨く事例 2-A: self-review 10

マージ前の品質検証 + Pull Requestの意図をチーム全体に共有役割他メンバーのPull Requestに対しマージ前のガード + 意図の整理・構造化
動き Jira/Slack/レビュー指摘から意図を収集 Google's Code Review Guidelineに沿ってマージのブロッカーを洗い出し、修正提案ねらいマージを意識した修正提案 + 意図の共有事例 2-B: code-review 11

なんかすごそう！自分のチームでもやってみたい！ 12

でもどこから始めればいいか分からない 13

失敗しても良いところから入れる AIの思考過程を記録し、観察する課題点をこまめに修正するスムーズなハーネス構築を実現する3つのTips 14

未知の技術、かつ成果物に揺らぎが生まれるAIだからこそ、失敗時のコストが少ない箇所から組み込むことが重要！ jira-to-pr : 最終成果物はDraftのPull Request作成、人間の最終承認を経てマージしっくりこなかったら closeすればOK
code-review : Pull Requestのopen時に Codex で走らせ、簡単なプロンプトで指摘的外れなコメントは無視すればOK / 動かなければ削除（レビューが人間に戻るだけ）そもそも Linterや単体テスト等の（AIよりも）枯れた技術で品質向上ができるなら、最優先で組み込む Tips 1: 失敗しても良いところから入れる 15

開発者の思惑からズレた挙動 / 効率の悪い挙動を察知できる状態を整える残すもの生成物スキル実行の過程実装計画・進捗管理 → Issue
/ Pull Request の descriptionやcomment AIの思考過程 → ローカル（ tmp ディレクトリ等）集計・分析の基盤分析レポート → レポジトリに蓄積 ※AIの自動レビュー結果から指摘再発率 / 修正サイクル数 / カテゴリ集中度等を計測し、ハーネスの改善に還元 Tips 2: AIの思考過程を記録し、観察するスキル定義の改善につながるものはレポジトリ外に、プロジェクトコードの改善につながるものはレポジトリ内に蓄積！ 16

レトロスペクティブで「よりよいプロセス」を議論する時間を確保週1回、ハーネスも含めたプロセス改善が必ず実行される状態になっている細かな改善アイディアは積極的に取り入れる不満点があれば、雑にSlackで共有 → スキル化して解決メンバーのアクションにはポジティブに反応し、前向きに議論を交わす Tips 3: 課題点をこまめに修正する
17

「AIが賢く振る舞わざるを得ない環境」を作るのがハーネスエンジニアリング、これをスムーズに組み込むには… 導入 → 観察 → 改善のサイクルを失敗してもいい領域から組み込み、短いスパンで回す AIで改善ループを構築する前に人間による改善ループを構築し、業務プロセスを継続的にアップデートする
ことが重要まとめ 18

AIハーネスを試す対象を「失敗してもよい領域」から選ぶ AIのアウトプットは過程も含めて、ローカルのMarkdown / Issue / Pull Requestのコメントなど、形式問わず積極的に残す明日からできること今アツいハーネスエンジニアリング、ベストプラクティスが確立されていないからこその楽しさがたくさん！
みなさんも明日から、チャレンジしてみてね 19

資料公開＆技術発信は公式Xから本日のスライドは公式Xで公開！開発チームの技術やイベント情報を発信中、フォローお願いします！ @TOKIUM_Dev 情報発信中！ 20

AIを賢くしたいなら、まずは人間の改善ループから

AIを賢くしたいなら、まずは人間の改善ループから

subroh_0508

More Decks by subroh_0508

Other Decks in Technology

Featured

Transcript