Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIを賢くしたいなら、まずは人間の改善ループから
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
subroh_0508
May 11, 2026
Technology
43
0
Share
AIを賢くしたいなら、まずは人間の改善ループから
サポーターズCoLab・ハーネスエンジニアリング事例共有LT会のLT資料です。
https://supporterz-seminar.connpass.com/event/391344/
subroh_0508
May 11, 2026
More Decks by subroh_0508
See All by subroh_0508
"S/N-GUL4R1TY"に向けて人類は何をすべきなのか
subroh0508
0
23
画面の向こうから「気づき」を得る 画面の向こうを「物差し」として捉える
subroh0508
1
220
蓮ノ空女学院スクールアイドルクラブはなぜ強いのか
subroh0508
0
63
2026年、書籍をちゃんと読むぞ👊 〜約3万円分の書籍を積読にしないためにやること〜
subroh0508
5
850
「発信の依頼」が採用広報活動の立ち上げに効くかもしれない
subroh0508
1
780
技術以外の世界に『越境』しエンジニアとして進化を遂げる 〜Kotlinへの愛とDevHRとしての挑戦を添えて〜
subroh0508
1
1.4k
10分de名コミュ “最高の自分”を演じ憧れの同業者と渡り合う
subroh0508
1
640
カンファレンス協賛を社員の成長機会に変える
subroh0508
0
170
ネガティブをねじ伏せ、n=1のキャリアに変える技術
subroh0508
1
1.2k
Other Decks in Technology
See All in Technology
巨大プラットフォームを進化させる「第3のROI」
recruitengineers
PRO
2
2.3k
AIが自律的に働く時代へ Amazon Quick で実現するAIエージェント紹介
koheiyoshikawa
0
170
Microsoft 365 / Microsoft 365 Copilot : 自分の状態を確認する「ラベル」について
taichinakamura
0
450
Cortex Codeのコスト見積ヒントご紹介
yokatsuki
0
140
The 7 pitfalls of AI
ufried
0
180
生成AIが変える SaaS の競争原理と弁護士ドットコムのプロダクト戦略
bengo4com
1
3.3k
独断と偏見で試してみる、 シングル or マルチエージェント どっちがいいの?
shichijoyuhi
1
240
雑談は、センサーだった
bitkey
PRO
2
190
Angular Architecture Revisited Modernizing Angular Architectural Patterns
rainerhahnekamp
0
120
AIが書いたコードを信じられない問題 〜レビュー負荷を下げるために変えたこと〜 / The AI Code Trust Gap: Reducing the Review Burden
bitkey
PRO
8
1.4k
「QA=テスト」「シフトレフト=スクラムイベントの参加者の一員」の呪縛を解く。アジャイルな開発を止めないために、10Xで挑んだ「右側のしわ寄せ」解消記 #scrumniigata
nihonbuson
PRO
3
660
GitHub Copilot CLI と VS Code Agent Mode の使い分け
tomokusaba
0
140
Featured
See All Featured
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.3k
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
380
A Modern Web Designer's Workflow
chriscoyier
698
190k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
1
500
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
220
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.2k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
780
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
140
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.9k
Transcript
AIを賢くしたいなら まずは人間の改善ループから 2026/05/12 ハーネスエンジニアリング事例共有LT会 株式会社TOKIUM Webエンジニア 坂上 晴信
坂上 晴信 Harunobu Sakaue 経歴 1995年生まれ。東京の離島・伊豆大島出身。 エンジニア → DevHR(= 開発組織専任の人事)→
エンジニア 2016年 3月 東京高専 情報工学科卒 2016年 4月 株式会社TOKIUM 入社 Android/Webエンジニア 2023年 1月 DevHRにロールチェンジ 育成・組織づくり・採用広報 2025年12月 再びエンジニアにロールチェンジ Webエンジニア NOW! 自己紹介 / リアルのすがた ⚫︎ ⚫︎ ⚫︎ ⚫︎ ⚫︎ 2
にしこりさぶろ〜 @subroh_0508 好きなもの Kotlin / アイドルマスター / ラブライブ! Kotlin本体へのContribute経験、Kotlin Festへの複数回の
登壇経験アリ。DevHR時代も趣味でKotlinを書き続け、 "200名収容の会場で技術登壇をした人事"になった。 プライベートでは、アイマスPとライブライバーを兼任。 『シャニマス』三峰結華と『蓮ノ空』村野さやかが 人生のロールモデル。 自己紹介 / インターネットのすがた 3
ハーネスエンジニアリング めちゃめちゃ盛り上がってる! 4
他社のハーネスがどうなってるか 見て学びたい! 5
実際に運用中のハーネスの紹介 ハーネス構築におけるTipsの紹介 おしながき 6
新規PJで実際に運用している(広義の)ハーネスを 2つ 紹介 1. チケットから実装・Pull Request作成まで自動化 jita-to-pr 2. コードレビューの自動化 self-review
… AI生成コードの品質磨き込み code-review … マージ前ガード + 変更意図のチーム共有知化 実践事例 7
jira-to-pr スキル jira-to-pr TICKET-XXX で実行、以下4ステップを一気通貫で通す 1. タスクの目的・完了条件が記載されたJiraチケットから、実装計画を立案 2. 計画をGitHub Issueに蓄積、修正点がないか開発者に確認
3. GitHub Issueを参照して、クラウド上 or ローカル上で実装 4. Pull Requestをdraftで作成 3人で週30PR、溺れかけた開発チームがClaude Codeスキルでレビューを回した話 | TOKIUMプロダクトチーム テックブログ zenn.dev/tokium_dev/articles/pr-review-workflow-with-claude-code-skills 事例 1: チケットからPull Request作成まで自動化 1つのJIRAチケットから複数のPRが出てくることも珍しくなく、週30 PR (※注: 3名のチーム) の土台はこのスキルです。 “ 8
スタートは、Pull Request作成時に自動実行される「Codexによる自動レビューアクション」 当初、人間が見落としてしまう観点をカバーしてもらうために導入したところ… → 運用してみると 「同じ AI レビューでも、目的によって設計が変わる」 ことに気付き、 1ヶ月ほどで
2系統に分岐 していった。 系統 対象 目的 self-review 自分のPull Request (AI生成コード) AI生成コードの 品質磨き込み code-review 他メンバーのPull Request マージガード + 変更意図の共有知化 事例 2: コードレビューの自動化 9
AI生成コードの品質を、AI自身のループで磨き込む 役割 自分のPull Requestに対し レビュー → 修正 を 指摘収束まで反復 動き
Agent Teamsで複数観点からレビュー 結果をマージし、重要度を3段階に分類 指摘をPull Requestに投稿 → 修正まで実行 ねらい AIの生成物の品質を 人間のレビュー前に磨く 事例 2-A: self-review 10
マージ前の品質検証 + Pull Requestの意図をチーム全体に共有 役割 他メンバーのPull Requestに対し マージ前のガード + 意図の整理・構造化
動き Jira/Slack/レビュー指摘から 意図 を収集 Google's Code Review Guidelineに沿って マージのブロッカーを洗い出し、修正提案 ねらい マージを意識した修正提案 + 意図の共有 事例 2-B: code-review 11
なんかすごそう! 自分のチームでもやってみたい! 12
でもどこから始めればいいか 分からない 13
失敗しても良いところから入れる AIの思考過程を記録し、観察する 課題点をこまめに修正する スムーズなハーネス構築を実現する3つのTips 14
未知の技術、かつ成果物に揺らぎが生まれるAIだからこそ、 失敗時のコストが少ない箇所から 組み込むことが重要! jira-to-pr : 最終成果物はDraftのPull Request作成、人間の最終承認 を経てマージ しっくりこなかったら closeすればOK
code-review : Pull Requestのopen時に Codex で走らせ、簡単なプロンプトで指摘 的外れなコメントは 無視すればOK / 動かなければ 削除(レビューが人間に戻るだけ) そもそも Linterや単体テスト等の(AIよりも)枯れた技術 で品質向上ができるなら、 最優先で組み込む Tips 1: 失敗しても良いところから入れる 15
開発者の思惑からズレた挙動 / 効率の悪い挙動を察知できる状態を整える 残すもの 生成物 スキル実行の 過程 実装計画・進捗管理 → Issue
/ Pull Request の descriptionやcomment AIの思考過程 → ローカル( tmp ディレクトリ等) 集計・分析の 基盤 分析レポート → レポジトリに蓄積 ※AIの自動レビュー結果から 指摘再発率 / 修正サイクル数 / カテゴリ集中度 等 を計測し、ハーネスの改善に還元 Tips 2: AIの思考過程を記録し、観察する スキル定義の改善につながるものは レポジトリ外に、 プロジェクトコードの改善につながるものは レポジトリ内に蓄積! 16
レトロスペクティブで「よりよいプロセス」を議論する時間を確保 週1回、ハーネスも含めたプロセス改善が必ず実行される状態になっている 細かな改善アイディアは積極的に取り入れる 不満点があれば、雑にSlackで共有 → スキル化して解決 メンバーのアクションにはポジティブに反応し、前向きに議論を交わす Tips 3: 課題点をこまめに修正する
17
「AIが賢く振る舞わざるを得ない環境」を作るのが ハーネスエンジニアリング、これをスムーズに組み込むには… 導入 → 観察 → 改善のサイクルを失敗してもいい領域から組み込み、 短いスパンで回す AIで改善ループを構築する前に人間による改善ループを構築し、 業務プロセスを継続的にアップデートする
ことが重要 まとめ 18
AIハーネスを試す対象を「失敗してもよい領域」から選ぶ AIのアウトプットは過程も含めて、ローカルのMarkdown / Issue / Pull Requestのコメントなど、形式問わず積極的に残す 明日からできること 今アツいハーネスエンジニアリング、 ベストプラクティスが確立されていないからこその楽しさがたくさん!
みなさんも明日から、チャレンジしてみてね 19
資料公開&技術発信は公式Xから 本日のスライドは公式Xで公開! 開発チームの技術やイベント情報を 発信中、フォローお願いします! @TOKIUM_Dev 情報発信中! 20