AIと”コードの評価関数”を共有する / Share the "code evaluation function" with AI

2025/07/03　omotesando.rb #111 株式会社タイミー　新谷哲平 AIと”コードの評価関数”を共有する @euglena1215

自己紹介 Shintani Teppei（@euglena1215） • 株式会社タイミー • バックエンドテックリード • Claude
Pro の枠をスマホゲームのデイリーミッションの気持ちで消費してます

2025/07/03　omotesando.rb #111 株式会社タイミー　新谷哲平 AIと”コードの評価関数”を共有する @euglena1215

AIエージェントとプログラミングをしていて思うこと

AIエージェントとプログラミングをしていて思うことめんどくさい！

✅ AIエージェントが得意なこと • RSpecを実行し、成功するまで修正を繰り返す • RuboCopを実行し、成功するまで修正を繰り返す 󰤇 AIエージェントが苦手なこと • 筋の良い設計・実装になるまで修正を繰り返す
• 大事な部分はテストをしっかり書く AIエージェントとプログラミングをしていて思うこと

✅ AIエージェントが得意なこと • RSpecを実行し、成功するまで修正を繰り返す • RuboCopを実行し、成功するまで修正を繰り返す → 客観的でCLIで検証できる 󰤇 AIエージェントが苦手なこと
• 筋の良い設計・実装になるまで修正を繰り返す • 大事な部分はテストをしっかり書く → 主観的でCLIで検証できない AIエージェントとプログラミングをしていて思うこと

✅ AIエージェントが得意なこと • RSpecを実行し、成功するまで修正を繰り返す • RuboCopを実行し、成功するまで修正を繰り返す → 客観的でCLIで検証できる 󰤇 AIエージェントが苦手なこと
• 筋の良い設計・実装になるまで修正を繰り返す • 大事な部分はテストをしっかり書く → 主観的でCLIで検証できない → 客観的でCLIで検証できればいいのでは？ AIエージェントとプログラミングをしていて思うこと

まだ実験段階で実用レベルはもう少し先 Claude Code 製ツール https://github.com/euglena1215/code-qualia code-qualia：コード改善優先度計算ツール

１. テストカバレッジテストが少ないほど品質低２. 複雑度複雑度が高いほど品質低評価関数: "コードの品質" × "コードの重要度"
３. 変更頻度変更が多いほど重要度高４. アーキテクチャ Modelのようなコアロジックほど重要度高コードの品質コードの重要度 × 品質が低く重要なコードを改善対象として最優先する

評価関数の係数をパラメータとして設定可能コードの品質に関するパラメータコードの重要度に関するパラメータアーキテクチャに関するパラメータ各ディレクトリに対して重み付けを行う

最も重要なのはパラメータチューニング複雑度よりもテストがないのは許せない

最も重要なのはパラメータチューニングこのアプリケーションにとってサービスクラスは特に重要

最も重要なのはパラメータチューニングパラメータチューニング = 開発者の主観・経験則の言語化このやりとりさえもAIエージェントと一緒にできるかも

想定する活用方法 • 「コードを変更したらスコアn以上のメソッドが存在しない状態を保つこと」と書いておく • コードレビューを依頼する際に「スコアを踏まえた上でレビューして」と伝える • 定期実行で「最もスコアの高いメソッドを改善する Pull
Request を作って」と要求する重要ポイント：コマンド実行中は token を消費しないので経済的 💰 AIエージェントにとってコストが高く、安定しない操作は積極的にCLI化すべき

現状と今後の予想今の code-qualia のクオリティはまだまだ • 全テストを実行したカバレッジ結果を手元に置いておく必要がある ◦ ローカルで動かせない規模のテストケースになってくると結構大変 • 今の実装だと中規模〜のRailsだと集計に時間かかる
◦ タイミーのモノリスだと35秒くらい。ちょっと遅い開発者の主観・経験則をうまく表現し、CLIとしてAIに使わせてコードを自律的に改善させるケースはこれからもっと増えていくのではという予想 e.g. https://github.com/mizchi/similarity

Happy Vibe Coding!

AIと”コードの評価関数”を共有する / Share the "code evaluation...

AIと”コードの評価関数”を共有する / Share the "code evaluation function" with AI

Shintani Teppei

More Decks by Shintani Teppei

Other Decks in Programming

Featured

Transcript

2025/07/03　omotesando.rb #111 株式会社タイミー　新谷哲平 AIと”コードの評価関数”を共有する @euglena1215

自己紹介 Shintani Teppei（@euglena1215） • 株式会社タイミー • バックエンドテックリード • Claude

2025/07/03　omotesando.rb #111 株式会社タイミー　新谷哲平 AIと”コードの評価関数”を共有する @euglena1215

AIエージェントとプログラミングをしていて思うこと

AIエージェントとプログラミングをしていて思うこと

AIエージェントとプログラミングをしていて思うこと

AIエージェントとプログラミングをしていて思うこと

AIエージェントとプログラミングをしていて思うこと

AIエージェントとプログラミングをしていて思うこと

AIエージェントとプログラミングをしていて思うこと

AIエージェントとプログラミングをしていて思うこと

AIエージェントとプログラミングをしていて思うことめんどくさい！

✅ AIエージェントが得意なこと • RSpecを実行し、成功するまで修正を繰り返す • RuboCopを実行し、成功するまで修正を繰り返す 󰤇 AIエージェントが苦手なこと • 筋の良い設計・実装になるまで修正を繰り返す

✅ AIエージェントが得意なこと • RSpecを実行し、成功するまで修正を繰り返す • RuboCopを実行し、成功するまで修正を繰り返す → 客観的でCLIで検証できる 󰤇 AIエージェントが苦手なこと

✅ AIエージェントが得意なこと • RSpecを実行し、成功するまで修正を繰り返す • RuboCopを実行し、成功するまで修正を繰り返す → 客観的でCLIで検証できる 󰤇 AIエージェントが苦手なこと

まだ実験段階で実用レベルはもう少し先 Claude Code 製ツール https://github.com/euglena1215/code-qualia code-qualia：コード改善優先度計算ツール

１. テストカバレッジテストが少ないほど品質低２. 複雑度複雑度が高いほど品質低評価関数: "コードの品質" × "コードの重要度"

評価関数の係数をパラメータとして設定可能コードの品質に関するパラメータコードの重要度に関するパラメータアーキテクチャに関するパラメータ各ディレクトリに対して重み付けを行う

最も重要なのはパラメータチューニング複雑度よりもテストがないのは許せない

最も重要なのはパラメータチューニングこのアプリケーションにとってサービスクラスは特に重要

最も重要なのはパラメータチューニングパラメータチューニング = 開発者の主観・経験則の言語化このやりとりさえもAIエージェントと一緒にできるかも

Happy Vibe Coding!