研究開発のための Coding Agent 活用術

研究開発のための Coding Agent 活用術 Laboratory Automation 月例勉強会 / 2026.02 知念
優 2026 年 2 月 28 日理化学研究所 BDR / 東京科学大学

自己紹介知念優 (ちねんゆう) 理化学研究所生命機能科学研究センター AI 生物学研究チーム東京科学大学
情報理工学院数理・計算科学系 B4 (休学中) 興味: AI for Science, 数理最適化 X: @taxfree_python GitHub: @taxfree-python 最近見た映画プラダを着た悪魔 (すごい面白かった) 1 / 17

Coding Agents の現在地

チャット AI と Coding Agent の違い従来: チャット AI AI
がコード生成 → 人間がコピペ・実行人間が結果を報告 → AI が修正案を提示実行の主体は人間。ループのたびにコピペが発生現在: Coding Agent Agent が計画・実装・実行 → Agent が自己修正必要な時だけ人間に確認実行の主体は Agent。人間は approve するだけモデルの推論能力の向上により、Agent が自律的にコードを書き・実行し・修正するサイクルが現実的に 3 / 17

モデル能力の進化 Source: https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/ 4 / 17

IDE 統合型 & マルチモデル CLI Cursor • VS Code fork
の AI ネイティブ IDE • Claude / GPT / Gemini 等マルチモデル対応 • Background Agent: クラウド VM で自律開発・PR 作成 • Tab 補完・Composer (複数ファイル一括編集) • Pro $20/mo〜 OpenCode • OSS (Go 製 / MIT)のターミナル Agent • 75+ LLM プロバイダ対応 (ローカルモデルも可) • LSP 統合でコード解析精度を強化 • GitHub Copilot 連携 (2026.01〜) • 95k+ GitHub Stars ※ IDE 型は他に Windsurf, Cline (VS Code 拡張) 等も存在 5 / 17

CLI 型 ── モデルプロバイダ提供 Claude Code • Anthropic 公式 (Sonnet
4.6 / Opus 4.6) • MCP: 外部ツール連携の標準プロトコル • hooks: ファイル保存時の自動フォーマット等 • plan mode / subagents で複雑なタスクを分割 • 70.9k Stars Codex CLI • OpenAI 公式 (GPT-5.x-Codex が現在の主流) • OSS (Rust 製 / Apache 2.0) • sandbox: ネットワーク遮断でファイル操作を隔離 • ChatGPT Plus ($20/mo) に含まれる • 62k Stars Gemini CLI • Google 公式 (Gemini 2.5 Pro / 3.1 Pro / 3 Flash) • OSS (TypeScript / Apache 2.0) • 1M トークンのコンテキストウィンドウ • Google 検索統合 / 無料枠 1,000 回/日 • 95.9k Stars 各社が自社モデルに最適化した CLI を提供。哲学・強みがそれぞれ異なる 6 / 17

私のワークフロー

ツールの使い分け開発対象: LangChain 等を用いた AI Agent の作成。実験・検証はローカル PC 内で完結 Claude
Code: メイン開発 • 日常的な実装・デバッグ・リファクタリング • MCP 経由で Codex CLI も呼び出し可能 • hooks で通知を受け取りながら作業 Codex CLI: プラン・レビュー • 実装計画の策定 • コードレビューの補助 • Claude Code の plan mode から相談も共通指示ファイル: LLM.md を作成し CLAUDE.md / AGENTS.md に symlink → ツールが変わっても同じルールで動作 8 / 17

開発スタイル • 並列作業 → git worktree で分離 • Issue/PR 駆動
で開発を管理 • 1 Issue = 1 Claude Code session • セッションに名前をつけて管理 # session に名前をつけて起動 claude --session-name 'issue-42-fix-config' # 後から再開 claude --resume # → issue-42-fix-config を選択 Issue 作成 → Session 開始 → Branch + Worktree → 実装 → 効果検証 → PR + Review 9 / 17

LLM.md と品質保証

LLM.md の書き方 WHAT 何をやるか機能要件技術スタックコーディング規約 WHY なぜやるか設計意図
背景・制約の理由判断基準 DON'T 何をやらないか禁止事項アンチパターン勝手にやりがちなこと研究プロジェクト特有の規約: • fail-fast: エラーを握りつぶさない (LLM は親切心で try/except を足しがち) • default 値の一元管理: config で定義、下位レイヤーで再定義禁止 # DON'T (例) - try/except で例外を握りつぶさない - 関数の引数に default 値を定義しない config.yaml の値を唯一の情報源とする - 既存の utility がある場合は再実装しない 11 / 17

品質保証の仕組み • 研究の再現性: default 値の分散を防ぎ、パラメータを追跡可能に • コード品質: lint・型チェックでロジックを保証、テストで破壊的変更を検知ローカル pre-commit
ruff: lint pre-push mypy: type check pytest: test CI/CD (GitHub Actions) Codex & Claude Code で自動レビュー • 再利用性のチェック • 型・default の再定義検知 • fail-fast 方針の遵守確認 12 / 17

Claude Code の便利機能

便利機能 4 選 Session Naming セッションに名前をつけて起動・/resume で検索 Issue 番号やタスク名で管理すると便利 MCP
(Model Context Protocol) 外部ツール連携の標準規格 serena (コード解析), context7 (ドキュメント参照) 等を接続 Hooks で通知 approve 要求時・タスク完了時に macOS 通知を表示放置しておいて通知が来たら確認するスタイル Plan Mode 編集前にまず計画を立てる (最近は自動切替も) 計画段階で Codex に相談することも可能 14 / 17

課題と教訓

失敗談 default 値がいたるところで上書きされる config.yaml を変更しても反映されない → 全箇所探して修正する羽目に → CLAUDE.md に規約を明文化して解決
Before: default が散在 def train(lr=0.001, epochs=100): ... def run(lr=0.01, epochs=50): # !? After: config で一元管理 def train(lr: float, epochs: int): ... # config.yaml から注入 worktree を使ってくれない「worktree で作業して」と指示しても普通にブランチを切ってしまう → 指示の書き方を工夫する必要あり規約を書いても完璧ではない LLM は「だいたい」守るが 100% ではない → 継続的なメンテナンスが必要 16 / 17

まとめ • Coding Agent は用途に応じて使い分ける ‣ IDE 型、CLI 型
(プロバイダ提供 / OSS) • LLM.md (共通指示ファイル)が品質の要 • 特に「やらないこと」を明文化するのが重要 • pre-commit + CI で品質を機械的に担保 • 完璧ではない → 規約の継続的メンテが必要ご清聴ありがとうございました 17 / 17

研究開発のための Coding Agent 活用術

研究開発のための Coding Agent 活用術

taxfree

More Decks by taxfree

Featured

Transcript