Upgrade to Pro — share decks privately, control downloads, hide ads and more …

研究開発のための Coding Agent 活用術

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for taxfree taxfree
February 28, 2026
33

研究開発のための Coding Agent 活用術

https://laboratoryautomation.connpass.com/event/380190/ の LT で使用したスライド

Avatar for taxfree

taxfree

February 28, 2026
Tweet

Transcript

  1. 研究開発のための Coding Agent 活用術 Laboratory Automation 月例勉強会 / 2026.02 知念

    優 2026 年 2 月 28 日 理化学研究所 BDR / 東京科学大学
  2. 自己紹介 知念 優 (ちねん ゆう) 理化学研究所 生命機能科学研究センター AI 生物学研究チーム 東京科学大学

    情報理工学院 数理・計算科学系 B4 (休学中) 興味: AI for Science, 数理最適化 X: @taxfree_python GitHub: @taxfree-python 最近見た映画 プラダを着た悪魔 (すごい面白かった) 1 / 17
  3. チャット AI と Coding Agent の違い 従来: チャット AI AI

    がコード生成 → 人間がコピペ・実行 人間が結果を報告 → AI が修正案を提示 実行の主体は 人間。ループのたびにコピペが発生 現在: Coding Agent Agent が計画・実装・実行 → Agent が自己修正 必要な時だけ人間に確認 実行の主体は Agent。人間は approve するだけ モデルの推論能力の向上により、Agent が自律的にコードを書き・実行し・修正するサイクルが現実的に 3 / 17
  4. IDE 統合型 & マルチモデル CLI Cursor • VS Code fork

    の AI ネイティブ IDE • Claude / GPT / Gemini 等マルチモデル対応 • Background Agent: クラウド VM で自律開 発・PR 作成 • Tab 補完・Composer (複数ファイル一括編集) • Pro $20/mo〜 OpenCode • OSS (Go 製 / MIT)のターミナル Agent • 75+ LLM プロバイダ対応 (ローカルモデルも可) • LSP 統合でコード解析精度を強化 • GitHub Copilot 連携 (2026.01〜) • 95k+ GitHub Stars ※ IDE 型は他に Windsurf, Cline (VS Code 拡張) 等も存在 5 / 17
  5. CLI 型 ── モデルプロバイダ提供 Claude Code • Anthropic 公式 (Sonnet

    4.6 / Opus 4.6) • MCP: 外部ツール連携の標準プロ トコル • hooks: ファイル保存時の自動 フォーマット等 • plan mode / subagents で複雑 なタスクを分割 • 70.9k Stars Codex CLI • OpenAI 公式 (GPT-5.x-Codex が 現在の主流) • OSS (Rust 製 / Apache 2.0) • sandbox: ネットワーク遮断で ファイル操作を隔離 • ChatGPT Plus ($20/mo) に含ま れる • 62k Stars Gemini CLI • Google 公式 (Gemini 2.5 Pro / 3.1 Pro / 3 Flash) • OSS (TypeScript / Apache 2.0) • 1M トークンのコンテキストウィ ンドウ • Google 検索統合 / 無料枠 1,000 回/日 • 95.9k Stars 各社が自社モデルに最適化した CLI を提供。哲学・強みがそれぞれ異なる 6 / 17
  6. ツールの使い分け 開発対象: LangChain 等を用いた AI Agent の作成。実験・検証はローカル PC 内で完結 Claude

    Code: メイン開発 • 日常的な実装・デバッグ・リファクタリング • MCP 経由で Codex CLI も呼び出し可能 • hooks で通知を受け取りながら作業 Codex CLI: プラン・レビュー • 実装計画の策定 • コードレビューの補助 • Claude Code の plan mode から相談も 共通指示ファイル: LLM.md を作成し CLAUDE.md / AGENTS.md に symlink → ツールが変わっても 同じルールで動作 8 / 17
  7. 開発スタイル • 並列作業 → git worktree で分離 • Issue/PR 駆動

    で開発を管理 • 1 Issue = 1 Claude Code session • セッションに 名前をつけて 管理 # session に名前をつけて起動 claude --session-name 'issue-42-fix-config' # 後から再開 claude --resume # → issue-42-fix-config を選択 Issue 作成 → Session 開始 → Branch + Worktree → 実装 → 効果検証 → PR + Review 9 / 17
  8. LLM.md の書き方 WHAT 何をやるか 機能要件 技術スタック コーディング規約 WHY なぜやるか 設計意図

    背景・制約の理由 判断基準 DON'T 何をやらないか 禁止事項 アンチパターン 勝手にやりがちなこと 研究プロジェクト特有の規約: • fail-fast: エラーを握りつぶさない (LLM は親切心で try/except を足しがち) • default 値の一元管理: config で定義、下位レイヤーで再定義禁止 # DON'T (例) - try/except で例外を握りつぶさない - 関数の引数に default 値を定義しない config.yaml の値を唯一の情報源とする - 既存の utility がある場合は再実装しない 11 / 17
  9. 品質保証の仕組み • 研究の再現性: default 値の分散を防ぎ、パラメータを追跡可能に • コード品質: lint・型チェックでロジックを保証、テストで破壊的変更を検知 ローカル pre-commit

    ruff: lint pre-push mypy: type check pytest: test CI/CD (GitHub Actions) Codex & Claude Code で自動レビュー • 再利用性のチェック • 型・default の再定義検知 • fail-fast 方針の遵守確認 12 / 17
  10. 便利機能 4 選 Session Naming セッションに名前をつけて起動・/resume で検索 Issue 番号やタスク名で管理すると便利 MCP

    (Model Context Protocol) 外部ツール連携の標準規格 serena (コード解析), context7 (ドキュメント参 照) 等を接続 Hooks で通知 approve 要求時・タスク完了時に macOS 通知を 表示 放置しておいて通知が来たら確認するスタイル Plan Mode 編集前にまず計画を立てる (最近は自動切替も) 計画段階で Codex に相談することも可能 14 / 17
  11. 失敗談 default 値がいたるところで上書きされる config.yaml を変更しても反映されない → 全箇所探して修正する羽目に → CLAUDE.md に規約を明文化して解決

    Before: default が散在 def train(lr=0.001, epochs=100): ... def run(lr=0.01, epochs=50): # !? After: config で一元管理 def train(lr: float, epochs: int): ... # config.yaml から注入 worktree を使ってくれない 「worktree で作業して」と指示しても 普通にブランチを切ってしまう → 指示の書き方を工夫する必要あり 規約を書いても完璧ではない LLM は「だいたい」守るが 100% ではない → 継続的なメンテナンスが必要 16 / 17
  12. まとめ • Coding Agent は 用途に応じて使い分ける ‣ IDE 型、CLI 型

    (プロバイダ提供 / OSS) • LLM.md (共通指示ファイル)が品質の要 • 特に「やらないこと」を明文化するのが重要 • pre-commit + CI で品質を機械的に担保 • 完璧ではない → 規約の継続的メンテ が必要 ご清聴ありがとうございました 17 / 17