Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
研究開発のための Coding Agent 活用術
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
taxfree
February 28, 2026
85
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
研究開発のための Coding Agent 活用術
https://laboratoryautomation.connpass.com/event/380190/
の LT で使用したスライド
taxfree
February 28, 2026
More Decks by taxfree
See All by taxfree
Evolving collaborative research ideas with multi-agent grounding in lab-specific contexts and literature
taxfree_python
0
13
R&D_UIのラストワンマイルをLLMで埋める
taxfree_python
0
19
AI for タギロン
taxfree_python
0
41
traP 2024 忘年会
taxfree_python
0
11
traP ユニークビジョン LT 会
taxfree_python
0
18
R.*u.*f.*f.*
taxfree_python
0
19
traP_新入生オリエンテーション_2024
taxfree_python
0
110
A Beginner's Guide to Quantum computing
taxfree_python
0
420
How to create slack Bot with Python?
taxfree_python
1
350
Featured
See All Featured
Abbi's Birthday
coloredviolet
2
8k
Paper Plane (Part 1)
katiecoart
PRO
0
8.8k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
New Earth Scene 8
popppiees
3
2.3k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
280
Mind Mapping
helmedeiros
PRO
1
240
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.2k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
280
Leading Effective Engineering Teams in the AI Era
addyosmani
9
2k
Music & Morning Musume
bryan
47
7.2k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
Transcript
研究開発のための Coding Agent 活用術 Laboratory Automation 月例勉強会 / 2026.02 知念
優 2026 年 2 月 28 日 理化学研究所 BDR / 東京科学大学
自己紹介 知念 優 (ちねん ゆう) 理化学研究所 生命機能科学研究センター AI 生物学研究チーム 東京科学大学
情報理工学院 数理・計算科学系 B4 (休学中) 興味: AI for Science, 数理最適化 X: @taxfree_python GitHub: @taxfree-python 最近見た映画 プラダを着た悪魔 (すごい面白かった) 1 / 17
Coding Agents の現在地
チャット AI と Coding Agent の違い 従来: チャット AI AI
がコード生成 → 人間がコピペ・実行 人間が結果を報告 → AI が修正案を提示 実行の主体は 人間。ループのたびにコピペが発生 現在: Coding Agent Agent が計画・実装・実行 → Agent が自己修正 必要な時だけ人間に確認 実行の主体は Agent。人間は approve するだけ モデルの推論能力の向上により、Agent が自律的にコードを書き・実行し・修正するサイクルが現実的に 3 / 17
モデル能力の進化 Source: https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/ 4 / 17
IDE 統合型 & マルチモデル CLI Cursor • VS Code fork
の AI ネイティブ IDE • Claude / GPT / Gemini 等マルチモデル対応 • Background Agent: クラウド VM で自律開 発・PR 作成 • Tab 補完・Composer (複数ファイル一括編集) • Pro $20/mo〜 OpenCode • OSS (Go 製 / MIT)のターミナル Agent • 75+ LLM プロバイダ対応 (ローカルモデルも可) • LSP 統合でコード解析精度を強化 • GitHub Copilot 連携 (2026.01〜) • 95k+ GitHub Stars ※ IDE 型は他に Windsurf, Cline (VS Code 拡張) 等も存在 5 / 17
CLI 型 ── モデルプロバイダ提供 Claude Code • Anthropic 公式 (Sonnet
4.6 / Opus 4.6) • MCP: 外部ツール連携の標準プロ トコル • hooks: ファイル保存時の自動 フォーマット等 • plan mode / subagents で複雑 なタスクを分割 • 70.9k Stars Codex CLI • OpenAI 公式 (GPT-5.x-Codex が 現在の主流) • OSS (Rust 製 / Apache 2.0) • sandbox: ネットワーク遮断で ファイル操作を隔離 • ChatGPT Plus ($20/mo) に含ま れる • 62k Stars Gemini CLI • Google 公式 (Gemini 2.5 Pro / 3.1 Pro / 3 Flash) • OSS (TypeScript / Apache 2.0) • 1M トークンのコンテキストウィ ンドウ • Google 検索統合 / 無料枠 1,000 回/日 • 95.9k Stars 各社が自社モデルに最適化した CLI を提供。哲学・強みがそれぞれ異なる 6 / 17
私のワークフロー
ツールの使い分け 開発対象: LangChain 等を用いた AI Agent の作成。実験・検証はローカル PC 内で完結 Claude
Code: メイン開発 • 日常的な実装・デバッグ・リファクタリング • MCP 経由で Codex CLI も呼び出し可能 • hooks で通知を受け取りながら作業 Codex CLI: プラン・レビュー • 実装計画の策定 • コードレビューの補助 • Claude Code の plan mode から相談も 共通指示ファイル: LLM.md を作成し CLAUDE.md / AGENTS.md に symlink → ツールが変わっても 同じルールで動作 8 / 17
開発スタイル • 並列作業 → git worktree で分離 • Issue/PR 駆動
で開発を管理 • 1 Issue = 1 Claude Code session • セッションに 名前をつけて 管理 # session に名前をつけて起動 claude --session-name 'issue-42-fix-config' # 後から再開 claude --resume # → issue-42-fix-config を選択 Issue 作成 → Session 開始 → Branch + Worktree → 実装 → 効果検証 → PR + Review 9 / 17
LLM.md と品質保証
LLM.md の書き方 WHAT 何をやるか 機能要件 技術スタック コーディング規約 WHY なぜやるか 設計意図
背景・制約の理由 判断基準 DON'T 何をやらないか 禁止事項 アンチパターン 勝手にやりがちなこと 研究プロジェクト特有の規約: • fail-fast: エラーを握りつぶさない (LLM は親切心で try/except を足しがち) • default 値の一元管理: config で定義、下位レイヤーで再定義禁止 # DON'T (例) - try/except で例外を握りつぶさない - 関数の引数に default 値を定義しない config.yaml の値を唯一の情報源とする - 既存の utility がある場合は再実装しない 11 / 17
品質保証の仕組み • 研究の再現性: default 値の分散を防ぎ、パラメータを追跡可能に • コード品質: lint・型チェックでロジックを保証、テストで破壊的変更を検知 ローカル pre-commit
ruff: lint pre-push mypy: type check pytest: test CI/CD (GitHub Actions) Codex & Claude Code で自動レビュー • 再利用性のチェック • 型・default の再定義検知 • fail-fast 方針の遵守確認 12 / 17
Claude Code の便利機能
便利機能 4 選 Session Naming セッションに名前をつけて起動・/resume で検索 Issue 番号やタスク名で管理すると便利 MCP
(Model Context Protocol) 外部ツール連携の標準規格 serena (コード解析), context7 (ドキュメント参 照) 等を接続 Hooks で通知 approve 要求時・タスク完了時に macOS 通知を 表示 放置しておいて通知が来たら確認するスタイル Plan Mode 編集前にまず計画を立てる (最近は自動切替も) 計画段階で Codex に相談することも可能 14 / 17
課題と教訓
失敗談 default 値がいたるところで上書きされる config.yaml を変更しても反映されない → 全箇所探して修正する羽目に → CLAUDE.md に規約を明文化して解決
Before: default が散在 def train(lr=0.001, epochs=100): ... def run(lr=0.01, epochs=50): # !? After: config で一元管理 def train(lr: float, epochs: int): ... # config.yaml から注入 worktree を使ってくれない 「worktree で作業して」と指示しても 普通にブランチを切ってしまう → 指示の書き方を工夫する必要あり 規約を書いても完璧ではない LLM は「だいたい」守るが 100% ではない → 継続的なメンテナンスが必要 16 / 17
まとめ • Coding Agent は 用途に応じて使い分ける ‣ IDE 型、CLI 型
(プロバイダ提供 / OSS) • LLM.md (共通指示ファイル)が品質の要 • 特に「やらないこと」を明文化するのが重要 • pre-commit + CI で品質を機械的に担保 • 完璧ではない → 規約の継続的メンテ が必要 ご清聴ありがとうございました 17 / 17