claude codeでPrompt Engineering

claude codeで Prompt Engineering 2025/07/22

自己紹介・名前：いおりん (https://x.com/Ioriiii8) ・職務内容：・土木図面のチェックシステム・学校教育の自動採点システムについてLLMを用いて取り組んでいます・趣味：マグロ釣ってます。

今日話したいことコーディング以外でのclaude codeの活用方法プロンプトの評価・改善フィードバックループの事例を共有

claude codeの魅力 MAXプランによる定額使い放題 -> 雑に検証を回したり、並列実装を安易に行える高い自立性とロングラン能力 -> tool等を大量に使う長時間タスクを実行できる ex) コードベースに関連する論文を大量に検索してMarkdownで保存

プロンプトエンジニアリングは大変めんどくさいし品質管理が大変！！ ⭐寝てる間にいい感じにやってほしいというモチベーション ⭐

フィードバックループのワークフローデータセット：Trainデータ、Valiデータ、Testデータの3種類を準備 LLM実行スクリプト：claude codeが実行するためのスクリプトの準備 - 出力結果を整形してclaude codeに食わせやすい形にすることが肝要品質評価：LLMの出力がどうあってほしいかの観点を整理

プロンプトの評価・改善手法 Opus4自体の推論によるLLM as a judge Anthropic のimprove_prompt API(https://docs.anthropic.com/en/api/prompt-tools-improve) 論文やLLMモデルのベスプラなどを参照(ragでもいい)

ロングランタスクのヒントファイルの読み書き、スクリプトの実行はTaskツールを使う -> メインエージェントのコンテキスト節約を徹底詳細なTodoリストのテンプレ、作業記録のテンプレ作成 -> 毎回のclaude codeの挙動を制御定性評価の定量化 ->
実行ごとの評価を相対化する

おわりに寝てる間にたくさん走ってくれてるとうれしい！

claude codeでPrompt Engineering

claude codeでPrompt Engineering

いおりん

Other Decks in Technology

Featured

Transcript