Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
claude codeでPrompt Engineering
Search
いおりん
July 22, 2025
Technology
0
780
claude codeでPrompt Engineering
いおりん
July 22, 2025
Tweet
Share
More Decks by いおりん
See All by いおりん
Samba Cloudの高速推論を活用した模範解答分析と開発知見
iori0311
0
160
Other Decks in Technology
See All in Technology
Gemini でコードレビュー知見を見える化
zozotech
PRO
1
130
手動から自動へ、そしてその先へ
moritamasami
0
260
意外とあった SQL Server 関連アップデート + Database Savings Plans
stknohg
PRO
0
250
Noを伝える技術2025: 爆速合意形成のためのNICOフレームワーク速習 #pmconf2025
aki_iinuma
2
1.8k
Oracle Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
0
160
pmconf2025 - データを活用し「価値」へ繋げる
glorypulse
0
630
useEffectってなんで非推奨みたいなこと言われてるの?
maguroalternative
10
6.4k
.NET 10 のパフォーマンス改善
nenonaninu
2
4.9k
プロダクトマネージャーが押さえておくべき、ソフトウェア資産とAIエージェント投資効果 / pmconf2025
i35_267
2
520
私のRails開発環境
yahonda
0
190
Agentic AI Patterns and Anti-Patterns
glaforge
1
160
安いGPUレンタルサービスについて
aratako
2
2.6k
Featured
See All Featured
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.2k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
9
1k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.7k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Mobile First: as difficult as doing things right
swwweet
225
10k
Testing 201, or: Great Expectations
jmmastey
46
7.8k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.1k
Music & Morning Musume
bryan
46
7k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Transcript
claude codeで Prompt Engineering 2025/07/22
自己紹介 ・名前:いおりん (https://x.com/Ioriiii8) ・職務内容: ・土木図面のチェックシステム ・学校教育の自動採点システム についてLLMを用いて取り組んでいます ・趣味:マグロ釣ってます。
今日話したいこと コーディング以外でのclaude codeの活用方法 プロンプトの評価・改善フィードバックループの事例を共有
claude codeの魅力 MAXプランによる定額使い放題 -> 雑に検証を回したり、並列実装を安易に行える 高い自立性とロングラン能力 -> tool等を大量に使う長時間タスクを実行できる ex) コードベースに関連する論文を大量に検索してMarkdownで保存
プロンプトエンジニアリングは大変 めんどくさいし 品質管理が大変!! ⭐寝てる間にいい感じにやってほしいというモチベーション ⭐
フィードバックループのワークフロー データセット:Trainデータ、Valiデータ、Testデータの3種類を準備 LLM実行スクリプト:claude codeが実行するためのスクリプトの準備 - 出力結果を整形してclaude codeに食わせやすい形にすることが肝要 品質評価:LLMの出力がどうあってほしいかの観点を整理
プロンプトの評価・改善手法 Opus4自体の推論によるLLM as a judge Anthropic のimprove_prompt API(https://docs.anthropic.com/en/api/prompt-tools-improve) 論文やLLMモデルのベスプラなどを参照(ragでもいい)
ロングランタスクのヒント ファイルの読み書き、スクリプトの実行はTaskツールを使う -> メインエージェントのコンテキスト節約を徹底 詳細なTodoリストのテンプレ、作業記録のテンプレ作成 -> 毎回のclaude codeの挙動を制御 定性評価の定量化 ->
実行ごとの評価を相対化する
おわりに 寝てる間にたくさん走ってくれてるとうれしい!