Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
claude codeでPrompt Engineering
Search
いおりん
July 22, 2025
Technology
0
810
claude codeでPrompt Engineering
いおりん
July 22, 2025
Tweet
Share
More Decks by いおりん
See All by いおりん
Samba Cloudの高速推論を活用した模範解答分析と開発知見
iori0311
0
160
Other Decks in Technology
See All in Technology
AzureでのIaC - Bicep? Terraform? それ早く言ってよ会議
torumakabe
1
500
GSIが複数キー対応したことで、俺達はいったい何が嬉しいのか?
smt7174
3
150
月間数億レコードのアクセスログ基盤を無停止・低コストでAWS移行せよ!アプリケーションエンジニアのSREチャレンジ💪
miyamu
0
850
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
1.8k
Webhook best practices for rock solid and resilient deployments
glaforge
1
280
会社紹介資料 / Sansan Company Profile
sansan33
PRO
15
400k
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.3k
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
2026年、サーバーレスの現在地 -「制約と戦う技術」から「当たり前の実行基盤」へ- /serverless2026
slsops
2
220
顧客との商談議事録をみんなで読んで顧客解像度を上げよう
shibayu36
0
210
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
3
1.2k
Data Hubグループ 紹介資料
sansan33
PRO
0
2.7k
Featured
See All Featured
Between Models and Reality
mayunak
1
180
Chasing Engaging Ingredients in Design
codingconduct
0
110
Designing for humans not robots
tammielis
254
26k
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
910
sira's awesome portfolio website redesign presentation
elsirapls
0
150
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
The SEO identity crisis: Don't let AI make you average
varn
0
67
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
92
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
200
Transcript
claude codeで Prompt Engineering 2025/07/22
自己紹介 ・名前:いおりん (https://x.com/Ioriiii8) ・職務内容: ・土木図面のチェックシステム ・学校教育の自動採点システム についてLLMを用いて取り組んでいます ・趣味:マグロ釣ってます。
今日話したいこと コーディング以外でのclaude codeの活用方法 プロンプトの評価・改善フィードバックループの事例を共有
claude codeの魅力 MAXプランによる定額使い放題 -> 雑に検証を回したり、並列実装を安易に行える 高い自立性とロングラン能力 -> tool等を大量に使う長時間タスクを実行できる ex) コードベースに関連する論文を大量に検索してMarkdownで保存
プロンプトエンジニアリングは大変 めんどくさいし 品質管理が大変!! ⭐寝てる間にいい感じにやってほしいというモチベーション ⭐
フィードバックループのワークフロー データセット:Trainデータ、Valiデータ、Testデータの3種類を準備 LLM実行スクリプト:claude codeが実行するためのスクリプトの準備 - 出力結果を整形してclaude codeに食わせやすい形にすることが肝要 品質評価:LLMの出力がどうあってほしいかの観点を整理
プロンプトの評価・改善手法 Opus4自体の推論によるLLM as a judge Anthropic のimprove_prompt API(https://docs.anthropic.com/en/api/prompt-tools-improve) 論文やLLMモデルのベスプラなどを参照(ragでもいい)
ロングランタスクのヒント ファイルの読み書き、スクリプトの実行はTaskツールを使う -> メインエージェントのコンテキスト節約を徹底 詳細なTodoリストのテンプレ、作業記録のテンプレ作成 -> 毎回のclaude codeの挙動を制御 定性評価の定量化 ->
実行ごとの評価を相対化する
おわりに 寝てる間にたくさん走ってくれてるとうれしい!