Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
claude codeでPrompt Engineering
Search
いおりん
July 22, 2025
Technology
0
810
claude codeでPrompt Engineering
いおりん
July 22, 2025
Tweet
Share
More Decks by いおりん
See All by いおりん
Samba Cloudの高速推論を活用した模範解答分析と開発知見
iori0311
0
160
Other Decks in Technology
See All in Technology
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
6
68k
(金融庁共催)第4回金融データ活用チャレンジ勉強会資料
takumimukaiyama
0
130
Cosmos World Foundation Model Platform for Physical AI
takmin
0
280
セキュリティについて学ぶ会 / 2026 01 25 Takamatsu WordPress Meetup
rocketmartue
1
290
We Built for Predictability; The Workloads Didn’t Care
stahnma
0
130
CDK対応したAWS DevOps Agentを試そう_20260201
masakiokuda
1
200
レガシー共有バッチ基盤への挑戦 - SREドリブンなリアーキテクチャリングの取り組み
tatsukoni
0
210
Deno・Bunの標準機能やElysiaJSを使ったWebSocketサーバー実装 / ラーメン屋を貸し切ってLT会! IoTLT 2026新年会
you
PRO
0
300
Bill One急成長の舞台裏 開発組織が直面した失敗と教訓
sansantech
PRO
1
300
Context Engineeringの取り組み
nutslove
0
290
入社1ヶ月でデータパイプライン講座を作った話
waiwai2111
1
250
仕様書駆動AI開発の実践: Issue→Skill→PRテンプレで 再現性を作る
knishioka
2
600
Featured
See All Featured
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
110
Are puppies a ranking factor?
jonoalderson
1
2.7k
The Limits of Empathy - UXLibs8
cassininazir
1
210
How to Think Like a Performance Engineer
csswizardry
28
2.4k
The Curse of the Amulet
leimatthew05
1
8.3k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
How Software Deployment tools have changed in the past 20 years
geshan
0
32k
Rails Girls Zürich Keynote
gr2m
96
14k
Testing 201, or: Great Expectations
jmmastey
46
8k
The World Runs on Bad Software
bkeepers
PRO
72
12k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
83
Transcript
claude codeで Prompt Engineering 2025/07/22
自己紹介 ・名前:いおりん (https://x.com/Ioriiii8) ・職務内容: ・土木図面のチェックシステム ・学校教育の自動採点システム についてLLMを用いて取り組んでいます ・趣味:マグロ釣ってます。
今日話したいこと コーディング以外でのclaude codeの活用方法 プロンプトの評価・改善フィードバックループの事例を共有
claude codeの魅力 MAXプランによる定額使い放題 -> 雑に検証を回したり、並列実装を安易に行える 高い自立性とロングラン能力 -> tool等を大量に使う長時間タスクを実行できる ex) コードベースに関連する論文を大量に検索してMarkdownで保存
プロンプトエンジニアリングは大変 めんどくさいし 品質管理が大変!! ⭐寝てる間にいい感じにやってほしいというモチベーション ⭐
フィードバックループのワークフロー データセット:Trainデータ、Valiデータ、Testデータの3種類を準備 LLM実行スクリプト:claude codeが実行するためのスクリプトの準備 - 出力結果を整形してclaude codeに食わせやすい形にすることが肝要 品質評価:LLMの出力がどうあってほしいかの観点を整理
プロンプトの評価・改善手法 Opus4自体の推論によるLLM as a judge Anthropic のimprove_prompt API(https://docs.anthropic.com/en/api/prompt-tools-improve) 論文やLLMモデルのベスプラなどを参照(ragでもいい)
ロングランタスクのヒント ファイルの読み書き、スクリプトの実行はTaskツールを使う -> メインエージェントのコンテキスト節約を徹底 詳細なTodoリストのテンプレ、作業記録のテンプレ作成 -> 毎回のclaude codeの挙動を制御 定性評価の定量化 ->
実行ごとの評価を相対化する
おわりに 寝てる間にたくさん走ってくれてるとうれしい!