Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
claude codeでPrompt Engineering
Search
いおりん
July 22, 2025
Technology
0
710
claude codeでPrompt Engineering
いおりん
July 22, 2025
Tweet
Share
More Decks by いおりん
See All by いおりん
Samba Cloudの高速推論を活用した模範解答分析と開発知見
iori0311
0
73
Other Decks in Technology
See All in Technology
Goに育てられ開発者向けセキュリティ事業を立ち上げた僕が今向き合う、AI × セキュリティの最前線 / Go Conference 2025
flatt_security
0
350
成長自己責任時代のあるきかた/How to navigate the era of personal responsibility for growth
kwappa
3
280
動画データのポテンシャルを引き出す! Databricks と AI活用への奮闘記(現在進行形)
databricksjapan
0
150
Escaping_the_Kraken_-_October_2025.pdf
mdalmijn
0
150
生成AIで「お客様の声」を ストーリーに変える 新潮流「Generative ETL」
ishikawa_satoru
1
330
SoccerNet GSRの紹介と技術応用:選手視点映像を提供するサッカー作戦盤ツール
mixi_engineers
PRO
1
190
いま注目しているデータエンジニアリングの論点
ikkimiyazaki
0
610
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
9.1k
extension 現場で使えるXcodeショートカット一覧
ktombow
0
220
GA technologiesでのAI-Readyの取り組み@DataOps Night
yuto16
0
280
Shirankedo NOCで見えてきたeduroam/OpenRoaming運用ノウハウと課題 - BAKUCHIKU BANBAN #2
marokiki
0
150
OpenAI gpt-oss ファインチューニング入門
kmotohas
2
1k
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
100
5.8k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Balancing Empowerment & Direction
lara
4
680
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.5k
A better future with KSS
kneath
239
17k
Mobile First: as difficult as doing things right
swwweet
224
10k
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.7k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Unsuck your backbone
ammeep
671
58k
Practical Orchestrator
shlominoach
190
11k
[RailsConf 2023] Rails as a piece of cake
palkan
57
5.9k
Transcript
claude codeで Prompt Engineering 2025/07/22
自己紹介 ・名前:いおりん (https://x.com/Ioriiii8) ・職務内容: ・土木図面のチェックシステム ・学校教育の自動採点システム についてLLMを用いて取り組んでいます ・趣味:マグロ釣ってます。
今日話したいこと コーディング以外でのclaude codeの活用方法 プロンプトの評価・改善フィードバックループの事例を共有
claude codeの魅力 MAXプランによる定額使い放題 -> 雑に検証を回したり、並列実装を安易に行える 高い自立性とロングラン能力 -> tool等を大量に使う長時間タスクを実行できる ex) コードベースに関連する論文を大量に検索してMarkdownで保存
プロンプトエンジニアリングは大変 めんどくさいし 品質管理が大変!! ⭐寝てる間にいい感じにやってほしいというモチベーション ⭐
フィードバックループのワークフロー データセット:Trainデータ、Valiデータ、Testデータの3種類を準備 LLM実行スクリプト:claude codeが実行するためのスクリプトの準備 - 出力結果を整形してclaude codeに食わせやすい形にすることが肝要 品質評価:LLMの出力がどうあってほしいかの観点を整理
プロンプトの評価・改善手法 Opus4自体の推論によるLLM as a judge Anthropic のimprove_prompt API(https://docs.anthropic.com/en/api/prompt-tools-improve) 論文やLLMモデルのベスプラなどを参照(ragでもいい)
ロングランタスクのヒント ファイルの読み書き、スクリプトの実行はTaskツールを使う -> メインエージェントのコンテキスト節約を徹底 詳細なTodoリストのテンプレ、作業記録のテンプレ作成 -> 毎回のclaude codeの挙動を制御 定性評価の定量化 ->
実行ごとの評価を相対化する
おわりに 寝てる間にたくさん走ってくれてるとうれしい!