Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Claude Codeはどこまで戦えるのか?Kaggle金メダルで見えた現在地
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Kinosuke
April 10, 2026
710
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Claude Codeはどこまで戦えるのか?Kaggle金メダルで見えた現在地
Kinosuke
April 10, 2026
More Decks by Kinosuke
See All by Kinosuke
Agent時代のKaggleで、人間は何を見るべきか (関西kaggler会 2026.5.22)
chihironakayama
1
1.1k
草コンペ振り返り
chihironakayama
3
920
Featured
See All Featured
Paper Plane
katiecoart
PRO
1
51k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
220
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
420
Unsuck your backbone
ammeep
672
58k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
970
エンジニアに許された特別な時間の終わり
watany
107
250k
Speed Design
sergeychernyshev
33
1.8k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
200
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
Amusing Abliteration
ianozsvald
1
200
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Transcript
Claude Codeはどこまで戦えるのか? Kaggle⾦メダルで⾒えた現在地
⾃⼰紹介 1 / 8 名前 Kinosuke 所属 個⼈事業主(法⼈化予定) やっていること コンピュータビジョン(VLM)
/ 図⾯やドキュメントの検索タスクが得意 Kaggle Competition Master 筋トレ BIG3 400kg
とは 精度を競うデータサイエンスの⼤会, 世界1,000万⼈以上が登録 2 / 8 Kaggle • 1,000万⼈以上が登録 •
約3ヶ⽉間、精度を競い合う • 年間30件くらいコンペを開催 NLP/画像/Table(⾦融・時系列) … • 相対評価 ̶ 相⼿に勝つことが⼤事 今回のお題 (CSIRO-Biomass) • 牧草地の画像 → 草の量を推定 放牧の家畜の餌管理に重要な課題 • 3,803チーム(4,460⼈)参加 予測モデル クローバー: 20.5[g] 枯れ草: 0.6[g] 草: 34.0[g]
結果 5位 / 3,803チーム ̶ ⾦メダル獲得 3 / 8 5th
/ 3,803 teams ̶ Top 0.1% ⾃分が書いたコードはほぼゼロ 実装は Claude Code / Codex に全任せ でも「AIが勝った」わけではない
Claude Codeの現在地 そこそこのベースラインは作れる、でもコンペでは勝てない 4 / 8 得意 • 実験パイプラインをほぼ1プロンプトで構 築
• 精度もそこそこ出る • 複雑なモデルも指⽰すれば忠実に実装 限界 • 数サイクルで精度改善が頭打ち • 定番施策はできるが、お題に刺さる本質 的な改善は出てこない • データを観察して改善案を導く⼒が弱い • みんな使っているので差がつかない
勝つためには? アイディアは⼈間 分析はAIに任せる。次に何をするかは⼈間が決める 6 / 8 Claude Code 予測結果の分析 レポート作成
ここまでは得意 → ⼈間 データ観察 アイディアを出す Next Actionは⼈間 → Claude Code アイディアを 忠実に実装 複雑な実装もOK 最⼤の勝因: DINOv3 patch token 「草の⾯積・⾼さ・密度が⼤事」という仮説 → DINOv3の出⼒を⽬視観察 → 「これだ」 ※「精度上げろ」というあいまいな指⽰からは絶対出ない
勝つためには? 試⾏回数はAI 実装コストほぼゼロ。「とにかく試す」をAIが実現する 7 / 8 1,515回 5-Fold CV 合計学習回数(ユニーク実験数
約300) • 何が効くかはタスク次第 → とにかく試す (Do Everything) • 書く→ダメなら捨てて作り直す → エージェントとの相性◎ 実験環境 Mac + Claude Code ↓ Google Drive ↓ Colab ×6並列
ちなみに… 「精度上げろ!」とパワハラしすぎるとClaudeが諦める なにをやっても精度上がらなくて、特にアイディアなく精度上げろとパワハラし続け ると… 5 / 8 いろんな⾔い回しで、撤退させようとしてくる
まとめ ⼈間のアイディア × 試⾏回数(Claude Code) 8 / 8 ⼈間のアイディア ×
試⾏回数 (Claude Code) ⼈間とClaude Codeの得意を理解して、補い合う Kaggleだけでなく、精度向上が求められるR&D全般に同じことが⾔える GitHub: github.com/Chihiro-n/csiro-biomass-agentic-solution まとめ記事: https://zenn.dev/chiman/articles/b233cc808d6af3 コンペ資料: https://speakerdeck.com/chihironakayama/cao-konhezhen-rifan-ri