Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Claude Codeはどこまで戦えるのか?Kaggle金メダルで見えた現在地
Search
Kinosuke
April 10, 2026
610
1
Share
Claude Codeはどこまで戦えるのか?Kaggle金メダルで見えた現在地
Kinosuke
April 10, 2026
More Decks by Kinosuke
See All by Kinosuke
草コンペ振り返り
chihironakayama
3
830
Featured
See All Featured
Paper Plane
katiecoart
PRO
1
49k
Making Projects Easy
brettharned
120
6.6k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
900
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
How to Think Like a Performance Engineer
csswizardry
28
2.6k
[SF Ruby Conf 2025] Rails X
palkan
2
990
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.7k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
2
1.4k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
140
The Limits of Empathy - UXLibs8
cassininazir
1
320
Transcript
Claude Codeはどこまで戦えるのか? Kaggle⾦メダルで⾒えた現在地
⾃⼰紹介 1 / 8 名前 Kinosuke 所属 個⼈事業主(法⼈化予定) やっていること コンピュータビジョン(VLM)
/ 図⾯やドキュメントの検索タスクが得意 Kaggle Competition Master 筋トレ BIG3 400kg
とは 精度を競うデータサイエンスの⼤会, 世界1,000万⼈以上が登録 2 / 8 Kaggle • 1,000万⼈以上が登録 •
約3ヶ⽉間、精度を競い合う • 年間30件くらいコンペを開催 NLP/画像/Table(⾦融・時系列) … • 相対評価 ̶ 相⼿に勝つことが⼤事 今回のお題 (CSIRO-Biomass) • 牧草地の画像 → 草の量を推定 放牧の家畜の餌管理に重要な課題 • 3,803チーム(4,460⼈)参加 予測モデル クローバー: 20.5[g] 枯れ草: 0.6[g] 草: 34.0[g]
結果 5位 / 3,803チーム ̶ ⾦メダル獲得 3 / 8 5th
/ 3,803 teams ̶ Top 0.1% ⾃分が書いたコードはほぼゼロ 実装は Claude Code / Codex に全任せ でも「AIが勝った」わけではない
Claude Codeの現在地 そこそこのベースラインは作れる、でもコンペでは勝てない 4 / 8 得意 • 実験パイプラインをほぼ1プロンプトで構 築
• 精度もそこそこ出る • 複雑なモデルも指⽰すれば忠実に実装 限界 • 数サイクルで精度改善が頭打ち • 定番施策はできるが、お題に刺さる本質 的な改善は出てこない • データを観察して改善案を導く⼒が弱い • みんな使っているので差がつかない
勝つためには? アイディアは⼈間 分析はAIに任せる。次に何をするかは⼈間が決める 6 / 8 Claude Code 予測結果の分析 レポート作成
ここまでは得意 → ⼈間 データ観察 アイディアを出す Next Actionは⼈間 → Claude Code アイディアを 忠実に実装 複雑な実装もOK 最⼤の勝因: DINOv3 patch token 「草の⾯積・⾼さ・密度が⼤事」という仮説 → DINOv3の出⼒を⽬視観察 → 「これだ」 ※「精度上げろ」というあいまいな指⽰からは絶対出ない
勝つためには? 試⾏回数はAI 実装コストほぼゼロ。「とにかく試す」をAIが実現する 7 / 8 1,515回 5-Fold CV 合計学習回数(ユニーク実験数
約300) • 何が効くかはタスク次第 → とにかく試す (Do Everything) • 書く→ダメなら捨てて作り直す → エージェントとの相性◎ 実験環境 Mac + Claude Code ↓ Google Drive ↓ Colab ×6並列
ちなみに… 「精度上げろ!」とパワハラしすぎるとClaudeが諦める なにをやっても精度上がらなくて、特にアイディアなく精度上げろとパワハラし続け ると… 5 / 8 いろんな⾔い回しで、撤退させようとしてくる
まとめ ⼈間のアイディア × 試⾏回数(Claude Code) 8 / 8 ⼈間のアイディア ×
試⾏回数 (Claude Code) ⼈間とClaude Codeの得意を理解して、補い合う Kaggleだけでなく、精度向上が求められるR&D全般に同じことが⾔える GitHub: github.com/Chihiro-n/csiro-biomass-agentic-solution まとめ記事: https://zenn.dev/chiman/articles/b233cc808d6af3 コンペ資料: https://speakerdeck.com/chihironakayama/cao-konhezhen-rifan-ri