Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250808_AIAgent勉強会_ClaudeCodeデータ分析の実運用〜競馬を題材に回...
Search
Kakeru Sato
August 11, 2025
Programming
510
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20250808_AIAgent勉強会_ClaudeCodeデータ分析の実運用〜競馬を題材に回収率100%の先を目指すメソッドとは〜
Kakeru Sato
August 11, 2025
Other Decks in Programming
See All in Programming
軽量Java基盤の設計 DIコンテナに頼らない、長期保守と1秒起動の実現 JJUG CCC 2026 Spring
macha64
0
530
ECSアプリログをFireLensでコスト削減しようとしたけど諦めた話 in Fargate×Node.js
akihisaikeda
2
4.2k
ローカルLLMでどこまでコードが書けるか -拡張版 / How much code can be written on a local LLM Extended
kishida
11
4.1k
AI時代の仕事技芸論 — ソフトウェア開発で「遊ぶように働く」職人的熟達のすすめ
kuranuki
2
680
New "Type" system on PicoRuby
pocke
1
930
A2UI という光を覗いてみる
satohjohn
1
140
「なぜそう決めたのか」を残し続ける仕組み ― Notion AI カスタムエージェント × Slack連携による設計判断の自動記録 - NIKKEI Tech Talk #47
niftycorp
PRO
0
170
脅威をエンジニアリングの糧にして――現場編 / Turning Threats into Engineering Fuel — Field Edition
nrslib
0
280
「AIで開発し、AIを届ける」をEvalでつなぐ 〜AIネイティブに始めるプロダクト開発の実践〜 / Connecting "Develop with AI, deliver AI" with Eval
rkaga
4
5.1k
エンジニアと一緒にテストコードの設計と実装を改善した話
mototakatsu
0
180
ローカルLLMを使ってB2Bサービスを作っていての学び
yaotti
0
170
正しくソフトウェアを作る、前提を疑うための認知の視点 / doubt-premise
minodriven
21
6.6k
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
55
8.2k
SEO for Brand Visibility & Recognition
aleyda
0
4.6k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Navigating Team Friction
lara
192
16k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
1
280
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
The Curse of the Amulet
leimatthew05
1
13k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
A better future with KSS
kneath
240
18k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
Rails Girls Zürich Keynote
gr2m
96
14k
Transcript
1 2025/8/8 株式会社Almondo AIソリューション事業部AIチーム統括 佐藤駿 ©Almondo Co.Ltd,. Claude Codeデータ分析の実運用 〜競馬を題材に回収率
100%の先を目指すメソッドとは〜
自己紹介 2 ©Almondo Co.Ltd,.
今回お話しする部分について 3 ©Almondo Co.Ltd,. 1. SW開発とデータ分析の流れの簡単な説明 2. 競馬についてと競馬領域における分析難易度の高さの説明 3.
Claude Codeとの共創で変わる部分 4. Claude Code選定の理由 5. 実際の使用方法についてのご説明 a. ユースケースについて b. ユースケース1 c. ユースケース2 d. ユースケース3 6. ユースケースからの成功パターン 7. 最後に
SW開発とデータ分析の流れの簡単な説明 1. 要件定義 機能要件・非機能要件を明確化 1. 問題定義 分析目標・仮説の立案 SW開発フロー データ分析フロー
2. 設計 アーキテクチャ・ DB・UI設計 2. データ収集 複数ソースからのデータ取得 3. 実装(コーディング ) 2.設計に基づいて実装 3. データ前処理 クリーニング・正規化・特徴量エンジニアリング 4. テスト 単体・結合テスト等 4. EDA(探索的データ分析 ) 可視化・仮説検証・パターン発見 5. デプロイ・保守 本番環境へのリリースや改善 5. モデル構築・評価 アルゴリズム選定・学習・検証・反復改善 フローとしては似ているものの、データ分析は1と4が複数回サイクルとして回る点に相違がある
競馬についての簡単な説明 そもそも競馬の仕組み 10人がそれぞれ10万円ずつ賭けた時、合 計賭け額の20%はJRAのものになります。 つまり、残りの80万円を当たった人で分担 する形です。
5人が当たっていれば一人当たり16万円 (+6万円)の払い戻しですし、1人しか当たっ ていなければ一人当たり80万円(+70万円) の払い戻しになります。 競馬が勝つのが難しい理由 相手にするのは動物であることに加え - 血統(父親,祖父) - 当日の天気 - レースの開催される場所 - レース距離や回り方 - 騎手との相性 - レース相手とそれによる展開の違い 等々あまり多変量かつ多くの変数が変動 的であるため、難易度が非常に高い
Claude Codeとの共創で変わる部分 1. 要件定義 機能要件・非機能要件を明確化 1. 問題定義 分析目標・仮説の立案 SW開発フロー
データ分析フロー 2. 設計 アーキテクチャ・DB・UI設計 2. データ収集 複数ソースからのデータ取得 3. 実装(コーディング) 2.設計に基づいて実装 3. データ前処理 クリーニング・正規化・特徴量エンジニアリング 4. テスト 単体・結合テスト等 4. EDA(探索的データ分析 ) 可視化・仮説検証・パターン発見 5. デプロイ・保守 本番環境へのリリースや改善 5. モデル構築・評価 アルゴリズム選定・学習・検証・反復改善 問題定義に対するFBがClaude Codeから高速かつ正確に帰ることでより尤もらしい問題定義が可能になる (SW分野においては頑健なテスト駆動開発(TDD)の設計に近しいかと思慮)
Claude Code選定の理由 Claude Codeの強み • 他ツールと比較すると単純にプログラミング能力が高い(SWも同様かと思います) • 選定される統計分析手法の妥当性が高い(GPTだとあまりにユニークなものを使われることや、Geminiだと明ら
かに適切でない手法が使われていることが多い印象) • 複数の可視化結果の解釈性が高い(GPTやGeminiよりも複数の可視化結果をそれぞれ関係性含め読み取る のが強い印象) • 背景の推察が得意(競馬に関して一定以上の情報を与える前に曖昧なクエリを投げても適切な形でフローを起 こしてくれる) Claude Codeの弱み • 一定以上の知識を渡した瞬間、出てくるコードの精度が著しく悪化する ◦ 直近のSerena MCPなどによるコンテキスト削除によって対応はできそう • 一定以上の複雑性を持つものを簡素化しようとする ◦ ただ、これはClaude Codeに限った話ではなく、これらのツール全体的な傾向としてみて捉えることができ る ▪ Claude Codeは比較的簡素化することはないが、それが故に小さな部分だけ簡素化されているとどう しても気づきにくい →他ツールと比較してデータ分析領域においては大きな弱みがなく、逆に仮説検証サイクルの自動化においては大 きな強みを持っているため、Claude Codeを選定
実際の使用方法についてのご紹介 8 ©Almondo Co.Ltd,.
ユースケースについて 以下のような言説は競馬界隈でよく言われます - ゴールドシップ産駒は馬場が荒れている方が好成績を残しやすい - ディープインパクト産駒は芝の中長距離において好成績を残しやすい ⇨本当なのかを2023年,2024年の全競走成績を持って判断してみる
ユースケース1 input「ゴールドシップ産駒は馬場が荒れている方が好成績を残しやすいと巷では言 われているんですが、EDAおよび統計分析を持って検証し、その検証結果を保存して ください。」 →
ユースケース1 使われている統計手法ももっともらしいものが使用されている上で、言説は正しくないことがわかった。 一方で、体感としては言説は正しそう。なぜ? ⇨1勝以上したりしていると関係があるのか?(0勝で終わっている馬もたくさんいる)
ユースケース1 使われている統計手法ももっともらしいものが使用されている上で、言説は正しくないことがわかった。 一方で、体感としては言説は正しそう。なぜ? ⇨1勝以上したりしていると関係があるのか?(0勝で終わっている馬もたくさんいる)
ユースケース1 1勝以上したりしていると関係があるのか?(0勝で終わっている馬もたくさんいる) →これも関係なさそう ⇨今回の言説は正しくなかったと結論づける。
ユースケース2 input「ディープインパクト産駒は芝中長距離で好成績を残しやすいと巷では言われ ているんですが、EDAおよび統計分析を持って検証し、その検証結果を保存してく ださい。」 →
※中距離が2000m前後のことなので、1800m以上としてフィルタリ ングしていることには妥当性あり
ユースケース2 使われている統計手法ももっともらしいものが使用されている上で、言説は正しいことがわかった。 ⇨芝1800m以上の競争の場合には、ディープインパクト産駒か否かの特徴量を追加することに妥 当性がありそう
ユースケース3 ディープインパクト産駒やゴールドシップ産駒の成績レポートを参考にし、他の産駒での得意分野に関する 仮説の立案と検証及びその結果から新たな仮説の立脚というサイクルを何回か繰り返してレポーティング までしてください。
→
ユースケース3 以下のうち、5%有意だったのは第1サイクルの12,3のみ →ブラックタイド産駒は勝率が高いこと、またハーツクライ産駒は長距離勝率が高いことがわかる一方で血 統における時系列の改善トレンドやダート特化血統が芝で優位性を発揮することはない。
ユースケース3 結果を持ってClaudeによって立てられた仮説
ユースケース3 結果を持ってClaudeによって立てられた仮説 →季節適応性仮説及び血統×展開適性仮説は尤もらしく感じられるので、新たに検証項目として追加し、 Claude Codeに検証させるが、季節適応性仮説のためには季節フラグをつける必要があるのでまずはそち らを調整してから検証できるようにする
ユースケースからの成功パターン 1. 初期仮説をClaude Codeに投げる 2. 最初は単発のレスポンスを何回か繰り返す 3.
2の結果を参照しながらClaude Codeが仮説を考え、それを検証し、新しい仮説を生み出す 4. (必要であれば)人がその仮説内容を確認し、改めて仮説をClaude Codeに投げる →おそらくみなさんのお仕事ではClaude Code を“部下エンジニア”として活用し、既存の枠を超えた仮説を 短時間で創出・洗練できるのでは? 例)
最後に もし分析してみたい方いたらこの後のMeetUpで話しましょう!
ご清聴ありがとうございました!!