Slide 1

Slide 1 text

1
 2025/8/8 株式会社Almondo AIソリューション事業部AIチーム統括 佐藤駿 ©Almondo Co.Ltd,. Claude Codeデータ分析の実運用  〜競馬を題材に回収率 100%の先を目指すメソッドとは〜 


Slide 2

Slide 2 text

自己紹介
 2
 ©Almondo Co.Ltd,.

Slide 3

Slide 3 text

今回お話しする部分について 
 3
 ©Almondo Co.Ltd,. 1. SW開発とデータ分析の流れの簡単な説明
 2. 競馬についてと競馬領域における分析難易度の高さの説明
 3. Claude Codeとの共創で変わる部分
 4. Claude Code選定の理由
 5. 実際の使用方法についてのご説明
 a. ユースケースについて
 b. ユースケース1
 c. ユースケース2
 d. ユースケース3
 6. ユースケースからの成功パターン
 7. 最後に


Slide 4

Slide 4 text

SW開発とデータ分析の流れの簡単な説明 
 1. 要件定義 機能要件・非機能要件を明確化 1. 問題定義 分析目標・仮説の立案 SW開発フロー
 データ分析フロー
 2. 設計 アーキテクチャ・ DB・UI設計 2. データ収集 複数ソースからのデータ取得 3. 実装(コーディング ) 2.設計に基づいて実装 3. データ前処理 クリーニング・正規化・特徴量エンジニアリング 4. テスト 単体・結合テスト等 4. EDA(探索的データ分析 ) 可視化・仮説検証・パターン発見 5. デプロイ・保守 本番環境へのリリースや改善 5. モデル構築・評価 アルゴリズム選定・学習・検証・反復改善 フローとしては似ているものの、データ分析は1と4が複数回サイクルとして回る点に相違がある


Slide 5

Slide 5 text

競馬についての簡単な説明 
 そもそも競馬の仕組み 
 
 
 10人がそれぞれ10万円ずつ賭けた時、合 計賭け額の20%はJRAのものになります。 つまり、残りの80万円を当たった人で分担 する形です。
 
 5人が当たっていれば一人当たり16万円 (+6万円)の払い戻しですし、1人しか当たっ ていなければ一人当たり80万円(+70万円) の払い戻しになります。
 
 
 競馬が勝つのが難しい理由 
 
 
 相手にするのは動物であることに加え
 - 血統(父親,祖父)
 - 当日の天気
 - レースの開催される場所
 - レース距離や回り方
 - 騎手との相性
 - レース相手とそれによる展開の違い
 等々あまり多変量かつ多くの変数が変動 的であるため、難易度が非常に高い
 
 


Slide 6

Slide 6 text

Claude Codeとの共創で変わる部分 
 1. 要件定義 機能要件・非機能要件を明確化 1. 問題定義 分析目標・仮説の立案 SW開発フロー
 データ分析フロー
 2. 設計 アーキテクチャ・DB・UI設計 2. データ収集 複数ソースからのデータ取得 3. 実装(コーディング) 2.設計に基づいて実装 3. データ前処理 クリーニング・正規化・特徴量エンジニアリング 4. テスト 単体・結合テスト等 4. EDA(探索的データ分析 ) 可視化・仮説検証・パターン発見 5. デプロイ・保守 本番環境へのリリースや改善 5. モデル構築・評価 アルゴリズム選定・学習・検証・反復改善 問題定義に対するFBがClaude Codeから高速かつ正確に帰ることでより尤もらしい問題定義が可能になる
 (SW分野においては頑健なテスト駆動開発(TDD)の設計に近しいかと思慮)


Slide 7

Slide 7 text

Claude Code選定の理由 
 Claude Codeの強み 
 ● 他ツールと比較すると単純にプログラミング能力が高い(SWも同様かと思います)
 ● 選定される統計分析手法の妥当性が高い(GPTだとあまりにユニークなものを使われることや、Geminiだと明ら かに適切でない手法が使われていることが多い印象)
 ● 複数の可視化結果の解釈性が高い(GPTやGeminiよりも複数の可視化結果をそれぞれ関係性含め読み取る のが強い印象)
 ● 背景の推察が得意(競馬に関して一定以上の情報を与える前に曖昧なクエリを投げても適切な形でフローを起 こしてくれる)
 
 Claude Codeの弱み 
 ● 一定以上の知識を渡した瞬間、出てくるコードの精度が著しく悪化する
 ○ 直近のSerena MCPなどによるコンテキスト削除によって対応はできそう
 ● 一定以上の複雑性を持つものを簡素化しようとする
 ○ ただ、これはClaude Codeに限った話ではなく、これらのツール全体的な傾向としてみて捉えることができ る
 ■ Claude Codeは比較的簡素化することはないが、それが故に小さな部分だけ簡素化されているとどう しても気づきにくい
 
 →他ツールと比較してデータ分析領域においては大きな弱みがなく、逆に仮説検証サイクルの自動化においては大 きな強みを持っているため、Claude Codeを選定


Slide 8

Slide 8 text

実際の使用方法についてのご紹介 8
 ©Almondo Co.Ltd,.

Slide 9

Slide 9 text

ユースケースについて 
 以下のような言説は競馬界隈でよく言われます
 
 - ゴールドシップ産駒は馬場が荒れている方が好成績を残しやすい
 - ディープインパクト産駒は芝の中長距離において好成績を残しやすい
 
 ⇨本当なのかを2023年,2024年の全競走成績を持って判断してみる


Slide 10

Slide 10 text

ユースケース1 
 input「ゴールドシップ産駒は馬場が荒れている方が好成績を残しやすいと巷では言 われているんですが、EDAおよび統計分析を持って検証し、その検証結果を保存して ください。」
 
 →
 
 
 
 
 
 
 
 


Slide 11

Slide 11 text

ユースケース1 
 
 
 使われている統計手法ももっともらしいものが使用されている上で、言説は正しくないことがわかった。
 
 一方で、体感としては言説は正しそう。なぜ?
 ⇨1勝以上したりしていると関係があるのか?(0勝で終わっている馬もたくさんいる)
 


Slide 12

Slide 12 text

ユースケース1 
 
 
 使われている統計手法ももっともらしいものが使用されている上で、言説は正しくないことがわかった。
 
 一方で、体感としては言説は正しそう。なぜ?
 ⇨1勝以上したりしていると関係があるのか?(0勝で終わっている馬もたくさんいる)
 


Slide 13

Slide 13 text

ユースケース1 
 
 
 1勝以上したりしていると関係があるのか?(0勝で終わっている馬もたくさんいる)
 →これも関係なさそう
 
 ⇨今回の言説は正しくなかったと結論づける。
 
 


Slide 14

Slide 14 text

ユースケース2 
 
 
 input「ディープインパクト産駒は芝中長距離で好成績を残しやすいと巷では言われ ているんですが、EDAおよび統計分析を持って検証し、その検証結果を保存してく ださい。」
 
 →
 
 
 
 
 
 ※中距離が2000m前後のことなので、1800m以上としてフィルタリ ングしていることには妥当性あり


Slide 15

Slide 15 text

ユースケース2 
 
 
 使われている統計手法ももっともらしいものが使用されている上で、言説は正しいことがわかった。
 
 ⇨芝1800m以上の競争の場合には、ディープインパクト産駒か否かの特徴量を追加することに妥 当性がありそう
 


Slide 16

Slide 16 text

ユースケース3 
 
 
 ディープインパクト産駒やゴールドシップ産駒の成績レポートを参考にし、他の産駒での得意分野に関する 仮説の立案と検証及びその結果から新たな仮説の立脚というサイクルを何回か繰り返してレポーティング までしてください。 
 
 
 →
 
 


Slide 17

Slide 17 text

ユースケース3 
 以下のうち、5%有意だったのは第1サイクルの12,3のみ
 
 →ブラックタイド産駒は勝率が高いこと、またハーツクライ産駒は長距離勝率が高いことがわかる一方で血 統における時系列の改善トレンドやダート特化血統が芝で優位性を発揮することはない。
 
 


Slide 18

Slide 18 text

ユースケース3 
 結果を持ってClaudeによって立てられた仮説
 
 


Slide 19

Slide 19 text

ユースケース3 
 結果を持ってClaudeによって立てられた仮説
 
 →季節適応性仮説及び血統×展開適性仮説は尤もらしく感じられるので、新たに検証項目として追加し、 Claude Codeに検証させるが、季節適応性仮説のためには季節フラグをつける必要があるのでまずはそち らを調整してから検証できるようにする
 
 


Slide 20

Slide 20 text

ユースケースからの成功パターン 
 
 
 1. 初期仮説をClaude Codeに投げる
 2. 最初は単発のレスポンスを何回か繰り返す
 3. 2の結果を参照しながらClaude Codeが仮説を考え、それを検証し、新しい仮説を生み出す
 4. (必要であれば)人がその仮説内容を確認し、改めて仮説をClaude Codeに投げる
 
 →おそらくみなさんのお仕事ではClaude Code を“部下エンジニア”として活用し、既存の枠を超えた仮説を 短時間で創出・洗練できるのでは?
 例)
 
 


Slide 21

Slide 21 text

最後に
 
 
 
 
 
 
 
 
 もし分析してみたい方いたらこの後のMeetUpで話しましょう! ご清聴ありがとうございました!!