20250808_AIAgent勉強会_ClaudeCodeデータ分析の実運用〜競馬を題材に回収率100%の先を目指すメソッドとは〜

by Kakeru Sato

Slide 1

Slide 1 text

1  2025/8/8 株式会社Almondo AIソリューション事業部AIチーム統括佐藤駿 ©Almondo Co.Ltd,. Claude Codeデータ分析の実運用　〜競馬を題材に回収率 100%の先を目指すメソッドとは〜  

Slide 2

Slide 2 text

自己紹介  2  ©Almondo Co.Ltd,.

Slide 3

Slide 3 text

今回お話しする部分について   3  ©Almondo Co.Ltd,. 1. SW開発とデータ分析の流れの簡単な説明  2. 競馬についてと競馬領域における分析難易度の高さの説明  3. Claude Codeとの共創で変わる部分  4. Claude Code選定の理由  5. 実際の使用方法についてのご説明  a. ユースケースについて  b. ユースケース1  c. ユースケース2  d. ユースケース3  6. ユースケースからの成功パターン  7. 最後に 

Slide 4

Slide 4 text

SW開発とデータ分析の流れの簡単な説明   1. 要件定義機能要件・非機能要件を明確化 1. 問題定義分析目標・仮説の立案 SW開発フロー  データ分析フロー  2. 設計アーキテクチャ・ DB・UI設計 2. データ収集複数ソースからのデータ取得 3. 実装(コーディング ) 2.設計に基づいて実装 3. データ前処理クリーニング・正規化・特徴量エンジニアリング 4. テスト単体・結合テスト等 4. EDA(探索的データ分析 ) 可視化・仮説検証・パターン発見 5. デプロイ・保守本番環境へのリリースや改善 5. モデル構築・評価アルゴリズム選定・学習・検証・反復改善フローとしては似ているものの、データ分析は1と4が複数回サイクルとして回る点に相違がある 

Slide 5

Slide 5 text

競馬についての簡単な説明   そもそも競馬の仕組み       10人がそれぞれ10万円ずつ賭けた時、合計賭け額の20%はJRAのものになります。つまり、残りの80万円を当たった人で分担する形です。    5人が当たっていれば一人当たり16万円 (+6万円)の払い戻しですし、1人しか当たっていなければ一人当たり80万円(+70万円) の払い戻しになります。      競馬が勝つのが難しい理由       相手にするのは動物であることに加え  - 血統(父親,祖父)  - 当日の天気  - レースの開催される場所  - レース距離や回り方  - 騎手との相性  - レース相手とそれによる展開の違い  等々あまり多変量かつ多くの変数が変動的であるため、難易度が非常に高い     

Slide 6

Slide 6 text

Claude Codeとの共創で変わる部分   1. 要件定義機能要件・非機能要件を明確化 1. 問題定義分析目標・仮説の立案 SW開発フロー  データ分析フロー  2. 設計アーキテクチャ・DB・UI設計 2. データ収集複数ソースからのデータ取得 3. 実装(コーディング) 2.設計に基づいて実装 3. データ前処理クリーニング・正規化・特徴量エンジニアリング 4. テスト単体・結合テスト等 4. EDA(探索的データ分析 ) 可視化・仮説検証・パターン発見 5. デプロイ・保守本番環境へのリリースや改善 5. モデル構築・評価アルゴリズム選定・学習・検証・反復改善問題定義に対するFBがClaude Codeから高速かつ正確に帰ることでより尤もらしい問題定義が可能になる  (SW分野においては頑健なテスト駆動開発(TDD)の設計に近しいかと思慮) 

Slide 7

Slide 7 text

Claude Code選定の理由   Claude Codeの強み   ● 他ツールと比較すると単純にプログラミング能力が高い(SWも同様かと思います)  ● 選定される統計分析手法の妥当性が高い(GPTだとあまりにユニークなものを使われることや、Geminiだと明らかに適切でない手法が使われていることが多い印象)  ● 複数の可視化結果の解釈性が高い(GPTやGeminiよりも複数の可視化結果をそれぞれ関係性含め読み取るのが強い印象)  ● 背景の推察が得意(競馬に関して一定以上の情報を与える前に曖昧なクエリを投げても適切な形でフローを起こしてくれる)    Claude Codeの弱み   ● 一定以上の知識を渡した瞬間、出てくるコードの精度が著しく悪化する  ○ 直近のSerena MCPなどによるコンテキスト削除によって対応はできそう  ● 一定以上の複雑性を持つものを簡素化しようとする  ○ ただ、これはClaude Codeに限った話ではなく、これらのツール全体的な傾向としてみて捉えることができる  ■ Claude Codeは比較的簡素化することはないが、それが故に小さな部分だけ簡素化されているとどうしても気づきにくい    →他ツールと比較してデータ分析領域においては大きな弱みがなく、逆に仮説検証サイクルの自動化においては大きな強みを持っているため、Claude Codeを選定 

Slide 8

Slide 8 text

実際の使用方法についてのご紹介 8  ©Almondo Co.Ltd,.

Slide 9

Slide 9 text

ユースケースについて   以下のような言説は競馬界隈でよく言われます    - ゴールドシップ産駒は馬場が荒れている方が好成績を残しやすい  - ディープインパクト産駒は芝の中長距離において好成績を残しやすい    ⇨本当なのかを2023年,2024年の全競走成績を持って判断してみる 

Slide 10

Slide 10 text

ユースケース1   input「ゴールドシップ産駒は馬場が荒れている方が好成績を残しやすいと巷では言われているんですが、EDAおよび統計分析を持って検証し、その検証結果を保存してください。」    →                 

Slide 11

Slide 11 text

ユースケース1       使われている統計手法ももっともらしいものが使用されている上で、言説は正しくないことがわかった。    一方で、体感としては言説は正しそう。なぜ？  ⇨1勝以上したりしていると関係があるのか？(0勝で終わっている馬もたくさんいる)   

Slide 12

Slide 12 text

Slide 13

Slide 13 text

ユースケース1       1勝以上したりしていると関係があるのか？(0勝で終わっている馬もたくさんいる)  →これも関係なさそう    ⇨今回の言説は正しくなかったと結論づける。     

Slide 14

Slide 14 text

ユースケース2       input「ディープインパクト産駒は芝中長距離で好成績を残しやすいと巷では言われているんですが、EDAおよび統計分析を持って検証し、その検証結果を保存してください。」    →            ※中距離が2000m前後のことなので、1800m以上としてフィルタリングしていることには妥当性あり 

Slide 15

Slide 15 text

ユースケース2       使われている統計手法ももっともらしいものが使用されている上で、言説は正しいことがわかった。    ⇨芝1800m以上の競争の場合には、ディープインパクト産駒か否かの特徴量を追加することに妥当性がありそう   

Slide 16

Slide 16 text

ユースケース3       ディープインパクト産駒やゴールドシップ産駒の成績レポートを参考にし、他の産駒での得意分野に関する仮説の立案と検証及びその結果から新たな仮説の立脚というサイクルを何回か繰り返してレポーティングまでしてください。       →     

Slide 17

Slide 17 text

ユースケース3   以下のうち、5%有意だったのは第1サイクルの12,3のみ    →ブラックタイド産駒は勝率が高いこと、またハーツクライ産駒は長距離勝率が高いことがわかる一方で血統における時系列の改善トレンドやダート特化血統が芝で優位性を発揮することはない。     

Slide 18

Slide 18 text

ユースケース3   結果を持ってClaudeによって立てられた仮説     

Slide 19

Slide 19 text

ユースケース3   結果を持ってClaudeによって立てられた仮説    →季節適応性仮説及び血統×展開適性仮説は尤もらしく感じられるので、新たに検証項目として追加し、 Claude Codeに検証させるが、季節適応性仮説のためには季節フラグをつける必要があるのでまずはそちらを調整してから検証できるようにする     

Slide 20

Slide 20 text

ユースケースからの成功パターン       1. 初期仮説をClaude Codeに投げる  2. 最初は単発のレスポンスを何回か繰り返す  3. 2の結果を参照しながらClaude Codeが仮説を考え、それを検証し、新しい仮説を生み出す  4. (必要であれば)人がその仮説内容を確認し、改めて仮説をClaude Codeに投げる    →おそらくみなさんのお仕事ではClaude Code を“部下エンジニア”として活用し、既存の枠を超えた仮説を短時間で創出・洗練できるのでは？  例)     

Slide 21

Slide 21 text

最後に                  もし分析してみたい方いたらこの後のMeetUpで話しましょう！ご清聴ありがとうございました！！