Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Kaggle Drivenな顧客予測への挑戦
Search
KeisukeShimokawa
December 20, 2018
Technology
0
77
Kaggle Drivenな顧客予測への挑戦
LT for PyData.Fukuoka #1
Dec. 20th, 2018
KeisukeShimokawa
December 20, 2018
Tweet
Share
More Decks by KeisukeShimokawa
See All by KeisukeShimokawa
0から始めるMetric Learning
keisukeshimokawa
0
1.3k
Other Decks in Technology
See All in Technology
Database イノベーショントークを振り返る/reinvent-2025-database-innovation-talk-recap
emiki
0
240
【U/Day Tokyo 2025】Cygames流 最新スマートフォンゲームの技術設計 〜『Shadowverse: Worlds Beyond』におけるアーキテクチャ再設計の挑戦~
cygames
PRO
2
940
Kiro を用いたペアプロのススメ
taikis
3
920
2025-12-18_AI駆動開発推進プロジェクト運営について / AIDD-Promotion project management
yayoi_dd
0
130
WordPress は終わったのか ~今のWordPress の制作手法ってなにがあんねん?~ / Is WordPress Over? How We Build with WordPress Today
tbshiki
2
860
100以上の新規コネクタ提供を可能にしたアーキテクチャ
ooyukioo
0
140
AWSに革命を起こすかもしれない新サービス・アップデートについてのお話
yama3133
0
170
AI時代のワークフロー設計〜Durable Functions / Step Functions / Strands Agents を添えて〜
yakumo
3
1.4k
Jakarta Agentic AI Specification - Status and Future
reza_rahman
0
110
Amazon Quick Suite で始める手軽な AI エージェント
shimy
1
1k
AI駆動開発における設計思想 認知負荷を下げるフロントエンドアーキテクチャ/ 20251211 Teppei Hanai
shift_evolve
PRO
2
440
Amazon Bedrock Knowledge Bases × メタデータ活用で実現する検証可能な RAG 設計
tomoaki25
6
1.4k
Featured
See All Featured
Writing Fast Ruby
sferik
630
62k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
180
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
61
The Spectacular Lies of Maps
axbom
PRO
1
390
Balancing Empowerment & Direction
lara
5
810
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
115
91k
The SEO Collaboration Effect
kristinabergwall1
0
300
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandezseo
1
1.3k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
47
33k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
34
Facilitating Awesome Meetings
lara
57
6.7k
Transcript
Kaggle Drivenな 顧客予測への挑戦 PyData.Fukuoka Meetup #1 – 年末LT大会 Dec. 20th,
2018 shimopino (@shimoke4869)
自己紹介 2 • 下川 啓介 @shimoke4869 • 九州大学 総合理工学府 大気海洋環境システム学専攻
研究内容:宇宙プラズマと宇宙線の相互作用の効果 • 解析の経験 Python歴:1年強 機械学習:1年弱(2018年度から勉強) Kaggleは7月に初大会参加 6月からトライアルでアルバイト
トライアルでのタスク 3 時間帯別 顧客予測 売上予測 発注予測 作業計画 製造指示 人事確保 適正値下
挑戦結果 4 R2 = 0.9967 • 挑戦した結果 各点は、1店舗の1週間分の各時間帯別 のPOS客数の実績と予測 (1店舗1日に平均で
-40人程度の誤差) 解析店舗数=226 経験があるからできた? じつはテーブルデータは未経験 (Titanicはコードを眺めたのみ)
どうやって取り組んだのか 5 1. 大会の概要とデータを注意深く観察する。 2. 似た大会を探し、その大会のデータを観察する。 3. 似た大会の解法を読む 4. その分野の見逃している発展的な論文を読む。
5. … • 現在1位のKaggler、bestfittingさんの取り組み方 個人的に最も重要 • 例えば... ・RSMEとRMSLEの違い ・指数移動平均の最適化 ・Pandasの各メソッドの使用法 ・Pandasの高速化 などなど
どうやって取り組んだのか 6 • 例えば... ・「先月」のデータでも十分機能 ・日ごと月ごとの売り上げ平均はうまく 機能しない場合もある。 ・政府の所得統計データを利用する ・季節調整データの使用法 ・クリスマスなどの特殊イベント時での
売り上げデータの調整方法 ・機械学習モデルと統計モデルのブレンド (scikit-learnでのモデル、statsのarimaモデル)
具体的にどうすればいいのか 7 • リクルートコンペを例にまとめてます!(更新中ですが) Kaggle Advent Calendar 2018 その2 明日(21日)に
Kaggleもくもく会! ぜひ参加してください! 週末にKaggleのリバース エンジニアリングなどを わいわいやってみたい…