Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Kaggle Drivenな顧客予測への挑戦
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
KeisukeShimokawa
December 20, 2018
Technology
0
80
Kaggle Drivenな顧客予測への挑戦
LT for PyData.Fukuoka #1
Dec. 20th, 2018
KeisukeShimokawa
December 20, 2018
Tweet
Share
More Decks by KeisukeShimokawa
See All by KeisukeShimokawa
0から始めるMetric Learning
keisukeshimokawa
0
1.3k
Other Decks in Technology
See All in Technology
コンテキスト・ハーネスエンジニアリングの現在
hirosatogamo
PRO
6
630
イベントで大活躍する電子ペーパー名札を作る(その2) 〜 M5PaperとM5PaperS3 〜 / IoTLT @ JLCPCB オープンハードカンファレンス
you
PRO
0
130
内製AIチャットボットで学んだDatadog LLM Observability活用術
mkdev10
0
140
Laravelで学ぶOAuthとOpenID Connectの基礎と実装
kyoshidaxx
4
1.3k
It’s “Time” to use Temporal
sajikix
3
230
楽しく学ぼう!ネットワーク入門
shotashiratori
1
490
OpenClaw を Amazon Lightsail で動かす理由
uechishingo
0
240
生成AI活用でQAエンジニアにどのような仕事が生まれるか/Support Required of QA Engineers for Generative AI
goyoki
1
330
形式手法特論:SMT ソルバで解く認可ポリシの静的解析 #kernelvm / Kernel VM Study Tsukuba No3
ytaka23
1
680
頼れる Agentic AI を支える Datadog のオブザーバビリティ / Powering Reliable Agentic AI with Datadog Observability
aoto
PRO
0
240
「コントロールの三分法」で考える「コト」への向き合い方 / phperkaigi2026
blue_goheimochi
0
100
Microsoft “Adaptive Cloud” Update 2026年3月版
sdosamut
0
100
Featured
See All Featured
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
1.9k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
1.9k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
9.9k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
450
Optimizing for Happiness
mojombo
378
71k
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
380
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
64
54k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
400
Prompt Engineering for Job Search
mfonobong
0
200
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.4k
The Pragmatic Product Professional
lauravandoore
37
7.2k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Transcript
Kaggle Drivenな 顧客予測への挑戦 PyData.Fukuoka Meetup #1 – 年末LT大会 Dec. 20th,
2018 shimopino (@shimoke4869)
自己紹介 2 • 下川 啓介 @shimoke4869 • 九州大学 総合理工学府 大気海洋環境システム学専攻
研究内容:宇宙プラズマと宇宙線の相互作用の効果 • 解析の経験 Python歴:1年強 機械学習:1年弱(2018年度から勉強) Kaggleは7月に初大会参加 6月からトライアルでアルバイト
トライアルでのタスク 3 時間帯別 顧客予測 売上予測 発注予測 作業計画 製造指示 人事確保 適正値下
挑戦結果 4 R2 = 0.9967 • 挑戦した結果 各点は、1店舗の1週間分の各時間帯別 のPOS客数の実績と予測 (1店舗1日に平均で
-40人程度の誤差) 解析店舗数=226 経験があるからできた? じつはテーブルデータは未経験 (Titanicはコードを眺めたのみ)
どうやって取り組んだのか 5 1. 大会の概要とデータを注意深く観察する。 2. 似た大会を探し、その大会のデータを観察する。 3. 似た大会の解法を読む 4. その分野の見逃している発展的な論文を読む。
5. … • 現在1位のKaggler、bestfittingさんの取り組み方 個人的に最も重要 • 例えば... ・RSMEとRMSLEの違い ・指数移動平均の最適化 ・Pandasの各メソッドの使用法 ・Pandasの高速化 などなど
どうやって取り組んだのか 6 • 例えば... ・「先月」のデータでも十分機能 ・日ごと月ごとの売り上げ平均はうまく 機能しない場合もある。 ・政府の所得統計データを利用する ・季節調整データの使用法 ・クリスマスなどの特殊イベント時での
売り上げデータの調整方法 ・機械学習モデルと統計モデルのブレンド (scikit-learnでのモデル、statsのarimaモデル)
具体的にどうすればいいのか 7 • リクルートコンペを例にまとめてます!(更新中ですが) Kaggle Advent Calendar 2018 その2 明日(21日)に
Kaggleもくもく会! ぜひ参加してください! 週末にKaggleのリバース エンジニアリングなどを わいわいやってみたい…