Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Kaggle Drivenな顧客予測への挑戦
Search
KeisukeShimokawa
December 20, 2018
Technology
0
76
Kaggle Drivenな顧客予測への挑戦
LT for PyData.Fukuoka #1
Dec. 20th, 2018
KeisukeShimokawa
December 20, 2018
Tweet
Share
More Decks by KeisukeShimokawa
See All by KeisukeShimokawa
0から始めるMetric Learning
keisukeshimokawa
0
1.2k
Other Decks in Technology
See All in Technology
AIエージェント入門 〜基礎からMCP・A2Aまで〜
shukob
0
110
OAuthからOIDCへ ― 認可の仕組みが認証に拡張されるまで
yamatai1212
0
140
Geospatialの世界最前線を探る [2025年版]
dayjournal
1
260
「改善」ってこれでいいんだっけ?
ukigmo_hiro
0
370
新規事業におけるGORM+SQLx併用アーキテクチャ
hacomono
PRO
0
430
生成AI時代のセキュアコーディングとDevSecOps
yuriemori
0
140
[Codex Meetup Japan #1] Codex-Powered Mobile Apps Development
korodroid
2
1k
Copilot Studio ハンズオン - 生成オーケストレーションモード
tomoyasasakimskk
0
150
ソースを読むプロセスの例
sat
PRO
15
9.4k
エンタメとAIのための3Dパラレルワールド構築(GPU UNITE 2025 特別講演)
pfn
PRO
0
570
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
2.8k
20251007: What happens when multi-agent systems become larger? (CyberAgent, Inc)
ornew
1
470
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.5k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.6k
Done Done
chrislema
185
16k
We Have a Design System, Now What?
morganepeng
53
7.8k
Designing for humans not robots
tammielis
254
26k
Git: the NoSQL Database
bkeepers
PRO
431
66k
Six Lessons from altMBA
skipperchong
29
4k
Facilitating Awesome Meetings
lara
56
6.6k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Faster Mobile Websites
deanohume
310
31k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Transcript
Kaggle Drivenな 顧客予測への挑戦 PyData.Fukuoka Meetup #1 – 年末LT大会 Dec. 20th,
2018 shimopino (@shimoke4869)
自己紹介 2 • 下川 啓介 @shimoke4869 • 九州大学 総合理工学府 大気海洋環境システム学専攻
研究内容:宇宙プラズマと宇宙線の相互作用の効果 • 解析の経験 Python歴:1年強 機械学習:1年弱(2018年度から勉強) Kaggleは7月に初大会参加 6月からトライアルでアルバイト
トライアルでのタスク 3 時間帯別 顧客予測 売上予測 発注予測 作業計画 製造指示 人事確保 適正値下
挑戦結果 4 R2 = 0.9967 • 挑戦した結果 各点は、1店舗の1週間分の各時間帯別 のPOS客数の実績と予測 (1店舗1日に平均で
-40人程度の誤差) 解析店舗数=226 経験があるからできた? じつはテーブルデータは未経験 (Titanicはコードを眺めたのみ)
どうやって取り組んだのか 5 1. 大会の概要とデータを注意深く観察する。 2. 似た大会を探し、その大会のデータを観察する。 3. 似た大会の解法を読む 4. その分野の見逃している発展的な論文を読む。
5. … • 現在1位のKaggler、bestfittingさんの取り組み方 個人的に最も重要 • 例えば... ・RSMEとRMSLEの違い ・指数移動平均の最適化 ・Pandasの各メソッドの使用法 ・Pandasの高速化 などなど
どうやって取り組んだのか 6 • 例えば... ・「先月」のデータでも十分機能 ・日ごと月ごとの売り上げ平均はうまく 機能しない場合もある。 ・政府の所得統計データを利用する ・季節調整データの使用法 ・クリスマスなどの特殊イベント時での
売り上げデータの調整方法 ・機械学習モデルと統計モデルのブレンド (scikit-learnでのモデル、statsのarimaモデル)
具体的にどうすればいいのか 7 • リクルートコンペを例にまとめてます!(更新中ですが) Kaggle Advent Calendar 2018 その2 明日(21日)に
Kaggleもくもく会! ぜひ参加してください! 週末にKaggleのリバース エンジニアリングなどを わいわいやってみたい…