Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Kaggle Drivenな顧客予測への挑戦
Search
KeisukeShimokawa
December 20, 2018
Technology
0
78
Kaggle Drivenな顧客予測への挑戦
LT for PyData.Fukuoka #1
Dec. 20th, 2018
KeisukeShimokawa
December 20, 2018
Tweet
Share
More Decks by KeisukeShimokawa
See All by KeisukeShimokawa
0から始めるMetric Learning
keisukeshimokawa
0
1.3k
Other Decks in Technology
See All in Technology
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
3.6k
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.5k
1万人を変え日本を変える!!多層構造型ふりかえりの大規模組織変革 / 20260108 Kazuki Mori
shift_evolve
PRO
5
660
「駆動」って言葉、なんかカッコイイ_Mitz
comucal
PRO
0
130
AWS re:Inventre:cap ~AmazonNova 2 Omniのワークショップを体験してきた~
nrinetcom
PRO
0
130
Oracle Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
3
260
20251225_たのしい出張報告&IgniteRecap!
ponponmikankan
0
110
善意の活動は、なぜ続かなくなるのか ーふりかえりが"構造を変える判断"になった半年間ー
matsukurou
0
220
Contract One Engineering Unit 紹介資料
sansan33
PRO
0
12k
Digitization部 紹介資料
sansan33
PRO
1
6.4k
Data Hubグループ 紹介資料
sansan33
PRO
0
2.5k
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
2.9k
Featured
See All Featured
The #1 spot is gone: here's how to win anyway
tamaranovitovic
1
880
Bash Introduction
62gerente
615
210k
How to build a perfect <img>
jonoalderson
1
4.8k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
1
220
Navigating Team Friction
lara
191
16k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
sira's awesome portfolio website redesign presentation
elsirapls
0
100
Side Projects
sachag
455
43k
Heart Work Chapter 1 - Part 1
lfama
PRO
3
35k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
54
48k
Transcript
Kaggle Drivenな 顧客予測への挑戦 PyData.Fukuoka Meetup #1 – 年末LT大会 Dec. 20th,
2018 shimopino (@shimoke4869)
自己紹介 2 • 下川 啓介 @shimoke4869 • 九州大学 総合理工学府 大気海洋環境システム学専攻
研究内容:宇宙プラズマと宇宙線の相互作用の効果 • 解析の経験 Python歴:1年強 機械学習:1年弱(2018年度から勉強) Kaggleは7月に初大会参加 6月からトライアルでアルバイト
トライアルでのタスク 3 時間帯別 顧客予測 売上予測 発注予測 作業計画 製造指示 人事確保 適正値下
挑戦結果 4 R2 = 0.9967 • 挑戦した結果 各点は、1店舗の1週間分の各時間帯別 のPOS客数の実績と予測 (1店舗1日に平均で
-40人程度の誤差) 解析店舗数=226 経験があるからできた? じつはテーブルデータは未経験 (Titanicはコードを眺めたのみ)
どうやって取り組んだのか 5 1. 大会の概要とデータを注意深く観察する。 2. 似た大会を探し、その大会のデータを観察する。 3. 似た大会の解法を読む 4. その分野の見逃している発展的な論文を読む。
5. … • 現在1位のKaggler、bestfittingさんの取り組み方 個人的に最も重要 • 例えば... ・RSMEとRMSLEの違い ・指数移動平均の最適化 ・Pandasの各メソッドの使用法 ・Pandasの高速化 などなど
どうやって取り組んだのか 6 • 例えば... ・「先月」のデータでも十分機能 ・日ごと月ごとの売り上げ平均はうまく 機能しない場合もある。 ・政府の所得統計データを利用する ・季節調整データの使用法 ・クリスマスなどの特殊イベント時での
売り上げデータの調整方法 ・機械学習モデルと統計モデルのブレンド (scikit-learnでのモデル、statsのarimaモデル)
具体的にどうすればいいのか 7 • リクルートコンペを例にまとめてます!(更新中ですが) Kaggle Advent Calendar 2018 その2 明日(21日)に
Kaggleもくもく会! ぜひ参加してください! 週末にKaggleのリバース エンジニアリングなどを わいわいやってみたい…