Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Kaggle Drivenな顧客予測への挑戦
Search
KeisukeShimokawa
December 20, 2018
Technology
0
65
Kaggle Drivenな顧客予測への挑戦
LT for PyData.Fukuoka #1
Dec. 20th, 2018
KeisukeShimokawa
December 20, 2018
Tweet
Share
More Decks by KeisukeShimokawa
See All by KeisukeShimokawa
0から始めるMetric Learning
keisukeshimokawa
0
970
Other Decks in Technology
See All in Technology
転移学習とドメイン適応の基礎
kmatsui
2
570
Oracle Cloud Infrastructure:2024年4月度サービス・アップデート
oracle4engineer
PRO
1
110
〜小さく始めて大きく育てる〜データ分析基盤の開発から活用まで
kniino
0
2k
最近たまに見かけるTiDBってなんだ? - Findy
pingcap0315
2
570
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs (QCon London)
inesmontani
PRO
1
150
オブザーバビリティの Primary Signals
onk
PRO
0
540
少数チームで挑む: SwiftUI, TCA, KMPを用いた 新規動画配信アプリ 「ABEMA Live」の開発について
tomu28
0
530
PHP"オレ"カンファレンスの告知
ysknsid25
0
360
スタートアップの技術顧問を3年間続けて発生した事と気付き
biwakonbu
0
150
エンタープライズ環境下での Active Directory の運用 TIPS
tamaiyutaro
1
1.5k
テストプロセスで大事にしていること #jasstnano
makky_tyuyan
0
110
2024/4/26 コンピュータ歴史博物館解説告知
toshi_atsumi
0
200
Featured
See All Featured
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
24
2.3k
The Cost Of JavaScript in 2023
addyosmani
14
3.8k
Large-scale JavaScript Application Architecture
addyosmani
503
110k
The Straight Up "How To Draw Better" Workshop
denniskardys
227
130k
KATA
mclloyd
14
12k
Why You Should Never Use an ORM
jnunemaker
PRO
50
8.6k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
13
1.5k
Adopting Sorbet at Scale
ufuk
67
8.6k
Being A Developer After 40
akosma
56
580k
How to Ace a Technical Interview
jacobian
272
22k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
501
140k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
20
1.6k
Transcript
Kaggle Drivenな 顧客予測への挑戦 PyData.Fukuoka Meetup #1 – 年末LT大会 Dec. 20th,
2018 shimopino (@shimoke4869)
自己紹介 2 • 下川 啓介 @shimoke4869 • 九州大学 総合理工学府 大気海洋環境システム学専攻
研究内容:宇宙プラズマと宇宙線の相互作用の効果 • 解析の経験 Python歴:1年強 機械学習:1年弱(2018年度から勉強) Kaggleは7月に初大会参加 6月からトライアルでアルバイト
トライアルでのタスク 3 時間帯別 顧客予測 売上予測 発注予測 作業計画 製造指示 人事確保 適正値下
挑戦結果 4 R2 = 0.9967 • 挑戦した結果 各点は、1店舗の1週間分の各時間帯別 のPOS客数の実績と予測 (1店舗1日に平均で
-40人程度の誤差) 解析店舗数=226 経験があるからできた? じつはテーブルデータは未経験 (Titanicはコードを眺めたのみ)
どうやって取り組んだのか 5 1. 大会の概要とデータを注意深く観察する。 2. 似た大会を探し、その大会のデータを観察する。 3. 似た大会の解法を読む 4. その分野の見逃している発展的な論文を読む。
5. … • 現在1位のKaggler、bestfittingさんの取り組み方 個人的に最も重要 • 例えば... ・RSMEとRMSLEの違い ・指数移動平均の最適化 ・Pandasの各メソッドの使用法 ・Pandasの高速化 などなど
どうやって取り組んだのか 6 • 例えば... ・「先月」のデータでも十分機能 ・日ごと月ごとの売り上げ平均はうまく 機能しない場合もある。 ・政府の所得統計データを利用する ・季節調整データの使用法 ・クリスマスなどの特殊イベント時での
売り上げデータの調整方法 ・機械学習モデルと統計モデルのブレンド (scikit-learnでのモデル、statsのarimaモデル)
具体的にどうすればいいのか 7 • リクルートコンペを例にまとめてます!(更新中ですが) Kaggle Advent Calendar 2018 その2 明日(21日)に
Kaggleもくもく会! ぜひ参加してください! 週末にKaggleのリバース エンジニアリングなどを わいわいやってみたい…