儲かるPython~時系列データの予測と売り上げの予測~2021/2/20Python機械学習勉強会 in 新潟 #12大野 宏
View Slide
概要・以前、時系列データの予測を使い、電力消費量の予測を紹介した。・今回、加熱に要するエネルギー削減を目的に、ある装置を加熱する時の温度を予測した。・製造業(食品製造業も対象)における売り上げを予測し、生産計画の立案に役立てる。
時系列データの予測・ある装置の温度を予測し、加熱に使用するエネルギー使用量を削減したい。・月曜日9時にある装置が所定の温度になるよう、前日にヒータで加熱を始めているが、早めに所定の温度に達し、エネルギーが無駄になっている。・1年分のデータを使い再帰型ニューラルネットワークで温度を予測し、良い結果が得られた。実装はこれから。
売り上げを上げるために事前に予測・分類問題として考える営業データから成約予測モデルを作り、成約ありかなしか予測する。成約が上がるよう、営業対象を絞り込む。・各種データから売り上げを予測(回帰)自転車レンタル数を、天候、季節、温度、曜日などの条件から予測する。・季節などの周期性から売り上げを予測(時系列分析)過去の値を基に未来の値を予測する。・回帰+時系列分析でさらなる向上
予測モデル・営業成約予測モデル・予測モデル(回帰)・過去の値を基に未来の値を予測(時系列分析)季節 年 曜日・・ 天気湿度 風速モデル 自転車利用数年齢 職業・・ 連絡回数連絡日数モデル成約あり制約なし過去の自転車利用数モデル未来の自転車利用数
類似事例としてのAIタクシー・過去のタクシーの昇降データ等を学習させ、顧客がいるエリアを予想する。・タクシー会社の昇降データ、携帯電話会社の人の分布データ、曜日、時間、天候多くのタクシーが一斉に使ったらどうなる?6
類似事例としての売り上げ予測・伊勢神宮前の「ゑびや」(食堂とお土産屋)がAIで売り上げを予測 → 新会社を設立してツールを販売通行人をカウントしながら年齢・性別の情報も収集7
参考図書Pythonで儲かるAIをつくる
回帰・レンタル自転車の利用数を予測する・データはUCIのBike Sharing Dataset・日付、季節、年、月、祝日、曜日、勤務日(月~金か土日か)、天気、気温、体感温度、湿度、風速で予測訓練データ 検証データ
回帰の結果・XGBoostRegressor での予測結果の決定係数R2は 0.4206・月と季節をOne-hotエンコーディング R2は 0.5099
・決定係数 R2 は、標本値を y 、推定値を f とすると次式で表される。・y と f が合うと1に、合わないと0になる決定係数
重要度分析・XGBoostRegressor ではplot_importanceで重要度を分析
時系列分析・過去の利用数から未来の利用数をFB社Prophetで予測・天気、気温、風速、湿度も加味して改善R20.4145↓0.6196
売り上げ予測のまとめ・回帰より時系列分析の方が良い結果が得られた・時系列分析に回帰を加えた方が良い結果が得られた・時系列分析は、1週間後や1か月後の売り上げも予測可能