Slide 1

Slide 1 text

0 時系列分析 ハンズオン 2022-12-23 第26回NearMe技術勉強会 Takuma Kakinoue

Slide 2

Slide 2 text

1 時系列分析 ● 時系列データとは ○ 一定間隔(日・月・年など)で記録された時間的順序のあるデータのこと e.g. 毎時間の気温の変化、毎日の売上データ ● 時系列分析とは ○ 時系列データの変動を長期的変動(トレンド)成分、季節的変動成分、外的要因に よる変動成分などの要素に分解して、将来の変動を予測する手法 ○ Pythonフレームワークには、DartsやProphet、DeepAR、 Greykite(今回使用)などがある

Slide 3

Slide 3 text

2 時系列データを要素に分解する ● 自己相関(Auto Regression) ○ 直近の過去の値による影響 e.g. n日目の売上 ∝ n-1日目の売上 + n-2日目の売上 ● 長期的変動(Integrated)/ トレンド(Trend) ○ 時間経過と共に増加する、あるいは、減少するといった長期的な傾向のこと ● 季節的変動(Seasonality) ○ 月や曜日などの周期的なものに関連した変動のこと e.g. 夏は売上が多い ● 外的要因 ○ 外部の影響による変化のこと e.g. コロナの影響で売上低下

Slide 4

Slide 4 text

3 今回用いる Greykite について ● 従来手法(ProphetやDeepAR) ○ 各時点の値は確率分布に従うと仮定し、その確率分布の平均と分散を 同時に予測する ● 従来手法の欠点 ○ Prophetは、解釈可能だが、ベイズ推定を用いるため計算が遅い ○ DeepARは、深層学習を使うことで精度は良いが、解釈可能でない ● Grekiteの優位性 ○ 平均の予測と分散の予測を異なるモデルで行うことで精度と計算速度を向上 ○ 予測モデルには、線形回帰や決定木などを用いるので解釈可能

Slide 5

Slide 5 text

4 参考文献 ● NRI ナレッジインサイト, https://www.nri.com/jp/knowledge/glossary/lst/sa/time_series_analysis#:~:t ext=%E6%99%82%E7%B3%BB%E5%88%97%E5%88%86%E6%9E%90%E3 %81%A8%E3%81%AF,%E5%80%A4%E3%82%92%E4%BA%88%E6%B8%A C%E3%81%99%E3%82%8B%E3%82%82%E3%81%AE%E3%80%82 ● Greykite: Deploying Flexible Forecasting at Scale at LinkedIn, KDD2022, https://arxiv.org/abs/2207.07788

Slide 6

Slide 6 text

5 Thank you