Upgrade to Pro — share decks privately, control downloads, hide ads and more …

予測モデルがポンコツになった日_PyLadiesTokyo10May2020-LT

 予測モデルがポンコツになった日_PyLadiesTokyo10May2020-LT

kanan

May 10, 2020
Tweet

More Decks by kanan

Other Decks in Programming

Transcript

  1. Who am I ? • データ分析屋 研修講師 あたりやってます
 • PyLadies

    Caravan STAFF
 • 意外だと思うけど、お酒が大好き
 • 趣味は宴、きゃんぷ、島旅
 • 剣舞はじめて1年経ちました
 Name : KANAN(かなん)
 @Addition_quince https://www.facebook.com/kanae.ymst @_kanan_0518
  2. 時系列分析の大別
 • 古典的手法(統計モデル以前):指数平滑か、Holt-Winters法 等 
 ◦ 時系列データの特徴の一部のみに焦点を当てた計算手法
 ◦ 「過去と未来が似ている」「トレンドと周期性とホワイトノイズに分割できる」等
 


    • 統計モデル:ARIMA, SARIMA, Box-Jenkins法, VAR, GARCH 等 
 ◦ 古典的手法を統計によって拡張、単純な構造で線形定常性データは精度が向上
 ◦ 得られたデータの解釈や「予測の外れ具合」への言及など様々な活用が可能に
 
 • 状態空間モデル 
 ◦ 古典的手法や統計手法のさらなる拡張
 ◦ 目に見えない「状態」を用いることで、時系列データをより柔軟にモデル化が可能
 
 • 曲線フィッティング:prophet, 機械学習手法 等
 ◦ 膨大な計算量を短時間に行えることにより、古典的手法を拡張
 ◦ 例えば曲線による表現により特徴量設計が自動推定可能になるなど
 
 • ニューラルネットワーク:LSTM 等
 ◦ 長期的な依存関係を学習することができるようになる

  3. 時系列データの
 成分分解
 ▪成分分解  statsmodels.tsa.seasonal. seasonal_decompose • オリジナルデータ • トレンド成分 •

    季節成分 • 残差 やはり7の周期性を検出 季節成分 < 残差 なのでやはり季節性は若干
  4. まとめ
 • 状態空間モデルでのビール飲酒量予測
 ◦ 状態空間モデルはやはり柔軟な推定ができそう 
 ◦ 時系列特有の成分(季節性など)調整や外生変数投入で精度もあがる 
 ◦

    でもやはり短期的予測には良いが、長期的予測は難しい 
 ◦ 実際は常々直近の過去データを入れながら状態推定するのが正解 
 
 • データ構造が変わるとモデルがぽんこつになる
 ◦ 時系列分析のみでなく、どんな手法のモデルも過去のデータに依存 
 ◦ 生活習慣が変わる=データ構造が変わる 
 ◦ データ構造が変わるとモデルが正しく予測できなくなる(モデルの劣化) 
 ◦ COVID-19で経済構造が変化 ⇨ モデルの再構築が必要かもしれない