Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amazon Forecast Getting Start

貞松政史
October 11, 2019

Amazon Forecast Getting Start

2019.10.11 DevelopersIO 2019 in Osaka

貞松政史

October 11, 2019
Tweet

More Decks by 貞松政史

Other Decks in Technology

Transcript

  1. 3 ⾃⼰紹介 • ⽒名 • 貞松 政史 (サダマツ マサシ) •

    所属 • データアナリティクス事業本部 • インテグレーション部 開発チーム • 岡⼭オフィス勤務 •好きなAWSサービス • SageMaker • Lambda • Forecast ← new!
  2. 13 Forecastの利⽤⽅法 • コンソール上で使⽤ ← 今回はこれ • AWS CLIで使⽤ •

    Jupyter Notebookで使⽤ • AWS SDKで使⽤ (for Python, for Java など)
  3. 15 時系列予測とは        

            時間的な連続性を持つ過去の実績データから未来の数値・傾向を予測する ? ? ?
  4. 16 どうやって予測するのか 0 2 4 6 8 10 12 1

    2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 value 0 10 20 30 40 50 60 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 value temp 予測対象データ⾃体の傾向 季節変動・トレンド →その他外部要因(周辺環境の変化、世界情勢)など 古典的な統計⼿法や機械学習を適⽤することで予測
  5. 23 Forecast domain • RETAIL : ⼩売の需要予測 • INVENTORY_PLANNING :

    サプライチェーンと在庫の計画 • EC2 CAPACITY : Amazon EC2 キャパシティの予測 • WORK_FORCE : 従業員の計画 • WEB_TRAFFIC : 今後のウェブトラフィックの⾒積もり • METRICS : 収益およびキャッシュフローなどの予測メトリクス • CUSTOM : その他すべての時系列予測のタイプ
  6. 25 時系列データの時間刻み 選択可能な時間刻みの単位 • minutes : 分 • hour :

    時間 • day : ⽇ • week : 週 • month : ⽉ • year : 年
  7. 26 データインポート • データセットインポート名 • タイムスタンプフォーマット ⁻ yyyy-MM-dd HH:mm:ss ⁻

    yyyy-MM-dd • IAMロール(S3のRead) • インポートするデータの場所 ⁻ S3バケット上のパス
  8. 29 予測⼦の作成 Forecastで使⽤可能な時系列予測アルゴリズム • ARIMA : ⾃⼰回帰和分移動平均 • DeepAR+ :

    再帰型ニューラルネットワーク (RNN) を使⽤してスカ ラー (1次元) 時系列を予測するための、教師あり学習アルゴリズム • ETS : 指数平滑法 • NPTS : ノンパラメトリック時系列 • Prophet : 局所的なベイズ構造時系列モデル
  9. 30 予測⼦の作成 • Forecast dimensions • Backtest window ⁻ Number

    of windows ⁻ Offset • Advanced configutations ⁻ ハイパーパラメータ設定など
  10. 33 作成した予測⼦の確認 平均平⽅⼆乗誤差 (Root Mean Squared Error, RMSE) 外れ値 (⼤きなズレ)

    を より⼤きな誤差として扱う -0.2 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65 67 69 71 73 75 77 79 81 83 85 87 89 91 93 95 97 99    値が⼩さいほど良い
  11. 55