Forecastの簡単な使用方法や、機械学習にかかるAWS利用費の概算など、初めての取り組む場合のハードルを下げれるような内容を紹介させて頂きたいと思います。
アジェンダ * Amazon Forecast で何ができるのか * Amazon Forecast を使ってみる * コスト計算の勘所
Amazon Forecast 機械学習でビジネスの予測と成果を簡単かつ正確に予測する2022/11/21CX事業本部 SIN(平内真⼀)
View Slide
⾃⼰紹介平内真⼀(SIN)クラスメソッド(株)CX事業本部Iot 関連のサーバーサイドエンジニア
本セッションではForecastの簡単な使⽤⽅法や、機械学習にかかるAWS利⽤費の概算など、初めての取り組む場合のハードルを下げれるような内容を紹介させて頂きたいと思います。
アジェンダAmazon Forecast で何ができるのかAmazon Forecast を使ってみるコスト計算の勘所
Amazon Forecast とは機械学習の経験なしで、Amazon.comと同じテクノロジーを使⽤して、正確な時系列予測を実現するフルマネージドサービス
時系列予測販売数時間販売推移 Forecastで予測
時系列予測販売数時間販売推移⼈⼒でも予測できるけど* ⾃動化できない* 影響要因が複雑な場合、⽐較的難しい季節性、祝祭⽇、価格、商品の⾊、プロモーションなど
時系列予測販売数時間販売推移なぜ予測する* 過剰な⾒積は、無駄なコスト* 過⼩な⾒積は、機会損失
予測と実績の⽐較https://dev.classmethod.jp/articles/forecast-compare-prediction-and-achievements/
Amazon Forecast
Amazon ForecastデータData group予測⼦Predictor予測Forecast洞察Insight
データグループデータData group予測⼦Predictor予測Forecast洞察Insight
ドメインドメイン 説明ERTAL ⼩売の需要予測INVENTORY_PLANNING サプライチェーンとインベントリの計画EC2 CAPACITY EC2キャパシティ予測WORK_FORCE 従業員の計画WEB_TRAFFIC Webトラフィック⾒積MQTRICS 収益及びキャッシュフローCUSTOM その他
データグループ* TARGET_TIME_SERIES 予測したいデータに関する過去の時系列* RELATED_TIME_SERIES 補完的な時系列データ* ITEM_METADATA データに関連する静的なメタデータTimestamp item value2022/01/01 10:00:00 チョコレート 102022/01/01 10:00:00 ポテトチップ 12022/01/01 10:00:00 じゃがりこ 12022/01/01 10:00:00 トマト 32022/01/01 11:00:00 チョコレート 32022/01/01 11:00:00 ポテトチップ 22022/01/01 11:00:00 にんじん 22022/01/01 12:00:00 チョコレート 52022/01/01 12:00:00 ポテトチップ 12022/01/01 12:00:00 じゃがりこ 1Timestamp weather2022/01/01 10:00:00 晴れ2022/01/01 11:00:00 曇り2022/01/01 12:00:00 曇り時々雨item typeチョコレート お菓子ポテトチップ お菓子じゃがりこ お菓子トマト 野菜にんじん 野菜※型式はドメイン依存
「時間間隔」と「必要な期間」周期分時間⽇週⽉年TARGET_TIME_SERIES2022-01-01 〜 2022/11/21RELATED_TIME_SERIES2022-01-01 〜 2022/11/29予測期間2022-11-22 〜2022/11/29500 ステップ or TTSの1/3以下
PredictorデータData group予測⼦Predictor予測Forecast洞察Insight
トレーニング周期分位数期間(ポイント数
アルゴリズム名前 計算量 説明ニューラルネットワーク CNN-QR ⾼ 因果畳み込みニューラルネットワーク (CNN) を使⽤して時系列を予測するための独⾃の機械学習アルゴリズムDeepAR+ ⾼ 再帰型ニューラルネットワーク (RNN) を使⽤して時系列を予測するための、独⾃の機械学習アルゴリズムローカルアルゴリズム Prophet 中 ⾮線形傾向が年、週次、および⽇常の季節性に適合する加法モデルに基づく時系列予測アルゴリズムベースラインアルゴリズム ARIMA 低 ⾃⼰回帰和分移動平均 (ARIMA) は、時系列予測に⼀般的に使⽤される統計アルゴリズムNPTS 低 ノンパラメトリック時系列 (NPTS) の独⾃のアルゴリズムは、スケーラブルで確率的なベースライン予測機能ETS 低 指数平滑法 (ETS) は、時系列予測に⼀般的に使⽤される統計アルゴリズム※ AutoMLを使⽤すると、HPOと共に最適なものが選択される
ForecastデータData group予測⼦Predictor予測Forecast洞察Insight
予測item分位数
InsightデータData group予測⼦Predictor予測Forecast洞察Insight
Insightデータセット内の属性が特定の時系列の予測にどのように影響したか
コスト計算の勘所⼀般的に、機械学習でお⾦がかかるのは、分かるが、Forecastの効果がハッキリしないうちに⼤きなコストが発⽣するのは、できるでば避けたい
コスト計算の勘所Getting Started / Hands on家庭の電⼒消費データセット(400軒分1年分)predict (1h45min) 1時間間隔で36時間を予測forecast (30min)0.x + 8.4 + 1.0 + 2*43 = $95.4
料⾦表料⾦タイプ 料⾦ 詳細インポートしたデータ $0.088 / 1 GB予測器のトレーニング $0.24 / 1時間 課⾦時間は、表⽰時間を上回る⽣成された予測データポイント$2.00 / 1,000件予測の説明 $2.00 / 1,000件 予測データポイント × 属性ˈˈˈˈ
料⾦表料⾦タイプ 料⾦ 詳細インポートしたデータ $0.088 / 1 GBCPU $0.24 / 1時間 課⾦時間は、表⽰時間を上回る予測データポイント $2.00 / 1,000件予測の説明 $2.00 / 1,000件 予測データポイント × 属性ˈˈˈˈˈˈ ˈ ˈˈ ˈdataset training forecast insight
料⾦表ˈˈ ˈ ˈˈ ˈdataset training forecast insight課⾦時間は、表⽰時間を上回る
料⾦表ˈˈ ˈ ˈˈ ˈdataset training forecast insight予測データのポイント数 = Items数 × 期間 × 分位数チョコレートポテトチップじゃがりこトマトにんじん周期(⽇)×期間 = 7 0.1、0.5、0,9 で3$2.01,000/⽉1,000/回(レガシー)
料⾦表ˈˈ ˈ ˈˈ ˈdataset training forecast insight予測データのポイント数 × 属性※ Item数指定可能)天気カテゴリー祝祭⽇
コスト計算の勘所Getting Started / Hands on家庭の電⼒消費データセット(400軒分1年分)predict (1h45min) 1時間間隔で36時間を予測forecast (30min)データ 学習 予測 ポイント数0.x 8.4h 1.0h 2*43 = $95.436(時間) × 3(分位数) × 400(items数) = 43,200ポイント ($88)