FreakOut における Amazon SageMaker 活用事例 / Amazon SageMaker in FreakOut

© FreakOut FreakOut における Amazon SageMaker 活用事例株式会社フリークアウト Software Engineer
小浜翔太郎

© FreakOut Machine Learning in FreakOut, Inc. 適切な入札価格を決定するために CTR/CVR予測を利用
学習モデルはバッチで更新し、予測はアプリケーション内で行う学習器訓練データ学習モデル App 予測器特徴量予測値

© FreakOut CTR/CVR 予測モデル改善の流れ評価KPIの決定文献等調査オフライン検証
本番実装オンライン検証全適用 Baseline の確認データの確認

© FreakOut オフライン検証の環境の変化 2014年 2016年 2018年人員数 1人
から X人体制へ R&D チームの人数の増加と共に、オフライン検証の環境も変化オンプレミスの環境に分析サーバを用意 EC2 の利用を始める Vagrant AWS Provider を使い開発で使い慣れているコマンドでインスタンスの操作ができるようにした Amazon SageMaker により大規模で並列にオフライン検証が行えるようになった

© FreakOut Amazon SageMaker とは主要な３つのコンポーネントから構成される Authoring 前処理用の Notebook instance
を簡単に立ち上げられる Model Training モデル学習 Job を簡単に実行 Model Hosting 学習したモデルを利用したエンドポイントを簡単に作成現在は Model Training のところを主に利用している

© FreakOut Model Training | Amazon SageMaker ▪ 学習アルゴリズムが入った Docker
Image の ECR パス ▪ 訓練データなどの入力用 S3 パス ▪ 学習に利用するハイパーパラメータ ▪ 学習済みモデルなどの出力用 S3 パス https://docs.aws.amazon.com/sagemaker/latest/dg/how-it-works-training.html 主に以下の４つを指定するとモデル学習 Job が実行できる

© FreakOut Model Training | Amazon SageMaker 有名な学習アルゴリズムは Built-in で
Image が用意されている ▪ XGBoost Algorithm ▪ Factorization Machines ▪ Image Classification Algorithm (ResNet) ▪ Sequence2Sequence ... Built-in のアルゴリズムだけでなく Docker image を用意することで任意の学習アルゴリズムを SageMaker 上で動かすことができる

© FreakOut Model Training with Custom Image ▪ 訓練データなどの入力用 S3
パスは、FILE mode の場合以下のパスにマウントされる docker run image train ▪ Job を submit すると以下が実行される /opt/ml/input/data/channel_name ▪ ハイパーパラメータは、以下のパスに JSON 形式で置かれる /opt/ml/input/config/hyperparameters.json ▪ 学習済みモデルなどは、以下のパスに置くと、S3に保存される /opt/ml/model/

© FreakOut Model Training with Custom Image ▪ マウントされた訓練・評価データの連結と移動 ▪
hyperparameter.json を luigi.cfg に設定 ▪ 学習・評価を行う luigi ワークフローの実行 ▪ モデル・評価結果をS3に保存されるように移動 docker run image train で以下を実行するイメージをオフライン検証用に用意した

© FreakOut Luigi Train, Prediction and Evaluation Workflow を使うと hyperparameters.json
が JSON のまま luigi.cfg 経由でタスクに簡単に渡すことが可能 Luigi は Spotify を中心に開発しているワークフロー管理ツール予測タスク学習タスク評価タスク訓練データ学習モデル評価データ予測結果評価結果

© FreakOut Docker image | Model Training with Custom Image
Docker image は CircleCI で build し ECR で管理 Push a branch Trigger build Build and push to ECR

© FreakOut SageMaker を用いたオフライン検証手順 SageMaker を使うことで効率的にオフライン検証が可能に 1. 訓練・評価データを抽出し HDFS 上に保存する
2. オンプレ HDFS 上のデータを S3 に保存する 3. Notebook instance を立ち上げ Job を submit 4. Notebook instance で結果を確認し比較する

© FreakOut sample_type: imp-click logs_tables: ad: last_hour: “2017-10-15T12:00:00” duration_hour: 24
conditions: - “billing_type = 1” - “is_application = 1” … features: - ad_id - hour - spot_id … remove_anormaly_cvr_cpns: true performance_indicator_type: ‘cpa’ … 1. 訓練・評価データを抽出し HDFS 上に保存訓練・評価データを Spark を利用して抽出する抽出条件を書いた YAML からデータ抽出する Application を用意抽出に使う Hive テーブルの条件データに対して行うフィルターの設定抽出する特徴量の設定

© FreakOut 2. オンプレ HDFS 上のデータを S3 に保存する hadoop distcp
を利用して抽出したデータを S3 上に移動訓練・評価データは、別のパスに置いて job を submit する際それぞれ train/test Channel として指定できるようにする hadoop distcp

© FreakOut 3. Notebook instance を立ち上げ job を submit train/test
Channel の指定 Job の submit

© FreakOut 4. Notebook instance で結果を確認し比較するで job の進行を確認可能 S3
に保存した評価結果を取得し比較を行う

© FreakOut オフライン検証の具体例グリッドサーチによるハイパーパラメータの最適化を行うためのオフライン検証ハイパーパラメータの一部だけ上書き後述する Hyperparameter tuning
Job を使えば Bayesian optimization を使ったパラメータ調整が可能

© FreakOut Hyperparameter Tuning Job Hyperparameter Tuning Job では通常の訓練Job に加えて
以下を指定することで Job を投げることが可能 ▪ 探索したいハイパーパラメータと探索範囲 ▪ 最適化する指標をログから取り出す正規表現 ▪ 最大試行回数と並列試行回数

© FreakOut Future Work プロダクション環境での利用学習・評価結果の可視化実験スクリプトの永続化の簡単な方法 ▪ 現在置き換えが進行中 ▪
バッチごとに使用するリソースを決めることができ、学習時間を柔軟に調整できるようになった ▪ 評価結果比較用のリーダーボードを用意 ▪ 学習曲線の可視化を CloudWatchLogs で行う ▪ 今は手動で .ipynb をダウンロードして GitHub に Upload

Give People Work That Requires A Person.

FreakOut における Amazon SageMaker 活用事例 / Amazon Sa...

FreakOut における Amazon SageMaker 活用事例 / Amazon SageMaker in FreakOut

Shotaro Kohama

More Decks by Shotaro Kohama

Other Decks in Programming

Featured

Transcript

© FreakOut FreakOut における Amazon SageMaker 活用事例株式会社フリークアウト Software Engineer

© FreakOut Machine Learning in FreakOut, Inc. 適切な入札価格を決定するために CTR/CVR予測を利用

© FreakOut CTR/CVR 予測モデル改善の流れ評価KPIの決定文献等調査オフライン検証

© FreakOut オフライン検証の環境の変化 2014年 2016年 2018年人員数 1人

© FreakOut オフライン検証におけるAmazon SageMaker の利用

© FreakOut Amazon SageMaker とは主要な３つのコンポーネントから構成される Authoring 前処理用の Notebook instance

© FreakOut Model Training | Amazon SageMaker ▪ 学習アルゴリズムが入った Docker

© FreakOut Model Training | Amazon SageMaker 有名な学習アルゴリズムは Built-in で

© FreakOut Model Training with Custom Image ▪ 訓練データなどの入力用 S3

© FreakOut Model Training with Custom Image ▪ マウントされた訓練・評価データの連結と移動 ▪

© FreakOut Luigi Train, Prediction and Evaluation Workflow を使うと hyperparameters.json

© FreakOut https://github.com/shotarok/vw-luigi Luigi Train, Prediction and Evaluation Workflow

© FreakOut Docker image | Model Training with Custom Image

© FreakOut SageMaker を用いたオフライン検証手順 SageMaker を使うことで効率的にオフライン検証が可能に 1. 訓練・評価データを抽出し HDFS 上に保存する

© FreakOut sample_type: imp-click logs_tables: ad: last_hour: “2017-10-15T12:00:00” duration_hour: 24

© FreakOut 2. オンプレ HDFS 上のデータを S3 に保存する hadoop distcp

© FreakOut 3. Notebook instance を立ち上げ job を submit train/test

© FreakOut 4. Notebook instance で結果を確認し比較するで job の進行を確認可能 S3

© FreakOut オフライン検証の具体例グリッドサーチによるハイパーパラメータの最適化を行うためのオフライン検証ハイパーパラメータの一部だけ上書き後述する Hyperparameter tuning

© FreakOut Hyperparameter Tuning Job Hyperparameter Tuning Job では通常の訓練Job に加えて

© FreakOut Hyperparameter Tuning Job ハイパーパラメータの探索範囲は柔軟にカテゴリ変数、連続変数、離散(整数)変数と指定できる https://docs.aws.amazon.com/sagemaker/latest/dg/automatic-model-tuning-define-ranges.html

© FreakOut Hyperparameter Tuning Job の具体例最適化するパラメータと範囲試行回数等を指定し Tuning

© FreakOut Hyperparameter Tuning Job の具体例コンソールから結果一覧や最も良いパラメータを確認できる

© FreakOut Future Work プロダクション環境での利用学習・評価結果の可視化実験スクリプトの永続化の簡単な方法 ▪ 現在置き換えが進行中 ▪

© FreakOut As-is Production Architecture 学習器訓練データ学習モデル

© FreakOut To-be Production Architecture 訓練データ学習モデル App

© FreakOut Future Work プロダクション環境での利用学習・評価結果の可視化実験スクリプトの永続化の簡単な方法 ▪ 現在置き換えが進行中 ▪

Give People Work That Requires A Person.