Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Sage Makerで構築する価格推定システム

Sage Makerで構築する価格推定システム

Connehito Marché vol.6 〜機械学習・データ分析市〜
https://connehito.connpass.com/event/149552/

Keita Mizushima

November 05, 2019
Tweet

More Decks by Keita Mizushima

Other Decks in Programming

Transcript

  1. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    Sage Makerで構築
    する価格推定システム
    株式会社ランサーズ 
    開発部 水島 啓太

    View Slide

  2. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    2

    今日話すこと
    機械学習でなんかやってよと言
    われてやってみた話

    View Slide

  3. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    3

    伝えられる内容
    ランサーズの機械学習周りの話
    機械学習プロジェクト立ち上げ時の話
    Sage Maker運用のpros・cons

    View Slide

  4. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    4

    自己紹介
    version: '21’
    services:
    introduce:
    name : Keita Mizushima
    company : Lancers, Inc.
    position : Backend/AI Engineer
    twitter : @0xb5951
    github : odrum428

    View Slide

  5. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    5

    ランサーズとは

    View Slide

  6. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    機械学習の歴史

    View Slide

  7. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    7

    社内Wikiで歴史を見てみる...

    最古の機械学習関連
    テキストは2016年
    この時代は調査のみで
    本格的な実装には着手せず

    View Slide

  8. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    8

    時は進み...

    2017年4月から毎週金曜日の20%は好きなテーマが
    開発できるというルールの中で機械学習に取り組む。(現在は廃止)
    当時のメンバーを中心にメッセージの機械学習監視プロジェクトがスタート
    これがランサーズとして、最初の機械学習プロジェクトとなる。
    実対応時間 ⇨ 96.9 [%] 減

    View Slide

  9. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    機械学習でなんかできない?
    単価とかあげられないかな?

    View Slide

  10. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜

    View Slide

  11. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    まずは方向性を決める

    導入対象の条件
    ・ きちんと着地する
    ・ 事業数値に影響を与える
    アプローチ
    ユーザの意思決定コストを下げる

    View Slide

  12. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    企画を考えてみる

    ひたすらアイディア出し
    ・他社事例
    ・コンペっぽい対象を見つける
    ・ユーザが時間をかけている部分を洗い出し
    必要なキーマン
    ・ドメイン知識を持っている人
    ・MLちょっとできる人
    ・権力を持った

    View Slide

  13. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    今回取り組んだ施策

    依頼がいくらで成約するかを推定

    クライアントが立てた依頼に対して、
    どれくらいの金額で成約するかを予測&提案
    単価UPと意思決定コストの削減が目的

    View Slide

  14. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    要件
    ・使い捨ててもいいような設計にしておく
    ・手早く実装したい
    ・モデリングもなるべく楽に
    ・コストより実装のしやすさ、柔軟性を重視
    どういうアーキテクチャにしよう


    View Slide

  15. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜

    View Slide

  16. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    16

    Sage Makerについて

    ・AWSが提供している完全マネージドの機械学習サービス
    ・モデルの開発から、学習、デプロイまで対応
    ・学習済みモデルが用意されているので、初学者でもそこそこ使える
    ・リアルタイムやバッチ処理どちらにも対応

    View Slide

  17. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    17

    アーキテクチャ


    View Slide

  18. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    18

    モデル構築フロー

    学習を実行
    バッチでデータを転送
    モデル保存
    XGBoost+α
    ユーザデータを集計

    View Slide

  19. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜

    View Slide

  20. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    今日リリース....

    View Slide

  21. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    できませんでした!

    今週中にはリリースできる予定


    View Slide

  22. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    Sage Makerの
    pros・cons

    View Slide

  23. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    23

    pros : 検証、モデルの学習からデプロイまで対応

    学習 デプロイ
    インフラの構築や、運用などを考えなくても良い
    Notebookで学習からデプロイまで一括で実行できる

    View Slide

  24. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    24

    pros : Notebookのサンプルがちゃんとある

    組み込みのモデルも有名どころはかなり充実している

    View Slide

  25. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    25

    cons : 全体像をうまく掴むのが難しい

    学習、デプロイ時はNotebookインスタンスから、
    別のコンテナを呼び出す。
    コンテナの知識を裏で意識しないと把握しづらいかも。

    View Slide

  26. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    26

    cons : 独自実装のモデルを使うのには向いてない

    学習モデルのユースケース
    ①組み込みのアルゴリズムを使用する
    ②構築済みのコンテナイメージを使用
    ③構築済みのコンテナイメージを拡張します
    ④独自のカスタムコンテナイメージを構築する
    独自実装や拡張したモデルを使いたい場合には
    Docker Fileを定義する必要がある。
    ④やりたいなら、別の手法でやった方が良いかも。

    View Slide

  27. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    27

    cons : そこそこお金かかる

    エンドポイントを複数個立てるようになってくるとお金がかかってく
    る。
    モデルだけ流用して、別環境で運用するのもあり

    View Slide

  28. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    28

    開発してみての知見

    ・落とし所決めるのが難しい
    モデルの解釈性、既存との組み込み、リスクどこまでとるか
    ・ハマる対象をうまく見つけられるかがキモ
    ・Redashにデータがまとまっている嬉しさ
    ・MLの導入段階ではSage Makerはオススメ

    View Slide

  29. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    29

    絶賛採用中!!

    AIチーム立ち上げ中!!!

    現在 僕+インド人(入社予定)


    View Slide

  30. 2019/11/5 Connehito Marché vol.6 〜機械学習・データ分析市〜
    ご静聴ありがとう
    ございました!!

    View Slide