Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ランサーズと機械学習のこれから

 ランサーズと機械学習のこれから

2019/5/20
Yahoo! 機械学習交流会

Keita Mizushima

May 20, 2019
Tweet

More Decks by Keita Mizushima

Other Decks in Programming

Transcript

  1. 2019/05/20 Yahoo! 機械学習交流会
    ランサーズ機械学習の
    今とこれから
    ランサーズ株式会社 
    CRE / 水島 啓太

    View Slide

  2. 2019/05/20 Yahoo! 機械学習交流会
    2

    1 ランサーズ機械学習の歴史
    2 今取り組んでいること
    3 僕の趣味の話
    アジェンダ

    View Slide

  3. 2019/05/20 Yahoo! 機械学習交流会
    自己紹介


    View Slide

  4. 2019/05/20 Yahoo! 機械学習交流会
    @0xb5951
    Keita Mizushima
    CRE
    津山高専 電子制御卒
    Skill
    Python,PHP,C ...etc

    View Slide

  5. 2019/05/20 Yahoo! 機械学習交流会
    一旦CM

    View Slide

  6. 2019/05/20 Yahoo! 機械学習交流会
    6

    ランサーズとは

    View Slide

  7. 2019/05/20 Yahoo! 機械学習交流会
    CM終わり

    View Slide

  8. 2019/05/20 Yahoo! 機械学習交流会
    ランサーズ
    機械学習の歴史

    View Slide

  9. 2019/05/20 Yahoo! 機械学習交流会
    9

    社内Wikiで歴史を見てみる...

    最古の機械学習関連
    テキストは2016年
    この時代は調査のみで本格的
    な実装には着手せず

    View Slide

  10. 2019/05/20 Yahoo! 機械学習交流会
    10

    時は進み...

    2017年4月から毎週金曜日の20%は好きなテーマが
    開発できるというルールが始まる。(現在は廃止)
    当時のメンバーを中心にメッセージの機械学習監視プロジェクトがスタート
    これがランサーズとして、最初の機械学習プロジェクトとなる。

    View Slide

  11. 2019/05/20 Yahoo! 機械学習交流会
    11

    導入結果

    スパムメッセージ送信数 ⇨ 98.2 [%] 減

    View Slide

  12. 2019/05/20 Yahoo! 機械学習交流会
    12

    導入結果

    実対応時間 ⇨ 96.9 [%] 減

    View Slide

  13. 2019/05/20 Yahoo! 機械学習交流会
    今取り組んで
    いること

    View Slide

  14. 2019/05/20 Yahoo! 機械学習交流会
    14

    なぜ機械学習に取り組んでいるか

    CREチームの目標 : サポート業務の効率化,
    社内のデータが眠ったままになっている状況,
    イケてないフローがあるので、そいつらを根こそぎ倒したい
    ...etc

    View Slide

  15. 2019/05/20 Yahoo! 機械学習交流会
    15

    なぜ機械学習に取り組んでいるか

    CREチームの目標 : サポート業務の効率化,
    社内のデータが眠ったままになっている状況,
    イケてないフローがあるので、そいつらを根こそぎ倒したい
    ...etc
    生データを使って、自分たちで環境作れる機会
    なんてそうそうないし、絶対面白いでしょ!!

    View Slide

  16. 2019/05/20 Yahoo! 機械学習交流会
    16

    導入対象

    メッセージに対して、導入した時の知見
    ⇨ 対象がテキストなら流用できそう
    裏側の管理画面への導入なら、そこまで不具合がでなさそう
    ⇨ 監視業務の効率化
    現状、時間がかかっている監視項目って何?
     ⇨ 依頼監視に導入してみよう!

    View Slide

  17. 2019/05/20 Yahoo! 機械学習交流会
    17

    依頼監視の構成


    View Slide

  18. 2019/05/20 Yahoo! 機械学習交流会
    18

    検知アルゴリズム

    依頼のタイトル+本文
    分かち書き
    (MeCab+neologd)
    文章をベクトル化
    TF-IDF LSA
    次元圧縮
    (影響度の高い要素のみ
    を取り出す)
    Passive
    Aggressive
    Classifier
    決定境界からの符号
    付き距離をスコアにする
    オンライン学習で
    モデル更新
    参考文献 : https://qiita.com/Wotipati/items/a8eda3f246eb07c516ca
    Truncated SVD

    View Slide

  19. 2019/05/20 Yahoo! 機械学習交流会
    19

    Slackで専用の通知部屋を
    作成して監視できる
    体制を作成

    View Slide

  20. 2019/05/20 Yahoo! 機械学習交流会
    20

    導入結果

    監視期間 : 4/17 〜 5/17
    該当期間の依頼数: 34969
    依頼監視と検出された依頼
    既存 : 9948         機械学習 : 1277
    そのうち実際に違反とされた依頼
    既存 : 2840 機械学習 : 1111
    予測精度
    既存 : 約24.9 [%]  機械学習 : 約86.2 [%]

    View Slide

  21. 2019/05/20 Yahoo! 機械学習交流会
    21

    今後の展望

    今のロジックでは、検知範囲が不十分
    オンライン学習ってノイズ耐性低い
    し、ミニバッチ処理に変える?
    今回はテキストしか入れてないけど、
    ユーザデータとかの
    関連するデータも使いたい
    検知ロジックを修正する?
    BERT,Doc2dev, ...etc
    学習した結果を他の対象に
    適用したら面白そう

    View Slide

  22. 2019/05/20 Yahoo! 機械学習交流会
    僕の趣味のお話

    View Slide

  23. 2019/05/20 Yahoo! 機械学習交流会
    23

    進捗 : タイトルと歌詞の自動生成は完了
    現在は自分の音響モデルを作成中(ATR503)
    やりたいこと : 楽曲を自動生成したい
    背景 : リコメンドが個人最適化されてきて、
    アーティストの概念が溶けてきた。
    使い捨ての音楽があってもいいんじゃないか。
    今後 : 空間データを元に楽曲を自動生成させたい
    その一瞬しかに成立しないエモさを追いたい

    View Slide

  24. 2019/05/20 Yahoo! 機械学習交流会
    ところで...

    View Slide

  25. 2019/05/20 Yahoo! 機械学習交流会
    そういえば今日
    いい感じのBGM
    なってませんか?

    View Slide

  26. 2019/05/20 Yahoo! 機械学習交流会
    実はこれコードで

    自動生成された

    BGMなんですよ!

    詳しく知りたい人はぜひ!懇親会で!! 


    View Slide

  27. 2019/05/20 Yahoo! 機械学習交流会
    ご静聴ありがとう

    ございました!!


    View Slide