2019/5/20 Yahoo! 機械学習交流会
2019/05/20 Yahoo! 機械学習交流会ランサーズ機械学習の今とこれからランサーズ株式会社 CRE / 水島 啓太
View Slide
2019/05/20 Yahoo! 機械学習交流会2 1 ランサーズ機械学習の歴史2 今取り組んでいること3 僕の趣味の話アジェンダ
2019/05/20 Yahoo! 機械学習交流会自己紹介
2019/05/20 Yahoo! 機械学習交流会@0xb5951Keita MizushimaCRE津山高専 電子制御卒SkillPython,PHP,C ...etc
2019/05/20 Yahoo! 機械学習交流会一旦CM
2019/05/20 Yahoo! 機械学習交流会6 ランサーズとは
2019/05/20 Yahoo! 機械学習交流会CM終わり
2019/05/20 Yahoo! 機械学習交流会ランサーズ機械学習の歴史
2019/05/20 Yahoo! 機械学習交流会9 社内Wikiで歴史を見てみる... 最古の機械学習関連テキストは2016年この時代は調査のみで本格的な実装には着手せず
2019/05/20 Yahoo! 機械学習交流会10 時は進み... 2017年4月から毎週金曜日の20%は好きなテーマが開発できるというルールが始まる。(現在は廃止)当時のメンバーを中心にメッセージの機械学習監視プロジェクトがスタートこれがランサーズとして、最初の機械学習プロジェクトとなる。
2019/05/20 Yahoo! 機械学習交流会11 導入結果 スパムメッセージ送信数 ⇨ 98.2 [%] 減
2019/05/20 Yahoo! 機械学習交流会12 導入結果 実対応時間 ⇨ 96.9 [%] 減
2019/05/20 Yahoo! 機械学習交流会今取り組んでいること
2019/05/20 Yahoo! 機械学習交流会14 なぜ機械学習に取り組んでいるか CREチームの目標 : サポート業務の効率化,社内のデータが眠ったままになっている状況,イケてないフローがあるので、そいつらを根こそぎ倒したい...etc
2019/05/20 Yahoo! 機械学習交流会15 なぜ機械学習に取り組んでいるか CREチームの目標 : サポート業務の効率化,社内のデータが眠ったままになっている状況,イケてないフローがあるので、そいつらを根こそぎ倒したい...etc生データを使って、自分たちで環境作れる機会なんてそうそうないし、絶対面白いでしょ!!
2019/05/20 Yahoo! 機械学習交流会16 導入対象 メッセージに対して、導入した時の知見⇨ 対象がテキストなら流用できそう裏側の管理画面への導入なら、そこまで不具合がでなさそう⇨ 監視業務の効率化現状、時間がかかっている監視項目って何? ⇨ 依頼監視に導入してみよう!
2019/05/20 Yahoo! 機械学習交流会17 依頼監視の構成
2019/05/20 Yahoo! 機械学習交流会18 検知アルゴリズム 依頼のタイトル+本文分かち書き(MeCab+neologd)文章をベクトル化TF-IDF LSA次元圧縮(影響度の高い要素のみを取り出す)PassiveAggressiveClassifier決定境界からの符号付き距離をスコアにするオンライン学習でモデル更新参考文献 : https://qiita.com/Wotipati/items/a8eda3f246eb07c516caTruncated SVD
2019/05/20 Yahoo! 機械学習交流会19 Slackで専用の通知部屋を作成して監視できる体制を作成
2019/05/20 Yahoo! 機械学習交流会20 導入結果 監視期間 : 4/17 〜 5/17該当期間の依頼数: 34969依頼監視と検出された依頼既存 : 9948 機械学習 : 1277そのうち実際に違反とされた依頼既存 : 2840 機械学習 : 1111予測精度既存 : 約24.9 [%] 機械学習 : 約86.2 [%]
2019/05/20 Yahoo! 機械学習交流会21 今後の展望 今のロジックでは、検知範囲が不十分オンライン学習ってノイズ耐性低いし、ミニバッチ処理に変える?今回はテキストしか入れてないけど、ユーザデータとかの関連するデータも使いたい検知ロジックを修正する?BERT,Doc2dev, ...etc学習した結果を他の対象に適用したら面白そう
2019/05/20 Yahoo! 機械学習交流会僕の趣味のお話
2019/05/20 Yahoo! 機械学習交流会23 進捗 : タイトルと歌詞の自動生成は完了現在は自分の音響モデルを作成中(ATR503)やりたいこと : 楽曲を自動生成したい背景 : リコメンドが個人最適化されてきて、アーティストの概念が溶けてきた。使い捨ての音楽があってもいいんじゃないか。今後 : 空間データを元に楽曲を自動生成させたいその一瞬しかに成立しないエモさを追いたい
2019/05/20 Yahoo! 機械学習交流会ところで...
2019/05/20 Yahoo! 機械学習交流会そういえば今日いい感じのBGMなってませんか?
2019/05/20 Yahoo! 機械学習交流会実はこれコードで 自動生成された BGMなんですよ! 詳しく知りたい人はぜひ!懇親会で!!
2019/05/20 Yahoo! 機械学習交流会ご静聴ありがとう ございました!!