Upgrade to Pro — share decks privately, control downloads, hide ads and more …

API群「A3RT」を通じた 機械学習のビジネス活用について

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

API群「A3RT」を通じた 機械学習のビジネス活用について

API Meetupでの牧の資料になります。

Avatar for Recruit Technologies

Recruit Technologies

May 07, 2018
Tweet

More Decks by Recruit Technologies

Other Decks in Technology

Transcript

  1. 2 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    自己紹介 その他 学歴 略歴 氏名 牧 允皓 (まき よしひろ) 九州工業大学大学院 情報工学府 情報科学専攻 新卒としてソーシャルゲームの会社に入社。 データサイエンティストとして4年間勤務。アクセスログの分析、施策の効 果検証、異常検知システムの構築などを経験。 2017年にリクルートテクノロジーズに入社し、機械学習のソリューションを 開発、運用するグループに所属。主な業務はA3RTプロダクトの開発・運 用と、協業・講演などのプレゼンス向上を図るユニットのディレクション。 データサイエンティスト養成読本 登竜門編 共同執筆 機械学習の講師として活動
  2. 3 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    本日の内容 1. A3RT開発の経緯 2. A3RTの導入事例 3. “AI”を活かすための勘所 4. オープンイノベーション
  3. 5 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    リクルートのビジネスモデル Matching Business HR Bridal Group Buying Used Cars Travel Real Estate Beauty Gourmet Social Games E-Commerce Ad Network New Business Consumers Enterprise
  4. 6 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    リクルートの事業領域 「選択」をサポートするような情報サービスを展開 Life event area Lifestyle Area Travel Business support Lifestyle Health & Beauty Job Hunt Marriage Job Change Home Purchase Car Purchase Child Birth Education
  5. 7 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    リクルートテクノロジーズの立ち位置 7 リクルート ホールディングス リクルートキャリア リクルート住まいカンパニー リクルートライフスタイル リクルートジョブズ リクルートマーケティングパートナーズ リクルートテクノロジーズ リクルートスタッフィング スタッフサービス・ホールディングス リクルートコミュニケーションズ メディア・ ソリューショSBU ㈱リクルート グローバル派遣 SBU グローバル オンラインHR SBU Infrastructure /Security Project Management UXD/SEO Internet Marketing Big Data Solutions Technology R&D Systems Development ITソリューションを提 供 その他海外派遣グループ会社 Indeed, Inc.
  6. 8 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    組織体制 8 ITエンジニアリング本部 キャリア領域データテク ノロジー用途開拓G 販促領域データテクノロ ジー用途開拓G キャリア領域を軸とした テクノロジーの用途開拓 販促領域を軸とした テクノロジーの途開拓 データテクノロジー プロダクト開発G データテクノロジー インフラG データ解析基盤の 構築・運用、 高度演算環境の検証 データテクノロジーラボ部 ソリューションを軸とした 各種R&D系プロダクトの開発 バイト領域データテクノ ロジー用途開拓G バイト領域を軸とした テクノロジーの用途開拓
  7. 9 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    組織ミッション・バリュー Long Term Mission データテクノロジーの力で リクルートを変え、世界を変える Short Term Mission データテクノロジーを武器として、 リクルートの新しい可能性を引き出し、 挑戦する機会を生み出し続ける Values ・一流の仕事をする ・お互いの強みを活かしあう ・誰のため・何のためを考える ・”できる”方法を考え抜く ・一次情報を取りに行く ・逆境も楽しむ
  8. 11 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    A3RT(アート)とは Analytics & Artificial Intelligence API via Recruit Technologiesの略表記 事業のサービスの価値を高めるための汎用的な機械学習APIサービス群
  9. 12 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    歴史を遡る:リクルートにおけるAIムーブメント 2013年 Hadoopカンファレンスの様子 http://gihyo.jp/news/report/2013/01/2901 •AI領域の発展はデータ解析領域の発展と密に関係性がある。 •リクルートにおいてはHadoopの導入がことの始まり。 •データが一箇所に集まり・・・並列計算で機械学習が・・・と Hadoopを入れることによるスタンダードなメリットは享受。 •HDFSのファイルシステム機構。つまり音声、画像、動画 も一箇所に貯めることができる。実はこの思考がAI活用の キーポイント。 •また、「ボトムアップ」という文化も今後大きく発展を牽引。
  10. 13 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    非構造データから始まったビジネス活用 •蓄積された非構造データ、特に画像を何かに活かせないかを考える。 (Hadoopからは離れていく・・・) •思考一発目:ネイルの画像で何か施策ができないか・・・ •ということで類似ネイルデザイン推薦を考える。 •古典的特徴量での判別モデルの限界に、 颯爽と現れるDeep Learningフレームワーク。 •上記全てがメンバーレベルで進行する。
  11. 14 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    気づいたこと •「Deep Learning×データ×課題解決」の破壊力と可能性 •それらには人間の作業をある程度代替する潜在要素を持っている
  12. 15 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    AIというバズワードを定義する ▪今やAIという言葉が一人歩きしている現状。人により、様々な定義や仮説が存在。 ▪ただ、感情や理解・意識の概念や高度な判断はまだできず。現時点ではあくまでも人の行なっていたパターン行動を 忠実に模倣・学習するというレベルであることは共通の認識。これを下記のように定義する。 データ ロジック アルゴリズム 行動模倣 フィードバック フィードバック 五感 思考 行動
  13. 16 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    目指す世界:API化による効率化 • 目的:横断的なソリューションを開発し提供する • メリット ◦ 適用先の環境が変化してもAPI側の設計を変える必要がない ◦ インターフェースよりもコア技術の磨き込みを優先できる ◦ ソリューションミックスが容易になる リクルート内サービス モデル化 API モデル・技術共有 コール 再学習 API コール
  14. 20 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    模倣スキーム クチコミ データ Convolutional Neural Network クチコミ審査機能 フィードバック クチコミを審査する 審査要項や過去の実績と 照らし合わせる 機械による クチコミ審査 人の行動 模倣
  15. 21 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    クチコミ審査AI: 背景 ✓ リクルートライフスタイルが提供するホットペッパービューティーではクチコミの投稿件数 が150%推移で上昇。それに伴い審査コストも増加。 • クチコミ関係の施策を打ちたくても、審査コストがキャップとなりできない状態
  16. 22 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    クチコミ審査AI: 背景 ✓ そもそもクチコミの審査では、NGワード単位で拾えるものからベテランでないと判断が 難しいものまで、60以上の審査項目を見極める必要がある。 • 多段階の審査で対応しているが、それがコスト増の要因となっている 2018/1/30 Copyright(C)2016 Recruit Technologies Co.,Ltd. All rights reserved 22 ベテランの審査ノウハウを学習したAI(Deep Learning) モデルを使い、工数削減ができないかを検討
  17. 24 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    クチコミ審査AI: 技術 ✓ 画像解析用のCNNにテキストデータを食わせるためにテキストデータの擬似画像化を embedding処理を用いて行う 2018/1/30 Copyright(C)2016 Recruit Technologies Co.,Ltd. All rights reserved 24
  18. 25 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    クチコミ審査AI: 技術 ✓ 画像として表現したクチコミデータとそのラベルを学習することで精度93%のモデルを作成、 実用化 • RNNを使うよりもモデルの作成に時間がかからず、トライ&エラーを多く繰り返せた Copyright(C)2016 Recruit Technologies Co.,Ltd. All rights reserved 25
  19. 30 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    現場で起きる事件(遭遇率が高かったもの) •精度を100%まで望み、100%まで出ないと本番稼働させないという夢物語。 ◦いつしか人が100%の精度だと勘違い ◦機械「学習」という言葉を無視 •AIをやりたい、しかし目的なし。コストはかけたくない。 ◦手段が目的化する ◦むしろ、その目的がないからコストが悪化する悪循環。 •やったらやりっぱなし、エンハンスなし。 ◦機械に学ばせてあげない ◦技術は日進月歩だということを忘れない
  20. 31 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    ▪手段の選択 解決手段の一つAI AIは魔法のようなツールではない ▪目的・目標 ・人のコストを月◦◦円 下げる。 ・あるユーザー層のCVRを ◦◦上げたい。 etc... ▪課題の深堀 なぜコストがかかっている のか? 原因1: ナレッジが蓄積さ れないから 原因2: ルーチンワークが 多いから etc... •AIプロダクトを作ったからビジネス活用が進むと思っていると痛い目に会う •一般に言うビジネス検討、要件定義、振り返りは必要 •しかも、手段がややこしいため、説明にさえ専門性が必要 ▪課題 ・人のコストがかかりすぎ ・訪問数をあげたい ・アクションをあげたい etc... ビジネスにおける課題解決のフロー(例)
  21. 32 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    ・施策と手法を結びつける知識 ・AIとよばれるものの長短を説明 ・目的やコスト、課題感の共有能力 AI案件推進の際に必要な要素 AI案件推進のために必要なもの 施策適応 モデリング チューニングノウハウ アルゴリズム 教師データ ・自社データ ・クラウドソーシングで集める ・データ購入 ・取得できていないデータを収集・顕在化 ・機械学習やAIの仕組み理解 ・パラメータチューニングなどの勘所 ・アルゴリズムの選択 →採用や、他の企業ごと人を買収 • オープンソースの利用 • 社外の商用製品の利用 プロダクト開発Gの メンバーがサポート プロダクト開発Gの メンバーがサポート 組織として対応 組織として対応
  22. 34 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    オープンイノベーション • 世の中のAI技術利用に貢献する A3RTがAI技術活用のハードルを下げることで、世の中に革新的な製品・サービス が生まれ、結果としてよりよい世界を作る手助けができるのではないか • リクルートへの還元効果 ユーザから様々なフィードバックをいただくことで、A3RTをより良いものに進化 させる • 具体的な取り組み ◦ A3RT無償公開 ◦ 社外協業 ◦ 海外スタートアップとの協業
  23. 35 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    35 (C) Recruit Technologies Co.,Ltd. All rights reserved. A3RTの一部機能を無料で一般公開(2017年3月) https://a3rt.recruit- tech.co.jp/ 外部データ獲得による既存モデルの精度向上や 技術知見向上&AI文脈でのプレゼンス向上を図る
  24. 36 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    A3RT公開のインパクト 36 (C) Recruit Technologies Co.,Ltd. All rights reserved. • 登録ユニークユーザー 3544人(2017/3/14〜2018/4/15) • 企業からの問い合わせ 70件以上 • 多数の主要メディアで掲載
  25. 37 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    A3RT公開の効果 37 • プレゼンス向上 ◦ 講演会依頼の増加、独自採用イベントの開催 • モデルの精度向上 ◦ Talk APIで収集した3万件以上のデータを機能改善に活用するなど • 外部とのベンチマーク ◦ 精度がいまいちなどのFBによる改善点の立案。メンバーの意識改善 • ニーズ把握・活用事例の蓄積
  26. 38 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    社外協業に関する取り組み • 経緯 ◦ A3RT:リクルートグループで利用するソリューション ◦ 導入先がその時点でなくとも、習得しておきたい技術や手法があった • 協業のスタンス ◦ パートナー:課題とそれを解決するためのデータを提供 ◦ 私達:技術を提供 • 目的 ◦ 研究段階の技術を先行して習得しておく ◦ 社内の課題やデータに縛られずに取り組む
  27. 39 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    事例 (Crowd Gate社 × A3RT) • 社外協業の事例 ◦ GANを用いた加工技術の開発 ◦ ラフ画から線画を経て着色 • Crowd Gate社: ◦ デザインに関する専門知識 ◦ 豊富な画像データ • 弊社: ◦ AIに関する技術 https://recruit-tech.co.jp/news/180322_002179.html
  28. 40 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    スタートアップ協業スキーム構築 • 現地出張を基軸とした以下のようなスタートアップ協業スキームをUS/イスラエルで運用。 • 目的 ◦ データテクノロジー系スタートアップとの(投資目的ではない)技術協業。 ◦ 新しい知見習得、リクルートのバイアス排除 出張 8 or 9月 出張 2 or 3月 出張結果を踏まえ POC検討 • POCの結果によるフィード バックとNextAction検討 • 訪問先企業精査 • POCの結果によるフィード バックとNextAction検討 • 訪問先企業精査 出張結果を踏まえ POC検討 1Q 2Q 3Q 4Q
  29. 41 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    Verbit Software Ltd. 音声認識(Speech-to-Text) Spartans AI ltd AR技術 事例 その他の例 屋内位置情報取得文脈で協業
  30. 43 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    本日のおさらい • A3RT開発の経緯 ◦ Hadoop導入からデータ蓄積が進み、それらを活用するためAI領域に進出 ◦ 事業、サービスに依存しない横断的なソリューションを開発 ◦ 様々な機械学習のソリューションをAPI群としてブランド化 • A3RTの導入事例 ◦ テキスト分類の導入によって口コミ審査の業務改善を図る • “AI”を活かすための勘所 ◦ 魔法のツールではないため、技術の限界について共通の認識をもつことが重要 ◦ 手段と目的を混同しないように注意 ◦ いくら自動化してもPDCAサイクルが必須 • オープンイノベーション ◦ A3RTを無償公開し、データ・ノウハウの蓄積と、プレゼンス向上を目指す ◦ 社外協業によって技術力を磨き、独りよがりにならないよう努力を続ける
  31. 44 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    目標 AIを流行で終わらせない 地に足をつけて、AIを活用し続ける
  32. 45 Copyright © Recruit Technologies Co., Ltd. All Rights Reserved.

    どしどし使ってください! A3RT利用ください https://a3rt.recruit-tech.co.jp/