Pro Yearly is on sale from $80 to $50! »

Rettyにおけるデータ活用について

6fe6b19f7204487ab25ceb3b3a70204e?s=47 takegue
May 10, 2018

 Rettyにおけるデータ活用について

6fe6b19f7204487ab25ceb3b3a70204e?s=128

takegue

May 10, 2018
Tweet

Transcript

  1. Retty におけるデータ活用 竹野 峻輔(TAKENO Shunsuke) 2018.05.09

  2. 自己紹介

  3. 竹野 峻輔 Retty では - 集計・分析基盤開発 / 分析 / 機械学習

    - Web開発 (ログ〜ロジック 開発) - M.Eng. (自然言語処理) その他 - もくもくPython勉強会@Retty - 寄稿: Software Design 6月/ OR学会 特集「自 然言語処理と数理モデル」 - Qiita「負荷試験のためのノウハウと Webフレームワーク の負荷試験 (Python,Node,Go,PHP)」
  4. Retty について

  5. Rettyにおけるデータ活用の取り組みの紹介

  6. キャッチコピー生成 (自然言語処理) (自動) 二戸産のそばを店内で製粉し、挽きたて・打ちたて・茹でたての「3たて」で提供 (人手) お婆ちゃんの家に遊びに来たような古民家で頂くコシの強いお蕎麦は美味 「AIが飲食店のキャッチコピー、優先度学習を採用したRetty」 (5/9) http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00275/050100002/ まとめページやおすすめのお店

    /ユーザ レコメンド(情報推薦 ) Native App(iPhone) Web(desktop/mobile)
  7. “バエ”な写真の発掘 (画像処理) キャッチコピー生成 (自然言語処理) (自動) 二戸産のそばを店内で製粉し、挽きたて・打ちたて・茹でたての「3たて」で提供 (人手) お婆ちゃんの家に遊びに来たような古民家で頂くコシの強いお蕎麦は美味 「AIが飲食店のキャッチコピー、優先度学習を採用したRetty」 (5/9)

    http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00275/050100002/ まとめページやおすすめのお店 /ユーザ レコメンド(情報推薦 ) Native App(iPhone) Web(desktop/mobile) 「【飯テロ注意】新世代 AIによるグルメサービス Rettyの進化」 https://qiita.com/taru0216/items/438bc9119d9c6c3ee86e
  8. ”ビッグデータ” あるあるの苦労話 ※ 個人の見解です

  9. とりあえず溜まったデータはある データ周りの苦労話 1 実際 7~8割ぐらい使わない ほんとに欲しいデータは 無い/使えない/整っていない データセットとしてのアノテーションの基準が整っていない 前処理 9割

  10. 期待と現実のズレも割とビッグ 2 人間の感覚が基準で言語化 /数値化できない (≠ 機械的な基準) SOTAが 思ったよりも使えない .... 超えられない平均の壁

    データ周りの苦労話 いきなりは精度はでない
  11. 手段が目的化する 3 AI(人工知能)が使いたい! ビッグデータ使ってすごいことしたい! データドリブンにしたい! データ周りの苦労話 SOTAの手法を使いたい

  12. 手段が目的化する 期待と現実のズレもビッグ とりあえず溜まったデータはある 2 3 1 → 5S(整理・整頓・清掃・清潔・躾) → 手法を使い方ではなくて、データ(が生まれる構造)の活かし方を考える

    → 最初に調整する / 短いイテレーションで MTGを開く → 超安全策 と チャレンジ策 必ず2つは用意する. 3つはあるとベスト → 「魔王を倒すことではなくて、倒して世界平和にするんだろう...!」 っ辛抱よく伝える → 「問題の難しさ把握するためにも一番簡単な方法とる」 それでもデータを使っていくことで価値がある
  13. ベンチャーとして半歩先を踏み出すために 

  14. 目的 データ 手段

  15. 目的 データ 手段 ほかの2つを広げる 努力する

  16. 目的 データ 手段 ほかの2つを広げる 努力する 個人の能力値 組織の能力値

  17. プログラマよりもエンジニア、エンジニアよりもアーキテクトであれ - データの取得〜活用 / 評価 まで 詳しい人 が 密に携わる -

    (収集) ログ量の調整 / 欲しいデータの取得 → ログ送信 〜 ログ基盤 に携わる - (実装) スケール性 / 効率性 / 妥当性 → 月間3000万UUに耐えうる良いロジック開発 - (評価) サービスの成長 → 精度評価 からの KPI 評価。 - (運用) サービスに統合した手法の評価・改良 → 機械学習周りはリリースしてからが本番...      個別の知見が他のステップの知見となる (データの作り方/運用が少ない機械学習) - しんどい が結果的に 手っ取り早い - 色々なところでの スピード感 (データは集めるまでに時間を要する) - できるまでわからない、効果実感 - 一気通貫でやれた方が アウトプットの質が上がる - 手法の提案よりもシステムの提案
  18. 食を通じて世界中の人々を Happy に fin. すべてはビジョンのために