Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Two years have passed since I got into data analysis

ragi
May 20, 2019

Two years have passed since I got into data analysis

「データ分析の門をたたいて2年が経ちました」

s-dev talks 〜サービス開発勉強会〜「定量データ分析」
https://s-dev-talks.connpass.com/event/128911/

ragi

May 20, 2019
Tweet

Other Decks in Technology

Transcript

  1. データ分析 門をたたい
    2年が経ちました
    s-dev talks 「定量データ分析」
    クックパッド株式会社 佐藤市也
    2019/05/20

    View Slide

  2. 佐藤市也
    会員事業部 データ分析業 (2017~2018)
    - A/Bテスト 設計
    - ログ 計測
    - キャンペーン分析
    - ユーザー 行動分析
    技術部 データ基盤グループ DWH業 (2019~)
    - サービスDBからDWH取り込みシステム
    - DBドキュメントシステム (Dmemo)
    さ う いち り

    View Slide

  3. クックパッド 会員事業

    View Slide

  4. レシピサービス
    PC版
    レシピ
    Android
    iPhone版
    iPad版
    利用者
    利用者間 “つくったよ” “おいしい” “ありが う” コミュニケーション
    レシピを
    検索
    つくれぽを
    投稿
    レシピを
    投稿
    利用者
    つくれぽ
    累計レシピ数 約310万品

    View Slide

  5. cookpad プレミアムサービス
    ■ 月額280円(税抜)※
    プレミアムサービスを提供
    ■ 人気順検索、殿堂入りレシピ 機能を提供
    ※iTunes決済から ご登録 場合

     金額が異 ります
    人気順検索・殿堂入りレシピ プレミアム献立 専門家厳選レシピ
    MYフォルダ 絞り込み検索 カロリー・塩分計算

    View Slide

  6. 国内 「クックパッド」
    プレミアム会員数 推移

    View Slide

  7. クックパッド データ分析業務

    View Slide

  8. ぜひデータサイエンス 知識を活かし
    レシピサービス事業 貢献し ほしい!
    そし 会員事業部へ
    データが好き す
    「自社サービス データがある」
    「分野 特化したデータがある」
    からこ 会社を選びました
    就活中
    部署配属

    View Slide

  9. 今日 話
    新卒入社から2年経っ 得たも
    - 仮説検証分析へ 自信
    - ドメイン知識
    - 良い分析 そう い分析 見分け

    View Slide

  10. 仮説検証分析

    View Slide

  11. 分析 種類
    仮説検証型分析・仮説探索型分析
    ※こ 種類分け 一例 他 も色々 分け方がある  
    (他 例)定型選択型・定型計画型・非定型選択型・原因解明型・仮説試行型・経営判断型
    「機械学習 活用範囲正しい すか?東証一部唯一 データ分析専門企業が説く、データ・ドリブンへ 第一歩」より
    検証型 得意 探索型が苦手
    「現場 能力を引き出す データ分析 6つ 型」より

    View Slide

  12. 仮説検証型分析①
    キャンペーン分析
    - 過去 キャンペーン 成否
    - キャンペーン XXする うしたらいいか
    ユーザー行動分析
    - 過去 行動から退会率を予測
    実装・分析を担当した
    キャンペーン 例

    View Slide

  13. 仮説検証型分析②
    A/Bテスト
    - レシピ検索ページ 出すPS導線比較
    - 新機能 プロトタイプ比較
    高 仮説を検証するため   ~A/Bテスト実践~
    https://techlife.cookpad.com/entry/2018/02/22/080000

    View Slide

  14. 仮説探索型分析
    push開封時 遷移先画面 パフォーマンス
    push通知開封数 遷移
    push 効果が高い時間帯 仮説
    push通知をいつ送るべきか?
      (数少 い仮説探索 経験)

    View Slide

  15. ぜ探索 き い か
    - データ分析から仮説が見つから い
    - 仮説を立 た時点 既 ビジネス的 イケ く ボツる
    - そ 仮説が正しく もそう く も別 影響が い
    - 仮説 対象 るユーザー数が少 すぎる
    - そ 仮説を検証する方法がわから い・難しすぎる・コスト高い

    View Slide

  16. 分析 対する自信 課題
    自信
    - 仮説検証分析 数多くこ し きた
    - 分析 度 精度 高く保 る・保つ方法がわかっ いる
    - 統計 関する教養
    課題
    - 仮説探索型分析が き い い
    - 受動的分析 っ しまいがち 能動的分析が足り い い
    - 価値 ある分析を量産 き い い(後 「良い分析」 再び説明)

    View Slide

  17. ドメイン知識

    View Slide

  18. ぜドメイン知識が大事 か
    現場を知らず 行う分析ほ 怖いも い
    役 立た い 済め まだマシ 、仕事 邪魔 すら りか い
    そ 知識さえあれ 、 後から悔やむこ もある

    View Slide

  19. case1 他 人 知っ る
    「アクセス傾向を分析したら夏 ユーザーがアクティブ ありません」
    「それ そう す、我々 間 ”夏枯れ” 呼ん います」
    時間を無駄 する

    View Slide

  20. case2 間違う
    危険
    「課金 関する分析結果 ました、こちらがレポート す」
    「え? これ本気 言っ る? これ これ 数値、逆転し い?」

    View Slide

  21. うやっ 身 着けるか
    分析以外 業務
    ● PS購読・決済トラブルシューティング
    ● クックパッド コード改修
    ● 座席 雑談・Slack 会話
    ● 社内wiki/blog 情報 集積化
    非定形依頼業務から得られる知識 バカ ら い
    分析者 積極的 外 出 コミュニケーションを る

    View Slide

  22. 良い分析

    View Slide

  23. 良い分析
    影響力 ある分析
    - そ 分析結果が人を動かす
    - そ 分析結果がNextAction 繋がる
    - そ 分析結果がストーリー 一部 っ いる
    A/Bテストやキャンペーン分析
    既 ある流れ 一環 、自分 作った流れ かった

    View Slide

  24. 良く かった分析
    t-SNE クラスタリング
    PSユーザーをセグメント分けします!
    話題 時系列データライブラリを使っ
    PS入会を分析し みます!
    思いつきonly  無駄
    SOON

    View Slide

  25. 良かった分析
    2017年最も評価された業務
    「バレンタイン おい クーポン 扱い方 関する分析」
    2018年最も評価された業務
    「スマートフォンWeb アクセス傾向分析 & SEO 関する情報収集」
    (から ) 「スマートフォンWeb レシピ検索ページ高 化」
    ビジネスを意識しつつ
    仕事 流れを作った
    意思決定 繋がった

    View Slide

  26. ま め

    View Slide

  27. 今日 話
    2017年新卒入社から2年経っ 得たも
    - 仮説検証分析へ 自信
    - ドメイン知識
    - 良い分析 そう い分析 見分け

    View Slide