2021/11/12(金)に開催したExploratory データサイエンス勉強会#21の株式会社リクルート様のご登壇資料です。
データ・コミュニケーションツールとしてのExploratory活用法株式会社リクルートまなびデータソリューション部後藤真理絵
View Slide
❖ 自己紹介❖ 会社紹介・業務の背景❖ ビジネス課題❖ 活用機能❖ 効果アジェンダ
自己紹介
大学時代 社会人1−2年 社会人3-10年 社会人10年〜慶應SFCデザイン思考エスノグラフィFlashプログラミングWeb広告制作会社ディレクター見習いプロジェクト進行管理マーケティングリサーチ会社<データ収集>・文献、各種統計情報・Webアンケート・インタビュー調査・有識者インタビュー・ビジネスエスノグラフィ<分析・報告>・多変量解析、マイニング・顧客向け報告会ヤフー株式会社<広告効果分析>・広告効果分析・全社マーケティング最適化<サービス利用状況分析>・既存サービス分析支援・新規サービス立ち上げ伴走2020〜株式会社リクルート『スタディサプリ』サービス利用状況分析自己紹介
大学時代 社会人1−2年 社会人3-10年 社会人10年〜慶應SFCデザイン思考エスノグラフィFlashプログラミングWeb広告制作会社ディレクター見習いプロジェクト進行管理マーケティングリサーチ会社<データ収集>・文献、各種統計情報・Webアンケート・インタビュー調査・有識者インタビュー・ビジネスエスノグラフィ<分析・報告>・多変量解析、マイニング・顧客向け報告会自己紹介クリエイティブ系に憧れていた時期 営業・調査・分析の基礎 データサイエンスな世界ヤフー株式会社<広告効果分析>・広告効果分析・全社マーケティング最適化<サービス利用状況分析>・既存サービス分析支援・新規サービス立ち上げ伴走2020〜株式会社リクルート『スタディサプリ』サービス利用状況分析
弊社のご紹介
スタディサプリhttps://studysapuri.jp/
日本 インドネシア フィリピン対象学年 小・中学校 高校 大学・社会人 高校 高校オンラインビデオ(B to C)オンラインビデオ&アセスメント(B to B to C)オンラインコーチング各国で様々なサービスラインナップにて事業展開をしていますパーソナルコーチプランサービスラインナップ広報資料より
営業 学校・先生(クライアント)生徒(カスタマー)年単位で導入・活用支援を行うコンサル型営業スタイル
2020年に直面したビジネス課題
学校の一斉休校2020年3月
『スタディサプリ』のニーズが急上昇
顧客接点の数 = フォローする先生の人数 × 学校数
データでどう解決するか?
求められていたゴール● 合格点の対応品質の担保● 継続率の維持
ソリューション● どの学校に優先フォローをすればいいかわかる● 瞬間理解できる● 誰が見ても納得できる学校ごとの継続可能性を予測し、必要なフォロー内容をデータからサジェストする
データ活用面での課題
乗り越えるべき壁時間的制約短期間でデータをかき集め、予測モデルを作るため、試行錯誤期間が限られている精度<明瞭精度よりもわかりやすさ。誰もが瞬間で理解でき、解釈の余地がないアウトプット用途ドリブン営業が納得感を持ち、アクションが打てるものにしなければならない
ドメイン知識の習得・業務フローの理解・事業課題の把握初期問題定義・目的、ゴール・前提条件の整理・実施する範囲の設定データ調査&収集・ユーザー利用データ・マーケティングデータ・売上データ・オープンデータ現状把握分析・基礎統計・ユーザー利用状況・目的変数との関連性・企画者とのすり合わせ問題定義完了予測モデル検討・予測アルゴリズム選定・特徴量エンジアリング・データセット追加・予測モデルでの変数重要度算出・評価方法・予測結果のアウトプットイメージ・企画者とのすり合わせ・予測モデルブラッシュアップ・データ追加・システム実装・システムリリース・エンドユーザーへのコミュニケーション&フォローアップ企画・構想 現状調査 施策検討 施策実装 リリース必要な対応策プロジェクト運営プロセス(一例)ここを特に綿密にやる
対応手段➢ 問題定義に関係者全員が関わり、ブレない方針を策定した➢ 営業現場の人を巻き込み、データ分析でビジネス現場の状況と課題を共有(営業とデータ人材の視点を揃える)➢ 営業ヒアリングとデータ観点から、特徴量を選定(データチーム内でも目線を揃える)
Exploratoryの利用
インプットデータの修正をしても即、読み込めるデータインプット時
データインプット時DBにない関連データもクラウド上から取り込んで可視化
データチェック・クレンジング● データの質(欠損値、ばらつき)の確認● かき集めたデータで予測できそうか一次確認
● サマリーデータから特に重要視しているデータにフォーカスし、継続率への影響がありそうかを確認データチェック・クレンジング
データに基づく議論● 予測に特に影響してそうな特徴量候補のデータを、様々な角度から検証(実数、割合、分布、クロス集計など)
手元での予測モデル作成● 不均衡データの調整● 全体サマリで一定の傾向が見えた特徴量を入れて予測● 新たな特徴量をステップで作成● 分岐の納得性を確認
手元での予測モデル作成● 精度指標、変数重要度を確認● 不必要なもの、アンコントローラブルなものは抜いて精度にどう影響するかを試行錯誤
効果
データにフォーカスした議論によりスピーディーに進捗時間的制約PJチーム全体でシャープな問題定義ができた。モデル構築や精度検証を早いサイクルで回せた。精度<明瞭データ可視化を通じて営業現場との壁打ちが可能に。様々な現場の「肌感」を共有してもらえた用途ドリブン現場の声を取り入れたモノづくりができた。シンプルなソリューション提供で、施策にすぐ直結。
次年度に向けた重要な知見も得られる結果に定量・リピート率の維持・事業への貢献定性・予測結果に関する質問から改善点の抽出・現場の「肌感」を表すデータの不足認識と収集対策
まとめ➢ 現場の「肌感」を可視化結果に基づき引き出す➢ PJメンバーとデータにフォーカスした議論を重ねる➢ 時間的・データ的制約がある中で、問題定義を精度高く実施すぐに有効活用されたことで、事業に貢献