求人サービスのユーザー分析をもとにした予算管理（ロジスティック回帰）

© Livecence Inc. 2021 自己紹介【名前】大坪誠（オオツボマコト）【所属】株式会社リブセンス　　　　アルバイト事業部　マーケティンググループ
【担当】アルバイト求人情報サイト「マッハバイト」の　　　　ブランディングおよび広告運用 2

© Livecence Inc. 2021 Exploratoryの活用状況【利用範囲】 • アンケートデータ集計・可視化・分析 •
広告配信データ分析 • サイト内ユーザー行動ログデータ分析 etc. 【利点】 • 集計・可視化が速く、簡単に、柔軟にできる • データ量が大きくても処理できる • サポートが手厚い 3

© Livecence Inc. 2021 Agenda • 解決したい課題 • 解決方法の概要 •
予測モデルの構築 • 予測モデルの性能評価 • モデルによる予測と評価 4

© Livecence Inc. 2021 「マッハバイト」の事業構造マッハバイトに求人広告を掲載マッハバイトでバイト探し&応募マッハボーナス掲載費用掲載or応募or採用時に
課金採用・勤務が決まって申請すると 5千円～1万円*のお祝い金 *不定期開催のボーナス増額タイム中の応募ならさらに+5,000円 6

© Livecence Inc. 2021 解決したい課題マッハバイトでバイト探し&応募マッハボーナス採用・勤務が決まって申請すると 5千円～1万円*のお祝い金
応募された時点では、マッハボーナスを支払うかどうか（採用され、かつ申請されるか）分からないため、将来発生する費用がどれくらいになるか分からない ⇒ 1応募獲得あたりの広告費用を　最適化できない *不定期開催のボーナス増額タイム中の応募ならさらに+5,000円 7

© Livecence Inc. 2021 現状の運用 • マッハボーナスの金額は、求人ごとに応募時点で決まっている • マッハボーナスは応募後90日間申請可能　→
90日以上前の1ヵ月間の実績の平均金額を予測値としている 7月 8月 9月 10月 11月 1応募あたり平均実績：1,000円 1応募あたり平均予測：1,000円【例】 8

© Livecence Inc. 2021 現状の運用の課題応募ユーザーの男女比が常に一定であるなら、数ヵ月前の実績値がそのまま使えるかもしれない 7月 11月 1応募あたりの金額：1,000円
1応募あたりの金額：1,000円 10

© Livecence Inc. 2021 現状の運用の課題応募ユーザーの男女比が変化している場合、数ヵ月前の実績値をそのまま使うのは適切ではない 7月 11月 1応募あたりの金額：1,000円
1応募あたりの金額：1,000円?? 11

© Livecence Inc. 2021 解決方法（イメージ）性別年齢職種ボーナス金額
ボーナス受給予測ボーナス受給確率女性 19 大学生 ¥5,000 TRUE 0.25 女性 47 派遣社員 ¥10,000 FALSE 0.08 男性 29 フリーター ¥15,000 FALSE 0.13 女性 16 高校生 ¥5,000 FALSE 0.06 男性 24 短大生 ¥7,000 TRUE 0.28 未知のデータ性別年齢職種ボーナス金額ボーナス受給男性 30 フリーター ¥10,000 FALSE 女性 28 主婦 ¥10,000 TRUE 男性 17 高校生 ¥7,000 TRUE 男性 43 自営業 ¥15,000 FALSE 女性 22 大学生 ¥5,000 FALSE トレーニングデータ（過去実績データ）性別年齢職種ボーナス金額ボーナス受給女性 19 大学生 ¥5,000 ？女性 47 派遣社員 ¥10,000 ？男性 29 フリーター ¥15,000 ？女性 16 高校生 ¥5,000 ？男性 24 短大生 ¥7,000 ？未知のデータ予測モデルアルゴリズム 13

© Livecence Inc. 2021 解決方法（イメージ）性別年齢職種ボーナス金額
ボーナス受給予測ボーナス受給確率女性 19 大学生 ¥5,000 TRUE 0.25 女性 47 派遣社員 ¥10,000 FALSE 0.08 男性 29 フリーター ¥15,000 FALSE 0.13 女性 16 高校生 ¥5,000 FALSE 0.06 男性 24 短大生 ¥7,000 TRUE 0.28 未知のデータある一定期間の各応募について、マッハボーナスを進呈するか否かを予測。その結果をもとに、その期間の応募に対するマッハボーナスの平均進呈額を予測。 14

© Livecence Inc. 2021 説明変数の選定（サマリビュー） ※例示しているデータはダミーです。実際の数値とは異なります。予測したい変数とその他の各変数との相関を確認ユーザーの属性（性別・年齢・利用デバイス等）や応募先の条件（業種・職種・マッハボーナス金額等）などがマッハボーナス受給確率に影響がありそう
17

© Livecence Inc. 2021 ※例示しているデータはダミーです。実際の数値とは異なります。 • タイプ　：ロジスティック回帰を選択 • 目的変数：予測したい変数を選択 •
予測変数：影響がありそうな変数を選択予測モデルの作成（ロジスティック回帰） 18

© Livecence Inc. 2021 ※例示しているデータはダミーです。実際の数値とは異なります。 TRUE/FALSEの閾値を変更 0.5（デフォルト） 0.167 TRUE/FALSEの境界値（閾値）変更
24

© Livecence Inc. 2021 予測モデルの適用（イメージ）予測モデルアルゴリズム 4～6月の応募実績データマッハボーナスの進呈有無が確定している 90日以上前のデータに対して、構築したモデルで予測し、実績値と比較
7月の応募実績データ 7月の応募実績データ予測値と実績値とを比較 29

© Livecence Inc. 2021 予測金額の計算①（イメージ）性別年齢職種ボーナス金額
ボーナス受給予測ボーナス受給確率ボーナス予測金額女性 19 大学生 ¥5,000 TRUE 0.25 ¥5,000 女性 47 派遣社員 ¥10,000 FALSE 0.08 \0 男性 29 フリーター ¥15,000 FALSE 0.13 \0 女性 16 高校生 ¥5,000 FALSE 0.06 \0 男性 24 短大生 ¥7,000 TRUE 0.28 ¥7,000 未知のデータ予測ラベルがTRUEの応募には、実際に進呈する場合の金額を、予測ラベルがFALSEの応募には、0円と予測する 32

© Livecence Inc. 2021 予測結果の確認 ※例示しているデータはダミーです。実際の数値とは異なります。 TRUEの割合実績予測ラベル予測確率の平均
ロジスティック回帰で予測するのは、「TRUE or FALSE」ではなく「TRUEである確率」 ⇒ ならば、期待値を求められるのでは？ 35

© Livecence Inc. 2021 予測金額の計算②（イメージ）性別年齢職種ボーナス金額
ボーナス受給予測ボーナス受給確率ボーナス予測金額女性 19 大学生 ¥5,000 TRUE 0.25 ¥1,250 女性 47 派遣社員 ¥10,000 FALSE 0.08 ¥800 男性 29 フリーター ¥15,000 FALSE 0.13 ¥1,950 女性 16 高校生 ¥5,000 FALSE 0.06 ¥300 男性 24 短大生 ¥7,000 TRUE 0.28 ¥1,960 未知のデータ予測ラベルにかかわらず、（TRUEの場合の金額）×（TRUEである確率）で期待値を算出する* 36 *不均衡データの調整（オーバーサンプリング/アンダーサンプリング）をして構築したモデルでは使えない

© Livecence Inc. 2021 予測金額の計算②（イメージ）性別年齢職種ボーナス金額
ボーナス受給予測ボーナス受給確率ボーナス予測金額女性 19 大学生 ¥5,000 TRUE 0.25 ¥1,250 女性 47 派遣社員 ¥10,000 FALSE 0.08 ¥800 男性 29 フリーター ¥15,000 FALSE 0.13 ¥1,950 女性 16 高校生 ¥5,000 FALSE 0.06 ¥300 男性 24 短大生 ¥7,000 TRUE 0.28 ¥1,960 未知のデータ予測ラベルにかかわらず、（TRUEの場合の金額）×（TRUEである確率）で期待値を算出する* 37 予測ラベルは考慮しない →TRUE/FALSEの閾値を考える必要がない *不均衡データの調整（オーバーサンプリング/アンダーサンプリング）をして構築したモデルでは使えない

© Livecence Inc. 2021 まとめ • Exploratoryを使えば、非エンジニアでも容易に予測モデルを構築できる • ロジスティック回帰は活用シーンが多い優秀な手法だが、閾値の設定次第で予測結果が変わってしまう（閾値の最適化が難しい）
• 予測ラベルそのものが重要ではないケースにおいては、予測確率や、予測確率から導いた期待値に着目するのも有力 40

求人サービスのユーザー分析をもとにした予算管理（ロジスティック回帰）

求人サービスのユーザー分析をもとにした予算管理（ロジスティック回帰）

More Decks by Ikuya Murasato

Other Decks in Business

Featured

Transcript