Slide 1

Slide 1 text

リクルート新人研修 データ分析ハッカソン 2019/04/15 リクルートテクノロジーズ 大杉直也 1 公開できるところだけ残した版

Slide 2

Slide 2 text

リクルート来た後にやってたこと 2 これらのランキングアルゴリズム(検索おすすめ順)の開発・改善

Slide 3

Slide 3 text

今回の研修 1. 今日から3日間、データ分析の研修 2. 座学はやるのもやられるのも嫌いなのでハッカソン形式 3. 実際の某巨大サービスのデータで金になりそうなテーマ 4. 人数があまりに多いので、テーマごとにチームわけ 5. メンターと参考書とサンプルコードをご活用ください 3

Slide 4

Slide 4 text

今日から3日間、データ分析の研修 • 大まかなスケジュール 1. (45分ワーク+15分議論) ×N • チームが安定したら、別にこの進め方でなくても良い 2. 必要に応じて、適時講義 • 基本はSlackで会話・質問 3. 最終日の16:00~発表 • 10分+5分質疑応答 • 縦A0ポスター形式 • 印刷は間に合わないので、スライド投影で • 記念+営業資料 4

Slide 5

Slide 5 text

座学はやるのもやられるのも嫌いなので ハッカソン形式 • 環境 • Google Drive Colaboratory + GCP BigQuery • この後、下記を確認 • Slackのこれ用チャンネルに入れているか • BigQueryのWeb画面にアクセス可能か • Colabのサンプルコードをコピー&実行できるか 5

Slide 6

Slide 6 text

人数があまりに多いので、テーマごとに チームわけ • 1. 応募原稿とその応募者の流入元の記事との関連 • 応募原稿のメタデータとメディアのメタデータとの関連 • 2. ふんわりキーワードと閲覧・応募原稿との関連分析 • 3. 満足退会者と不満足退会者の間の行動の違いを深掘り • 4. 求人票からの給与予測 • 5. どんな検索キーワードをみせるとウケるか? • 6. エージェントAIを作ってみる 6