Slide 17
Slide 17 text
データの準備・取り込みでやること 17
探索的データ分析(EDA)
• データの傾向や特徴を捉え、レコメンドに適したデータセットを作るためのプロセス
• アイテム、ユーザー数、メタデータ、アクション数の分布などを事前に調べておく
• このプロセスがないと不適切なデータ設計による偏ったレコメンド結果となる可能性も…
SELECT
FLOOR(download_count/100) * 100 as download_range_start,
FLOOR(download_count/100) * 100 + 99 as download_range_end,
COUNT(*) as user_count
FROM
(SELECT user_id, COUNT(*) as download_count
FROM download_history
GROUP BY user_id) user_downloads
GROUP BY FLOOR(download_count/100)
ORDER BY download_range_start;