Slide 20
Slide 20 text
オフライン評価による効果検証
どのように効果検証をするか︖
↓
Amazon Personalizeが提供するオフライン指標(Metrics)を⽤いる
https://docs.aws.amazon.com/personalize/latest/dg/working-with-training-metrics.html#metric-definitions
種類 説明
coverage 多様なアイテムをレコメンドしているかどうか
MRR: mean reciprocal rank at k (k=25) レコメンド結果の上位に正解があることを重視した指標
NDCG: normalized discounted cumulative gain at k (k=5,10,25) レコメンド結果の順序に依存した指標
precision at k (k=5,10,25) レコメンドの正確性を表す指標
USER-A,ITEM-002,購⼊
USER-A,ITEM-005,購⼊
USER-A,ITEM-012,購⼊
...
USER-A,ITEM-005,0.81
USER-A,ITEM-002,0.74
USER-A,ITEM-001,0.53
USER-A,ITEM-003,0.49
USER-A,ITEM-012,0.33
⽐較
テストデータ
(正解とみなすデータ)
推論結果
テストセット
全期間のデータセット
20