Slide 10
Slide 10 text
© commmune Inc. All rights reserved
隠れていた2st-recsysのCandidateとFeatureの要件
共通
● 重い処理は一度だけ実行し、保存したい。二度目は読み出したい
● データの取得先や方法を柔軟に変えたい(BQ, インメモリ, csv…)
● 柔軟にデータの保存先を変えたい(Train/ valid / test…, Fold,....)
● 各ロジックごとに検証したい(欠損値はないか、len() != 0...)
Candidate
● 複数のTOP KでRecallやなどMetricを評価したい
Feature
● ロジックは同じだけど、 join先のkey_colsを可変にしたい (ex. item2itemの推薦)
● 実験を経て、使うカラムを柔軟に決めたい