Upgrade to Pro — share decks privately, control downloads, hide ads and more …

A Decision Model of Sales Period on List Price for Second-hand Fashion Items Based on Machine Learning Approach

kuwata
June 12, 2020
610

A Decision Model of Sales Period on List Price for Second-hand Fashion Items Based on Machine Learning Approach

kuwata

June 12, 2020
Tweet

Transcript

  1. 目次 1. 研究背景と目的 2. 提案への着想 3. 提案への準備 4. 提案手法 5.

    実データ分析 5.1 分析条件 5.2 分析結果 6. まとめと今後の課題 1/26
  2. 1. 研究背景と目的 TシャツA 5,000円 ソファーB 20,000円 チャーハンC 600円 ファッションアイテム 家具・日用品

    食料品 近年,様々な業界においてECサイトが普及している → 膨大な販売履歴データが蓄積されている データを活用し, ビジネスに生かす ECサイトの多様化 2/26
  3. 1. 研究背景と目的 TシャツA 5,000円 ファッションアイテム ECサイトの多様化 自社ブランドを扱うサイト (ex. ユニクロ etc.)

    … サイズや素材の表記がある程度統一されている 複数ブランドを扱うサイト (ex. Amazon etc.) … サイズや素材がブランドによって多種多様である 本研究では,複数ブランドの中古品を扱う ZOZOUSEDを対象とする 3/26
  4. 1. 研究背景と目的 買取 販売価格 …ユーザに購入された際の価格 ZOZOUSEDのサービス概要 販売 (あるユーザが購入) TシャツA 5,000円

    (値下げ) TシャツA 20% off 4,000円 TシャツA 20% off 4,000円 ✔︎ 出品 出品価格 …アイテムを出品した最初の価格 一定期間売れなかった アイテムは値下げされる 4/26
  5. 1. 研究背景と目的 買取 ZOZOUSED TシャツA 5,000円 TシャツA 20% off 4,000円

    TシャツA 20% off 4,000円 ✔︎ 出品 プロパー期間 … 初期価格の保持期間 (ZOZOUSEDの経験則により決定されている) プロパー期間の決定次第で,より値下げをせずに販売された可能性 → 適切なプロパー期間の決定 課題 (値下げ) 販売 (あるユーザが購入) 5/26
  6. アイテムの販売はユーザの意思決定に左右される → 販売日数の分布を考慮したプロパー期間の決定 1. 研究背景と目的 買取 ZOZOUSED TシャツA 5,000円 TシャツA

    20% off 4,000円 TシャツA 20% off 4,000円 ✔︎ 出品 ユーザの意思決定による (値下げ) → 販売日数は確率的に 決定される 販売 (あるユーザが購入) 販売日数 … 出品から販売までの日数 6/26
  7. 7月に出品 1. 研究背景と目的 ZOZOUSED コートA 9,000円 コートA 9,000円 コートA 9,000円

    コートA 60%off 3,600円 60日後 1日後 ✔︎ ✔︎ 常に同じプロパー期間を適用することは合理的でない → 出品月ごとにプロパー期間を設定 1月に出品 季節性 のあるアイテム 7/26
  8. アイテム カテゴリ ブランド 出品月 使用状態 ・・・ 販売日数 アイテムA コート ブランドA

    9月 C 35日 アイテムB シューズ ブランドD 6月 A 2日 アイテムC パンツ ブランドS 11月 D 182日 … 2. 提案への着想 アイテムの特徴を個々に把握することは非効率 → 類似したアイテムをグルーピングする 膨大なアイテム (常時60万点以上) 多数のブランド (9,000以上) あらゆる 使用状態 ZOZOUSEDのアイテム(販売履歴データ) 9/26
  9. 3. 提案への準備 弱学習器 確率分布 スコア (MLE, etc.) 勾配法を用いてスコアを最大化するようにパラメータを学習 スコアに対数尤度 ℒ

    , を用いた場合: ℒ , ∝ ℒ ()−1ℒ , (1) ℒ = ~ − 2ℒ(, ) (2) :特徴量, :観測データ, :イテレーション数, :確率分布のパラメータ, ℒ , :勾配, ℒ , :自然勾配, ℒ :フィッシャー情報行列 [1] Duan, T., Avati, A., Ding, D. Y., Basu, S., Ng, A. Y., Schuler, A., “NGBoost: Natural Gradient Boosting for Probabilistic Prediction,” https://arxiv.org/abs/1910.03225, 2019. 区間予測が可能なモデル.確率分布を推定して予測を行う. Natural Gradient Boosting (NGBoost) [1] 11/26
  10. 3. 提案への準備 弱学習器 確率分布 スコア (MLE, etc.) 勾配法を用いてスコアを最大化するようにパラメータを学習 [1] Duan,

    T., Avati, A., Ding, D. Y., Basu, S., Ng, A. Y., Schuler, A., “NGBoost: Natural Gradient Boosting for Probabilistic Prediction,” https://arxiv.org/abs/1910.03225, 2019. 区間予測が可能なモデル.確率分布を推定して予測を行う. Natural Gradient Boosting (NGBoost) [1] 推定された分布の期待値を用いて点予測を行う 確率分布が正規分布の場合: 予測値 12/26
  11. 4. 提案手法 販売日数分布を考慮した各出品月における アイテムの適切なプロパー期間の決定 研究目的 Step1) 類似アイテムをグルーピング Step2) グループごとにNGBoostを構築 Step3)

    プロパー期間を決定 ・・・ ・・・ ・・・ グループ① ・・・ グループ① グループ② グループ③ ・・・ 1月 30日 24日 13日 ・・・ 2月 20日 22日 19日 ・・・ グループ② グループ③ 13/26
  12. 4. 提案手法 Step1) 類似アイテムをグルーピング ブランドクラスでアイテムをグルーピング 価格帯を中心として 類似ブランドを分類したクラス(8クラス) ブランドクラス1 ブランドA ブランドB

    ブランドクラス2 ブランドC ブランドD ブランドクラス8 ブランドE ・・・ ブランドF 販売日数分布を考慮した各出品月におけるアイテムの適切なプロパー期間の決定 研究目的 14/26
  13. 4. 提案手法 Step2) グループごとにNGBoostを構築 販売日数分布を考慮した各出品月におけるアイテムの適切なプロパー期間の決定 研究目的 アイテム 特徴量 目的変数 コート

    … 32日 帽子 … 7日 … アイテム 特徴量 目的変数 コート … 15日 シューズ … 2日 … ブランドクラス1 NGBoost1 ブランドクラス8 NGBoost8 ・・・ 15/26
  14. 4. 提案手法 Step3) プロパー期間(日)を決定 販売日数分布を考慮した各出品月におけるアイテムの適切なプロパー期間の決定 研究目的 アイテム 出品月 ・・・ 推定分布

    販売日数 1月 35日 1月 43日 … … ブランドクラスごとに あらかじめ設定 プロパー期間 39日 出品月(1~12月)を固定して, NGBoostを適用 平均 ブランドクラス1 NGBoost1 %点 %点 16/26
  15. 4. 提案手法 Step3) プロパー期間(日)を決定 販売日数分布を考慮した各出品月におけるアイテムの適切なプロパー期間の決定 研究目的 1月 2月 3月 4月

    5月 6月 7月 8月 9月 10月 11月 12月 ブランド クラス1 39 39 39 39 39 38 38 41 41 38 39 39 ブランド クラス2 39 39 39 39 39 38 38 41 41 38 39 39 … ブランド クラス8 39 39 39 39 39 38 38 41 41 38 39 39 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 プロパー 期間 39 39 39 39 39 38 38 41 41 38 39 39 全ブランドクラスに対して同様に算出 17/26
  16. 5.1 分析条件 データ概要 出品期間 :2018年1月1日~2019年11月19日 データ数 :301,129件 モデル構築用(学習データ) :72,007件 プロパー期間決定用(検証データ):229,122件

    特徴量 :出品価格,定価,補助変数(買取価格, 使用状態 etc.) 分析内容 ① 販売日数の予測におけるNGBoostの有用性の検証 ② 販売日数の予測におけるブランドクラスを用いたグルーピングの有用性の検証 ③ 提案手法を用いた適切なプロパー期間の決定 販売履歴データに提案手法を適用し,提案手法の有用性を示す 分析目的 18/26
  17. 5.1 分析条件 販売日数の予測におけるNGBoostの有用性の検証 分析① 分析条件 予測モデル:NGBoost(分布の期待値を用いて予測) 比較手法 :LightGBM[2] 評価指標 :平均平方二乗誤差(比較手法に合わせて点予測での比較)

    販売日数の予測におけるブランドクラスを用いたグルーピングの有用性の検証 分析② 分析条件 グルーピング方法:ブランドクラス 比較手法 :ZOZOUSEDの現行のルール 評価指標 :対数損失 [2] Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., Liu, T. Y., “LightGBM: A Highly Efficient Gradient Boosting Decision Tree,” In Advances in Neural Information Processing Systems, 2017. 19/26
  18. 5.1 分析条件 提案手法を用いた適切なプロパー期間の決定 分析③ 分析条件 予測モデル :NGBoost イテレーション数 :500 事前分布

    :指数分布 グルーピング方法:ブランドクラス プロパー期間決定のパラメータ :プロパー期間内に販売したいアイテム割合 ブランドクラス 1 2 3 4 5 6 7 8 68 59 49 45 46 43 35 61 表:ブランドクラスごとのパラメータ 20/26
  19. 5.2 分析結果 ブランド クラス 学習データ テストデータ NGBoost Lightgbm NGBoost Lightgbm

    1 22.73 23.77 26.76 27.53 2 29.01 30.40 29.12 30.46 3 23.38 23.98 24.57 25.75 4 21.14 21.50 13.85 14.74 5 16.03 16.03 12.94 13.98 6 15.92 15.95 12.87 13.83 7 10.20 12.44 14.43 14.39 8 14.59 15.20 12.16 12.91 販売日数の予測にはNGBoostを適用することが有用 ① 販売日数の予測におけるNGBoostの有用性の検証 表:各手法による学習時とテスト時の平均平方二乗誤差(RMSE) 太字は精度の高い手法 21/26
  20. 5.2 分析結果 グルーピング方法 対数損失 ブランドクラス 3.75 現行のルール 3.89 販売日数の予測にはブランドクラスでグルーピングすることが有用 ②

    販売日数の予測におけるブランドクラスを用いたグルーピングの有用性の検証 表:グルーピング方法によるテストデータに対する対数損失 太字は精度の高い方 22/26
  21. 5.2 分析結果 ③ 提案モデルを用いた適切なプロパー期間の決定 ブランド クラス 1月 2月 3月 4月

    5月 6月 7月 8月 9月 10月 11月 12月 1 39 39 39 39 39 38 38 41 41 38 39 39 2 58 63 71 64 57 59 59 58 57 58 58 58 3 34 42 37 32 30 34 34 34 34 41 35 34 4 22 29 23 22 22 22 22 22 22 24 22 22 5 19 32 19 19 19 19 19 19 19 22 21 19 6 18 32 18 18 16 18 18 18 18 19 20 18 7 14 14 14 14 12 14 14 14 14 16 14 14 8 24 26 25 25 24 24 24 24 24 24 24 24 23/26
  22. 5.2 分析結果 ③ 提案モデルを用いた適切なプロパー期間の決定 ブランド クラス 1月 2月 3月 4月

    5月 6月 7月 8月 9月 10月 11月 12月 1 39 39 39 39 39 38 38 41 41 38 39 39 2 58 63 71 64 57 59 59 58 57 58 58 58 3 34 42 37 32 30 34 34 34 34 41 35 34 4 22 29 23 22 22 22 22 22 22 24 22 22 5 19 32 19 19 19 19 19 19 19 22 21 19 6 18 32 18 18 16 18 18 18 18 19 20 18 7 14 14 14 14 12 14 14 14 14 16 14 14 8 24 26 25 25 24 24 24 24 24 24 24 24 プロパー期間 長い 短い 販売単価 高い 低い ZOZOUSED: 販売単価が高いアイテムは サイトに長く掲載しておきたい → サイトの魅力度の 観点においても適切 24/26
  23. 参考文献 [1] Duan, T., Avati, A., Ding, D. Y., Basu,

    S., Ng, A. Y., Schuler, A., “NGBoost: Natural Gradient Boosting for Probabilistic Prediction,” https://arxiv.org/abs/1910.03225, 2019. [2] Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., Liu, T. Y., “LightGBM: A Highly Efficient Gradient Boosting Decision Tree,” In Advances in Neural Information Processing Systems, 2017. 26/26
  24. 付録. 研究背景と目的 実績データを分析すればよいのではないか 出品価格 カテゴリ 出品月 コンディション 販売日数 アイテムA 3,400

    デニム 11 A … 30 アイテムB 900 コート 11 B … 6 アイテムC 8,000 シューズ 11 D … 22 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 多様な変数によって ばらつきが生じている 可能性 正確な比較ができない 分析するデータ数が減る ⇒ 出品条件ごとにアイテムを分割し,販売日数を比較 実績データを分析しても最適なプロパー期間とは言えない 販売日数に強く寄与している特徴量を特定したい 販売日数に寄与していない特徴量は除外したい ⇒ 28/26
  25. 付録. 分析条件 使用変数 説明 出品価格(1) アイテムを出品した際の初期価格 定価(1) 新品の状態での出品価格 買取価格(1) ユーザからアイテムを買い取る際の価格

    性別(2) アイテムの性別(女性用 or その他) 出品月(11) アイテムを出品した際の月 コラボ(1) コラボ商品かどうか 使用状態(5) アイテムの使用状態 初回出品からの日数(1) 初回の出品(新品)からの経過日数 販売日数の増減(4) 前回の販売日数に比べて増えたか減ったか 前回販売日数(4) 以前販売された際の販売日数(4回分) 表. 使用変数 30/26