SizeFlags: Reducing Size and Fit Related Returns in Fashion E-Commerce

SizeFlags: Reducing Size and Fit Related Returns in Fashion E-Commerce
KDD2021 参加報告&論文読み会兵頭亮介 #kdd2021_yomikai

自己紹介兵頭亮介 @onysuke 　2021年新卒, データサイエンティスト　小売領域における分析を担当小売DX採用サイト | 株式会社サイバーエージェント
興味 • 機械学習を用いた意思決定支援及び産業応用最近の話 • Notion（+ Fruition）で個人ページ作りました https://hyodo.tokyo 2

概要 SizeFlags: Reducing Size and Fit Related Returns in Fashion
E-Commerce 背景 • ファッションECにおける返品は顧客体験や収益性に深刻な影響をもたらす手法 • 顧客による返品データを用いてサイズ選択を支援するモデル SizeFlags を提案 ◦ 専門家のフィードバックや画像情報を事前知識として組み込むことが可能結論 • A/Bテスト及びプロダクション環境での継続的な評価により、提案手法による情報提示がサイズに起因する返品を削減することを示した 3

ファッションECにおける返品 ECのうち、特にファッションECは返品率が25~40%と高い [Mostard+, 2003] 代表的な返品理由として “サイズやフィット感の悪さ” があげられる 4 Consumers' common
return reason? Wrong color, size or ﬁt

返品率の増加がもたらす影響 5 • 収益性の低下 • 顧客体験の悪化 • 配送による温室効果ガス排出量増

本研究：顧客ごとにパーソナライズせず商品自体のサイズ感の情報を提示する　　　顧客の意思決定支援という立場、情報提示にとどめることで自然な顧客体験をつくる関連研究や事例 6 サイズをパーソナライズするアプローチ（顧客に着目） • 注文履歴を用いてサイズが正規化された潜在空間を学習 [Du+, arXiv2019]
• 注文履歴を元に顧客に適したサイズ自体を予測 [Abdul+, RecSys2019, ...] 　一方で、レコメンドされたサイズが注文されない現象が報告 [Vecchi+, B&MReview2015] 　　　　　顧客体験ではなく予測サイズの精度のみで評価されている問題 [Guigourès+, RecSys2018] 返品自体に制限をかけるアプローチ • 返品の禁止、追加料金の導入、再注文の停止

本研究の貢献 1. 顧客より得られる主観的な返品データを用いて、商品のサイズ感を判定するフレームワークSizeFlagsを提案 2. 事前情報として専門家のフィードバックと商品画像情報を組み込むことで、日々新商品が登場するファッションECにおけるコールドスタート問題に対処 3. プロダクション環境でのA/Bテストと継続調査による顧客体験の評価 7

やりたいこと 8 大きめ小さめふつうこの商品のサイズ感は {} です。論文に掲載されていないためイメージ図 https://en.zalando.de/

size issue ﬂag 問題設定の整理 9 ある期間、カテゴリ C の商品 a
が “大きすぎる” (“小さすぎる”) かどうかを判定カテゴリ C ⊂ C_all （例. jeans）商品 a ∈ C （例. relaxed ﬁt jeans）大きめふつう

手法の概要 10

Binomial Likelihood 11

Binomial Likelihood ここで、商品 𝑎 のサイズに関連する返品率：srr(a) = k / n カテゴリCの商品の返品率の平均値：π
= mean({srr(a)}_a∈C) 商品 𝑎 における合計 𝑛 件の注文のうち、サイズに関連した返品を 𝑘 件観測する確率を二項分布でモデル化 12 データ • 商品毎の注文数 𝑛 • 商品毎の”サイズが大きい（小さい）”という理由の返品数 𝑘 ssr: size-related return rate

商品ごとに size issue ﬂag を判定 13

*閾値 θ の決め方はappendix参照 **平均値 π と同様に標準偏差 σ を算出 σ =
std({srr(a)}_a∈C) 2項分布の尤度とカテゴリ内返品率との差に基づき“サイズに問題がある商品かどうか”判定商品ごとに size issue ﬂag を判定 14 カテゴリ内返品率との差** srr(a) < π+σ: サイズに問題なし srr(a) ≧ π+σ: サイズに問題あり 2項分布の負の対数尤度* s < θ: サイズに問題なし s ≧ θ: サイズに問題あり size issue ﬂag の判定条件

ここまでのアプローチの課題コールドスタート問題 ◦ 注文数 n と返品数 k が少ない場合に size-issue-ﬂag が安定しない
　 15

事前情報をモデルに組み込むことで対処コールドスタート問題 ◦ 注文数 n と返品数 k が少ない場合に size-issue-ﬂag が安定しない
　 16 画像情報専門家のフィードバック 🗣

事前情報の導入 17

事前情報の導入事前分布にベータ分布を用いた場合、尤度は事後分布は次のようになる size issue ﬂag の判定条件：p14 (4)式の更新版 18

事前情報の導入事前分布のパラメータ (α, β) は商品毎に設定する 1. 専門家のフィードバック a. 通常体型のファッションモデルに {‘certain
size issue’, ‘potential size issue’, ‘good ﬁt’} を尋ねる b. 集計結果をもとに (α, β) を設定※ 2. 画像情報 a. 商品画像をSizeNet（サイズ問題有無を予測するCNN）[Karessli+, CVPRW2019] に入力 b. 出力されたスコアをもとに (α, β) を設定※ 　　　※（α, β）の具体的な算出方法は言及されておらず 19

実験 20 実験1. A/Bテスト　提案手法による情報提示が返品率にもたらす効果を検証実験2. 継続評価　一部の顧客に継続的に悪影響を与えうるA/Bテストを用いず、DIDを用いて評価

モデル名の一覧 21 モデル名注文&返品データ事前分布あり/なし専門家のフィードバック画像情報
閾値最適化 Appendix p35 V0 ✔ なし Vhf なし ✔ Vbase ✔ あり ✔ Vsn ✔ あり ✔ ✔ Vth ✔ あり ✔ ✔ SizeFlags ✔ あり ✔ ✔ ✔

実験1. A/Bテスト：V0 22 カテゴリ靴衣類全般モデル V0：p14 (4)式の判定条件サンプルサイズ※
(treatment : control) 720,000:720,000 180,000:180,000 ※ユーザ単位表. 実験設定

靴衣類全般サイズ関連返品率 E[srr(tre) - srr(con)] 全体 -3.8% - “小さい”商品
- -4.3% “大きい”商品 - -6.6% 情報提示によりサイズに関連する返品率を3~6%削減 23 結果が部分的に報告されている一方、サイズ予測でSOTAな既存手法 [Guigourès+, RecSys2018] では有意差なし（appendix p37）

実験2. 継続評価 Nearest Neighbor Diﬀerence-in-Diﬀerence（DID）[Heckman+, 1997] 　Ω_T, Ω_C：提案手法によるサイズ情報提示 {あり, なし}
の商品群　ここで、Ω_T と Ω_C のssr（サイズ関連返品率）は平行トレンドにあることを確認　Ω_C のうち、商品 a ∈ Ω_T と近い k個の商品群を Ω_C* とする（実験では k=10）　ここで、商品間の距離は以下の特徴量のユークリッド距離から算出する 1. 返品率 2. 商品価格 3. 割引率 4. 返品理由が”不明”の返品率 24 Ω_T Ω_C Ω_C* a

実験2. 継続評価 Nearest Neighbor Difference-in-Difference（DID）[Heckman+, 1997] 介入時点を t_flag(a) ：商品aのページで提案手法による情報提示が開始された時点とする
ここで、DIDを用いて平均効果は以下のように計算される 25 画像URL https://stats.stackexchange.com/questions/564/what-is-difference-in-differences t_flag(a) a∈Ω_T Ω_C* 介入前の返品率の差介入後の返品率の差 srr: サイズ関連返品率

継続評価：Vbase Vbase：専門家のフィードバックを事前分布に組み込んだモデル 26 カテゴリサイズ関連返品率商品あたり削減された平均返品数靴 -5.65% 2.29
衣類全般 -5.01% 1.50 • A/Bテストの結果”返品率を3~6%削減”（p23）と同程度の結果が得られた • avg. returns saved / article (“商品あたり削減された平均返品数”) について特に言及されず ◦ 返品数でみるとインパクトが小さいような気もする表. DIDを用いたVbaseモデルの評価結果

継続評価：Vth, Vsn, SizeFlags 2020年はじめに衣類全般カテゴリにおいて3つのモデルを同時に評価 27 図. Vbaseモデルと比較して削減した返品数の割合閾値調整と画像情報
を組み合わせた SizeFlags がバランスよく効率的 2020/04に14カ国にロールアウト明らかにサイズに問題がある商品全商品

• 手法自体の技術的な新規性というより、 ◦ 解くべき課題に対してアプローチ ◦ プロダクト上でA/Bテスト・継続的に重要指標を評価したことが評価されたのかなという印象 • 単純にレビュー評価の集計結果を提示した場合との比較が気になった ◦
意思決定支援という観点では、断定的にラベルを提示するより集計結果を提示するほうが良さそう • 使えるデータの量/種類によるものの、やはり“顧客毎にサイズを推薦する” アプローチの方が顧客体験が良さそう ◦ 例えばユニクロは身長等に加えて好みの着用感（主観的情報）を入力させてサイズを推薦している（appendix p33） ◦ ただし実装コスト対効果を検討する必要あり所感 28

まとめ背景 • ファッションECにおける返品は顧客体験や収益性に深刻な影響をもたらす手法 • 顧客による返品データを用いてサイズ選択を支援するモデル SizeFlags を提案 ◦
専門家のフィードバックや画像情報を事前知識として組み込むことが可能結論 • A/Bテスト及びプロダクション環境での継続的な評価により、提案手法による情報提示がサイズに起因する返品を削減することを示した 29 @onysuke

Appendix 30

背景欧州大手のアパレルEC 31 from Supplemental Material https://dl.acm.org/doi/10.1145/3447548.3467160

他社事例　ユニクロ：MySize ASSIST 32 https://www.uniqlo.com/jp/ja/contents/mysize-assist/

SizeNet [Karessli+, CVPRW2019] slide, paper 33 https://project.inria.fr/usad/ﬁles/2019/07/SizeNet-FFSS-USAD-Talk.pdf size issue, no-size
issue ラベルの2値分類。2項分布の負の対数尤度に基づく重み付き損失で学習

Threshold Optimization size-issue-flagについて保守的な（十分大きい） θ_max = -log(ε_min) を初期値として、以下を満たす閾値 θ*
を算出する 34 ここで、N(C, θ)はパラメータθのときsize-issue-flagが立った商品数　　　　S(C, θ)は該当期間で値が変化しないsize-issue-flagが立った数（安定性）　　　　実験では (ε_1, ε_2, ε_3) = (0.2, 0.05, 1.5) 不安定なフラグ数 N(C, θ) - S(C, θ) を一定以下にする制約のもとで、できるだけ小さい閾値を算出

size-issue-ﬂagの判定条件の閾値 θ > 0 と πのとりうる範囲 Π ⊂ [0, 1]
が与えられたとき、次のようにして算出ベータ分布のパラメータ α, β の範囲 35 ここで、p0は n=0, k=0 となるエッジケースの負の対数尤度例. Π = [0.08, 0.3], θ = 15 の場合

モデル名の一覧 36

結果既存手法のベンチマーク A/BテストによりSOTAである既存手法 [Guigourès+, RecSys2018] を検証顧客毎に適切なサイズをパーソナライズするアプローチ（treatment:control = 300k:300k）
37 cv率カートに追加された商品数訪問あたりの利益サイズ関連返品率 +2.1% +1.8% +2.1% <0.5% 購買に関連する各指標は改善したものの、サイズ関連返品率は統計的に有意な差が見られなかった

結果継続評価：Vhf Vhf：専門家のフィードバックの集計値をラベルにしたもの 38 カテゴリサイズ関連返品率商品あたり削減された返品数の平均靴 -4.40%
5.68 繊維製品 -8.15% 5.87 ファッションモデルによるフィードバックにより、4~8%返品率削減

課題：サイズとフィット感の問題が ”大きすぎ”, “小さすぎ” といった粗い定義 • モデルの拡張 ◦ 多項分布 & ディリクレ分布
▪ より細分化した定義（ex. お尻周りがきつい, 袖が長い）を扱う ◦ 追加情報を用いる ▪ 商品毎のサイズ指標今後の展望 40

SizeFlags: Reducing Size and Fit Related Return...

SizeFlags: Reducing Size and Fit Related Returns in Fashion E-Commerce

More Decks by hyodo

Featured

Transcript