Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

uplift modeling

Avatar for jeey jeey
January 05, 2022

uplift modeling

Avatar for jeey

jeey

January 05, 2022
Tweet

More Decks by jeey

Other Decks in Technology

Transcript

  1. 1郚 1Uplift Modelingずは 1-1. 目的 1-2. A/Bテスト 1-3. A/Bテストの問題点 1-4.

    Uplift Modelingによる解決 1-5. ぀のセグメント 2Uplift Modelingの具䜓的手法 2-1. 党䜓のフロヌ 2-2. モデル構築結果解釈のフロヌ 2-3. 予枬結果の解釈 2-4. 問題点
  2. 1-1. Uplift Modelingずは  目的 ある斜策が本圓に効果があるのかを怜蚌したいずきに䜿甚される機械孊習の手法 できるこず 因果掚論の芳点では  斜策の本圓の効果がわかる ビゞネスの芳点では 

    斜策を効率化し、斜策の効果を増幅するこずができる 機械孊習技術の芳点では  デヌタからパタヌンを芋出し、ある特定のクラスタに分けるこずができる むンプットアりトプットの芳点では  A/Bテストの結果をむンプットずし、斜策の察象候補を䞀郚に絞った結果をアりトプットずな る
  3. 1-1. Uplift Modelingずは  目的 【実䟋】 • USバンク アメリカ最倧の地方銀行 適甚䟋

    • 斜策䜏宅担保ロヌン口座開蚭のダむレクトメヌルを既存の顧客に送る 実瞟 • 投資回収率ROIは以前の販促掻動の倍増→ • 販促経費を削枛 • 増収以䞊 ・ 『ダバい予枬孊 「䜕を買うか」から「い぀死ぬか」たであなたの行動はすべお読たれおいる』 ゚リック・ シヌゲル (著)、矢矜野 薫 (翻蚳) 、CCCメディアハりス、2013幎、241-243p
  4. 1-1. Uplift Modelingずは  目的 ・ 『ダバい予枬孊 「䜕を買うか」から「い぀死ぬか」たであなたの行動はすべお読たれおいる』 ゚リック・ シヌゲル

    (著)、矢矜野 薫 (翻蚳) 、CCCメディアハりス、2013幎、241-243p DMを送るず口座開蚭しおくれやすい客 ・ロヌン契玄しおいる17.3%以䞊返枈枈 ・リボ払い枠を9%以䞊䜿っおいる ・特定のラむフスタむルを持っおいる USバンク この顧客集団を芋぀けられる
  5. 1-2. Uplift Modelingずは  A/Bテスト テスト察象を統制矀ず実隓矀に分け、実隓矀のみに介入行為を行い、それぞれの矀の反応の差から介 入の効果を蚈る 䟋 ある通販䌚瀟で、商品Aを売りたいずきに、DMを送っお販促を行いたい このずき、A/Bテストを甚いるずするず 

    介入行為DMを送るこず 反応 商品Aを買うこずコンバヌゞョン 実隓矀 DMを送る顧客 統制矀 DMを送らない顧客 効果 反応の差商品Aを買う顧客がどれだけ増えたか
  6. 1-2. Uplift Modelingずは  A/Bテスト テスト察象を統制矀ず実隓矀に分け、実隓矀のみに介入行為を行い、それぞれの矀の反応の差から介 入の効果を蚈る 統制矀 実隓矀 DM無送付

    DM送付 賌入者数 DM無送付 DM送付 賌入者数 DM無送付 DM送付 賌入者数 男 性 女 性 本圓の効果はこうだったかもしれない 男性には賌入率を4倍に抌し䞊げる効果があり 女性には賌入率を1/4に抌し䞋げる効果があった
  7. 1-4. Uplift Modelingずは  Uplift Modelingによる解決 Uplift Modelingでは、同䞀の察象に察しおテストを疑䌌的に行うこずによっお、玔効果を予枬する 同 侀

    察 象 に 察 し お テ ス ト で き る 察 象 間 の 比 范 が で き る 倉 数 に 察 す る 反 応 が 評 䟡 で き る 箔 効 果 が わ か る
  8. 2-1. Uplift Modelingの具䜓的手法 ヌ 党䜓のフロヌ 斜策策定 介入行為ず介入察象を決める A/Bテストを行う 分析 モデル構築

    介入候補に察する予枬 結果の解釈介入候補から介入察象を決める 実行 介入を実行する 介入の結果を蚈枬する
  9. 2-3. Uplift Modelingの具䜓的手法 ヌ 結果の解釈 暪軞にuplift score、瞊軞にliftをずったグラフを解釈する 1.Uplift score デヌタ個別の介入の効果

    2. lift デヌタ党䜓の介入の効果 介入察象を決めるための指暙 3.AUUC Base lineずliftの間の面積 モデルの評䟡指暙
  10. ID 確率 A 0.3 B 0.2 C 0.5 D 0.9

    
 ID 確率 A 0.3 B 0.8 C 0.1 D 0.9 
 2-3. Uplift Modelingの具䜓的手法 ヌ 結果の解釈 uplift scoreは、介入による効果の指暙 ID score A 1 B 0.25 C 5 D 1 
 ÷  uplift score = 𝑝 𝑟 = 1 𝑥; 𝑡𝑟𝑒𝑎𝑡 𝑝 𝑟 = 1 𝑥; 𝑐𝑜𝑛𝑡𝑟𝑜𝑙 = 介入ありの反応確率 介入なしの反応確率 𝑀ℎ𝑒𝑟𝑒 𝑟 ቊ 1 𝑖𝑓 𝑡𝑎𝑟𝑔𝑒𝑡 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑑 0 𝑜𝑡ℎ𝑒𝑟𝑀𝑖𝑠𝑒 介入によっお反応確率 が䜕倍になったか  倍
  11. 2-3. Uplift Modelingの具䜓的手法 ヌ 結果の解釈 Liftは、そのデヌタのスコア以䞊のデヌタ矀党おに介入するず増える环積反応数を瀺す あるランクのリフトは以䞋の匏で瀺される 𝐿𝑖𝑓𝑡𝑟𝑎𝑛𝑘 = σ

    𝑖=1 𝑟𝑎𝑛𝑘 𝑟𝑖 𝑥𝑖 ; 𝑡𝑟𝑒𝑎𝑡 𝑛 𝑥𝑟𝑎𝑛𝑘 𝑡𝑟𝑒𝑎𝑡 − σ 𝑖=1 𝑟𝑎𝑛𝑘 𝑟𝑖 𝑥𝑖 ; 𝑐𝑜𝑛𝑡𝑟𝑜𝑙 𝑛 𝑥𝑟𝑎𝑛𝑘 𝑐𝑜𝑛𝑡𝑟𝑜𝑙 ⋅ 𝑛 𝑥𝑟𝑎𝑛𝑘 𝑡𝑟𝑒𝑎𝑡 n Xrank = count X up to rank 𝑟 ቊ 1 𝑖𝑓 𝑡𝑎𝑟𝑔𝑒𝑡 𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑒𝑑 0 𝑜𝑡ℎ𝑒𝑟𝑀𝑖𝑠𝑒 あるランク のlift そのランクの スコア以䞊の 実隓矀の 反応率 そのランクの スコア以䞊の 統制矀の 反応率 そのランクの スコア以䞊の 実隓矀の 総数 介入したこずにより増えた反応率 ヌ ×  文章では以䞋の通り
  12. 2-3. Uplift Modelingの具䜓的手法 ヌ 結果の解釈 Liftは、そのデヌタのスコア以䞊のデヌタ矀党おに介入するず増える环積反応数を瀺す ID Rank Score is_treat

    is_cv Lift B 1 5 0 0 0 E 2 3 1 1 1 A 2 1 0 1 0.5 D 3 1 1 0 0 C 4 0.25 0 1 -0.32 ID T cnt T cv C cnt C cv T cvr C cvr Lift 蚈算匏 (Tcvr – Ccvr) * tcnt B 0 0 1 0 0 0 (0-0)*0=0 E 1 1 1 0 1 0 (1-0)*1=1 A 1 1 2 1 1 0.5 (1-0.5)*1=0.5 D 2 1 2 1 0.5 0.5 (0.5-0.5)*2=0 C 2 1 3 2 0.5 0.66 (0.5-0.66)*2=-0.32
  13. 2-3. Uplift Modelingの具䜓的手法 ヌ 結果の解釈 base lineは、ランダムにその割合たでのデヌタに介入した堎合の想定Lift base lineは、スコア最高倀のデヌタのLiftを0ずしお、最埌のデヌタのリ フトに䞀臎するような傟きの盎線青線

    𝑓 𝑟𝑎𝑛𝑘 = 𝐿𝑖𝑓𝑡𝑁 𝑁 ∙ 𝑟𝑎𝑛𝑘 最埌のデヌタの リフトに察する 1デヌタの 増加率 ランク × 暪軞をランク→スコアにするず、曲線になる
  14. Two Model Approachの問題点 そしお、モデルの構造にも問題があり、珟実の問題でうたくいくこずは皀 Two Model Approachにおいお、各モデルの目的はアップリフトの予枬ではなく、各 モデルに割り圓おられた矀の反応の予枬 反応が介入より他の倉数に埓う堎合には、その倉数を重芖しお反応を予枬をするよう なモデルになる

    この堎合、反応の予枬がアップリフトの予枬に぀ながらない ぀たり、介入の効果を無芖しがちなモデルになる そしお、実は珟実の問題はほずんどそうである Nicholas J. Radcliffe & Patrick D. Surry (2011) “Real-World Uplift Modelling with Significance-Based Uplift Trees“, p16-17
  15. Two Model Approachの問題点 Two Model Approachは、介入より倧きい効果があるず無芖しがちになる 0 800 0.8 介入の

    特城量 䞻効果の 特城量 反応確率 1 800 0.801 Two Model Approach 介入効果の差が 芋えない 僅かな特城量を無芖する 珟実では反応に察する䞻効果よりも介入による効果のほうが小さいこずがほずんど 䟋飲食店クヌポンより、料理の奜みや店舗ぞの距離など 電化補品CMでよく流れるかより、倀段や性胜など など  差が わからない (0)
  16. Two Model Approachの問題点 One Model Approachは、介入効果の差を考慮できる 0 800 0.8 介入の

    特城量 䞻効果の 特城量 反応確率 1 800 0.801 1 800 0.801 0 800 0.8 Two Model Approach One Model Approach 介入効果の差が 芋えない 僅かな特城量を無芖する 考慮できる 介入効果の差がわかる 差が わからない (0) 差が わかる (0.001) 0.001
  17. Two Model Approachの問題点 One Model Approachならこれらの問題を解決できる Two Model Approachの問題 ・モデルのパラメヌタチュヌニングが困難

    ・モデルの解釈が困難 ・介入より倧きい効果があるず無芖しがちになる → One Model Approachならすべお解決できる
  18. 掟生モデルの類型ず目的 Two Model Approach Mouloud Belbahri , Alejandro Murua, Olivier

    Gandouet, and Vahid Partovi Nia, “Uplift Regression: The R Package tools4uplift” 2019 Yuta Saito, Hayato Sakata and Kazuhide Nakata, ”Doubly Robust Prediction and Evaluation Methods Improve Uplift Modeling for Observational Data” 2019, p468-469 ・回垰モデル CVT(Class Variable Transformation) ・決定朚モデル DTUM(Decision Tree Uplift Model) SBUT(Significance-Based Uplift Tree) DBUT(Divergence-Based Uplift Tree) URF(Uplift Random Forest /ensembled DTUM) CTS(Contextual Treatment Selection) ・SVMモデル Uplift Support Vector Machine One Model Approach ・TOT/TOM (Transform Outcome (Tree) Method) ・SDRM(Switch Doubly Robust Method) ・CCIT/CCIF(Causal Conditional Inference Tree/Forests) 前述の問題の解決 A/Bテスト以倖の デヌタを䜿えないか Causal Conditional Inference Uplift Modeling
  19. 回垰モデル ヌ Class Variable Transformation 目的倉数を倉圢し、Upliftそのものを予枬する 倉圢 介入 反応 1

    1 1 0 0 1 0 0 介入を考慮した 反応倀 ? ? ? ? 介入ずいう区別をなくすず、介入ありの反応ず介入なしの反応の区別が぀かない 介入を考慮した反応倀に倉圢する必芁がある
  20. 回垰モデル ヌ Class Variable Transformation 孊習フェヌズ目的倉数を倉圢し、䞀぀のモデルで孊習する Two Model Approach Class

    Variable Transformation 実隓矀 モデル 統制矀 モデル 実隓矀 統制矀 倉圢 å­Šç¿’
  21. 回垰モデル ヌ Class Variable Transformation 予枬フェヌズ予枬結果を倉圢し、Upliftそのものを導出する ID 確率 A 0.3

    B 0.2 C 0.5 D 0.9 
 ID 確率 A 0.3 B 0.8 C 0.1 D 0.9 
 ID score A 0 B -0.6 C 0.4 D 0 
 -  Two Model Approach Class Variable Transformation ID 確率 A 0.5 B 0.8 C 0.7 D 0.5 
 ID score A 0 B -0.6 C 0.4 D 0 
 倉圢 予枬 CV率0.4% アップ
  22. 回垰モデル ヌ Class Variable Transformation では、どうやっお目的倉数を倉圢するか 介入効果 (Treatment Effect)を盎接予枬する 䞋匏のように定矩

    𝑇𝐞𝑖 = 𝑃 𝑌𝑖 = 1 𝑋1 
 𝑋𝑚 , 𝐺 = 𝑇 − 𝑃 𝑌𝑖 = 1 𝑋1 
 𝑋𝑚 , 𝐺 = 𝐶 ある察象の ある察象の 介入効果 介入ありの反応確率 ヌ 介入なしの反応確率 Notation: サンプル集合N 特城量ベクトル Xi1 
 Xim ∈ R 反応Yi ∈ {0,1} 介入Gi ∈ {T, C} https://qiita.com/usaito/items/af3fa59d0ee153a70350 M Jaskowski, S Jaroszewicz2012”Uplift modeling for clinical trial data”
  23. 回垰モデル ヌ Class Variable Transformation 以䞋のような倉数Zを導入し、これを目的倉数ずする 介入ありの反応ありor介入なしの反応なしが1、それ以倖が0 説埗可胜に思われるデヌタを1にしおいる 𝑍𝑖 ቐ

    1 𝑖𝑓𝐺𝑖 = 𝑇 𝑎𝑛𝑑 𝑌𝑖 = 1 1 𝑖𝑓𝐺𝑖 = 𝐶 𝑎𝑛𝑑 𝑌𝑖 = 0 0 𝑜𝑡ℎ𝑒𝑟𝑀𝑖𝑠𝑒 このずき、TE介入効果を䞋匏で衚すこずができる匏倉圢埌述 𝑇𝐞𝑖 = 2𝑃𝑖 𝑍𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 − 1
  24. 𝑇𝐞𝑖 = 2𝑃𝑖 𝑍𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 −

    1 𝑍𝑖 ቐ 1 𝑖𝑓𝐺𝑖 = 𝑇 𝑎𝑛𝑑 𝑌𝑖 = 1 1 𝑖𝑓𝐺𝑖 = 𝐶 𝑎𝑛𝑑 𝑌𝑖 = 0 0 𝑜𝑡ℎ𝑒𝑟𝑀𝑖𝑠𝑒 回垰モデル ヌ Class Variable Transformation 党䜓の流れ 実隓矀 統制矀 倉圢 å­Šç¿’ 予枬 ID 確率 A 0.5 B 0.8 C 0.7 D 0.5 
 ID score A 0 B -0.6 C 0.4 D 0 
 倉圢
  25. 回垰モデル ヌ Class Variable Transformation 𝑃𝑖 𝑍𝑖 = 1 𝑋𝑖1

    
 𝑋𝑖𝑚 = 𝑃 𝑍𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝑇 𝑃 𝐺𝑖 = 𝑇 𝑋𝑖1 
 𝑋𝑖𝑚 +𝑃 𝑍𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝐶 𝑃 𝐺𝑖 = 𝐶 𝑋𝑖1 
 𝑋𝑖𝑚 = 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺 = 𝑇 𝑃 𝐺𝑖 = 𝑇 𝑋𝑖1 
 𝑋𝑖𝑚 +𝑃 𝑌𝑖 = 0 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺 = 𝐶 𝑃 𝐺𝑖 = 𝐶 𝑋𝑖1 
 𝑋𝑖𝑚 = 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝑇 𝑃 𝐺𝑖 = 𝑇 +𝑃 𝑌𝑖 = 0 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝐶 𝑃 𝐺𝑖 = 𝐶 = 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝑇 𝑃 𝐺𝑖 = 𝑇 + 1 − 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝐶 𝑃 𝐺𝑖 = 𝐶 = 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝑇 ⋅ 1 2 + 1 − 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝐶 ⋅ 1 2 2𝑃𝑖 𝑍𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑛 = 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺 = 𝑇 + 1 − 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺 = 𝐶 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺 = 𝑇 − 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺 = 𝐶 = 2𝑃𝑖 𝑍𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 − 1 𝑇𝐞𝑖 = 2𝑃𝑖 𝑍𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 − 1 党確率の法則による倉圢 Z=1のずき、介入ありの反応あり OR 介入なしの反応なし ぀たり、G=TのずきY=1 OR G=CのずきY=0 1.ランダム化の仮定 介入の有無が倉数に䟝存しなくなるため 𝑃 𝐺𝑖 𝑋𝑖1 
 𝑋𝑖𝑚 = 𝑃 𝐺𝑖 より 2.実隓矀ず統制矀の割合が同じである仮定 𝑃 𝑌𝑖 = 0 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝐶 = 1 − 𝑃 𝑌𝑖 = 1 𝑋𝑖1 
 𝑋𝑖𝑚 , 𝐺𝑖 = 𝐶 より P Gi = T = P Gi = C = 1 2 より 䞡蟺に2を掛けるず、1/2が消える 移行しお敎理するず、巊蟺がTEの圢になる 匏倉圢
  26. 決定朚モデル  SBUT 決定朚のアップリフトモデリング党䜓の抂芳 Nicholas J. Radcliffe & Patrick D.

    Surry (2011) “Real-World Uplift Modelling with Significance-Based Uplift Trees “ ・Upliftの差が倧きくなるようにノヌドを 分割できる説明倉数ず氎準を遞択し、ノヌ ドを分割しおいく ・ノヌドそれぞれでUpliftを蚈算する ・Upliftの差を蚈る分割基準は耇数提案さ れおいる Uplift5% Uplift=1% Uplift=14% X > 5 å­Šç¿’ ・䜜成した決定朚にデヌタを入力し、 所属したノヌドのUpliftを予枬倀ずする 予枬
  27. 決定朚モデル  SBUT 情報利埗蚈算ルヌプ開始 条件倉数ず氎準の 組み合わせの数すべお デヌタ 倉数ず氎準を 決定し、分割情 報を付䞎

    線圢回垰モデル を構築 情報利埗を蚈算 ルヌプ終了 ノヌド分割ルヌプ開始 ノヌド分割ルヌプ終了 情報利埗蚈算 情報利埗が 最も倧きい基準 でノヌド分割 終了 開始 情報利埗蚈算 分割埌ノヌドの Upliftを蚈算
  28. 決定朚モデル  SBUT ある倉数ず氎準を決め、二぀のノヌドに分割する それぞれのデヌタに察しお、右ノヌドか巊ノヌドかの 倉数を付䞎する 以䞋の線圢予枬子を持぀線圢回垰モデルを構築する 入力デヌタはこの線圢モデルにあわせる圢で成圢する 𝑝𝑖𝑗 =

    ÎŒ + α𝑖 + β𝑗 + γ𝑖𝑗 *notation 𝑝反応確率 𝑖介入の有無 𝑇: 1 𝐶: 0 𝑗分割先 𝑅: 1 𝐿: 0 Όバむアス項 α介入の有無 β分割先 γ介入ず分割の亀互䜜甚項 䞊蚘亀互䜜甚項γ𝑇𝑅 のt怜定量の二乗倀を蚈算し、 これをこの分割の情報利埗ずする 情報利埗蚈算ルヌプ開始 条件倉数ず氎準の 組み合わせの数すべお 1.倉数ず氎準を 決定 分割情報を付䞎 2.線圢回垰 モデルを構築 3.情報利埗を 蚈算 ルヌプ終了 情報利埗蚈算
  29. 決定朚モデル  SBUT 亀互䜜甚項γ𝑇𝑅 は、分割による巊右のノヌド・同ノヌドの介入有無のグルヌプのアップリフトの差を 説明する項ずなる α is_R β is_T

    γ α*β E[cv] p 0 0 0 0.005 0 1 0 0.015 1 0 0 0.03 1 1 1 0.17 5% 1% 14% X > 5 TL: 1.5% CL: 0.5% TR: 17% CR: 3% α/β/γに぀いお集 蚈 α is_R β is_T γ α*β is_cv 0 0 0 1 0 1 0 0 1 0 0 0 1 1 1 1 
 CL TL CR TR γ𝑇𝑅 TRずそれ以倖のグルヌプずのUplift の差を説明する項 TRのみ1になる 𝑝𝑖𝑗 = ÎŒ + α𝑖 + β𝑗 + γ𝑖𝑗 に入力するデヌタ
  30. 決定朚モデル  SBUT 亀互䜜甚項γ𝑇𝑅 のt怜定量ずは、亀互䜜甚項γ𝑇𝑅 に係数の信頌性を考慮した倀である tγTR 2 = γTR

    2 } s2{γTR 偏回垰係数γの倧きさに比䟋する 二乗するのは、偏回垰係数が負倀ずなる堎合もあるため たた、 } s2{γTR 、偏回垰係数γの分散に反比䟋する これは、係数の信頌性ず考える小さいほど信頌性が高い 偏回垰係数γの分散の蚈算には、残差が甚いられおいるため、モデルの信頌 性、ひいおは、モデルが解釈しやすいようにデヌタがうたく分割できるよ うになっおいるか、ず考えおもよい※ ※詳现な導出は耇雑なので省略する
  31. 決定朚モデル  SBUT ・ 『ダバい予枬孊 「䜕を買うか」から「い぀死ぬか」たであなたの行動はすべお読たれおいる』 ゚リック・ シヌゲル (著)、矢 矜野

    薫 (翻蚳) 、CCCメディアハりス、2013幎、241-243p DMを送るず口座開蚭しおくれやすい客 ・ロヌン契玄しおいる17.3%以䞊返枈枈 ・リボ払い枠を9%以䞊䜿っおいる ・特定のラむフスタむルを持っおいる USバンク この顧客集団を芋぀けられる
  32. 掟生モデルの類型ず目的 Two Model Approach Mouloud Belbahri , Alejandro Murua, Olivier

    Gandouet, and Vahid Partovi Nia, “Uplift Regression: The R Package tools4uplift” 2019 Yuta Saito, Hayato Sakata and Kazuhide Nakata, ”Doubly Robust Prediction and Evaluation Methods Improve Uplift Modeling for Observational Data” 2019, p468-469 ・回垰モデル CVT(Class Variable Transformation) ・決定朚モデル DTUM(Decision Tree Uplift Model) SBUT(Significance-Based Uplift Tree) DBUT(Divergence-Based Uplift Tree) URF(Uplift Random Forest /ensembled DTUM) CTS(Contextual Treatment Selection) ・SVMモデル Uplift Support Vector Machine One Model Approach ・TOM(Transform Outcome Method) ・SDRM(Switch Doubly Robust Method) A/Bテスト以倖の デヌタを䜿えないか Causal Conditional Inference Uplift Modeling
  33. A/Bテストができないずき  A/Bテスト  介入の効果を蚈るためのテスト 䞻効果 介入 効果 䞻効果 統制矀

    実隓矀 ランダム化 䞻効果 介入 効果 䞻効果 統制矀 実隓矀 耇数暙本化 䞻効果 介入 効果 䞻効果 介入なし 介入あり 片方が 欠枬する 個人比范 • ある個人に察しお介入したずき ず介入しなかったずきの反応の 差は介入効果ず蚀えそう • しかし、どちらか䞀方しか芳枬 できない ランダム化され おいない矀比范 • そこで、介入する矀実隓矀ず 介入しない矀統制矀の反応 の差を介入効果ずしお利甚した い • しかし、矀間で特城量䞻効果 が異なるため単玔比范できない ランダム化され た矀比范 • ランダムにサンプリングした集 団の特城量䞻効果の平均に は差がなくなるので、反応の単 玔比范で介入効果を枬定でき る 反 応 𝐎𝑇𝐞 = 𝐞 𝑌(1) − 𝐞 𝑌(0)
  34. A/Bテストができないずき A/Bテストの実斜には、倚くの問題がある 䞋蚘のような問題により、 実斜できないor実斜できおもA/Bテストの条件ランダム割付を満たすのが困難な堎合がある 経枈的問題 実斜にコストがかかったり、介入しないこずによりビゞネス機䌚を逃すこずになる 䟋ある新商品のキャンペヌンが介入であるテストに぀いお、お埗意様のような明らかに売れそうな顧客 に察しお、キャンペヌンを行わないような統制矀を蚭定する必芁がある 倫理的問題 介入非介入が倫理に反する

    䟋 ある病気の投薬が介入であるテストに぀いお、有効な治療法が明らかであるのに、治療を斜さない統 制矀を蚭定する必芁がある 介入の原理的問題 介入の割付をコントロヌルできない、ホヌ゜ン効果、察象の途䞭離脱など 䟋ある補品の屋倖広告が介入であるテストに぀いお、誰が広告を目にするかをコントロヌルするこずは できない
  35. A/Bテストができないずき ※介入がランダム割付されおいないA/Bテストずは蚀えないデヌタの䟋 問題ずバむアス 䞻な問題 研究 デザむン 察象 デヌタ ある化粧品に぀いお、キャンペヌンの効果を過去の賌買 デヌタから掚枬する

    →キャンペヌンの察象者に偏りがある 効果のある客に出しおいるはず、女性が倚めなど 経枈的 問題 芳察研究 過去 デヌタ ある病気に぀いお、治療を受けた患者ず受けなかった患者の 臚床デヌタを比范する →治療を受けるかどうかに偏りがある 患者の経枈状況や病院の地理的䜍眮など 倫理的 問題 芳察研究 過去 デヌタ ある動画配信サヌビスに぀いお、屋倖広告を出した地域ず出 さない地域の申蟌者数を比范する →地域の䜏民属性に偏りがある 䜏民の経枈状況や広告の出皿堎所など 介入の 原理的 問題 介入研究 非ランダ ム化 実隓 デヌタ あるスマホゲヌムに぀いお、CMを流したずきず流しおいない 時の利甚時間数を比范する →芖聎者の属性に偏りがある CMを流した時間垯を芋やすい芖聎者局、流した時期の競 合他瀟のスマホゲヌムなど 介入の 原理的 問題 介入研究 非ランダ ム化 実隓 デヌタ
  36. 準実隓法 準実隓法は、介入がランダム割付されおいない実隓結果や芳察結果に䜕らかの操䜜を行い、介入効果 を掚定する方法 A/Bテスト、すなわち、ランダム化の利点は、特城量が同䞀の矀を甚意で き、反応をそのたた比范すれば自動的に介入効果を掚定できるこず したがっお、䞋蚘のような操䜜を行えば介入効果を掚定できるずいうのが 準実隓法の考え方 特城量を揃えた二矀を調敎する反応を補正する介入効果のみを取り出す など このずき操䜜する特城量は、介入に関連があり、反応に因果関係がある特 城を察象ずする、これを亀絡因子ず呌ぶ

    ランダム化されおいないずきは、亀絡因子の存圚が想定される 䟋 孊習意欲 孊力 授業ぞの出垭
  37. 目的倉数を補正する 朜圚目的倉数を予枬する 介入効果のみを取り出す 特城量を揃える 準実隓法 回垰分析 目的倉数ず説明倉数を甚いお、 介入倉数ごずに回垰モデルを構築し、 個別の察象の介入ありの反応ず介入 なしの反応を予枬し、その差分を介

    入効果ず掚定する 回垰分断デザむン 統制矀ず実隓矀の割付が説明倉数 の閟倀によっお行われおいる時、閟 倀前埌の実隓矀ず統制矀を比范す るず介入効果が枬定できる 差の差法 それぞれの矀に぀いお、介入前埌の デヌタを取埗しおその差をずる 介入効果(E) (B-A)-(D-C)で衚せる 実隓矀介入前/埌: A/B 統制矀介入前/埌: C/D B E C A D x y 局別分析マッチング法 特城量を同䞀の集団に分割しお、 反応を比范し、その平均を党䜓の 介入効果ずする 介入 効果 介入効果 の平均を 取る 特城量によっお 分ける ・ ・ 傟向スコア補正 説明倉数から介入を受ける確率を掚 定し、この傟向スコアを甚いお目的倉 数に察しお重み付けする事によっお、 目的倉数ぞのバむアスを補正する 操䜜倉数法 図のような操䜜倉数Zを甚いお、介 入Tが目的倉数Yに䞎える玔粋な効 果A介入効果を掚定する方法 Zの倉動ではBの効果は生じないた め、Aのみ掚定できる Y T Z X A B 個人間の介入効果を 察象にできる手法 Uplift Modelingで䜿える
  38. 回垰分析 回垰分析はTwo Model Approach/One Model Approachそのもの 亀絡因子を線圢予枬子に導入するこずにより、介入による効果ず亀絡因子によ る効果を分離するこずが期埅できる 䟋 手法ずしおは、これたでUplift

    Modelingで行っおきたこずそのもの したがっお、これたでの手法を甚いおも、ある皋床A/Bテストでないデヌタにも 察応できる しかし、埗られる倀は厳密には因果効果の掚定倀ではなく、回垰の結果に過ぎ ないため、介入による効果ず亀絡因子による効果の分離がうたく行かないこず が倚い 孊習意欲 孊力 授業ぞの 出垭 0.05 0.3
  39. 傟向スコア 傟向スコア補正IPW: Inverse Probability Weighting IPWは傟向スコアの逆数を反応量にかけお、反応量を補正する IPWによる平均介入効果(ATE:Average treatment effect)は、䞋蚘のように 瀺される

    傟向スコア介入を受ける確率: 𝑒 𝑥 を甚いお、実隓矀ず統制矀の反応量 を比范可胜な倀にそろえるむメヌゞ 回垰分析に比べるず、因果効果の掚定倀による補正のため、亀絡因子の効 果の分離がうたくいくこずが倚い しかし、傟向スコアが高すぎるor䜎すぎるず補正しすぎる欠点がある 𝑒 𝑥 = 𝑃 𝑊𝑖 = 1 𝑋𝑖 = 𝑥) 𝐎𝑇𝐞 = 𝐞 𝑊𝑖 𝑒 𝑋𝑖 𝑌 𝑖 (1) − 𝐞 1 − 𝑊𝑖 1 − 𝑒 𝑋𝑖 𝑌 𝑖 (0) *notation W:介入あり=1/介入なし=0 Y:反応 カッコ内は介入
  40. 傟向スコア 𝑊𝑖 = 0 𝑒 𝑥 = 0.75 1 −

    𝑒 𝑥 = 0.25 𝑖 𝑊𝑖 = 1 𝑌𝑖1 𝑌𝑖2 𝑌𝑖3 𝑌𝑖4 𝑊𝑖 = 0 𝑒 𝑥 = 0.5 1 − 𝑒 𝑥 = 0.5 𝑖 𝑊𝑖 = 1 𝑌𝑖1 𝑌𝑖2 𝑌𝑖3 𝑌𝑖4 𝑊𝑖 = 0 𝑊𝑖 = 1 𝑌𝑖1 𝑌𝑖2 𝑌𝑖3 𝑌𝑖4 𝑌𝑖+1 𝑌𝑖+1 ・ ・ ・ ・ ・ 𝑌𝑛 𝑌𝑛 𝑊𝑖 = 0 𝑊𝑖 = 1 𝑌𝑖1 𝑌𝑖2 𝑌𝑖3 𝑌𝑖4 𝑌𝑖+1 𝑌𝑖+1 ・ ・ ・ ・ ・ 𝑌𝑛 𝑌𝑛 𝑊𝑖 = 0 𝑊𝑖 = 1 𝑌𝑖1 𝑌𝑖2 𝑌𝑖3 𝑌𝑖4 𝑌𝑖+1 𝑌𝑖+1 ・ ・ ・ ・ 𝑌𝑛 𝑌𝑛 ラ ン ダ ム 割 付 の å Ž 合 ラ ン ダ ム 割 付 で な い å Ž 合 iに぀いお暙本を取る 簡単のために4個で図瀺 iの反応量の総和高さを比范しお、 介入効果面積を求める iに぀いお暙本を取る 割付確率が違うため暙本数が 異なる反応量の総和が異なる 幅介入割付確率が異なるため、 高さでは介入効果面積が比范䞍可胜 幅ず高さを傟向スコアによっお 補正しお比范可胜にする ・ ・ ・ 割付確率幅が小さいほど、 反応量高さを倧きく補正す る 瞊暪比を維持したたた幅に 合わせお拡倧するむメヌゞ 𝑌𝑖+1 𝑌𝑖1 𝑌𝑖2 𝑌𝑖3
  41. TOM

  42. TOM TOM: Transformed Outcome Method 個人介入効果(ITE: Individual Treatment Effect)を傟向スコアで補正する https://qiita.com/usaito/items/f713d93732db82696a76

    Athey, S and Imbens, G. Machine Learning Method for estimating heterogeneous causal effects. stat, 1050:5, 2015 IPWを行った反応倀を甚いお、Uplift Modelingを行う IPWは党䜓介入効果(ATE)に察する補正だったため、個人介入効果(ITE)に察す る補正に拡匵する 䟋 介入ありの反応1で傟向スコア0.8だず、1*1/0.8-0=1*1.25=1.25 介入なしの反応0.2で傟向スコア0.2だず、0-0.2*1/0.8=0.2*1.25=-1 たた、介入なしの反応0で傟向スコア0.2だず、0-0*5=0 (二倀の堎合、統制矀のデヌタは考慮されない 𝑌𝑖 𝑜𝑏𝑠 = 𝑊𝑖 𝑌 𝑖 (1) − 1 − 𝑊𝑖 𝑌 𝑖 (0) 𝑌𝑖 𝑇𝑂 = 𝑌𝑖 𝑜𝑏𝑠 ⋅ 𝑊𝑖 − 𝑒 𝑋𝑖 𝑒 𝑋𝑖 ⋅ 1 − 𝑒 𝑋𝑖 = 𝑌 𝑖 (1) ⋅ 𝑊𝑖 𝑒 𝑋𝑖 − 𝑌 𝑖 (0) ⋅ 1 − 𝑊𝑖 1 − 𝑒 𝑋𝑖 𝐞 𝑌𝑖 𝑇𝑂 𝑋𝑖 = 𝐞 𝑌 𝑖 (1) 𝑋𝑖 − 𝐞 𝑌 𝑖 (0) 𝑋𝑖 = 𝐌𝑇𝐞𝑖 *notation W:介入あり=1/介入なし=0 Y:反応 カッコ内は介入 X:説明倉数
  43. TOM TOM: Transformed Outcome Method 党䜓の流れ 𝑌𝑖 𝑇𝑂 = 𝑌

    𝑖 (1) ⋅ 𝑊𝑖 𝑒 𝑋𝑖 − 𝑌 𝑖 (0) ⋅ 1 − 𝑊𝑖 1 − 𝑒 𝑋𝑖 実隓矀 統制矀 倉圢 実隓矀 統制矀 ID 傟向スコア A 0.5 B 0.1 C 0.8 D 0.2 
 𝑒 𝑋𝑖 ②介入効果 掚定モデル 構築 ①傟向スコア孊 習噚構築掚 定 ③介入効果 掚定 ID 確率 A 0.5 B 0.8 C 0.7 D 0.5 
 テスト デヌタ
  44. SDRM SDRM: Switch Doubly Robust Method 傟向スコア補正ず回垰分析の結果を䜵甚する Yuta Saito, Hayato

    Sakata and Kazuhide Nakata, “Doubly Robust Prediction and Evaluation Methods Improve Uplift Modeling for Observational Data” (2019) 傟向スコアはかに近いスコアだず補正しすぎる※傟向スコアが0.002の反応量は500倍の補正を受ける たた、二倀の堎合、統制矀のデヌタを捚おおしたう これらの欠点を補完するため、傟向スコアが極端な倀の堎合には、回垰分析の結果のみを 甚い、たた、極端な倀でない堎合にも回垰分析の結果を混合するこずにより、掚定の頑匷 さを高めた方法 𝑌𝑖 𝑆𝐷𝑅 = 𝜁𝑖 𝑌𝑖 𝐷𝑅 + (1 − 𝜁𝑖 ) ( Æž 𝜇 𝑖 1 − Æž 𝜇 𝑖 (0)) 𝜁𝑖 = 𝑊𝑖 𝐌𝐌𝛟< Æž 𝑒 𝑋𝑖 < 1 + 1 − 𝑊𝑖 𝐌𝐌0< Æž 𝑒 𝑋𝑖 < 1−𝛟 𝑌𝑖 𝐷𝑅 = 𝑊𝑖 Æž 𝑒 𝑋𝑖 𝑌 𝑖 (1) − Æž 𝜇 𝑖 (1) − 1 − 𝑊𝑖 1 − Æž 𝑒 𝑋𝑖 𝑌 𝑖 (0) − Æž 𝜇 𝑖 (0) + Æž 𝜇 𝑖 1 − Æž 𝜇 𝑖 (0) *notation W:介入あり=1/介入なし=0 Y:反応 カッコ内は介入 X:説明倉数 ÎŒ:反応の期埅倀の掚定倀(回垰モデルにより掚定) II:条件に圓おはたるずき1を取る倉数 γ:傟向スコアの極端さの閟倀を決めるハむパヌパラメヌタ
  45. SDRM SDRM: Switch Doubly Robust Method 党䜓の流れ 𝑌𝑖 𝑆𝐷𝑅 =

    𝜁𝑖 𝑌𝑖 𝐷𝑅 + (1 − 𝜁𝑖 ) ( Æž 𝜇 𝑖 1 − Æž 𝜇 𝑖 (0)) 
 実隓矀 統制矀 倉圢 ID 確率 A 0.5 B 0.8 C 0.7 D 0.5 
 実隓矀 統制矀 ID 傟向 A 0.5 B 0.1 C 0.8
 𝑒 𝑋𝑖 ③介入効果掚定 モデル構築 ①傟向スコア孊習噚構築掚定 ②朜圚目的倉数掚定モデル構築 実隓矀 蚓緎 デヌタ モデル 統制矀 蚓緎 デヌタ モデル ④介入効果掚定 テスト デヌタ
  46. Liftはなぜ実隓矀の総数を甚いるのか Liftは原論文では䞋匏の圢ずなっおいる Lift = Rt − Rc ⋅ 𝑁𝑡 𝑁𝑐

    実隓矀の反応率𝑅𝑡 統制矀の反応率𝑅𝑐 実隓矀の総数𝑁𝑡 統制矀の総数𝑁𝑐 実隓矀の反応数ヌ実隓矀の総数に合わせお補正した統制矀の反応数 倉圢するず、「仕事ではじめる機械孊習 9章」ず同じ圢の匏になる 𝐿𝑖𝑓𝑡 𝑁𝑡 = 𝑅𝑡 𝑁𝑡 − 𝑅𝑐 𝑁𝑐 Lift = 𝑅𝑡 𝑁𝑡 − 𝑅𝑐 𝑁𝑐 ⋅ Nt 実隓矀の反応率ヌ統制矀の反応率×実隓矀の総数 なぜ実隓矀の数を軞にするのかに぀いおは、原論文にも蚀及がないが、 Liftの意味がそもそも、介入に察しお反応率がどれだけ䞊がるかずいう、実隓矀を軞にした基準であるた めではないかず考える Nicholas J. Radcliffe (2007) “Using control groups to target on predicted lift: Building and assessing uplift model”
  47. SBUTの情報利埗ペナルティPruning 情報利埗ペナルティ ノヌドの巊右のサむズが違うずアップリフトにペナルティを加える kはハむパヌパラメヌタ 𝐺𝑎𝑖𝑛𝑖 = 𝑆𝑝𝑙𝑖𝑡𝐶𝑟𝑖𝑡𝑒𝑟𝑖𝑜𝑛 ∙ 1 −

    𝑁𝑅 − 𝑁𝐿 𝑁𝑅 + 𝑁𝐿 𝑘 Pruning ・蚓緎デヌタをk個デフォルト8に分け、1セットを䜿っお朚を最倧たで構築する ノヌドがTorCのみになったり、蚭定したアップリフトを䞋回ったり、 蚭定したノヌドサむズを䞋回ったり、など基準を蚭ける その埌、k-1個のデヌタセットの暙準偏差を䞊回る暙準偏差ずなったノヌドを 削陀する ・0.5%-3%のノヌドを削陀する 実際の問題では、反応率は1-3、アップリフトは0.1-2%皋床であるため