Upgrade to Pro — share decks privately, control downloads, hide ads and more …

HIERARCHICAL MODELS for HETEROGENOUS UNITS(後編)

HIERARCHICAL MODELS for HETEROGENOUS UNITS(後編)

Avatar for ディップ株式会社

ディップ株式会社 PRO

October 29, 2025
Tweet

More Decks by ディップ株式会社

Other Decks in Technology

Transcript

  1. Copyright © DIP Corporation, All rights reserved. 2 ⼩テーマ 01

    前回の復習 P.03 ⼩テーマ 02 混合正規分布の導⼊ P.08 ⼩テーマ 03 モデルの⼀部変更 P.11 ⼩テーマ 04 再解析の結果 P.13 ⼩テーマ 05 まとめ P.16 Agenda
  2. Copyright © DIP Corporation, All rights reserved. 階層モデルって何?何のためにあるの? 例えば、消費者の購買傾向 (価格格が⾼くなるとどのくらい気にするか等)

    を知りたいとすると • 個⼈または世帯レベルの購買データが⼊⼿できるので、階層性を仮定できる。 • 階層性を仮定することで、ターゲットを絞った売り⽅ができるようになる。 3 𝛿 ʢۉҰʣ 𝛿 𝛽! 𝛽" 𝛽# 𝛽$%! 𝛽$ … … ֊૚ੑΛԾఆ͠ͳ͍Ϟσϧ ֊૚ੑΛԾఆ͢ΔϞσϧ
  3. Copyright © DIP Corporation, All rights reserved. 𝜹 (消費者全体)と 𝜷(世帯)

    の関係はどうなるか 4 𝛽! 𝛽" 𝛽# ⋮ 𝛽$ 𝛽$%! ⋮ 𝛽$%" 𝛿
  4. Copyright © DIP Corporation, All rights reserved. 購買データから世帯ごとの購買傾向を分析する • マーガリンのブランド6個を対象とした

    • 係数を設定した ◦ 商品側の属性として、「上記のブランドのいずれであるか」と「log(価格)」を設定し、 a「消費者がどの程度⾼く点数をつけるか」の重みづけ係数がそれぞれの属性に対して 存在するとした。 • 消費者側の情報を以下とした ◦ 調査期間中に上記のブランドを5種類以上購⼊した合計313世帯を対象とした。 ◦ 購買に影響すると考えられる要因として「世帯所得」「家族サイズ」を組み込んだ。 5
  5. Copyright © DIP Corporation, All rights reserved. まずは下の階層から 6 ◦

    𝑦&' は「最終的に選好がどのくらいの⼤きさになったか」 ◦ 𝑋&' は「どのブランドに対しての話か」と「当時は−log(価格)がいくらだったか」 ◦ 𝛽& は「各ブランドに対してどれくらい⾼く点数をつけるか」「log(価格)にどのくらい ⾼く点数をつけるか」の重みづけ係数 ◦ 𝜀&' は誤差項 𝑦!" = 𝑥!" 𝛽!" + 𝜀!" 世帯ID 𝑖 = 1, 2, … , 𝑚 観測 (購入) ID 𝑗 = 1, 2, … , 𝑛 𝑥&' = [ 0, 1, 0, 0, 0, 0, 𝑙𝑜𝑔500 ] ◦ 例:世帯 i が観測 j において 2個⽬のブランドを500円で買った場合 𝑥&' 𝛽&' = 0 + 8 + 0 + 0 + 0 + 0 − 𝑙𝑜𝑔 500 ≒ 5.3 𝛽&' = 2 8 4 3 6 1 2 −1
  6. Copyright © DIP Corporation, All rights reserved. 次は上の階層 7 ◦

    𝛽& は世帯ごとの重みづけ係数 ◦ 𝛿 は消費者側の属性ごとに「各ブランドにどのくらい⾼く点数がつくか」の重みづけ係数 ◦ 𝑧& は各世帯の属性(「世帯所得」「家族サイズ」)の値 ◦ 𝑢& は誤差項 𝑢& ~ 𝑁𝑜𝑟𝑚𝑎𝑙 ( 0, 𝑉- ) 𝛽! = 𝛿𝑧! + 𝑢! 世帯ID 𝑖 = 1, 2, … , 𝑚 𝑧& = 8 3 ◦ 例:世帯𝑖において、世帯所得800万、家族サイズ3 𝛿 = 0.2 0.1 0.8 0.5 0.3 0.5 0.2 0.4 0.6 0.4 0.1 0.1 0.1 0.4 −0.1 −0.1 𝛽&' = 1.9 7.9 3.9 2.8 6.0 1.1 2.0 −1.1
  7. Copyright © DIP Corporation, All rights reserved. 𝜷(世帯)は𝜹に属しつつグループに分かれてもいる • 世帯レベルの重みづけ係数βの事後分布が歪んでいた。

    • 𝛽ͷޡ߲ࠩʹਖ਼ن෼෍ΛԾఆ͢Δͱɺʮଟ਺೿Ͱ͸ͳ͍΋ͷͷ͋Δఔ౓͍ Δάϧʔϓʯ ΛϞσϧʹ൓өͤ͞ʹ͍͘。 8 ௵ͯ͠͠·͍ͬͯΔ૚ ີ ౓ ີ ౓ 𝛽ͷ܎਺஋ 𝛽ͷ܎਺஋ ਖ਼ن෼෍ ਖ਼نࠞ߹෼෍ ੈଳ ੈଳ ੈଳ𝑚 − 1 ੈଳ𝑚 ੈଳ ੈଳ ੈଳ𝑚 − 1 ੈଳ𝑚 ʜ ʜ
  8. Copyright © DIP Corporation, All rights reserved. 𝒖𝒊 は正規混合分布に従うとする 11

    𝑢! ~ 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇!"#" , Σ!"#" ) 世帯ID 𝑖 = 1, 2, … , 𝑚 𝑝𝑣𝑒𝑐 = 0.05 0.1 0.3 0.5 0.05 ྫ͑͹ɺάϧʔϓ਺Λ5ͱͨ͠ͱ͖ 𝛽! = 𝛿𝑧! + 𝑢! 𝑖𝑛𝑑! ~ 𝑀𝑢𝑙𝑡𝑖𝑛𝑜𝑚𝑖𝑎𝑙$(𝑝𝑣𝑒𝑐) 1, … , Kͷ஋ΛͱΔ જࡏࢦࣔม਺ ͜ͷΑ͏ͳਅͷࠞ߹ൺ཰ʢະ஌ʣ͔Β𝑖𝑛𝑑! ͕ϥϯμϜʹ αϯϓϦϯά͞Ε͍ͯΔͱߟ͑Δɻ      𝛽& ͕313×7 ੈଳ͝ͱม਺͝ͱ ͷ ߦྻͳͷͰ 𝑢& ΋ಉ͘͡313×7ͷߦྻɻ
  9. Copyright © DIP Corporation, All rights reserved. 事前分布を設定します 12 𝑝𝑣𝑒𝑐

    ~ 𝐷𝑖𝑟𝑖𝑐ℎ𝑙𝑒𝑡(𝛼) 𝜇!"#" ~ 𝑁𝑜𝑟𝑚𝑎𝑙(B 𝜇 , Σ!"#" ⊗ 𝑎% &') Σ!"#" ~ 𝐼𝑊 𝜈, 𝑉 σΟϦΫϨ෼෍ ଟ߲෼෍ͷڞ໾ࣄલ෼෍ɻ 𝛼͸௕͞𝑘ͷϕΫτϧɻ ଟมྔਖ਼ن෼෍ ٯ΢Ογϟʔτ෼෍ ଟมྔਖ਼ن෼෍ͷ෼ࢄڞ෼ࢄߦྻͷڞ໾ࣄલ෼෍ɻ ྫ͑͹ɺάϧʔϓ਺Λ5ͱͨ͠ͱ͖ 𝜇! 𝜇" 𝜇# 𝜇1 𝜇2 ̅ 𝜇 z
  10. Copyright © DIP Corporation, All rights reserved. ブランドに対する傾向の差異がより明確に表れた • 世帯レベルの重みづけ係数の⼤きさ

    ▪ 灰⾊:単⼀の正規分布 ▪ 黒⾊:5個の混合正規分布 ◦ Fleischmanns, House, Genericにおいて 特に裾の重い分布になった。 =͜ΕΒͷϒϥϯυΛ໌֬ʹආ͚Δੈଳ͕ ॆ෼਺ଘࡏ͢Δ。 13
  11. Copyright © DIP Corporation, All rights reserved. 係数𝜷の取りうる値が拡がった • 世帯ごとの重みづけ係数の事後平均

    ◦ 混合正規分布を仮定すると、 係数の取りうる値が拡がった。 ◦ 係数が負になっている世帯の情報を より反映できている。 14
  12. Copyright © DIP Corporation, All rights reserved. 混合の個数を5から10へ増やすメリットは弱い • 世帯レベルの重みづけ係数の⼤きさ

    ▪ 黒⾊:5個の正規分布 ▪ 灰⾊:10個の混合正規分布 ◦ 裾により重⼼が移動しているものの、 顕著に分布の形が変わったブランドはない。 ◦ 混合の個数は多すぎると過学習のリスク があるため、注意が必要。 15
  13. Copyright © DIP Corporation, All rights reserved. まとめ • 階層モデルを使うと、ফඅऀ୯Ґͷߪങ܏޲をより詳細に知ることが

    できる。 • 混合分布を併⽤すると、ফඅऀ͕ܗ੒͢Δάϧʔϓの状態を知ることが できる。 16 ີ ౓ 𝛽ͷ܎਺஋ ਖ਼نࠞ߹෼෍ ੈଳ ੈଳ ੈଳ𝑚 − 1 ੈଳ𝑚 ʜ 𝛿 𝛽! 𝛽" 𝛽# 𝛽$%! 𝛽$ … ֊૚Ϟσϧ