Upgrade to Pro — share decks privately, control downloads, hide ads and more …

HIERARCHICAL MODELS for HETEROGENOUS UNITS(後編)

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

HIERARCHICAL MODELS for HETEROGENOUS UNITS(後編)

Avatar for ディップ株式会社

ディップ株式会社 PRO

October 29, 2025
Tweet

More Decks by ディップ株式会社

Other Decks in Technology

Transcript

  1. Copyright © DIP Corporation, All rights reserved. 2 ⼩テーマ 01

    前回の復習 P.03 ⼩テーマ 02 混合正規分布の導⼊ P.08 ⼩テーマ 03 モデルの⼀部変更 P.11 ⼩テーマ 04 再解析の結果 P.13 ⼩テーマ 05 まとめ P.16 Agenda
  2. Copyright © DIP Corporation, All rights reserved. 階層モデルって何?何のためにあるの? 例えば、消費者の購買傾向 (価格格が⾼くなるとどのくらい気にするか等)

    を知りたいとすると • 個⼈または世帯レベルの購買データが⼊⼿できるので、階層性を仮定できる。 • 階層性を仮定することで、ターゲットを絞った売り⽅ができるようになる。 3 𝛿 ʢۉҰʣ 𝛿 𝛽! 𝛽" 𝛽# 𝛽$%! 𝛽$ … … ֊૚ੑΛԾఆ͠ͳ͍Ϟσϧ ֊૚ੑΛԾఆ͢ΔϞσϧ
  3. Copyright © DIP Corporation, All rights reserved. 𝜹 (消費者全体)と 𝜷(世帯)

    の関係はどうなるか 4 𝛽! 𝛽" 𝛽# ⋮ 𝛽$ 𝛽$%! ⋮ 𝛽$%" 𝛿
  4. Copyright © DIP Corporation, All rights reserved. 購買データから世帯ごとの購買傾向を分析する • マーガリンのブランド6個を対象とした

    • 係数を設定した ◦ 商品側の属性として、「上記のブランドのいずれであるか」と「log(価格)」を設定し、 a「消費者がどの程度⾼く点数をつけるか」の重みづけ係数がそれぞれの属性に対して 存在するとした。 • 消費者側の情報を以下とした ◦ 調査期間中に上記のブランドを5種類以上購⼊した合計313世帯を対象とした。 ◦ 購買に影響すると考えられる要因として「世帯所得」「家族サイズ」を組み込んだ。 5
  5. Copyright © DIP Corporation, All rights reserved. まずは下の階層から 6 ◦

    𝑦&' は「最終的に選好がどのくらいの⼤きさになったか」 ◦ 𝑋&' は「どのブランドに対しての話か」と「当時は−log(価格)がいくらだったか」 ◦ 𝛽& は「各ブランドに対してどれくらい⾼く点数をつけるか」「log(価格)にどのくらい ⾼く点数をつけるか」の重みづけ係数 ◦ 𝜀&' は誤差項 𝑦!" = 𝑥!" 𝛽!" + 𝜀!" 世帯ID 𝑖 = 1, 2, … , 𝑚 観測 (購入) ID 𝑗 = 1, 2, … , 𝑛 𝑥&' = [ 0, 1, 0, 0, 0, 0, 𝑙𝑜𝑔500 ] ◦ 例:世帯 i が観測 j において 2個⽬のブランドを500円で買った場合 𝑥&' 𝛽&' = 0 + 8 + 0 + 0 + 0 + 0 − 𝑙𝑜𝑔 500 ≒ 5.3 𝛽&' = 2 8 4 3 6 1 2 −1
  6. Copyright © DIP Corporation, All rights reserved. 次は上の階層 7 ◦

    𝛽& は世帯ごとの重みづけ係数 ◦ 𝛿 は消費者側の属性ごとに「各ブランドにどのくらい⾼く点数がつくか」の重みづけ係数 ◦ 𝑧& は各世帯の属性(「世帯所得」「家族サイズ」)の値 ◦ 𝑢& は誤差項 𝑢& ~ 𝑁𝑜𝑟𝑚𝑎𝑙 ( 0, 𝑉- ) 𝛽! = 𝛿𝑧! + 𝑢! 世帯ID 𝑖 = 1, 2, … , 𝑚 𝑧& = 8 3 ◦ 例:世帯𝑖において、世帯所得800万、家族サイズ3 𝛿 = 0.2 0.1 0.8 0.5 0.3 0.5 0.2 0.4 0.6 0.4 0.1 0.1 0.1 0.4 −0.1 −0.1 𝛽&' = 1.9 7.9 3.9 2.8 6.0 1.1 2.0 −1.1
  7. Copyright © DIP Corporation, All rights reserved. 𝜷(世帯)は𝜹に属しつつグループに分かれてもいる • 世帯レベルの重みづけ係数βの事後分布が歪んでいた。

    • 𝛽ͷޡ߲ࠩʹਖ਼ن෼෍ΛԾఆ͢Δͱɺʮଟ਺೿Ͱ͸ͳ͍΋ͷͷ͋Δఔ౓͍ Δάϧʔϓʯ ΛϞσϧʹ൓өͤ͞ʹ͍͘。 8 ௵ͯ͠͠·͍ͬͯΔ૚ ີ ౓ ີ ౓ 𝛽ͷ܎਺஋ 𝛽ͷ܎਺஋ ਖ਼ن෼෍ ਖ਼نࠞ߹෼෍ ੈଳ ੈଳ ੈଳ𝑚 − 1 ੈଳ𝑚 ੈଳ ੈଳ ੈଳ𝑚 − 1 ੈଳ𝑚 ʜ ʜ
  8. Copyright © DIP Corporation, All rights reserved. 𝒖𝒊 は正規混合分布に従うとする 11

    𝑢! ~ 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇!"#" , Σ!"#" ) 世帯ID 𝑖 = 1, 2, … , 𝑚 𝑝𝑣𝑒𝑐 = 0.05 0.1 0.3 0.5 0.05 ྫ͑͹ɺάϧʔϓ਺Λ5ͱͨ͠ͱ͖ 𝛽! = 𝛿𝑧! + 𝑢! 𝑖𝑛𝑑! ~ 𝑀𝑢𝑙𝑡𝑖𝑛𝑜𝑚𝑖𝑎𝑙$(𝑝𝑣𝑒𝑐) 1, … , Kͷ஋ΛͱΔ જࡏࢦࣔม਺ ͜ͷΑ͏ͳਅͷࠞ߹ൺ཰ʢະ஌ʣ͔Β𝑖𝑛𝑑! ͕ϥϯμϜʹ αϯϓϦϯά͞Ε͍ͯΔͱߟ͑Δɻ      𝛽& ͕313×7 ੈଳ͝ͱม਺͝ͱ ͷ ߦྻͳͷͰ 𝑢& ΋ಉ͘͡313×7ͷߦྻɻ
  9. Copyright © DIP Corporation, All rights reserved. 事前分布を設定します 12 𝑝𝑣𝑒𝑐

    ~ 𝐷𝑖𝑟𝑖𝑐ℎ𝑙𝑒𝑡(𝛼) 𝜇!"#" ~ 𝑁𝑜𝑟𝑚𝑎𝑙(B 𝜇 , Σ!"#" ⊗ 𝑎% &') Σ!"#" ~ 𝐼𝑊 𝜈, 𝑉 σΟϦΫϨ෼෍ ଟ߲෼෍ͷڞ໾ࣄલ෼෍ɻ 𝛼͸௕͞𝑘ͷϕΫτϧɻ ଟมྔਖ਼ن෼෍ ٯ΢Ογϟʔτ෼෍ ଟมྔਖ਼ن෼෍ͷ෼ࢄڞ෼ࢄߦྻͷڞ໾ࣄલ෼෍ɻ ྫ͑͹ɺάϧʔϓ਺Λ5ͱͨ͠ͱ͖ 𝜇! 𝜇" 𝜇# 𝜇1 𝜇2 ̅ 𝜇 z
  10. Copyright © DIP Corporation, All rights reserved. ブランドに対する傾向の差異がより明確に表れた • 世帯レベルの重みづけ係数の⼤きさ

    ▪ 灰⾊:単⼀の正規分布 ▪ 黒⾊:5個の混合正規分布 ◦ Fleischmanns, House, Genericにおいて 特に裾の重い分布になった。 =͜ΕΒͷϒϥϯυΛ໌֬ʹආ͚Δੈଳ͕ ॆ෼਺ଘࡏ͢Δ。 13
  11. Copyright © DIP Corporation, All rights reserved. 係数𝜷の取りうる値が拡がった • 世帯ごとの重みづけ係数の事後平均

    ◦ 混合正規分布を仮定すると、 係数の取りうる値が拡がった。 ◦ 係数が負になっている世帯の情報を より反映できている。 14
  12. Copyright © DIP Corporation, All rights reserved. 混合の個数を5から10へ増やすメリットは弱い • 世帯レベルの重みづけ係数の⼤きさ

    ▪ 黒⾊:5個の正規分布 ▪ 灰⾊:10個の混合正規分布 ◦ 裾により重⼼が移動しているものの、 顕著に分布の形が変わったブランドはない。 ◦ 混合の個数は多すぎると過学習のリスク があるため、注意が必要。 15
  13. Copyright © DIP Corporation, All rights reserved. まとめ • 階層モデルを使うと、ফඅऀ୯Ґͷߪങ܏޲をより詳細に知ることが

    できる。 • 混合分布を併⽤すると、ফඅऀ͕ܗ੒͢Δάϧʔϓの状態を知ることが できる。 16 ີ ౓ 𝛽ͷ܎਺஋ ਖ਼نࠞ߹෼෍ ੈଳ ੈଳ ੈଳ𝑚 − 1 ੈଳ𝑚 ʜ 𝛿 𝛽! 𝛽" 𝛽# 𝛽$%! 𝛽$ … ֊૚Ϟσϧ