Pro Yearly is on sale from $80 to $50! »

Synapse: 利用者の文脈に応じて 継続的に推薦手法の選択を 最適化する推薦システム/iot45_synapse

Synapse: 利用者の文脈に応じて 継続的に推薦手法の選択を 最適化する推薦システム/iot45_synapse

第45回 情報処理学会 インターネットと運用技術研究会
https://www.ipsj.or.jp/kenkyukai/event/csec85iot45.html

Cd3d2cb2dadf5488935fe0ddaea7938a?s=128

monochromegane

May 24, 2019
Tweet

Transcript

  1. ࡾ୐༔հ / Pepabo R&D Institute, GMO Pepabo, Inc. 2019.05.24 ୈ45ճ

    ৘ใॲཧֶձ Πϯλʔωοτͱӡ༻ٕज़ݚڀձ Synapse: ར༻ऀͷจ຺ʹԠͯ͡ ܧଓతʹਪનख๏ͷબ୒Λ ࠷దԽ͢ΔਪનγεςϜ
  2. 1. ͸͡Ίʹ 2. എܠ 3. ఏҊख๏ 4. ධՁ 5. ·ͱΊ

    2 ໨࣍
  3. 1. ͸͡Ίʹ

  4. • ECαΠτͰ͸঎඼૿େʹ൐͏৘ใաଟ໰୊Λղܾ͢ΔͨΊ঎඼Λࣗಈతʹఏ Ҋ͢ΔػೳʢਪનγεςϜʣ͕ಋೖ͞ΕΔɽ • ਪનख๏͸ਪનࠜڌͱͳΔ৘ใݯ΍ํࣜʹΑͬͯબఆ͢Δ঎඼͕ҟͳΔ • ར༻ऀͷཁٻΛຬͨ͢঎඼Λબఆ͢ΔՄೳੑͷߴ͍ਪનख๏Λબ୒͢Δ͜ͱ͕ ӡӦऀʹͱͬͯॏཁ 4 ݚڀͷ໨త

  5. • Which is the best ? • ಺༰ϕʔεܕਪન • ྨࣅը૾

    • ྨࣅςΩετ • ڠௐܕਪન • ஌ࣝϕʔεܕਪન • ϋΠϒϦουܕਪન • ฒྻܕɼ௚ྻܕ… 5 ਪનख๏ͷબ୒
  6. • Which is the best • ಺༰ϕʔεܕਪન • ྨࣅը૾ •

    ྨࣅςΩετ • ڠௐܕਪન • ஌ࣝϕʔεܕਪન • ϋΠϒϦουܕਪન • ฒྻܕɼ௚ྻܕ… 6 ಛఆͷ৚݅Ͱͷਪનख๏ͷબ୒ • In the case ? • ਫ਼౓΍଎౓ • ঎඼ͷಛੑ • ಺༰ͷදݱྗ • ίʔϧυελʔτ • ۙࣅ • จ຺ • ར༻ऀͷঢ়گͱཁٻ
  7. • Which is the best • ಺༰ϕʔεܕਪન • ྨࣅը૾ •

    ྨࣅςΩετ • ڠௐܕਪન • ஌ࣝϕʔεܕਪન • ϋΠϒϦουܕਪન • ฒྻܕɼ௚ྻܕ… 7 ECαΠτͷಛఆͷ৚݅Ͱͷਪનख๏ͷબ୒ • In the case • ਫ਼౓΍଎౓ • ঎඼ͷಛੑ • ಺༰ͷදݱྗ • ίʔϧυελʔτ • ۙࣅ • จ຺ • ར༻ऀͷঢ়گͱཁٻ • On a EC site ? • ܧଓతͳվળ • ػೳ௥Ճ • ར༻ऀ૿Ճ • அଓతͳվѱ • ෆ۩߹ • γεςϜෛՙ • ݱࡏͷ࠷ળखͷ௥ٻ
  8. ਪનख๏ͷ༏ྼ͸ଟ͘ͷ৚݅ʢจ຺ʣʹΑͬͯࠨӈ͞ΕΔ 8 ݚڀͷഎܠͱఏҊͷࠎࢠ ࣄલʹఆΊͨจ຺͝ͱʹਪનख๏ͷબ୒Λࣗಈత͔ͭܧଓతʹ࠷దԽ͢Δਪન γεςϜͷఏҊ ༗ޮͳਪનख๏Λػձଛࣦ͕ͳ͍Α͏ʹจ຺ʹԠͯ͡࢖͍෼͚͍ͨ

  9. 3. എܠ

  10. • ᶃ ਪનख๏ͷ༏ྼ͕จ຺ʹΑͬͯมԽ͢Δ • ᶄ ༏ྼͷมԽ͢Δ൚༻తͰ໌֬ͳج४͕ͳ͍ • ᶅ ༏ྼ͕ܧଓతʹมԽ͢Δ 10

    ਪનख๏ͷબ୒ʹ·ͭΘΔ՝୊ ECαΠτͷӡӦऀ͸ར༻ऀͷཁٻΛຬͨ͢Մೳੑͷߴ͍ਪનख๏Λબ୒͍ͨ͠ ͕ɼҎԼͷ՝୊ͷͨΊಋೖઌ͝ͱͷධՁͱௐ੔͕ߦΘΕ͍ͯΔɽ
  11. 11 ՝୊ᶃ ਪનख๏ͷ༏ྼ͕จ຺ʹΑͬͯมԽ͢Δ • ਪનख๏ͷ༏ྼ͸ଟ͘ͷ৚݅ʢจ຺ʣʹΑͬͯࠨӈ͞ΕΔ • ਪનख๏ͷલఏ΍ํࣜʹىҼ͢Δ੍໿ • ਪનର৅ͱͳΔ঎඼ͷಛੑ •

    Ԡ౴଎౓΍දࣔॱংͳͲͷ࣮૷ཁҼ • ΫϦοΫ཰΍ߪೖ཰ͳͲͷධՁࢦඪ • ਪન݁ՌΛධՁ͢Δར༻ऀଆͷঢ়گ
  12. 12 ՝୊ᶃ ਪનख๏ͷ༏ྼ͕จ຺ʹΑͬͯมԽ͢Δ ਪનର৅ͱͳΔ঎඼ͷಛੑɼධՁࢦඪʹΑΔ༏ྼࠩͷྫ

  13. 13 ՝୊ᶃ ਪનख๏ͷ༏ྼ͕จ຺ʹΑͬͯมԽ͢Δ ਪનख๏ͷ༏ྼ͸ଟ͘ͷ৚݅ʢจ຺ʣʹΑͬͯࠨӈ͞ΕΔ ৚݅ʢจ຺ʣΛఆΊͯɼจ຺͝ͱʹదͨ͠ਪનख๏Λ࢖͍෼͚Δ͜ͱͰਪનγ εςϜશମͰར༻ऀͷཁٻΛຬͨ͢঎඼Λબఆ͢ΔՄೳੑΛߴΊ͍ͨ

  14. 14 ՝୊ᶄ ༏ྼͷมԽ͢Δ൚༻తͰ໌֬ͳج४͕ͳ͍ • ༏ྼࠩͷج४ʹ͍ͭͯͷҰൠతͳ܏޲͸͜Ε·Ͱͷใࠂ΍ධՁߟ࡯͕͋Δ΋ͷ ͷจ຺ґଘͷͨΊ൚༻తͰ໌֬ͳج४͸ଘࡏ͠ͳ͍ • Ұൠతͳ܏޲΍ߟ࡯ʹج͖ͮͭͭ΋ɼ࣮؀ڥͰͷධՁʹΑͬͯ࢖͍෼͚ͷج४ ΛٻΊΔඞཁ͕͋Δ

  15. • ϋΠϒϦουܕਪન • ਪનख๏Λ૊Έ߹Θ֤ͤͯख๏ͷ୹ॴΛิ͏ • ߪങཤྺ͕஝ੵ͞ΕΔ·Ͱ͸಺༰ϕʔεΛॏࢹɼ஝ੵޙʹڠௐܕΛॏࢹ౳ 15 ՝୊ᶄ ༏ྼͷมԽ͢Δ൚༻తͰ໌֬ͳج४͕ͳ͍ $53

         )JTUPSZDPVOU -PX .JEEMF )JHI $POUFOUCBTF $PDPSBCPSBUFCBTF ڠௐܕਪન͕ߪങཤྺͷ஝ੵʹΑͬͯਫ਼౓͕޲্͠಺༰ϕʔεܕ ਪનͷਫ਼౓ͱٯస͢Δ͜ͱΛදݱͨ͠໛ࣜਤ ߪങཤྺͷ஝ੵ͕۩ମతʹԿ݅ʹୡͨ࣌͠ʹ಺༰ϕʔεܕਪનͱ ੾Γସ͑Δ΂͖͔͸࣮؀ڥͰͷධՁ͕ඞཁ
  16. 16 ՝୊ᶅ ༏ྼ͕ܧଓతʹมԽ͢Δ ECαΠτ͸ɼ࣮؀ڥͰͷධՁʹΑͬͯಘΒΕͨ৚݅͝ͱͷޮՌࠩʹج͍ͮͨਪ નख๏ͷ࢖͍෼͚ʹΑͬͯਪનγεςϜͷޮՌΛܧଓతʹ࠷େԽ͍ͨ͠ 1. จ຺ͷ੾Γ෼͚ 2. ৽͍͠ਪનख๏ͷಋೖ 3.

    ಋೖޙͷ࠶ܭଌɼޮՌ൑ఆɼޮՌతͳख๏ͷద༻ ͜ΕΒΛఆظత͔ͭ࠷୹ͰߦΘͳ͚Ε͹ӡ༻؀ڥͰ͸ػձଛࣦ͕ൃੜ͢Δ
  17. 3. ఏҊख๏

  18. • ᶃ ਪનख๏ͷ༏ྼ͕จ຺ʹΑͬͯมԽ͢Δ • จ຺ΛఆΊͯɼఆΊͨจ຺͝ͱʹਪનख๏Λ࢖͍෼͚Δ • ᶄ ༏ྼͷมԽ͢Δ൚༻తͰ໌֬ͳج४͕ͳ͍ • ఆΊͨจ຺͝ͱʹ࣮؀ڥͰͷධՁΛߦ͏

    • ᶅ ༏ྼ͕ܧଓతʹมԽ͢Δ • จ຺΍ਪનख๏ͷಋೖޙʹ࣌ؒࠩͳ͘దԠ͢Δ 18 ՝୊ͷ੔ཧ
  19. • ར༻ऀͷཁٻΛຬͨ͢঎඼Λબఆ͢ΔՄೳੑͷߴ͍ਪનख๏Λӡ༻؀ڥͰػձ ଛࣦ͕ൃੜ͠ͳ͍Α͏ࣗಈత͔ͭܧଓతʹར༻͍ͨ͠ 19 ఏҊख๏ 1. จ຺ͷఆٛͱಋೖ 2. ৽͍͠ਪનख๏ͷಋೖ 3.

    ಋೖޙͷ࠶ܭଌɼޮՌ൑ఆɼޮՌతͳख๏ͷద༻ • ࣄલʹఆΊͨจ຺͝ͱʹਪનख๏ͷબ୒Λࣗಈత͔ͭܧଓతʹ࠷దԽ͢Δਪન γεςϜΛఏҊ
  20. 20 ਪનख๏ͷಋೖ • ධՁର৅ͷਪનख๏ΛਪનγεςϜ͕౳Ձʹѻ͑ΔΑ͏ڞ௨ͷΠϯλʔϑΣʔ εΛ࣋ͭϞδϡʔϧͱͯ͠ఆٛ • ਪનॲཧ͸ڞ௨͢ΔϑΟϧλʹΑͬͯߏ੒͞ΕΔ • Profileʢར༻ऀͷ৘ใΛऩूʣ •

    AssociationʢϓϩϑΝΠϧͱ৚݅ͷඥ෇͚ʣ • Searchʢ৚݅ʹै͍ީิΛݕࡧɼฒସ͑ʣ • ϑΟϧλͷڞ௨ར༻ʹΑΓอकੑͷ޲্
  21. • ਪન݁Ռʹର͢Δར༻ऀͷ൓ԠΛܭଌ͢ΔͨΊͷϩάઃܭ • ར༻ऀ͝ͱͷϦΫΤετΛه࿥ • ར༻ऀ͝ͱͷਪનϦΫΤετʹର͢Δਪન݁ՌΛه࿥ • ਪનϦΫΤετͷ௚ޙͷߦಈ͕ਪન݁Ռͷ঎඼ʹؔ͢Δߦಈ͔Λൺֱ 21 จ຺͝ͱͷܭଌͱධՁ

    5JNF $POUFYU .FUIPE 6TFS 1BUI 1BSBNT 3FTQPOTF  $IBJS JNBHF " SFDPNNFOE        " TIPX   $IBJS DG # SFDPNNFOE        # TIPX  ਪનͷडೖ
  22. • ෳ਺ͷਪનख๏͔ΒಘΒΕΔޮՌΛ࠷େԽ͢Δ • ଟ࿹όϯσΟοτ໰୊ͱͯ͠ղऍ͠ɼෳ਺ͷਪનख๏ͷޮՌʢΫϦοΫ཰΍ߪ ೖ཰ʣΛ࠷େԽ͢ΔͨΊEpsilon-GreedyΞϧΰϦζϜΛ࠾༻ • A/Bςετʹ͓͚Δ௿ධՁͷख๏ར༻࣌ͷػձଛࣦΛճආ͢ΔͨΊͷख๏ • ࠷ॳ͸A/BςετͷΑ͏ʹಉස౓Ͱ੾Γସ͑Δ͕ධՁͷ஝ੵʢใु:rewardʣ ʹ൐͍ར༻ස౓ʹॏΈ෇͚͕ͳ͞ΕΔ

    22 จ຺͝ͱͷධՁ          Џ ׆༻ ୳ࡧ &QTJMPO(SFFEZΞϧΰϦζϜ
  23. 23 ධՁ݁Ռͷ൓ө ਪનγεςϜ͸ɼଟ࿹όϯσΟοτ໰୊ͱͯ͠ѻͬͨจ຺͝ͱͷޮՌతͳਪનख ๏ͷબ୒݁ՌΛఆظతʹऔΓࠐΈɼEpsilon-GreedyΞϧΰϦζϜͷॏΈ෇͚ʹ ै͍׆༻ํ਑Λมߋ͢Δ

  24. Synapse 24 Context Routing Context Context Method Method Method Method

    Matching Process 0.33 0.33 0.33 Search Result Bandit Activity log Rewards Algorithms Epsilon- Greedy Softmax Feedback
  25. Synapse 25 Context Routing Context Context Method Method Method Method

    Matching Process 0.1 0.8 0.1 Search Result Bandit Activity log Rewards Algorithms Epsilon- Greedy Softmax Feedback
  26. 4. ධՁ

  27. • ECαΠτͰར༻தͷਪનख๏ͷΫϦοΫ཰࣮੷ʹΑΔఏҊख๏ͷޮՌ༧ଌ • ΫϦοΫ཰࣮੷ɿӾཡதͷ঎඼ʹର͢Δਪન঎඼ΛఏҊ͢Δػೳ • ਪનख๏ɿྨࣅը૾ɼྨࣅςΩετɼڠௐܕਪનʢϓϦϛςΟϒɼLLRʣɼ σϞάϥϑΟοΫ • ϞϯςΧϧϩ๏ʹΑΔྦྷੵใु༧ଌΛൺֱ •

    ࣄલʹఆΊΔจ຺ͱͯ͠Ӿཡதͷ঎඼ͷΧςΰϦΛ࠾༻ • ࠷దԽͷޮՌଌఆɿ࠷దԽʹΑΔྦྷੵใु༧ଌͷมԽΛൺֱ • จ຺ͷޮՌଌఆɿจ຺͝ͱͷ࠷దԽͷ༗ແͰྦྷੵใु༧ଌͷมԽΛൺֱ 27 จ຺Λߟྀͨ͠ਪનख๏ͷબ୒ͷ࠷దԽ
  28. จ຺͝ͱͷਪનख๏ͷޮՌͷࠩ 28 • จ຺͸ɼར༻ऀ͕Ͳͷ঎඼Χ ςΰϦΛݟ͍ͯΔ͔ • ਪનख๏͔ΒͷఏҊʹର͢Δ ΫϦοΫ཰Λൺֱ • ΧςΰϦ͝ͱʹਪનख๏ͷޮ

    Ռͷ͕ࠩ͋Δ͜ͱ͕ݟͯऔΕ Δ ঎඼ΧςΰϦ͸ར༻ऀͷจ຺ͷ͏ͪγεςϜ͕೺ ѲͰ͖Δ΋ͷͰଞͷECαΠτͰ΋ల։͠΍͍͢ɽ
  29. ྦྷੵใु༧ଌ 29 • ࠷దԽΛߦͳ͍ͬͯͳ͍΋ͷ(1. No optimization) ͱൺֱͯ͠ ࠷ద ԽΛ͓͜ͳͬͨ΋ͷʢ2. Overall

    optimization, 3. Category-wise optimizationʣͷྦྷੵใु༧ଌ͕ ߴ͍ • ࠷ऴతͳྦྷੵใु༧ଌ͸จ຺ߟྀ ͨ͠࠷దԽ(3. Category-wize optimization)͕࠷΋ߴ͍
  30. ྦྷੵใु༧ଌʢ্ཱ͕ͪΓʣ 30 • ࠷ॳͷൺֱͷઌ಄1000ճͷΈΛൺ ֱͨ͠΋ͷ • จ຺ߟྀ(3. Category-wise optimization)ͷ৔߹ɼจ຺͝ͱʹ ֶश͕ߦΘΕΔ͜ͱ͔Β্ཱ͕ͪ

    Γʹ͸͕͔͔࣌ؒͬͨ
  31. ྦྷੵใु༧ଌʢ༏ྼࠩͷগͳ͍΋ͷʣ 31 • ࠷ॳͷൺֱͷΫϦοΫ཰ͷࠩΛҙ ਤతʹ௿Ίͨ΋ͷ • ࠷ॳͷ࣮ݧͱಉ͡ॱҐ͚ͮʹͳΔ ͕༏ྼࠩͷ൑அ·Ͱʹଟ͘ͷࢼߦ ճ਺Λཁͨ͠

  32. • ਪનख๏ͷ༏ྼΛॿ௕͢Δద੾ͳ৚݅Λબఆͯ͠ɼ͜ΕʹԠͨ͡ਪનख๏ͷબ ୒ͷ࠷దԽΛߦ͏͜ͱͰྦྷੵใुֹͷ޲্ʹͭͳ͕Δ • ຊݚڀ͸؀ڥͷมԽͷଟ͍ঢ়گΛҙਤ͍ͯ͠Δ͜ͱ͔Βɼগͳ͍ࢼߦճ਺Ͱͷ ࠷దԽΛਤΕΔΑ͏ͳํࡦʹΑΔվળ͕ظ଴Ͱ͖Δ • ࢼߦճ਺ͷ૿Ճʹ൐͍୳ࡧ཰Λ௿ΊΔʢΞχʔϦϯάʣ • ଞͷόϯσΟοτΞϧΰϦζϜʢUCB,

    softmax…) • จ຺෇͖όϯσΟοτ 32 ධՁ
  33. 5. ·ͱΊ

  34. • ར༻ऀͷจ຺ʹԠͯ͡ਪનख๏ͷಘखෆಘख͕͋Δ͜ͱ͕Θ͔ͬͨ • ఏҊख๏ʹΑΓख๏ಋೖͱจ຺ʹԠͨ͡࠷దͳख๏બఆ͕༰қʹͳΓɼػձଛ ࣦͷͳ͍ਪનγεςϜΛޮ཰తͳߏங͕Մೳͱͳͬͨ • ݱࡏɼจ຺ΛࣄલʹఆΊΔඞཁ͕͋ΔͨΊɼಘखෆಘख͕ੜ͡Δจ຺ʹ͍ͭͯ ௐࠪΛਐΊΔ • ಘखෆಘखΛิ͍߹͑ΔΑ͏ʹͳͬͨ͜ͱͰɼݶఆతͰ͋ͬͯ΋ޮՌͷߴ͍ਪ

    નख๏ͷ༗༻ੑ͕૿͢͜ͱ͕ߟ͑ΒΕΔͨΊɼͦͷΑ͏ͳख๏ͷݕ౼ΛਐΊΔɽ 34 ·ͱΊ
  35. None