Save 37% off PRO during our Black Friday Sale! »

recommendation system with document similarity

Ad6c3628aba9c357f42e412468e39732?s=47 yoppi
January 27, 2018

recommendation system with document similarity

Ad6c3628aba9c357f42e412468e39732?s=128

yoppi

January 27, 2018
Tweet

Transcript

 1. จॻؒྨࣅ౓ʹΑΔ ϨίϝϯυγεςϜ !ZPQQJCMPH։ൃ෦6;06 4QFFF,BJHJ 

 2. ࣗݾ঺հ w !ZPQQJCMPHٛాതҰ w 4QFFFྺϲ݄ͪΐͬͱ%$6;06 w (PϦϦʔεΊͰ͍ͨ w γεςϜϓϩάϥϛϯά͕େ޷෺ w

  ےτϨ
 3. ͸͡Ίʹ w ωΠςΟϒΞυωοτϫʔΫͰ͋Δ6;06͸Ϩίϝϯυ΢ΟδΣο τΛఏڙ͍ͯ͠Δ w ϝσΟΞ಺ͷهࣄͱ޿ࠂओ͔Βೖߘ͞Εͨ޿ࠂͦΕͧΕΛ΢ΟδΣο τ಺ͰϨίϝϯυ

 4. Ϩίϝϯυهࣄ Ϩίϝϯυ޿ࠂ هࣄ

 5. ͕ɺهࣄϨίϝϯυͷਫ਼౓͕Α͘ͳ͍ʢ$53͕௿͍ʣঢ়ଶͩͬͨ

 6. T

 7. ΞϧΰϦζϜ͕ద༻͞Εͳ͍ϥϯμϜΑΓ௿͍ɻɻɻ

 8. σΟϨΫλʔʮࠓिதʹهࣄCTR޲্͓ئ͍͠·͢ʯ yoppiʮ;͊ͬʂʁʢ3೔͘Β͍͔͠ͳ͍ʂʁʣʯ σΟϨΫλʔʮʢʹͬ͜Γʣʯ yoppiʮ͸ɺ͸͍…ʯ ͱ͍͏͜ͱͰͳΔ΂͘ޙʑͷվળՄೳʹ͢ΔͨΊʹίΞػೳΛ γϯϓϧʹ࡞Γͭͭ΋CTR޲্ΛݟࠐΊΔվળΛ͢Δ͜ͱʹ

 9. • Ϩίϝϯυͬͯʁ • จॻؒྨࣅ౓ • UZOUͰͷద༻ྫ • ͞ΒͳΔվળҊ • ·ͱΊ

  ໨࣍
 10. • Ϩίϝϯυͬͯʁ • จॻؒྨࣅ౓ • UZOUͰͷద༻ྫ • ͞ΒͳΔվળҊ • ·ͱΊ

 11. l͋ΔϢʔβ͕ڵຯΛ࣋ͭͱࢥΘΕΔ৘ใΛਪન͢Δz

 12. ࣮૷ํ๏ w ڠௐϑΟϧλϦϯά w ίϯςϯπϕʔε

 13. ڠௐϑΟϧλϦϯάͰͷϨίϝϯυ w ʮίϯςϯπʹର͢ΔϢʔβͷධՁʯΛݩʹϨίϝϯυ͢Δ w ΞΫηεཤྺɺߪങཤྺɺϨϏϡʔείΞ౳ w ίϯςϯπࣗମͷσʔλͰ͸ͳ͘ϢʔβධՁΛΑΓڧ͍ॏΈͱ͠ ͯଊ͑Δ&$ͰΑ͘࢖ΘΕΔ

 14. ίϯςϯπϕʔεͷϨίϝϯυ w ʮίϯςϯπࣗମͷσʔλʯΛݩʹϨίϝϯυ͢Δ w ίϯςϯπͷλΠτϧɺຊจɺΧςΰϦɺը૾౳ w Ϣʔβσʔλ͕গͳ͍ঢ়ଶͰϨίϝϯυ͍ͨ͠৔߹΍ɺϝσΟΞͰ هࣄΛਪન͢Δ৔߹ʹ࢖ΘΕΔ

 15. ࠓճ࿩͢͜ͱ w ڠௐϑΟϧλϦϯά w ίϯςϯπϕʔε

 16. ίϯςϯπϕʔεͰهࣄΛϨίϝϯυ͢Δ w ʮจॻಉ͕࢜ࣅ͍ͯΕ͹Ϣʔβ͸ڵຯΛ࣋ͭͰ͋Ζ͏ʯͱ͍͏Ծ ఆΛݩʹهࣄΛϨίϝϯυ͢Δ w ਓ͕ؒݟΔͱͳΜͱͳ͘ࣅͯΔͬͯ൑அͰ͖Δ w ܭࢉػ͸Ͳ͏΍ͬͯ൑அ͢ΔͷͩΖ͏͔ʁ

 17. • Ϩίϝϯυͬͯʁ • จॻؒྨࣅ౓ • UZOUͰͷద༻ྫ • ͞ΒͳΔվળҊ • ·ͱΊ

 18. จॻؒྨࣅ౓ w จॻؒͰʮͳΜͱͳ͘ࣅ͍ͯΔʯ΋ͷΛද͢ई౓Λ਺஋Խͨ͠΋ ͷ w ͦͷई౓Λྨࣅ౓ʢTJNJMBSJUZʣͱݺͿ w ྫ͑͹ɺʮྨࣅ౓͕ߴ͍΋ͷΛࣅ͍ͯΔʯͱఆٛ͢Ε͹ܭࢉػ͸ ͦͷ਺஋͔Βࣅ͍ͯΔ͔ࣅ͍ͯͳ͍͔Λ൑அͰ͖Δ w

  ͦͷई౓ΛଌΔํ๏͕͍͔ͭ͘ఏএ͞Ε͍ͯΔ w ϕΫτϧۭؒϞσϧ w ৘ใݕࡧʢ*3ʣ
 19. ϕΫτϧۭؒϞσϧ w จॻதͷग़ݱ୯ޠΛϕΫτϧͱΈͳͯ͠ʢ͍͍ͩͨ͸ʣ5'*%'஋Λ ϕΫτϧ੒෼ʹ༻͍ͯɺίαΠϯ΍಺ੵͳͲΛܭࢉͯ͠ྨࣅ౓Λܭ ࢉ͢Δ

 20. ϕΫτϧۭؒϞσϧ w $PTJOFྨࣅ౓ w +BDDBSEྨࣅ౓ w %JDFྨࣅ౓ w 0WFSMBQྨࣅ౓

 21. ৘ใݕࡧʢ*OGPSNBUJPO3FUSJFWBMʣ w େྔͷ৘ใʢจॻʣ͔Β໨తʢΫΤϦʣʹ߹கͨ͠΋ͷΛऔΓग़ ͢ w จॻؒͰͷྨࣅ౓ͱΈͳ͢৔߹ɺϨίϝϯυର৅ͱͳΔจॻதͷ ୯ޠΛΫΤϦͱΈͳͯ͠จॻू߹ʹରͯ͠ݕࡧ͢Δ

 22. ৘ใݕࡧʢ*OGPSNBUJPO3FUSJFWBMʣ w #. w &MBTUJDTFBSDIʢ-VDFOFʣͷσϑΥϧτͷྨࣅ౓ܭࢉͷϞσϧ ʹ࢖༻͞Ε͍ͯΔ w ϊΠζͷϕΫτϧ੒෼͕ͱͯ΋খ͘͞ධՁ͞ΕΔͷͰTUPQXPSET ͳͲΛνϡʔχϯά͠ͳͯ͘΋σϑΥϧτͰͦͦ͜͜ͳਫ਼౓ʹ ͳΔ

 23. None
 24. • Ϩίϝϯυͬͯʁ • จॻؒྨࣅ౓ • UZOUͰͷద༻ྫ • ͞ΒͳΔվળҊ • ·ͱΊ

 25. 6;06ͷهࣄϨίϝϯυγεςϜ w ίϯςϯπϕʔεͷϨίϝϯυΛ࠾༻ w هࣄ͔Βಛ௃ྔΛநग़ w ϕΫτϧۭؒϞσϧΛ࠾༻ w 0WFSMBQྨࣅ౓ʹࣅͨ΋ͷ w

  هࣄʹର͢ΔهࣄϨίϝϯυ܊Λੜ੒
 26. ϝσΟΞ ޿ࠂओ ഑৴αʔόܭଌαʔό ޿ࠂϦΫΤετ ޿ࠂϨεϙϯε ίϯόʔδϣϯ௨஌ ഑৴ީิσʔλ ഑৴σʔλੜ੒όον σʔλ΢ΣΞϋ΢ε ഑৴ϩά

  3%# όονॲཧ ؅ཧը໘ ഑৴࣮੷σʔλ
 27. ίϯςϯπϕʔεΛ࠾༻ͨ͠ܦҢ w ڠௐϑΟϧλϦϯά͸ʢେྔͷʣϢʔβ͕͋Δఔ౓ίϯςϯπΛ ८ճ͢Δঢ়ଶͰͳ͍ͱσʔλ͔ΒϨίϝϯυ͠ʹ͍͘ w ڠௐϑΟϧλϦϯά͸ϩϯάςʔϧʹޮ͖΍͘͢ɺ&$ͳΒ୯Ձ͕ ߴ͍ͷͰϩϯάςʔϧ෦෼·ͰΧόʔͰ͖Δͷ͸༗ҙٛ w 6;06ͷΑ͏ͳωΠςΟϒΞυͩͱภΓ͕͋Δʢདྷ๚ऀ͕ճͰऴ ΘΔ͜ͱ͕ଟ͍ʣ

  w ͜ͷΑ͏ͳঢ়گԼͰ͸΋ͱ΋ͱ୯Ձ͋ͨΓऩӹ͕௿͍ͷͰϩϯά ςʔϧ෦෼ʹ͋·Γࢫຯ͕ͳ͍ʢͱࢥ͏ʣ
 28. ಛ௃ྔΛຊจ͔Βநग़͢Δ w λΠτϧ͕Ұ൪ಛ௃Λอ͍࣋ͯ͠Δ͸ͣ w ਓ͕ؒλά෇͚͍ͯ͠Δͱݴ͍׵͑ͯྑ͍ w ຊจશͯΛ࢖͏ͱϊΠζ͕ଟ͘ͳΔ w ॳظ࣮૷͕࠾༻ʢTJNJMBSJUZ໰୊ʣ w

  ຊจͷจ໨Λ࠾༻ w ಛʹ8FCϝσΟΞͰ͸Ϣʔβʹ୹͍࣌ؒͰಡΜͰ΋Β͏ͨΊʹจ໨ ʹཁ໿͞Εͨ΋ͷ͕ॻ͔Ε͍ͯΔ͜ͱ͕ଟ͍ w χϡʔεܥ͸ϝσΟΞ͸ݦஶ w ʮจॻཁ໿ʯͷ෼໺Ͱ΋จ໨Λಛ௃ྔܭࢉͷࡍʹॏΈΛڧͯ͘͠ܭ ࢉ͢Δํ๏͕Α͘ݟΒΕΔ
 29. ͦͬͱแΜͰϞϛϞϛ ৴ݰṷͷਖ਼͍͠৯΂ํ͕ʜ ࢁསͷ୅දతͳ໏՛ʮ٥伷৴ݰṷʯख࡞ΓͷຯΘ͍ʹ ͩ͜Θ͓ͬͨṷͱ߳͹͍͖͠ͳคɺೱްͳࠇຶ͕ͨͬ ΀Γೖ͍ͬͯ·͢ɻಛ੡ͷࠇຶΛ͔͚ͯ৯΂Δॠؒ͸ ͳΜͱ΋ݴ͑ͳ͍޾ͤʹแ·Εɺ΄ͬͱҰଉ͖ͭͨ͘ ͳΔͰ͠ΐ͏ɻ࣮͸٥伷৴ݰṷΛϞνʔϑʹͨ͠େਓ ؾͷʮ৴ݰṷεΠʔπʯ͕͍͔ͭ͋͘Γ·͢ɻͬͦ͞ ͘঺հ͠·͠ΐ͏ʂʮ৴ݰṷιϑτʯ͸ɺ͖ͳคͱೱ

  ްͳࠇຶ͕ͨͬ΀Γ͔͔ͬͨ٥伷৴ݰṷͱιϑτΫϦʔ Ϝ͕ίϥϘϨʔγϣϯͨ͠ཉுΓͳ૊߹ͤɻόχϥΞ Πε͕ઈົʹ૊Έ߹Θͬͨ͞࿨༸ં஭ͷΫηʹͳΔຯ ͸ɺ͔ͳΓ᩵୔ͳεΠʔπʹ࢓্͕͍ͬͯ·͢ɻࢁས ͷ٥伷԰ຊࣾ޻৔ʹ͋ΔΞ΢τϨοτ΍ɺࢁསݝథਧ ࢢͷதԝߴ଎ಓ࿏΋ऍᷟಊύʔΩϯάΤϦΞͰ΋৯΂ ΒΕΔͦ͏Ͱ͢ɻʜ
 30. ͦͬͱแΜͰϞϛϞϛ ৴ݰṷͷਖ਼͍͠৯΂ํ͕ʜ ࢁསͷ୅දతͳ໏՛ʮ٥伷৴ݰṷʯख࡞ΓͷຯΘ͍ʹ ͩ͜Θ͓ͬͨṷͱ߳͹͍͖͠ͳคɺೱްͳࠇຶ͕ͨͬ ΀Γೖ͍ͬͯ·͢ɻಛ੡ͷࠇຶΛ͔͚ͯ৯΂Δॠؒ͸ ͳΜͱ΋ݴ͑ͳ͍޾ͤʹแ·Εɺ΄ͬͱҰଉ͖ͭͨ͘ ͳΔͰ͠ΐ͏ɻ࣮͸٥伷৴ݰṷΛϞνʔϑʹͨ͠େਓ ؾͷʮ৴ݰṷεΠʔπʯ͕͍͔ͭ͋͘Γ·͢ɻͬͦ͞ ͘঺հ͠·͠ΐ͏ʂʮ৴ݰṷιϑτʯ͸ɺ͖ͳคͱೱ

  ްͳࠇຶ͕ͨͬ΀Γ͔͔ͬͨ٥伷৴ݰṷͱιϑτΫϦʔ Ϝ͕ίϥϘϨʔγϣϯͨ͠ཉுΓͳ૊߹ͤɻόχϥΞ Πε͕ઈົʹ૊Έ߹Θͬͨ͞࿨༸ં஭ͷΫηʹͳΔຯ ͸ɺ͔ͳΓ᩵୔ͳεΠʔπʹ࢓্͕͍ͬͯ·͢ɻࢁས ͷ٥伷԰ຊࣾ޻৔ʹ͋ΔΞ΢τϨοτ΍ɺࢁསݝథਧ ࢢͷதԝߴ଎ಓ࿏΋ऍᷟಊύʔΩϯάΤϦΞͰ΋৯΂ ΒΕΔͦ͏Ͱ͢ɻʜ Ϟσϧ࡞੒ʹར༻
 31. ܗଶૉղੳ w .F$BCΛ࠾༻ w ࣙॻ͸OFPMPHEΛ࠾༻ w IUUQTHJUIVCDPNOFPMPHENFDBCJQBEJDOFPMPHE w 8JLJQFEJBΛϕʔεʹ࡞ΒΕ͍ͯΔ w

  8FCϝσΟΞʹରͯ͠͸εϥϯά౳Λೝࣝͯ͘͠ΕΔͷͰ༗༻ w TUPQXPSET͸ϝσΟΞຖʹ࠷దԽ͸͍ͯ͠ͳ͍ w ͋Δఔ౓͜Ε͸ෆཁͩΖ͏ͱ͍͏ͷΛ൒ࣗಈతʹ଍͍ͯͬͯ͠ ͍Δ
 32. Ϟσϧ࡞੒ w 0WFSMBQྨࣅ౓Λϕʔεʹͨ͠୯७ͳϞσϧ w 5'ɾ*%'஋ΛॏΈͱͯ͠ܭࢉ͢Δ͚ͩ w $PTJOFྨࣅ౓Λॳظ࣮૷ʹద༻ͯ͠΋ͦ͜·Ͱ໬౓͋Δ݁ՌΛ ಘΒΕͳ͔ͬͨ

 33. ద༻݁Ռ w 6;06Λಋೖ͍ͯ͠ΔશϝσΟΞʹద༻͠ɺ΄΅શͯͷϝσΟΞͰ هࣄ$53ͷ޲্Λୡ੒ w ճ༡཰΋େ෯ʹ޲্

 34. None
 35. T

 36. None
 37. None
 38. • Ϩίϝϯυͬͯʁ • จॻؒྨࣅ౓ • UZOUͰͷద༻ྫ • ͞ΒͳΔվળҊ • ·ͱΊ

 39. ͞ΒͳΔվળҊ w Ϟσϧͷ޲্ w ೔͘Β͍Ͱ࡞Γग़ͨ͠ͳΜͪΌͬͯϞσϧͳͷͰਫ਼౓͕͍͍ͱ ͞Ε͍ͯΔ#.΍0.CBTFEΛݕূͯ͠Έ͍ͨ w ϝσΟΞຖͷಛ௃ྔநग़ͷ޲্ w ݱࡏຊจ͔Βͷಛ௃ྔநग़͸શϝσΟΞಉ༷ͳͷͰݸʑͷϝσΟ

  ΞͰΑΓద੾ͳநग़ํ๏Λݕ౼͢Δ w ଟ࿹όϯσΟοτ໰୊Λద༻ w ΫϦοΫͨ͠ɺ͍ͯ͠ͳ͍ɺͷ஋ͱͳΔͷͰ֬཰෼෍͸ϕϧ ψʔΠ෼෍ͱͳΓଟ࿹όϯσΟοτ໰୊Λద༻Ͱ͖ΔͷͰ͜Ε Λղ͘͜ͱͰϞσϧͷߋ৽͕ՄೳʹͳΔ
 40. • Ϩίϝϯυͬͯʁ • จॻؒྨࣅ౓ • UZOUͰͷద༻ྫ • ͞ΒͳΔվળҊ • ·ͱΊ

 41. ·ͱΊ w ίϯςϯπϕʔεͰͷϨίϝϯυͰ$53Λେ෯ʹ͋͛ΒΕͨ w ʮจॻಉ͕࢜ࣅ͍ͯΕ͹Ϣʔβ͸ڵຯΛ࣋ͭͰ͋Ζ͏ʯͱ͍͏ Ծఆ͕ূ໌͞Εͨͱ͍͑Δ w ෳࡶͳϞσϧΛ༻͍ͣͱ΋ಛ௃ྔͷநग़ஈ֊Ͱ͋Δఔ౓͠΅Δ͜ ͱͰਫ਼౓Λग़ͤΔ w

  γϯϓϧʹίΞ෦෼Λ࡞Δ͜ͱͰࠓޙͷվྑͷํ਑ཱ͕ͯ΍͍͢