Upgrade to Pro — share decks privately, control downloads, hide ads and more …

読み手の印象推定に基づくツイートのフィルタリングに関する研究 ポスター / A Study o...

読み手の印象推定に基づくツイートのフィルタリングに関する研究 ポスター / A Study on Filtering Tweet based on Impression Estimation of Reading (Poster)

読み手の印象推定に基づくツイートのフィルタリングに関する研究
DEIM Forum 2017 D5-1
http://db-event.jpn.org/deim2017/papers/126.pdf

Avatar for mogumogu mogumi

mogumogu mogumi

March 07, 2017
Tweet

More Decks by mogumogu mogumi

Other Decks in Technology

Transcript

  1. ಡΈखͷҹ৅ਪఆʹجͮ͘
 πΠʔτͷϑΟϧλϦϯάʹؔ͢Δݚڀ A Study on Filtering Tweet based on Impression

    Estimation of Readin g D5-1ɹ ఏҊख๏ ධՁ πΠʔτ Ϣʔβ͕ཉ͍͠ҹ৅Λද͢Ϋϥελ ɾ ɾ ɾ ʮ͍͍Ͷʯͨ͠πΠʔτ ະ஌ͷπΠʔτ πΠʔτ ϑΟϧλ χϡʔϥϧωοτϫʔΫʹ͓͚ΔϑΟϧλϦϯά
 ਖ਼ղ཰͸0.53 ఏҊख๏ͷྲྀΕ 1.͓ؾʹೖΓπΠʔτΛ൓Ԡʹج͍ͮͯΫϥελϦϯά 2.ͦΕΒΛϢʔβ͕ཉ͍͠ҹ৅Λද͢ΫϥελͱΈͳ͢ 3.ͦΕΒΛ༻͍ͯϑΟϧλʢֶशثʣΛ࡞੒ 4.৽͍͠πΠʔτΛϑΟϧλʹ͔͚ɼҹ৅Λ༧ଌ͢Δ πΠʔτ ൓Ԡ πΠʔτ πΠʔτ ൓Ԡ πΠʔτ πΠʔτ ൓Ԡ πΠʔτ ͔Θ͍͍ܥ স͑Δܥ ײ୰ܥ χϡʔϥϧωοτϫʔΫʹΑΔ൑ఆ ಛ௃ྔ ಛ௃ྔ ಛ௃ྔ ܗ ༰ ࢺ ͷ tf-idf ஋ ҹ৅ ֶशث ػ ց ֶ श Ͱ ֶ श ث Λ ࡞ ੒ Ϣʔβ MinPts 3 3 4 ε 1.6 1.7 1.8 8 10 8 0.73 0.6 0.66 0.34 0.51 0.66 ύϥϝ ʔλ Ϋϥελ ਺ ద߹ ཰ ෼ྨ੒ޭ ཰ Ϋϥελ਺͕8Ҏ্ͷ3ͭͷύϥϝʔλʹ͓͚Δ
 ద߹཰ͱ෼ྨ੒ޭ཰ ΫϥελϦϯάͷ಺༰ʹର͢Δղऍ ద߹཰ͱ෼ྨ੒ޭ཰͕ߴ͍ύϥϝʔλ(MinPts=2, ε=4)ΛϑΟϧλϦϯάʹར༻ MinPts=4, ε =1.8 Ϋϥελ ID 1 2 3 4 5 6 7 8 ղऍ ໰୊ҙࣝܥ ඒຯ͠ ͦ͏ ܥ ͔Θ͍͍ܥ ײ୰ܥ ջ͔͠ ͍ܥ ٞ࿦͠ ͨ͘ ͳΔ ͓΋͠ Ζܥ ʁ ݸ਺ 8 5 21 22 4 7 4 6 ਖ਼ղ਺ 5 4 21 9 4 4 4 0 ߟ࡯ • N-gram΍doc2vecͳͲಛ௃ྔΛੜ੒͢Δଞͷख๏΍ɼ୯ޠҎ֎ ͷಛ௃Λ༻͍Δ͜ͱ͕ద੾Ͱ͋Δҹ৅ͷಛ௃͸൓ԠπΠʔτͷ ܗ༰ࢺͷΈʹݱΕΔ΋ͷͰ͸ͳ͘ɼྫ͑͹ֆจࣈ΍إจࣈɼ ʮʂʯʮwʯͳͲͷه߸ʹ΋දݱ͞Ε͍ͯΔͱߟ͑ΒΕΔ • ಉ͡ਓ͕ಉ͡Α͏ʹ൓Ԡ͢ΔπΠʔτ͸ಉ͡Α͏ͳҹ৅Λ࣋ͭ πΠʔτͩͱΈͳ͢ΞϓϩʔνΛߟ͑Δ DBSCAN x ε ୅දతͳີ౓ʹج͍ͮͨΫϥ ελϦϯάख๏ ൒ܘε಺ʹɺMinPtsݸҎ্ͷπ Πʔτͷಛ௃ྔΛؚΉxͷू߹ ΛҰͭͷΫϥελͱ͢Δ ͱͯ΋ɹඒ͍͠ɹͰ͢ɹͶ ͍͍ɹͰ͢ɹͶ͐ɹ ៉ྷɹʂɹ͍͍ɹͶ tf-idfͷจॻߦྻΛੜ੒ @t o ͱͯ΋ඒ͍͠Ͱ͢Ͷ ͍͍Ͱ͢Ͷ͐ ៉ྷʂ͍͍Ͷ MinPts ඒຯͦ͠͏ܥ ͔Θ͍͍ܥ Ϋϥελ2 Ϋϥελ3 ൓ԠπΠʔτ ൓ԠπΠʔτ ຊจπΠʔτ ຊจπΠʔτ πΠʔτ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ਖ਼ղΫϥελ C3 C7 C7 C1 C7 C3 C4 C6 C3 0 C3 C1 0 C7 C3 NN݁Ռ C3 C4 C4 0 0 C3 C4 C6 C3 0 C3 C4 0 C4 0 ϑΟϧλϦϯάͷ಺༰ →͔Θ͍͍ܥͱ൑ఆ̋ →ײ୰ܥͱ൑ఆ× ɹ໰୊ఏىܥͱࢥΘΕΔ ຊจπΠʔτ ൓ԠπΠʔτ ৘ใൃ৴ ίϛϡχ έʔγϣϯ ৘ใऩू ՋͭͿ͠
 ଉൈ͖ TwitterͰ͸༷ʑͳ໨తͰ࢖ΘΕ͍ͯΔɻ
 ՋͭͿ͠Λ໨తʹTwitterΛ࢖͏ͱ͖ɺϢʔβ͸ ʮͳΓ͍ͨؾ෼ʹͳΔ͜ͱʯΛٻΊ͍ͯΔ ଉൈ͖ͷࡍʹʮϢʔβ͕ͳΓ͍ͨؾ࣋ͪʯ
 ʹͳΔπΠʔτΛఏڙ πΠʔτ ҹ৅ πΠʔτͷҹ৅ͷਪఆ͕ඞཁ ϑΟϧλ πΠʔτ πΠʔτ πΠʔτ πΠʔτͷϑΟϧλϦϯά͕ඞཁ Ϣʔβ ຊจͷΈͰҹ৅Λਪఆ͢Δ͜ͱ͸೉͍͕͠ɺ ଞͷϢʔβͷ൓ԠΛར༻͢Δ͜ͱʹΑΓҹ৅ਪఆՄೳ ଉൈ͖ͷ࣌ɺͳΓ͍ͨؾ෼ʹͳΔπΠʔτΛಡΈ͍ͨʂ ൓Ԡʹج͍ͮͯ DBSCANͰ ΫϥελϦϯά ʮ͍͍Ͷʯͨ͠πΠʔτͷ൓ԠπΠʔτͷܗଶૉͷܗ༰ࢺ ͷtf-idf஋Λಛ௃ྔͱͯ͠ɺจॻߦྻΛ࡞੒ ൓ԠπΠʔτ ʓʓͳҹ৅Λ࣋ͭΫϥελ ࠇ໦Ϋϧϛʢ۝भେֶܳज़޻ֶ෦ʣɹڇೌ߶૱ʢ۝भେֶେֶӃܳज़޻ֶݚڀӃʣ