$30 off During Our Annual Pro Sale. View Details »

ファッションを扱うサービスのために、Elasticsearchのユーザー辞書とシノニム辞書を作った話

 ファッションを扱うサービスのために、Elasticsearchのユーザー辞書とシノニム辞書を作った話

ファッションを扱うサービスのために、Elasticsearchのユーザー辞書とシノニム辞書を作ったときの具体的な話

sinamon129

April 26, 2016
Tweet

More Decks by sinamon129

Other Decks in Programming

Transcript

 1. ϑΝογϣϯΛѻ͏αʔϏεͷݕࡧվળͷͨΊʹɺ &MBTUJDTFBSDIͷϢʔβʔࣙॻͱγϊχϜࣙॻΛ ࡞ͬͨ࿩ גࣜձࣾ'BCMJD ยࢁɹைඒ

 2. ࣗݾ঺հ w ยࢁɹைඒ!TJOBNPO w גࣜձࣾ'BCMJDɹαʔόαΠυΤϯδχΞ w 3VCZPO3BJMT "1*ɾ؅ཧը໘ ɾ&MBTUJDTFBSDI FUD

  
 3. ࠓ೔ͷ࿩ ϑϦϧͷݕࡧվળͷͨΊʹɺ &MBTJUDTFBSDIͷϢʔβʔࣙॻͱγϊχϜࣙॻΛ ߏஙͨ࣌͠ͷͱͬͯ΋۩ମతͳ࿩ 

 4. 

 5. None
 6. "#065'3*- ϑΝογϣϯϑϦϚΞϓϦ ୅ޙ൒ʙ୅લ൒͙Β͍ͷঁੑͷϢʔβʔ͕ଟ͍ 

 7. ঎඼ͷΩʔϫʔυݕࡧ ݕࡧͷ໿͙Β͍͸Ωʔϫʔυؚ͕·ΕΔ Ωʔϫʔυݕࡧ͸؊

 8. Ͳ͏͍͏σʔλ͕ݕࡧ͞ΕΔ͔ Ͳ͏͍͏ΩʔϫʔυͰݕࡧ͞ΕΔ͔

 9. Ωʔϫʔυݕࡧͷର৅ͱͳΔσʔλ Ϣʔβ͞Μ͕ࣗ༝ʹॻ͘ Ϛελʔσʔλܥ λΠτϧɾ঎඼આ໌ ঢ়ଶɾܗঢ়ɾηʔϧεϙΠϯτ ུশɾදهΏΕ΋ͦͦ͋͜͜Δ ΧςΰϦ ɹ֊૚͢΂͕ͯର৅ ϒϥϯυ

  ɹӳࣈͱΧφ͕ର৅
 10. Ͳ͏͍͏ΩʔϫʔυͰݕࡧ͞ΕΔ͔ͷྫ εφΠσϧɾ$)"/&-ʢϒϥϯυʣ ϫϯϐʔεɾτϨϯνίʔτʢΧςΰϦʹ͋Δʣ J1IPOFέʔεɾηοτΞοϓɾ."ɾελϯεϛεɹɹɹɹɹɹ ϨʔεΞοϓγϡʔζɾηʔϥʔϜʔϯʢΧςΰϦʹͳ͍ʣ όοΫʢදهؒҧ͍ʣ ϩϯάΧʔσɾΦϑγϣϧɾγϟπϫϯϐʢུশ FUDʜ 

 11. վળલͷΩʔϫʔυݕࡧ w VOJ(SBN w ࠶ݱ཰͕ߴͯ͘ద߹཰͕௿͍ঢ়ଶ w ར఺ɿϫϯϐͰݕࡧͯ͠΋ϫϯϐʔε͕ݕࡧͰ͖Δ w ౰ͯ͸·Δ΋ͷ͸Ͱ͖Δ͚ͩଟ͘ग़ͯ͋͛͠Δ΄͏͕͍͍ w

  Α͘ͳ͍఺ɿϑΝʔͰݕࡧͨ͠ͱ͖ʹϩʔϑΝʔ͕ग़Δ w Ωʔϫʔυʹରͯ͠ਖ਼͍͠঎඼͕ݕࡧ݁ՌͰຒ΋Ε͍ͯΔ ͱ঎඼Ӿཡ཰͕௿͍ 
 12. None
 13. ͜͏͍ͨ͠ w Ͱ͖Δ͚ͩ࠶ݱ཰ͱద߹཰͕ߴ͍ঢ়ଶ w ϑΝʔͰݕࡧͨ͠ͱ͖ʹɺϩʔϑΝʔ΍ϩʔϦʔζ ϑΝʔϜ͕ೖͬͨ঎඼͕ग़ͳ͍Ͱ΄͍͠ w ϫϯϐͰݕࡧͨ࣌͠ʹϫϯϐʔε͕Ͱͯ΄͍͠ w ͞ΒʹനͰݕࡧͨ͠ΒϗϫΠτ΋Ͱͯ΄͍͠

  
 14. ͜͏͢Δ͜ͱʹͨ͠ w &MBTUJDTFBSDIͷUPLFOJ[FSΛVOJ(SBN͔Β LVSPNPKJ΁ w Ϣʔβʔࣙॻ௥Ճ w γϊχϜࣙॻ௥Ճ 

 15. ϦϦʔε৚݅ w VOJ(SBNͷ࣌ͱൺֱͯ͠ɺݕࡧ্Ґϫʔυͷ ώοτ਺͕େ෯ʹݮΒͳ͚Ε͹Α͠ w ώοτ਺͕େ෯ʹݮΔ৔߹ w ώοτͯ͠͸μϝͳ΋ͷ͕୔ࢁώοτ͍ͯͨ͠ͷ͕ਖ਼͞Εͨ w VOJ(SBNͩͱΧόʔͰ͖͍ͯͨলུܗͷྨٛޠొ࿥͕଍Γͳ͍

  w Ϣʔβʔࣙॻ͕଍Γͳ͍PS͓͔͍͠ 
 16. Ϣʔβʔࣙॻ΁ͷ௥Ճ &MBTUJDTFBSDIͷJORVJTJUPSϓϥάΠϯͰ֬ೝ ˠΧφΛௐ΂ͯৼͬͯࣙॻʹొ࿥ʜ ຊ൪%# ݱߦ൛&TJOEFY มߋ൛&TJOEFY VOJ(SBN LVSPNPKJ ࣙॻ

 17. ͋Δఔ౓؆қతʹࣙॻߏங͢Δ w ϑϦΨφͷ͍ͭͨϑΝογϣϯͷσʔλ͕ͳ ͔ͬͨ w ࣗࣾͰ࣋ͬͯΔϒϥϯυϚελʔΛ௥Ճ w ࣗࣾͷݕࡧϩάΛNFDBCJQBEJDOFPMPHE Ͱ෼ղͯ͠ɺΧφ͕͋Δ໊ࢺσʔλΛ௥Ճ 

 18. ྨٛޠͷొ࿥ w VOJ(SBNͰग़དྷ͍ͯͨ෦෼Λ༏ઌతʹ w ୹ॖܗʲΦϑγϣϧμʔʳʲΦϑγϣϧʳ w ݕࡧ਺͕ଟ͍΋ͷ͔Β Ћ w Ϟσϧ͞ΜͷѪশʲ౻ాχίϧʳʲʹ͜ΔΜʳ

  w ʲനʳͱʲϗϫΠτʳ 
 19. ্Ґ֓೦ԼҐ֓೦ΛͲ͏ొ࿥͢Δ͔

 20. αϯμϧ αϯμϧͰݕࡧͨ͠ͱ͖ IJUͯ͠΄͍͠ αϯμϧͰݕࡧͨ͠ͱ͖ IJUͯ͠΄͘͠ͳ͍ wϏʔναϯμϧ wίϯϑΥʔταϯμϧ w΢Τοδιʔϧαϯμϧ wαϘαϯμϧ

  wαϯμϧ΢ου αϯμϧ
 21. ্Ґ֓೦ԼҐ֓೦ͷొ࿥ΛͰ͖Δ͚ͩ͠ͳ͍ w େମʲࣙॻʹొ࿥Ͱ͖Δޠ ্Ґ֓೦ͷޠʳ w ⚪⚪αϯμϧ͸ɺʲαϯμϧʳͱʲ⚪⚪ʳΛొ࿥ w ⚪⚪͕ొ࿥ͨ͘͠ͳ͍ޠͷ৔߹Λআ͘ w αϯμϧ΢ουʢαϯμϧͰͳ͍ʣ͸ผ్ొ࿥

  
 22. දه༳ΕΛͲ͏͢Δ͔ w ݕࡧ਺͕ଟ͍΋ͷ͸ྨٛޠొ࿥ͨ͠ w ʲόοΫʳʲόοάʳʲε΢ΣʔυʳʲεΤʔυʳ w ϒϥϯυ͸༳Εͷొ࿥Λ͠ͳ͍ w ݕࡧ࣌ͷ༳Ε͸ΩʔϫʔυαδΣετͰରԠ w

  ঎඼ͷλΠτϧ΍ৄࡉΑΓϚελʔ͕ਖ਼͍͠ 
 23. ࡉʑͱͨ͠ઃఆͷͨΊʹ؅ཧը໘Λ࡞ͬͨ w ը૾షΓషΓ TOJEFM TOJEFM εφΠσϧ ϒϥϯυ ΧʔΩ ΧʔΩ

  ΧʔΩ ৭ ͙Ͱͨ· ͙Ͱͨ· άσλϚ ΩϟϥΫλʔ αϯμϧ΢ου αϯμϧ΢ου αϯμϧ΢ου ΧελϜ໊ࢺ Φϑγϣϧ Φϑγϣϧ Φϑγϣϧ ΧελϜ໊ࢺ Φϑγϣϧμʔ Φϑγϣϧμʔ Φϑγϣϧμʔ ΧελϜ໊ࢺ αϩϖ αϩϖ αϩϖ ΧελϜ໊ࢺ αϩϖοτ αϩϖοτ αϩϖοτ ΧελϜ໊ࢺ Φϑγϣϧμʔ Φϑγϣϧ αϩϖοτ αϩϖ όοά όοΫ ന ϗϫΠτ ۺԼ ͭͨ͘͠ ιοΫε Ϗʔναϯμϧ Ϗʔαϯ εΤʔυ ε΢Σʔυ ౻ాχίϧ ౻ాχίϧ ʹ͜ΔΜ Ϣʔβʔࣙॻ γϊχϜࣙॻ
 24. Կ͕ࠔ೉͔ͩͬͨ w ࡞Γํͷ৘ใ͕͋·Γͳ͍ w ࢼߦࡨޡɾஅยతͳ৘ใ͔Β΍ͬͯΈΔ͔͠ͳ͍ w Ͱ͖Δ͚ͩݕࡧͷརศੑΛߴͯ͘͠ɺ࡞ۀί ετ͕௿͍ํ๏WTࢿݯͱͯ͠ͷਖ਼͠͞ w Կ͕ਖ਼͍͠ͷ͔

  
 25. ໘ന͔ͬͨ͜ͱ w ϑΝογϣϯ͕େ޷͖ͳͷͰແݶʹ༸෰ͷจ ࣈྻσʔλΛோΊΔͷָ͕͔ͬͨ͠ w ݕࡧ݁Ռ͕͍͍ײ͡ʹͳΔͷΛχϠχϠ͠ͳ ͕ΒݟΔ͜ͱ w ݕࡧͷͨΊͷࣙॻ͡Όͳ͘ɺαʔϏε಺ͷݴ ޠࢿݯͱͯ͠׆༻͢Δʹ͸Ͳ͏͢Ε͹͍͍ͷ

  ͔Λߟ͑ΔΑ͏ʹͳͬͨ͜ͱ 
 26. ϙΤϜ w αʔϏε༻ͷࣙॻͱ͔ݴޠࢿݯΛͭͬͨ͘ͱ ͖ʹಘͨ஌ݟΛ΋ͬͱ஌Γ͍ͨˍڞ༗͍ͨ͠ w ৄ͍͠ํʑ͕ݟͯɺͲ͏ࢥ͏͔ɺͲ͏ͨ͠Β͍͍ͱ ࢥ͏͔ͳͲͷҙݟΛͱͬͯ΋ฉ͖͍ͨͰ͢ w αʔϏεͰूΊͨ୯ޠΛ͍ΖΜͳͱ͜ΖͰ࢖ ͑ΔΑ͏ʹձࣾͷ֎ʹग़͍͚ͯ͠Δͱ͍͍ͳ