Upgrade to Pro — share decks privately, control downloads, hide ads and more …

How to start studying NLP 02

59a6f68c811161a92ea0da6c242efcd7?s=47 kabayan55
February 18, 2019

How to start studying NLP 02

59a6f68c811161a92ea0da6c242efcd7?s=128

kabayan55

February 18, 2019
Tweet

More Decks by kabayan55

Other Decks in Programming

Transcript

 1. ʲॳ৺ऀ޲͚ʳ ɹ͸͡ΊͯΈΑ͏ʂࣗવݴޠॲཧ ɹɹࣗવݴޠॲཧͷੈք΁ɺΑ͏ͦ͜ αϙʔλʔζ$P-BCษڧձ ݄ LBCBZBO

 2. LBCBZBO େֶɾେֶӃͷݚڀͰࣗવݴޠॲཧ ๭8FCܥاۀ৽ଔ೥໨ σʔλαΠΤϯεΤϯδχΞ ࣗݾ঺հ

 3. Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏

 4. Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏

 5. ࣗવݴޠΛίϯϐϡʔλͰॲཧ͢Δ ࣗવݴޠɿਓ͕ؒ೔ৗతʹ࢖ͬͯΔݴޠ ɹɹɹɹɹྫ ೔ຊޠɺӳޠ ੜ·Εͨͱ͖͔Β਎ۙʹ͋ΔࣗવݴޠΛ ίϯϐϡʔλͰॲཧͰ͖Δͬͯ ͳΜ͔ͩͦ͢͝͏ʂ ʜʜͱ࠷ॳࢲ͸ࢥ͍·ͨ͠ ࣗવݴޠॲཧͬͯͳʹʁ

 6. ֓ཁਤ ⽂書分類 ⾃動要約 情報抽出 機械翻訳 質問応答 情報検索 評判分析 形態素解析 構⽂解析

  意味解析 要素技術 複合技術 etc.
 7. ܗଶૉղੳ ܗଶૉʢ୯ޠʣʹ෼͚ͯ඼ࢺ൑ผ .F$BC +6."/ͳͲ $ mecab すもももももももものうち すもも 名詞,⼀般,*,*,*,*,すもも,スモモ,スモモ も   助詞,係助詞,*,*,*,*,も,モ,モ もも  名詞,⼀般,*,*,*,*,もも,モモ,モモ

  も   助詞,係助詞,*,*,*,*,も,モ,モ もも  名詞,⼀般,*,*,*,*,もも,モモ,モモ の   助詞,連体化,*,*,*,*,の,ノ,ノ うち名詞,⾮⾃⽴,副詞可能,*,*,*,うち,ウチ,ウチ EOS ཁૉٕज़
 8. ߏจղੳ ,/1 $BCP$IB ͳͲ ཁૉٕज़ Wikipedia より

 9. ҙຯղੳ ߏจతᐆດੑ͕͋Δͱ͖͸ ҙຯղੳ͕ඞཁ ྫ ʮ಄͕੺͍ڕΛ৯΂Δೣʯ தଜ໌༟͞Μ !OLNS@BLJ ͷ5XJUUFSΑΓ ཁૉٕज़

 10. จॻ෼ྨ จॻΛΧςΰϦ͝ͱʹ෼͚Δ ࣗಈཁ໿ จষΛࣗಈͰཁ໿͢Δ ৘ใநग़ ΩʔϫʔυΛநग़͢Δ ྫʣΠϕϯτ৘ใநग़ɺ঎඼৘ใநग़ ෳ߹ٕज़

 11. ෳ߹ٕज़ ධ൑෼ੳ ྫ ϨϏϡʔจ Positive Negative ͜ͷέʔΩ͸͍ͪ͝ͷ ؁͕͞ࡍཱͬͯඒຯͰͨ͠ɻ ·ͨߪೖ͍ͨ͠Ͱ͢ɻ ΫϦʔϜ͕؁͗ͨ͢ɻ

  εϙϯδ͕ύαύαͩͬͨɻ
 12. ෳ߹ٕज़ ػց຋༁ ৘ใݕࡧ ࣭໰Ԡ౴

 13. ୯ޠΛϕΫτϧͰදݱͰ͖Δ ୯ޠͷ଍͠ࢉҾ͖ࢉ͕Ͱ͖Δ ྫ LJOHrNBO XPNBORVFFO ୯ޠͷྨࣅ౓͕Θ͔Δ χϡʔϥϧωοτϫʔΫ ٕज़঺հ8PSE7FD King Queen

  Woman Man
 14. 8PSE7FDͱͷҧ͍ɿ׆༻ܗΛ·ͱΊΒΕΔ ྫ HP HPJOH HPFTˠHP ٕज़঺հGBTU5FYU

 15. ೥݄ʹ(PPHMF͕ެ։ ൚༻తͳϞσϧ ϑΝΠϯνϡʔχϯάͰߴ͍ਫ਼౓Λग़͢ ٕज़঺հ#&35

 16. Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏

 17. ࢲ͸PythonΛ࢖༻͍ͯ͠·͢ Python͕ਓؾʂ ϝϦοτ ! εΫϦϓτݴޠͳͷͰ͙͢ʹ࣮ߦͰ͖Δ ! ๛෋ͳϥΠϒϥϦ ɹ/VNQZ 4DJQZ /-5, 4DJLJUMFBSO ϓϩάϥϛϯάݴޠ͸ʁ

 18. ͓͢͢Ίڭࡐ

 19. ݴޠॲཧຊϊοΫ http://www.cl.ecei.tohoku.ac.jp/nlp100/

 20. ݴޠॲཧຊϊοΫ ! ౦޻େͷԬ࡚ઌੜ͕࡞੒ͨ͠ νϡʔτϦΞϧ ! Pythonͷ࿅शʹ΋ͳΔ ! ݴޠॲཧʹඞཁͳ࣮૷͸͜͜Ͱֶ΂Δ ! GitHubʹίʔυΛ্͛ͯΔͻͱ΋ଟ͘ɺ ଞͷਓͷίʔυΛࢀߟʹͰ͖ΔͷͰ ಠֶ͠΍͍͢

 21. ݴޠॲཧຊϊοΫ

 22. ݴޠॲཧຊϊοΫ GitHubͰ “NLP100knock” ͱ ݕࡧ͢Δ͚ͩͰ΋ɺ 86 ϦϙδτϦ ݟ͔ͭΔ ˞2018೥9݄࣌఺

   ར༻ऀͨ͘͞Μ ͍·͢
 23. /-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php

 24. /-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php

 25. /-1ϓϩάϥϛϯάνϡʔτϦΞϧ ! ΧʔωΪʔϝϩϯେֶͷ Graham Neubig ઌੜ͕࡞੒ͨ͠ νϡʔτϦΞϧ ! εϥΠυܗࣜ ! ֤νϡʔτϦΞϧʹԋश໰୊͕͋Γɺ ٖࣅίʔυͱߨٛεϥΠυΛࢀߟʹ ࣮૷͢Δͱཧղ͕ਂ·Δ

  ! ਺ࣜΑΓίʔυΛݟͨ΄͏͕ ཧղ͠΍͍͢ਓʹ͸ಛʹΦεεϝ
 26. /-1ϓϩάϥϛϯάνϡʔτϦΞϧ ࢿྉɾԋशσʔλ͸ ͔͜͜Β Ұׅμ΢ϯϩʔυʂ https://github.com/neubig/nlptutorial

 27. ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ http://cl.sd.tmu.ac.jp/prospective/prerequisite

 28. ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ ट౎େֶ౦ژͷখொઌੜ͕ ! ਺ֶ ! ӳޠ ! ϓϩάϥϛϯά ! ػցֶश ! ࣗવݴޠॲཧ ͷษڧͷ࢓ํʹ͍ͭͯ ·ͱΊ͍ͯΔϖʔδ

 29. ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ ࠓճ͸ॳ৺ऀ޲͚ͷߨٛͳͷͰ ঺հ͚ͩʹͱͲΊ͓͖ͯ·͕͢ Կͷษڧ͕ඞཁͰ Ͳ͏ษڧ͢΂͖͔ ஸೡʹΘ͔Γ΍͘͢·ͱ·͍ͬͯΔͷͰ ੋඇ͝ཡʹͳͬͯ΄͍͠Ͱ͢ʂ

 30. ⻑岡技術科学⼤学⾃然⾔語処理研究室(YouTube) IUUQTXXXZPVUVCFDPNVTFSKOMQPSH ʮ೥ษڧձʯ͔ΒݟΔͱྑ͍ͱࢥ͍·͢

 31. LBHHMF ࣗવݴޠॲཧܥͷίϯϖ΋͋Δ Θͨ͠͸/-1ͷίϯϖ͸ग़ͨ͜ͱͳ͍Ͱ͢

 32. ࣗવݴޠॲཧΤϯδχΞʹͳΓ͍ͨਓ ! ػցֶशΤϯδχΞʹͳͬͯ ࣗવݴޠॲཧ΋΍Δ ! ࣗવݴޠॲཧٕज़ʹಛԽͨ͠اۀʹߦ͘

 33. ػցֶशΤϯδχΞʹͳΓ͍ͨਓ Φεεϝॻ੶ ʰػցֶशΤϯδχΞʹͳΓ͍ͨਓͷ ɹͨΊͷຊ"*Λఱ৬ʹ͢Δʱ ! ԿΛ͢Ε͹͍͍͔۩ମత

 34. &OKPZ 4UVEZJOH /-1