Upgrade to Pro — share decks privately, control downloads, hide ads and more …

How to start studying NLP 02

59a6f68c811161a92ea0da6c242efcd7?s=47 kabayan55
February 18, 2019

How to start studying NLP 02

59a6f68c811161a92ea0da6c242efcd7?s=128

kabayan55

February 18, 2019
Tweet

Transcript

  1. ʲॳ৺ऀ޲͚ʳ ɹ͸͡ΊͯΈΑ͏ʂࣗવݴޠॲཧ ɹɹࣗવݴޠॲཧͷੈք΁ɺΑ͏ͦ͜ αϙʔλʔζ$P-BCษڧձ  ݄  LBCBZBO

  2. LBCBZBO େֶɾେֶӃͷݚڀͰࣗવݴޠॲཧ ๭8FCܥاۀ৽ଔ೥໨ σʔλαΠΤϯεΤϯδχΞ ࣗݾ঺հ

  3. Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏

  4. Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏

  5. ࣗવݴޠΛίϯϐϡʔλͰॲཧ͢Δ ࣗવݴޠɿਓ͕ؒ೔ৗతʹ࢖ͬͯΔݴޠ ɹɹɹɹɹྫ ೔ຊޠɺӳޠ ੜ·Εͨͱ͖͔Β਎ۙʹ͋ΔࣗવݴޠΛ ίϯϐϡʔλͰॲཧͰ͖Δͬͯ ͳΜ͔ͩͦ͢͝͏ʂ ʜʜͱ࠷ॳࢲ͸ࢥ͍·ͨ͠ ࣗવݴޠॲཧͬͯͳʹʁ

  6. ֓ཁਤ ⽂書分類 ⾃動要約 情報抽出 機械翻訳 質問応答 情報検索 評判分析 形態素解析 構⽂解析

    意味解析 要素技術 複合技術 etc.
  7. ܗଶૉղੳ ܗଶૉʢ୯ޠʣʹ෼͚ͯ඼ࢺ൑ผ .F$BC +6."/ͳͲ $ mecab すもももももももものうち すもも 名詞,⼀般,*,*,*,*,すもも,スモモ,スモモ も   助詞,係助詞,*,*,*,*,も,モ,モ もも  名詞,⼀般,*,*,*,*,もも,モモ,モモ

    も   助詞,係助詞,*,*,*,*,も,モ,モ もも  名詞,⼀般,*,*,*,*,もも,モモ,モモ の   助詞,連体化,*,*,*,*,の,ノ,ノ うち名詞,⾮⾃⽴,副詞可能,*,*,*,うち,ウチ,ウチ EOS ཁૉٕज़
  8. ߏจղੳ ,/1  $BCP$IB ͳͲ ཁૉٕज़ Wikipedia より

  9. ҙຯղੳ ߏจతᐆດੑ͕͋Δͱ͖͸ ҙຯղੳ͕ඞཁ ྫ ʮ಄͕੺͍ڕΛ৯΂Δೣʯ தଜ໌༟͞Μ !OLNS@BLJ ͷ5XJUUFSΑΓ ཁૉٕज़

  10. จॻ෼ྨ จॻΛΧςΰϦ͝ͱʹ෼͚Δ ࣗಈཁ໿ จষΛࣗಈͰཁ໿͢Δ ৘ใநग़ ΩʔϫʔυΛநग़͢Δ ྫʣΠϕϯτ৘ใநग़ɺ঎඼৘ใநग़ ෳ߹ٕज़

  11. ෳ߹ٕज़ ධ൑෼ੳ ྫ ϨϏϡʔจ Positive Negative ͜ͷέʔΩ͸͍ͪ͝ͷ ؁͕͞ࡍཱͬͯඒຯͰͨ͠ɻ ·ͨߪೖ͍ͨ͠Ͱ͢ɻ ΫϦʔϜ͕؁͗ͨ͢ɻ

    εϙϯδ͕ύαύαͩͬͨɻ
  12. ෳ߹ٕज़ ػց຋༁ ৘ใݕࡧ ࣭໰Ԡ౴

  13. ୯ޠΛϕΫτϧͰදݱͰ͖Δ ୯ޠͷ଍͠ࢉҾ͖ࢉ͕Ͱ͖Δ ྫ LJOHrNBO XPNBORVFFO ୯ޠͷྨࣅ౓͕Θ͔Δ χϡʔϥϧωοτϫʔΫ ٕज़঺հ8PSE7FD King Queen

    Woman Man
  14. 8PSE7FDͱͷҧ͍ɿ׆༻ܗΛ·ͱΊΒΕΔ ྫ HP HPJOH HPFTˠHP ٕज़঺հGBTU5FYU

  15. ೥݄ʹ(PPHMF͕ެ։ ൚༻తͳϞσϧ ϑΝΠϯνϡʔχϯάͰߴ͍ਫ਼౓Λग़͢ ٕज़঺հ#&35

  16. Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏

  17. ࢲ͸PythonΛ࢖༻͍ͯ͠·͢ Python͕ਓؾʂ ϝϦοτ ! εΫϦϓτݴޠͳͷͰ͙͢ʹ࣮ߦͰ͖Δ ! ๛෋ͳϥΠϒϥϦ ɹ/VNQZ 4DJQZ /-5, 4DJLJUMFBSO ϓϩάϥϛϯάݴޠ͸ʁ

  18. ͓͢͢Ίڭࡐ

  19. ݴޠॲཧຊϊοΫ http://www.cl.ecei.tohoku.ac.jp/nlp100/

  20. ݴޠॲཧຊϊοΫ ! ౦޻େͷԬ࡚ઌੜ͕࡞੒ͨ͠ νϡʔτϦΞϧ ! Pythonͷ࿅शʹ΋ͳΔ ! ݴޠॲཧʹඞཁͳ࣮૷͸͜͜Ͱֶ΂Δ ! GitHubʹίʔυΛ্͛ͯΔͻͱ΋ଟ͘ɺ ଞͷਓͷίʔυΛࢀߟʹͰ͖ΔͷͰ ಠֶ͠΍͍͢

  21. ݴޠॲཧຊϊοΫ

  22. ݴޠॲཧຊϊοΫ GitHubͰ “NLP100knock” ͱ ݕࡧ͢Δ͚ͩͰ΋ɺ 86 ϦϙδτϦ ݟ͔ͭΔ  ˞2018೥9݄࣌఺

     ར༻ऀͨ͘͞Μ ͍·͢
  23. /-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php

  24. /-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php

  25. /-1ϓϩάϥϛϯάνϡʔτϦΞϧ ! ΧʔωΪʔϝϩϯେֶͷ Graham Neubig ઌੜ͕࡞੒ͨ͠ νϡʔτϦΞϧ ! εϥΠυܗࣜ ! ֤νϡʔτϦΞϧʹԋश໰୊͕͋Γɺ ٖࣅίʔυͱߨٛεϥΠυΛࢀߟʹ ࣮૷͢Δͱཧղ͕ਂ·Δ

    ! ਺ࣜΑΓίʔυΛݟͨ΄͏͕ ཧղ͠΍͍͢ਓʹ͸ಛʹΦεεϝ
  26. /-1ϓϩάϥϛϯάνϡʔτϦΞϧ ࢿྉɾԋशσʔλ͸ ͔͜͜Β Ұׅμ΢ϯϩʔυʂ https://github.com/neubig/nlptutorial

  27. ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ http://cl.sd.tmu.ac.jp/prospective/prerequisite

  28. ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ ट౎େֶ౦ژͷখொઌੜ͕ ! ਺ֶ ! ӳޠ ! ϓϩάϥϛϯά ! ػցֶश ! ࣗવݴޠॲཧ ͷษڧͷ࢓ํʹ͍ͭͯ ·ͱΊ͍ͯΔϖʔδ

  29. ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ ࠓճ͸ॳ৺ऀ޲͚ͷߨٛͳͷͰ ঺հ͚ͩʹͱͲΊ͓͖ͯ·͕͢ Կͷษڧ͕ඞཁͰ Ͳ͏ษڧ͢΂͖͔ ஸೡʹΘ͔Γ΍͘͢·ͱ·͍ͬͯΔͷͰ ੋඇ͝ཡʹͳͬͯ΄͍͠Ͱ͢ʂ

  30. ⻑岡技術科学⼤学⾃然⾔語処理研究室(YouTube) IUUQTXXXZPVUVCFDPNVTFSKOMQPSH ʮ೥ษڧձʯ͔ΒݟΔͱྑ͍ͱࢥ͍·͢

  31. LBHHMF ࣗવݴޠॲཧܥͷίϯϖ΋͋Δ Θͨ͠͸/-1ͷίϯϖ͸ग़ͨ͜ͱͳ͍Ͱ͢

  32. ࣗવݴޠॲཧΤϯδχΞʹͳΓ͍ͨਓ ! ػցֶशΤϯδχΞʹͳͬͯ ࣗવݴޠॲཧ΋΍Δ ! ࣗવݴޠॲཧٕज़ʹಛԽͨ͠اۀʹߦ͘

  33. ػցֶशΤϯδχΞʹͳΓ͍ͨਓ Φεεϝॻ੶ ʰػցֶशΤϯδχΞʹͳΓ͍ͨਓͷ ɹͨΊͷຊ"*Λఱ৬ʹ͢Δʱ ! ԿΛ͢Ε͹͍͍͔۩ମత

  34. &OKPZ 4UVEZJOH /-1