Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
How to start studying NLP 02
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
kabayan55
February 18, 2019
Programming
5.4k
7
Share
How to start studying NLP 02
kabayan55
February 18, 2019
More Decks by kabayan55
See All by kabayan55
My favorite tool 2019
kabayan55
2
1.7k
Escalators are Awesome
kabayan55
2
1.5k
How to start studying NLP
kabayan55
0
360
Other Decks in Programming
See All in Programming
気づいたらRubyで100作品 ー クリエイティブコーディングが生活の一部になるまで / 100 Ruby Sketches Later: How Creative Coding Became Part of My Life
chobishiba
3
450
RailsTokyo 2026#4: AI様があれば、 Hotwireの弱点は消えるか?
naofumi
5
1k
Java × distroless で 軽量なコンテナイメージを / Java on Distroless
contour_gara
0
370
ビジネスモデルから紐解く、AI+型駆動開発
hirokiomote
2
3.3k
~ 秘伝のタレ化した『神スプシ』と戦う ~ 関数型パラダイムで壊れない仕組みへ
h0r15h0
1
140
[BalkanRuby 2026] Drop your app/services!
palkan
3
710
oxlintはeslint/typescript-eslintを置き換えられるのか
shomafujita
2
270
Composerを使ったサプライチェーン攻撃の様子を眺めてみる #phpstudy
o0h
PRO
2
170
次世代リンターで探る、tsgo 時代における型認識カスタムルールの現実解
ytakahashii
3
1.2k
新規プロダクトを高速で生み出すハーネスエンジニアリング
seanchas116
12
6.2k
Sans tests, vos agents ne sont pas fiables
nabondance
0
160
プラグインで拡張される Context をtype-safe にする難しさと設計判断
kazupon
2
390
Featured
See All Featured
A better future with KSS
kneath
240
18k
Site-Speed That Sticks
csswizardry
13
1.2k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
150
KATA
mclloyd
PRO
35
15k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4k
Navigating Team Friction
lara
192
16k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.6k
Designing Experiences People Love
moore
143
24k
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.5k
sira's awesome portfolio website redesign presentation
elsirapls
0
260
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
290
Transcript
ʲॳ৺ऀ͚ʳ ɹ͡ΊͯΈΑ͏ʂࣗવݴޠॲཧ ɹɹࣗવݴޠॲཧͷੈքɺΑ͏ͦ͜ αϙʔλʔζ$P-BCษڧձ ݄ LBCBZBO
LBCBZBO େֶɾେֶӃͷݚڀͰࣗવݴޠॲཧ 8FCܥاۀ৽ଔ σʔλαΠΤϯεΤϯδχΞ ࣗݾհ
Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏
Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏
ࣗવݴޠΛίϯϐϡʔλͰॲཧ͢Δ ࣗવݴޠɿਓ͕ؒৗతʹͬͯΔݴޠ ɹɹɹɹɹྫ ຊޠɺӳޠ ੜ·Εͨͱ͖͔Βۙʹ͋ΔࣗવݴޠΛ ίϯϐϡʔλͰॲཧͰ͖Δͬͯ ͳΜ͔ͩͦ͢͝͏ʂ ʜʜͱ࠷ॳࢲࢥ͍·ͨ͠ ࣗવݴޠॲཧͬͯͳʹʁ
֓ཁਤ ⽂書分類 ⾃動要約 情報抽出 機械翻訳 質問応答 情報検索 評判分析 形態素解析 構⽂解析
意味解析 要素技術 複合技術 etc.
ܗଶૉղੳ ܗଶૉʢ୯ޠʣʹ͚ͯࢺผ .F$BC +6."/ͳͲ $ mecab すもももももももものうち すもも 名詞,⼀般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,⼀般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,⼀般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち名詞,⾮⾃⽴,副詞可能,*,*,*,うち,ウチ,ウチ EOS ཁૉٕज़
ߏจղੳ ,/1 $BCP$IB ͳͲ ཁૉٕज़ Wikipedia より
ҙຯղੳ ߏจతᐆດੑ͕͋Δͱ͖ ҙຯղੳ͕ඞཁ ྫ ʮ಄͕͍ڕΛ৯Δೣʯ தଜ໌༟͞Μ !OLNS@BLJ ͷ5XJUUFSΑΓ ཁૉٕज़
จॻྨ จॻΛΧςΰϦ͝ͱʹ͚Δ ࣗಈཁ จষΛࣗಈͰཁ͢Δ ใநग़ ΩʔϫʔυΛநग़͢Δ ྫʣΠϕϯτใநग़ɺใநग़ ෳ߹ٕज़
ෳ߹ٕज़ ධੳ ྫ ϨϏϡʔจ Positive Negative ͜ͷέʔΩ͍ͪ͝ͷ ͕͞ࡍཱͬͯඒຯͰͨ͠ɻ ·ͨߪೖ͍ͨ͠Ͱ͢ɻ ΫϦʔϜ͕͗ͨ͢ɻ
εϙϯδ͕ύαύαͩͬͨɻ
ෳ߹ٕज़ ػց༁ ใݕࡧ ࣭Ԡ
୯ޠΛϕΫτϧͰදݱͰ͖Δ ୯ޠͷ͠ࢉҾ͖ࢉ͕Ͱ͖Δ ྫ LJOHrNBO XPNBORVFFO ୯ޠͷྨࣅ͕Θ͔Δ χϡʔϥϧωοτϫʔΫ ٕज़հ8PSE7FD King Queen
Woman Man
8PSE7FDͱͷҧ͍ɿ׆༻ܗΛ·ͱΊΒΕΔ ྫ HP HPJOH HPFTˠHP ٕज़հGBTU5FYU
݄ʹ(PPHMF͕ެ։ ൚༻తͳϞσϧ ϑΝΠϯνϡʔχϯάͰߴ͍ਫ਼Λग़͢ ٕज़հ#&35
Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏
ࢲPythonΛ༻͍ͯ͠·͢ Python͕ਓؾʂ ϝϦοτ ! εΫϦϓτݴޠͳͷͰ͙͢ʹ࣮ߦͰ͖Δ ! ๛ͳϥΠϒϥϦ ɹ/VNQZ 4DJQZ /-5, 4DJLJUMFBSO ϓϩάϥϛϯάݴޠʁ
͓͢͢Ίڭࡐ
ݴޠॲཧຊϊοΫ http://www.cl.ecei.tohoku.ac.jp/nlp100/
ݴޠॲཧຊϊοΫ ! ౦େͷԬ࡚ઌੜ͕࡞ͨ͠ νϡʔτϦΞϧ ! Pythonͷ࿅शʹͳΔ ! ݴޠॲཧʹඞཁͳ࣮͜͜ͰֶΔ ! GitHubʹίʔυΛ্͛ͯΔͻͱଟ͘ɺ ଞͷਓͷίʔυΛࢀߟʹͰ͖ΔͷͰ ಠֶ͍͢͠
ݴޠॲཧຊϊοΫ
ݴޠॲཧຊϊοΫ GitHubͰ “NLP100knock” ͱ ݕࡧ͢Δ͚ͩͰɺ 86 ϦϙδτϦ ݟ͔ͭΔ ˞20189݄࣌
ར༻ऀͨ͘͞Μ ͍·͢
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ ! ΧʔωΪʔϝϩϯେֶͷ Graham Neubig ઌੜ͕࡞ͨ͠ νϡʔτϦΞϧ ! εϥΠυܗࣜ ! ֤νϡʔτϦΞϧʹԋश͕͋Γɺ ٖࣅίʔυͱߨٛεϥΠυΛࢀߟʹ ࣮͢Δͱཧղ͕ਂ·Δ
! ࣜΑΓίʔυΛݟͨ΄͏͕ ཧղ͍͢͠ਓʹಛʹΦεεϝ
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ ࢿྉɾԋशσʔλ ͔͜͜Β Ұׅμϯϩʔυʂ https://github.com/neubig/nlptutorial
ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ http://cl.sd.tmu.ac.jp/prospective/prerequisite
ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ टେֶ౦ژͷখொઌੜ͕ ! ֶ ! ӳޠ ! ϓϩάϥϛϯά ! ػցֶश ! ࣗવݴޠॲཧ ͷษڧͷํʹ͍ͭͯ ·ͱΊ͍ͯΔϖʔδ
ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ ࠓճॳ৺ऀ͚ͷߨٛͳͷͰ հ͚ͩʹͱͲΊ͓͖ͯ·͕͢ Կͷษڧ͕ඞཁͰ Ͳ͏ษڧ͖͔͢ ஸೡʹΘ͔Γ͘͢·ͱ·͍ͬͯΔͷͰ ੋඇ͝ཡʹͳͬͯ΄͍͠Ͱ͢ʂ
⻑岡技術科学⼤学⾃然⾔語処理研究室(YouTube) IUUQTXXXZPVUVCFDPNVTFSKOMQPSH ʮษڧձʯ͔ΒݟΔͱྑ͍ͱࢥ͍·͢
LBHHMF ࣗવݴޠॲཧܥͷίϯϖ͋Δ Θͨ͠/-1ͷίϯϖग़ͨ͜ͱͳ͍Ͱ͢
ࣗવݴޠॲཧΤϯδχΞʹͳΓ͍ͨਓ ! ػցֶशΤϯδχΞʹͳͬͯ ࣗવݴޠॲཧΔ ! ࣗવݴޠॲཧٕज़ʹಛԽͨ͠اۀʹߦ͘
ػցֶशΤϯδχΞʹͳΓ͍ͨਓ Φεεϝॻ੶ ʰػցֶशΤϯδχΞʹͳΓ͍ͨਓͷ ɹͨΊͷຊ"*Λఱ৬ʹ͢Δʱ ! ԿΛ͢Ε͍͍͔۩ମత
&OKPZ 4UVEZJOH /-1