Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
How to start studying NLP 02
Search
kabayan55
February 18, 2019
Programming
7
5.3k
How to start studying NLP 02
kabayan55
February 18, 2019
Tweet
Share
More Decks by kabayan55
See All by kabayan55
My favorite tool 2019
kabayan55
2
1.7k
Escalators are Awesome
kabayan55
2
1.5k
How to start studying NLP
kabayan55
0
350
Other Decks in Programming
See All in Programming
CSC307 Lecture 05
javiergs
PRO
0
500
CSC307 Lecture 07
javiergs
PRO
1
550
CSC307 Lecture 02
javiergs
PRO
1
780
FOSDEM 2026: STUNMESH-go: Building P2P WireGuard Mesh Without Self-Hosted Infrastructure
tjjh89017
0
170
CSC307 Lecture 08
javiergs
PRO
0
670
CSC307 Lecture 03
javiergs
PRO
1
490
Oxlintはいいぞ
yug1224
5
1.3k
今こそ知るべき耐量子計算機暗号(PQC)入門 / PQC: What You Need to Know Now
mackey0225
3
380
AIで開発はどれくらい加速したのか?AIエージェントによるコード生成を、現場の評価と研究開発の評価の両面からdeep diveしてみる
daisuketakeda
1
2.5k
なるべく楽してバックエンドに型をつけたい!(楽とは言ってない)
hibiki_cube
0
140
Automatic Grammar Agreementと Markdown Extended Attributes について
kishikawakatsumi
0
200
【卒業研究】会話ログ分析によるユーザーごとの関心に応じた話題提案手法
momok47
0
200
Featured
See All Featured
Site-Speed That Sticks
csswizardry
13
1.1k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
9.9k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
190
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
0
2.3k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
117
110k
Faster Mobile Websites
deanohume
310
31k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
100
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
280
Transcript
ʲॳ৺ऀ͚ʳ ɹ͡ΊͯΈΑ͏ʂࣗવݴޠॲཧ ɹɹࣗવݴޠॲཧͷੈքɺΑ͏ͦ͜ αϙʔλʔζ$P-BCษڧձ ݄ LBCBZBO
LBCBZBO େֶɾେֶӃͷݚڀͰࣗવݴޠॲཧ 8FCܥاۀ৽ଔ σʔλαΠΤϯεΤϯδχΞ ࣗݾհ
Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏
Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏
ࣗવݴޠΛίϯϐϡʔλͰॲཧ͢Δ ࣗવݴޠɿਓ͕ؒৗతʹͬͯΔݴޠ ɹɹɹɹɹྫ ຊޠɺӳޠ ੜ·Εͨͱ͖͔Βۙʹ͋ΔࣗવݴޠΛ ίϯϐϡʔλͰॲཧͰ͖Δͬͯ ͳΜ͔ͩͦ͢͝͏ʂ ʜʜͱ࠷ॳࢲࢥ͍·ͨ͠ ࣗવݴޠॲཧͬͯͳʹʁ
֓ཁਤ ⽂書分類 ⾃動要約 情報抽出 機械翻訳 質問応答 情報検索 評判分析 形態素解析 構⽂解析
意味解析 要素技術 複合技術 etc.
ܗଶૉղੳ ܗଶૉʢ୯ޠʣʹ͚ͯࢺผ .F$BC +6."/ͳͲ $ mecab すもももももももものうち すもも 名詞,⼀般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,⼀般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,⼀般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち名詞,⾮⾃⽴,副詞可能,*,*,*,うち,ウチ,ウチ EOS ཁૉٕज़
ߏจղੳ ,/1 $BCP$IB ͳͲ ཁૉٕज़ Wikipedia より
ҙຯղੳ ߏจతᐆດੑ͕͋Δͱ͖ ҙຯղੳ͕ඞཁ ྫ ʮ಄͕͍ڕΛ৯Δೣʯ தଜ໌༟͞Μ !OLNS@BLJ ͷ5XJUUFSΑΓ ཁૉٕज़
จॻྨ จॻΛΧςΰϦ͝ͱʹ͚Δ ࣗಈཁ จষΛࣗಈͰཁ͢Δ ใநग़ ΩʔϫʔυΛநग़͢Δ ྫʣΠϕϯτใநग़ɺใநग़ ෳ߹ٕज़
ෳ߹ٕज़ ධੳ ྫ ϨϏϡʔจ Positive Negative ͜ͷέʔΩ͍ͪ͝ͷ ͕͞ࡍཱͬͯඒຯͰͨ͠ɻ ·ͨߪೖ͍ͨ͠Ͱ͢ɻ ΫϦʔϜ͕͗ͨ͢ɻ
εϙϯδ͕ύαύαͩͬͨɻ
ෳ߹ٕज़ ػց༁ ใݕࡧ ࣭Ԡ
୯ޠΛϕΫτϧͰදݱͰ͖Δ ୯ޠͷ͠ࢉҾ͖ࢉ͕Ͱ͖Δ ྫ LJOHrNBO XPNBORVFFO ୯ޠͷྨࣅ͕Θ͔Δ χϡʔϥϧωοτϫʔΫ ٕज़հ8PSE7FD King Queen
Woman Man
8PSE7FDͱͷҧ͍ɿ׆༻ܗΛ·ͱΊΒΕΔ ྫ HP HPJOH HPFTˠHP ٕज़հGBTU5FYU
݄ʹ(PPHMF͕ެ։ ൚༻తͳϞσϧ ϑΝΠϯνϡʔχϯάͰߴ͍ਫ਼Λग़͢ ٕज़հ#&35
Agenda ࣗવݴޠॲཧͰͰ͖Δ͜ͱ ࣗવݴޠॲཧͷษڧ๏
ࢲPythonΛ༻͍ͯ͠·͢ Python͕ਓؾʂ ϝϦοτ ! εΫϦϓτݴޠͳͷͰ͙͢ʹ࣮ߦͰ͖Δ ! ๛ͳϥΠϒϥϦ ɹ/VNQZ 4DJQZ /-5, 4DJLJUMFBSO ϓϩάϥϛϯάݴޠʁ
͓͢͢Ίڭࡐ
ݴޠॲཧຊϊοΫ http://www.cl.ecei.tohoku.ac.jp/nlp100/
ݴޠॲཧຊϊοΫ ! ౦େͷԬ࡚ઌੜ͕࡞ͨ͠ νϡʔτϦΞϧ ! Pythonͷ࿅शʹͳΔ ! ݴޠॲཧʹඞཁͳ࣮͜͜ͰֶΔ ! GitHubʹίʔυΛ্͛ͯΔͻͱଟ͘ɺ ଞͷਓͷίʔυΛࢀߟʹͰ͖ΔͷͰ ಠֶ͍͢͠
ݴޠॲཧຊϊοΫ
ݴޠॲཧຊϊοΫ GitHubͰ “NLP100knock” ͱ ݕࡧ͢Δ͚ͩͰɺ 86 ϦϙδτϦ ݟ͔ͭΔ ˞20189݄࣌
ར༻ऀͨ͘͞Μ ͍·͢
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ http://phontron.com/teaching.php
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ ! ΧʔωΪʔϝϩϯେֶͷ Graham Neubig ઌੜ͕࡞ͨ͠ νϡʔτϦΞϧ ! εϥΠυܗࣜ ! ֤νϡʔτϦΞϧʹԋश͕͋Γɺ ٖࣅίʔυͱߨٛεϥΠυΛࢀߟʹ ࣮͢Δͱཧղ͕ਂ·Δ
! ࣜΑΓίʔυΛݟͨ΄͏͕ ཧղ͍͢͠ਓʹಛʹΦεεϝ
/-1ϓϩάϥϛϯάνϡʔτϦΞϧ ࢿྉɾԋशσʔλ ͔͜͜Β Ұׅμϯϩʔυʂ https://github.com/neubig/nlptutorial
ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ http://cl.sd.tmu.ac.jp/prospective/prerequisite
ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ टେֶ౦ژͷখொઌੜ͕ ! ֶ ! ӳޠ ! ϓϩάϥϛϯά ! ػցֶश ! ࣗવݴޠॲཧ ͷษڧͷํʹ͍ͭͯ ·ͱΊ͍ͯΔϖʔδ
ࣗવݴޠॲཧΛಠश͍ͨ͠ਓͷͨΊʹ ࠓճॳ৺ऀ͚ͷߨٛͳͷͰ հ͚ͩʹͱͲΊ͓͖ͯ·͕͢ Կͷษڧ͕ඞཁͰ Ͳ͏ษڧ͖͔͢ ஸೡʹΘ͔Γ͘͢·ͱ·͍ͬͯΔͷͰ ੋඇ͝ཡʹͳͬͯ΄͍͠Ͱ͢ʂ
⻑岡技術科学⼤学⾃然⾔語処理研究室(YouTube) IUUQTXXXZPVUVCFDPNVTFSKOMQPSH ʮษڧձʯ͔ΒݟΔͱྑ͍ͱࢥ͍·͢
LBHHMF ࣗવݴޠॲཧܥͷίϯϖ͋Δ Θͨ͠/-1ͷίϯϖग़ͨ͜ͱͳ͍Ͱ͢
ࣗવݴޠॲཧΤϯδχΞʹͳΓ͍ͨਓ ! ػցֶशΤϯδχΞʹͳͬͯ ࣗવݴޠॲཧΔ ! ࣗવݴޠॲཧٕज़ʹಛԽͨ͠اۀʹߦ͘
ػցֶशΤϯδχΞʹͳΓ͍ͨਓ Φεεϝॻ੶ ʰػցֶशΤϯδχΞʹͳΓ͍ͨਓͷ ɹͨΊͷຊ"*Λఱ৬ʹ͢Δʱ ! ԿΛ͢Ε͍͍͔۩ମత
&OKPZ 4UVEZJOH /-1