Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
テクノフェスタ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Stern
November 07, 2024
48
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
テクノフェスタ
テクノフェスタでの登壇資料です.
Stern
November 07, 2024
Featured
See All Featured
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.6k
Believing is Seeing
oripsolob
1
160
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.6k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
1k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
280
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Facilitating Awesome Meetings
lara
57
7k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
380
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
320
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
Transcript
静岡大情報学部 片岩拓也 言葉を操る機械について 1 /9 片岩 拓也 静岡大学情報学部2年 LT大会用 2024年
11月 9日(土) 言葉を操る機械について ~言葉を機械で扱うには~
静岡大情報学部 片岩拓也 言葉を操る機械について 2 /9 Sizuoka University 自己紹介 片岩拓也:情報社会学科2年 興味:機械学習の数理や,自然言語処理
甘いもの食べるのが好きです. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 3 /9 Sizuoka University 昨今流行りのChatGPT…….その背景にあるのが, 自然言語処理技術(Natural Language
Processing; NLP) 自然言語(ex, 英語, 日本語)をコンピュータ上で扱えるよう にする技術. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 4 /9 Sizuoka University でも冷静に考えてみると…… 機械は簡単な計算しかできないはずなのに, どうやって言葉を操っているんだろう…?
という問いが浮かびます. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 5 /9 Sizuoka University そもそも,NLPはここ十数年で飛躍的に発展した分野. まだまだ謎なことが多い. 「どうやって、言葉を理解しているの?」などのクリティカ
ルな問いにはいまだに明確な答えは出ていない. ただ、世間が言うほど、わからないことだらけでもない. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 6 /9 Sizuoka University NLPの三大発明品 ・言語の埋め込み Word2Vec
[Mikolov 2014] ・注意機構 Attention [Bahdanau 2015] ・Transformer Attention is All You Need [Vaswani 2017] 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 7 /9 Sizuoka University NLPの三大発明品 ・言語の埋め込み Word2Vec
[Mikolov 2014] ・注意機構 Attention [Bahdanau 2015] ・Transformer Attention is All You Need [Vaswani 2017] 今日はこの言語の埋め込みについて話します. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 8 /9 Sizuoka University そもそも意味の埋め込みとは何か?(ざっくり) 意味的に似たもの同士は近くなるように, 単語を数字に変換する技術.
これを使うと,機械に言葉を教えることができそう. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 9 /9 Sizuoka University そもそも意味の埋め込みとは何か?(ざっくり) 意味的に似たもの同士は近くなるように, 単語を数字に変換する技術.
これを使うと,機械に言葉を教えることができそう. →実際にベースになっている(といえる). 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 10 /9 Sizuoka University 埋め込みはおおよそ2種類ある. ・静的埋め込み…… 単語のベクトルは一度学習してしまえば,変化しない.
・文脈付き埋め込み…… 入力する文の周りの単語によってベクトルが変化する. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 11 /9 Sizuoka University そもそも意味の埋め込みとは何か?(きちんと) 文書中の単語の共起関係を学習するように, 類似単語同士が近くなるように単語にベクトルを
割り当てること.(とくに静的埋め込みの場合) 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 12 /9 Sizuoka University 先行研究 共起関係 (2-windowの場合)
研究室 で 自然言語処理 の 研究 を してみたい! 共起 共起でない 共起の背景にはHarrisの意味分布仮説がある. 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 13 /9 Sizuoka University 先行研究 意味分布仮説 “you
shall know a word by the company it keeps” ~連れ立った仲間を見れば、言葉を知ることができる~ [Firth 1957] 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 14 /9 Sizuoka University 先行研究 意味分布仮説 We
found a little, hairy wampimuk sleeping behind the tree. Wampimukは存在しない単語だが、little(小さくて)hairy(毛むく じゃら)な存在(=生きもの?)と予想できる. 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 15 /9 Sizuoka University 先行研究 こうして意味分布仮説に基づいて言語をモデリング. →言葉がベクトル(数字の列)になる.
ベクトル(数字の列)に直すと何が嬉しいの? 機械学習モデルに入力できるようになる. 言葉を計算することができる.(距離や角度など) 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 16 /9 Sizuoka University 先行研究 実際に計算すると 背景
先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 17 /9 Sizuoka University 先行研究 実際に計算すると 背景
先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 18 /9 Sizuoka University 先行研究 単語類似度 単語ベクトルの間の「角度」を測る.
背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 19 /9 Sizuoka University まとめ ・言語の埋め込みによって、言葉は計算可能になる. ・ただ、今回はもっとも基本的な部分だけ.
・そこから言葉を操る機械ができるまでには十分な先がある ので興味ある人はぜひ掘ってみてください. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 20 /9 Sizuoka University 先行研究 実演 背景
先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 21 /9 Sizuoka University 先行研究 PMI行列の特異値分解 [Levy&Goldberg
2014] PMI行列 単語ベクトル 文脈ベクトル 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 22 /9 Sizuoka University 先行研究 PMI行列の特異値分解 [Levy&Goldberg
2014] PMI行列 単語ベクトル 文脈ベクトル 背景 先行研究 実装 参考文献 Skip-Gram with Negative Sampling(SGNS)と等しい
静岡大情報学部 片岩拓也 言葉を操る機械について 23 /9 Sizuoka University 先行研究 1次元埋め込み [sato
NACCL 2022] 単語は都市で,巡回経路が埋め込みと解釈する TSP(巡回セールスマン問題)として解くことができる 背景 先行研究 実装 参考文献