Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
テクノフェスタ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Stern
November 07, 2024
39
0
Share
テクノフェスタ
テクノフェスタでの登壇資料です.
Stern
November 07, 2024
Featured
See All Featured
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Prompt Engineering for Job Search
mfonobong
0
300
Thoughts on Productivity
jonyablonski
76
5.2k
How GitHub (no longer) Works
holman
316
150k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
150
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
210
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
170
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.7k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
180
Transcript
静岡大情報学部 片岩拓也 言葉を操る機械について 1 /9 片岩 拓也 静岡大学情報学部2年 LT大会用 2024年
11月 9日(土) 言葉を操る機械について ~言葉を機械で扱うには~
静岡大情報学部 片岩拓也 言葉を操る機械について 2 /9 Sizuoka University 自己紹介 片岩拓也:情報社会学科2年 興味:機械学習の数理や,自然言語処理
甘いもの食べるのが好きです. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 3 /9 Sizuoka University 昨今流行りのChatGPT…….その背景にあるのが, 自然言語処理技術(Natural Language
Processing; NLP) 自然言語(ex, 英語, 日本語)をコンピュータ上で扱えるよう にする技術. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 4 /9 Sizuoka University でも冷静に考えてみると…… 機械は簡単な計算しかできないはずなのに, どうやって言葉を操っているんだろう…?
という問いが浮かびます. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 5 /9 Sizuoka University そもそも,NLPはここ十数年で飛躍的に発展した分野. まだまだ謎なことが多い. 「どうやって、言葉を理解しているの?」などのクリティカ
ルな問いにはいまだに明確な答えは出ていない. ただ、世間が言うほど、わからないことだらけでもない. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 6 /9 Sizuoka University NLPの三大発明品 ・言語の埋め込み Word2Vec
[Mikolov 2014] ・注意機構 Attention [Bahdanau 2015] ・Transformer Attention is All You Need [Vaswani 2017] 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 7 /9 Sizuoka University NLPの三大発明品 ・言語の埋め込み Word2Vec
[Mikolov 2014] ・注意機構 Attention [Bahdanau 2015] ・Transformer Attention is All You Need [Vaswani 2017] 今日はこの言語の埋め込みについて話します. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 8 /9 Sizuoka University そもそも意味の埋め込みとは何か?(ざっくり) 意味的に似たもの同士は近くなるように, 単語を数字に変換する技術.
これを使うと,機械に言葉を教えることができそう. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 9 /9 Sizuoka University そもそも意味の埋め込みとは何か?(ざっくり) 意味的に似たもの同士は近くなるように, 単語を数字に変換する技術.
これを使うと,機械に言葉を教えることができそう. →実際にベースになっている(といえる). 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 10 /9 Sizuoka University 埋め込みはおおよそ2種類ある. ・静的埋め込み…… 単語のベクトルは一度学習してしまえば,変化しない.
・文脈付き埋め込み…… 入力する文の周りの単語によってベクトルが変化する. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 11 /9 Sizuoka University そもそも意味の埋め込みとは何か?(きちんと) 文書中の単語の共起関係を学習するように, 類似単語同士が近くなるように単語にベクトルを
割り当てること.(とくに静的埋め込みの場合) 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 12 /9 Sizuoka University 先行研究 共起関係 (2-windowの場合)
研究室 で 自然言語処理 の 研究 を してみたい! 共起 共起でない 共起の背景にはHarrisの意味分布仮説がある. 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 13 /9 Sizuoka University 先行研究 意味分布仮説 “you
shall know a word by the company it keeps” ~連れ立った仲間を見れば、言葉を知ることができる~ [Firth 1957] 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 14 /9 Sizuoka University 先行研究 意味分布仮説 We
found a little, hairy wampimuk sleeping behind the tree. Wampimukは存在しない単語だが、little(小さくて)hairy(毛むく じゃら)な存在(=生きもの?)と予想できる. 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 15 /9 Sizuoka University 先行研究 こうして意味分布仮説に基づいて言語をモデリング. →言葉がベクトル(数字の列)になる.
ベクトル(数字の列)に直すと何が嬉しいの? 機械学習モデルに入力できるようになる. 言葉を計算することができる.(距離や角度など) 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 16 /9 Sizuoka University 先行研究 実際に計算すると 背景
先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 17 /9 Sizuoka University 先行研究 実際に計算すると 背景
先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 18 /9 Sizuoka University 先行研究 単語類似度 単語ベクトルの間の「角度」を測る.
背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 19 /9 Sizuoka University まとめ ・言語の埋め込みによって、言葉は計算可能になる. ・ただ、今回はもっとも基本的な部分だけ.
・そこから言葉を操る機械ができるまでには十分な先がある ので興味ある人はぜひ掘ってみてください. 背景 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 20 /9 Sizuoka University 先行研究 実演 背景
先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 21 /9 Sizuoka University 先行研究 PMI行列の特異値分解 [Levy&Goldberg
2014] PMI行列 単語ベクトル 文脈ベクトル 背景 先行研究 実装 参考文献
静岡大情報学部 片岩拓也 言葉を操る機械について 22 /9 Sizuoka University 先行研究 PMI行列の特異値分解 [Levy&Goldberg
2014] PMI行列 単語ベクトル 文脈ベクトル 背景 先行研究 実装 参考文献 Skip-Gram with Negative Sampling(SGNS)と等しい
静岡大情報学部 片岩拓也 言葉を操る機械について 23 /9 Sizuoka University 先行研究 1次元埋め込み [sato
NACCL 2022] 単語は都市で,巡回経路が埋め込みと解釈する TSP(巡回セールスマン問題)として解くことができる 背景 先行研究 実装 参考文献