Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
EMNLP2014読み会 "Efficient Non-parametric Estimati...
Search
Yuya Unno
November 24, 2014
Research
0
15
EMNLP2014読み会 "Efficient Non-parametric Estimation of Multiple Embeddings per Word in Vector Space"
Yuya Unno
November 24, 2014
Tweet
Share
More Decks by Yuya Unno
See All by Yuya Unno
深層学習で切り拓くパーソナルロボットの未来 @東京大学 先端技術セミナー 工学最前線
unnonouno
0
15
深層学習時代の自然言語処理ビジネス @DLLAB 言語・音声ナイト
unnonouno
0
36
ベンチャー企業で言葉を扱うロボットの研究開発をする @東京大学 電子情報学特論I
unnonouno
0
27
PFNにおけるセミナー活動 @NLP2018 言語処理研究者・技術者の育成と未来への連携WS
unnonouno
0
7
進化するChainer @JSAI2017
unnonouno
0
14
予測型戦略を知るための機械学習チュートリアル @BigData Conference 2017 Spring
unnonouno
0
6
深層学習フレームワーク Chainerとその進化
unnonouno
0
15
深層学習による機械とのコミュニケーション @DeNA TechCon 2017
unnonouno
0
22
最先端NLP勉強会 “Learning Language Games through Interaction” @第8回最先端NLP勉強会
unnonouno
0
10
Other Decks in Research
See All in Research
大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成
nomamist
0
100
Weekly AI Agents News! 9月号 論文のアーカイブ
masatoto
1
180
コミュニティドライブプロジェクト
smartfukushilab1
0
180
言語モデルLUKEを経済の知識に特化させたモデル「UBKE-LUKE」について
petter0201
0
170
論文紹介: COSMO: A Large-Scale E-commerce Common Sense Knowledge Generation and Serving System at Amazon (SIGMOD 2024)
ynakano
1
370
言語と数理の交差点:テキストの埋め込みと構造のモデル化 (IBIS 2024 チュートリアル)
yukiar
5
1.1k
CoRL2024サーベイ
rpc
1
1.5k
Human-Informed Machine Learning Models and Interactions
hiromu1996
2
570
文書画像のデータ化における VLM活用 / Use of VLM in document image data conversion
sansan_randd
2
490
新規のC言語処理系を実装することによる 組込みシステム研究にもたらす価値 についての考察
zacky1972
1
320
[依頼講演] 適応的実験計画法に基づく効率的無線システム設計
k_sato
0
260
[ECCV2024読み会] 衛星画像からの地上画像生成
elith
1
1k
Featured
See All Featured
The World Runs on Bad Software
bkeepers
PRO
67
11k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
The Invisible Side of Design
smashingmag
299
50k
Git: the NoSQL Database
bkeepers
PRO
427
64k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.3k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.7k
Java REST API Framework Comparison - PWX 2021
mraible
28
8.4k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
11
940
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Building Better People: How to give real-time feedback that sticks.
wjessup
366
19k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
99
18k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.3k
Transcript
Efficient Non-parametric Estimation of Multiple Embeddings per Word in Vector
Space Arvind Neelakantan, Jeevan Shankar, Alexandre Passos, Andrew McCallum ®Preferred Infrastructure ~ôø (@unnonouno) EMNLP2014 @PFI
nìûÏ ~ôø (@unnonouno) ! nÕǽ6ODKPYARbF6ÿå ! ´ò½5&7'+6:2" ! NLP¾q/fµt©k2014- !
rc§¨Û¹IBM¢ýÊPFI
îÓ NLP¾q/fYANS ! YANSIbXJBZ9o ! ¾qÊÒl40ÈãØ9/¾qÊÒln Ã/ÊÒ>4;$4/¸2: ! s6¤jCbJR@/»5üç !
d0mê* $ ! YANSĀ3o ! ǽfecfyg.ĀÑf> 2" ! à-;õ3f*""
þ ! word2vec>ÙÉ )1(/àÇ.í/× WEPa>Á; ! àÇ/å+ÇÂĄă¥¿>tx.¥ ! ×WEPa/>n*4;w5«£ );
ù*=;Skip-gram [Mikolov+13] éā 0 Ă * ; $(&#%'
{*=;Skip-gram ! àÇ/WEPa v(wt ) +GbODKP/WEP a v(c) /|Ð>IF\AQ.<;
Ă * ;
Multi Sense Skip-gram (MSSG) model 1. ÞÚàÇ/GbODKPWEPa9æG bODKP>±h 2. ×âÀ/g9iËGbODKP/ßú
$ ×>ó 3. #/×.v¼";×WEPa>ó 4. ó<$×WEPa.Ý')ÞÚGbOD KPz );+.";Skip-gram+ t!
ù*=;MSSG $(&#%'"! " Skip-gram
{*=;MSSG ! ó $×WEPa>¯% ! àÇ/WEPa0×ï.ª:GbODKP /WEPa01(%ª;
@aH`LZ*=;MSSG ! ÞÚGbO DKP> ¯')× >ó"; G Qu ;%
Non-Parametric MSSG (NP-MSSG) model ! MSSG*0×WEPa/04¬&%'$ ! NP-MSSG*0<>n*4; ! 4w0àö.2*+GbODKPWEP
a/æƶ$9} ×WEPa> Í";%
NP-MSSG.;×/ó/Ôw ! 2*+ÆGbODKPh $9}9 ×Ëä>²:)8 ! k(wt )02*wt .²:)$×/ !
vcontext 0wt /æGbODKPWEPa ! (wt , k)0kË/×/GbODKPg¦
q/2+4 ! MSSG ! àÇ.v )kÅ/×WEPa>²:);S_ [ Mkè !
" ! ! ó<$×WEPa>¯')ñ.Skip-gram ! NP-MSSG ! kÅ/×WEPa>²:);/0t! ! "# ! ó<$×WEPa*Skip-gram";/0t!
Ì¡°Apple ! ° +J^VK<.p<;
Ì¡°Run) ! ×/Ąă-àÇ.0º/×WEPa³Á<;
×/ßú >*;/Ì localSimiËú$×t¹/÷ÖcÜ
·Î ! 01+?,t!Ì>6')$(^o^) ! E_K>n*z";w.áð )$ /*?-/*/ +ëÄ ! ÞÚàÇ*4;8:QD][bP/P
TNE*4$1nÕ-"; ! S_F_UWEPa>¯