Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[Gunosy研究会]Semantic Hashing

ysekky
November 19, 2014

[Gunosy研究会]Semantic Hashing

ysekky

November 19, 2014
Tweet

More Decks by ysekky

Other Decks in Research

Transcript

  1. [論文紹介]     Seman)c  Hashing     Ruslan  Salakhutdinov,  Geoffrey

     Hinton   (University  of  Toronto)   SIGIR  2007 Yoshifumi  Seki  (Gunosy  Inc)   2014.11.18  @Gunosy研究会
  2. 概要 •  目的   –  Deep  Learningを用いて文書のトピックをLSAとかよりいい感じに判定し たい   • 

    背景   –  TF-­‐IDF   •  語彙空間で類似度を推定するため,語彙が増えるとその分遅くなる   •  語が一致しない場合は類似性を得ることができない   –  LSA(SVD)   •  語が一致しなくとも類似性を得ることができるようになったが,それも限定的 な領域である   –  pLSA,  LDA   •  生成モデルによってより詳細な類似性を得ることができるようになったが,ト ピックの事後分布は正確に推定することが困難であり遅い手法か、不正確な 手法を使わなくてはならない   •  LSAに比べて高い改善があったとは言いがたい(実験,データセットにによる)  
  3. Deep  Learningについて •  多層ニューラルネットワーク   –  ニューラルネットワークとは一般に隠 れ層がひとつのものを指す   – 

    隠れ層を増やしたものがニューラル ネットワーク   –  逆伝搬によって隠れ層を学習する   •  何が難しいか(難しかったか)   –  層を増やすと下層まで情報が伝わらな い   –  過学習がとても起きやすい