Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介2015年3月

miyanishi
March 03, 2015
470

 文献紹介2015年3月

miyanishi

March 03, 2015
Tweet

Transcript

  1. 文献情報 • Automatic Domain Assignment for Word Sense Alignment •

    著者:Tommaso Caselli, Carlo Strapparava • EMNLP2014 2
  2. 本文献に出てくる資源 • Senso Comune De Mauro Lexicon(SCDM) – 辞書式の語彙知識 –

    同義関係などの関係・分野・カテゴリの記載なし • WordNet Domains – WordNetの情報に分野(Domain)情報を付加 ラベルは65種類(FACTOTUM,SPORT,FOOD…) – FACTOTUMラベル:複数の分野にまたがる語 • MultiWordNet 5
  3. 素性ベクトル取得方法の説明 • lemma – MultiWordNetからあり得るラベルを全取得 – GENERICはFACTOTUMラベルの数の和 – SPECIFICは他のラベルの数の和 •

    wsd – イタリア語のUKBで曖昧性を解消 – GENERICはFACTOTUMラベルの数の和 – SPECIFICは他のラベルの数の和 9
  4. 手法に関する説明 • Lexical Match – SCDMとMultiWordNetから単語と語義を取得 – 各語を文字列の長さで正規化 – 重複するトークン数が大きいものを選択

    • Cosine Similarity – Personalized Page Rankアルゴリズムを使用 • 上記手法+分野情報でのフィルタリング 12