Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介7月分

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for miyanishi miyanishi
July 24, 2014
390

 文献紹介7月分

Avatar for miyanishi

miyanishi

July 24, 2014
Tweet

Transcript

  1.  タイトル: Word Sense Disambiguation Improves Information Retrieval  著者:

    Zhi Zhong Hwee Tou Ng Proceedings of Annual Meeting of ACL:Long papers,2012,p273-282 01
  2.  IRタスクにWSDは有効か?  有効・効果なし どちらの意見も存在  筆者の提案  語義情報を考慮した言語モデル 精度UP↑

     同義関係を用いたクエリ拡張 再現率UP↑ IRタスクにおけるWSDの有効性を示した! 結果 02
  3.  語義曖昧性解消(WSD)の現状  他タスクへの有効性が期待  機械翻訳(MT)×WSD ⇒ 精度が向上!  情報検索(IR)×WSD

    ⇒ ???  IR×WSDの研究者の意見  WSDと組み合わせる効果あり  WSDと組み合わせる効果なし どちらも 存在している 03
  4.  クエリのタームが多義の場合  WSDによって曖昧性解消  正しいクエリで検索が可能 ⇒精度がUP!  クエリ拡張への応用を考えた場合 

    WSDによって語義が決定  同じ語義を持つ単語をクエリに使用可能 ⇒再現率がUP! クエリ:検索する語全体 ターム:クエリの要素 (例) 長岡 花火 04
  5.  対訳コーパス 7つ を使用  全て中国語-英語のペア  対訳コーパスの使い方  英・中の文をトークン化

     GIZA++でアライメントを取得  ある単語e(英語)に着目して対訳対を取得  eの出現頻度が高い対訳文対のみを取得  ↑をトレーニングデータとして機械学習 10