Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介 6月17日

gumigumi7
June 17, 2016
75

文献紹介 6月17日

gumigumi7

June 17, 2016
Tweet

Transcript

  1. 文献 ▪ 論文 ▪ 山田 一郎, 橋本 力, 呉 鍾勲,

    鳥澤 健太郎, 黒田 航, Stijn De Saeger, 土田 正明, 風間 淳一, Wikipedia を利用した上位下位関係の詳細化. 自然言語処理, Vol. 19 (2012) No. 1 p. 3-23 ▪ キーワード ▪ 上位下位関係獲得, 「対象–属性–属性値」抽出, Wikipedia 2
  2. 理論 ▪ wikipediaを用いた上位下位関係の獲得 ▪ Wikipediaが提供するMediaWikiのソースコードを用いる。 ▪ 記事の節見出し、小節タイトル項目名を用いて上位下位関係候補 を取得 ▪ SVMを用いて上位下位関係候補を分類

    ▪ 上位概念候補、下位概念候補の品詞 ▪ 上位概念候補、下位概念候補に含まれる形態素 ▪ 上位概念候補、下位概念候補の表層系文字列 ▪ 上位概念候補、下位概念候補が属性語Xに一致するか否か ▪ 上位概念候補、下位概念候補の修飾記号 ▪ 上位概念候補と下位概念候補間のレイアウト構造上の距離 ▪ 上位概念候補と下位概念候補の末尾1文字が一致するか 6
  3. 理論 9 ▪ T-上位下位関係の獲得 ▪ ベース上位下位関係の上位概念をWikipedia記事タイトルを用い, T-上位概念を生成 ▪ T-上位概念は元の上位概念とWikipedia記事タイトルを助詞「の」で 連結して生成。

    ▪ 例) 「作品」「黒澤明」 → 「黒澤明の作品」 ▪ G-上位下位関係の獲得 ▪ T-上位概念の記事タイトルをその上位概念で置き換えることで生成 ▪ 上位概念は記事の一文目と下部のカテゴリ情報をSVMで判定したも のを利用 ▪ 例) 「黒澤明の作品」 → 「映画監督の作品」
  4. 実験 ▪ 2009-09-27版の日本語Wikipediaデータを用いてG- 上位下位関係を取得 ▪ 上位下位関係が妥当か以下のペアについて評価 ▪ ベース上位下位関係 ▪ G-上位概念ペア

    ▪ T-上位概念ペア ▪ 被験者3人で200ペア(G-上位概念ペアは178ペア)につ いてGood, Less good, Bad の三段階で評価 10