Upgrade to Pro — share decks privately, control downloads, hide ads and more …

自然言語処理研究室 B4 Seminar

takegue
February 19, 2014

自然言語処理研究室 B4 Seminar

論文紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析

takegue

February 19, 2014
Tweet

More Decks by takegue

Other Decks in Technology

Transcript

  1. • 小町守, 飯田龍, 乾健太郎 & 松本裕治. 名詞句の 語彙統語パターンを用いた事態性名詞の項構造解 析. 自然言語処理

    = J. Nat. Lang. Process. 17, 141–159 (2010). • 概要: –述語項構造解析を 事態性名詞の項構造解析へ適用 –語彙統語パターンを判別に利用 (≒複合語の生成パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 文献紹介:名詞句の語彙統語パターンを用いた事態性名詞の項構造解析 2
  2. • 述語項構造解析 – 文中の「誰が」「何を」「どうした」 ⇒ 項 – 述語:「どうした」(形容詞や動詞)を中心に項を解析 • 事態性名詞

    – 事態性:行為や状態,出来事 を表す. • 「上司ガ彼ヲ推薦(する)」 ⇒ 述語項構造と一致 – 文脈から事態性の有無が変化する. e.g) 「電話」 … (公式)電話[物体], 電話(する)(事態) – NAISTテキストコーパスは事態21.1%が事態性名詞 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 1. はじめに:述語項構造解析と事態性 3
  3. • 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり

    複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 4 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues
  4. • 名詞の多義性の問題 – 事態であるか物体を表すか e.g) 電話 • 解析単位の問題 – 動詞と異なり

    複合する名詞も項となりうる e.g) 民間支援 ≒ 民間ヲ支援(する) • 項同定の問題 – 目印となるガ,ヲ,ニがない 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 3. 事態性名詞の項構造解析へのアプローチ 5 2 1 3 2 1 事態性の有無の判別(2値分類) 事態名詞の項構造解析 Approach Issues ・特徴的な統語素性が使える ・語義曖昧解消の解決手法が使える
  5. • 事態性判別のための語彙統語パターンを教師なし学習 – BACT*1による木構造のパターンマイニング 正例パターン)同一文節中にサ変名詞+サ変名詞がある 負例パターン)後ろにサ変名詞がある • 事態性判別の分類精度の向上を確認 – 分類器はSVM

    (TinySVM)利用 – 最頻出語義,語彙統語パターンなし・有りを比較 • 素性:文節内素性,文節外素性(+語彙統合パターン) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性の判別 6 *1 http://chasen.org/~taku/software/bact/
  6. • 事態性が無いと判定された誤り例 – … 妻の和江さんらが現地と電話のやり取りを続けた. – … 選挙だ」と述べ,選挙協力よりも独自候補擁立を 優先すべきだとの考えを示した. 課題:事態性判別と項同定を同時に最適化

    1. ゼロ照応解析⇒項同定⇒事態判別(Iida et al.2006) 2. Markov Logic Networkによる同時判定(Meza-Ruiz and Riedel 2009) 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 4.事態性判別 - エラー分析 7 周辺文脈が事態性のない一般名詞と一致 “選挙二 協力(する)” といった項の関係が反映されていない
  7. • 動詞と格要素の共起の利用 – サ変名詞 は 動詞 と共通の項を持つと仮定している. – 名詞nが格助詞cを介し,動詞vと係る共起確率を計算. •

    pLSI手法を用いたスムージング. • Zは潜在的な意味クラス (|Z| = 1000) • 新聞19年度分・EMアルゴリズムより各確率を計算 – 共起尺度 PMIを利用⇒最尤候補との相対値を素性に利用 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 8
  8. • 支援動詞辞書の作成および利用 – 事態性名詞の格助詞を伴わない 問題を解決 – “電話する” から事態性名詞”電話”の格を推定 – 格の交替も記述

    • “彼女に勉強を教える” ⇒ “彼女ガ勉強(する)” • 項同定の判定:トーナメントモデルを利用したSVM – 局所的なものに対して適応できない “太郎が次郎の連勝を止める” ⇒ [連勝 ガ格:太郎] × [連勝 ガ格:太郎] × 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 5. 事態性名詞の項同定に有効な素性の検討 9
  9. • 語彙統語パターンを用いた事態性名詞の項構造解析 ⇒情報検索の下地 – 事態性判別 - 精度76.% 再現率79.6% – 項同定

    – ガ格:68.3%, ヲ格:80.1%, ニ格:74.6% • 個人的感想 – 論文の構成 • 問題提起⇒手法提案⇒実験⇒議論⇒結論 – 素性の取り方:パターンマイニング – 述語項解析に関する知識 2014/2/20 長岡技術科学大学 自然言語処理研究室 2014年度 B4ゼミ 6. 結論 10