Upgrade to Pro — share decks privately, control downloads, hide ads and more …

A simple pattern-matching algorithm for recover...

takegue
May 08, 2015
100

A simple pattern-matching algorithm for recovering empty nodes and their antecedents

2015-05-08

takegue

May 08, 2015
Tweet

More Decks by takegue

Transcript

  1. 1 文献紹介ゼミ A simple pattern-matching algorithm for recovering empty nodes

    and their antecedents 自然言語処理研究室 竹野 峻輔
  2. 2 概要 • Johnson, M. (2002). A simple pattern-matching algorithm

    for recovering empty nodes and their antecedents. In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (pp. 136–143). • Penn TreeBankを対象とした ECの検出および 同一指標(co-index)の補完 • 知識非依存のパターンマッチングによる手法の提案 → F値 0.79の性能の達成 (Gold データに対しては 精度0.90)
  3. 5 Pattern-matching algorithm 以下の手順に従って, 付与を行う 0.(前処理) 非明示的な アノテーション を 明示的に

    1.(抽出処理) 訓練データから検出パターンの抽出 2.パターンに基づきECとco-indexの挿入
  4. 6 Pattern-mathing algorithm:前処理 • 助動詞と他動詞について前処理を行う. • 助動詞(i.e. is, being) は

    AUX or AUXG に変更 • 他動詞を明示的にする( 主に VBZ_t のように _t ) →NPが後続に続く場合, 全てを変更 他動詞であるか否か は 非情に強力な素性
  5. 7 Pattern-mathing algorithm:抽出と置換 • ECと その先行詞(antecedants) を含む 構文が重要なコンテキスト いくつか方法があるが性能は対して変化無し, 最も単純な方法でも十分

    • EC と co-indexを含む 最小の木をパターンとして抽出 – Co-index は 1から振り直し – ECを除く単語は無視 → 約 11,000 パターン 抽出