Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介2015年5月

miyanishi
April 30, 2015
260

 文献紹介2015年5月

miyanishi

April 30, 2015
Tweet

Transcript

  1. 文献情報  タイトル: The Penn Parsed Corpus of Modern British

    English: First Parsing Result and Analysis  著者: Seth Kulick et. al.  ACL short Papers 2014, Pages 662-667
  2. 概要  Penn Parsed Corpus of Modern British English(PPCMBE)を利用 

    Penn Tree Bank(PTB)と比較  PPCMBEを改良  実験でその成果を提示  今回は構文解析に着目して改良  PTBに寄せることで精度向上(PTBと同等)
  3. Penn Parsed Corpus of Modern British English(PPCMBE)  100万語を超えるツリーバンク (今回は101ファイル中94ファイル使用)

     英語の構文の変化を研究するための資源  歴史的調査用のツリーバンクの中では 最も現代的(1700-1914年)  Penn Tree Bank(PTB)内のWSJくらいの規模
  4. PPCMBEとPTBの比較 (品詞タグの数)  PPCMBE:248種類(全時代に対応するため)  PTB:45種類  PPCMBEは複合タグ(Complex)が多い  (例)gentlemen

    -> ADJ+NS(形容詞+複数形名詞)  特殊なタグが多い 表1 PPCMBEに付与されているタグの種類数と割合
  5. 実験設定  構文解析器:Berkeley parser  スコアリング:evalb program  Train &

    Val section: fine-tuning parameters  POS tagging:  正解タグを使用(Gold Tags)  Berkeley parserを使用(Parser Tags)
  6. 概要  Penn Parsed Corpus of Modern British English(PPCMBE)を利用 

    Penn Tree Bank(PTB)と比較  PPCMBEを改良  実験でその成果を提示  今回は構文解析に着目して改良  PTBに寄せることで精度向上(PTBと同等)