Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文献紹介2015年5月

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for miyanishi miyanishi
April 30, 2015
270

 文献紹介2015年5月

Avatar for miyanishi

miyanishi

April 30, 2015

Transcript

  1. 文献情報  タイトル: The Penn Parsed Corpus of Modern British

    English: First Parsing Result and Analysis  著者: Seth Kulick et. al.  ACL short Papers 2014, Pages 662-667
  2. 概要  Penn Parsed Corpus of Modern British English(PPCMBE)を利用 

    Penn Tree Bank(PTB)と比較  PPCMBEを改良  実験でその成果を提示  今回は構文解析に着目して改良  PTBに寄せることで精度向上(PTBと同等)
  3. Penn Parsed Corpus of Modern British English(PPCMBE)  100万語を超えるツリーバンク (今回は101ファイル中94ファイル使用)

     英語の構文の変化を研究するための資源  歴史的調査用のツリーバンクの中では 最も現代的(1700-1914年)  Penn Tree Bank(PTB)内のWSJくらいの規模
  4. PPCMBEとPTBの比較 (品詞タグの数)  PPCMBE:248種類(全時代に対応するため)  PTB:45種類  PPCMBEは複合タグ(Complex)が多い  (例)gentlemen

    -> ADJ+NS(形容詞+複数形名詞)  特殊なタグが多い 表1 PPCMBEに付与されているタグの種類数と割合
  5. 実験設定  構文解析器:Berkeley parser  スコアリング:evalb program  Train &

    Val section: fine-tuning parameters  POS tagging:  正解タグを使用(Gold Tags)  Berkeley parserを使用(Parser Tags)
  6. 概要  Penn Parsed Corpus of Modern British English(PPCMBE)を利用 

    Penn Tree Bank(PTB)と比較  PPCMBEを改良  実験でその成果を提示  今回は構文解析に着目して改良  PTBに寄せることで精度向上(PTBと同等)