Upgrade to Pro — share decks privately, control downloads, hide ads and more …

文生成のための機能語の補完

 文生成のための機能語の補完

池田 諭史、沢井 康孝、山本 和英. 文生成のための機能語の補完. 言語処理学会第12回年次大会, pp.208-211 (2006.3)

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 1.補完箇所の同定 及び 2.ノの補完  補完箇所の同定とノの補完は SVM(Tiny SVM)を用いた  素性は単語、品詞、単語の出現位 置を用いた

     カーネルは線形カーネル 安全検査を簡素化する方向で検討する →{安全,検査,簡素,化,する,方向,検討,する} →{安全検査,簡素化する方向,検討する}
  2. 3.2 機能語の決定(2/2) A , B: 単語 , Z : 機能語

    , λ:重み係数 ScoreA , B , Z: AZB 単語列 のスコア LA , B , Z: 局所的なスコア ( n 単語 −gram確率を使用) GZ: 大局的なスコア ( n 機能語 −gram確率)  機能語決定のスコアは以下により 求める Score A , B ,Z =log {LA , B ,Z }λlog {GZ }
  3. 不正解例  先行の東京電力に対抗 先行東京電力は対抗  政府が検討していた公務員改革基本指針案が明ら かに 政府が検討していを公務員改革に関する基本指針 案が明らかに 

    キヤノンの今期連結純利益は2000億円強となり、 四期連続で最高益を更新する見通しだ キヤノンは今期連結純利益を2000億円強になり 四期連続で最高益を更新する見通し
  4. 補完箇所の同定 70 75 80 85 90 95 1.E+03 1.E+04 1.E+05

    1.E+06 エント リ 数 精度[% ] 適合率[% ] 再現率[% ]
  5. ノの補完 0 10 20 30 40 50 60 70 80

    90 100 1.E+03 1.E+04 1.E+05 1.E+06 エント リ 数 精度[% ] 適合率[% ] 再現率[% ]