Upgrade to Pro — share decks privately, control downloads, hide ads and more …

自動抽出した換喩表現を用いた係り受け関係のずれの解消

nishi-k
September 21, 2016
300

 自動抽出した換喩表現を用いた係り受け関係のずれの解消

nishi-k

September 21, 2016
Tweet

Transcript

  1. 参考文献  清 田 陽 司 , 黒 橋 禎

    夫 , 木 戸 冬 子 , ,自動抽出した換喩表現を用いた係り受け関係のずれの 解消,自然言語処理, Vol.11(2004), No.4, pp.127-145 2
  2. 換喩表現の自動抽出 8  対象とする換喩表現と換喩解釈表現  (α)換喩表現  名詞 + 格助詞

    ⇒ 用言  (β)換喩解釈表現  名詞 (の) ⇒ 名詞 + 格助詞 ⇒ 用言  例:  (α) GIF を 表示する  (β) GIF (の) 画像を 表示する  ユーザー質問文データベースから自動抽出  1,351,981文から(α) (β) のパターンに一致する文章の頻度が それぞれ3以上のペアを抽出  1,126個の換喩表現・換喩解釈ペアを獲得
  3. 抽出された換喩表現・換喩解釈ペアの評価 9  獲得した表現のペアをグループ化  単一解釈表現:679 グループ  例:電源を入れる [

    電源スイッチを入れる ]  複数解釈表現:168グループ , 447ペア  例:エラーが出る [ エラー表示が出る、エラー報告がでる ]  評価  換喩表現と換喩解釈表現から想定される状況が一致するも のに◦  提案手法によって得られた換喩解釈表現以外の解釈をBγ と して列挙
  4. 10

  5. 抽出された換喩表現・換喩解釈ペアの評価 11  換喩表現グループを以下のいずれかの評価に分類  A 全てのペアの評価が◦、 他の解釈(Bγ) が存在しない 

    B 全てのペアの評価が◦、 他の解釈(Bγ) が存在する  C 評価に×が混在、 他の解釈(Bγ) が存在しない  D 評価に×が混在、 他の解釈(Bγ) が存在する  E 全てのペアの評価が×
  6.  テストセット  ヘルプ集のテキスト : 31文  サポート技術情報のテキスト: 140文 

    評価尺度  n: 入力された質問文に対 する正解テキスト数  R: 出力されたテキストの うちの正解テキストの順位 マッチングにおける有効性の評価 12
  7. Εを悪化させた表現ペア 14  (W1) ~ (W4) :適切でないペア  (W4) ~

    (W7):解釈としては適切、マッチング手法に問題  格の違いを考慮していないことによる誤り (カラ格とノ格)  「アクセス 」と 「(Windows) ACCESS 」(製品名)が同義語として登録