Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「やさしい日本語」のための語彙制限の検討

 「やさしい日本語」のための語彙制限の検討

杢真奈見, 山本和英. 「やさしい日本語」のための語彙制限の検討. 言語処理学会第18回年次大会, pp.209-212 (2012.3)

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 評価基準 8 原文 出力文 逐語訳 意味がわかる 意味がわからない 意味がわかる 変化なし やさしい

    意味がわからない やさしくない やさしくない  評価①それぞれの意味がわかるか  評価②やさしいと感じる順位 原文に対する出力文・逐語訳の順位 評価 順位が上がる やさしい 順位が同じ 変化なし 順位が下がる やさしくない
  2. 評価例 9 分類 評価文 評価① 評価② 原文 本 人 確

    認 済 み の [ 口 座 ] を 利用した送金や送金の受領を 除きます × 3 出力文 個人判定済みのアカウントを 使い行った支払金額や支払金 額の取得を消去します ◦ 1 逐語訳 本 人 確 認 済 み の 口 座 を 使った送金や送金のもらいは 問題ない ◦ 2 ※ [ ] は評価③意味がわからない語彙
  3. 評価①の結果 10 評価①それぞれの意味がわかるか やさしい 変化なし やさしくない 出力文 17.1% 15.2% 67.6%

    逐語訳 33.3% 22.9% 43.8% 評価者の半数以上が「意味がわかる」と判断 した文は、原文は40%、出力文は13.3%、 逐語訳は73.3%であった。 置き換えることによって33.3%の文が 「意味がわかる」と判断されるが、 個人差が大きい。
  4. 評価②の結果 11 やさしい 変化なし やさしくない 出力文 24.8% 46.7% 28.6% 逐語訳

    51.4% 46.7% 1.9% 評価②やさしいと感じる順位 出力文は人手でつくられた 逐語訳より評価が低いものの、 置き換えの効果はあった。
  5. 考察 12  意味がわかるようになった語彙 サ変名詞・・・サ変名詞は数も多い。動詞は 和語に置き換える処理が必要となる。 例) 原文:扶養している → 出力文:補助している

    逐語訳:育てている 原文と逐語訳が等しい ・・・公的文書で頻出する語彙 例) 原文・逐語訳:口座、出力文:アカウント
  6. 結論 14  内容語の上位語への置き換えは 公的文書、新聞記事共に有効であった。  今後の語彙制限のための検討結果  置き換える語彙 ・・・サ変名詞

     置き換えない語彙 ・・・公的文書で頻出する語彙、 日常生活に頻出する語彙  今後検討 ・・・複合名詞  (上位語の領域についても検討予定)