Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「サ変動詞+名詞」の複合名詞への換言

 「サ変動詞+名詞」の複合名詞への換言

大橋 一輝, 山本 和英. 「サ変動詞+名詞」の複合名詞への換言. 言語処理学会第10回年次大会, pp.693-696 (2004.3)

More Decks by 自然言語処理研究室

Other Decks in Research

Transcript

  1. 2 やりたいこと • 「サ変動詞 + 名詞」→「サ変名詞 + 名詞」 入力 )

    ガンを治療する施設は存在しなかった。 → ガンの治療施設は存在しなかった。 • 字幕にするための要約 • より堅い表現に
  2. 4 問題の範囲 • 「する」が活用した形は考慮しない 入力)雇用調整を実施した企業の割合 → 雇用調整の実施企業の割合 • 「サ変動詞 +

    形式名詞」は考慮しない 入力)乳製品から撤退することを明らかにした。 → 乳製品からの撤退を明らかにした。
  3. 6 複合名詞の妥当性 指導する者 → 指導者 指導する人 → * 指導人 •

    どちらも意味は理解できる • 通常使わない複合名詞は不自然 コーパスに存在する複合名詞のみを妥当とする 存在しなければ換言対象としない
  4. 11 複合名詞の名詞的な働き 入力)県は、 3 台の公用車を購入する計画だ。 →* 県は、 3 台の公用車を購入計画だ。(連用形) →*

    県は、 3 台の公用車の購入計画だ。(連体形) • 文が動詞的な意味を持っている • 「購入計画」が名詞的な働きをしている 「計画」の次に助動詞「だ」もしくは句点がある … 換言対象から除外
  5. 13 「の」を減らす (2/2) 例)格助詞「に」 入力)掃除に参加する義務 → 掃除に対する参加義務 例)格助詞「を」 入力)審判を侮辱する行為 →

    審判に対する侮辱行為 例)格助詞「で」 入力)統一基準で表示する制度 → 統一基準を用いた表示制度
  6. 14 実験 及び 考察 • 毎日新聞 1999 年度版を構文解析器「南瓜」で解析 • 1272

    文が換言対象 • 無作為に 200 文を抽出して換言し、主観的に評価  換言の精度… 67.0%  茶筌及び南瓜の誤りを除いた精度… 78.8% • 係り受けが長くなり不自然 入力)万里の長城を人類の文化遺産として日中共同で 修復する作業 →* 万里の長城の人類の文化遺産としての日中共同での 修復作業
  7. 15 考察 • 表現のバリエーションが少ない  動詞的意味を持つため連用形にしない文が 70 文  連体形に変換した単語

    1511 語のうち 83% が格助詞「が」 「を」「に」「で」 • 固有名詞を言い換えてしまう 入力)松浦総三氏らが「東京空襲を記録する会」を作った。 →* 松浦総三氏らが「東京空襲の記録会」を作った。
  8. 16 考察 • 動詞的な意味の検出 入力) 17 日からの臨時総会に提案する予定の設置案 →*17 日からの臨時総会に対する提案予定の設置案 →17

    日からの臨時総会に提案予定の設置案 • 動詞テ形の連体形への変換が不自然 入力)日本の大学生は数式を覚えて計算する能力は高い。 →* 日本の大学生は数式を覚えての計算能力は高い。
  9. 17 参考文献 •寺村 秀夫 : 日本語のシンタクスと意味 III, くろ しお出版 ,

    1991. •国立国語研究所 : 日本語の文法 ( 下 ), 国立 国語研究所 , 1981. •益岡 隆志 , 田窪 行則 : 基礎日本語文法 改訂 版 , くろしお出版 , 1992.
  10. 18 関連研究 • 佐藤 理史 : 論文表題を言い換える , 情報処理学 会論文誌

    , Vol. 40, No.7, pp.2937-2945, 1999. • 「サ変名詞+名詞」→「サ変動詞+名詞」 • 本稿と逆の処理 • 換言の対象が論文の表題のみ(本研究は単一文)