Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「サ変動詞+名詞」の複合名詞への換言
Search
自然言語処理研究室
March 31, 2004
Research
0
340
「サ変動詞+名詞」の複合名詞への換言
大橋 一輝, 山本 和英. 「サ変動詞+名詞」の複合名詞への換言. 言語処理学会第10回年次大会, pp.693-696 (2004.3)
自然言語処理研究室
March 31, 2004
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
510
データサイエンス12_分類.pdf
jnlp
0
360
データサイエンス11_前処理.pdf
jnlp
0
480
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
130
自然言語処理研究室 研究概要(2015年)
jnlp
0
210
Other Decks in Research
See All in Research
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
270
ACL読み会2025: Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
100
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
240
論文紹介:Not All Tokens Are What You Need for Pretraining
kosuken
1
220
CoRL2025速報
rpc
3
3.7k
[論文紹介] Intuitive Fine-Tuning
ryou0634
0
160
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
110
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
130
AIスパコン「さくらONE」の オブザーバビリティ / Observability for AI Supercomputer SAKURAONE
yuukit
2
1.1k
SkySense V2: A Unified Foundation Model for Multi-modal Remote Sensing
satai
3
240
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
390
長期・短期メモリを活用したエージェントの個別最適化
isidaitc
0
360
Featured
See All Featured
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
2
68
Breaking role norms: Why Content Design is so much more than writing copy - Taylor Woolridge
uxyall
0
120
Music & Morning Musume
bryan
46
7k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
170
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Technical Leadership for Architectural Decision Making
baasie
0
190
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
4 Signs Your Business is Dying
shpigford
186
22k
Rails Girls Zürich Keynote
gr2m
95
14k
Building AI with AI
inesmontani
PRO
1
580
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Transcript
1 「サ変動詞 + 名詞」の 複合名詞への換言 大橋 一輝 山本 和英 長岡技術科学大学
http://nlp.nagaokaut.ac.jp/
2 やりたいこと • 「サ変動詞 + 名詞」→「サ変名詞 + 名詞」 入力 )
ガンを治療する施設は存在しなかった。 → ガンの治療施設は存在しなかった。 • 字幕にするための要約 • より堅い表現に
3 換言例 入力)被害者対策を適切に推進する体制 → 被害者対策の適切な推進体制 入力)来春をメドに清洲工場を閉鎖する方針を決めた。 → 来春をメドとする清洲工場の閉鎖方針を決めた。 入力)ホームページにハッカーが侵入する事件が相次いでいる。 →
ホームページへのハッカーによる侵入事件が相次いでいる。
4 問題の範囲 • 「する」が活用した形は考慮しない 入力)雇用調整を実施した企業の割合 → 雇用調整の実施企業の割合 • 「サ変動詞 +
形式名詞」は考慮しない 入力)乳製品から撤退することを明らかにした。 → 乳製品からの撤退を明らかにした。
5 換言の流れ 入力 ) 絵画を募集する記事を載せた。 → 絵画を募集記事を載せた。(複合名詞に換言) → 絵画の募集記事を載せた。(連体形に変換 )
問題点 換言によってできる複合名詞は妥当か 連用形を連体形に変換できるか
6 複合名詞の妥当性 指導する者 → 指導者 指導する人 → * 指導人 •
どちらも意味は理解できる • 通常使わない複合名詞は不自然 コーパスに存在する複合名詞のみを妥当とする 存在しなければ換言対象としない
7 連用形を連体形に (1/3) • サ変動詞にかかる文節を連体形へ変換 例)格助詞を「の」に置換 入力)有識者が共同研究するプロジェクトが始まる。 → 有識者の共同研究プロジェクトが始まる。 例)規則的に連体形へと変換
入力)確実に入手する方法 → 確実な入手方法
8 連用形を連体形に (2/3) 例)基本形にする 入力)障害者に対して情報を提供するサービス → 障害者に対する情報の提供サービス 例)後ろに「の」を付与 入力)約一年間留学する制度 →
約一年間の留学制度
9 連用形を連体形に (3/3) • 格助詞「に」が持つ7つの意味により変換 • 特徴的なサ変動詞や、格助詞が接続する名詞で判断 例)動作の対象 入力)貸金業規制法に違反する行為があった。 →
貸金業規制法への違反行為があった。 例)事態の時 入力)充電器が充電中に発火する事故 → 充電器の充電中の発火事故
10 複合名詞の動詞的な働き 入力)国は、中旬から運転を再開する予定だ。 → 国は、中旬から運転を再開予定だ。(連用形) →* 国は、中旬からの運転の再開予定だ。 ( 連体形 )
• 文が動詞的な意味を持っている • 「再開予定」が動詞的な働きをしている 連体形への変換をしない
11 複合名詞の名詞的な働き 入力)県は、 3 台の公用車を購入する計画だ。 →* 県は、 3 台の公用車を購入計画だ。(連用形) →*
県は、 3 台の公用車の購入計画だ。(連体形) • 文が動詞的な意味を持っている • 「購入計画」が名詞的な働きをしている 「計画」の次に助動詞「だ」もしくは句点がある … 換言対象から除外
12 「の」を減らす (1/2) • 助詞「の」が増えて不自然になる • 格助詞「が」「を」「に」「で」を助詞「の」以外の表現に 入力)高校生が教育熱心な母親を殺害する事件が起きた。 →* 高校生の教育熱心な母親の殺害事件が起きた。
→ 高校生による教育熱心な母親の殺害事件が起きた。 • 特徴的なサ変動詞や、格助詞が接続する名詞で判断
13 「の」を減らす (2/2) 例)格助詞「に」 入力)掃除に参加する義務 → 掃除に対する参加義務 例)格助詞「を」 入力)審判を侮辱する行為 →
審判に対する侮辱行為 例)格助詞「で」 入力)統一基準で表示する制度 → 統一基準を用いた表示制度
14 実験 及び 考察 • 毎日新聞 1999 年度版を構文解析器「南瓜」で解析 • 1272
文が換言対象 • 無作為に 200 文を抽出して換言し、主観的に評価 換言の精度… 67.0% 茶筌及び南瓜の誤りを除いた精度… 78.8% • 係り受けが長くなり不自然 入力)万里の長城を人類の文化遺産として日中共同で 修復する作業 →* 万里の長城の人類の文化遺産としての日中共同での 修復作業
15 考察 • 表現のバリエーションが少ない 動詞的意味を持つため連用形にしない文が 70 文 連体形に変換した単語
1511 語のうち 83% が格助詞「が」 「を」「に」「で」 • 固有名詞を言い換えてしまう 入力)松浦総三氏らが「東京空襲を記録する会」を作った。 →* 松浦総三氏らが「東京空襲の記録会」を作った。
16 考察 • 動詞的な意味の検出 入力) 17 日からの臨時総会に提案する予定の設置案 →*17 日からの臨時総会に対する提案予定の設置案 →17
日からの臨時総会に提案予定の設置案 • 動詞テ形の連体形への変換が不自然 入力)日本の大学生は数式を覚えて計算する能力は高い。 →* 日本の大学生は数式を覚えての計算能力は高い。
17 参考文献 •寺村 秀夫 : 日本語のシンタクスと意味 III, くろ しお出版 ,
1991. •国立国語研究所 : 日本語の文法 ( 下 ), 国立 国語研究所 , 1981. •益岡 隆志 , 田窪 行則 : 基礎日本語文法 改訂 版 , くろしお出版 , 1992.
18 関連研究 • 佐藤 理史 : 論文表題を言い換える , 情報処理学 会論文誌
, Vol. 40, No.7, pp.2937-2945, 1999. • 「サ変名詞+名詞」→「サ変動詞+名詞」 • 本稿と逆の処理 • 換言の対象が論文の表題のみ(本研究は単一文)