Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
「サ変動詞+名詞」の複合名詞への換言
Search
自然言語処理研究室
March 31, 2004
Research
0
340
「サ変動詞+名詞」の複合名詞への換言
大橋 一輝, 山本 和英. 「サ変動詞+名詞」の複合名詞への換言. 言語処理学会第10回年次大会, pp.693-696 (2004.3)
自然言語処理研究室
March 31, 2004
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
400
データサイエンス13_解析.pdf
jnlp
0
500
データサイエンス12_分類.pdf
jnlp
0
360
データサイエンス11_前処理.pdf
jnlp
0
480
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
150
自然言語処理研究室 研究概要(2013年)
jnlp
0
110
自然言語処理研究室 研究概要(2014年)
jnlp
0
130
自然言語処理研究室 研究概要(2015年)
jnlp
0
210
Other Decks in Research
See All in Research
高畑鬼界ヶ島と重文・称名寺本薬師如来像の来歴を追って/kikaigashima
kochizufan
0
110
国際論文を出そう!ICRA / IROS / RA-L への論文投稿の心構えとノウハウ / RSJ2025 Luncheon Seminar
koide3
12
6.5k
「リアル×スキマ時間」を活用したUXリサーチ 〜新規事業を前に進めるためのUXリサーチプロセスの設計〜
techtekt
PRO
0
210
さまざまなAgent FrameworkとAIエージェントの評価
ymd65536
1
370
Combining Deep Learning and Street View Imagery to Map Smallholder Crop Types
satai
3
330
AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data
satai
3
590
若手研究者が国際会議(例えばIROS)でワークショップを企画するメリットと成功法!
tanichu
0
130
論文紹介:Not All Tokens Are What You Need for Pretraining
kosuken
1
220
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
340
説明可能な機械学習と数理最適化
kelicht
2
770
SkySense V2: A Unified Foundation Model for Multi-modal Remote Sensing
satai
3
220
論文紹介: ReGenesis: LLMs can Grow into Reasoning Generalists via Self-Improvement
hisaokatsumi
0
150
Featured
See All Featured
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.3k
So, you think you're a good person
axbom
PRO
0
1.8k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
45
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
190
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.3k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
2
260
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
94
Abbi's Birthday
coloredviolet
0
3.7k
Prompt Engineering for Job Search
mfonobong
0
120
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
30
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
28
Transcript
1 「サ変動詞 + 名詞」の 複合名詞への換言 大橋 一輝 山本 和英 長岡技術科学大学
http://nlp.nagaokaut.ac.jp/
2 やりたいこと • 「サ変動詞 + 名詞」→「サ変名詞 + 名詞」 入力 )
ガンを治療する施設は存在しなかった。 → ガンの治療施設は存在しなかった。 • 字幕にするための要約 • より堅い表現に
3 換言例 入力)被害者対策を適切に推進する体制 → 被害者対策の適切な推進体制 入力)来春をメドに清洲工場を閉鎖する方針を決めた。 → 来春をメドとする清洲工場の閉鎖方針を決めた。 入力)ホームページにハッカーが侵入する事件が相次いでいる。 →
ホームページへのハッカーによる侵入事件が相次いでいる。
4 問題の範囲 • 「する」が活用した形は考慮しない 入力)雇用調整を実施した企業の割合 → 雇用調整の実施企業の割合 • 「サ変動詞 +
形式名詞」は考慮しない 入力)乳製品から撤退することを明らかにした。 → 乳製品からの撤退を明らかにした。
5 換言の流れ 入力 ) 絵画を募集する記事を載せた。 → 絵画を募集記事を載せた。(複合名詞に換言) → 絵画の募集記事を載せた。(連体形に変換 )
問題点 換言によってできる複合名詞は妥当か 連用形を連体形に変換できるか
6 複合名詞の妥当性 指導する者 → 指導者 指導する人 → * 指導人 •
どちらも意味は理解できる • 通常使わない複合名詞は不自然 コーパスに存在する複合名詞のみを妥当とする 存在しなければ換言対象としない
7 連用形を連体形に (1/3) • サ変動詞にかかる文節を連体形へ変換 例)格助詞を「の」に置換 入力)有識者が共同研究するプロジェクトが始まる。 → 有識者の共同研究プロジェクトが始まる。 例)規則的に連体形へと変換
入力)確実に入手する方法 → 確実な入手方法
8 連用形を連体形に (2/3) 例)基本形にする 入力)障害者に対して情報を提供するサービス → 障害者に対する情報の提供サービス 例)後ろに「の」を付与 入力)約一年間留学する制度 →
約一年間の留学制度
9 連用形を連体形に (3/3) • 格助詞「に」が持つ7つの意味により変換 • 特徴的なサ変動詞や、格助詞が接続する名詞で判断 例)動作の対象 入力)貸金業規制法に違反する行為があった。 →
貸金業規制法への違反行為があった。 例)事態の時 入力)充電器が充電中に発火する事故 → 充電器の充電中の発火事故
10 複合名詞の動詞的な働き 入力)国は、中旬から運転を再開する予定だ。 → 国は、中旬から運転を再開予定だ。(連用形) →* 国は、中旬からの運転の再開予定だ。 ( 連体形 )
• 文が動詞的な意味を持っている • 「再開予定」が動詞的な働きをしている 連体形への変換をしない
11 複合名詞の名詞的な働き 入力)県は、 3 台の公用車を購入する計画だ。 →* 県は、 3 台の公用車を購入計画だ。(連用形) →*
県は、 3 台の公用車の購入計画だ。(連体形) • 文が動詞的な意味を持っている • 「購入計画」が名詞的な働きをしている 「計画」の次に助動詞「だ」もしくは句点がある … 換言対象から除外
12 「の」を減らす (1/2) • 助詞「の」が増えて不自然になる • 格助詞「が」「を」「に」「で」を助詞「の」以外の表現に 入力)高校生が教育熱心な母親を殺害する事件が起きた。 →* 高校生の教育熱心な母親の殺害事件が起きた。
→ 高校生による教育熱心な母親の殺害事件が起きた。 • 特徴的なサ変動詞や、格助詞が接続する名詞で判断
13 「の」を減らす (2/2) 例)格助詞「に」 入力)掃除に参加する義務 → 掃除に対する参加義務 例)格助詞「を」 入力)審判を侮辱する行為 →
審判に対する侮辱行為 例)格助詞「で」 入力)統一基準で表示する制度 → 統一基準を用いた表示制度
14 実験 及び 考察 • 毎日新聞 1999 年度版を構文解析器「南瓜」で解析 • 1272
文が換言対象 • 無作為に 200 文を抽出して換言し、主観的に評価 換言の精度… 67.0% 茶筌及び南瓜の誤りを除いた精度… 78.8% • 係り受けが長くなり不自然 入力)万里の長城を人類の文化遺産として日中共同で 修復する作業 →* 万里の長城の人類の文化遺産としての日中共同での 修復作業
15 考察 • 表現のバリエーションが少ない 動詞的意味を持つため連用形にしない文が 70 文 連体形に変換した単語
1511 語のうち 83% が格助詞「が」 「を」「に」「で」 • 固有名詞を言い換えてしまう 入力)松浦総三氏らが「東京空襲を記録する会」を作った。 →* 松浦総三氏らが「東京空襲の記録会」を作った。
16 考察 • 動詞的な意味の検出 入力) 17 日からの臨時総会に提案する予定の設置案 →*17 日からの臨時総会に対する提案予定の設置案 →17
日からの臨時総会に提案予定の設置案 • 動詞テ形の連体形への変換が不自然 入力)日本の大学生は数式を覚えて計算する能力は高い。 →* 日本の大学生は数式を覚えての計算能力は高い。
17 参考文献 •寺村 秀夫 : 日本語のシンタクスと意味 III, くろ しお出版 ,
1991. •国立国語研究所 : 日本語の文法 ( 下 ), 国立 国語研究所 , 1981. •益岡 隆志 , 田窪 行則 : 基礎日本語文法 改訂 版 , くろしお出版 , 1992.
18 関連研究 • 佐藤 理史 : 論文表題を言い換える , 情報処理学 会論文誌
, Vol. 40, No.7, pp.2937-2945, 1999. • 「サ変名詞+名詞」→「サ変動詞+名詞」 • 本稿と逆の処理 • 換言の対象が論文の表題のみ(本研究は単一文)