Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
公的文書に対する「やさしい日本語」換言辞書作成のための調査
Search
自然言語処理研究室
March 31, 2011
Research
0
93
公的文書に対する「やさしい日本語」換言辞書作成のための調査
杢 真奈見, 山本 和英. 公的文書に対する「やさしい日本語」換言辞書作成のための調査. 言語処理学会第17回年次大会, pp.376-379 (2011.3)
自然言語処理研究室
March 31, 2011
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
380
データサイエンス13_解析.pdf
jnlp
0
480
データサイエンス12_分類.pdf
jnlp
0
340
データサイエンス11_前処理.pdf
jnlp
0
460
Recurrent neural network based language model
jnlp
0
140
自然言語処理研究室 研究概要(2012年)
jnlp
0
130
自然言語処理研究室 研究概要(2013年)
jnlp
0
97
自然言語処理研究室 研究概要(2014年)
jnlp
0
120
自然言語処理研究室 研究概要(2015年)
jnlp
0
190
Other Decks in Research
See All in Research
[輪講] SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
nk35jk
2
980
SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images
satai
3
170
近似動的計画入門
mickey_kubo
4
1k
snlp2025_prevent_llm_spikes
takase
0
160
Galileo: Learning Global & Local Features of Many Remote Sensing Modalities
satai
3
230
大規模な2値整数計画問題に対する 効率的な重み付き局所探索法
mickey_kubo
1
360
数理最適化と機械学習の融合
mickey_kubo
16
9.3k
SNLP2025:Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
120
2025年度人工知能学会全国大会チュートリアル講演「深層基盤モデルの数理」
taiji_suzuki
25
18k
AIスパコン「さくらONE」のLLM学習ベンチマークによる性能評価 / SAKURAONE LLM Training Benchmarking
yuukit
0
320
AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data
satai
1
200
数理最適化に基づく制御
mickey_kubo
6
730
Featured
See All Featured
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Rails Girls Zürich Keynote
gr2m
95
14k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.4k
Git: the NoSQL Database
bkeepers
PRO
431
66k
Speed Design
sergeychernyshev
32
1.1k
Designing Experiences People Love
moore
142
24k
Six Lessons from altMBA
skipperchong
28
4k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
34
3.1k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Testing 201, or: Great Expectations
jmmastey
45
7.6k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.9k
Mobile First: as difficult as doing things right
swwweet
224
9.9k
Transcript
公的文書に対する 「やさしい日本語」換言辞書 作成のための調査 長岡技術科学大学 電気系 杢 真奈見 山本 和英 1
研究背景 2 現在、日本には十分な日本語能力を 持たない外国人が数十万人いる。 現支援策 … 多言語での情報提供 ⇒ 全情報を多言語化することは 難しく、時間・コスト的に負担 支援策として最善ではない
研究背景 3 日本語母語話者(日本人) 文法、語彙に制限をかけて日本語 から「やさしい日本語」へ換言 日本語初学者(外国人) 最低限の文法と語彙を習得 「やさしい日本語」
「やさしい日本語」 4 対象者:日本語初学者 →留学生や外国人労働者等の 日本語能力の低い人々 「やさしい」と難しいの定義 →最低限の文法、語彙を習得した
日本語初学者の判断 (使用コーパス:日本語教師の主観による判断)
既存研究 5 本研究と同じコーパスを用いて 統計的機械翻訳 (松田ら・2010) ⇒ 変換の精度が低かった ➔原因:コーパスのフォーマット・質が 機械翻訳に適していない 人手による「やさしい日本語」 換言辞書の有効性を調査
研究目的
コーパス 6 公的文書を日本語教師が3段階の 「やさしい日本語」に訳したもの ➢逐語訳 難しい表現 ⇒ 「やさしい」表現 (逐語的に訳したもの) ➢意訳 文意等を損なわないように可能な限り
「やさしい日本語」に換言 ➢要約 可能な限り文を簡約化
辞書の作成方法 7 原文と逐語訳を使用 コーパス例) 原文 …世界的に新型(豚)インフルエンザ の流行が危惧されています。
逐語訳…世界中で新型インフルエンザ の流行が心配されています。 「世界的に」が「世界中で」に換言…等
換言辞書の内容(1/3) 8 換言例) 単語: 接種 ⇒ 注射 複合名詞:
任意接種 ⇒ 任意の注射 年号: 平成21年 ⇒ 2009年 補助動詞: お読みいただき ⇒ 読んで 敬語等: たまわりまして ⇒ いただき
換言辞書の内容(2/3) 9 換言例) 省略: ~等、~を対象、各~ 補完: (月) ⇒
(月曜日) (カッコ)の情報: 新型(豚)インフルエンザ ⇒ 新型インフルエンザ 低学年(3年生まで) ⇒ 3年生まで
換言辞書の内容(3/3) 10 逐語的ではない換言例) 助成措置が講じられておりますので ⇒ 少し安くなりますから 保護者の皆様のご理解とご協力を ⇒ 皆さん、どうか理解と協力を お願いします。
評価実験 11 換言辞書の内容から20文の評価データを 作成し、評価のための小規模実験を行った。 ➢被験者:留学生2名 ➢評価方法:4種類 ①元の文の方がやさしく感じる ②換言後の方がやさしく感じる
③どちらもやさしく感じる ④どちらも難しく感じる
評価実験 12 評価データ例) 換言前:平成22年8月16日(月)~20日(金) に市立病院にて予防接種を行います。 換言後:2010年8月16日(月曜日)~20日(金曜日) に市立病院で予防注射を行います。 ⇒ 結果:換言後がやさしいと判断 …平均15.5文
/ 20文
考察 13 複合名詞の分割 予定人数→ 予定の人数 必要書類→ 必要な書類
地区住民→ 地区に住んでいる人 敬語…尊敬語・謙譲語 ⇒ これらを解消することで やさしくなった。
結論 14 人手で作成した換言辞書の評価 →20文中15.5文がやさしいと判断 ⇒辞書の有効性が確認できた。 複合名詞と敬語の問題を解消すると 日本語はやさしくなり、日本語初学者 の理解を助ける。
今後の課題 15 換言辞書の完成 換言辞書を用いた換言システムの作成