Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
公的文書に対する「やさしい日本語」換言辞書作成のための調査
Search
自然言語処理研究室
March 31, 2011
Research
0
73
公的文書に対する「やさしい日本語」換言辞書作成のための調査
杢 真奈見, 山本 和英. 公的文書に対する「やさしい日本語」換言辞書作成のための調査. 言語処理学会第17回年次大会, pp.376-379 (2011.3)
自然言語処理研究室
March 31, 2011
Tweet
Share
More Decks by 自然言語処理研究室
See All by 自然言語処理研究室
データサイエンス14_システム.pdf
jnlp
0
330
データサイエンス13_解析.pdf
jnlp
0
380
データサイエンス12_分類.pdf
jnlp
0
290
データサイエンス11_前処理.pdf
jnlp
0
400
Recurrent neural network based language model
jnlp
0
100
自然言語処理研究室 研究概要(2012年)
jnlp
0
100
自然言語処理研究室 研究概要(2013年)
jnlp
0
69
自然言語処理研究室 研究概要(2014年)
jnlp
0
64
自然言語処理研究室 研究概要(2015年)
jnlp
0
120
Other Decks in Research
See All in Research
Target trial emulationの概要
shuntaros
2
1.1k
AIを前提とした体験の実現に向けて/toward_ai_based_experiences
monochromegane
1
230
Alexander Mielke Hellinger--Kantorovich (a.k.a. Wasserstein-Fisher-Rao) Spaces and Gradient Flows
jjzhu
3
180
Cross-Media Information Spaces and Architectures
signer
PRO
0
120
Source Code Diff Revolution (JetBrains Open Reading Club)
tsantalis
0
250
Bridging Continuous and Discrete Spaces: Interpretable Sentence Representation Learning via Compositional Operations
rudorudo11
0
160
近似最近傍探索とVector DBの理論的背景
matsui_528
4
1.3k
LiDARセキュリティ最前線
kentaroy47
0
270
時系列解析と疫学
kingqwert
2
900
第12回全日本コンピュータビジョン勉強会:画像の自己教師あり学習における大規模データセット
naok615
0
500
NeurIPS-23 参加報告 + DPO 解説
akifumi_wachi
4
1.4k
MegaParticles: GPUを利用したStein Particle Filterによる点群6自由度姿勢推定
koide3
1
500
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
301
110k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
18
1.7k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
115
18k
It's Worth the Effort
3n
180
27k
Imperfection Machines: The Place of Print at Facebook
scottboms
258
12k
A designer walks into a library…
pauljervisheath
199
23k
Debugging Ruby Performance
tmm1
70
11k
Building an army of robots
kneath
300
41k
Code Reviewing Like a Champion
maltzj
513
39k
Thoughts on Productivity
jonyablonski
57
3.8k
The Art of Programming - Codeland 2020
erikaheidi
41
12k
The Invisible Side of Design
smashingmag
294
49k
Transcript
公的文書に対する 「やさしい日本語」換言辞書 作成のための調査 長岡技術科学大学 電気系 杢 真奈見 山本 和英 1
研究背景 2 現在、日本には十分な日本語能力を 持たない外国人が数十万人いる。 現支援策 … 多言語での情報提供 ⇒ 全情報を多言語化することは 難しく、時間・コスト的に負担 支援策として最善ではない
研究背景 3 日本語母語話者(日本人) 文法、語彙に制限をかけて日本語 から「やさしい日本語」へ換言 日本語初学者(外国人) 最低限の文法と語彙を習得 「やさしい日本語」
「やさしい日本語」 4 対象者:日本語初学者 →留学生や外国人労働者等の 日本語能力の低い人々 「やさしい」と難しいの定義 →最低限の文法、語彙を習得した
日本語初学者の判断 (使用コーパス:日本語教師の主観による判断)
既存研究 5 本研究と同じコーパスを用いて 統計的機械翻訳 (松田ら・2010) ⇒ 変換の精度が低かった ➔原因:コーパスのフォーマット・質が 機械翻訳に適していない 人手による「やさしい日本語」 換言辞書の有効性を調査
研究目的
コーパス 6 公的文書を日本語教師が3段階の 「やさしい日本語」に訳したもの ➢逐語訳 難しい表現 ⇒ 「やさしい」表現 (逐語的に訳したもの) ➢意訳 文意等を損なわないように可能な限り
「やさしい日本語」に換言 ➢要約 可能な限り文を簡約化
辞書の作成方法 7 原文と逐語訳を使用 コーパス例) 原文 …世界的に新型(豚)インフルエンザ の流行が危惧されています。
逐語訳…世界中で新型インフルエンザ の流行が心配されています。 「世界的に」が「世界中で」に換言…等
換言辞書の内容(1/3) 8 換言例) 単語: 接種 ⇒ 注射 複合名詞:
任意接種 ⇒ 任意の注射 年号: 平成21年 ⇒ 2009年 補助動詞: お読みいただき ⇒ 読んで 敬語等: たまわりまして ⇒ いただき
換言辞書の内容(2/3) 9 換言例) 省略: ~等、~を対象、各~ 補完: (月) ⇒
(月曜日) (カッコ)の情報: 新型(豚)インフルエンザ ⇒ 新型インフルエンザ 低学年(3年生まで) ⇒ 3年生まで
換言辞書の内容(3/3) 10 逐語的ではない換言例) 助成措置が講じられておりますので ⇒ 少し安くなりますから 保護者の皆様のご理解とご協力を ⇒ 皆さん、どうか理解と協力を お願いします。
評価実験 11 換言辞書の内容から20文の評価データを 作成し、評価のための小規模実験を行った。 ➢被験者:留学生2名 ➢評価方法:4種類 ①元の文の方がやさしく感じる ②換言後の方がやさしく感じる
③どちらもやさしく感じる ④どちらも難しく感じる
評価実験 12 評価データ例) 換言前:平成22年8月16日(月)~20日(金) に市立病院にて予防接種を行います。 換言後:2010年8月16日(月曜日)~20日(金曜日) に市立病院で予防注射を行います。 ⇒ 結果:換言後がやさしいと判断 …平均15.5文
/ 20文
考察 13 複合名詞の分割 予定人数→ 予定の人数 必要書類→ 必要な書類
地区住民→ 地区に住んでいる人 敬語…尊敬語・謙譲語 ⇒ これらを解消することで やさしくなった。
結論 14 人手で作成した換言辞書の評価 →20文中15.5文がやさしいと判断 ⇒辞書の有効性が確認できた。 複合名詞と敬語の問題を解消すると 日本語はやさしくなり、日本語初学者 の理解を助ける。
今後の課題 15 換言辞書の完成 換言辞書を用いた換言システムの作成